OpenAI wypuścił nową wersję swojego generatora obrazów współpracującego z ChatGPT i Copilotem. GPT‑Image-1.5 radzi sobie jeszcze lepiej z tworzeniem czegoś od zera na podstawie instrukcji lub edytowaniem zdjęć, a ponadto generuje obrazy 4 razy szybciej. Dzięki swoim osiągnięciom może śmiało rywalizować z Nano Banana od Google.
Generatory obrazów AI z jednej strony zachwyciły swoimi umiejętnościami, a z drugiej - z czasem wyszły na jaw ich wady, niepożądane tendencje i maniery. Technologia idzie jednak do przodu i tak w sierpniu tego roku Google wypuściło przełomowy Nano Banana (Gemini 2.5 Flash Image), a niecałe cztery miesiące później ukazała się też nowa generacja modelu generatywnego od OpenAI. Debiutował on 16 grudnia i od razu zaczął być dostępny dla użytkowników ChatuGPT oraz poprzez API jako GPT Image 1.5.
Co w nim takiego szczególnego? GPT Image 1.5 wychodzi naprzeciw oczekiwaniom użytkowników. Według producenta można na nim bardziej polegać. Kiedy dokonuje edycji, to dokonuje edycji tam, gdzie prosi użytkownik, zachowując pozostałe szczegóły nietknięte. Użytkownicy mają się spodziewać bardziej przydatnych edycji zdjęć, wiarygodnego "przymierzania" ciuchów i fryzur, lepszych filtrów stylistycznych i transformacji konceptualnych.
Na porównaniach opublikowanych przez OpenAI widać większą wierność promptom, jeszcze większy realizm (wiarygodność) i przede wszystkim mniej efektu pomarańczowego filtra, od którego wszystkim robiło się niedobrze. Na pewno wielu z was widziało animacje z ChatemGPT poproszonym o odtworzenie dokładnie tego samego zdjęcia bez zmian, a każde kolejne stawało się coraz bardziej pomarańczowe. Wygląda na to, że OpenAI już się tym niechcianym efektem zajął.

GPT Image 1.5 jest także dostępny poprzez API, dzięki czemu można go użyć we własnych aplikacjach AI. Jak wyjaśnia producent, jest on mocniejszy w zachowywaniu i edytowaniu obrazów niż GPT Image 1. Zachowuje on częściej branding i logo, a także kluczowe szczegóły wizualne pomiędzy edycjami. Jego inputy i outputy są o 20% tańsze, więc można generować więcej przy tym samym budżecie.
Jeszcze nie wiadomo, kiedy ten model trafi do Microsoft 365 Copilot i pozostałych usług opartych na modelach OpenAI. Microsoft ogłosił natomiast jego ogólną dostępność w Microsoft Foundry.

