Microsoft oficjalnie zaprezentował MAI-Image-2.5 - swój najnowszy i najbardziej zaawansowany model sztucznej inteligencji typu text-to-image. Narzędzie AI do generowania obrazów z hukiem wkroczyło do prestiżowego rankingu Arena, zdobywając z miejsca trzecią pozycję na globalnej liście liderów. Tym samym gigant rzucił spore wyzwanie firmom takim jak OpenAI czy Google.
MAI-Image-2.5 reprezentuje imponujący skok technologiczny, biorąc pod uwagę dotychczasową drogę Microsoftu. Zaprezentowany w zeszłym roku, w pełni autorski model pierwszej generacji MAI-Image-1 zadebiutował dopiero na 9. pozycji, wyraźnie ustępując konkurencji z innych laboratoriów AI. Wówczas firma udostępniła go użytkownikom platformy Bing.
Sytuacja zaczęła się dynamicznie zmieniać w marcu tego roku, kiedy zespół Microsoft AI wprowadził drugą generację systemu. MAI-Image-2 przyniósł znaczącą poprawę w odwzorowaniu naturalnego światła i precyzji odcieni skóry, co pozwoliło mu wskoczyć na 3. miejsce zestawienia - tuż za modelami gemini-3.1-flash-image-preview od Google oraz gpt-image-1.5-high-fidelity od OpenAI. Model ten trafił do Copilota, Kreatora Obrazów Bing, a także w ręce deweloperów poprzez API w usłudze Microsoft Foundry.
Najnowsza odsłona, MAI-Image-2.5, umacnia pozycję Microsoftu w pierwszej trójce rankingu Arena. Na ten moment liderem zestawienia pozostaje model gpt-image-2 od OpenAI z wynikiem 1388 punktów.
Według oficjalnych deklaracji Microsoftu, wersja 2.5 radzi sobie znacznie lepiej w szerokim spektrum stylów wizualnych. Została zaprojektowana tak, aby dokładniej podążać za promptami, bardziej niezawodnie i stabilnie renderować napisy, a także generować obrazy o wyższym poziomie szczegółowości i spójności. Cechuje ją też lepsze tzw. rozumowanie wizualne (ang. visual reasoning). Dzięki temu sztuczna inteligencja lepiej rozumie strukturę sceny, wzajemne relacje przestrzenne obiektów, ich skalę oraz zachowanie światła.
Microsoft zwraca szczególną uwagę na fakt, że MAI-Image-2.5 przynosi największy jak dotąd postęp w obszarze renderowania tekstu, stylizowanych ilustracji oraz grafiki komercyjnej. Model ma stać się potężnym narzędziem w rękach projektantów, umożliwiając tworzenie znacznie lepszych plakatów, makiet opakowań, konceptów brandingowych czy profesjonalnych zdjęć produktowych. Napisy na wygenerowanych grafikach są ostrzejsze, układy elementów - bardziej stabilne, a wizualizacje ukierunkowane na markę zyskują niespotykany dotąd szlif.
Nowy generator obrazów AI jest już dostępny dla każdego, kto chce go przetestować. Zgodnie z dotychczasową praktyką Microsoftu w ciągu najbliższych 2 tygodni narzędzie zostanie również zintegrowane i udostępnione na platformie MAI Playground oraz dla programistów w ramach Microsoft Foundry.


