Microsoft na potęgę korzysta ze sztucznej inteligencji OpenAI w swoich produktach, ale od wielu lat rozwija również własne modele. W ten poniedziałek (13 października) gigant zaprezentował swój pierwszy model AI do generowania obrazów, stworzony w całości przez siebie. Już w dniu debiutu MAI-Image-1 wszedł do pierwszej dziesiątki modeli text-to-image w LMArena, a niebawem trafi do Copilota i Kreatora Obrazów Bing. Jak on wygląda i co potrafi?
Obecnie w usługach Microsoftu i OpenAI obrazy generowane są przez model GPT-Image-1, zintegrowany z multimodalnym GPT-4o. Wcześniej wykorzystywane były modele DALL-E (2021), DALL-E 2 (2022) i DALL-E 3 (2023). Microsoft stworzył tymczasem swój całkowicie własny model generowania obrazów na podstawie tekstu (text-to-image), który już niebawem do jego usług jako alternatywa dla modelu OpenAI.
Jedna z prac wygenerowanych przez MAI-Image-1. Źródło: Microsoft AI
MAI-Image-1 okazał się na tyle dobry, że już w dniu debiutu znalazł się w Top 10 rankingu Text-to-Image Arena, gdzie obecnie zajmuje 9. miejsce. Oto, co piszą o nim jego twórcy.
W Microsoft AI tworzymy AI dla każdego – wspierającą, pomocną obecność zawsze do usług dla ludzkości. Podzieliliśmy się tym, jak zbudowane w konkretnym celu modele są kluczowe dla tej misji, a także ogłosiliśmy nasze dwa pierwsze własne modele w sierpniu. MAI-Image-1 to kolejny krok na tej drodze, który przeciera szlak dla bardziej immersyjnych, kreatywnych i dynamicznych doświadczeń wewnątrz naszych produktów.
Wytrenowaliśmy ten model z celem dostarczenia autentycznej wartości dla twórców i dołożyliśmy wszelkich starań, aby unikać powtarzalnych lub generycznych rezultatów. Przykładowo za priorytet obraliśmy rygorystyczną selekcję danych i zniuansowaną ewaluację, skupiając się na zadaniach, które ściśle odzwierciedlają rzeczywiste przypadki kreatywnego użycia – uwzględniając opinie specjalistów z branży kreatywnej. Model ten jest zaprojektowany, by dostarczał prawdziwej elastyczności, wizualnej różnorodności i praktycznej wartości.
MAI-Image-1 radzi sobie doskonale z generowaniem fotorealistycznych obrazów, takich jak oświetlenie (np. odbijające się światło, refleksy), krajobrazy i wiele więcej. Jest to szczególnie widoczne w porównaniu z wieloma większymi, wolniejszymi modelami. Jego połączenie szybkości i jakości oznacza, że użytkownicy mogą zobaczyć swoje pomysły na ekranie dużo szybciej, szybciej przez nie iterować i przenieść swoje prace do innych narzędzi, aby kontynuować ich dopieszczanie.
Jesteśmy zobowiązani do zapewniania bezpiecznych i odpowiedzialnych wyników. To doprowadziło nas do rozpoczęcia testów tego modelu w LMArena, abyśmy mogli zebrać wglądy i feedback. Jesteśmy podekscytowaniu, udostępniając MAI-Image-1 w aplikacjach Copilot i Kreator Obrazów Bing już bardzo niedługo. Na ten moment wypróbujcie go w LMArena i dajcie nam znać, co myślicie!
— Microsoft AI
Dowiedz się więcej o sztucznej inteligencji Microsoftu: