Microsoft oprócz polegania na najpotężniejszych modelach dostarczanych przez OpenAI od lat tworzy swoje własne modele AI i udostępnia je m.in. w chmurze Azure oraz do uruchamiania lokalnie na urządzeniach. Gigant z Redmond wypuścił w tym tygodniu dwa nowe modele LLM: MAI-Voice-1 oraz MAI-1-preview. Jakie jest ich przeznaczenie i gdzie można je z naleźć?
Microsoft nadal rozwija ideę "AI for Everyone", co oznacza demokratyzację sztucznej inteligencji i jej powszechną dostępność dla ludzkości. Gigant nie tylko inwestuje w OpenAI, z którym współdzieli tę misję, ale również tworzy własne modele AI. Właśnie ukazały się dwa nowe z rodziny MAI (Microsoft AI). Jakie jest ich przeznaczenie?
Po pierwsze, udostępniamy MAI-Voice-1, nasz pierwszy wysoce ekspresyjny i generujący mowę naturalną model, który jest dostępny w Copilot Daily i Podcasts oraz jako nowe doświadczenie Copilot Labs do wypróbowania tutaj. Głos stanowi interfejs przyszłych towarzyszy AI, a MAI-Voice-1 dostarcza wysokiej jakości, ekspresyjny dźwięk w scenariuszach zarówno z jednym, jak i wieloma mówiącymi.
Pod drugie, rozpoczęliśmy publiczne testy MAI-1-preview na LMArena, popularnej platformie ewaluacji modeli przez społeczność. To pierwszy model bazowy MAI trenowany kompleksowo. Oferuje on wgląd w przyszłe możliwości Copilota. Aktywnie pracujemy nad udoskonaleniem modeli. W nadchodzących miesiącach będziemy mieli znacznie więcej do przekazania. Bądźcie czujni!
— Microsoft AI
MAI-Voice-1 to niezwykle szybki model generowania mowy, który potrafi wygenerować minutową wypowiedź w niecałą sekundę na jednym GPU. To jeden z najwydajniejszych tego typu systemów dostępnych na rynku. Microsoft sam z niego korzysta w swoich usługach Copilot Daily oraz Copilot Podcasts, o których już wcześniej pisaliśmy. Został on także wypuszczony w Copilot Labs.
MAI-1-preview można z kolei określić jako konglomerat modeli eksperckich, trenowanych wstępnie i po uruchomieniu na blisko 15 tysiącach układów GPU NVIDIA H100. Ma on zapewnić konsumentom korzyści w scenariuszach wymagających dokładnego wykonywania instrukcji i dostarczania odpowiedzi na codzienne zapytania. W ciągu następnych tygodni ten model zostanie wdrożony w Microsoft Copilot, aby obsługiwał niektóre zapytania tekstowe.
W przeciwieństwie do małych modeli językowych (SLM) Microsoftu, takich jak Mu i Phi, modele MAI nie uruchamiają się bezpośrednio na urządzeniu użytkownika, lecz w chmurze Azure.