Naturalna rozmowa z postaciami w grze stała się możliwa dzięki AI

Naturalna rozmowa z postaciami w grze stała się możliwa dzięki AI

Autor: Krzysztof Sulikowski

Opublikowano: 2/22/2021, 8:52 PM

Liczba odsłon: 4115

Twórca Modbox połączył rozpoznawanie mowy z Windows, sztuczną inteligencję OpenAI GPT-3, naturalną syntezę mowy Replica i VR, tworząc unikalne demo: prawdopodobnie jedną z pierwszych wirtualnych postaci z konwersacyjną sztuczną inteligencją.

Modbox to sandbox do tworzenia gier wieloosobowych na SteamVR. Niedawno jego deweloper sięgnął po najnowocześniejsze rozwiązania z zakresu machine learningu i AI nastawionej na mowę. Chodzi tu o model językowy OpenAI GPT-3 i syntezator mowy naturalnej Replica. Efekt jest po prostu oszałamiający i bardzo nowatorski. W istniejących grach wideo i doświadczeniach VR albo w ogóle nie można rozmawiać z NPC-ami, albo możemy poruszać się tylko po wcześniej napisanych drzewach dialogowych. Dialogi są oskryptowane i nagrane przez aktorów, a gra jedynie odtwarza pliki dźwiękowe. W tym przypadku jest zupełnie inaczej. Wirtualna postać otrzymuje dowolne pytanie zadane przez gracza i udziela na nie odpowiedzi. Między pytaniem a odpowiedzią występuje niestety spore opóźnienie, ponieważ zarówno GPT-3, jak i Replica działają w chmurze. Przyszłe modele działające lokalnie na urządzeniu mogą wyeliminować tę niedogodność.

Jak to w ogóle możliwe? Bezpośrednia, naturalna rozmowa z wirtualnymi postaciami i uzyskanie przekonujących odpowiedzi bez względu na to, o co zapytamy, to do niedawna sfera fantazji. Zmienia się to dopiero za sprawą ostatnich osiągnięć w uczeniu maszynowym, które sprawiają, że ​​ten pomysł jest wreszcie możliwy. Odpowiada za to model GPT-3, który jest efektem lat ewolucji. Przytoczmy nieco historii. W 2017 roku dział AI Google pokazał nowe podejście do modeli językowych zwane Transformer. Najnowocześniejsze modele uczenia maszynowego już wcześniej wykorzystywały koncepcję uwagi, aby uzyskać lepsze wyniki, ale model Transformer został zbudowany całkowicie wokół niej. Rok później startup OpenAI, wspierany przez Elona Muska, zastosował podejście Transformer do nowego ogólnego modelu języka o nazwie Generative Pre-Training (GPT) i stwierdził, że jest w stanie przewidzieć następne słowo w wielu zdaniach i odpowiadać na pytania wielokrotnego wyboru.

W 2019 roku OpenAI powiększył model ponad 10-krotnie, wydając GPT-2. Okazało się, że to skalowanie drastycznie zwiększyło możliwości systemu. Mając kilka podpowiedzi, model był już w stanie napisać całe eseje na prawie każdy temat. W niektórych przypadkach był nie do odróżnienia od człowieka. Ze względu na potencjalne konsekwencje OpenAI początkowo zdecydował się go nie publikować, co z kolei wywołało zainteresowanie mediów i spekulacje na temat społecznych skutków zaawansowanych modeli językowych. GPT-2 miał 1,5 miliarda parametrów, ale w czerwcu 2020 roku OpenAI ponownie przeskalował ten pomysł do 175 miliardów w GPT-3, którego działanie pokazano właśnie w tym demo. Wyniki GPT-3 są prawie zawsze nie do odróżnienia od wypowiedzi ludzkich.

Technicznie rzecz biorąc, GPT-3 nie ma prawdziwego "zrozumienia", chociaż definicja tego słowa jest przedmiotem dyskusji — zwłaszcza filozoficznych. Czasami efekty modelu mogą wydać się bezsensowne lub nawet szkodliwe (jak choćby pochwała samobójstwa), dlatego badacze musieli nałożyć pewne ograniczenia, takie jak mechanizm "zdroworozsądkowy". O tym, że sztuczna inteligencja musi być od początku etyczna, od dawna przekonuje Microsoft, i tak też jest w przypadku GPT-3, który dopiero ze stosownymi blokadami może trafić do ogólnodostępnych produktów konsumenckich.

Microsoft, który zainwestował miliard dolarów w OpenAI, ma wyłączne prawa do kodu źródłowego i komercyjnego wykorzystania GPT-3, więc jest chyba mało prawdopodobne, aby ta funkcja została dodana na stałe do Modboksa. Niezależnie od tego powyższa demonstracja to chyba najlepsze jak dotąd spojrzenie na przyszłość interaktywnych postaci w grach. Przyszłe modele językowe mogą zmienić samą naturę projektowania gier i umożliwić wprowadzenie zupełnie nowych gatunków.

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia