Konwersacyjna sztuczna inteligencja oparta na dużych modelach językowych okazała się prawdziwym przełomem, ale jednak wiele osób tęskni za asystentami pokroju Cortany - mniej inteligentnymi, ale bardziej uzdolnionymi w załatwianiu spraw. Te dwa światy coraz częściej udaje się połączyć, czego przykładem jest nowy agent ChatGPT. Funkcja ta wykona za użytkownika realne działania w Internecie. Jak to działa?
Odpowiadanie na pytania, wyszukiwanie w Internecie, generowanie obrazów, wideo z dźwiękiem, tabel, podsumowań czy raportów to tylko część funkcji, w jakie wyposażone są dzisiejsze czatboty takie jak ChatGPT, Microsoft Copilot albo Gemini. Coraz częściej próbują one swoich sił w roli agenta. Chodzi o oprogramowanie, które nie tylko rozmawia i przekazuje informacje, ale także podejmuje się realnych działań w przeglądarce internetowej albo innych aplikacjach otwartych na komputerze.
Agent ChatGPT wykorzystuje własną przeglądarkę, aby załatwiać sprawy w imieniu użytkownika. Możesz poprosić go np. o zaplanowanie i zakup składników na śniadanie w stylu japońskim dla czterech osób, zerknięcie na Twój kalendarz i briefing przed spotkaniem z klientem, napisanie kodu programistycznego albo przygotowanie prezentacji lub tabeli i ich wygenerowanie w plikach PowerPointa i Excela. Możliwości jest sporo. Agent AI wykona odpowiednie czynności, a Ty musisz je tylko zatwierdzić... albo odrzucić.
ChatGPT w trybie agenta nie ma pełnej autonomii i nie zna Twoich danych logowania. Nie może też samodzielnie płacić Twoją kartą ani robić przelewów. Można to porównać do wrzucania różnych towarów do koszyka. Agent znajdzie i zapakuje produkty, ale to użytkownik staje przed kasą i wszystko finalizuje. A jeśli wynik działania agenta mu się nie podoba, może wszystko anulować. Użytkownik może również przerwać jego działanie w dowolnej chwili, a także przejąć kontrolę nad przeglądarką.
Tryb agenta w ChatGPT opiera się m.in. na Operatorze, znanym już wcześniej agencie OpenAI, a także na dużym modelu językowym (takim z serii GPT lub o), który odpowiada za umiejętności konwersacyjne i wnioskujące/rozumujące agenta. Działa on w normalnym czacie ChatGPT, w którym wystarczy kliknąć "tryb agenta".
Funkcjonalność jest już dostępna w planach ChatGPT Pro, Plus i Team. Nie wiadomo na razie nic o ewentualnej dostępności w ChatGPT Free.