W czym sztuczna inteligencja Microsoftu góruje nad innymi SI i... człowiekiem?

Microsoft inwestuje w sztuczną inteligencję ogromne środki, a w jego oddziałach Microsoft Research pracują naprawdę tęgie głowy. Z drugiej strony firma nie ma na tym polu tak spektakularnych, medialnych osiągnięć, porównywalnych choćby z pobiciem Go przez Google Deepmind. W czym tak naprawdę AI od Microsoft jest najlepsza? Otóż jest kilka branżowych testów, w których nie ma sobie równych. Zobaczmy, na czym one polegają.

Rekordowymi osiągnięciami w dziedzinie AI pochwalił się na blogu Steve Guggenheimer, CVP Developer Platform w Microsoft. Opracowywana przez firmę technologia sztucznej inteligencji jest liderem w czterech niezależnych benchmarkach o dość sporej rozpiętości zadaniowej. Są to swego rodzaju branżowe testy, które badają zdolność różnych modeli AI w konkretnych scenariuszach. Ich dokładne cechy przytaczamy poniżej.

SQuAD 1.1 (Stanford Question Answer Dataset): testy SQuAD proszą AI o przeczytanie dokumentu, a następnie o udzielenie odpowiedzi na pytania związane z tekstem. Fachowo mówiąc, tego rodzaju test bada machine reading comprehension (MRC), czyli zdolność do maszynowego czytania ze zrozumieniem. Sztuczna inteligencja Microsoftu posiada tu zdolność na poziomie ludzkim. Więcej o tym osiągnięciu pisaliśmy tutaj.
Stanford SQuAD 2.0: w czerwcu bieżącego roku ukazała się druga iteracja SQuAD, także badająca zdolność maszynowego czytania. Wersja ta powstała, aby zachęcać do rozwijania czytających ze zrozumieniem systemów, które wiedzą, czego nie wiedzą. Microsoft w tym benchmarku okupuje pierwsze miejsce i w sumie w trzech z pięciu rankingów, jednocześnie utrzymując pierwsze miejsce w SQuAD 1.1.
Salesforce WikiSQL Challenge: ten benchmark używa dużego, crowdsourcingowego zestawu danych, opartego na Wikipedii (WikiSQL). Od sztucznej inteligencji wymaga się odpowiedzi na pytania zadane w języku naturalnym i dotyczące zagadnień z wspomnianego zestawu danych. W teście prowadził zazwyczaj Salesforce, ale w tym miesiącu Microsoft wszedł na pierwsze miejsce w nowym podejściu o nazwie IncSQL. Znacząca poprawa w wynikach testu (81,4% na 87,1%) jest rezultatem współpracy naukowców z działów Microsoft Research oraz Business Application Group.
Allen Institute for AI’s Reasoning Challenge (ARC): kwestionariusz ARC zawiera zestaw 7787 otwartych pytań wielokrotnego wyboru na poziomie szkoły podstawowej. Najlepsze podejście wykonał ET-RR (essential term aware – retriever reader) opracowany wspólnie przez zespoły Microsoft Dynamics 365 i badaczy AI we współpracy ze stażystami z University of San Diego. W tym samym teście trzecie miejsce zajął model innego zespołu, złożonego z naukowców z Sun Yat-Sen University i Microsoft Research Asia.

Spośród wszystkich osiągnięć AI Microsoftu - a było ich trochę, choćby pokonanie Pac-Mana - najbardziej prestiżowym pozostaje chyba czytanie ze zrozumieniem na poziomie ludzkim. Dla inteligencji, działającej całkowicie sztucznie, jest to nie lada wyczyn, nie wspominając o tym, że czytanie ze zrozumieniem sprawia kłopoty nawet części dorosłych ludzi. Sztuczne inteligencje biją się tymczasem o pierwsze miejsca w zawodach, w których równie dobrze mogłyby brać udział przedszkolaki. Nieuniknione jest jednak, że AI będzie piąć się coraz wyżej. Aż trudno sobie wyobrazić, co będzie, kiedy osiągnie zdolności rozumowania, przekraczające nasze własne. Czy granica w rozwoju AI kiedyś się ujawni i będzie to coś pokroju prawa Moore'a w odniesieniu do procesorów? Tego jeszcze nie wiadomo. Zwolenników koncepcji technologicznej osobliwości jednak nie brakuje.

W czym sztuczna inteligencja Microsoftu góruje nad innymi SI i... człowiekiem?

Autor: Krzysztof Sulikowski

Opublikowano: 9/26/2018, 10:32 PM

Liczba odsłon: 1254

Aktualności

Artykuły

Wydarzenia