Microsoft udostępnia publicznie trzy spośród dwudziestu pięciu usług, wchodzących w skład Microsoft Cognitive Services. W fazę General Availability wejdą Custom Speech Service oraz Content Moderator. W przyszłym miesiącu dołączy do nich Bing Speech API. Co potrafią nowe serwisy i jak można je wykorzystać we własnych aplikacjach?
Custom Speech Service (znany również jako CRIS) pozwala deweloperom zaprzęgnąć silnik speech-to-text (zamiana mowy na tekst). Jest to ten sam silnik, z którego korzystają już aplikacje Microsoftu. Content Moderator z kolei "pozwala użytkownikom przenosić do kwarantanny i rewidować dane", filtrując treści obraźliwe, które mogą urazić użytkowników. Ostatnia z nowych usług, Bing Speech API, "konwertuje dźwięk na tekst, rozumiejąc intencje i konwertując tekst z powrotem na mowę".
Usługi są dostępne dla deweloperów różnych szczebli (także za darmo) i można ich używać za pośrednictwem odpowiednich API. Mike Seltzer, główny badacz z Speech and Dialog Research Group w Microsoft, dodaje: "W Cognitive Services bierzemy wszystkie inteligentne funkcje machine learningowe i AI w tej firmie i wystawiamy je deweloperom poprzez łatwe w użyciu API, przez co nie muszą oni wynajdować technologii samodzielnie. W większości przypadku wymagałoby to mnóstwa czasu, mnóstwa danych, mnóstwa doświadczenia i wielkiej mocy obliczeniowej, by zbudować wysokiej klasy model machine learningowy".
Microsoft udostępnia własne inteligentne technologie w myśl strategii "Demokratyzacji AI", krzyżującej się ponadto z ideą "Konwersacji jako platformy", przedstawionej na konferencji Build 2016 w kontekście Bot Framework. Według najświeższych danych z inteligentnych serwisów skorzystało już ponad 424 tysiące deweloperów z 60 krajów świata.