Dyktowanie w Office wkrótce jako zintegrowana funkcja. Jak to działa w języku polskim?

Dyktowanie w Office wkrótce jako zintegrowana funkcja. Jak to działa w języku polskim?

Autor: Krzysztof Sulikowski

Opublikowano: 8/30/2019, 5:35 PM

Liczba odsłon: 15047

Microsoft swego czasu mocno promował obsługę oprogramowania głosem, która jest możliwa dzięki inteligentnemu rozpoznawaniu mowy. To właśnie dyktowanie czy konwersacja mają w przyszłości stać się podstawowymi formami interakcji, spychając na dalszy plan klawiaturę, mysz i dotyk. Opierające się na tym rozwiązania już istnieją, choćby w Cortanie i dodatku Microsoft Dictate do pakietu Office. Ten wkrótce przestanie być tylko dodatkiem, a stanie się integralną częścią pakietu Office. Zobaczmy, jak stać się dyktatorem.

Dzisiaj każdy gigant technologii ma swój system rozpoznawania mowy. Sprawdza się to najlepiej oczywiście w USA, gdzie największą popularnością (i dostępnością!) cieszą się asystenci głosowi Alexa, Siri, Google i Cortana. Równolegle do nich rozwijana jest obsługa głosu przez same aplikacje, bez pośrednictwa asystentów. Przykładem jest właśnie funkcjonalność Microsoft Dictate opracowana przez Microsoft Garage. Wtyczka napędzana przez Microsoft Cognitive Services okazała się na tyle dobra, że Microsoft postanowił włączyć ją do Office na stałe.

Dictate jest dodatkiem Office dla Windows Outlook, Word i PowerPoint, który konwertuje mowę na tekst, używając najwyższej jakości rozpoznawania mowy, stojącego za Cortaną i Microsoft Translatorem.

Naturalnie nie można pominąć pytania, jak ten system radzi sobie z językiem polskim, który, jak zakładamy, okazał się dla Cortany zbyt trudny i niszowy, by było sens tworzyć dla niej jego obsługę. Tu z pewnością lepiej wypada synteza mowy polskiej, ale co z rozpoznawaniem? Sprawdzaliśmy to właśnie w funkcji Dictate. Część słów jest rozpoznawana prawidłowo, ale tylko część, a to za mało, by z tą funkcjonalnością sensownie pracować. Zobaczcie, co na przykład Dictate zwrócił, gdy wypowiedzieliśmy "CentrumXP", w dodatku za drugim razem, bo za pierwszym nie zarejestrował niczego:

Dyktowanie do Worda

Cóż, wiemy, że język polski jest jednym z najtrudniejszych, ale Microsoft naprawdę mógłby się bardziej postarać. Dla porównania — funkcja dyktowania w Google Translator znacznie lepiej radzi sobie z rozpoznawaniem naszej mowy i na upartego można jej używać do dyktowania dłuższych tekstów, które następnie kopiujemy do Worda. Oficjalna aplikacja na stronie Translatora ma pewne ograniczenia, ale zamiast niej można skorzystać z zamiennika, który nie kończy rejestrować, gdy zapadnie cisza. Wada jest niestety taka, że nie da się tego wszystkiego ogarnąć w jednym oknie aplikacji Outlook czy Word, a to w nich jest najbardziej przydatna. Gdyby powstał dodatek do Office'a oparty na tym systemie, mógłby z powodzeniem konkurować z Dictate, przynajmniej wśród polskich użytkowników.

Dictate posiada inteligentne zaplecze w chmurze i jest zdolny do nauki, dlatego z biegiem czasu powinien stawać się lepszy i trafniej rozpoznawać słowa. Gdy funkcja doczeka się integracji, zapewne wielu użytkowników ją odkryje i zacznie z niej korzystać. Integracja z Office 365 i Windows 10 ma nastąpić po odesłaniu dodatku na emeryturę, czyli po 15 października tego roku. Tymczasem możemy pobrać Dictate jako dodatek do Office w wersji 32-bit lub 64-bit.