7 nowych, realistycznych głosów AI w Azure

7 nowych, realistycznych głosów AI w Azure

Autor: Krzysztof Sulikowski

Opublikowano: 11/6/2023, 4:00 PM

Liczba odsłon: 259

Realistycznie, naturalnie brzmiące głosy syntezatorów mowy dostępnych w Windows oraz aplikacjach internetowych, mobilnych i desktopowych, to dziś właściwie norma. Z drugiej strony to nadal pole do rozwoju, na którym osiągnięcia wciąż potrafią zaskakiwać. Microsoft zaprezentował kilka nowych, wyjątkowo realistycznych głosów w Azure, które deweloperzy mogą wykorzystać w swoich aplikacjach.

Teraz w interakcjach konwersacyjnych człowiek-bot AI może produkować bardziej naturalne, płynne i wysokiej jakości odpowiedzi niż kiedykolwiek wcześniej dzięki mocy Dużych Modeli Językowych (Large Language Models, LLMs), takich jak Azure OpenAI GPT. W efekcie podczas rozmów werbalnych zapotrzebowanie na naturalność i ekspresję głosów Text-to-Speech (TTS, zamiany tekstu na mowę) jest większe niż kiedykolwiek. Przedstawiamy te nowe głosy zaprojektowane specjalnie do scenariuszy konwersacyjnych. Niezależnie od tego, czy tworzysz czatbota wykorzystującego mowę, asystenta głosowego czy agenta konwersacyjnego, te nowe głosy sprawią, że Twoje interakcje będą bardziej realistyczne, żywe i wciągające.
— Microsoft

Według Microsoftu te nowe głosy są świetnym wyborem dla scenariuszów, w których odbywają się naturalne interakcje głosowe, takich jak czatboty, asystenci głosowi, e-learning, rozrywka i nie tylko. Po wprowadzeniu 3 głosów angielskich (USA) w zeszłym miesiącu firma wypuściła 7 kolejnych: francuski (Kanada), francuski (Francja), niemiecki (Niemcy), włoski (Włochy), koreański (Korea), portugalski (Brazylia) i hiszpański (Hiszpania). Zaktualizowano też głosy mandaryński (Chiny), hiszpański (Hiszpania), angielski (Wielka Brytania) i koreański (Korea), poprawiając ich naturalność i prozodię. Próbki mowy można odsłuchać na stronie Microsoft Teach Community.

Microsoft oferuje ponad 400 głosów neuronowych w ponad 140 językach i dialektach, wliczając w to 3 głosy polskie: pl-PL-AgnieszkaNeural, pl-PL-MarekNeural (Male) i pl-PL-ZofiaNeural.

Źródło: https://techcommunity.microsoft.com/t5/azure-ai-services-blog/introducing-7-new-realistic-ai-voices-optimized-for/ba-p/3971966