Czystszy dźwięk w połączeniach Teams dzięki sztucznej inteligencji

Czystszy dźwięk w połączeniach Teams dzięki sztucznej inteligencji

Autor: Krzysztof Sulikowski

Opublikowano: 6/13/2022, 7:34 PM

Liczba odsłon: 1383

Sztuczna inteligencja i maszynowe uczenie wspomagają aplikacje Office na wiele sposobów. W przypadku Teams odpowiadają m.in. za wykrywanie postaci przy rozmywaniu tła i wykrywaniu hałasów przy ich tłumieniu. Technologie te jeszcze na inne sposoby ulepszają jakość audiowizualną i tym samym wrażenia z połączeń zespołów.

Microsoft ogłosił dostępność nowych funkcji Teams, w tym tłumienia echa, dostosowywania dźwięku do kiepskich warunków akustycznych i możliwości mówienia wielu użytkowników jednocześnie bez zakłóceń. Funkcje te opierają się na sztucznej inteligencji — podobnie jak aktywne tłumienie hałasu (ANC/ANS).

Wśród wspomnianych nowości znajdziemy:

  • Tłumienie echa: Podczas rozmów i spotkań, gdy mikrofon uczestnika znajduje się zbyt blisko głośnika, często dochodzi do zapętlenia dźwięku i niechcianego efektu echa. Microsoft Teams korzysta teraz z AI, aby rozpoznawać różnice między dźwiękiem z głośnika a ludzkim głosem, eliminując echo bez tłumienia mowy lub ograniczania możliwości jednoczesnego mówienia przez wiele osób.
  • Tłumienie pogłosu ("de-reverbation"): Niektóre pomieszczenia cechuje kiepska akustyka, w której dźwięk może się odbijać w niepożądany sposób i brzmieć tak, jakby uczestnik mówił z jaskini. Po raz pierwszy Microsoft Teams używa modelu uczenia maszynowego (ML) do konwersji przechwyconego sygnału audio na taki, jak gdyby użytkownik mówił z bliska do mikrofonu.
  • Możliwość przerwania rozmowy: W naturalnych sytuacjach konwersacji ludzie często przerywają w celu wyjaśnienia lub potwierdzenia. W telekomunikacji odbywa się to poprzez transmisję dźwięku w trybie full-duplex (dwukierunkowym), pozwalając użytkownikom jednoczesne mówić i słyszeć innych. Gdy nie używasz zestawu słuchawkowego, a zwłaszcza gdy używasz urządzeń, w których głośnik i mikrofon znajdują się bardzo blisko siebie, trudno jest usunąć echo przy zachowaniu pełnego dwukierunkowego dźwięku. Microsoft Teams wykorzystuje teraz model wytrenowany na 30 tys. godzin próbek mowy, aby zachować pożądane głosy, jednocześnie tłumiąc niechciane sygnały dźwiękowe, co zapewnia bardziej płynny dialog.

Microsoft wspomina też o tłumieniu hałasów tła, a także o optymalizacjach wizualnych: poprawkach obrazu w zależności od udostępnianej zawartości, optymalizacjach poprawiających jakość przy zakłóceniach transmisji, a także filtrach jasności i ostrości, które ukazują sylwetkę uczestnika w najlepszym świetle i z subtelnym rozmyciem głębi ostrości.

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia