Jak powstają dźwięki dla systemów Windows

Jak powstają dźwięki dla systemów Windows

Autor: Krzysztof Sulikowski

Opublikowano: 9/7/2018, 1:00 PM

Liczba odsłon: 4711

Myśleliście kiedyś o dźwiękach, które emitują Wasze komputery, kiedy dostajecie maila, spada poziom baterii albo kalendarz przypomina o spotkaniu? Matthew Hasser Bennett myślał. I to dużo. Bennett osobiście skomponował, wykonał i cyfrowo obrobił ponad 400 wersji dźwięku kalendarza w Windows 10, zanim wybrał ten idealny. Dźwięki towarzyszące Windows zawsze były dość dobrze przemyślane. Artyści i kompozytorzy musieli bowiem w skondensowanej formie zawrzeć czytelny komunikat, co wychodziło różnie. Niektóre dźwięki, jak np. Wykrzyknik, zdawały się aż nadto dosadne, podczas gdy inne - zwłaszcza dźwięki startowe, takie jak ten z Windows 95 - były jak balsam dla uszu. Ale czy byłyby takie nadal? Wprawne ucho wychwyci, że od czasów tamtych Windowsów wiele się zmieniło. Dźwięki stały się krótsze, mniej inwazyjne i jakby przyjemniejsze, a niektóre całkowicie zniknęły z systemu - dowiemy się na przykład, dlaczego Windows 10 nie ma dźwięku startowego. Z perspektywy użytkownika dźwięk powiadomienia ma po prostu coś sygnalizować i być w miarę przyjemny. Zwykle nie zdajemy sobie sprawy z ogromnej pracy, mnóstwa koncepcji i filozofii, stojących za materiałem, którego łączna długość końcowa to zaledwie kilka sekund. A okazuje się, że praca nad dźwiękami dla Windows jest niezmiernie ciekawa.

Prace nad udźwiękowieniem Windows 10 przeprowadzono z niespotykanym dotąd rozmachem. To już nie są generowane na wiekowych kartach dźwiękowych brzdąknięcia ani skompresowane do granic możliwości nagrania instrumentów lub przedmiotów codziennego użytku. To kawał umysłowej i studyjnej pracy z profesjonalnym sprzętem, profesjonalnym kompozytorem i mnóstwem idei, które zwykle wydają się tak oczywiste, że o nich zapominamy, lub tak abstrakcyjne, że nie zdążyliśmy o nich pomyśleć. Poznajmy tę fascynującą historię i zobaczmy, jak powstawał dźwiękowy pejzaż Windows 10, Office, Xboksa, Cortany, Skype i innych produktów Microsoftu.

Te 400 nagranych, przetworzonych i przebranych sekwencji, by ostatecznie wydobyć tylko jeden dźwięk powiadomienia, doskonale wprowadza w zagadnienie produkcji dźwięków dla systemu operacyjnego. Tyle to właśnie trwa, by zrobić to prawidłowo - mówił Matthew Bennett podczas ostatniej wizyty w swoim studio dźwiękowym w Redmond. Odseparowane od świata zewnętrznego i wytłumione pomieszczenie wyposażone jest w stół mikserski, zestaw high-endowych monitorów studyjnych, wielkie ekrany LCD i wielooktawową klawiaturę syntezatora. Jako dyrektor kreatywny dźwięku z przepastnym portfolio prac wykonanych dla Microsoftu, przez ostatnie 15 lat Bennett odgrywał kluczową rolę w projektowaniu dźwięku dla sprzętu i oprogramowania firmy. Ma on mocne opinie i rozwiniętą filozofię na temat dźwięku, a także bogate słownictwo, które pozwala mu o nim mówić.

Jak można opisać rolę reżysera dźwięku w Microsoft? Naszą odpowiedzialnością w stosunku do klientów jest, po pierwsze, nie szkodzić - żadnego denerwującego audio! Po drugie, uczynić to funkcjonalnym, a po trzecie, uczynić to pięknym. Piękno i funkcjonalność idą w parze. Im piękniejszy design, tym lepiej będzie wspierał doświadczenia, które tworzymy - podsumowuje Bennett. Rodzina dźwięków w Windows 10 potrzebowała wielu miesięcy na osiągnięcie perfekcji. Nie jest to jednak praca jednej osoby! Bennett współpracował blisko z kluczowymi członkami jego zespołu, wliczając w to projektantów graficznych, badaczy, menadżerów projektów i inżynierów: Dokonaliśmy wielu iteracji, by mieć pewność, że wszystko brzmi, jak należy.

Posłuchajcie dźwięku powiadomienia o zdarzeniu w Kalendarzu

Będąc kompozytorem muzyki poważnej i improwizowanej, który prowadził rozległe badania nad muzyką kultur spoza zachodniego kręgu, Bennett obronił doktorat z etnomuzykologii (antropologii muzyki) na University of Washington, by następnie objąć pełnoetatowe stanowisko w Microsoft. Okres ten trwał 5 lat, po czym Bennett odszedł, by założyć własną agencję, i przez następną dekadę poświęcać się tworzeniu ścieżek dźwiękowych dla filmów i telewizji. W tym czasie tworzył też dźwięk dla firm z listy Fortune 500. Ostatecznie jednak nie poczuł się usatysfakcjonowany muzyką, którą tworzył. W poszukiwaniu nowych inspiracji Bennett porzucił komponowanie i zajął się studiami nad średniowiecznymi psalmami i muzyczną kulturą Afryki Zachodniej, Indii, Bliskiego Wschodu i Indonezji. Kiedy zaczął stopniowo powracać do komponowania, jego celem stało się stworzenie osobistego języka muzycznego, dźwięku, z którym mógłbym żyć, jak mówi sam Bennett. Rezultatów tej koncepcji można posłuchać na stronie kompozytora.

Powróciwszy do Microsoft, Bennett zaczął kopać głębiej. Efekty jego prac pobrzmiewają dziś nie tylko na milionach urządzeń z Windows, ale również na konsolach Xbox i w wielu produktach Microsoftu, takich jak Office, Surface, Cortana i Skype. Można rzec, że posiadanie mocnej filozofii projektowania dźwięku, której oś stanowi kreatywny punkt widzenia, pomogło Bennettowi ujednolicić pejzaż dźwiękowy produktów Microsoftu podobnie jak zasady projektowania interfejsów użytkownika mają na celu stworzenie kontinuum wizualnego i funkcjonalnego, obejmującego wszystkie te produkty.

Chcemy zorkiestrować harmonię
pomiędzy urządzeniami i zmysłami.

Poza tym środowisko rozwojowe Fluent Sound and Sensory Design Microsoftu ma na celu szerokie wpłynięcie na projektowanie dźwięku w branży technologicznej. Używamy dźwięku, aby kształtować rytm i teksturę emocjonalną doświadczenia użytkownika - mówi Bennett. Dźwięk jest elementem, który jest zintegrowany z innymi doświadczeniami zmysłowymi, takimi jak dotyk, tekstura i ruch. Zmieniamy sposób, w jaki myślimy o projektowaniu dźwięku w Microsoft i - przy odrobinie szczęścia - także w całej branży. Naszym celem jest pomóc zorkiestrować harmonię pomiędzy urządzeniami i zmysłami.

Rick Senechal, architekt rozwiązań medialnych w Microsoft, pracował z Matthew Bennettem przez 20 lat. Senechal kieruje serwisem muzycznym o zasięgu globalnym, przeznaczonym dla zespołów firmowych i agencji. Każdego roku serwis dostarcza 4000 utworów dla wydarzeń, wideo, podcastów i produktów. Jak twierdzi Senechal, Bennettowi nigdzie się nie spieszy i wszystko ma ekstremalnie przemyślane: Matthew jest najbardziej skupioną osobą, z jaką kiedykolwiek pracowałem. Ma szerokie, pogłębione spojrzenie na swoje rzemiosło i naprawdę ma wszystko przemyślane. Nie tworzy po prostu dźwięków i nie mówi 'Och, to brzmi dobrze'. Za dźwiękami i teksturami, które tworzy, stoją logika i inteligencja. Bennett jest za to szybki, by zadeklarować, czym dźwięki Microsoftu nie są.

Za dźwiękami i teksturami, które tworzy,
stoją logika i inteligencja.

Nie jesteśmy efektami dźwiękowymi, dźwiękami do gier, dźwiękami ogólnymi (pipczenie i buczenie), nowoczesnymi dźwiękami (psy i nautofony), futurystycznymi dźwiękami, muzyką od ściany do ściany ani alarmami - wymienia kompozytor. Dźwięki naszych produktów nie są muzykami, grającymi na żywo, ani samplowanymi kawałkami prawdziwych instrumentów, jak pianino, gitara albo syntezator analogowy, ponieważ przywołują one określone style muzyczne i pamięć emocjonalną, co jest bardzo subiektywne dla indywidualnych osób i całych kultur. Te podejścia do designu nie mają sensu w tych rodzajach nowoczesnych doświadczeń cyfrowych, które nasze zespoły tworzą. Naszym celem jest rozwinięcie języka projektowania dźwięku, który daje poczucie unikalności i autentyczności i który jest głęboko zintegrowany z naszymi produktami i urządzeniami.

Dźwięki w poprzednich wersjach Windows dość znacząco się różniły od tych w Windows 10. Z jednej strony było ich dużo więcej. Tryumfatorskie fanfary, wieszczące sukces udanego rozruchu, zdaniem Bennetta nie są już koniecznie potrzebne - i trudno się z nim nie zgodzić. Nie potrzebujemy dłużej celebrować faktu, że nasze urządzenie się włączyło. W tych czasach przyjmujemy to za coś oczywistego.

Ewolucja dźwięków nie tylko w Windows, ale i w innych nowoczesnych produktach, uwidacznia się również poprzez skrócenie form. Wczesne dźwięki, jak choćby ten w Windows NT Workstation 4.0 z 1996 r., który trwał 8 sekund i był stosunkowo przyjemny, zupełnie nie pasują do współczesnych urządzeń i współczesnego stylu. Dziś sygnały powiadomień mierzy się nie w sekundach, a w milisekundach (1/1000 części sekundy). Podobnie jak dźwięki startowe, tak i dźwięki pożegnalne stały się reliktami przeszłości. Mimo całego sentymentu, który wokół nich narósł, nie są już postrzegane jako nieodzowna wizytówka, lecz jako kolejne zbędne zanieczyszczenie technologicznym hałasem.

Posłuchajcie dźwięku uruchomienia Windows NT Workstation 5.0

Dźwięk startowy w Windows NT Workstation 5 (2000) trwał niemal 12 sekund i brzmiał jak szwadron wzlatujących samolotów myśliwskich, potem następowało podwyższenie (jak w starych intrach VHS) i sekwencję kończyły migające marimby. Dzisiejsze dźwięki są dużo głębiej zintegrowane z produktem i tak spokojne, ciche i nieintruzywne, jak to możliwe - mówi Bennett. Na próżno też szukać dźwięków skeumorficznych - takich, które replikują odpowiedniki ze świata rzeczywistego, jak zgniatany kawałek papieru, kiedy dokument jest usuwany, albo stukanie XIX-wiecznej maszyny do pisania, które miałoby symbolizować pisanie na ekranie.

Na wcześniejszych etapach dźwięki te pomagały ludziom zaznajomić się z technologią, ale już ich nie potrzebujemy. Nie dodają już nic do doświadczenia i sprawiają raczej wrażenie bałaganu - tłumaczy Bennett. Od wielu lat świat designu graficznego redukuje bałagan i używa większej przestrzeni. Dźwięk zaczął robić to samo. Rzeczywiście, dostrzegalna jest analogia między dźwiękiem a warstwą wizualną - doskonałym przykładem porzucenia skeumorfizmu jest to, co stało się z interfejsem asystenta Microsoft Bob, o czym pisaliśmy szerzej w linkowanym artykule.

Windows 7 posiadał około 40 dźwięków. Windows 10 ma ich już tylko 8, nie licząc dołączonych do systemu starszych dźwięków, które zapewnić mają wsteczną zgodność. Kiedy zaczynałem, było siedem różnych dźwięków błędu. Dokładano je z biegiem lat i nikt nie wiedział, co one znaczą. Nie było jasnych wytycznych dla partnerów ani dla nas samych - wspomina Bennett. Pozbyliśmy się całego zestawu i zastąpiliśmy go dwoma bardziej ukierunkowanymi dźwiękami - jednym jako delikatne powiadomienie w tle i innym bardziej gwałtownym dźwiękiem.

Jak powstają dźwięki dla Windows?

Jedna z rozwiniętych przez Bennetta technik polega na ekstensywnym nagrywaniu i porównaniu konturów wokalu - rytmicznych i melodycznych aspektów mowy - w różnych językach, by zidentyfikować uniwersalne wzorce, które mogą pomóc w stworzeniu języka projektowania dźwięku. Przykładowo komunikat, oznaczający "Gotowy do drogi?", może posiadać zbliżony wzór wysokości tonów, gdy jest wymawiany po angielsku, francusku, japońsku, hiszpańsku czy rosyjsku. Bennett charakteryzuje go jako do góry, w dół i mały skok. Właśnie taki wzór tonalny - ową melodię głosu - przełożył on na muzykę i wykorzystał w dźwięku powiadomienia kalendarza w Windows 10. W ten sam sposób powstały wszystkie inne dźwięki w Windows 10. Jak tłumaczy kompozytor: Kontury językowe są głęboko zintegrowane, nie są przeznaczone do bycia słyszanymi dosłownie lub świadomie. Powinny być odczuwane intuicyjnie, by tworzyły emocjonalne połączenie, które odczuwa się naturalnie, instynktownie.

Bennett wierzy, że najlepsze dźwięki dla systemu operacyjnego powinny być głęboko zintegrowane z wydarzeniami, które wspierają. Przykładowo wysyłanie szybkich wiadomości jest bardziej związane z czasem niż wysyłanie maili, dlatego dźwięk dla tego pierwszego pcha nas trochę do przodu i jest nieco bardziej alarmowy, a dźwięk nowej poczty sprawia, że nadal chcemy zobaczyć, co do nas przyszło, ale dźwięk jest trochę bardziej wycofany, jest trochę bardziej zrelaksowany.

Czy Benett nazywa swoje utwory muzyką? Co to w ogóle jest muzyka?

Projektujemy dźwięk z myślą o ciszy.

W szerokim rozumieniu - tak. Opisałbym je jako paramuzyczne - odpowiada Bennett. Wykorzystują elementy muzyki - rytm, melodię i harmonię - aby stworzyć dźwięki, które odczuwa się jako piękne, ale które nigdy nie powinny przyciągać do siebie uwagi jako utwory muzyczne. Koncepcje muzyczne pełnią jednak ważną rolę w jego projektowaniu: Brzmienie komunikatu o błędzie używa interwału nony małej, który jest zdecydowanie trochę dysonansowy, i mówi: "Naprawdę musisz poświęcić temu uwagę". Czym jest szerokie rozumienie muzyki? Najlepiej ujmuje to Wikipedia - jest to sztuka organizacji struktur dźwiękowych w czasie. Muzyką będą zatem utwory tak samo autorstwa Merzbow, jak i zespołu Akcent. W węższym rozumieniu występują wspomniane elementy (rytm, melodia i harmonia) a także człowiek jako organizator tych struktur. Muzyka generowana przez komputer bez ingerencji ludzkiej ma tu trochę niejasny status. Tak czy inaczej dźwięki Bennetta są nie tylko muzyczne, ale też muzykalne.

Chociaż rośnie liczba firm technologicznych, zatrudniających reżyserów dźwięku, to jako dyscyplina projektowanie dźwięku nadal jest trochę opóźnione względem projektowania sprzętowego i wizualnego - zauważa Bennett. Tradycyjnie nie byliśmy głęboko zintegrowani z zespołami designu produktów, nie licząc gier. Microsoft był jedną z pierwszych firm, które zrozumiały wartość osadzenia projektantów dźwięku w zespołach produktów.

Oprócz wpływania na Microsoft i, szerzej, na design technologiczny Bennett uważa, że dyscyplina projektowania dźwięku ma powinności wobec całego świata. "New York Times" w historii z 9 lutego 2018 r. odnotował, że kakofonia produkowana przez wszechobecne dziś urządzenia elektroniczne dowodzi, iż pompatyczne, wydzierające uwagę, nieorganiczne hałasy stały się normą, [zaś] wzburzone soniczne alerty wywołują odruchy Pawłowa.

Bennett też to słyszy: W naszym otoczeniu jest teraz tak wiele dźwięków urządzeń. Same tylko dźwięki Windows są słyszane setki milionów razy w ciągu dnia na całym świecie. To sporo dźwięku, mającego wpływ na wiele żyć. Nawet jeśli są one względnie krótkie, każdy dźwięk ma emocjonalny wpływ, czy jesteśmy tego świadomi, czy nie. Jesteśmy odpowiedzialni, by podejść do tego jako do systemu i pomóc w tworzeniu ekologii dźwięku, która wspiera zdrowe relacje między ludźmi i technologią.

Jak powstają dźwięki dla Windows?

Światowa Organizacja Zdrowia uznała, że niespodziewane, głośne dźwięki mogą prowadzić do stresu i lęku, które są szkodliwe dla zdrowia publicznego, a niepotrzebne dźwięki i zbyt wysokie ich natężenie są kolejną formą zanieczyszczenia. Od tego zgiełku nowoczesności uciec chciał również Bennett: W lesie deszczowym poprzez dźwięk przenoszone są niewiarygodne ilości informacji i jest tego wiele warstw w ciągłym ruchu - ptaki, insekty, drzewa, rośliny, woda i wiatr. Wszystko to jest bardzo zrozumiałe, ponieważ design akustyczny lasu deszczowego ewoluował, by być naturalnie zorkiestrowanym, z głęboką harmonią, która pozwala wszystkim warstwom oddychać i wspólnie funkcjonować. To potężna metafora tego, jak powinniśmy projektować dźwięki.

Wiemy zatem, jak przemyślana jest filozofia dźwięku w Windows i innych produktach Microsoftu. Co jednak w przypadku, gdy po pierwotnym, hurraoptymistycznym etapie przygody z użytkowaniem komputera uznaliśmy, że lepiej będzie wyłączyć wszystkie dźwięki systemu, zostawiając sobie ewentualnie sygnały powiadomień dla poczty czy komunikatora? Czy wyciszając system coś tracimy? Odpowiedni dźwięk w odpowiednim czasie może wspierać efektywniejsze i przyjemniejsze doświadczenie użytkownika - odpowiada Bennett. Dobrze dobrane dźwięki mogą przenosić ważne informacje i poprawiać rytm i przepływ uwagi, która jest naszym najważniejszym zasobem. Mogą one przekazywać decydujące informacje, kiedy jesteśmy z dala od monitora. Mogą poprawić to, jak odczuwamy technologię. Chcemy, by ludzie wiedzieli, że jest OK, by włączyć znowu dźwięki. Nasze nowoczesne podejście do projektowania dźwięku jest pełne głębokiego szacunku. Nie zamierzamy ładować niczego głośnego na spotkaniu albo w bibliotece, nie chcemy przeszkadzać ludziom w waszym otoczeniu. To nie będzie jakiś losowy hałas. To będzie niewielki zestaw pięknych dźwięków, które zostały z uwagą dobrane, by komunikować ważne informacje bardzo efektywnie i pozostawać dobrze osadzonymi w waszym środowisku.

Delikatne przypomnienie

Matthew Bennett o tworzeniu dźwięku alertu kalendarza w Windows 10

Wielu ludzi odczuwa lęk przed swoimi dźwiękami kalendarza, bo to oznacza, że muszą coś zrobić. Niektórzy z nich mówią, że to jak odpowiadanie na alarm przeciwpożarowy przez cały dzień. Potrzebowaliśmy czegoś, co byłoby alarmujące, ale nie wywołujące ataków paniki. Chcieliśmy uzyskać odpowiednią dozę optymizmu i energii, popychającą użytkowników naprzód, w kierunku ich następnej aktywności, ale z poczuciem spokojnego, wspierającego przyjaciela.

Ten dźwięk powinien być słyszany przy niskich głośnościach i powinien być bardziej odczuwany niż słyszany. Posiada on początek, środek i koniec. Jeśli posłuchacie uważnie, usłyszycie, że to rytm siedmiu równych pulsów. Zaczyna się nisko i wolno, z trzema pulsami, które zaprojektowano, by były bardziej odczuwane niż słyszane. Trwa to więcej niż przeciętny dźwięk interfejsu użytkownika - 2,5 sekundy - ale przy normalnej głośności usłyszycie naprawdę tylko część dźwięku, ponieważ te pierwsze trzy tony są tak łagodne. Są one jak oddech, muzyczne podniesienie, by dać wam znać, że coś się ma wydarzyć. Potem głośność trochę pęcznieje, zakwita, by uczynić środkową część trochę bardziej słyszalną. Pod koniec jest długi ogon pogłosu, opadający, który odczuwa się jako bardzo przejrzysty i jasny, ale mogący też poprawić słyszalność w niektórych kontekstach głośności lub jeśli użytkownicy znajdują się daleko od urządzenia.

Jak powstają dźwięki dla Windows?

Jest to więc długi dźwięk, ale bardzo otwarty. Zdecydowanie nie jest alarmujący. Odczuwa się go jako lekki i przyjemny, i posiadający miłą emocjonalną teksturę. Jest też subtelny ruch od lewej do prawej w polu dźwiękowym [panoramie], który możecie usłyszeć przez słuchawki albo z przyzwoitych głośników, jak te w dobrych laptopach czy tabletach. Są też warstwy pierwszoplanowe i drugoplanowe, zawarte w dźwięku końcowym. Tło stanowią cyfrowo wyrzeźbione plumkania i strojona perkusja. Tekstury brzmią znajomo, ale nie są to instrumenty z prawdziwego świata.

Jest też uczucie trioli, towarzyszące temu dźwiękowi i wielu innym w Windows 10. Przez lata dźwięki, które odczuwało się jako najbardziej płynne i które mogą równoważyć odpowiednie jakości energii i spokoju, okazywały się być oparte na trójkowym rytmie. Zatem ten puls, ta rytmiczna podbudowa stały się częścią naszego DNA.

Chcemy brzmieć organicznie, ale integralnie. Znaczy to, że z całą pewnością nie chcemy dźwięków, które dawałyby poczucie zaprogramowania przez komputer. Ale nie chcemy też brzmieć jak człowiek, wykonujący małe utwory muzyczne w waszych urządzeniach. Rozwiązaliśmy to w taki sposób, by dać poczucie zbliżone do maszynowego, nadal zachowując przy tym trochę uduchowienia.