Project Silica - szklany nośnik danych, który przetrwa tysiąclecia

Project Silica - szklany nośnik danych, który przetrwa tysiąclecia

Autor: Krzysztof Sulikowski

Opublikowano: 12/4/2019, 7:00 AM

Liczba odsłon: 5764

Stanisław Lem już w 1964 roku przewidywał, że kryształ ze względu na swą trwałość będzie świetnym nośnikiem pamięci. W opowiadaniu Biała Śmierć z cyklu Bajki robotów pisał o pamięci ludu, która spisana była w czarnym prakrysztale wezuwjanowym, ukrytym w samym jądrze planety. Tym lepiej znał ją i pamiętał ich władca. Motyw nośników, które przetrwają zagładę, będzie w przyszłości powracał w motywach filmów i powieści postapokaliptycznych. Tymczasem, podobnie jak wiele przewidywań polskiego fantasty, staje się ono rzeczywistością — technologią namacalną i jak najbardziej działającą.

Microsoft i Warner Bros. nawiązali współpracę, dzięki której udało się z powodzeniem zapisać i przechować cały kultowy film Superman z 1978 r. na kawałku szkła wielkości podstawki pod napoje. Nośnik ten ma wymiary 75 x 75 x 2 mm, znajduje się na nim 75,6 GB danych (w tym dane naprawcze) i jest praktycznie niezniszczalny. Wykorzystany w nim materiał — twarde szkło krzemionkowe — może przetrwać gotowanie w gorącej wodzie, pieczenie w piekarniku, podgrzewanie w kuchence mikrofalowej, zalanie, szorowanie, rozmagnesowanie i działanie innych czynników, które zagrażają bezcennym archiwom historycznym, filmowym czy księgarskim. To właśnie z rodzaju tego szkła (kwarcowego) wzięła się nazwa Project Silica. Czy oto narodził się najlepszy nośnik danych cyfrowych i czy stanie się powszechny? Jak w ogóle doszło do jego powstania? W tę ciekawą podróż chcemy Was zabrać w dalszej części artykułu!

Superman, kwarc i lasery

Project Silica po raz pierwszy został pokazany światu na konferencji Microsoft Ignite 2019, kiedy to na scenie Satya Nadella wyciągnął z kieszeni spodni szklaną płytkę z wgranym Supermanem i opowiedział nieco o możliwościach, ale przede wszystkim o odpornościach nowego nośnika. Projct Silica to projekt badawczy Microsoftu, który wykorzystuje najnowsze odkrycia w ultraszybkiej optyce laserowej i sztucznej inteligencji, by magazynować dane w szkle kwarcowym. Jak to działa? Laser koduje dane w szkle, tworząc w skali nano warstwy trójwymiarowego rusztowania, podlegającego deformacji na różnych głębokościach i pod różnymi kątami. Za odczyt danych z tych konstrukcji odpowiadają algorytmy uczenia maszynowego, które odkodowują obrazy i wzory powstające, gdy spolaryzowane światło przenika przez szkło.

Project Silica

Co ciekawe, Silica powstał z myślą o potrzebach Microsoft Azure. Gigant zainwestował w opracowanie technologii pamięci masowej, która miała być zbudowana specjalnie dla scenariuszy przetwarzania w chmurze, aby nie trzeba było polegać na typach pamięci zaprojektowanych do pracy na tradycyjnych komputerach czy innych podobnych urządzeniach. Jest to tylko jeden z wielu przykładów wykorzystania przez Azure osiągnięć grupy Microsoft Research. Inne projekty powstałe na styku tych dwóch działów to m.in. podwodne centra danych w ramach Project Natick, układy obliczeniowe FPGA w ramach Project Brainwave czy stosunkowo niedawno rozpoczęte wysiłki spod szyldu Optics for the Cloud, do których zalicza się właśnie Project Silica.

Przechowywanie całego filmu Superman w szkle i możliwość jego odczytania to ważny kamień milowy. Nie twierdzę, że na wszystkie pytania udzielono pełnej odpowiedzi, ale wygląda na to, że jesteśmy obecnie w fazie, w której pracujemy nad udoskonaleniem i eksperymentami, a nie pytamy, czy możemy to zrobić.
— Mark Russinovich, CTO w Microsoft Azure

Warner Bros., gdy tylko dowiedział się o badaniach, zwrócił się do Microsoftu. Filmowy gigant zawsze chętnie sięgał po nowe technologie, aby zabezpieczyć swoją ogromną bibliotekę — historyczne skarby, takie jak Casablanca, audycje radiowe z lat 40., animowane krótkometrażówki, sitcomy czy dzienniki z planów filmowych. Przez lata trochę się tego nazbierało! Warner Bros. poszukiwał technologii przechowywania, która mogłaby przetrwać setki lat, wytrzymać powodzie lub rozbłyski słoneczne i która nie wymagałaby utrzymywania określonej temperatury ani ciągłego odświeżania. Producent musiał więc sprawdzić szklany nośnik Microsoftu.

Pamięć, która przetrwa nuklearną apokalipsę

Wielu ludzi postrzega chmurę jako abstrakcyjne miejsce przechowywania wszystkiego — od tysięcy zdjęć rodzinnych, po miliony e-maili, które nie zabierają miejsca na telefonie lub komputerze. Wszystkie te dane są jednak fizycznie przechowywane w określonych, bardzo przyziemnych lokalizacjach, tzw. centrach danych, i na zupełnie przyziemnym sprzęcie. Sprawdza się to świetnie, jednak istnieje poważna groźba, że ten tradycyjny sprzęt zostanie w tyle za potrzebami użytkowników. Nie tak dawno wkroczyliśmy w erę zettabajtową. Oznacza to, że po raz pierwszy ruch IP przekroczył pod względem transferu 1 ZB. Miało to miejsce w 2016 roku. To tylko 4 lata po tym, jak wszystkie dane cyfrowe na świecie osiągnęły tę objętość. Szacuje się, że do 2020 roku w obiegu będzie już 40 ZB danych, a niektóre źródła mówią nawet o 600 ZB.

Nietrudno tu o porównanie, że w ciągu roku komputery przetwarzają więcej danych niż przetworzono przez całą wcześniejszą historię ludzkości. W podobnej skali przybywa też nowych danych. Ilość danych, które ludzkość chce teraz przechowywać — od dokumentacji medycznej, przez śmieszne filmy z kotami, po zdjęcia zrobione przez statek kosmiczny — wręcz eksploduje. Wszystko to trzeba gdzieś zapisywać, ale to nie jedyny problem. Nie wystarczy produkować więcej dysków i nie tylko dlatego, że w końcu nie będzie gdzie ich trzymać ani złomować. Chodzi raczej o to, że tradycyjne nośniki ulegają zużyciu i zawarte na nich dane trzeba transferować na nowe, a to pochłania czas i sporo kosztuje.

Project Silica

Dyski twarde mogą się zużyć po upływie trzech do pięciu lat. Taśma magnetyczna może przetrwać od pięciu do siedmiu. Wie o tym dobrze Warner Bros., który aktywnie migruje zawartość swoich archiwów cyfrowych co trzy lata, aby wyprzedzić problemy związane z degradacją. Szklany nośnik Microsoftu ma potencjał, by stać się tańszą opcją, ponieważ dane zapisujemy na nim tylko raz. Lasery femtosekundowe — emitujące ultrakrótkie impulsy optyczne i powszechnie stosowane w chirurgii LASIK — trwale zmieniają strukturę szkła, dzięki czemu dane mogą być przechowywane przez wieki. Graczom serii Fallout może nasunąć się skojarzenie z występującymi tam holodyskami. Ich nieco archaiczna budowa mogła bawić, ale w końcu zapisane na nich dane przetrwały nuklearną apokalipsę. Szkło kwarcowe w ogóle jest mało wymagające. Nie potrzebuje energochłonnej klimatyzacji, która utrzymuje materiał w stałej temperaturze, ani systemów usuwających wilgoć z powietrza. W przypadku dużych bibliotek zasobów ma to ogromne znaczenie. Podkreśla to Ant Rowstron, który współpracował z University of Southampton przy opracowaniu projektu Silica:

Nie staramy się budować rzeczy, które trzymasz w domu lub z których odtwarzasz filmy. Budujemy pamięć masową działającą w skali chmurowej. Jedną wielką rzeczą, którą chcieliśmy wyeliminować, jest ów kosztowny cykl przenoszenia i przepisywania danych do pamięci następnych generacji. Naprawdę chcemy czegoś, co można postawić na półce na 50, 100 lub 1000 lat i zapomnieć o nim do czasu, aż będzie to potrzebne.
— Ant Rowstron, Principal Researcher/Deputy Lab Director w Microsoft Research Cambridge

Projekt Silica ma służyć przechowywaniu tzw. zimnych danych, czyli danych archiwalnych, które mogą posiadać ogromną wartość albo które firmy muszą zachować, ale nie potrzebują często uzyskiwać do nich dostępu. Przykłady? Dane medyczne, które muszą być przechowywane przez całe życie pacjenta, dane finansowe, umowy prawne, informacje geologiczne, plany budowy czy wreszcie archiwa filmowe. Takie potrzeby ma Warner Bros., który posiada prawdopodobnie największą bibliotekę treści w branży mediów i rozrywki. Są one wyjątkowe pod względem skali, ale z pewnością nie pod względem problemu, z którym producent się mierzy.

Analogowo-cyfrowe zmagania

Warner Bros., od blisko 100 lat działający w przemyśle filmowym i rozrywkowym, zgromadził jedną z największych bibliotek filmowych na świecie. Wraz upowszechnianiem się nowych formatów danych i ekranów wysokiej rozdzielczości ważną częścią biznesu stało się wydawanie starszych filmów w nowych, zremasterowanych formatach, takich jak Full HD czy 4K. Warner Bros. za punkt honoru uznaje również zachowanie na zawsze najbardziej lubianych historii na świecie. Wyobraźmy sobie choćby, że Czarnoksiężnik z Oz, serial Przyjaciele czy trylogia Matrix stają się nieosiągalne dla przyszłych pokoleń. Oczywiście nikt nie chce sobie takiego scenariusza wyobrażać, dlatego Warner Bros. bardzo poważnie podchodzi do archiwizacji swojego dorobku.

Project Silica

Firma zabezpieczyła się na wszelkie ewentualności i ma plany, które pozwolą jej sobie poradzić z wieloma najgorszymi scenariuszami, takimi jak trzęsienie ziemi, huragan, pożar czy awaria klimatyzacji. Wrażenie robi też strategia zachowawcza, której celem jest, by trzy archiwalne kopie każdego zasobu były przechowywane w różnych lokalizacjach na całym świecie. W ich skład wchodzą dwie osobne kopie cyfrowe oraz oryginalna kopia fizyczna na dowolnym nośniku, na którym zarejestrowano film, odcinek serialu czy kreskówkę. Na szczęście oryginalne taśmy filmowe przetrwają wieki, jeśli będą przechowywane w odpowiednich warunkach. Są jednak takie kopie — przykładowo niektórych programów nakręconych w latach siedemdziesiątych — których oryginalne nośniki mają ograniczony okres trwałości i które wymagają migracji do nowszych formatów. W przypadku dzisiejszych filmów i programów telewizyjnych kręconych cyfrowo trzecia kopia archiwalna ma bardzo krótki cykl migracji — trwa on od trzech do pięciu lat.

Można powiedzieć, że w przypadku nowych, całkowicie cyfrowych produkcji nie ma niczego fizycznego. Jest plik cyfrowy, który możemy zapisać na którymś ze współczesnych nośników, ale nie umieścimy go w skarbcu ani nie zakopiemy pod ziemią, by przetrwał wieki. Dla takich produkcji Warner Bros. tworzy trzecią kopię archiwalną, konwertując ją z powrotem do postaci analogowej. Ostateczny materiał dzielony jest na trzy warstwy kolorystyczne — cyjan, magenta i żółty — i każda z nich jest przenoszona na czarno-białe negatywy filmowe, które nie ulegają wyblaknięciu, tak jak taśma kolorowa. Mimo wielu zalet nawet najlepsza kopia analogowa nie zapewnia 100% integralności danych. Warner Bros. pokłada więc spore nadzieje w projekcie Silica, który pozwoli mu tworzyć trwałe "trzecie" kopie zapasowe nowych treści cyfrowych.

Project Silica

Negatywy te są umieszczane w archiwum-chłodni. Są to prawdziwe schrony, w których temperatura i wilgotność są ściśle kontrolowane, a specjalne czujniki szukają chemicznych oznak rozkładu, które mogłyby sygnalizować problemy. Jeśli z tego kontrolowanego środowiska trzeba pobrać kopię filmu, należy zachować środki ostrożności. Proces ten jest również drogi, a na świecie pozostało tylko kilka laboratoriów filmowych, które nadal tak robią. Nie jest też optymalny z punktu widzenia jakości, ponieważ oryginalny materiał zarejestrowany cyfrowo — zapisany za pomocą zer i jedynek reprezentujących piksele na ekranie — po wydrukowaniu go na filmie analogowym traci oryginalne wartości pikseli. Taki film może i wygląda całkiem dobrze, ale tego procesu konwersji nie można odwrócić. Tworzenie archiwalnych negatywów filmowych dla każdego cyfrowo nakręconego odcinka serialu jest dla Warner Bros. nieopłacalne. Studio ma nadzieję, że Project Silica stanie się nie tylko tańszą alternatywą, ale również pozwalającą zachować oryginalną jakość cyfrową.

Jeżeli możemy wziąć cyfrową reprezentację tych pikseli i umieścić ją na nośniku, takim jak szkło kwarcowe, i odczytać ją z powrotem dokładnie w takiej postaci, w jakiej wyszła z kamery, oznacza to, że wykonaliśmy czynność zachowania najlepiej, jak możemy.
— Brad Collar, SVP Global Archives & Media Engineering, Warner Bros. Entertainment

Project Silica póki co osiąga obiecujące rezultaty w doświadczeniach na małą skalę, ale duże studia potrzebują odpowiednio dużej „mocy przerobowej”. Innymi słowy inżynierowie z Microsoft musieliby znacznie zwiększyć szybkość, z jaką dane mogą być zapisywane i odczytywane, a także ich gęstość. Jeśli rozwiązanie okaże się opłacalne i skalowalne, Warner Bros. będzie korzystał z własnej infrastruktury odczytu szklanych nośników i zachęcał inne studia oraz branże, by również z niego korzystały.

Koniec z przewijaniem kasety ołówkiem!

Szkło krzemionkowe nie jest jedynym innowacyjnym nośnikiem, nad jakim pracuje Microsoft. W ostatnich latach na skutek przełomów technologicznych znacząco spadły koszty syntezy DNA i odczytu danych. Microsoft zakupił kilkadziesiąt milionów nici DNA i rozpoczął prace, na skutek których udało mu się dojść do 100% poprawności zapisu i odczytu danych, a także wzrostu ich zagęszczenia. DNA w przyszłości może pomieścić ilość informacji, magazynowaną obecnie w centrum danych rozmiarów dużej hali, w pamięci wielkości kostki do gry. Ogólnym celem tych badań nad nośnikami nowej generacji jest zapewnienie klientom szerokiego wyboru sposobów, w jakie przechowywane są ich dane.

Project Silica

Badacze z Microsoft przez lata starali się osiągnąć coś podobnego za pomocą technologii używanych obecnie w centrach danych. Przeszkodą okazały się gabaryty, dlatego postanowiono rozpocząć budowę od podstaw. Inżynierowie nawiązali współpracę z University of Southampton Optoelectronic Research Centre, którego pracownicy jako pierwsi zademonstrowali sposób przechowywania danych w szkle z użyciem laserów femtosekundowych. Microsoft zbudował w Cambridge laboratorium, w którym zatrudnił inderdyscyplinarny zespół fizyków, ekspertów optyki, inżynierów elektryków i badaczy z doświadczeniem w magazynowaniu danych. Od tego czasu Microsoft Research odnotował dramatyczne postępy w szybkości i precyzji. Naukowcy pracowali ramię w ramię z kolegami z działu Azure, mając na uwadze zastosowania w chmurze komercyjnej.

Lasery podczerwieni, z których korzysta Project Silica, kodują dane w voxelach, trójwymiarowych odpowiednikach pikseli, które tworzą płaski obraz. W przeciwieństwie do innych nośników optycznych, które zapisują dane na powierzchni czegoś, Silica magazynuje dane wewnątrz samego szkła. Dwumilimetrowej grubości szklana płytka może przechowywać ponad 100 warstw wokseli. Dane kodowane są w każdym z nich poprzez zmianę mocy i kierunku pulsacji lasera, który fizycznie deformuje szkło. Można to porównać do żłobienia gór lodowych w nanoskali, które różnią się od siebie głębokością, rozmiarem i fakturą detali. Aby odczytać dane, algorytmy maszynowego uczenia odkodowują wzory, które tworzą się, gdy spolaryzowane światło przenika szkło. W przeciwieństwie do taśmy, która ma charakter linearny i należy ją przewijać, algorytmy mogą błyskawicznie przedostać się do dowolnego punktu w szkle, co znacznie przyspiesza prędkość odczytu danych.

Jeśli jesteście na tyle starzy, by pamiętać przewijanie piosenek na kasetach magnetofonowych, to pewnie wiecie, że trochę trwało, by dojść do wybranej części. Dla kontrastu — odczyt ze szkła jest bardzo szybki, ponieważ możesz poruszać się jednocześnie po osiach x, y i z.
— Richard Black, Principal Research Software Engineer Lead w Microsoft Research Cambridge

Szkło kwarcowe używane do przechowywania danych różni się znacząco od delikatnego szkła, z którego robione są butelki na wino czy żarówki. Naukowcy piekli je w piekarniku rozgrzanym do ok. 260ºC, podgrzewali w mikrofalówce, gotowali i szorowali wełną szklaną. Gdy po tych zabiegach spróbowali odczytać dane, te wciąż tam były. Dla archiwistów z Warner Bros. jest to kompletnie zrozumiałe. Niedawno odkopali w swoich bibliotekach nagrania serialu radiowego Superman z 1940 roku, znajdujące się na szklanych płytach przypominających te winylowe. Okazuje się, że w archiwach studia zarówno najstarsze, jak i najnowsze nośniki magazynowe są wykonane ze szkła. Historia zatacza więc koło i studio ponownie sięga po najnowsze dla danej epoki zdobycze technologii.

Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży
Jak wykorzystać Copilot w codziennej pracy? Kurs w przedsprzedaży

Wydarzenia