Microsoft i OpenAI wsparli nową inicjatywę Harvard Law School Library – Institutional Data Initiative (IDI). We współpracy z innymi instytucjami wiedzy (bibliotekami, muzeami, uniwersytetami, agencjami rządowymi etc.) będzie ona zwiększać dostęp do wiedzy i wysokiej jakości danych dla wszystkich budujących sztuczną inteligencję. Dane będą mogły być wykorzystywane do różnych celów, w tym do trenowania modeli AI.
Postępy w sztucznej inteligencji wiążą się z zainteresowaniem danymi wysokiej jakości, dostępnymi często tylko w czeluściach archiwów. Institutional Data Initiative ma na celu ich wydobycie i udostępnienie wszystkim. Zespół badaczy i twórców społecznościowych zajmujący się projektem będzie współpracował z instytucjami wiedzy, by pomóc strukturyzować, analizować i publikować ich kolekcje danych do wykorzystania w dowolnych celach, w tym do uczenia modeli sztucznej inteligencji.
Nasze pierwsze działania obejmują udoskonalenie kolekcji prawie miliona książek z domeny publicznej, zeskanowanych w Harvard Library; współpracę z Boston Public Library w celu udostępnienia milionów stron z trudno dostępnych historycznych gazet; a także wiosenne sympozjum zorganizowane na Wydziale Prawa Harvarda, którego celem było nawiązanie kontaktów i zbadanie obszarów współpracy między społecznością instytucjonalną a społecznością zajmującą się sztuczną inteligencją.
Powołaliśmy Institutional Data Initiative, ponieważ sposób, w jaki my jako społeczeństwo rozumiemy to, co wiemy i jak to wiemy, jest na rozdrożu. Wieki temu stworzyliśmy zaufane instytucje, aby zacząć zarządzać najważniejszą wiedzą ludzkości, z której duża część jest obecnie reprezentowana jako dane. Dzisiaj, gdy świat szuka sposobów, aby poprowadzić ścieżkę AI w kierunku rozkwitu ludzkości, dane są wszystkim.
— Greg Leppert, Executive Director w Institutional Data Initiative na Harvardzie
Jak mówi dyrektor projektu, uruchomienie IDI zostało szczodrze wsparte prezentami od Microsoft i OpenAI. Microsoft od lat angażuje się w umożliwianie powszechniejszego dostępu do danych i wspomaganie bardziej inkluzywnego ekosystemu AI. Przykładem tego jest inicjatywa Open Data Campaign uruchomiona w 2020 roku. Ma ona zapewnić, że każda organizacja ma dostęp do danych, aby wprowadzać innowacje i osiągać więcej, co jest niezbędne do rozwoju dynamicznej, konkurencyjnej gospodarki AI.