Gigant z Redmond przesuwa granice sztucznej inteligencji, wdrażając drugą generację swoich autorskich układów scalonych. Sukces supernowoczesnego akceleratora Maia 200, stworzonego z myślą o potężnych modelach AI, nie byłby jednak możliwy bez rewolucji w zarządzaniu projektami. Gdy w grę wchodziło zsynchronizowanie setek inżynierów i skomplikowanej infrastruktury chmurowej, rozproszone systemy zastąpiono jednym narzędziem: Microsoft Planner. To całkowicie zmieniło reguły gry.
Maia 200. Nowy akcelerator AI w chmurze Azure
Sztuczna inteligencja przeżywa bezprecedensowy rozkwit, a obsługa najbardziej wymagających zadań związanych z jej funkcjami wnioskowania wymaga dedykowanego, potężnego sprzętu. Odpowiedzią Microsoftu na to wyzwanie jest Maia 200 - autorski akcelerator AI drugiej generacji. Układ ten został zaprojektowany od podstaw, by zasilić chmurę Azure i zoptymalizować wielkoskalowe operacje na modelach sztucznej inteligencji.
Przejście od fazy projektowania do realnego wdrożenia w centrach danych wymagało jednak tytanicznej pracy. Projekt zaangażował wiele niezależnych organizacji inżynieryjnych, tworzących jeden gigantyczny program. W szczytowym momencie systemy musiały przetwarzać ponad 700 aktywnych zadań jednocześnie. Zakres prac obejmował nie tylko samą architekturę krzemową i dedykowane oprogramowanie AI, ale również fizyczną infrastrukturę serwerowni.
Gdy program ruszał, poszczególne zespoły korzystały z różnych rozwiązań: od Excela, przez Azure DevOps, po lokalne instancje innych programów. Brak spójnego wglądu w to wszystko rodził ogromne ryzyko. Kamienie milowe, które dla jednego zespołu inżynierów wydawały się niezagrożone, dla twórców oprogramowania AI mogły oznaczać krytyczne opóźnienia. Zamiast dynamicznego podglądu sytuacji kadra menedżerska dysponowała jedynie ręcznie przygotowywanymi raportami statusu. Aby uratować harmonogram tak kluczowego projektu dla sektora AI, koordynatorzy potrzebowali jednego, centralnego punktu dowodzenia. Wybór padł na Microsoft Planner - aplikację dostępną w Microsoft 365, używaną przez tysiące zespołów na całym świecie, w tym przez redakcję CentrumXP.
Planner zapewnił integrację licznym zespołom inżynierów
Zamiast zmuszać wyspecjalizowane zespoły do porzucenia swoich codziennych narzędzi (takich jak Azure DevOps), Microsoft Planner został wdrożony jako nadrzędna warstwa integracyjna. Pozwoliło to zachować dotychczasowe nawyki inżynierów, dając jednocześnie liderom wgląd w ścieżki krytyczne, kamienie milowe i zależności - niezależnie od tego, gdzie fizycznie wykonywano pracę.
Programiści i projektanci sprzętu AI rozpoczęli mapowanie działań od stworzenia wizualnych "torów pływackich" dla każdej organizacji. W Plannerze przybrały one formę zadań głównych i podzadań, grupujących kluczowe obszary rozwoju akceleratora, takich jak gotowość funkcji krzemowych, wsparcie i uruchomienie sieci oraz walidacja systemowa.Każda organizacja otrzymała swój kod kolorystyczny, a niestandardowe pola w systemie pozwoliły przypisać do każdego zadania osobę bezpośrednio za nie odpowiedzialną. Przejrzystość struktury okazała się tak duża, że Planner błyskawicznie ewoluował z narzędzia czysto raportowego w główne źródło wiedzy dla liderów zespołów deweloperskich w ich codziennej pracy.
Kolejnym krokiem było wydzielenie nadrzędnej sekcji zatytułowanej "Top-Level Program Milestones". Podpięto pod nią poszczególne etapy cyklu życia projektu, co pozwoliło precyzyjnie powiązać strategiczne cele biznesowe Microsoftu z czysto technicznymi detalami inżynierii sprzętowej i programistycznej dla AI.
Zarządzanie ścieżką krytyczną i automatyzacja harmonogramu
Wytwarzanie zaawansowanych technologii sztucznej inteligencji to proces pełen wzajemnych zależności. Aby okiełznać chaos, liderzy programu Maia 200 wprowadzili żelazną zasadę - każda kluczowa funkcja na ścieżce krytycznej musiała znaleźć swoje odzwierciedlenie w Plannerze. Jeśli funkcjonalność rozwijana w Azure DevOps składała się z wielu mniejszych elementów, w Plannerze agregowano ją do jednego zadania nadrzędnego.
Wykorzystując zaawansowane funkcje śledzenia zależności, zespoły mogły wzajemnie linkować powiązane zadania. W efekcie, jeśli zespół odpowiedzialny za warstwę oprogramowania AI napotykał blokadę wynikającą z prac nad samym procesorem, problem stawał się natychmiast widoczny dla obu stron i wymagał obustronnego zatwierdzenia.
Co więcej, kamienie milowe zostały bezpośrednio powiązane z zadaniami wykonawczymi w "torach pływackich". Automatyczny grafik w Plannerze na bieżąco dopasowywał terminy ważnych kroków do tempa pracy inżynierów. Do monitorowania trendów i długofalowych postępów wykorzystano tzw. linie bazowe. Pozwalały one na wykonywanie migawek planu w danym momencie, eksport danych do programu Excel i precyzyjne prognozowanie trendów dostarczania kolejnych funkcjonalności chipu.
Nowa kultura pracy. Od raportowania do działania
Tradycyjne zarządzanie ryzykiem w tak ogromnych projektach technologicznych często zawodzi przez brak komunikacji. W przypadku akceleratora Maia 200 ryzyka zaczęto traktować jako... regularne zadania w Plannerze. Każde potencjalne zagrożenie było bezpośrednio łączone z zadaniami w torach inżynieryjnych oraz z kamieniami milowymi. W ten sposób prace nad mitygacją (grupą działań zapobiegawczych) były na bieżąco zintegrowane z głównym procesem produkcyjnym.
Taka integracja diametralnie zmieniła kulturę spotkań projektowych. Zamiast marnować czas na żmudne, ustne odczytywanie statusów, menedżerowie i inżynierowie AI mogli skupić się na realnym podejmowaniu decyzji, analizie kompromisów i "gaszeniu pożarów", zanim zależność zmieni się w realną blokadę.
Dzięki Plannerowi kierownictwo wyższego szczebla zapomniało też o "niespodziankach" w harmonogramie. Wszelkie przesunięcia były widoczne z wyprzedzeniem. Z kolei dla inżynierów system stał się gwarantem transparentności - nikt nie mógł zgłosić roszczeń o zablokowanie prac przez innego partnera bez formalnego uwzględnienia tego faktu w systemie i akceptacji przez drugą stronę.
Microsoft Planner - jako centralna warstwa koordynacyjna - połączył silosy informacyjne, systemy i ludzi. To właśnie ta synergia pozwoliła skutecznie doprowadzić projekt akceleratora sztucznej inteligencji Maia 200 do fazy wdrożenia w infrastrukturze Azure, dając firmie solidny fundament pod nadchodzącą erę sztucznej superinteligencji.


