GPT-5.5-Cyber od OpenAI naprawi dziury w sieci. Już wyprzedził Claude Mythos 5

OpenAI ogłosił znaczące rozszerzenie swojej inicjatywy z zakresu cyberbezpieczeństwa o nazwie Daybreak. Projekt ten ma na celu wsparcie obrońców sieciowych w szybszym wykrywaniu, weryfikowaniu oraz naprawianiu podatności w oprogramowaniu na wczesnych etapach procesu deweloperskiego. Szczególną uwagę przykuwa aktualizacja modelu defensywnego GPT-5.5-Cyber. W jednym z benchmarków zdołał on nawet wyprzedzić rewolucyjnego Claude Mythos 5 od Anthropic.

Nowa fizyka cyberbezpieczeństwa. Łatanie jako wąskie gardło

Pojawienie się zaawansowanych modeli sztucznej inteligencji zmieniło reguły gry w cyberbezpieczeństwie, drastycznie przyspieszając proces wykrywania luk. O ile historycznie największym wyzwaniem było samo odnajdywanie podatności, o tyle obecnie zespoły odpowiedzialne za obronę są wręcz zalewane ich liczbą. Nowym punktem krytycznym stało się masowe tworzenie poprawek.

Dawniej wykrywanie poważnych zagrożeń wymagało unikalnej wiedzy, czasu oraz głębokiego zrozumienia złożonych systemów. Współczesne modele potrafią samodzielnie analizować obszerne bazy kodu, śledzić ścieżki ataków i weryfikować hipotezy. OpenAI podkreśla, że same raporty o błędach nie chronią nikogo - kluczowa wartość płynie z walidacji problemu, zrozumienia jego wpływu, opracowania i przetestowania łatki oraz skoordynowanego wdrożenia aktualizacji zabezpieczeń. Inicjatywa Daybreak ma na celu demokratyzację dostępu do tych technologii, aby obrońcy mogli zabezpieczyć infrastrukturę, zanim przestępcy zdążą wykorzystać luki.

Codex Security. Od wykrycia do naprawy na masową skalę

Od momentu uruchomienia wersji demonstracyjnej Codex Security Cloud w marcu system ten przeskanował ponad 30 mln commitów w ponad 30 tys. baz kodu. W tym czasie ludzcy recenzenci oznaczyli ponad 70 tys. wykrytych błędów jako naprawione, a ponad pół miliona podatności zostało automatycznie zweryfikowanych jako usunięte.

Codex Security został zaprojektowane tak, aby działać jak cyfrowy inżynier ds. bezpieczeństwa, wspierający każdego twórcą oprogramowania bezpośrednio w środowisku Codex. Narzędzie analizuje kod, tworzy lub analizuje model zagrożeń, identyfikuje luki, generuje ścieżki walidacji i przygotowuje ukierunkowane łatki, pozostawiając ostateczną kontrolę w rękach człowieka.

Najnowsza aktualizacja Codex Security wprowadza gotowe do użycia przepływy pracy. Deweloperzy mogą uruchamiać głębokie skanowania, generować raporty o stopniu ważności błędów wraz z dowodami, a także automatycznie tworzyć poprawki dopasowane do konkretnej bazy kodu. Wtyczka umożliwia również segregowanie i weryfikację zgłoszeń pochodzących z zewnętrznych skanerów, programów bug-bounty czy systemów ticketowych. Narzędzie obsługuje eksport danych do systemów zarządzania podatnościami i integruje się z plikami SARIF czy zapytaniami CodeQL, działając zarówno poprzez Codex CLI, jak i aplikację Codex.

Aktualizacja GPT-5.5-Cyber. Model prześcignął Claude Mythos 5

OpenAI udostępnił także pełną, zaktualizowaną wersję modelu GPT-5.5-Cyber w ramach ograniczonego dostępu dla zweryfikowanych cyberobrońców. Jest to wariant oparty na ogólnym modelu GPT-5.5, dostępnym m.in. w Microsoft 365 Copilot, cechujący się wyższą tolerancją (tzw. permisywnością) na działania związane z zaawansowanymi badaniami bezpieczeństwa oraz mniejszą liczbą nieuzasadnionych odmów w specjalistycznych zadaniach.

Model potrafi prowadzić pogłębione analizy długiego kodu, identyfikować krytyczne komponenty, sprawdzać osiągalność podatnego fragmentu oraz testować łatki w kontrolowanych środowiskach. W branżowych benchmarkach GPT-5.5-Cyber osiągnął następujące rezultaty:

CyberGym (reprodukcja znanych podatności): 85,6 proc. (w porównaniu do 81.8 proc. dla standardowego GPT-5.5 oraz 83,8 proc. dla Claude Mythos 5).
ExploitGym (tworzenie działających exploitów z ze znanych luk): 39,5 proc. (w porównaniu do 25,95 proc. dla GPT-5.5).
SEC-bench Pro (długofalowe wykrywanie luk i generowanie PoC): 69,8 proc. (w porównaniu do 63,1 proc. dla GPT-5.5).

Podczas wczesnych prac w ramach projektu Daybreak, modele GPT-5.5 oraz Codex Security pomogły już zidentyfikować i zweryfikować podatności w powszechnie używanych systemach, takich jak Firefox, V8, Safari, OpenBSD, FreeBSD oraz w implementacjach HTTP/2. OpenAI ściśle współpracuje nad audytem przedwdrożeniowym z rządem USA, w tym z Center for AI Standards and Innovation (CAISI) oraz Office of the National Cyber Director (ONCD) i OSTP.

GPT-5.5-Cyber prześcignął Claude Mythos 5

Warto przypomnieć, że potężny Claude Mythos 5 wraz z jego ogólnodostępną, bardziej ograniczoną wersją Claude Fable 5 zostały wyłączone wskutek decyzji rządu USA, o czym niedawno informowaliśmy na CentrumXP. Stało się tak po nakazie kontroli eksportu wydanym przez rząd USA pod rygorem bezpieczeństwa narodowego. Przepisy zabraniają udostępniania tych systemów jakimkolwiek obcokrajowcom (zarówno użytkownikom zewnętrznym, jak i zagranicznym pracownikom samej firmy). Aby zachować pełną zgodność z prawem, Anthropic zdecydował o całkowitym zawieszeniu dostępu do obu modeli dla wszystkich klientów. Starsze wersje, takie jak Opus i Sonnet, działają bez zakłóceń m.in. Microsoft 365 Copilot.

Programy partnerskie i współpraca z Open Source

OpenAI ogłosił też uruchomienie programu "Daybreak Cyber Partner Program", który pozwala dostawcom rozwiązań cyberbezpieczeństwa integrować model GPT-5.5 wraz z Trusted Access for Cyber we własnych produktach. Wśród pierwszych partnerów znalazły się takie korporacje jak Accenture, Akamai, Cisco, Cloudflare, CrowdStrike, IBM, Palo Alto Networks, Proofpoint, SentinelOne, Wiz oraz Zscaler.

Równolegle startuje inicjatywa "Patch the Planet", realizowana wspólnie z Trail of Bits, HackerOne, Calif oraz niezależnymi badaczami i twórcami oprogramowania. Udział w niej zadeklarowało już ponad 30 projektów Open Source, w tym cURL, Go, Python, Sigstore oraz pyca/cryptography.