OpenAI zaprezentował w czwartek swój najnowszy i najbardziej zaawansowany model ukierunkowany na zadania programistyczne – GPT-5.3-Codex. Nowa wersja to istotny krok naprzód w rozwoju systemów agentowych, łącząc biegłość w pisaniu kodu z głęboką wiedzą merytoryczną i zdolnością do logicznego rozumowania. Zmiany nie ograniczają się jedynie do skuteczności, ale obejmują także znaczący wzrost szybkości działania, co pozwala na błyskawiczne wykonywanie nawet najbardziej złożonych operacji. Co ciekawe, w rozwoju tego modelu brał udział on sam.
Prezentujemy nowy model, który odblokowuje jeszcze więcej rzeczy, które Codex może zrobić: GPT-5.3-Codex, najzdolniejszy jak dotąd agentowy model kodujący. Model ten rozwija zarówno wydajność kodowania GPT-5.2-Codex, jak i umiejętności wnioskowania i korzystania z profesjonalnej wiedzy GPT-5.2 w jednym modelu, który jest także o 25% szybszy. To umożliwia wykonywanie długotrwałych zadań obejmujących badania, użycie narzędzi i złożone wykonanie. Podobnie jak ze współpracownikiem, możesz sterować i wchodzić w interakcje z GPT-5.3-Codex, gdy ten pracuje, bez utraty kontekstu.
GPT-5.3-Codex to nasz pierwszy model, który odegrał instrumentalną rolę w tworzeniu samego siebie. Zespół Codex wykorzystał wczesne wersje do debugowania jego własnego treningu, zarządzania własnym wdrożeniem i diagnozowania wyników testów oraz ewaluacji – nasz zespół był zdumiony, jak bardzo Codex był w stanie przyspieszyć swój własny rozwój.
Codex dzięki wykorzystaniu GPT-5.3-Codex przechodzi od agenta, który potrafi pisać i przeglądać kod, do agenta, który wykonuje niemal wszystko, co deweloperzy i profesjonaliści mogą robić na komputerze.
— OpenAI
Najważniejszą innowacją w GPT-5.3-Codex jest jego zdolność do pełnienia roli aktywnego współpracownika, a także jego wykorzystanie w procesie tworzenia samego siebie. Sztuczna inteligencja tworząca kolejne, lepsze wersje sztucznej inteligencji w sposób autonomiczny to co prawda pieśń przyszłości, ale już teraz takie wykorzystanie przez twórców jest imponujące – zwłaszcza że pozwoliło to na znaczne przyspieszenie cyklu rozwojowego technologii.
Nowy model wykracza możliwościami ponad to, co potrafiła poprzednia wersja. Co się zmieniło? GPT-5.3-Codex wykazuje się m.in. wyjątkową sprawnością w obsłudze terminala oraz poruszaniu się w systemach operacyjnych. Potencjał ten zademonstrowano, zlecając mu samodzielne stworzenie rozbudowanych gier wideo oraz funkcjonalnych aplikacji od podstaw, co zajęło maszynie zaledwie kilka dni autonomicznej pracy.
Nowa wersja lepiej też sobie radzi z interpretacją nieprecyzyjnych poleceń. Przy tworzeniu stron internetowych GPT-5.3-Codex domyślnie projektuje bardziej kompletne i profesjonalne rozwiązania, wykazując się dbałością o detale, takie jak dynamiczne elementy interfejsu czy przemyślana prezentacja ofert handlowych. Całość systemu została zoptymalizowana pod kątem wydajności obliczeniowej i jest wspierana przez najnowocześniejszą infrastrukturę sprzętową dostarczoną przez firmę NVIDIA.
OpenAI pochwalił się także rekordowymi wynikami GPT-5.3-Codex w branżowych benchmarkach.
GPT-5.3-Codex osiągnął niezrównaną wydajność w SWE-Bench Pro, rygorystycznej ewaluacji inżynierii oprogramowania [w scenariuszach] świata rzeczywistego. Podczas gdy SWE-bench Verified testuje jedynie Pythona, SWE-Bench Pro ogarnia cztery języki i jest bardziej odporny na zanieczyszczenia, wymagający, zróżnicowany i dostosowany do potrzeb branży. Znacznie przewyższa również poprzednią najwyższą wydajność w Terminal-Bench 2.0, który mierzy umiejętności posługiwania się terminalem, której potrzebuje agent kodowania, taki jak Codex. Co istotne, GPT-5.3-Codex robi to z mniejszą liczbą tokenów niż jakikolwiek poprzedni model, pozwalając użytkownikom budować więcej.
— OpenAI
OpenAI odnotował także znacząco wyższe wyniki nowego modelu w benchmarkach takich jak GDPval oceniający umiejętności użycia komputera przez agenta. Najnowszy model kodujący jest już dostępny dla subskrybentów płatnych planów ChatGPT. Użytkownicy mogą korzystać z jego możliwości poprzez dedykowaną aplikację, wiersz poleceń (CLI) oraz popularne rozszerzenia do środowisk programistycznych (IDE).
Dowiedz się więcej:

