OpenAI zaprezentowało Codex, opartego na chmurze agenta AI, specjalizującego się w inżynierii oprogramowania. Jest on w stanie równolegle wykonywać wiele zadań programistycznych. Codex opiera się na nowym modelu OpenAI codex-1, który powstał na bazie modelu o3. Został on wytrenowany z użyciem techniki uczenia poprzez wzmacnianie na zadaniach programistycznych z prawdziwego zdarzenia.
OpenAI Codex - nowy agent AI dla programistów
Codex może wykonywać jednocześnie wiele zadań w imieniu użytkownika, wliczając w to pisanie kodu, odpowiadanie na pytania dotyczące bazy kodu, poprawianie błędów czy proponowanie pull requestów do przejrzenia. Każde z tych zadań jest wykonywane w swoim własnym środowisku typu sandbox w chmurze oraz jest podłączone do repozytorium użytkownika.
Nowy agent sztucznej inteligencji opiera się na codex-1, specjalnej wersji potężnego modelu wnioskującego OpenAI o3 zoptymalizowanej pod kątem inżynierii oprogramowania. Został on wytrenowany techniką reinforcement learning na zadaniach związanych z kodowaniem z prawdziwego świata w różnych środowiskach, tak aby mógł generować kod w sposób odzwierciedlający ludzki styl oraz preferencje, postępować zgodnie z instrukcjami i iteratywnie uruchamiać testy aż do osiągnięcia zadowalającego rezultatu.
Jak działa Codex?
OpenAI wyjaśnia na blogu, że Codex zaczął być udostępniany płatnym subskrybentom ChatGPT Pro, Enterprise i Team, a w wersjach Plus i Edu pojawi się już niebawem. Agenta można uruchamiać bezpośrednio w czatbocie.
Dziś możesz uzyskiwać dostęp do Codex na pasku bocznym w ChatGPT i przydzielać mu nowe zadania programistyczne, pisząc prompt i klikając "Koduj" ("Code"). Jeśli chcesz zadać Codexowi pytanie o swoją bazę kodu, kliknij "Zapytaj" ("Ask"). Każde zadanie jest przetwarzane niezależnie w odseparowanym, izolowanym środowisku z załadowaną Twoją bazą kodu. Codex potrafi czytać i edytować pliki, a także uruchamiać polecenia, wliczając w to uprzęże testowe, lintery i type checkery. Wykonanie zadania trwa zwykle od 1 do 30 minut w zależności od stopnia złożoności. Możesz monitorować postępy Codexu w czasie rzeczywistym.
Kiedy Codex ukończy zadanie, zatwierdzi zmiany w swoim środowisku. Codex dostarcza weryfikowalne dowody swoich działań poprzez cytaty w logach terminala oraz testowe outputy, pozwalając Ci śledzić każdy podjęty krok podczas wykonania zadania. Możesz następnie przejrzeć wyniki, zażądać dalszych rewizji, otworzyć pull request w GitHub albo bezpośrednio zintegrować zmiany ze swoim lokalnym środowiskiem. Wewnątrz produktu możesz skonfigurować środowisko Codex, aby w jak największym stopniu odpowiadało Twojemu rzeczywistemu środowisku programistycznemu.
— OpenAI
Jak wyjaśniają twórcy, głównym celem treningu codex-1 było ścisłe dopasowanie wyników do ludzkich preferencji i standardów kodowania: W porównaniu do OpenAI o3 - codex-1 konsekwentnie produkuje czystsze poprawki gotowe do natychmiastowej rewizji przez człowieka i integracji ze standardowymi przepływami pracy. Firma zapowiedziała także Codex CLI, lżejszego agenta kodowania Open Source, który uruchamia się w terminalu na lokalnej maszynie. Dowiedz się więcej z naszych artykułów:
- Programowanie za pomocą zwykłego języka już możliwe dzięki OpenAI Codex
- Agenty AI - czym są i jak zmienią sposób naszej pracy?
- GitHub Copilot: sztuczna inteligencja pomoże w pisaniu kodu
- GitHub Copilot Enterprise z obsługą pull requestów i plików
- Operator od OpenAI będzie mógł pisać kod i rezerwować loty na Twoim PC
- "Kod pisze się sam", czyli Satya Nadella o integracji AI z Microsoft Power Platform