Czołowi twórcy sztucznej inteligencji prą do przodu ramię w ramię. Google wypuścił niedawno Gemini 3, a OpenAI – Gemini 5.2 w trybach Instant, Thinking i Pro. Najbardziej zaawansowany model dla pracy profesjonalnej i długo działających agentów jest już dostępny dla subskrybentów płatnych planów ChatGPT Plus, Pro, Business i Enterprise, dla deweloperów poprzez API oraz w Microsoft 365 Copilot i Microsoft Copilot Studio.
GPT-5.2 został wydany 11 grudnia jako najpotężniejsza seria modeli do profesjonalnej pracy opartej na wiedzy. Producent tłumaczy, że sztuczna inteligencja już wcześniej pozwalała użytkownikom ChatGPT Enterprise zaoszczędzić średnio 40-60 minut dziennie, a osoby korzystające z niej na potęgę oszczędzają nawet 10 godzin tygodniowo. Podobne wyniki dało również największe badanie Microsoft 365 Copilota z 20 tysiącami pracowników, które omawialiśmy w czerwcu. A było to parę generacji wcześniej. Nowy model idzie jeszcze dalej.
Zaprojektowaliśmy GPT-5.2, aby odblokować większą wartość ekonomiczną dla ludzi. Jest lepszy w tworzeniu arkuszy kalkulacyjnych, tworzeniu prezentacji, pisaniu kodu, postrzeganiu obrazów, rozumieniu długich kontekstów, używaniu narzędzi i obsługiwaniu złożonych, wieloetapowych projektów.
GPT-5.2 wyznacza nowy najwyższy standard wśród wielu benchmarków, wliczając w to GDPval, w którym przewyższa branżowych specjalistów w ściśle określonych zadaniach wymagających wiedzy, obejmujących 44 zawody.
— OpenAI
Można zatem przyjąć, że GPT-5.2 w niektórych zastosowaniach profesjonalnych osiąga lepsze rezultaty niż ludzcy eksperci. Jest od nich nawet o 70% lepszy, wykonuje pracę 11 razy szybciej, a kosztuje 1% tyle. To dość wymowne dane w świetle pytania, czy AI zabierze nam pracę. A jak GPT-5.2 wypada w benchmarkach w porównaniu do swojego poprzednika?
| Benchmark | GPT‑5.2 Thinking | GPT‑5.1 Thinking |
|---|---|---|
| GDPval (wins or ties) Zadania wymagające wiedzy |
70,9% | 38,8% (GPT‑5) |
| SWE-Bench Pro (public) Inżynieria oprogramowania |
55,6% | 50,8% |
| SWE-bench Verified Inżynieria oprogramowania |
80,0% | 76,3% |
| GPQA Diamond (no tools) Pytania naukowe |
92,4% | 88,1% |
| CharXiv Reasoning (w/ Python) Wnioskowania na podstawie złożonych wykresów naukowych |
88,7% | 80,3% |
| AIME 2025 (no tools) Konkurs matematyczny |
100,0% | 94,0% |
| FrontierMath (Tier 1–3) Zaawansowana matematyka |
40,3% | 31,0% |
| FrontierMath (Tier 4) Zaawansowana matematyka |
14,6% | 12,5% |
| ARC-AGI-1 (Verified) Abstrakcyjne rozumowanie |
86,2% | 72,8% |
| ARC-AGI-2 (Verified) Abstrakcyjne rozumowanie |
52,9% | 17,6% |
Jak wspomniało OpenAI, GPT-5.2 szczególnie dobrze radzi sobie z zadaniami w arkuszu kalkulacyjnym i tworzeniem prezentacji. Naturalnie od pierwszego dnia nowy model stał się dostępny w Microsoft 365 Copilot, w którym pomaga użytkownikom Excela, PowerPointa, Worda, Teams i pozostałych aplikacji, a także w Microsoft Copilot Studio, pomagając firmom tworzyć własne agenty Copilota.
OpenAI udostępniło na blogu porównanie, jaki wynik w Excelu dają GPT-5.1 i GPT-5.2 po otrzymaniu tego samego prompta, proszącego o stworzenie modelu planowania zatrudnienia obejmującego liczbę personelu, plan zatrudnienia, rotację i wpływ na budżet, z uwzględnieniem działów inżynierii, marketingu, prawnego i sprzedaży.

Co na ten temat mówi Microsoft?
GPT-5.2 łączy GPT-5.2 Thinking – jak dotąd najlepszy model dla złożonych problemów i strategicznych wniosków – oraz GPT-5.2 Instant – wydajny model do codziennego pisania, tłumaczenia i budowania umiejętności. Ten model staje się jeszcze potężniejszy, gdy zastosuje się go do pracy. W Microsoft 365 Copilot łączy się on z Work IQ, aby odblokowywać wglądy, badania rynku i strategiczne planowanie – wnioskując w oparciu o twoje spotkania, e-maile, dokumenty i nie tylko.
GPT-5.2 jest dostępny w selektorze modeli zarówno w Copilot Chat, jak i w Copilot Studio, dzięki czemu masz dostęp do najnowszych innowacji, które pomogą ci rozwiązać wyjątkowe problemy biznesowe i tworzyć bardziej urzekające środowiska dla agentów.
— Jared Spataro, Chief Marketing Officer w dziale AI at Work, Microsoft
10 grudnia 2025, czyli w dniu premiery GPT-5.2, Microsoft przekazał, że nowy model zaczął być wdrażany u użytkowników z licencją Microsoft 365 Copilot i do nich wszystkich powinien dotrzeć w ciągu najbliższych tygodni. Z kolei do subskrybentów Microsoft 365 Premium ma trafić na początku 2026 r.
GPT-5.2 dla Copilot Studio stał się natomiast dostępny w środowiskach z wczesnym cyklem wdrażania, zaś agenty AI oparte wcześniej na GPT-5.1, przejdą automatycznie na nowy model.

