Závody ve zbrojení v oblasti AI se přiostřují s GPT‑5.3
Na začátku roku 2026 je těžší držet krok s vydáními AI: aktualizace přicházejí tak často, že titulky mohou být během pár dnů zastaralé. Jeden den je pozornost na “silnější uvažování,” další den na rychlosti a nižší latenci a krátce nato na AI, která píše kód víc jako týmový kolega. Do víkendu konkurent zveřejní novou systémovou kartu a debata se rychle přesune k benchmarkům a sporům o to, co se počítá jako “skutečný” pokrok.
Poslední tah OpenAI v tomto rychle se pohybujícím závodě je GPT‑5.3‑Codex — model zaměřený na agentické programování, což znamená, že umí plánovat, používat nástroje a zvládat vícekrokové úlohy s menší potřebou vedení. OpenAI jej popisuje jako spojení špičkového výkonu v kódování z dřívějších verzí Codexu se silnějším uvažováním a odbornými znalostmi z rodiny GPT‑5 a s 25% rychlejším během pro uživatele Codexu.
Rozbalme si, co GPT‑5.3‑Codex mění, proč na tom záleží a jak reagují velcí hráči.
Proč je GPT‑5.3 zásadní
Nejprve malý, ale důležitý detail: když lidé říkají “GPT‑5.3,” veřejným vydáním je nyní GPT‑5.3‑Codex, model Codex zaměřený na tvorbu softwaru a práci na počítači. Je navržen tak, aby zvládal dlouhé úlohy zahrnující výzkum, používání nástrojů a komplexní provádění spíše jako kolega, kterého můžete usměrňovat, než jednoduchý chatbot, kterému kladete otázky.
OpenAI také uvádí tvrzení, které zní jako sci‑fi, ale je napsané černé na bílém: GPT‑5.3‑Codex byl “zásadní při vytváření sám sebe.” Tým Codexu použil rané verze k ladění tréninku, řízení nasazení a diagnostice testovacích výsledků — což znamená, že model pomohl zrychlit vlastní vývojový cyklus.
To je důležité z jednoho důvodu: zpětné smyčky. Když nástroje AI pomáhají rychleji vytvářet další nástroje AI, tempo vydávání se může znovu zvýšit. Pokud už vám pokrok v AI připadal rychlý, tady si nazouvá kolečkové brusle.
Datum vydání, klíčové funkce a ceny GPT‑5.3‑Codex
OpenAI představilo GPT‑5.3‑Codex 5. února 2026, popsalo jej jako dosud nejschopnější model pro agentické programování a zdůraznilo zrychlení (o 25 %) a lepší výkon v benchmarkech pro kódování a agentní chování.
Na co je GPT‑5.3‑Codex stavěn
OpenAI zdůrazňuje dlouhotrvající práci: úlohy, které mohou trvat hodiny, zahrnují nástroje a vyžadují mnoho kroků.
Uvádí také silný výkon v benchmarcích používaných k testování reálného softwarového inženýrství a agentního chování, včetně SWE‑Bench Pro a Terminal‑Bench, a zmiňuje výkon na OSWorld a GDPval (benchmarks zaměřené na měření schopností práce s nástroji v reálném světě).
Postoj k bezpečnosti je výraznější než dřív
Systémová karta obsahuje jasné konstatování: OpenAI to považuje za své první uvedení pod štítkem “High‑capability cybersecurity”, s aktivovanými pojistkami.
To je důležitý signál “závodů ve zbrojení”. Firmy soupeří o hrubý výkon, ale také o bezpečnostní rámce, monitoring a důvěryhodnost.
Ceník (OpenAI API) pro GPT‑5.3‑Codex
Pro úroveň Standard je GPT‑5.3‑Codex uveden takto:
- $1.75 vstup / 1M tokenů
- $0.175 vstup z mezipaměti / 1M tokenů
- $14.00 výstup / 1M tokenů
Pro úroveň Priority je uveden takto:
- $3.50 vstup / 1M tokenů
- $0.35 vstup z mezipaměti / 1M tokenů
- $28.00 výstup / 1M tokenů
Rychlost se stává zbraní: GPT‑5.3‑Codex‑Spark a závod v latenci
Týden po hlavním vydání GPT‑5.3‑Codex představil OpenAI 12. února 2026 GPT‑5.3‑Codex‑Spark, označil jej za výzkumný náhled a svůj první model navržený pro kódování v reálném čase.
OpenAI říká, že Codex‑Spark je optimalizován pro hardware s ultra nízkou latencí a může dodávat více než 1000 tokenů za sekundu, s cílem dosáhnout téměř okamžité odezvy.
Při uvedení OpenAI uvádí:
- 128k kontextové okno
- pouze text
- zavádí se jako výzkumný náhled pro uživatele ChatGPT Pro, s oddělenými limity rychlosti během náhledu
OpenAI uvádí, že Codex‑Spark běží na Cerebras Wafer Scale Engine 3, a popisuje to jako milník v partnerství s Cerebras.
OpenAI dokonce popisuje backendové práce na snížení latence v celém řetězci, včetně snížení režie na kolo o 80 % a zlepšení time‑to‑first‑token o 50 % díky změnám, jako jsou perzistentní připojení a optimalizace inferenčního stacku.
Nezávislé zpravodajství poukazuje i na strategický rozměr: použití Cerebras pro toto nasazení zdůrazňuje snahu diverzifikovat inferenční hardware mimo obvyklý stack silně závislý na Nvidii.
Jednoduše řečeno: závod nyní zahrnuje čipy, sítě a “time‑to‑first‑token.” Což je velmi moderní věta a trochu úsměvná, pokud si pamatujete, když bylo “načítání…” normální.
GPT‑5.3 vs Claude Opus 4.6 vs Gemini 3.1 Pro: srovnání závodů ve zbrojení v AI
OpenAI neuvedlo GPT‑5.3‑Codex do prázdné arény. Ve stejném měsíci vydali velcí konkurenti také velké upgrady — často s vlastními systémovými kartami, tvrzeními o benchmarcích a poznámkami k bezpečnosti.
Anthropic: Claude Opus 4.6 se zaměřuje na silné uvažování a testování bezpečnosti
Anthropic oznámil Claude Opus 4.6 dne 5. února 2026 — ve stejný den jako GPT‑5.3‑Codex — a odkázal čtenáře na systémovou kartu s podrobným hodnocením schopností a bezpečnosti.
Anthropic také zdůrazňuje, že nárůst schopností nepřichází se zhoršeným zarovnáním; uvádí, že Opus 4.6 vykazuje nízkou míru nevyhovujících chování (včetně klamání a podlézavosti) ve svém automatizovaném behaviorálním auditu, a zmiňuje rozšířená bezpečnostní hodnocení a nové pojistky.
Výrazným tématem je kyberbezpečnost: Anthropic říká, že Opus 4.6 vykazuje posílené kyberbezpečnostní schopnosti a že vyvinul šest nových kyberbezpečnostních sond pro sledování vzorců zneužití.
Zatímco OpenAI označuje kyberbezpečnostní schopnosti v rámci svého Preparedness Frameworku, Anthropic zdůrazňuje nové testování kyberbezpečnosti a sondy. Odlišný přístup, stejný vzkaz: tyto modely jsou natolik silné, že kybernetické riziko je dnes standardní součástí příběhu o vydání.
Google: Gemini 3.1 Pro posouvá uvažování a multimodální sílu
Google představil Gemini 3.1 Pro v náhledu a říká, že jej zavádí napříč spotřebitelskými i vývojářskými produkty.
Google vyzdvihuje pokrok v benchmarcích, včetně ověřeného skóre 77,1 % na ARC‑AGI‑2, a popisuje to jako více než dvojnásobný výkon v uvažování oproti Gemini 3 Pro.
Pro závody ve zbrojení vypadá strategie Googlu takto: uvažování + multimodalita + široká distribuce do produktů (aplikace Gemini, NotebookLM, vývojářské nástroje, podnikové kanály).
Meta: Llama 4 udržuje tlak otevřených modelů na trhu
Rodina Llama 4 od Meta (vydaná v dubnu 2025) hraje důležitou roli i v roce 2026, protože modely s otevřenými váhami nutí ostatní zrychlovat a chytřeji nastavovat ceny. Meta představila Llama 4 Scout a Maverick jako nativně multimodální AI modely.
Média také uvádějí, že modely Llama 4 pohánějí Meta AI napříč produkty jako WhatsApp a Instagram, a zmiňují detaily jako extrémně velké kontextové okno u Scoutu (v jednom reportu uváděno jako 10 milionů tokenů).
Temnější stránka závodu: spory o destilaci, přisvojování dat a soudní spory
Kdykoli je trh takto cenný, lidé se začnou přít o pravidla, zejména ta kolem dat.
Velký příklad se objevil v únoru 2026: Anthropic uvedl, že několik čínských AI společností používalo výstupy z Claude ke zlepšení vlastních modelů pomocí “destilace,” a popsal rozsáhlé zneužívání s asi 24 000 falešnými účty a více než 16 miliony interakcí, které porušovaly podmínky a přístupová omezení.
Destilace může být běžná technika ve strojovém učení. Ale když využívá výstupy uzavřeného modelu jiné firmy bez povolení, rychle se z ní stává konflikt duševního vlastnictví a bezpečnosti. A pak jsou tu soudní bitvy. 24. února 2026 informovala agentura Reuters, že americký soudce zamítl (zatím) žalobu xAI obviňující OpenAI z přivlastnění obchodního tajemství, přičemž xAI ponechal čas na doplnění stížnosti.
Co to znamená pro vývojáře a firmy (a pro nespecialisty)
Pokud vyvíjíte software, GPT‑5.3‑Codex a Codex‑Spark ukazují směrem k budoucnosti, kde:
- Zadáváte úkol, ne jediný prompt („prozkoumej tuto chybu, navrhni opravy, spusť testy, otevři PR“)
- AI pracuje déle, drží kontext a spolehlivěji používá nástroje
- Rychlost se stává každodenním faktorem produktivity
Pokud vedete tým, mění se i otázka. Méně zní “Máme používat AI?” a více:
- Který model odpovídá naší míře rizika (zejména pro kód, bezpečnost a citlivá data)?
- Jak testujeme výstupy a zabráníme tichým selháním?
- Jaké jsou skutečné náklady, když se tokeny a využití navýší?
Pokud se snažíte zajistit, aby se vaše role postupně neposunula jen k revizím práce generované AI, může pomoci jedno praktické pravidlo:
Vybírejte modely podle úloh.
- Potřebujete hluboké agentické programování? GPT‑5.3‑Codex je na to stavěn.
- Potřebujete rychlé interaktivní úpravy? Codex‑Spark je postaven pro nízkolatenční iteraci.
- Potřebujete široké uvažování + multimodální vstupy? Gemini 3.1 Pro je silně propagován právě tímto směrem.
- Potřebujete důraznou dokumentaci k bezpečnosti a silné sdělení pro podniky? Claude Opus 4.6 staví systémové karty a audity do popředí.
Závěr: GPT‑5.3 zvyšuje hlasitost
GPT‑5.3‑Codex je krokem k agentické práci na počítači, s vylepšeními rychlosti, silnou pozicí v benchmarcích a bezpečnostním postojem, který otevřeně upozorňuje na kyberbezpečnostní schopnosti.
Pak Codex‑Spark přidává druhý vzkaz: další boj není jen o inteligenci, ale také o latenci — kdo dokáže udělat AI skutečně v reálném čase v nástrojích, které lidé už používají.
Mezitím Claude Opus 4.6 a Gemini 3.1 Pro ukazují, že konkurenti zdvořile nečekají na svou řadu. Vydávají rychle, publikují systémové karty a silně tlačí na uvažování a multimodální schopnosti.
Závody ve zbrojení v AI se přiostřují. Lehce ironické je, že o vítězích mohou rozhodnout věci, které zní nudně — ceny za tokeny, bezpečnostní sondy, limity rychlosti a time‑to‑first‑token. Ale v roce 2026 se “nuda” často skrývá tam, kde je budoucnost.