Надпреварата във въоръжаването с ИИ се нажежава с GPT‑5.3
В началото на 2026 г. да следиш изданията на ИИ стана по-трудно: обновленията идват толкова често, че заглавията могат да остареят за дни. Един ден фокусът е “по-силно разсъждение,” на следващия е скорост и по-ниска латентност, а скоро след това — ИИ, който пише код повече като съотборник. До уикенда конкурент публикува нова системна карта и разговорът бързо се измества към бенчмаркове и спорове за това какво се брои за “реален” напредък.
Последният ход на OpenAI в това бързо движещо се състезание е GPT‑5.3‑Codex — модел, фокусиран върху агентно програмиране, което означава, че може да планира, да използва инструменти и да изпълнява многоетапни задачи с по-малко напътствия. OpenAI го описва като съчетаващ водеща производителност при кодирането от по-ранни версии на Codex с по-силно разсъждение и професионални знания от семейството GPT‑5 и работещ с 25% по-бързо за потребителите на Codex.
Нека разгледаме какво променя GPT‑5.3‑Codex, защо е важно и как реагират големите играчи.
Защо GPT‑5.3 е толкова важен
Първо, малък, но важен детайл: когато хората казват “GPT‑5.3,” публичното издание в момента е GPT‑5.3‑Codex, Codex модел, насочен към изграждане на софтуер и работа на компютър. Той е проектиран да се справя с дълги задачи, които включват проучване, използване на инструменти и сложна изпълнение — повече като колега, когото можете да направлявате, отколкото като прост чатбот, на когото задавате въпроси.
OpenAI прави и твърдение, което звучи като научна фантастика, но е в прав текст: GPT‑5.3‑Codex е бил “съществен за създаването си.” Екипът на Codex е използвал ранни версии, за да дебъгва обучението, да управлява внедряването и да диагностицира тестови резултати — тоест моделът е помогнал да се ускори собственният му цикъл на разработка.
Това е важно по една причина: цикли на обратна връзка. Когато инструментите с ИИ помагат за изграждането на следващите инструменти с ИИ по-бързо, темпото на пусканията може отново да се ускори. Ако напредъкът на ИИ вече ви се е струвал бърз, това е моментът, в който обува ролкови кънки.
Дата на пускане, ключови функции и цени на GPT‑5.3‑Codex
OpenAI представи GPT‑5.3‑Codex на 5 февруари 2026 г., описвайки го като най-способния си досега модел за агентно програмиране и подчертавайки повишение на скоростта (25% по-бърз), плюс по-силна производителност на бенчмаркове за кодиране и агенти.
За какво е създаден GPT‑5.3‑Codex
OpenAI акцентира върху дълго протичаща работа: задачи, които могат да отнемат часове, включват инструменти и изискват много стъпки.
Съобщава се и за силна производителност на бенчмаркове за реален софтуерен инженеринг и поведение на агенти, включително SWE‑Bench Pro и Terminal‑Bench, и се споменава представяне на OSWorld и GDPval (бенчмаркове, насочени към измерване на реални способности за използване на инструменти).
Позицията по безопасността е по-ясно заявена от преди
Системната карта включва ясен ред: OpenAI третира това като първото си пускане под етикета “киберсигурност с високи възможности,” с активирани предпазни мерки.
Това е важен сигнал в “надпреварата във въоръжаването.” Компаниите се състезават по сурова способност, но се състезават и по рамки за безопасност, мониторинг и достоверност.
Ценообразуване (OpenAI API) за GPT‑5.3‑Codex
За нивото Standard GPT‑5.3‑Codex е посочен така:
- $1.75 вход / 1M токена
- $0.175 кеширан вход / 1M токена
- $14.00 изход / 1M токена
За нивото Priority е посочен така:
- $3.50 вход / 1M токена
- $0.35 кеширан вход / 1M токена
- $28.00 изход / 1M токена
Скоростта се превръща в оръжие: GPT‑5.3‑Codex‑Spark и надпреварата за латентност
Седмица след основното издание на GPT‑5.3‑Codex, OpenAI представи GPT‑5.3‑Codex‑Spark (12 февруари 2026 г.), наричайки го изследователски преглед и първия си модел, проектиран за програмиране в реално време.
OpenAI казва, че Codex‑Spark е оптимизиран за хардуер с ултраниска латентност и може да доставя над 1000 токена в секунда, целейки почти мигновено изживяване.
При пускането OpenAI посочва:
- 128k контекстен прозорец
- само текст
- постепенно пускане като изследователски преглед за потребители на ChatGPT Pro, с отделни лимити на заявките по време на прегледа
OpenAI казва, че Codex‑Spark работи върху Cerebras Wafer Scale Engine 3, описвайки това като крайъгълен камък в партньорството си с Cerebras.
OpenAI дори описва бекенд работа за намаляване на латентността по целия тръбопровод, споменавайки намаления като 80% по-малък overhead на заявка-отговор и 50% подобрение на времето до първия токен благодарение на промени като постоянни връзки и оптимизации на стека за инференция.
Независими публикации отбелязват и стратегическия ъгъл: използването на Cerebras за това внедряване подчертава усилията за диверсификация на хардуера за инференция отвъд типичния стек, силно зависим от Nvidia.
Казано просто: надпреварата вече включва чипове, мрежи и “time-to-first-token.” Което е много модерно изречение и също малко забавно, ако помните, когато “зареждане…” беше нормално.
GPT‑5.3 vs Claude Opus 4.6 vs Gemini 3.1 Pro: сравнение в ИИ надпреварата
OpenAI не пусна GPT‑5.3‑Codex в празна арена. В същия месец и големи конкуренти доставиха големи надстройки — често със собствени системни карти, бенчмарк претенции и бележки за безопасност.
Anthropic: Claude Opus 4.6 се фокусира върху силно разсъждение и тестове за безопасност
Anthropic обяви Claude Opus 4.6 на 5 февруари 2026 г. — в същия ден като GPT‑5.3‑Codex — и насочи читателите към системна карта с подробни оценки на способности и безопасност.
Anthropic също подчертава, че нарастването на способностите не идва с влошено съгласуване, като казва, че Opus 4.6 показва нисък процент на несъгласувани поведения (включително измама и угодничество) в неговия автоматизиран поведенчески одит, и споменава разширени оценки за безопасност и нови предпазни мерки.
Забележима тема е киберсигурността: Anthropic казва, че Opus 4.6 показва подобрени киберсигурностни способности и че е разработил шест нови киберсигурностни сонди за проследяване на модели на злоупотреба.
И така, докато OpenAI маркира киберсигурностните способности в рамките на своята Рамка за готовност, Anthropic подчертава ново тестване и сонди за киберсигурност. Различен подход, също послание: тези модели са достатъчно мощни, че киберрискът вече е стандартна част от историята при пускане.
Google: Gemini 3.1 Pro залага на разсъждение и мултимодална сила
Google представи Gemini 3.1 Pro в преглед и казва, че го внедрява в потребителски и разработчески продукти.
Google подчертава напредък по бенчмаркове, включително верифициран резултат от 77.1% на ARC‑AGI‑2, описвайки го като повече от двойно по-добра производителност в разсъждението спрямо Gemini 3 Pro.
За надпреварата стратегията на Google изглежда така: разсъждение + мултимодалност + широко продуктово разпространение (приложението Gemini, NotebookLM, инструменти за разработчици, корпоративни канали).
Meta: Llama 4 поддържа натиска с отворени тегла на пазара
Семейството Llama 4 на Meta (пуснато през април 2025 г.) продължава да играе важна роля и през 2026 г., защото моделите с отворени тегла принуждават всички останали да се движат по-бързо и да ценообразуват по-умно. Meta представи Llama 4 Scout и Maverick като нативно мултимодални AI модели.
Медийни материали отбелязват също, че моделите Llama 4 захранват Meta AI в продукти като WhatsApp и Instagram, и подчертават детайли като изключително големия контекстен прозорец на Scout (съобщаван като 10 милиона токена в един репортаж).
Тъмната страна на надпреварата: спорове за дистилация, събиране на данни и съдебни дела
Винаги когато един пазар стане толкова ценен, хората започват да спорят за правилата, особено за правилата около данните.
Голям пример излезе наяве през февруари 2026 г.: Anthropic каза, че няколко китайски компании за ИИ са използвали изходите на Claude, за да подобрят собствените си модели чрез “дистилация,” описвайки злоупотреба в голям мащаб с около 24 000 фалшиви акаунта и над 16 милиона взаимодействия, нарушавайки условията и ограниченията за достъп.
Дистилацията може да е нормална техника в машинното обучение. Но когато използва изходите на чужд затворен модел без разрешение, това бързо се превръща в конфликт за интелектуална собственост и сигурност. После идват и битките в съда. На 24 февруари 2026 г. Reuters съобщи, че американски съдия е отхвърлил (засега) иска на xAI, обвиняващ OpenAI в присвояване на търговски тайни, като същевременно даде на xAI време да измени жалбата си.
Какво означава това за разработчиците и бизнеса (и за неспециалистите)
Ако изграждате софтуер, GPT‑5.3‑Codex и Codex‑Spark сочат към бъдеще, в което:
- Възлагате задача, а не единичен промпт (“разгледай този бъг, предложи поправки, пусни тестове, отвори PR”)
- ИИ работи по-дълго, пази контекста и използва инструментите по-надеждно
- Скоростта става ежедневен фактор за продуктивност
Ако управлявате екип, въпросът също се променя. Става по-малко за “Трябва ли да използваме ИИ?” и повече за:
- Кой модел отговаря на нашето ниво на риск (особено за код, сигурност и чувствителни данни)?
- Как тестваме резултатите и предотвратяваме тихи провали?
- Каква е реалната цена, когато токените и употребата нараснат?
Ако се опитвате да гарантирате, че ролята ви не се измести постепенно към само преглеждане на работа, генерирана от ИИ, едно практично правило може да помогне:
Избирайте модели според задачите.
- Нужно е дълбоко агентно програмиране? GPT‑5.3‑Codex е позициониран за това.
- Трябват бързи интерактивни редакции? Codex‑Spark е изграден за нисколатентни итерации.
- Нужно е широко разсъждение + мултимодални входове? Gemini 3.1 Pro е силно рекламиран в тази посока.
- Нужни са тежки по безопасност документи и силно корпоративно послание? Claude Opus 4.6 поставя системни карти и одити на преден план.
Заключение: GPT‑5.3 усилва звука
GPT‑5.3‑Codex е стъпка към агентна работа на компютри, с подобрения в скоростта, силни позиции по бенчмаркове и позиция по безопасността, която открито отбелязва киберсигурностни способности.
След това Codex‑Spark добавя второ послание: следващата битка не е само за интелигентност, а и за латентност — кой може да направи така, че ИИ да се усеща наистина в реално време в инструментите, които хората вече използват.
Междувременно Claude Opus 4.6 и Gemini 3.1 Pro показват, че конкурентите не чакат учтиво реда си. Те доставят бързо, публикуват системни карти и натискат силно върху разсъждение и мултимодални способности.
Надпреварата в ИИ се нажежава. Леко ироничното е, че победителите може да бъдат решени от неща, които звучат скучно — цени на токени, проверки за безопасност, лимити на заявките и time-to-first-token. Но през 2026 г. “скучното” често е мястото, където се крие бъдещето.