Гонка вооружений в сфере ИИ набирает обороты с GPT‑5.3 Гонка вооружений в сфере ИИ набирает обороты с GPT‑5.3

В начале 2026 года следить за релизами ИИ стало сложнее: обновления выходят так часто, что заголовки устаревают за считанные дни. В один день фокус — “более сильное рассуждение,” на следующий — скорость и меньшая задержка, а вскоре после этого — ИИ, который пишет код скорее как напарник. К выходным конкурент публикует новую системную карточку, и разговор быстро смещается к бенчмаркам и спорам о том, что считать “реальным” прогрессом.

Последний шаг OpenAI в этой стремительной гонке — GPT‑5.3‑Codex — модель, сфокусированная на агентном программировании: она умеет планировать, использовать инструменты и выполнять многошаговые задачи с меньшим количеством ручного сопровождения. OpenAI описывает её как сочетание ведущей производительности кодирования из ранних версий Codex с более сильным рассуждением и профессиональными знаниями из семейства GPT‑5 и указывает, что для пользователей Codex она работает на 25% быстрее.

Давайте разберём, что меняет GPT‑5.3‑Codex, почему это важно и как реагируют крупные игроки.

Почему GPT‑5.3 — большое событие

Сначала небольшой, но важный нюанс: когда говорят “GPT‑5.3,” сейчас публично доступен GPT‑5.3‑Codex — модель Codex, нацеленная на создание софта и работу за компьютером. Её спроектировали для долгих задач, включающих исследования, использование инструментов и сложное исполнение — больше как с коллегой, которого можно направлять, а не как с простым чат-ботом, которому задают вопросы.

OpenAI также делает заявление, звучащее как научная фантастика, но написанное прямым текстом: GPT‑5.3‑Codex был “существенно задействован в создании самого себя.” Команда Codex использовала ранние версии, чтобы отлаживать обучение, управлять развёртыванием и диагностировать результаты тестов — то есть модель помогала ускорять собственный цикл разработки.

Это важно по одной причине: петли обратной связи. Когда инструменты ИИ помогают быстрее строить следующие инструменты ИИ, темп релизов снова может вырасти. Если прогресс ИИ уже казался быстрым, это тот момент, когда он надевает ролики.

Дата выхода, ключевые возможности и цены GPT‑5.3‑Codex

OpenAI представила GPT‑5.3‑Codex 5 февраля 2026 года, назвав его своей самой способной моделью агентного программирования на сегодня и отметив прирост скорости (на 25% быстрее), а также усиление показателей на бенчмарках по коду и агентам.

Для чего создан GPT‑5.3‑Codex

OpenAI делает упор на долго выполняющиеся работы: задачи, которые могут занимать часы, задействуют инструменты и требуют множества шагов.

Также сообщается о сильных результатах на бенчмарках реальной инженерии ПО и агентного поведения, включая SWE‑Bench Pro и Terminal‑Bench, и упоминается производительность на OSWorld и GDPval (бенчмарки, измеряющие реальные, инструментальные возможности).

Вопросы безопасности звучат громче, чем прежде

В системной карточке есть чёткая строка: OpenAI рассматривает этот запуск как первый под меткой High-capability cybersecurity (высокие возможности в кибербезопасности) с активированными мерами защиты.

Это важный сигнал “гонки вооружений”. Компании соревнуются в сырой мощности, но также и в рамках безопасности, мониторинге и доверии.

Цены (OpenAI API) на GPT‑5.3‑Codex

Для уровня Standard указано:

  • $1.75 за ввод / 1 млн токенов
  • $0.175 за кэшированный ввод / 1 млн токенов
  • $14.00 за вывод / 1 млн токенов

Для уровня Priority указано:

  • $3.50 за ввод / 1 млн токенов
  • $0.35 за кэшированный ввод / 1 млн токенов
  • $28.00 за вывод / 1 млн токенов

Скорость становится оружием: GPT‑5.3‑Codex‑Spark и гонка задержек

Через неделю после основного релиза GPT‑5.3‑Codex OpenAI представила GPT‑5.3‑Codex‑Spark (12 февраля 2026 года), назвав его исследовательским превью и своей первой моделью, спроектированной для кодирования в реальном времени.

OpenAI говорит, что Codex‑Spark оптимизирован под аппаратное обеспечение с ультранизкой задержкой и способен выдавать более 1000 токенов в секунду, стремясь к почти мгновенному опыту.

На старте OpenAI указывает:

  • окно контекста 128k
  • только текст
  • постепенный запуск как исследовательского превью для пользователей ChatGPT Pro, с отдельными лимитами на время превью

OpenAI отмечает, что Codex‑Spark работает на Cerebras Wafer Scale Engine 3, называя это вехой партнёрства с Cerebras.

Компания даже описывает бэкенд-работы по снижению задержек по всему конвейеру, упоминая сокращения вроде 80% меньших накладных расходов на один раунд-трип и 50% улучшения времени до первого токена за счёт постоянных соединений и оптимизаций стека инференса.

Независимые материалы также подчеркивают стратегию: использование Cerebras для этого развёртывания демонстрирует попытку диверсифицировать железо для инференса за пределами типичного стека, сильно зависящего от Nvidia.

Проще говоря: гонка теперь включает чипы, сети и “time-to-first-token.” Это очень современная фраза и немного забавно, если вспомнить, когда “loading…” было нормой.

GPT‑5.3 vs Claude Opus 4.6 vs Gemini 3.1 Pro: сравнение гонки ИИ

OpenAI выпустила GPT‑5.3‑Codex не в пустую арену. В том же месяце крупные конкуренты тоже представили серьёзные апгрейды — часто со своими системными карточками, заявлениями по бенчмаркам и примечаниями по безопасности.

Anthropic: Claude Opus 4.6 делает упор на сильное рассуждение и тестирование безопасности

Anthropic анонсировала Claude Opus 4.6 5 февраля 2026 года — в тот же день, что и GPT‑5.3‑Codex — и указала на системную карточку с подробными оценками возможностей и безопасности.

Anthropic также подчёркивает, что рост возможностей не сопровождается ухудшением согласованности: Opus 4.6 показывает низкую частоту несогласованного поведения (включая обман и угодничество) в автоматизированном поведенческом аудите, а также упоминает расширенные оценки безопасности и новые меры защиты.

Отдельная тема — кибербезопасность: Anthropic говорит, что Opus 4.6 демонстрирует расширенные киберспособности и что компания разработала шесть новых кибербезопасностных проб (тестов) для отслеживания шаблонов злоупотребления.

То есть, пока OpenAI помечает кибервозможности в своей Preparedness Framework, Anthropic выделяет новое тестирование и пробы по кибербезопасности. Подходы разные, посыл один: эти модели уже настолько мощные, что киберриски — стандартная часть релизной истории.

Google: Gemini 3.1 Pro продвигает рассуждение и мультимодальные возможности

Google представила Gemini 3.1 Pro в превью и сообщает о его развёртывании в потребительских и разработческих продуктах.

Google подчёркивает прогресс в бенчмарках, включая подтверждённый результат 77,1% на ARC‑AGI‑2, что, по описанию, более чем вдвое превосходит способность к рассуждению у Gemini 3 Pro.

Стратегия Google в гонке выглядит так: рассуждение + мультимодальность + широкое продуктовое распространение (приложение Gemini, NotebookLM, инструменты для разработчиков, каналы для предприятий).

Meta: Llama 4 продолжает давить на рынок открытыми весами

Семейство Llama 4 от Meta (релиз в апреле 2025 года) по-прежнему играет важную роль в 2026-м, потому что модели с открытыми весами заставляют остальных двигаться быстрее и умнее выстраивать цены. Meta представила Llama 4 Scout и Maverick как изначально мультимодальные модели ИИ.

СМИ также отмечают, что модели Llama 4 питают Meta AI в продуктах вроде WhatsApp и Instagram, и выделяют детали наподобие чрезвычайно большого окна контекста у Scout (в одном из отчётов указано 10 миллионов токенов).

Тёмная сторона гонки: споры о дистилляции, захваты данных и иски

Когда рынок становится настолько ценным, начинают спорить о правилах — особенно о правилах вокруг данных.

Крупный пример всплыл в феврале 2026 года: Anthropic заявила, что несколько китайских компаний ИИ использовали ответы Claude для улучшения своих моделей через “дистилляцию,” описав масштабные злоупотребления — около 24 000 фальшивых аккаунтов и более 16 миллионов взаимодействий — с нарушением условий и ограничений доступа.

Дистилляция может быть обычной техникой в машинном обучении. Но когда она использует закрытые выходы чужой модели без разрешения, это быстро превращается в конфликт ИС и безопасности. Дальше начинаются судебные баталии. 24 февраля 2026 года Reuters сообщило, что американский судья отклонил (пока) иск xAI с обвинениями OpenAI в присвоении коммерческих тайн, позволив xAI время на уточнение иска.

Что это значит для разработчиков и бизнеса (и для неспециалистов)

Если вы создаёте софт, GPT‑5.3‑Codex и Codex‑Spark указывают на будущее, где:

  • Вы ставите задачу, а не один промпт («разберись с этим багом, предложи фиксы, запусти тесты, открой PR»)
  • ИИ работает дольше, сохраняет контекст и надёжнее использует инструменты
  • Скорость становится ежедневным фактором продуктивности

Если вы управляете командой, вопрос тоже меняется. Речь уже не о «Нужно ли нам ИИ?», а о:

  • Какая модель соответствует нашему уровню риска (особенно для кода, безопасности и чувствительных данных)?
  • Как тестировать выходы и предотвращать тихие сбои?
  • Какова реальная стоимость, когда токены и использование масштабируются?

Если вы стараетесь не допустить, чтобы ваша роль постепенно свелась лишь к ревью сгенерированной ИИ работы, поможет одно практическое правило:

Подбирайте модели под задачи.

  • Нужно глубокое агентное программирование? GPT‑5.3‑Codex позиционируется именно для этого.
  • Нужны быстрые интерактивные правки? Codex‑Spark создан для низколатентных итераций.
  • Нужны широкие рассуждения + мультимодальный ввод? Gemini 3.1 Pro активно продвигается в этом направлении.
  • Нужны усиленная документация по безопасности и сильное enterprise-позиционирование? Claude Opus 4.6 выносит системные карточки и аудиты на первый план.

Итог: GPT‑5.3 прибавляет громкость

GPT‑5.3‑Codex — шаг к агентной работе за компьютером, с улучшением скорости, сильными позициями на бенчмарках и открытой позицией по безопасности, прямо указывающей на кибервозможности.

Затем Codex‑Spark добавляет второй посыл: следующая борьба — не только за интеллект, но и за задержку — за то, кто сделает ИИ по-настоящему реалтаймовым внутри уже привычных инструментов.

Тем временем Claude Opus 4.6 и Gemini 3.1 Pro показывают, что конкуренты не ждут вежливо своей очереди. Они быстро поставляют обновления, публикуют системные карточки и активно прокачивают рассуждение и мультимодальность.

Гонка ИИ разогревается. Ирония в том, что победителей могут определить вещи, звучащие скучно, — цены на токены, проверки безопасности, лимиты и time-to-first-token. Но в 2026 году “скучное” часто и скрывает будущее.

Другие публикации автора

Apple и Snap накаляют гонку на рынке умных очков
Статья
Apple и Snap накаляют гонку на рынке умных очков
Apple и Snap обостряют гонку умных очков, делая очень разные ставки: очки с ИИ, привязанные к iPhone, против автономных AR-очков для потребителей.
Claude Mythos от Anthropic: модель слишком рискованна для публичного релиза?
Статья
Claude Mythos от Anthropic: модель слишком рискованна для публичного релиза?
Claude Mythos Preview — самый спорный релиз ИИ от Anthropic на сегодняшний день. Узнайте, почему он ограничен, что он умеет и почему к нему присматриваются регуляторы и банки.
Что 81,000 человек сказали Anthropic, чего они хотят от ИИ
Статья
Что 81,000 человек сказали Anthropic, чего они хотят от ИИ
Компания Anthropic проанализировала 80 508 интервью с пользователями ИИ в 159 странах, чтобы понять, чего люди хотят от ИИ, что их беспокоит и в чем сегодняшние инструменты всё ещё не дотягивают.
Nebius планирует построить в Финляндии центр обработки данных для ИИ стоимостью 10 млрд долларов на фоне гонки ИИ в Европе
Статья
Nebius планирует построить в Финляндии центр обработки данных для ИИ стоимостью 10 млрд долларов на фоне гонки ИИ в Европе
Nebius планирует центр обработки данных ИИ мощностью 310 МВт в Финляндии. Вот почему проект в Лаппеенранте важен для гонки Европы в сфере ИИ, инфраструктуры и суверенитета.