Perlumbaan senjata AI memanas dengan GPT‑5.3 Perlumbaan senjata AI memanas dengan GPT‑5.3

Pada awal 2026, mengikuti keluaran AI menjadi lebih sukar: kemas kini hadir begitu kerap sehingga tajuk berita boleh terasa usang dalam beberapa hari. Suatu hari, tumpuannya ialah “penaakulan yang lebih kukuh,” keesokannya kelajuan dan kependaman yang lebih rendah, dan tidak lama selepas itu, AI yang menulis kod lebih seperti rakan sepasukan. Menjelang hujung minggu, pesaing menyiarkan kad sistem baharu, dan perbualan segera beralih kepada penanda aras serta perdebatan tentang apa yang dikira sebagai kemajuan “sebenar”.

Langkah terbaru OpenAI dalam perlumbaan serba pantas ini ialah GPT‑5.3‑Codex — model yang memfokus pada pengkodan beragen (agentic), bermakna ia boleh merancang, menggunakan alat, dan menyelesaikan tugas berbilang langkah dengan kurang bimbingan. OpenAI menerangkannya sebagai menggabungkan prestasi pengkodan teratas daripada versi Codex terdahulu dengan penaakulan yang lebih kuat dan pengetahuan profesional daripada keluarga GPT‑5 serta berjalan 25% lebih pantas untuk pengguna Codex.

Mari kita huraikan apa yang diubah oleh GPT‑5.3‑Codex, mengapa ia penting, dan bagaimana pemain besar bertindak balas.

Mengapa GPT‑5.3 Begitu Penting

Pertama, butiran kecil tetapi penting: apabila orang menyebut “GPT‑5.3,” keluaran awam buat masa ini ialah GPT‑5.3‑Codex, iaitu model Codex yang ditujukan untuk membina perisian dan melakukan kerja berasaskan komputer. Ia direka untuk mengendalikan tugasan panjang yang merangkumi penyelidikan, penggunaan alat, dan pelaksanaan kompleks — lebih seperti rakan sekerja yang boleh anda pandu berbanding bot sembang ringkas yang anda soal.

OpenAI juga membuat kenyataan yang kedengaran seperti fiksyen sains, tetapi dinyatakan secara terus terang: GPT‑5.3‑Codex “berperanan penting dalam mencipta dirinya sendiri.” Pasukan Codex menggunakan versi awal untuk menyahpepijat latihan, mengurus penggunaan (deployment), dan mendiagnosis keputusan ujian — bermakna model itu membantu mempercepatkan kitaran pembangunannya sendiri.

Itu penting atas satu sebab: gelung maklum balas. Apabila alat AI membantu membina alat AI seterusnya dengan lebih cepat, kadar keluaran boleh meningkat lagi. Jika kemajuan AI sudah terasa pantas, inilah bahagian di mana ia seakan-akan memakai kasut roda.

Tarikh Keluaran, Ciri Utama, dan Harga GPT‑5.3‑Codex

OpenAI memperkenalkan GPT‑5.3‑Codex pada 5 Februari 2026, menggambarkannya sebagai model pengkodan beragen paling berkeupayaan setakat ini, serta menonjolkan peningkatan kelajuan (25% lebih pantas) dan prestasi yang lebih kukuh pada penanda aras pengkodan dan agen.

Untuk Apa GPT‑5.3‑Codex Dibina

OpenAI menekankan kerja yang berjalan lama: tugasan yang boleh mengambil masa berjam-jam, melibatkan alat, dan memerlukan banyak langkah.

Ia juga melaporkan prestasi kukuh pada penanda aras yang digunakan untuk menguji kejuruteraan perisian sebenar dan gelagat agen, termasuk SWE‑Bench Pro dan Terminal‑Bench, serta menyebut prestasi pada OSWorld dan GDPval (penanda aras yang bertujuan mengukur keupayaan dunia sebenar dalam penggunaan alat).

Pendekatan Keselamatan Lebih Ketara daripada Sebelum Ini

Kad sistem itu mengandungi pernyataan jelas: OpenAI menganggap ini sebagai pelancaran pertama di bawah label keselamatan siber Berkeupayaan Tinggi, dengan langkah perlindungan diaktifkan.

Itu ialah isyarat “perlumbaan senjata” yang penting. Syarikat bersaing pada keupayaan mentah, tetapi mereka juga bersaing pada rangka kerja keselamatan, pemantauan, dan kredibiliti.

Harga (API OpenAI) untuk GPT‑5.3‑Codex

Untuk peringkat Standard, GPT‑5.3‑Codex disenaraikan sebagai:

  • $1.75 input / 1M token
  • $0.175 input di-cache / 1M token
  • $14.00 output / 1M token

Untuk peringkat Keutamaan, ia disenaraikan sebagai:

  • $3.50 input / 1M token
  • $0.35 input di-cache / 1M token
  • $28.00 output / 1M token

Kelajuan Menjadi Senjata: GPT‑5.3‑Codex‑Spark dan Perlumbaan Kependaman

Seminggu selepas keluaran utama GPT‑5.3‑Codex, OpenAI memperkenalkan GPT‑5.3‑Codex‑Spark (12 Februari 2026), menyebutnya sebagai pratonton penyelidikan dan model pertamanya yang direka untuk pengkodan masa nyata.

OpenAI berkata Codex‑Spark dioptimumkan untuk perkakasan berkependaman ultra rendah dan boleh menghasilkan lebih daripada 1000 token sesaat, menyasarkan pengalaman yang hampir sekelip mata.

Pada pelancaran, OpenAI menyatakan:

  • tingkap konteks 128k
  • teks sahaja
  • dilancarkan sebagai pratonton penyelidikan untuk pengguna ChatGPT Pro, dengan had kadar berasingan sepanjang tempoh pratonton

OpenAI berkata Codex‑Spark berjalan di atas Cerebras Wafer Scale Engine 3, menyifatkannya sebagai satu pencapaian penting dalam kerjasamanya dengan Cerebras.

OpenAI turut menerangkan kerja bahagian belakang (backend) untuk mengurangkan kependaman di seluruh rantaian, termasuk pengurangan seperti 80% kurang overhead bagi setiap perjalanan ulang-alik dan penambahbaikan 50% pada masa-ke-token-pertama melalui perubahan seperti sambungan berterusan dan pengoptimuman timbunan inferens.

Liputan bebas turut menonjolkan sudut strategik: menggunakan Cerebras untuk penempatan ini menyerlahkan usaha mempelbagaikan perkakasan inferens melangkaui timbunan yang lazimnya berat kepada Nvidia.

Dalam istilah mudah: perlumbaan kini merangkumi cip, rangkaian, dan “masa-ke-token-pertama.” Itu ayat yang sangat moden, dan agak lucu jika anda masih ingat ketika “memuatkan…” adalah perkara biasa.

GPT‑5.3 lwn Claude Opus 4.6 lwn Gemini 3.1 Pro: Perbandingan Perlumbaan Senjata AI

OpenAI tidak melancarkan GPT‑5.3‑Codex ke dalam arena yang kosong. Pada bulan yang sama, pesaing utama turut menghantar peningkatan besar — selalunya dengan kad sistem mereka sendiri, dakwaan penanda aras, dan nota keselamatan.

Anthropic: Claude Opus 4.6 Memberi Tumpuan pada Penaakulan Kukuh dan Ujian Keselamatan

Anthropic mengumumkan Claude Opus 4.6 pada 5 Februari 2026 — hari yang sama dengan GPT‑5.3‑Codex — dan merujuk pembaca kepada kad sistem dengan penilaian keupayaan dan keselamatan terperinci.

Anthropic juga menekankan bahawa peningkatan keupayaan tidak datang bersama penjajaran yang lebih buruk, dengan menyatakan Opus 4.6 menunjukkan kadar tingkah laku yang tidak sejajar yang rendah (termasuk penipuan dan ampu-bodek) dalam audit tingkah laku automatiknya, serta menyebut penilaian keselamatan yang diperluas dan pengawal selia baharu.

Tema ketara ialah keselamatan siber: Anthropic berkata Opus 4.6 menunjukkan keupayaan keselamatan siber yang ditambah baik dan bahawa ia membangunkan enam prob keselamatan siber baharu untuk menjejaki corak penyalahgunaan.

Jadi, sementara OpenAI menandakan keupayaan keselamatan siber di bawah Rangka Kerja Kesiapsiagaan (Preparedness Framework)nya, Anthropic menonjolkan ujian dan prob keselamatan siber baharu. Pendekatan berbeza, mesej yang sama: model-model ini cukup berkuasa sehingga risiko siber kini menjadi bahagian standard dalam cerita pelancaran.

Google: Gemini 3.1 Pro Menggerakkan Penaakulan dan Kekuatan Multimodal

Google memperkenalkan Gemini 3.1 Pro dalam pratonton dan berkata ia sedang dilancarkan merentas produk pengguna dan pembangun.

Google menonjolkan kemajuan penanda aras, termasuk skor disahkan 77.1% pada ARC‑AGI‑2, menggambarkannya sebagai lebih daripada dua kali ganda prestasi penaakulan Gemini 3 Pro.

Untuk perlumbaan senjata, strategi Google kelihatan seperti: penaakulan + multimodal + pengedaran produk yang luas (aplikasi Gemini, NotebookLM, alat pembangun, saluran perusahaan).

Meta: Llama 4 Terus Memberi Tekanan Model “Open-Weight” ke atas Pasaran

Keluarga Llama 4 keluaran Meta (dikeluarkan pada April 2025) masih memainkan peranan penting pada 2026, kerana model berberat terbuka (open-weight) memaksa pihak lain bergerak lebih pantas dan menetapkan harga dengan lebih bijak. Meta memperkenalkan Llama 4 Scout dan Maverick sebagai model AI multimodal secara natif.

Liputan media turut menyatakan bahawa model Llama 4 memacu Meta AI merentas produk seperti WhatsApp dan Instagram, serta menonjolkan butiran seperti tingkap konteks Scout yang amat besar (dilaporkan sebagai 10 juta token dalam satu laporan).

Sisi Gelap Perlumbaan: Pertelingkahan Distilasi, Rampasan Data, dan Tindakan Undang-undang

Apabila sesebuah pasaran menjadi sangat bernilai, orang mula berdebat tentang peraturannya, khususnya peraturan berkaitan data.

Contoh besar muncul pada Februari 2026: Anthropic berkata beberapa syarikat AI China menggunakan keluaran Claude untuk menambah baik model mereka sendiri melalui “distilasi,” menggambarkan penyalahgunaan berskala besar dengan kira-kira 24,000 akaun palsu dan lebih 16 juta interaksi, melanggar terma dan sekatan akses.

Distilasi boleh menjadi teknik biasa dalam pembelajaran mesin. Tetapi apabila ia menggunakan keluaran model tertutup syarikat lain tanpa kebenaran, ia dengan cepat bertukar menjadi konflik harta intelek dan keselamatan. Kemudian ada pula pertempuran di mahkamah. Pada 24 Februari 2026, Reuters melaporkan bahawa seorang hakim A.S. menolak (buat masa ini) saman xAI yang menuduh OpenAI menyalahgunakan rahsia dagangan, sambil membenarkan xAI masa untuk meminda aduannya.

Maksudnya untuk Pembangun dan Perniagaan (dan untuk Bukan Pakar)

Jika anda membina perisian, GPT‑5.3‑Codex dan Codex‑Spark menunjuk ke arah masa hadapan di mana:

  • Anda memperuntukkan tugasan, bukan satu prompt tunggal (“selidik pepijat ini, cadangkan pembaikan, jalankan ujian, buka PR”)
  • AI bekerja lebih lama, mengekalkan konteks, dan menggunakan alat dengan lebih boleh dipercayai
  • Kelajuan menjadi faktor produktiviti harian

Jika anda mengurus pasukan, persoalannya turut berubah. Ia menjadi kurang tentang “Perlukah kita menggunakan AI?” dan lebih kepada:

  • Model mana sesuai dengan tahap risiko kita (terutamanya untuk kod, keselamatan, dan data sensitif)?
  • Bagaimana kita menguji keluaran dan mencegah kegagalan senyap?
  • Apakah kos sebenar apabila token dan penggunaan meningkat skala?

Jika anda cuba memastikan peranan anda tidak beransur-ansur beralih kepada hanya menyemak kerja yang dijana AI, satu peraturan praktikal boleh membantu:

Pilih model berdasarkan tugas.

  • Perlu pengkodan beragen yang mendalam? GPT‑5.3‑Codex diposisikan untuk itu.
  • Perlu suntingan interaktif yang pantas? Codex‑Spark dibina untuk lelaran berkependaman rendah.
  • Perlu penaakulan luas + input multimodal? Gemini 3.1 Pro dipasarkan kuat ke arah itu.
  • Perlu dokumentasi yang berat pada keselamatan dan pemesejan perusahaan yang kukuh? Claude Opus 4.6 meletakkan kad sistem dan audit di hadapan dan tengah.

Kesimpulan: GPT‑5.3 Menaikkan Volum

GPT‑5.3‑Codex ialah satu langkah ke arah kerja beragen di komputer, dengan penambahbaikan kelajuan, kedudukan penanda aras yang kukuh, dan pendekatan keselamatan yang secara terbuka menandakan keupayaan keselamatan siber.

Kemudian Codex‑Spark menambah mesej kedua: pertarungan seterusnya bukan sahaja tentang kepintaran, tetapi juga tentang kependaman — siapa yang boleh menjadikan AI benar-benar terasa masa nyata di dalam alat yang sudah digunakan orang.

Dalam masa yang sama, Claude Opus 4.6 dan Gemini 3.1 Pro menunjukkan bahawa para pesaing tidak menunggu giliran dengan sopan. Mereka menghantar keluaran dengan cepat, menerbitkan kad sistem, dan menolak keras keupayaan penaakulan serta multimodal.

Perlumbaan senjata AI semakin memanas. Bahagian yang sedikit ironik ialah para pemenang mungkin ditentukan oleh perkara yang kedengarannya membosankan — harga token, prob keselamatan, had kadar, dan masa-ke-token-pertama. Tetapi pada 2026, “membosankan” sering kali tempat masa depan bersembunyi.

Pos lain oleh penulis

Nebius merancang pusat data AI bernilai AS$10 bilion di Finland di tengah-tengah perlumbaan AI di Eropah
Artikel
Nebius merancang pusat data AI bernilai AS$10 bilion di Finland di tengah-tengah perlumbaan AI di Eropah
Nebius merancang pusat data AI 310 MW di Finland. Inilah sebab mengapa projek Lappeenranta penting untuk perlumbaan AI Eropah, infrastruktur dan kedaulatan.
Pelayar menjadi agen: mengapa carian mula bertindak
Artikel
Pelayar menjadi agen: mengapa carian mula bertindak
Carian AI sedang belajar untuk bertindak di dalam pelayar, bukan sekadar memberi jawapan. Inilah cara ejen pelayar mengubah SEO, trafik, privasi dan masa depan web terbuka.
Anthropic menang pusingan pertama dalam pertarungan AI di Pentagon
Artikel
Anthropic menang pusingan pertama dalam pertarungan AI di Pentagon
Anthropic meraih kemenangan awal di mahkamah dalam pertikaian AI dengan Pentagon, sekali gus menimbulkan persoalan yang lebih besar tentang pagar pengaman bagi AI ketenteraan, kontrak dan kawalan.
Anthropic mengukur AI di tempat kerja. Keputusannya tidak seperti yang anda fikirkan.
Artikel
Anthropic mengukur AI di tempat kerja. Keputusannya tidak seperti yang anda fikirkan.
Laporan pasaran buruh Claude 2026 oleh Anthropic menunjukkan bagaimana AI di tempat kerja sedang membentuk semula pengambilan pekerja, pekerjaan kolar putih dan kerjaya peringkat permulaan sebelum pemberhentian besar-besaran tiba.