کدکسِ OpenAI در حال فراتر رفتن از برنامه‌نویسی است

OpenAI در حال تبدیل اپلیکیشن Codex به فضایی است که عامل‌های هوش مصنوعی بتوانند کد بنویسند، رابط‌ها را آزمایش کنند، Pull Requestها را بازبینی کنند، از اپ‌ها استفاده کنند، عادات پروژه را به خاطر بسپارند و کارهای طولانی را در پس‌زمینه زنده نگه دارند.

به‌روزرسانی آوریل ۲۰۲۶ OpenAI استفاده از رایانه، مرورگری درون‌اپی، تولید تصویر، حافظه، افزونه‌ها، خودکارسازی‌ها، جریان‌های کاری قوی‌تر برای Pull Request، پیش‌نمایش فایل‌ها، چندین ترمینال و پشتیبانی اولیه از SSH را اضافه کرد. استفادهٔ هفتگی تا آن زمان از ۴ میلیون توسعه‌دهنده عبور کرده بود زیرا OpenAI Codex را عمیق‌تر در شرکت‌های بزرگ پیش می‌برد.

Codex در حال جای‌گیری در سراسر چرخهٔ عمر توسعهٔ نرم‌افزار است: برنامه‌ریزی، گردآوری زمینه، ساخت، آزمون، بازبینی، مستندسازی و پیگیری کار. IDE دیگر همهٔ ماجرا نیست. Codex می‌خواهد در کل دفتر قدم بزند.

چه چیزهایی در Codex تغییر کرد؟

استفاده از رایانه خارج از IDE

ویژگی شاخص استفادهٔ رایانه‌ای Codex است. Codex می‌تواند با نشانگر خودش در اپ‌های دسکتاپ ببیند، کلیک کند و تایپ کند. چندین عامل می‌توانند به‌طور موازی روی یک Mac اجرا شوند، در حالی‌که کاربر در اپ‌های دیگر به کارش ادامه می‌دهد. این به آزمون‌های فرانت‌اند، تضمین کیفیت اپ، و ابزارهایی که API تمیزی ندارند کمک می‌کند.

مثال: یک توسعه‌دهنده از Codex می‌خواهد صفحهٔ پرداخت را درست کند. Codex کد React را تغییر می‌دهد، صفحهٔ محلی را باز می‌کند، در جریان کلیک می‌کند، می‌بیند که فیلد تخفیف در عرض موبایل خراب می‌شود، CSS را ویرایش می‌کند، تست‌ها را اجرا می‌کند و نتیجه را گزارش می‌دهد.

مرورگر درون‌اپی برای بازخورد بصری

مرورگر درون‌اپی به کار فرانت‌اند کمک می‌کند. کاربران می‌توانند مستقیماً روی یک صفحه نظر بدهند و به عامل دستورهای دقیق بدهند. «این دکمه را زیر کارت قیمت جابه‌جا کن» وقتی «این» به دکمهٔ واقعی اشاره می‌کند ساده‌تر است، نه یک خط مبهم در یک پرامپت. استفاده از مرورگر همچنین به Codex اجازه می‌دهد در رابط‌های محلی کلیک کند، باگ‌های بصری را بازتولید کند و اصلاحات را داخل اپ تأیید کند.

افزونه‌ها، مهارت‌ها و اتصالات MCP

افزونه‌های Codex مهارت‌ها، یکپارچه‌سازی‌های اپ و سرورهای MCP را در جریان‌های کاری قابل‌استفاده‌مجدد بسته‌بندی می‌کنند. OpenAI نمونه‌هایی مانند Gmail، Google Drive، Slack، GitHub و ابزارهای دیگر را فهرست می‌کند. یک افزونه می‌تواند فرایندی تکرارپذیر به Codex بدهد: یک رشتهٔ Slack را بخوان، یک Issue در GitHub را بررسی کن، زمینه را از Drive بگیر، یک سند را به‌روزرسانی کن و پیش‌نویس پاسخ را آماده کن.

MCP به Codex دسترسی به ابزارها و زمینه‌های بیرونی می‌دهد، از جمله ابزارهای توسعه مانند مرورگرها یا Figma.

حافظه و خودکارسازی‌ها برای کار پایدار

حافظهٔ Codex به عامل اجازه می‌دهد زمینه‌های مفید را از گفتگوهای گذشته به کارهای آینده منتقل کند. می‌تواند ترجیحات، پشته‌های فناوری، جریان‌های کاری تکرارشونده، قراردادهای پروژه و دام‌های شناخته‌شده را به خاطر بسپارد. OpenAI می‌گوید حافظه‌ها به‌صورت پیش‌فرض خاموش‌اند و در زمان عرضه در EEA، بریتانیا یا سوئیس در دسترس نبودند.

خودکارسازی‌های Codex به Codex اجازه می‌دهد کارهای تکرارشونده را در پس‌زمینه اجرا کند، یافته‌ها را به یک صندوق ورودی بفرستد، یا وقتی چیزی برای گزارش نیست یک اجرا را بایگانی کند. یک تیم می‌تواند از Codex بخواهد هر صبح تله‌متری‌های ناموفق را بررسی کند، هر جمعه تغییرات کدبیس را خلاصه کند، یا یک PR طولانی‌مدت را زیر نظر داشته باشد.

چرا فراتر از کدنویسی مهم است

توسعهٔ نرم‌افزار فقط تولید کد نیست. روز عادی یک توسعه‌دهنده شامل خواندن Issueها، بررسی لاگ‌ها، بازتولید باگ‌ها، به‌روزرسانی اسناد، پاسخ به نظرهای بازبینی، اجرای تست‌ها و توضیح تصمیم‌هاست. توسعه‌دهندگان اکنون از Codex برای درک سیستم‌ها، گردآوری زمینه، بازبینی کار، رفع اشکال، هماهنگی با هم‌تیمی‌ها و جلو بردن کارهای طولانی‌تر استفاده می‌کنند. مالکیت نتیجه همچنان با توسعه‌دهنده است. عامل هوش مصنوعی Codex بخش‌های میانی پرزحمت را بیشتر انجام می‌دهد.

اپ Codex به‌عنوان مرکز فرمان چندعامله

OpenAI اپ Codex را در فوریهٔ ۲۰۲۶ به‌عنوان یک رابط دسکتاپ برای مدیریت هم‌زمان چند عامل معرفی کرد. این اپ از رشته‌های موازی، نماهای پروژه، Diffها، دیدگاه‌ها/نظرها، Worktreeها، ترمینال‌ها، کنش‌های Git و حالت ابری پشتیبانی می‌کند. پشتیبانی Windows در مارس ۲۰۲۶ رسید.

Worktreeها اجازه می‌دهند چند عامل روی یک مخزن در کپی‌های ایزوله کار کنند، بنابراین یک عامل می‌تواند صفحهٔ تنظیمات را بازآرایی کند در حالی که عامل دیگری برای بخش صورتحساب تست می‌نویسد.

Codex اکنون فراتر از نوشتن کد چه می‌تواند بکند

جدول ویژگی‌ها

یک مدیر محصول می‌تواند بنویسد: «صفحهٔ آن‌بوردینگ را برای کاربران تازه‌وارد واضح‌تر کن. از آخرین تیکت‌های پشتیبانی ما برای زمینه استفاده کن، متن را به‌روزرسانی کن، صفحه را تنظیم کن و یک خلاصهٔ کوتاه آماده کن.» Codex می‌تواند زمینه را جمع کند، اپ را تغییر دهد، بررسی‌ها را اجرا کند و خلاصه را تولید کند. انسان هنوز نتیجهٔ نهایی را تأیید می‌کند، چون محیط تولید نباید خانهٔ ارواح باشد.

Codex در برابر Claude Code، Cursor و Copilot

رقابت پیرامون کدنویسی عامل‌محور شلوغ است. Claude Code سامانهٔ کدنویسی عامل‌محور Anthropic است که یک کدبیس را می‌خواند، فایل‌ها را ویرایش می‌کند، تست‌ها را اجرا می‌کند و کدی Commit‌شده تحویل می‌دهد. Cursor بر یک ویرایشگر AI-first و عامل‌ها در سراسر دسکتاپ، CLI، GitHub، Slack، Linear و JetBrains تمرکز دارد. GitHub Copilot یک عامل ابری دارد که می‌تواند یک مخزن را بررسی کند، در یک شاخه تغییر ایجاد کند و از یک Issue یا دستور چت یک Pull Request باز کند.

OpenAI Codex به‌سوی یک مرکز فرمانِ جریان‌کار و عامل در حرکت است. بهترین مورد استفادهٔ آن کار چندمرحله‌ای در سراسر کد، اپ‌ها، فایل‌ها، مرورگرها و ابزارهای متصل است.
Claude Code بر کدنویسی عامل‌محور در سراسر کدبیس‌ها متمرکز است. برای وظایف توسعهٔ مبتنی بر ترمینال، تغییرات کد، تست‌ها و اجرا در سطح مخزن به‌خوبی کار می‌کند.
Cursor پیرامون یک تجربهٔ ویرایشگر بومیِ هوش مصنوعی ساخته شده است. برای توسعه‌دهندگانی که بیشتر روزشان را در ویرایشگر می‌گذرانند و کمک هوش مصنوعی نزدیک به کد می‌خواهند، تناسب بالایی دارد.
GitHub Copilot در جریان‌های کاری بومی GitHub قوی‌تر است. با Issueها، شاخه‌ها، Pull Requestها، بازبینی کد و کارهای مربوط به مخزن که از پیش در GitHub زندگی می‌کنند جور درمی‌آید.

آن حرکت بزرگ‌تر به‌سوی ابزارهای کدنویسی در خلأ رخ نمی‌دهد. ما آن را با جزئیات بیشتر در مقایسهٔ Claude Code با Codex بررسی کردیم، که نگاه می‌کند به این‌که چرا عامل‌های کدنویسی هوش مصنوعی ناگهان همه‌جا هستند و چرا شرکت‌ها این‌قدر روی آن‌ها شرط می‌بندند.

حرکت سازمانی OpenAI

OpenAI در حال گسترش شراکت‌ها با Accenture، Capgemini، CGI، Cognizant، Infosys، PwC و Tata Consultancy Services است تا Codex را به شرکت‌های بزرگ بیاورد. OpenAI همچنین Codex Labs را راه‌اندازی می‌کند که متخصصان OpenAI را داخل سازمان‌های مشتری مستقر خواهد کرد تا Codex را در سیستم‌ها و جریان‌های کاری موجود یکپارچه کنند.

شرکت‌های بزرگ «دموهای باحال» نمی‌خرند. آن‌ها کار تکرارشونده، کنترل‌ها، گزارش‌دهی و یکپارچگی با سیستم‌های درهمی را می‌خرند که از سه بازسازمان‌دهی و دست‌کم یک فایل Excel قهرمانانه جان سالم به در برده‌اند. عامل‌های فضای کاری Codex در همین مسیرند: آن‌ها با Codex توان می‌گیرند، در ابر اجرا می‌شوند، از اپ‌های متصل استفاده می‌کنند و می‌توان آن‌ها را در ChatGPT یا Slack به اشتراک گذاشت.

ایمنی، سندباکس و بازبینی انسانی

قدرت بیشتر، کنترل بیشتر می‌خواهد. مستندات امنیتی Codexِ OpenAI می‌گویند عامل به‌طور پیش‌فرض با دسترسی شبکه خاموش اجرا می‌شود. به‌صورت محلی، Codex از یک سندباکس تحمیلیِ سیستم‌عامل استفاده می‌کند که معمولاً به فضای کاری کنونی محدود است، به‌علاوهٔ سیاست‌های تأییدی که تعیین می‌کنند چه زمانی عامل باید پیش از عمل کردن اجازه بگیرد.

سندباکس تعیین می‌کند Codex به چه چیزهایی می‌تواند دست بزند. سیاست تأیید تعیین می‌کند چه زمانی باید مکث کند. ویرایش‌ها و تست‌های روتین می‌توانند در این محدودیت‌ها اجرا شوند. دسترسی شبکه، تغییرات بیرون از فضای کاری یا فراخوانی ابزارهای پرریسک می‌توانند نیازمند تأیید باشند.

حافظه هم به حکمرانی نیاز دارد. تیم‌ها باید قواعد لازم را در AGENTS.md یا مستندات ثبت‌شده در مخزن نگه دارند، نه فقط در فایل‌های حافظه. اسرار نباید وارد حافظه شوند. یک قاعدهٔ خوب: بگذارید Codex ترجیحات را به خاطر بسپارد، نه گذرواژه‌ها را.

تصویر بزرگ‌تر

Codex به‌سوی کار بومیِ هوش مصنوعی اشاره دارد: عامل‌هایی که در سراسر ابزارها، فایل‌ها، پنجره‌های مرورگر، پیام‌ها، اسناد و کد عمل می‌کنند. Codex همچنین می‌تواند توسط غیرتوسعه‌دهندگان برای کارهایی مانند گردآوری اطلاعات، ساخت اسلاید، ساخت داشبورد، رفع مشکلات جریان کار، به‌روزرسانی فایل‌ها و خودکارسازی کارهای روتین استفاده شود.

اما این آینده هنوز به یک دوش آب سرد نیاز دارد. عامل‌های هوش مصنوعی می‌توانند دچار توهم شوند، زمینه را بد بفهمند، یک کار را بیش از حد لفظی اجرا کنند، یا تغییری انجام دهند که تا رسیدن به یک جریان کار واقعی خوب به نظر می‌رسد. هرچه ابزارهای بیشتری در دسترس یک عامل باشد، اهمیت بازبینی بیشتر می‌شود. یک اشتباه کوچک در یک پیش‌نویس آزاردهنده است. یک اشتباه کوچک در یک مخزن، داشبورد، یا جریان کار مشتری می‌تواند خیلی سریع گران تمام شود.

Codex دارد کمتر شبیه خودتکمیلی و بیشتر شبیه یک عامل تحت‌نظارت برای کار دیجیتال پیچیده می‌شود. می‌تواند عمل کند، به خاطر بسپارد، ابزارها را متصل کند و با خروجی‌ها بازگردد. کار انسان این است که وظیفهٔ درست بدهد، نتیجه را بررسی کند و محافظ‌ها را محکم نگه دارد. این کمتر پرزرق‌وبرق از «هوش مصنوعی جایگزین توسعه‌دهندگان می‌شود» است، اما باورپذیرتر.