کدکسِ OpenAI در حال فراتر رفتن از برنامهنویسی است
OpenAI در حال تبدیل اپلیکیشن Codex به فضایی است که عاملهای هوش مصنوعی بتوانند کد بنویسند، رابطها را آزمایش کنند، Pull Requestها را بازبینی کنند، از اپها استفاده کنند، عادات پروژه را به خاطر بسپارند و کارهای طولانی را در پسزمینه زنده نگه دارند.
بهروزرسانی آوریل ۲۰۲۶ OpenAI استفاده از رایانه، مرورگری دروناپی، تولید تصویر، حافظه، افزونهها، خودکارسازیها، جریانهای کاری قویتر برای Pull Request، پیشنمایش فایلها، چندین ترمینال و پشتیبانی اولیه از SSH را اضافه کرد. استفادهٔ هفتگی تا آن زمان از ۴ میلیون توسعهدهنده عبور کرده بود زیرا OpenAI Codex را عمیقتر در شرکتهای بزرگ پیش میبرد.
Codex در حال جایگیری در سراسر چرخهٔ عمر توسعهٔ نرمافزار است: برنامهریزی، گردآوری زمینه، ساخت، آزمون، بازبینی، مستندسازی و پیگیری کار. IDE دیگر همهٔ ماجرا نیست. Codex میخواهد در کل دفتر قدم بزند.
چه چیزهایی در Codex تغییر کرد؟
استفاده از رایانه خارج از IDE
ویژگی شاخص استفادهٔ رایانهای Codex است. Codex میتواند با نشانگر خودش در اپهای دسکتاپ ببیند، کلیک کند و تایپ کند. چندین عامل میتوانند بهطور موازی روی یک Mac اجرا شوند، در حالیکه کاربر در اپهای دیگر به کارش ادامه میدهد. این به آزمونهای فرانتاند، تضمین کیفیت اپ، و ابزارهایی که API تمیزی ندارند کمک میکند.
مثال: یک توسعهدهنده از Codex میخواهد صفحهٔ پرداخت را درست کند. Codex کد React را تغییر میدهد، صفحهٔ محلی را باز میکند، در جریان کلیک میکند، میبیند که فیلد تخفیف در عرض موبایل خراب میشود، CSS را ویرایش میکند، تستها را اجرا میکند و نتیجه را گزارش میدهد.
مرورگر دروناپی برای بازخورد بصری
مرورگر دروناپی به کار فرانتاند کمک میکند. کاربران میتوانند مستقیماً روی یک صفحه نظر بدهند و به عامل دستورهای دقیق بدهند. «این دکمه را زیر کارت قیمت جابهجا کن» وقتی «این» به دکمهٔ واقعی اشاره میکند سادهتر است، نه یک خط مبهم در یک پرامپت. استفاده از مرورگر همچنین به Codex اجازه میدهد در رابطهای محلی کلیک کند، باگهای بصری را بازتولید کند و اصلاحات را داخل اپ تأیید کند.
افزونهها، مهارتها و اتصالات MCP
افزونههای Codex مهارتها، یکپارچهسازیهای اپ و سرورهای MCP را در جریانهای کاری قابلاستفادهمجدد بستهبندی میکنند. OpenAI نمونههایی مانند Gmail، Google Drive، Slack، GitHub و ابزارهای دیگر را فهرست میکند. یک افزونه میتواند فرایندی تکرارپذیر به Codex بدهد: یک رشتهٔ Slack را بخوان، یک Issue در GitHub را بررسی کن، زمینه را از Drive بگیر، یک سند را بهروزرسانی کن و پیشنویس پاسخ را آماده کن.
MCP به Codex دسترسی به ابزارها و زمینههای بیرونی میدهد، از جمله ابزارهای توسعه مانند مرورگرها یا Figma.
حافظه و خودکارسازیها برای کار پایدار
حافظهٔ Codex به عامل اجازه میدهد زمینههای مفید را از گفتگوهای گذشته به کارهای آینده منتقل کند. میتواند ترجیحات، پشتههای فناوری، جریانهای کاری تکرارشونده، قراردادهای پروژه و دامهای شناختهشده را به خاطر بسپارد. OpenAI میگوید حافظهها بهصورت پیشفرض خاموشاند و در زمان عرضه در EEA، بریتانیا یا سوئیس در دسترس نبودند.
خودکارسازیهای Codex به Codex اجازه میدهد کارهای تکرارشونده را در پسزمینه اجرا کند، یافتهها را به یک صندوق ورودی بفرستد، یا وقتی چیزی برای گزارش نیست یک اجرا را بایگانی کند. یک تیم میتواند از Codex بخواهد هر صبح تلهمتریهای ناموفق را بررسی کند، هر جمعه تغییرات کدبیس را خلاصه کند، یا یک PR طولانیمدت را زیر نظر داشته باشد.
چرا فراتر از کدنویسی مهم است
توسعهٔ نرمافزار فقط تولید کد نیست. روز عادی یک توسعهدهنده شامل خواندن Issueها، بررسی لاگها، بازتولید باگها، بهروزرسانی اسناد، پاسخ به نظرهای بازبینی، اجرای تستها و توضیح تصمیمهاست. توسعهدهندگان اکنون از Codex برای درک سیستمها، گردآوری زمینه، بازبینی کار، رفع اشکال، هماهنگی با همتیمیها و جلو بردن کارهای طولانیتر استفاده میکنند. مالکیت نتیجه همچنان با توسعهدهنده است. عامل هوش مصنوعی Codex بخشهای میانی پرزحمت را بیشتر انجام میدهد.
اپ Codex بهعنوان مرکز فرمان چندعامله
OpenAI اپ Codex را در فوریهٔ ۲۰۲۶ بهعنوان یک رابط دسکتاپ برای مدیریت همزمان چند عامل معرفی کرد. این اپ از رشتههای موازی، نماهای پروژه، Diffها، دیدگاهها/نظرها، Worktreeها، ترمینالها، کنشهای Git و حالت ابری پشتیبانی میکند. پشتیبانی Windows در مارس ۲۰۲۶ رسید.
Worktreeها اجازه میدهند چند عامل روی یک مخزن در کپیهای ایزوله کار کنند، بنابراین یک عامل میتواند صفحهٔ تنظیمات را بازآرایی کند در حالی که عامل دیگری برای بخش صورتحساب تست مینویسد.
Codex اکنون فراتر از نوشتن کد چه میتواند بکند
یک مدیر محصول میتواند بنویسد: «صفحهٔ آنبوردینگ را برای کاربران تازهوارد واضحتر کن. از آخرین تیکتهای پشتیبانی ما برای زمینه استفاده کن، متن را بهروزرسانی کن، صفحه را تنظیم کن و یک خلاصهٔ کوتاه آماده کن.» Codex میتواند زمینه را جمع کند، اپ را تغییر دهد، بررسیها را اجرا کند و خلاصه را تولید کند. انسان هنوز نتیجهٔ نهایی را تأیید میکند، چون محیط تولید نباید خانهٔ ارواح باشد.
Codex در برابر Claude Code، Cursor و Copilot
رقابت پیرامون کدنویسی عاملمحور شلوغ است. Claude Code سامانهٔ کدنویسی عاملمحور Anthropic است که یک کدبیس را میخواند، فایلها را ویرایش میکند، تستها را اجرا میکند و کدی Commitشده تحویل میدهد. Cursor بر یک ویرایشگر AI-first و عاملها در سراسر دسکتاپ، CLI، GitHub، Slack، Linear و JetBrains تمرکز دارد. GitHub Copilot یک عامل ابری دارد که میتواند یک مخزن را بررسی کند، در یک شاخه تغییر ایجاد کند و از یک Issue یا دستور چت یک Pull Request باز کند.
- OpenAI Codex بهسوی یک مرکز فرمانِ جریانکار و عامل در حرکت است. بهترین مورد استفادهٔ آن کار چندمرحلهای در سراسر کد، اپها، فایلها، مرورگرها و ابزارهای متصل است.
- Claude Code بر کدنویسی عاملمحور در سراسر کدبیسها متمرکز است. برای وظایف توسعهٔ مبتنی بر ترمینال، تغییرات کد، تستها و اجرا در سطح مخزن بهخوبی کار میکند.
- Cursor پیرامون یک تجربهٔ ویرایشگر بومیِ هوش مصنوعی ساخته شده است. برای توسعهدهندگانی که بیشتر روزشان را در ویرایشگر میگذرانند و کمک هوش مصنوعی نزدیک به کد میخواهند، تناسب بالایی دارد.
- GitHub Copilot در جریانهای کاری بومی GitHub قویتر است. با Issueها، شاخهها، Pull Requestها، بازبینی کد و کارهای مربوط به مخزن که از پیش در GitHub زندگی میکنند جور درمیآید.
آن حرکت بزرگتر بهسوی ابزارهای کدنویسی در خلأ رخ نمیدهد. ما آن را با جزئیات بیشتر در مقایسهٔ Claude Code با Codex بررسی کردیم، که نگاه میکند به اینکه چرا عاملهای کدنویسی هوش مصنوعی ناگهان همهجا هستند و چرا شرکتها اینقدر روی آنها شرط میبندند.
حرکت سازمانی OpenAI
OpenAI در حال گسترش شراکتها با Accenture، Capgemini، CGI، Cognizant، Infosys، PwC و Tata Consultancy Services است تا Codex را به شرکتهای بزرگ بیاورد. OpenAI همچنین Codex Labs را راهاندازی میکند که متخصصان OpenAI را داخل سازمانهای مشتری مستقر خواهد کرد تا Codex را در سیستمها و جریانهای کاری موجود یکپارچه کنند.
شرکتهای بزرگ «دموهای باحال» نمیخرند. آنها کار تکرارشونده، کنترلها، گزارشدهی و یکپارچگی با سیستمهای درهمی را میخرند که از سه بازسازماندهی و دستکم یک فایل Excel قهرمانانه جان سالم به در بردهاند. عاملهای فضای کاری Codex در همین مسیرند: آنها با Codex توان میگیرند، در ابر اجرا میشوند، از اپهای متصل استفاده میکنند و میتوان آنها را در ChatGPT یا Slack به اشتراک گذاشت.
ایمنی، سندباکس و بازبینی انسانی
قدرت بیشتر، کنترل بیشتر میخواهد. مستندات امنیتی Codexِ OpenAI میگویند عامل بهطور پیشفرض با دسترسی شبکه خاموش اجرا میشود. بهصورت محلی، Codex از یک سندباکس تحمیلیِ سیستمعامل استفاده میکند که معمولاً به فضای کاری کنونی محدود است، بهعلاوهٔ سیاستهای تأییدی که تعیین میکنند چه زمانی عامل باید پیش از عمل کردن اجازه بگیرد.
سندباکس تعیین میکند Codex به چه چیزهایی میتواند دست بزند. سیاست تأیید تعیین میکند چه زمانی باید مکث کند. ویرایشها و تستهای روتین میتوانند در این محدودیتها اجرا شوند. دسترسی شبکه، تغییرات بیرون از فضای کاری یا فراخوانی ابزارهای پرریسک میتوانند نیازمند تأیید باشند.
حافظه هم به حکمرانی نیاز دارد. تیمها باید قواعد لازم را در AGENTS.md یا مستندات ثبتشده در مخزن نگه دارند، نه فقط در فایلهای حافظه. اسرار نباید وارد حافظه شوند. یک قاعدهٔ خوب: بگذارید Codex ترجیحات را به خاطر بسپارد، نه گذرواژهها را.
تصویر بزرگتر
Codex بهسوی کار بومیِ هوش مصنوعی اشاره دارد: عاملهایی که در سراسر ابزارها، فایلها، پنجرههای مرورگر، پیامها، اسناد و کد عمل میکنند. Codex همچنین میتواند توسط غیرتوسعهدهندگان برای کارهایی مانند گردآوری اطلاعات، ساخت اسلاید، ساخت داشبورد، رفع مشکلات جریان کار، بهروزرسانی فایلها و خودکارسازی کارهای روتین استفاده شود.
اما این آینده هنوز به یک دوش آب سرد نیاز دارد. عاملهای هوش مصنوعی میتوانند دچار توهم شوند، زمینه را بد بفهمند، یک کار را بیش از حد لفظی اجرا کنند، یا تغییری انجام دهند که تا رسیدن به یک جریان کار واقعی خوب به نظر میرسد. هرچه ابزارهای بیشتری در دسترس یک عامل باشد، اهمیت بازبینی بیشتر میشود. یک اشتباه کوچک در یک پیشنویس آزاردهنده است. یک اشتباه کوچک در یک مخزن، داشبورد، یا جریان کار مشتری میتواند خیلی سریع گران تمام شود.
Codex دارد کمتر شبیه خودتکمیلی و بیشتر شبیه یک عامل تحتنظارت برای کار دیجیتال پیچیده میشود. میتواند عمل کند، به خاطر بسپارد، ابزارها را متصل کند و با خروجیها بازگردد. کار انسان این است که وظیفهٔ درست بدهد، نتیجه را بررسی کند و محافظها را محکم نگه دارد. این کمتر پرزرقوبرق از «هوش مصنوعی جایگزین توسعهدهندگان میشود» است، اما باورپذیرتر.