OpenAIは金曜日に、ソフトウェアエンジニアリング専用の新しいエージェントCodex(2021年に開始された最初のバージョンのCodexとは異なる)を発表しました。Operator(ウェブナビゲーション)やDeep Research(情報統合)に続くこのエージェントは、コード生成、バグの検出と修正、テストの作成、プルリクエストの作成など、特定のプログラミングタスクを自動化するために設計されています。
従来のコードアシスタンスシステムが提案や補完に留まるのに対し、このエージェントはより自律的に動作します。タスクは、ユーザーから提供された技術的なコンテキスト(特にコードリポジトリの内容)で設定されたクラウドベースの隔離環境で実行されます。これにより、エージェントは複雑な操作を順次または並列に行い、内部検証のレベルを確保します。例えば、コードを実行し、結果を分析し、自身の変更を調整し、プルリクエストのような出力ドキュメントを生成することができます。
この機能はcodex-1というモデルに基づいており、OpenAIの内部コミュニケーションでは「o3」として参照されている推論モデルGPT-4の派生です。このモデルは、読みやすく、プロジェクトのスタイルに一致し、ベストプラクティスに従ったコードを生成することを目的として、ソフトウェア開発のシナリオにおける強化学習を通じて特別に調整されました。
機能と利用可能性
CodexはChatGPTのサイドバーからアクセス可能です(Pro、Team、Enterpriseプランのユーザー向け)。2つの主要なエントリが提供されています:
「Code」はタスク(実装、修正など)の実行を依頼するためのものです
「Ask」は既存のファイルや構造(関数、クラス、依存関係など)についてエージェントに質問するためのものです
実行に必要な時間はタスクの複雑さに依存し、OpenAIによれば数分から30分程度です。Cisco、Superhuman、Temporal、Kodiakを含むいくつかの企業が、レガシーコードのメンテナンス、自動化されたテストの生成、プロジェクトのドキュメント化などの実際の使用例でこのツールを試験しています。
このサービスは現在、支払い済みの加入者に限定されており、「Plus」プランのユーザーへの拡張が後日に予定されています。
Pour mieux comprendre
ソフトウェアエンジニアリングにおいて、クラウドベースの孤立環境を使用することの規制とコンプライアンスに関する潜在的な影響は何ですか?
クラウドベースの孤立環境の使用は、特にデータの安全性やGDPRのようなデータ保護基準の遵守に関する規制上の懸念を引き起こします。企業は、クラウドホスティングの実施がこれらの規制に合致していることを確認する必要があります。
強化学習でcodex-1モデルを微調整することが、ソフトウェア開発のパフォーマンスをどのように向上させますか?
強化学習でcodex-1モデルを微調整することで、モデルはそのエラーから学び、動的に調整することができます。これにより、一貫してコードを生成する能力が高まり、現代の開発実践と一致しながら、プログラミングタスクの理解と実装における正確性が向上します。