AIエージェントを長時間動かし続け、複数のタスクや大量の情報をまたいで作業させる――そんな未来に向けて、Anthropicのエンジニアリングブログが「長時間実行エージェント」の課題と、その解決に向けた新しいアプローチを紹介しました。人間のソフトウェアエンジニアの働き方からヒントを得た「より効果的なエージェントの枠組み(ハーネス)」が提案されています。
長時間動作するAIエージェントが直面する課題
複数のコンテキストウィンドウをまたぐと何が難しいのか
現在の大規模言語モデルは、一度に扱える「コンテキストウィンドウ」のサイズに限りがあります。単発のチャットであれば問題になりにくいものの、長時間にわたってコードを書き換えたり、プロジェクトを継続的に改善したりする「長時間実行エージェント」の場合、次のような問題が生じやすくなります。
- 過去の作業内容を十分に覚えておけない
- 古い決定や方針と矛盾した行動を取ってしまう
- タスクが長引くほど、文脈の再構築にコストがかかる
結果として、エージェントが長時間動くほど効率が落ちたり、バグの温床になったりしやすいという問題があります。
従来の「一問一答型」利用からの脱却
多くの開発現場では、AIは「一問一答型」で使われることが一般的です。例えば「この関数をリファクタリングして」と頼んで、その応答だけを使うという形です。しかし大規模な開発や運用では、次のようなニーズが高まっています。
- エージェントに長期間プロジェクトを任せ、継続的に改善してほしい
- 複数のファイルやサービスをまたぐ大きな変更を、自律的に計画・実行してほしい
- 中断や再開をしながらも、一貫した方針で作業を続けてほしい
こうしたニーズに応えるには、単に「賢いモデル」を用意するだけでなく、エージェントをどう設計し、どう動かすかという「ハーネス(枠組み)」が重要になります。
人間エンジニアから学ぶ「エージェントハーネス」の発想
人間はどうやって長期的な開発を管理しているのか
Anthropicのエンジニアリングブログでは、長時間稼働するAIエージェントの設計にあたり、「人間のソフトウェアエンジニアが現場で実際に何をしているか」をヒントにしています。人間エンジニアは、次のような仕組みを使って長期的な開発を進めています。
- チケット管理ツール(Jira、GitHub Issuesなど)でタスクを細分化・記録する
- バージョン管理(Git)で変更履歴を追跡し、過去の決定を振り返る
- 設計ドキュメントやコメントで背景や意図を共有する
- コードレビューで品質と一貫性を担保する
つまり、人間は「すべてを頭の中だけで覚えている」わけではなく、外部のツールやプロセスを活用して、長期的な文脈や意図を維持しているのです。
エージェント専用の「外部記憶」とワークフロー
Anthropicが紹介する新しいエージェントハーネスは、こうした人間のやり方をAIエージェントに応用する考え方です。ポイントとなるのは、「モデルのコンテキストウィンドウの中だけですべてを解決しようとしない」設計です。
- エージェント用の外部メモリやログを用意し、重要な決定や方針をそこに明示的に保存する
- タスクを細かく分解し、それぞれを独立した「作業単位」として記録・再利用できるようにする
- エージェントが自分の過去の行動を振り返りながら、次のステップを計画できるようにする
これにより、コンテキストウィンドウの制約を超えて、より長期的で一貫した作業が可能になると期待されています。
開発者・企業にとってのメリットと応用シナリオ
ソフトウェア開発現場での実践的な使い道
Anthropicの取り組みは、単なる研究ではなく、開発現場での具体的な活用を意識したものです。長時間実行エージェントが安定して動くようになれば、次のようなシナリオが現実味を帯びてきます。
- 大規模リポジトリ全体のコード品質チェックと段階的な改善
- レガシーコードの長期的なリファクタリングプロジェクトの支援
- 継続的なテスト作成・更新と、自動バグレポートの生成
- ドキュメントの常時アップデートや多言語展開の自動化
企業にとっては、開発チームの生産性向上だけでなく、ナレッジの継承や保守コストの削減といった長期的なメリットも期待できます。
「人間+エージェント」の新しい協業スタイル
人間のエンジニアとAIエージェントが協力する前提に立つと、役割分担も見えてきます。
- 人間:仕様策定、優先順位付け、最終レビュー、難しい設計判断
- エージェント:タスク分解、コード修正案の作成、繰り返し作業、ログの整理
Anthropicの提案するエージェントハーネスは、こうした協業を前提に、エージェントが「信頼できる長期的なパートナー」として機能するための土台作りと言えます。
一次情報・参考リンク
まとめ
Anthropicのエンジニアリングブログで紹介された取り組みは、「コンテキストウィンドウの制約」という技術的な限界に正面から向き合い、人間エンジニアの実務から学ぶことで、長時間動作するAIエージェントの現実的な道筋を示そうとするものです。今後、こうしたエージェントハーネスの設計手法が広がれば、開発現場でのAI活用は「一問一答」から「長期的な協業」へと、大きく進化していく可能性があります。




