ClaudeのDreaming機能がAIエージェントの学習方法を根本から変える

AI

眠っている間に賢くなる、その発想

人間は眠っている間に記憶を整理し、翌日の判断に活かします。Anthropicが発表した新機能「Dreaming」は、まさにその仕組みをAIエージェントに持ち込もうとするものです。4月に公開されたClaude Managed Agentsプラットフォームに追加されたこの機能、一見ユニークな命名に見えますが、その中身は思ったよりずっと実用的です。

Dreamingは非同期ジョブとして動作します。既存のメモリストアと過去最大100セッション分のログを読み込み、重複や陳腐化した情報を取り除き、整理された新しいメモリを生成します。元のメモリは上書きされず保持されるので、実験的に試しやすい点も開発者にとってはありがたいところでしょう。繰り返し発生しているエラーパターンや、うまくいったワークフローを横断的に検出し、次のセッションに橋渡しする仕組みです。現在はClaude Opus 4.7とClaude Sonnet 4.6が対応しており、課金は通常のAPIトークン価格に従います。

評価者を分離するという発想の鋭さ

同時にパブリックベータへ移行したOutcomesは、エージェントの出力を検証する仕組みです。開発者があらかじめルーブリック、つまり「CSVファイルに数値が入った価格列が含まれている」といった具体的な成功基準を文書で定義しておき、エージェントとは独立した別の評価者(grader)がその基準に照らして結果を確認します。

ここで注目したいのは、評価者がエージェントの推論過程に引きずられないよう、独立したコンテキストウィンドウで動作する点です。自己採点では甘くなりがちという問題をシステム設計で封じています。基準を満たさなければ、graderが不足点を特定し、エージェントは最大3回(上限20回まで設定可能)修正を試みます。反復と検証のループが自動で回る仕組みです。

20体のエージェントが並列で動く世界

Multiagent Orchestrationもパブリックベータに昇格しました。リードエージェント(コーディネーター)が複数の専門エージェントの作業を管理する構成で、各エージェントは独立したスレッドと専用のコンテキスト、モデル、システムプロンプト、ツールを持ちつつ、ファイルシステムは共有します。コードレビューとテスト作成を別々のエージェントに同時に割り振るといった並列処理が可能で、最大20エージェント、25スレッドの同時実行をサポートします。

複雑なタスクを分解して専門化したエージェントに任せるというアプローチは、大規模な業務自動化を視野に入れていることは明らかです。コーディネーターがどこまで賢く振り分けられるかが実運用での鍵になりますが、アーキテクチャとしての方向性は理にかなっています。

研究プレビューという段階が意味するもの

Dreamingは現時点でリサーチプレビューとして提供されており、利用にはAnthropicのウェブサイトからフォームでアクセスを申請する必要があります。OutcomesとMultiagent Orchestration、そしてMemoryはパブリックベータとして既に試せる状態です。

過去のセッションから学び、出力を自律的に検証し、複数のエージェントが分業しながら動く。AIエージェントが単なる「賢いチャットボット」から、反復作業に耐えうる実務ツールへ変わろうとしている転換点に、私たちは立っているのかもしれません。Dreamingという名前は詩的に見えて、その本質は徹底した実用主義です。

タイトルとURLをコピーしました