Metaは、人間の脳が視覚や聴覚の刺激にどのように反応するかを高精度に予測する基盤モデル「TRIBE v2(Trimodal Brain Encoder)」を発表しました。700人以上・500時間超のfMRI(機能的MRI)データを学習したこのモデルは、新しい被験者や言語、タスクに対してもゼロショットで脳活動を推定できるとされ、脳科学とAIの融合を一段と前進させる技術として注目されています。
TRIBE v2とは何か
「Trimodal Brain Encoder」という新しい基盤モデル
TRIBE v2は「Trimodal Brain Encoder」の名が示す通り、複数のモダリティ(視覚、聴覚など)にまたがって人間の脳活動をエンコード(数値表現)するために設計された基盤モデルです。Metaによれば、このモデルは人が「ほぼあらゆる光景や音」を体験したときの脳の反応を予測することを目指して訓練されています。
Algonauts 2025 受賞アーキテクチャをベースに進化
TRIBE v2は、脳活動の予測精度を競う国際コンペティション「Algonauts 2025」で受賞したアーキテクチャをベースに開発されています。従来モデルの構造や学習手法を引き継ぎつつ、データ規模や汎用性、ゼロショット性能などの面で大きく強化された「第2世代」の脳エンコーダーモデルと位置づけられています。
700人・500時間分のfMRIデータを活用
モデルの学習には、700人以上の被験者から収集した、合計500時間を超えるfMRIデータが用いられています。fMRIは脳内の血流変化を計測することで、どの領域がどのタイミングで活動しているかを推定する手法です。多数の被験者データを統合して学習することで、「個人差」をある程度吸収しつつ、人間一般に共通する脳活動パターンのモデル化を目指しています。
ゼロショット予測がもたらす可能性
新しい被験者にも追加学習なしで対応
TRIBE v2の特徴としてMetaが強調しているのが、「ゼロショット予測」の能力です。これは、モデルの学習に参加していない新しい人の脳活動であっても、追加学習を行わずに刺激に対する反応をある程度予測できるという意味です。これにより、従来は一人ひとりに対して多くの実験データを収集しなければならなかった脳活動研究のハードルが、大きく下がる可能性があります。
言語やタスクが変わっても汎用的に機能
Metaは、TRIBE v2が新しい言語やタスクに対しても汎用的に脳活動を予測できると説明しています。たとえば、モデルの学習時には扱っていなかった言語の音声や、異なる種類の認知タスクを提示した場合でも、その刺激に対して脳がどのように反応するかを推定できる、というイメージです。この汎用性は、将来的に多言語環境やさまざまな実験条件での脳研究を加速させる要因となりうるでしょう。
「デジタルツイン」としての脳活動モデル
MetaはTRIBE v2を、人間の脳活動を模倣する「デジタルツイン」として位置づけています。実際の被験者に刺激を与えてfMRIを測定しなくても、モデル上で脳の反応をシミュレーションできれば、実験コストや時間を大幅に減らせます。さらに、AIモデルが内部でどのように情報を表現しているのかを、人間の脳活動との対応関係から探る「AIの可視化・理解」にも応用できると期待されています。
研究・産業分野での活用イメージ
神経科学・心理学研究の加速
こうした脳活動予測モデルは、神経科学や心理学の基礎研究を大きく前進させる可能性があります。大量の実験を行う前に、AIモデル上で「予行演習」を行い、仮説を絞り込んでから実測することで、研究の効率化や新しい発見につながることが期待されます。視覚認知、言語理解、音楽や環境音への反応など、幅広いテーマでの活用が考えられます。
ブレイン・コンピュータ・インターフェース(BCI)への応用
TRIBE v2のようなモデルは、脳信号を直接読み取りコンピュータと接続する「ブレイン・コンピュータ・インターフェース(BCI)」技術の基盤にもなりえます。たとえば、音や映像に対する脳の反応を高精度に理解できれば、将来的には「頭の中でイメージしたことをスクリーンに再構成する」といった研究の精度向上にも寄与すると考えられます。ただし、そのような応用には技術面・倫理面で多くの課題が残されています。
AIモデルの理解と安全性向上への寄与
人間の脳が情報を処理する仕組みと、AIモデル内部の表現の対応関係がより明らかになれば、「AIはなぜその判断をしたのか」を説明しやすくなります。TRIBE v2のような脳活動エンコーダーは、AIの判断過程を人間の認知プロセスと比較するためのツールとしても機能しうるため、透明性や安全性の高いAI設計につながる可能性があります。
今後の展開と課題
個人差や倫理的課題への向き合い方
脳活動を扱う研究では、プライバシー保護や「思考の読み取り」への懸念など、倫理的な課題が常に伴います。TRIBE v2のような高性能モデルが登場するほど、データの匿名化や利用目的の明確化、同意の取り方などが一層重要になります。また、モデルが「一般的な人間の脳」を表現しているとしても、年齢や文化、神経多様性などによる個人差をどこまで取り込めるのかという点も、大きな研究テーマとなるでしょう。
オープンなデモ公開とコミュニティの役割
Metaは、TRIBE v2のデモを公開し、詳細情報を紹介するページも用意しています。研究者や開発者が実際に試せる環境を整えることで、コミュニティ全体でモデルの性能評価や応用可能性の検証が進むことが期待されます。今後、学術論文や追加データセット、ベンチマークの公開が進めば、脳とAIの関係性を探る国際的な研究がさらに活発になるでしょう。
まとめ
TRIBE v2は、人間の脳活動を「デジタルツイン」として再現しようとする野心的な基盤モデルであり、大規模なfMRIデータに基づくゼロショット予測という点で新しい地平を切り開こうとしています。一方で、個人差への対応や倫理的なガイドラインの整備など、解決すべき課題も少なくありません。脳科学とAIの最前線に位置するこの試みが、今後どのような知見と応用を生み出すのかが注目されます。



