原子のための基盤モデル——ニューラルネットに「力」を覚えさせる
シリーズ 「凸包(The Convex Hull)」 第2回。第1回では、ある結晶が「安定」とは、DFT で計算した凸包(競合する全配置の下側境界)より下にあることだと見ました。問題は——DFT は正確だが、遅い。1つの結晶を解くのに大きな計算機で数分から数時間かかります。何百万もの候補をふるいにかけるには、絶望的に遅い。
今回は、その壁を破ったモデルの話です。
結晶は「グラフ」である
ニューラルネットに材料を読ませる、と聞くと難しそうですが、表現は素直です。結晶をグラフとして扱う——原子をノード、近くにある原子どうしの関係をエッジにする。すると、画像でも文章でもなく「グラフ上の予測問題」になります。
ネットに何を予測させるか。エネルギーと、各原子にかかる力です。
ここが肝心です。エネルギーだけでなく力(=各原子がどちらへ動きたいか)を出せると、ネットは単なる電卓ではなく、原子を実際に動かして構造を緩和できるようになります。物理では、力はエネルギーの傾き(勾配)です。だからエネルギーの地形を学んだネットは、その地形の傾きから力を読み取り、原子を谷へ転がせる。こうして「DFT を高速に近似する道具」=機械学習原子間ポテンシャル(MLIP) が生まれます。速度はおおむね DFT の千〜一万倍。ふるい分けには、これで十分です。
「原子のための基盤モデル」——LLMと同じ手口
2022年以降の本当の転換は、ここからです。
昔は、材料ごと・系ごとに専用のポテンシャルを作っていました。新しい転換は——周期表の広い範囲を1つのネットでカバーする「普遍ポテンシャル」を、巨大なDFTデータで事前学習すること。これは、あなたがLLMで知っている手口そのものです。大きな固定コーパスで事前学習し、未知へ汎化させ、そして分布シフトを心配する。違うのは中身が言語でなく原子だという点だけ。
具体例を挙げます(すべて実在の研究):
- M3GNet(Chen & Ong, 2022, 論文「A Universal Graph Deep Learning Interatomic Potential for the Periodic Table」)。Materials Project が10年かけて積んだ構造緩和データで学習し、3100万個の仮想結晶をふるって約180万個の候補を拾い上げました。さらに上位2000個のうち1578個がDFTで安定と確認——「速いふるい」が実際に機能した証拠です。
- MACE-MP(Batatia ら)。より高次の同変メッセージパッシング(結晶を回転させても予測が整合的についてくる仕組み)を使う普遍ポテンシャルで、89元素・160万結晶(MPの緩和軌跡 MPTrj)で学習されています。
LLMの読者なら、ここで「あ、これ同じ構造の話だ」と気づくはずです。固定された参照コーパスで事前学習した基盤モデル、汎化と分布シフトの同じ問い——アーキテクチャ(グラフニューラルネット)も認識論もLLMと地続きです。神経科学の直観で言えば、オフラインで訓練したデコーダがオンラインで劣化する、あの現象の三度目の再演です。
ただし——罠もLLMと同じ
ここで背骨に戻ります。DFT の答えを完璧に当てるモデルは、シミュレータを学んだのであって、現実を学んだのではありません。
機械学習ポテンシャルが学ぶ「正解」は、第1回で見たとおり DFT が計算した値です。だからモデルは、訓練した参照(DFT)の良さ以上には正確になれない。参照が外す領域(バンドギャップや強相関系)では、どれだけ精度よくDFTを再現しても、現実とはずれます。「モデルがDFTと一致した」は「現実と一致した」ではない——この一段を飛ばすと、speed の数字に酔って、何を達成したのか見失います。
もう一つ、正直な但し書き。万能の勝者はいません。形成エネルギーが得意なポテンシャル、緩和後の構造が得意なポテンシャルは別だったりします。速いネットは**トリアージ(ふるい分け)**であって最終判定ではない。最後はやはりDFTが、そして究極的には実験が確かめます。
まとめ、そして次回
第2回の要点。結晶をグラフとして読み、エネルギーと力を予測する基盤モデルが、DFTを千〜一万倍速く近似し、何百万もの候補をふるえるようになった。手口はLLMと同じ(事前学習・汎化・分布シフト)、そして罠も同じ(参照を学んだだけで現実ではない)。
ここで自然な疑問が立ちます。これだけ高速にふるえるなら——何百万個も「凸包より下」の材料を予測できるなら、その「下」は本当に「現実の新材料」を意味するのか? 第3回は、このシリーズの山場です。2023年、ある研究が「人類が知る安定材料を一桁増やした、220万個」と発表しました。そして材料化学者たちが、実際に中身を見にいった。何が見つかったか——次回に。
この記事はAIが下書きし、人間が編集・公開しています。