こんにちは!AX研究室のロベルト・フバチです。
今回は、機械学習(Machine Learning)を活用した実験計画のテーマについて少し紹介したいと思います。
科学や技術の発展により、私たちは興味のある現象やプロセスをより深く理解するために、ますます多くの実験を行う必要があります。実験の結果には、その実験条件を決めるさまざまな要因(因子)が影響します。たとえば、化学反応の進行には次のようなパラメータが関係します:圧力, 温度, 触媒の種類, 物質の濃度, 撹拌速度, 溶媒の種類, 固体物質の粒度. つまり、化学反応を調べる場合でも、結果に影響を与える要因は7つもあります。それぞれの要因について「低い」「高い」の2つの条件だけを試すとしても、組み合わせは 2⁷ = 128 通り、つまり128回の実験が必要になります。このような実験計画は、時間もコストも非常にかかります。
そこで、研究者たちはより少ない実験回数で信頼できる知見を得るための方法を開発しました。その代表例が「品質工学(田口方法)」です。この方法を使うと、7つの因子それぞれに2つの水準(例:低温/高温)がある場合でも、128回ではなくわずか8回の実験で十分な情報を得ることができます。このように、うまく設計された実験計画は、時間と材料を節約し、発見を加速させることができます。
品質工学は統計に基づいた伝統的な実験計画法ですが、近年では機械学習を用いた新しいアプローチも広く使われています。その一つが「アクティブラーニング(Active Learning)」です。これは、コンピュータが自ら「どの実験を追加で行えば効率よく学習できるか」を判断してくれる手法です。そして、このアクティブラーニングの一種として「ベイズ最適化(Bayesian Optimization)」があります。ベイズ最適化では、コンピュータが過去の実験結果から学び、次に試すべき最も有望な条件を自動的に提案してくれます。
実験計画におけるベイズ最適化
ベイズ最適化は、実験の結果を最大限に良くするための最適な条件を見つける手法です。たとえば化学反応の実験では、反応物の反応率が最も高くなるような温度や濃度、圧力などの条件を見つけることが目的になります。
ベイズ最適化を用いた実験計画は、次のような手順で進められます。
1. 初期実験の実施
まず、対象となる系についての知識を得るために、いくつか異なる実験条件(例:温度、濃度、撹拌速度など)を選び、測定(実験)を行います。
2. モデルの構築(代理モデル / Surrogate Model)
得られたデータに基づいて、最適化アルゴリズムが実験条件と結果の関係を近似的に表す「代理モデル(サロゲートモデル)」を構築します。
このモデルは、未知の条件下での結果を予測できるだけでなく、その予測の確実性(不確かさ)も同時に推定します。これにより、次にどの条件で実験を行うべきかを効果的に決定できます。
3. 次の実験条件の選択
次に最適化アルゴリズムは、モデルの予測が最も有望な領域、または不確実性が最も大きい領域を選びます。これにより、システムは最も効率的に新しい情報を学習し、モデルの精度を高めていきます。
4. 反復的な改善
新しい実験から得られた結果を使って代理モデルを再学習し、さらに最適な条件に近づけていきます。このプロセスを繰り返すことで、コンピュータは最終的に実験の最良条件を見つけ出します。

図1.これらのグラフは、ベイズ最適化(Bayesian Optimization) の仕組みを示しています。
図1には、ガウス過程(Gaussian Process, GP)モデルを用いたベイズ最適化の動作例を示しています。この場合、ガウス過程は代理モデル(サロゲートモデル)として機能し、未知の目的関数(たとえば化学反応の収率など)を近似します。ベイズ最適化の目的は、この関数の最大値を見つけることです。
説明のために、図1の上部グラフでは未知の関数の形状を黒い破線で示しています。実際の関数の形は未知ですが、実験を行うことで部分的に知ることができます。
最初の段階では、いくつかの異なる実験条件(ここでは単一のパラメータ x で表現)を選び、それぞれで測定を行います。得られた測定結果は、図1上部の赤い点で示されています。
次に、ガウス過程モデルはこれらの測定結果に基づき、未知の関数の形を近似します。
予測された関数の値は青い線で示され、青く塗られた領域は予測の不確実性(±1.96標準偏差)を表しています。
図1の下部には、期待改善法(Expected Improvement, EI)によって計算された獲得関数(acquisition function)が示されています。このEI法は、予測値と不確実性の両方を考慮して、次に実験を行うべき点を判断します。その最大値は x = 0.47 にあり、次に実験を行うべき点として選ばれます。この点が未知の関数の最大値付近にあることから、ベイズ最適化が効果的に有望な領域へ実験を導いていることが分かります。
ガウス過程は、予測の不確実性を自然に推定できるため、ベイズ最適化で最もよく使われる代理モデルの一つです。しかし、これが唯一の方法ではなく、ニューラルネットワークや他の機械学習手法を用いることも可能です。
このようなベイズ最適化やアクティブラーニングといった手法を用いた実験計画は、次に行う実験を自動的に選択することを可能にします。これにより、実験を自律的に計画・実行し、結果から学習する自動運転型ラボ(Self-Driving Labs)との統合も容易になります。このようなアプローチは、従来の手法に比べてはるかに高速かつ効率的に、新しい材料や化学プロセスの発見を加速させる可能性を持っています。
まとめ
ベイズ最適化やアクティブラーニングといった現代的な実験計画法を用いることで、コンピュータは自ら次に行うべき最も有望な実験条件を選択できるようになります。その結果、必要な実験回数を大幅に減らすことができ、未知の現象を発見するプロセスをより速く、そして低コストで進めることが可能になります。さらに、これらの手法を自律型ラボと組み合わせることで、機械が人間の関与なしに実験を計画・実施・解析する、完全に自動化された研究の実現へとつながります。(理化学研究所のSeM)



