MolGXは、ユーザーが望む性質を持つような分子構造をAIにより自動的にデザインする技術です。色や硬さ、水溶性や電気伝導性といった材料の性質は、材料を構成する分子の構造によって決まります。分子は酸素や炭素など原子の組み合わせによって構成されているので、その構成を組み替えることで分子のもたらす性質を制御することが出来ると言えます(
)。しかし118種類もある原子によって構成できる分子のパターンはほぼ無限にあるため、人間の専門家がすべてを試しながら性質を確認することはほぼ不可能です。そこでAIの「生成モデル」という技術により、自動的に分子をデザインすることを考えます。生成モデルはディープ・ラーニングを中心に、画像の自動生成や自動翻訳におけるテキスト生成などで幅広い実用化が進んでいるAI技術です。分子構造を表記するSMILESという文法表現(例えば、エタノールの分子は ”CCO”、カフェインの分子は” CN1C(=O)N(C)c2ncn(C)c2C1(=O)”と表記されます)を学習したテキスト生成モデルにより、様々な分子構造をデザインするのが昨今の技術トレンドです[
に示しています。ここで注意したいのは、表現力の豊かなディープ・ラーニングは、画像やテキストといったデータの自由度が高い(例:あるピクセルの周辺のピクセルがどんな色でも良い)分野では生成モデルとして強力なのですが、分子構造のように自由度が低く、規則が明示的に決まっている(例:酸素原子に結合できる原子は2つまで)分野では、必ずしもディープ・ラーニングが最良の技術とは限らないという可能性です。またディープ・ラーニングは、その高い表現力を獲得するために膨大なデータや豊富な計算資源による長時間の事前学習が必要で、なおかつ中身がほとんどブラックボックスのため、生成される分子構造に「水酸基の数は2つ以下、
図4:分子生成モデルの一般的な模式図
こういった事情を考慮し、MolGXは構造をデザインする機能にあえてディープ・ラーニングを用いず、原子や部分構造を効率よく連結させることで分子を組み上げる、グラフ理論による数理アルゴリズムを採用しました[
5]。これにより様々な分子構造を高速(10~100個/秒)かつ、ユーザーの注文に応じた柔軟性をもってデザインすることができます。一方で、ディープ・ラーニングが材料の性質予測(予測モデル)に優れていることは事実であり、またこの予測モデル部分の学習は、構造デザイン機能の事前学習ほど多くのデータを必要としません。したがってMolGXは、性質の予測機能には、他の機械学習モデルとあわせてディープ・ラーニングも選択できる仕様となっています。このように、MolGXはグラフ理論の得意とする分子グラフ生成と、ディープ・ラーニングの得意とする物性予測を併せ持つ、ハイブリッドのソリューションとなっています。
MolGXは、生成モデルとしてのパフォーマンスが高いのみならず、様々な分野に応じたデザイン(主骨格構造を保ったデザイン、対称性や周期性を取り込んだデザインなど)、ポリマーの重合条件や物性値の測定条件といった補助的な数値のモデル化、データのマスキングなど、材料デザインの実務で必要となる数多くの周辺機能を備えた、実用向けのソリューションとして開発されました。MolGXは、Discovery Acceleratorプラットフォーム[
6]など様々な手段を通じて、これまで多くのお客様にご提供させて頂いています。
4. 共創の時代へ2021年3月、東京基礎研究所はMolGXの一部の機能を、体験版のwebアプリケーションとして一般公開しました[
7,
8 ,
9]。このwebアプリは、東京大学の五月祭など様々なイベントでも活用されています[
10]。このような技術公開の背景には、急速に発達するAIやマテリアルズ・インフォマティクスの利用体験を社会の幅広い層の方に易しいインターフェースで提供することで、科学技術への興味や参加を促したいという狙いがあります。かつて最新の科学技術は、高度な専門スキルを身につけた一部の専門家のみが関わるものでしたが、webによる様々な教育・コミュニケーションツールが登場した今日、それぞれのスキル・レベルに応じてアクセスできる技術の種類が増えてきました。これにより、特にソフトウェアの分野では職業やスキルの壁を超えたコミュニケーションによる、オープンな技術開発が進んでいます。MolGX webアプリは、そのようなオープン・サイエンスの文化をマテリアルズ・インフォマティクスの分野で実現しようとするものです。
半導体のスケーリングや量子ビットの増加、新たなAIアルゴリズムの登場といったコンピュータ技術の発展は今後も止むことはありませんが、いつの時代も異分野間に渡る幅広いコミュニケーションがその発展のドライバーでした。人と人、人とコンピュータのコミュニケーションによりイノベーションが加速する共創的な社会の中で、Future of Computing(次世代コンピューティング)技術は、材料分野を越えて、創薬、医療、様々な産業デザインや建築デザイン[
11]といった分
野に適用され、より豊かな世界を創り上げてゆくでしょう。
参考文献
[1] 「IBM 5 in 5:新たな材料の発見プロセスの大幅な加速によって実現する持続可能な未来」Think Blog Japan (2020)
https://www.ibm.com/blogs/think/jp-ja/ibm-5-in-5-accelerating-process-of-discovery/[2] “Science and Technology Outlook 2021”, IBM Research (2021)
https://research.ibm.com/downloads/ces_2021/IBMResearch_STO_2021_Whitepaper.pdf[3] Project Photoresist, IBM Research (2021)
https://research.ibm.com/interactive/photoresist/[4] “Deep learning for molecular design—a review of the state of the art”, D. C. Elton, et al., Molecular Systems Design & Engineering, 4, 828 (2019)
[5] “Molecular Inverse-Design Platform for Material Industries”, S. Takeda, et al., KDD 2020.
[6] “The Discovery Accelerator comes to Europe”, IBM Research Blog
https://research.ibm.com/blog/stfc-discovery-accelerator[7] IBM Molecule Generation Experience web application
https://molgx.draco.res.ibm.com/[8] “Molecule Generation Experience: An Open Pla5orm of Material Design for Public Users”, S. Takeda, et al., arXiv:2108.03044
[9] 「あなたも自宅で新物質をデザイン!“IBM Molecule Generation Experience”が起こす革新とは」 Mugendai(無限大)
https://www.ibm.com/blogs/think/jp-ja/mugendai-13334-column-ibm-molecule-generation-experience/[10] 「化合物を新発見?!」東京大学 五月祭ホームページ
https://gogatsusai.jp/94/visitor/kikaku/587[11] 「物質と創造の果てへ」武田征士、建築討論(2021)
https://medium.com/kenchikutouron[著者]
武田征士 Seiji Takeda日本アイ・ビー・エム株式会社 東京基礎研究所 チームリーダー
Accelerated Material Discoveryリーダー。海外ラボと共に、国内外のマテリアルズ・インフォマティクス関連のプロジェクトを数多く手掛ける。2010年慶應義塾大学大学院博士課程修了。博士(工学)。人工知能学会現場イノベーション金賞など受賞。
*ProVISION 記事一覧はこちらから
IBM、IBMロゴは、米国やその他の国におけるInternational Business Machines Corporationの商標または登録商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、ibm.com/trademarkをご覧ください。