ProVISION

次世代コンピューティング技術によって拓かれる新素材発見の近未来(vol97-0019-futuretech)

By IBM ProVISION posted 24 days ago

  
Nomura-san.jpg 武田征士
Seiji Takeda
日本アイ・ビー・エム株式会社
東京基礎研究所
チームリーダー
Accelerated Material Discoveryリーダー。海外ラボと共に、国内外のマテリアルズ・インフォマティクス関連のプロジェクトを数多く手掛ける。2010年慶應義塾大学大学院博士課程修了。博士(工学)。人工知能学会現場イノベーション金賞など受賞。

環境問題やエネルギー問題など地球規模の差し迫った課題に取り組むために、IBM リサーチは各国のラボ横断で、新素材発見のための次世代コンピューティング技術の開発に注力しています。AI、ハイパフォーマンス・コンピューター、量子コンピューターをハイブリッドクラウド上で連携させることで、例えば工場から排出された二酸化炭素を分離・回収するポリマー薄膜といった様々な新素材を、これまでの10分の1の時間とコストで開発することを目指します。本稿では、このAccelerated Material Discovery(加速する新素材発見)の取り組みについて、東京基礎研究所のAI分子デザイン技術 IBM MolGXを中心にご紹介します。

1. 背景
人類の歴史を振り返ると、新しい性質をもつ材料(新素材)はいつの時代でも産業や文明を大きく飛躍させる駆動力して、私達の住む世界そのものを創り上げてきました。生活に欠かせないPCやスマートフォンの中で動作する、トランジスター、タッチパネル、ディスプレイ、バッテリーといったすべての素子が、半導体、導電性ポリマー、液晶、リチウムイオン電池といった、優れた性質を持つ新素材の発見や発明によってもたらされました。手に入る素材のバリエーション次第で、様々な工業製品の機能バリエーションから、産業や文明が発展するスピードや方向性、そして世界のあり方が大きく変わると言えます。
 今日その世界は、工場や発電所から排出される二酸化炭素(CO2)を大きな原因とする気候変動や、プラスチップごみによる環境汚染、人口急増にともなう食糧やエネルギーの供給不足、そして未知のウィルスや病原菌など、数多くの差し迫った問題に直面しています。IBM リサーチは、かつてない優れた性質をもつ新素材――例えば二酸化炭素を吸着するポリマー、生分解性の高いペットボトル、環境毒性の低いフォトレジストなど――の開発がこれらの問題を解く鍵であると考えています[1]。しかし新素材を開発するためには、一般には10年以上の歳月と、100億円程度の投資が必要とされています。そこで私達は、最先端のコンピューティング技術を組み合わせることで、新素材の発見・発明(「新素材のデザイン」ともいいます)にかかるコストと期間を10分の1以下に削減することを大きな戦略目標として掲げ、グローバル共同で取り組んでいます。

2. Accelerated Material Discovery – 次世代コンピューティング技術による素材開発
IBMリサーチは、ハイパフォーマンスコンピューター、AI、量子コンピューターをハイブリッドクラウド上で統合し、それらをもとに様々な分野へ向けたテクノロジーを開発する「Future of Computing(次世代コンピューティング)」という戦略を掲げています。その背景にあるのは、世界は成熟したコンピューティング技術を組み合わせることで、科学的発見を大幅に加速する「Accelerated Discovery(発見の加速)」の時代へ突入してゆくというビジョンです[2]。そして材料分野では、これを特に「Accelerated Material Discovery」と呼んでいます。
Accelerated Material Discovery(以降、AMDと略)は、4つのコア技術からなります(図1)。それは、(1)大量の文献から情報を自動的に抽出する「ディープ・サーチ(Deep search)」、(2)物理化学計算をAIによって高速かつ効率よく実施する「AI強化シミュレーション(AI-enriched simulation)」、(3)分子レベルの材料構造をAIによりデザインする「生成モデル(Generative model)」、そして(4)クラウド上でコントロール可能なロボット・ラボで化学実験・合成をする「自動実験ラボ(Autonomous Lab)」です。IBMリサーチは、これら4つのコア技術を、AMDの主要な拠点:米ヨークタウン、米アルマデン、チューリッヒ、イギリス、そして東京の5つのラボで分担・連携しながら開発を進めています。
図1:Accelerated Material Discovery (AMD)の4つのコア技術

AMDは、材料分野に応じてテクノロジーをカスタマイズしながら、お客様から頂いた課題や、IBMの化学者が定義したサステナビリティーに関する新素材の課題に取り組んできました。その1つの事例がフォトレジスト材料です[3]。フォトレジストは私たちの生活を支える半導体の微細加工(リソグラフィ)に欠かせない物質ですが、その環境毒性のために近年では世界的な規制対象となりつつあります。そこで私達は、従来のフォトレジストと同程度の光感作用を保ちつつ、毒性の低いフォトレジスト材料のデザインに取り組みました。まずディープ・サーチによりフォトレジストに関する米国特許約6,000件からデータを抽出し、そこで足りない物性値の情報をAI強化シミュレーションによって補完し、データ・セットを作成しました。このデータ・セットを用いて東京のAI分子生成モデル「IBM Molecule Generation Experience (以降、MolGXと略)」を学習させ、フォトレジストとして望ましい5種類の特性(例:光吸収波長、毒性、生分解性など)について目標値をセットし、デザインを実行したところ、約6時間で3,000個以上ものフォトレジスト材料の分子構造がデザインされました(図2)。このうち特に有力な候補が、自動実験ラボ「RoboRXN」で合成され、そのフォトレジストとしての可能性が確認されました。このプロジェクトはトータルで約半年間、つまり通常の材料開発の期間とくらべると、10倍以上の高速化が実証されたと言えるでしょう。
図2:MolGXによりデザインされたフォトレジスト材料構造の一部

3. AIによる分子デザインの最先端 – IBM MolGX -
ここでは、AMDのコア技術の中でも東京基礎研究所がリードする「生成モデル」の中核となる技術MolGXについてご紹介します。
MolGXは、ユーザーが望む性質を持つような分子構造をAIにより自動的にデザインする技術です。色や硬さ、水溶性や電気伝導性といった材料の性質は、材料を構成する分子の構造によって決まります。分子は酸素や炭素など原子の組み合わせによって構成されているので、その構成を組み替えることで分子のもたらす性質を制御することが出来ると言えます(図3)。しかし118種類もある原子によって構成できる分子のパターンはほぼ無限にあるため、人間の専門家がすべてを試しながら性質を確認することはほぼ不可能です。そこでAIの「生成モデル」という技術により、自動的に分子をデザインすることを考えます。生成モデルはディープ・ラーニングを中心に、画像の自動生成や自動翻訳におけるテキスト生成などで幅広い実用化が進んでいるAI技術です。分子構造を表記するSMILESという文法表現(例えば、エタノールの分子は ”CCO”、カフェインの分子は” CN1C(=O)N(C)c2ncn(C)c2C1(=O)”と表記されます)を学習したテキスト生成モデルにより、様々な分子構造をデザインするのが昨今の技術トレンドです[4]。一般的な分子生成モデルの模式図を図4に示しています。ここで注意したいのは、表現力の豊かなディープ・ラーニングは、画像やテキストといったデータの自由度が高い(例:あるピクセルの周辺のピクセルがどんな色でも良い)分野では生成モデルとして強力なのですが、分子構造のように自由度が低く、規則が明示的に決まっている(例:酸素原子に結合できる原子は2つまで)分野では、必ずしもディープ・ラーニングが最良の技術とは限らないという可能性です。またディープ・ラーニングは、その高い表現力を獲得するために膨大なデータや豊富な計算資源による長時間の事前学習が必要で、なおかつ中身がほとんどブラックボックスのため、生成される分子構造に「水酸基の数は2つ以下、酸素原子は3つ以上含むこと」といった細かい制約を与えることもできません。
図3:メチレンブルー色素の分子と性質

図4:分子生成モデルの一般的な模式図

こういった事情を考慮し、MolGXは構造をデザインする機能にあえてディープ・ラーニングを用いず、原子や部分構造を効率よく連結させることで分子を組み上げる、グラフ理論による数理アルゴリズムを採用しました[5]。これにより様々な分子構造を高速(10~100個/秒)かつ、ユーザーの注文に応じた柔軟性をもってデザインすることができます。一方で、ディープ・ラーニングが材料の性質予測(予測モデル)に優れていることは事実であり、またこの予測モデル部分の学習は、構造デザイン機能の事前学習ほど多くのデータを必要としません。したがってMolGXは、性質の予測機能には、他の機械学習モデルとあわせてディープ・ラーニングも選択できる仕様となっています。このように、MolGXはグラフ理論の得意とする分子グラフ生成と、ディープ・ラーニングの得意とする物性予測を併せ持つ、ハイブリッドのソリューションとなっています。
MolGXは、生成モデルとしてのパフォーマンスが高いのみならず、様々な分野に応じたデザイン(主骨格構造を保ったデザイン、対称性や周期性を取り込んだデザインなど)、ポリマーの重合条件や物性値の測定条件といった補助的な数値のモデル化、データのマスキングなど、材料デザインの実務で必要となる数多くの周辺機能を備えた、実用向けのソリューションとして開発されました。MolGXは、Discovery Acceleratorプラットフォーム[6]など様々な手段を通じて、これまで多くのお客様にご提供させて頂いています。

4. 共創の時代へ
2021年3月、東京基礎研究所はMolGXの一部の機能を、体験版のwebアプリケーションとして一般公開しました[7, 8 , 9]。このwebアプリは、東京大学の五月祭など様々なイベントでも活用されています[10]。このような技術公開の背景には、急速に発達するAIやマテリアルズ・インフォマティクスの利用体験を社会の幅広い層の方に易しいインターフェースで提供することで、科学技術への興味や参加を促したいという狙いがあります。かつて最新の科学技術は、高度な専門スキルを身につけた一部の専門家のみが関わるものでしたが、webによる様々な教育・コミュニケーションツールが登場した今日、それぞれのスキル・レベルに応じてアクセスできる技術の種類が増えてきました。これにより、特にソフトウェアの分野では職業やスキルの壁を超えたコミュニケーションによる、オープンな技術開発が進んでいます。MolGX webアプリは、そのようなオープン・サイエンスの文化をマテリアルズ・インフォマティクスの分野で実現しようとするものです。
半導体のスケーリングや量子ビットの増加、新たなAIアルゴリズムの登場といったコンピュータ技術の発展は今後も止むことはありませんが、いつの時代も異分野間に渡る幅広いコミュニケーションがその発展のドライバーでした。人と人、人とコンピュータのコミュニケーションによりイノベーションが加速する共創的な社会の中で、Future of Computing(次世代コンピューティング)技術は、材料分野を越えて、創薬、医療、様々な産業デザインや建築デザイン[11]といった分野に適用され、より豊かな世界を創り上げてゆくでしょう。

参考文献
[1] 「IBM 5 in 5:新たな材料の発見プロセスの大幅な加速によって実現する持続可能な未来」Think Blog Japan (2020)
https://www.ibm.com/blogs/think/jp-ja/ibm-5-in-5-accelerating-process-of-discovery/
[2] “Science and Technology Outlook 2021”, IBM Research (2021)
https://research.ibm.com/downloads/ces_2021/IBMResearch_STO_2021_Whitepaper.pdf
[3] Project Photoresist, IBM Research (2021)
https://research.ibm.com/interactive/photoresist/
[4] “Deep learning for molecular design—a review of the state of the art”, D. C. Elton, et al., Molecular Systems Design & Engineering, 4, 828 (2019)
[5] “Molecular Inverse-Design Platform for Material Industries”, S. Takeda, et al., KDD 2020.
[6] “The Discovery Accelerator comes to Europe”, IBM Research Blog
https://research.ibm.com/blog/stfc-discovery-accelerator
[7] IBM Molecule Generation Experience web application https://molgx.draco.res.ibm.com/
[8] “Molecule Generation Experience: An Open Pla5orm of Material Design for Public Users”, S. Takeda, et al., arXiv:2108.03044
[9] 「あなたも自宅で新物質をデザイン!“IBM Molecule Generation Experience”が起こす革新とは」 Mugendai(無限大) https://www.ibm.com/blogs/think/jp-ja/mugendai-13334-column-ibm-molecule-generation-experience/
[10] 「化合物を新発見?!」東京大学 五月祭ホームページ https://gogatsusai.jp/94/visitor/kikaku/587
[11] 「物質と創造の果てへ」武田征士、建築討論(2021)  https://medium.com/kenchikutouron

[著者]
武田征士  Seiji Takeda
日本アイ・ビー・エム株式会社   東京基礎研究所  チームリーダー
Accelerated Material Discoveryリーダー。海外ラボと共に、国内外のマテリアルズ・インフォマティクス関連のプロジェクトを数多く手掛ける。2010年慶應義塾大学大学院博士課程修了。博士(工学)。人工知能学会現場イノベーション金賞など受賞。


*ProVISION 記事一覧はこちらから


IBM、IBMロゴは、米国やその他の国におけるInternational Business Machines Corporationの商標または登録商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、ibm.com/trademarkをご覧ください。


#ProVISION
#futuretech
#Highlights
#Highlights-home
0 comments
140 views

Permalink