ProVision

 View Only

What’s Next in AI (vol97-0012-AI)

By IBM ProVision posted Sun July 25, 2021 03:39 AM

  
Tachibana-san.jpg 立花 隆輝 Ryuki Tachibana
日本アイ・ビー・エム株式会社
東京基礎研究所
AI担当シニア・マネージャー、シニア・テクニカル・スタッフ・メンバー
1998年日本IBM入社。以來、東京基礎研究所にてマルチメディア信号処理や音声言語処理などに従事。現在は、さらに自然言語処理、画像処理、エッジやロボット関連機械学習応用などを含めたAI関連プロジェクトのマネージメントを行う。

近年、ディープラーニング(深層学習)をはじめとする新しいAI技術がもたらした素晴らしい技術成果を目にすることは多い一方で、ビジネスで実用する上での難しさも見えてきており、AIに関しては基礎技術もツールも、利用の現場もそれぞれ次の段階へと進んでいます。これからのAIはどうなっていくのでしょうか。本稿では、企業がAIを活用していくために必要なAI技術はどんなものであるとIBM®が考えているか、技術動向を説明します。

イントロダクション – Broad AI

近年AIは様々な分野で目覚ましい成果をあげました。タスクが明確に定義されれば、人と同等あるいは人を超える能力を達成することができるということが、たとえばゲームや画像認識などの分野で示されました。そして、芸術的な画像の生成など、以前には考えられなかったような応用にも使えることが示されました。しかし、これまで開発されたAIの多くは、学習データに想定された状況を外れるとそのような高精度が達成できないことから、狭いAINarrow AI)と呼ぶべきものだと私たちは考えています。今後、様々に変化する現実の状況において広く人の知的活動を助け、より多くの社会問題の解決に有用なAIを実現するためには超えなければならない壁が多く、そういった壁を超えていくAIの方向性を私たちは広いAIBroad AI)と呼んでいます。私は、Narrow AIBroad AIの間に明確な境界線はなく、たとえばあるAIシステムについて、ある点においてBroad AIであるが他の点ではNarrow AIであるという言い方ができるものと思います。さて、Broad AIを実現するためのひとつの重要なキーワードは流動的知性(fluid intelligence)であるとIBM®は考えています。これは流動性を備えて適応的なAI、すなわち、一つの目的に限定されずに知識を新しい分野やタスクに柔軟に適用できるAIということです。以下の章では、私たちが取り組まないといけない今のAIの技術的課題、特に技術を利用する側はどんなことを知って取り組み始める必要があるかを、(1) AIエンジニアリング、(2) 安全で信頼できるAI(3) ニューロシンボリックAI(4) AIハードウェアという項目に分けてより具体的に解説します。
図1. Broad AIへ向けて鍵となる4つの技術

(1)AIエンジニアリング

機械学習モデルを含むAIシステムの開発と運用には、これまでのソフトウェアの開発と運用とは異なるやり方が求められ、独特の難しさやスキルの違いがあります。今後より多くの局面で、AIのシステムを使ったDXを進めるためには、アイデアを速やかにAIに実装し継続的に改善できるように、AIモデルの開発・運用を自動化・簡単化するツールや要素技術が必要です。

ドメイン知識をデータ分析に利用 – Semantic Feature Discovery

たとえば、IBM®Cloud Pak for Data製品には、与えられたデータに対して最高の精度を発揮するAIモデルを自動的に学習するAuto AI機能があります。IBM®の研究所ではさらにこの技術を推し進めて、分野に精通したデータサイエンティストなら持っているような知識(ドメイン知識)をシステムが自動的に検索・適用して、AIモデルの精度を改善する技術の研究開発を行っています。Semantic Feature Discoveryというこの技術[1]では、既存のプログラム、データベース、Wikipediaの文書などを自動的に解析することによって、分野でよく使われる数式やデータの意味をあらかじめ収集しておき、それを使って現在手元にあるデータを自動的に分析することを目指しています。

図2. Semantic Feature Discoveryの処理の流れ

複雑なエッジAI開発・運用の支援 – Edge AI SDK

昨今、工場や流通などの現場で生まれるデータを現場に近いところで処理したいというニーズによってエッジ・コンピューティングでのAI利用の機運も高まっています。複数のエッジに分散した環境では、クラウドでのAIにさらに輪をかけてデータやモデルの管理が複雑になりがちです。たとえばエッジサイトが多数あり、そこで計測されたデータにAIを適用するとします。それらのAIモデルが期待した通りのパフォーマンスで動作していることをどう管理すればよいのでしょうか。継続的にエッジに集められているデータを使ってモデルを更新する必要はあるでしょうか。更新の頻度や更新に使うデータをどう選択すればよいでしょうか。エッジ向けのAIではこれらの考慮点によって、前述のようなAIシステムの開発と運用のサイクルがさらに複雑化する傾向があるため、IBM®では関連する製品や新技術を研究開発しています。20215月のThink 2021IBM®は施設に分散した設備の点検を、画像検査のAIを搭載したロボットを歩きまわらせて行うデモを公開しました。このデモでもロボット上のエッジAIを扱うのにIBM®リサーチの技術であるEdge AI SDKを用いています。こういった新しいツールや技術を使いこなせば、これまではデータ整備の手間やAI開発のスキル不足など現実的な制約によって手が回らなかったようなタスクも含めて企業がAIを使うための敷居が下がり、DXにもより大きな可能性が広がることが期待できます。お客様にとっての制約を減らして、想像力を働かせることに集中していただきたいと思います。
図3. ロボット上での画像検査を例としてエッジAIの構成と開発のサイクル

(2)安全で信頼できるAI

もうひとつAI実用の障害になっているのは信頼に関する問題です。とても興味深いデモが可能なAI技術であっても、ビジネスに実運用するとなると求められる要件や水準が大きく変わります。さらにはたとえ実用でないデモであったとしても、人の目に広く触れるAIがたとえば差別的な振る舞いを見せてしまっては企業のイメージを大きく損なうことにもなってしまいかねません。企業がビジネスにAIを信頼して使うためには何が必要になるのでしょうか。IBM®リサーチは、説明可能性、公平性、ロバストさなどが重要な要件であると考えています[2]

説明可能性

深層学習を用いたAIモデルは高精度を実現しやすい一方で、ブラックボックスになり意思決定の理由が説明しづらくなりがちです。何をする誰のための説明が必要なのかによって適切な説明の仕方も変わってきます。そのため、説明の用途とデータやAIモデルの種類によって、様々なアルゴリズムが開発されています[3]。たとえば 「Model Agnostic Contrastive Explanations for Structured Data[4]は、あるローン可否の診断をしたときに、そのデータがどのように異なっていれば結果が違っていたかという対比によって、個別の意思決定についての説明を行うアルゴリズムです。また別の手法である「Model Agnostic Multilevel Explanations[5]は、あるデータの場合にはある特徴量が重要視されるが、また別のデータの場合には違う特徴量が重要視されるといった形で、対象とするAIモデルの挙動全体を説明します。

公平性

公平というのは意外と単純な概念ではなく、AIを運用するときにはどんな種類の公平性が今回必要なのかという少し哲学的な問いを考えてみる必要さえ時にはあります。ローンの判断を行うときに、考慮に入れてよい説明変数は何で、入れるべきでない説明変数は何でしょうか。大切なことは、十分意識的に考慮を行うことです。様々な観点からAIの公平性を評価するアルゴリズムや、公平性を改善するアルゴリズムが研究・提案されており、それらを使いやすく提供するライブラリやツールが利用可能です[6]

ロバストネス

ロバストネスについてもいくつか異なる種類の攻撃に対するロバストネスを考えなければいけません[7]。たとえば、入力データに人為的に手を加えることによってAIの判断結果を意図したものにさせる抜け道があってはいけません。このように考慮しなければいけない点は多いので、簡単にチェックして修正することができるツールとして技術が提供されていることが重要です。

(3)ニューロシンボリックAI

様々なタスクにおいて驚くべき成果をあげてきたディープラーニングをさらに複雑化して精度をあげたり別のタスクをできるようにしたりする研究は今後も進められていきます。しかしディープラーニングも万能ではなく、別種の技術もAIを高度化するためには必要です。ディープラーニングの不得意とする点としては、まず明示的に知識を扱いづらいことです。説明性の部分でも述べたように、推論を行ったときにそれがどのような知識や推論に基づいているのかを人が理解するためには、通常、別種の技術が必要になります。またディープラーニングには通常、大量のデータが必要になります。人間の熟練者が初心者に教えるような、あるいはノウハウ集から読み取れるような、簡潔な知識の記述を用いて知識を与えることはできません。転移学習と呼ばれる方法によって新たなデータで新しい知識を学習させることはできますが、それに必要なデータ量も計算時間も少なくはないので、知識を加えたり取り除いたりする上での柔軟性にも乏しいと言えます。また多段階の推論も不得意とするところであり、複数の知識を順に組み合わせて最終的に結果を導き出すのには適していません。こういった課題を補うために注目されているのがニューロシンボリックAI[8,9]という新しい研究分野です。これはシンボルを用いたAIをディープラーニングと密に組み合わせます。特にそのコア技術としてIBM®が力を入れているのがLogical Neural Network (LNN)という技術です[10]。これは論理を明示的に扱うためのまったく新しい種類のニューラルネットワークです。従来の深層学習とは異なり、個々のニューロンに明示的に論理的な意味を割り当てます。たとえばコロンブスの出生地はジェノバであるとか、ジェノバは今はイタリアの一部であるとか、イタリアは国であるといった知識を明示的に扱い、それらの知識をそれぞれ一個のニューロンで表現します。また過去の推論技術と異なる点は、ニューラルネットワークで表現された論理式をデータから学習することができる点です。IBM®はこの技術とディープラーニングを組み合わせた質問応答システムを開発し、学会で公開されている複数のデータセットで世界最高の精度を2020年に記録しました[11]。この技術はこれから数年のうちに応用分野を広げ、知識を明示的に扱うことによってAIの学習に必要なデータ量を格段に減らし学習時間を圧倒的に高速化することが期待されます。

図4. Logical Neural Networkの特徴と例

(4)AIハードウェア

大規模なニューラルネットワークは大幅に精度が向上している一方で、その学習に必要な計算量と消費電力が問題視されています。最先端のAIモデルを学習するのに使われる計算量は2012年以降30万倍以上に増加したと言われていますが、これは、エネルギーに換算すると一台の車が平均使用年数の間に排出するCO2の約5台分にも相当します[12]AIの今後の発展のためにはそれを支えるハードウェア・プラットフォームの面からも飛躍的な技術革新が必要です。その実現に向けて様々なアプローチがありますが、中でも大きな効果が期待されているのがアナログAIチップです。インメモリ・コンピューティングとも呼ばれる新しいアーキテクチャでは、メモリとプロセッサの間をバスで接続する従来のノイマン型アーキテクチャと異なりメモリ自体に演算能力を持たせるので、データを演算のために伝送する必要がなくなり計算速度とエネルギー効率が大幅に改善します。このアーキテクチャでは、ニューロン間の重みを相変化メモリで記憶する形でニューラルネットワークを物理的に実装します。20214月にIBM®は、そのようなアナログチップ向けのニューラルネットワークを設計しチューニングするためのAIHW Composerツールとオープンソース・ライブラリ IBM Analog Hardware Acceleration Kit (AIHWKIT)を発表しました[13]。これらを使うことによってユーザーはハードウェアを意識したニューラルネットワークの最適化をすることができ、消費電力と計算精度を高いレベルで両立させることができます。IBM®はこういった最先端のAI向けハードウェア研究を、2019年にニューヨーク州Albanyに設立したAI HW Centerでパートナー企業と協力して進めています[14]。このセンターは1年ごとに計算効率を2.5倍、2029年までに累積して1,000倍に高めることを使命としています。最初6団体で始まったパートナーは20214月までに16団体へと増えています。このセンターの研究成果が世界に広く利用されることで、高精度のAIによる社会問題の解決とCO2排出量抑制さらには削減が両立されることが期待されます。

おわりに

ビッグデータと機械学習の利用がビジネスのITシステムの中に組み入れられ本格的に実用されていく流れは社会全体を見ればまだ始まったばかりで、これからますます進んでいくと見るべきだと思われます。AIシステムは企業にとってさらに実用的で使いやすいものになっていきます。一層多くの企業が、利用可能な最先端の技術をうまく利用して、社会を良くするための新しいDXの発想を積極的に広げていくことを期待したいと思います。


[参考文献]

[1] 立石 孝彰ら, "機械学習プログラムからのドメイン知識の自動抽出," ソフトウェアエンジニアリングシンポジウム2020論文集, pp. 161-170, 2020.

[2] IBM Research, "Trusted AI," https://www.research.ibm.com/artificial-intelligence/trusted-ai/.

[3] IBM Research, "AI Explainability 360," https://aix360.mybluemix.net/.

[4] Amit Dhurandhar et al., "Model Agnostic Contrastive Explanations for Structured Data," CoRR abs/1906.00117, 2019.

[5] Karthikeyan Natesan Ramamurthy et al., "Model Agnostic Multilevel Explanations," NeurIPS 2020.

[6] IBM Research, "AI Fairness 360," https://aif360.mybluemix.net/.

[7] IBM Research Blog, "Adversarial Robustness 360 Toolbox v1.0: A Milestone in AI Security," https://www.ibm.com/blogs/research/2019/09/adversarial-robustness-360-toolbox-v1-0/.

[8] Katia Moskvitch, "Neurosymbolic AI to Give Us Machines With True Common Sense," https://medium.com/swlh/neurosymbolic-ai-to-give-us-machines-with-true-common-sense-9c133b78ab13.

[9] MIT-IBM Watson AI Lab, Neuro-symbolic AI, https://mitibmwatsonailab.mit.edu/category/neuro-symbolic-ai/.

[10] Alexander Gray, "Logical Neural Networks," https://skirmilitor.medium.com/logical-neural-networks-31498d1aa9be , Dec. 19, 2020.

[11] IBM Research Blog, https://www.ibm.com/blogs/research/2020/12/ai-neurosymbolic-common-sense/.

[12] Emma Strubell et al., "Energy and Policy Considerations for Deep Learning in NLP," ACL 2019.

[13] IBM Research Blog, "AI Hardware Composer launches on two-year anniversary of IBM AI Hardware Center," https://www.ibm.com/blogs/research/2021/04/ai-hardware-composer/.

[14] IBM Research. "AI Hardware Center," https://www.research.ibm.com/artificial-intelligence/ai-hardware-center/.

*ProVISION 記事一覧はこちらから

IBM、IBMロゴ、は、米国やその他の国におけるIBM Corp.の商標または登録商標です。


#ArtificialIntelligence(AI)
#AI
#ProVISION
#Highlights-home
#Highlights
#AI
#ProVision
#ProVision-AI
0 comments
3533 views

Permalink