ProVision

 View Only

デジタルサービス・プラットフォームを強化する連合学習・MLOps (vol98-0002-AI)

By IBM ProVision posted Tue May 31, 2022 10:50 PM

  

Yamada.jpg

山田 敦
Yamada Atsushi
日本アイ・ビー・エム株式会社
IBM AIセンター長
執行役員、兼IBM Distinguished Engineer

Nishiue 西上 功一郎
Nishiue Kohichiroh
日本アイ・ビー・エム システムズ・エンジニアリング株式会社
AIソリューション
コンサルタントITスペシャリスト
IBM AIセンター長として、部門をまたがりAIビジネスを推進。併せてデータサイエンティスト職のリーダーを務める。数多くのお客様に対して、データとAIを活用した業務変革を支援。工学博士。 2002年に日本アイ・ビー・エム システムズ・エンジニアリング入社以来、IBM iやPower Systemsのサポートに従事。2015年よりWatsonやDeep Learningを用いたAIのシステム開発を担当し、AI Solution部門のマネージャーとして、AIのソリューションを世に広めている。
IBM®では、デジタル・トランスフォーメーション(DX)の早期実現をご支援するために、デジタルサービス・プラットフォーム(DSP)の活用を推進しています。AIはDSPの中核技術の一つとして位置づけられており、企業ワイドでデータとAIを活用するためにエンタープライズAI機能を共通化することで、お客様のDXに素早くAIを組み込み展開していくことが可能となります。本稿では、DSPのエンタープライズAIを機能強化するために進めている連合学習(Federated Learning)とMLOpsについて紹介します。複数のデータ保有者が互いに学習データを開示せずに、共有機械学習モデルを共同学習する連合学習は、デジタル・ジャイアントのような1社で巨大なデータを持たない一般企業が、世界で戦うための強力な武器となります。また「日本企業がリリースするAIは、とにかく品質がよい」という方向に進むために、MLOpsによるAI品質の管理は、併せて大切な武器となります。日本企業が、データとこれらの技術を活用し、世界における競争上の優位性を獲得できるように、DXリーダーの活動を全力でサポートしていきたいと考えています。

DXを加速させるデジタルサービス・プラットフォームへの取り組み

IBMでは、お客様のDXを加速させるために、業界別の特性を盛り込んであらかじめ作りこんだデジタルサービス・プラットフォーム(DSP) 、つまり業界別のインダストリー・クラウドの提供を開始しています[1]。スピーディーに試行を成功させたAIを、本格的なデジタルサービスとしてビジネス展開しようとした時、その企業が求めるセキュリティーや可用性、性能といった非機能要件を考慮し実現しないといけませんが、それらに対応できずにスローダウンするケースが多くあります。IBMが提供する業界別DSPをテンプレート的に活用して、DXのための自社基盤を構築しておくことで、試行に成功したAIアプリを、スピーディーに本格展開することができます。
例えば金融向けのDSPにおいては、多くの顧客データや取引データをどのようにAIで分析し、活用していくかが課題となります。もし、日本中の銀行が保持するデータを合わせて学習したAIのモデルを作成することができるなら、どれだけの精度を出すことができるようになるでしょうか。夢物語のように聞こえるかもしれませんが、各銀行がデータを開示することなく、共用のAIモデルを学習させることのできる技術として、連合学習(Federated Learning)が注目されています。
また製造業では、スマートファクトリーによる生産効率化が共通化されており、データの収集・管理、AIモデルによる分析を行い、製品の品質管理や設備保全に活用されています。業務で活用されているAIモデルが陳腐化しないように、モデルを改善するサイクルを回しAI品質を管理する仕組みであるMLOpsが必要となっています。
IBMは現在、DSPの基本機能拡張を進めており、本稿では、DSPに組み込まれるエンタープライズAI技術である連合学習とMLOpsについて紹介する。

連合学習が企業の枠を超えた情報連携を促進

連合学習(Federated Learning)とは、複数のデータ保有者が互いに学習データを開示せずに、共有機械学習モデルを共同学習する技術です。図1に示すように、データを保有する各社は自社のデータを使って自社内で機械学習モデルを作り、モデルのパラメーターを社外に共有し、持ち寄ったパラメーターから共有モデルを作成し、それを各社で利用します。1社で持つデータから作成した機械学習モデルと比べて、高性能な予測モデルを作成できることが期待できます。

図1

図1. 連合学習の利用イメージ


Google TrendsにFederated Learningをキーワードとして入力してトレンドを検索すると、2017年頃から急速にその関心が高まっています(図2)。 DXの普及に伴い、様々な業務においてデータ活用が進められていますが、デジタル・ジャイアントのように自社で莫大なデータを持つ企業を除けば、自社で持つデータだけでは十分な性能をもつ機械学習モデルを作れないケースもあります。企業間で連合することで、より高性能な機械学習モデルを作れる可能性を秘めていることが、連合学習に対するこの急速な関心の高まりの背景にあると考えられます。

図2図2. Google Trendsにおける連合学習の人気度動向
連合学習には、データの分散状況に応じて、Horizontal型とVertical型の2つのタイプがあります(図3)。Horizontal型は、共通の特徴量を持つデータが分散しているケースです。連合学習により、全体としてデータ量が増えることによるモデル性能向上が期待できます。同業種での協業に有効です。一方Vertical型は、各社が異なる特徴量を保有するケースです。連合学習により、特徴量を増やすことでモデル性能向上が期待できます。異業種間での協業に有効です。

図3図3. 連合学習のタイプ

では、連合学習はどのような業務領域で活用できるでしょうか。図4左が、世の中でこれまで公表されている代表的な取り組み事例です。様々な業界で適用されています。図4右には、想定されるユース・ケースのパターンを列挙しました。連合を組むことで競争上の優位性を強化できるケースや、企業内でのグループ間情報連携、また非競争領域での連合など考えられます。保険業界に焦点を当てて議論した対談記事[2]もご参照ください。現時点では、まだ実証実験的な取り組みが多いようですが、今後、プライバシー面を十分に考慮した本格利用の事例が多数登場してくるのが楽しみです。

図4図4. これまでの取り組み事例と想定されるユース・ケースのパターン

IBMは、連合学習の機能を、ソフトウエア製品IBM Cloud Pak® for Data (CP4D)の機能として提供しています。触って試してみたい方は、こちらの記事[3]をご参照ください。現在製品で提供しているのは、Horizontal型ですが、Vertical型についてはIBM Research®からの研究アセットとして提供可能です。またセキュリティーをより強化する機能についてもIBM Researchから提供しています。

MLOpsによるAIの継続的運用

前述の連合学習(Federated Learning)において、どのユース・ケースに活用したとしても、学習モデルの運用が必要になってきます。MLOpsとは、ML(Machine Learning:機械学習) + DevOpsの略語であり、機械学習モデルがデータやロジックによって変化することに対応するために、モデルを定期的に再学習させたり、機械学習モデルを利用したアプリケーションに動的にデプロイしたりする、仕組みや考え方の総称です[4][5]。
例えば、金融業のマネーロンダリングを検出するAIモデルを作成したとしても、新しい手口に対応するために、定期的に精度を監視し、必要に応じて新しいデータを随時取り込んで新たなMLモデルを更新し続けなくてはなりません。図5に金融業のアンチ・マネーロンダリング対策システムの運用について記載します。

  • データ収集と準備:データ・エンジニアは、金融のお金の流れに関連する業務データを収集し、分析可能な形式に変換する。
  • MLモデルの作成と評価:データサイエンティストは、データを分析し実験・評価して最適なMLモデルを作成する。
  • MLモデルのデプロイ:MLエンジニアは、作成されたMLモデルをアンチ・マネーロンダリング対策アプリケーションで利用できるようにデプロイし、テストする。
  • 精度のモニタリング: MLエンジニアは、モデルの性能が劣化していないか監視を行い、アプリケーションを利用したビジネス・ユーザーからのフィードバック・データを元にモデルを評価する。

このシステムからのフィードバック・データとそのモデルの評価を元に、データ・エンジニアとデータサイエンティストは更に分析を行い、継続的にMLモデルを更新し続ける仕組みを回していくことがMLOpsによる運用となります。
図5
図5. アンチ・マネーロンダリング対策システムのMLOpsによるAI運用イメージ

MLOpsを実現する技術要素


MLOpsをオープンソース・ソフトウェア(OSS)で実現しようとした場合、実験管理ツールとしてのMLFlowや、パイプライン管理を実現するKubeflowなどを組み合わせたりします。また、クラウド・ベンダー各社も力を入れてきており、Microsoft Azure Machine Learning[6]、Google Vertex AI[7]、AWS Amazon SageMaker[8]などでMLOps機能が充実してきています。IBMでは、Cloud Pak for Dataによって、MLOps基盤を実現します。 各社、大別すると、開発環境による実験管理、MLモデルのデプロイや実験を繰り返すためのパイプライン、モニタリングによる品質保証の3つの機能を実現していることが多いです[9]。それぞれについて、詳しく説明します。

  • 開発環境による実験管理
    開発環境としてPythonの開発ツールをベースに、GUIによるノーコード/ローコード機能を加えたツールが多くあります。IBMではIBM Watson® Studioの機能として、Pythonの開発ツールであるJupyter Notebook、GUIで開発可能なSPSS® Modeler フロー、No Codeでモデルを自動的に作成できるAutoAIを提供しています。
    実験管理のためにはモデルのメタデータ管理を行う必要があり、IBM Watson Knowledge Catalog機能であるModel Inventoryにメタデータを格納することができます。モデル開発時のデータ・ソース、パラメーター、ソース・コード、そのモデルの品質、公平性などの情報をメタデータとして保存しておくことによって、どのデータをどのロジックでどのくらいの精度で実験したかを管理することができます。データサイエンティストが繰り返し実験するための、過去データの参照や再現が可能となります。

  • MLモデルのデプロイや実験を繰り返すためのパイプライン
    学習データからMLモデルを作成しアプリケーションへとデプロイするためには、多段の処理を実行する必要があり、一連の処理を自動化するパイプラインの仕組みが必要です。データサイエンティストが実験を繰り返すためにも、学習データを取り出し、教師データとテスト・データとして整形し、MLモデルを作成し、テストして結果をメタデータとして保管するという複雑な処理が必要です。また、MLエンジニアは、作成されたMLモデルをアプリケーションで利用できるようにデプロイし、テストし、問題がなければリリースするという処理を繰り返さなくてはなりません。
     IBMではWatson Studioの機能であるWatson Studio PipelinesでGUIによるパイプラインの作成を可能にします。Data Refineryによるデータ取得・加工、AutoAIによるMLモデルの自動作成、モデルのデプロイなどがNo Codeで実現でき、1つの処理を実行するノードを複数組み合わせるだけでパイプラインを実行することができます。

  • モニタリングによる品質保証
    企業は、AIを活用していく上での安全性、プライバシー、人権や社会全体に配慮し、責任あるAIを実現する必要があります。IBMは、Trustworthy AI(信頼できるAI)[10]を提唱しており、AIの精度(Quality)だけでなく、説明可能性(Explainability)、公平性(Fairness)を検知する仕組みに取り組んでいます。Watson OpenScaleは、MLモデルの実行環境であるWatson Machine Learningの実行結果に揺れを与えて近似的なモデルを内部に作成することで、説明可能性や公平性を評価します。監視対象のMLモデルが精度劣化を起こしていたり公平性を欠いていたら、アラートを上げることができます。MLエンジニアはアラートを元にWatson OpenScaleのダッシュボードで問題を確認し、改善ポイントを絞ることができます。

図6

図6. Cloud Pak for DataによるMLOpsの実現


Cloud Pak for DataはMLOpsを実現する技術要素に加えて、データ収集と準備を実現するDataOpsの機能も兼ね備えているData&AIプラットフォームです。 さらに、コンテナ・ベースのため、クラウドであってもオンプレミスであっても稼働させることが可能でエンタープライズ用途に適しています。図6において、ここまでに説明したCloud Pak for Dataの各コンポーネントによるMLOpsの実現イメージを記載します。DXにおけるAIの組み込みが必須と言える状況の中で、DSP活用におけるMLOpsの組み込みが有効であることをお気づきいただけたら幸いです。

DXによる日本の勝ち筋

2021年のIMD世界デジタル競争力ランキングによると、日本は28位と残念ながら決してデジタル先進国とは呼べない状況です [11]。しかしながら日本にまだ勝機は残されており、それはデータとAIをどれだけ「活用」しきれるかにあると考えます[12]。デジタル・ジャイアントのような1社で巨大なデータを持たない一般企業が、世界で戦うための戦略の1つが連合です。その方策として連合学習は、強力な武器となります。また「日本企業がリリースするAIは、とにかく品質がよい」という方向に進むために、MLOpsによるAI品質の管理は、併せて大切な武器となります。データとAIを駆使して日本企業を再び世界で輝かせるために、DXリーダーの活動を全力でサポートし、そして次の世代にバトンを渡していきたいと考えます。

[参考文献]
[1] 二上哲也:DXを加速する オープンなプラットフォーム構築, IBM ProVISION, Vol. 97, No. 0008 (2022),
https://community.ibm.com/community/user/japan/blogs/provision-ibm1/2021/06/01/vol97-0008-cloud
[2] 遠藤毅郎, 山田敦, 岡村周実: 企業間の情報連携が開く、保険業界「デジタル変革第2章」の扉, Smarter Business (2020),
https://www.ibm.com/blogs/smarter-business/business/csuite_insurtech_case
[3] IBM Cloud の Watson Studio と Watson Machine Learningサービスで、Federated Learningを動かす (UI編), Qiita (2022),
https://qiita.com/1000aki/items/5e5290a7665d63e96727
[4] 都竹 高広: MLOpsのキホンと動向, IBMソリューションブログ (2021),
https://www.ibm.com/blogs/solutions/jp-ja/mlops-2021-data/
[5] 河田大: なぜMLOpsが必要なのか, ProVISION(vol97-0014-ai) (2021),
https://community.ibm.com/community/user/japan/blogs/provision-ibm1/2021/08/17/vol97-0014-ai
[6] Microsoft: Azure Machine Learning,
https://azure.microsoft.com/ja-jp/services/machine-learning/
[7] Google: Vertex AI,
https://cloud.google.com/vertex-ai
[8] Amazon Web Service: Amazon SageMaker,
https://aws.amazon.com/jp/sagemaker/
[9] 曽田 俊明: IBM Cloud Pak for Data as a Serviceによる機械学習モデルのライフサイクル管理, ISE Technical Conference (2022), https://ibm.ent.box.com/v/IseConf2022-Docs-XFormation/file/946686007011
[10] IBM: Trustworthy AI,
https://www.ibm.com/watson/trustworthy-ai
[11] IMD: World Digital Competitiveness Ranking (2021),
https://www.imd.org/centers/world-competitiveness-center/rankings/world-digital-competitiveness/
[12] 山田敦: DXのスイッチを入れた日本企業が歩むべき道筋 ~ 4+1層で考えるAI Journeyの基本形, iMagazine (2022),
https://www.imagazine.co.jp/ai-roadmap-into-dx/





IBM、IBM ロゴ、IBM Cloud Pak®、IBM Research®、IBM Watson®、SPSS®
は、 米国やその他の国におけるInternational Business Machines Corporationの商標または登録商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点での IBM の商標リストについては、https://www.ibm.com/legal/copytradeをご覧ください。

*ProVISION 記事一覧はこちらから












#Artificial Intelligence (AI)
#AI
#ProVISION
#AI
#AI
#AI
#ProVision
#ProVision-AI
#Highlights-home
#Highlights
0 comments
1084 views

Permalink