Data Management

 View Only

LinkedIn Share on LinkedIn

生成AI時代にはデータ活用が鍵! センシティブなデータもIBMのコスパ最強データ基盤と手間なしインフラでしっかり安全・安心活用!(前編)

By Zui Kaku posted Wed August 28, 2024 09:26 PM

  

期待の入社2年目若手君(🐤)の成長物語。
今流行りの生成AI(watsonx)を学び、素晴らしさをお客様にお届けするために、ベテランSEの先輩さん(🐓)に話しかけにいきました💨

若手君(🐤)
先輩さーん、次のお客様との打ち合わせで、生成AIやデータの話が中心になるようですが、ちょっと教えていただけますか?

先輩さん(🐓) 
もちろん!ちなみに、若手君は、その生成AIブームについてどう思う?

🐤
そうですね、生成AIの進化には本当に驚かされます!
特にビジネスや技術の分野での影響は大きいですよね。
チャットボットや自動生成コンテンツなど、色々な場面で活用されていますね。

🐓
確かに!生成AIは、これまでできなかったクリエイティブなアウトプットができるようになったね。
でもね、AIの価値を最大限に引き出すには、やっぱり元となるデータがすごく大事なんだよ。

~📖データの重要性とデータ基盤に関する課題について知る📖~

🐤
デー
タの重要性はなんとなく分かっているのですが、、、もう少し詳しく教えてもらえますか?

🐓
もちろん!まず、従来のデータ活用の話からすると、企業が集めたデータを分析して、その結果を経営の意思決定に使っていました。
これは、ビジネスインテリジェンス(BI)📈って言われる手法だね。

🐤
ああ、それはよく聞きますね。

🐓
そして、最近は、BI📈だけではなく、もっと深い洞察を引き出すために、AI技術を使って、
ビックデータから価値を創出しようといろんな会社が取り組みをしているね。

🐤
なるほど、AIを使うことでデータからもっと深いインサイトを得られるわけですね。

🐓
その通り。でもいくつか課題があってね。
データは日々増えているし、形式や種類も多様で、さまざまな場所に分散して保存されているんだ。
だからこそ、一元管理して適切に処理することが重要なんだ。

🐤
なるほど。えーと、データの種類についてもう少し教えてもらえますか?

🐓
データには大きく分けて2つの種類があるよ。「構造化データ📊」と「非構造化データ📗」だね。
「構造化データ📊」は、表計算ソフトのデータみたいな行と列で整理されたデータだね。
「非構造化データ📗」は、テキストや画像、動画など、特定のフォーマットがないデータのことだよ。
最近の生成AIや機械学習では、この非構造化データが重要なんだ。

🐤
なるほど、AIモデルをトレーニングするため、多種多様なデータが必要ですよね。

🐓
その通り。データを利活用するため、多様なデータを扱ったり、整理・利用したりすることが大事だよ!
その仕組み(データ・アーキテクチャー)には、主に「データ・ウェアハウス」、「データ・レイク」、「データ・レイクハウス」の3つがあるんだ。

~🥺データを効率的に活用するための新しい設計書!レイクハウスの凄さに感動🥺~

🐤

データ・ウェアハウスは聞いたことありますが、他の2つはあまり聞いたことがありません、、、

🐓
「データ・ウェアハウス」はね、構造化データを前提として設計されたデータベースで、データ処理のパフォーマンス💪(列での計算など)にとても優れているんだ。
でも、大量な構造化データを高速処理するために最適化されているから、他のものと比較して、初期投資や運用コストも結構高いんだ。

🐤
なるほど。じゃ、データ・レイクは?データ・ウェアハウスと何が違いますか。

🐓

「データ・レイク」は、構造化から非構造化までのデータをすべて保存できるんだよ!
でも、データを
大量に保存するから、データ品質管理が大変で、疎かにしていると、気がついたらいろんなデータがどっさりで、必要なデータを見つけるのが難しくなることが多いよ。

🐤
どこにどのようなデータがあるか分からず、求めているデータを得られなくなってしまうなんて😱。
データの品質が低いと、分析結果にも影響に与えますね。今までのデータ・アーキテクチャーだと、それぞれ課題があるんですね。

そうすると、「データ・レイクハウス」は?

🐓
「データ・レイクハウス」はね、なんと!!!データ・レイクとデータ・ウェアハウスの両方の利点を統合して、
今までの課題を解決できるんだ👏すごくない???
あらゆるデータを統合して利用できて、今のビッグデータ時代では、企業にとってより理想的なデータ管理ソリューションだよ。

 データ・アーキテクチャー比較図


~🤩IBMにもあった!企業用のデータ・レイクハウス・ソリューション「watsonx.data」に迫る🤩~

🐤
もしかして、、、IBMにもそんなすごいレイクハウス製品があったりするんですか😀?

🐓
なんと、IBMは、
watsonx.dataという次世代のデータ・レイクハウス製品があるんだよ。
IBM watsonx(※1)というAIプラットフォーム製品群のデータ基盤の役割を担う製品であり、オンプレミスでもハイブリッド・マルチ・クラウド環境でも使えるんだ。

🐤
ん?なにが嬉しいんだろ、、、

🐓

えっとね、今までは、エンジンとデータが一緒だったから、データの移動とかがあってタイムロスや接続先を変えないといけなかったんだけど、レイクハウスのエンジンとデータが分離している特徴により、データ分析者🎓は、データの場所を意識せずに、一つの接続先から、欲しいデータにすぐにアクセスできるんだよ👏
そして、IBMのレイクハウス製品は、パフォーマンス💪が必要な時はデータ・ウェアハウスの高性能なエンジンを、機械学習をしたいときはそのためのエンジンを、今お客様が使っているエンジンを使い続けたいときは、そのまま使い続けることができるんだよ!
例えば、独自の生成AIモデルをトレーニングしたいときには、複数のデータ・ソースからの多様なデータ・セットが必要で、watsonx.dataはこれらのデータ・セットを一元管理し、必要なデータを必要なエンジンですばやく取り出しことができ、トレーニング時間の短縮やモデル精度の向上、コストの最適化などの利点もあるんだ!

参考事例:非構造化データの分析と調査を変革し、不正行為や組織犯罪に対抗

🐤
企業は自社特化の生成AIニーズがあるとニュース✉️とかでもよく聞きますよね!
だけど、そのためには何が必要なんだろう。IBMからお客様に伝えられることって、なにか
ありますか。

🐓
もちろん!
IBMは、データをうまく活用するための製品をたくさん提供していて、それと組み合わせることで、データの出所や変更履歴を追跡することで、生成AIの開発と運用のコンプライアンス🔑を満たした形で進められるんだよ!
あとね、大量にデータがあったときに、アクセスできても多すぎて、どのデータを使えばいいのか、迷ったことない?
データに対して、データの意味を生成AIが教えてくれる、そんな使い方がこれからできるようになるんだよ!
IBMは企業用として生成AIのニーズを叶えるための製品群が揃っていることが特徴だね!

~㊙️機密情報も安全・安心に利用できるオンプレミス環境で生成AI利用をコスパ最強基盤で支えます㊙️~

🐤
えー、すごいですね!データを安心して使えそうですね!
でも、お客様によっては、クラウド☁️にデータをあげられない、あげたくない方もいらっしゃいますよね?
あれ?
そういえば、さっき、オンプレでも使えますって言ってましたね。

🐓
そうだよ!オンプレミスで利用できるから、より厳格に機密の保護が可能だし、安心して利用できるんだよ。

🐤
素晴らしいですね!

🐓
ところで、IBMだとオンプレミスでwatsonx.dataを稼働させるのにベストマッチなインフラストラクチャ製品があるんだけど知っているかい?
2024年のThinkによると、そのソリューションを利用すると、なんと!競合他社に比べて、60%もコストパフォーマンスがよくなる結果も出てきているんだよ!!

参考記事:Delivering superior price-performance and enhanced data management for AI with IBM watsonx.data

🐤
えーー!?そんなソリューションがあるんですか!?ぜひ教えてください!!

🐓
もちろん!→後編へ続く🙌

※1補足:
IBM watsonx(ビジネスに特化したAIおよびデータ・プラットフォーム)
 -watsonx.data 多様なビジネスデータを統合し、分析とAIを強化するデータ・レイクハウス
 -watsonx.ai 生成AI構築のための企業向けスタジオ
 -watsonx.governance あらゆるAIアプリケーションとモデルのガバナンス
補足資料:https://www.ibm.com/jp-ja/watsonx

問い合わせ情報
より詳細なご説明についてはこちらまで

またはIBM の営業もしくはエキスパートまでご相談ください。


#watsonx.data
#StorageFusion

0 comments
164 views

Permalink