IBM TechXchange Japan Storage User Community

 View Only

【振り返り】9月6日 TechXchange ”これからデータ活用に求められる基盤 ~事例から理解するデータ活用基盤のカタチ~”

By Shu Yoshioka posted 20 hours ago

  


こんにちは、プリセールス担当の吉岡です。

2024年9月6日、IBM Japan ストレージによる IBM Japan Storage TechXchange が実施されました。

今回は本イベントの 1 Session である ”これからデータ活用に求められる基盤~事例から理解するデータ活用基盤のカタチ~” についての内容をご紹介したいと思います。

セッション概要


~昨今のAIブームをはじめとして、データ活用に必須となるストレージ基盤に求められる要件や要求のレベルは以前に比べて年々増加しています。
「どこから検討すべきか」「どんな基盤にしていくべきか?」など豊富な事例を交えてディスカッション形式で進行していきます~

→ IBM Japan ストレージ主催のイベントではめずらしい(?)、 ビジネスパートナー様を交えたパネル・ディスカッション形式となりました。

パネリストは以下の方々となります:

  • 株式会社イグアス ビジネス開発本部 執行役員 本部長: 野澤様
  • 株式会社イグアス パートナービジネス事業部 テクノロジー製品本部 システム製品営業部留田様
  • TCS株式会社 ソリューション事業本部 コンサルティング統括部大島様
  • 日本アイ・ビー・エム株式会社   テクノロジー事業本部 ストレージ・テクニカルセールス 吉岡

それでは、ディスカッションの内容を事例を含めてご紹介したいと思います。
本記事では抜粋して掲載しておりますので、詳細が気になる方は<こちら>のファイルをご覧ください。

ディスカッション内容


1.【事例】データ分析で営業活動の成果を最大化(TCS大島様)

TCS大島様より、自動車ディーラ様向けの自動車販売予測システムの事例をご紹介いただきました。 

■概要

この事例は販売会社様の方で蓄積されている販売データを分析・可視化するサービスです。
具体的には、ベテラン営業さんが持つ暗黙知だったり勘だったり、経験値とかスキル、ノウハウをデータと照らし合わせて、
それをデータモデル化してお客様の購買行動を可視化してそのデータをご提供するサービスとなります。

■主なストレージ要件

  • 貯めたデータにアクセスするために、外部ソフトウェアからの受け付ける様々なインターフェースに対応している
  • 詳細な洞察機能の提供や素早い復旧に対応している

■ディスカッションのやりとり(抜粋)

  • データ貯めるにしても最近はランサムウェアにやられたといったことがほんと多い
  • データの保全や仮に暗号化されても素早く復旧できるといったこと、検知だったりすばやい復旧だったりといったことをストレージ自体に求めているお客様も多い
  • セキュリティー侵害を受けてしまった際にフォレンジック対応も必要になってくる可能性もあるのでログをためておく、いう意味でもストレージは重要な役割を持つ
  • アプリケーション側に接続の選択肢を持たせてあげる、というのが重要
    • 例えば、汎用的に使用されるCSVといったファイルベースや、ODBC/JDBC、SQLなど
  • クラウド上のストレージに直接接続とかだと REST API が対応しているかどうかも重要

他システムとの多様な接続性の担保は、今やデータ基盤には欠かせない必須要素と言えるでしょう。
また、データを素早く復旧する話題が上がりました。



2.【事例】E コマース  データレイク基盤  事例(IBM 吉岡)

IBM 吉岡より、E コマースのデータレイク・ソリューションの事例をご紹介しました。

■概要

この事例ではS3 ストレージの IBM Storage Ceph(以下 Ceph)、データパイプラインとして  Kafka & Knative (Openshift)、分析基盤として IBM watsonx (Spark、Prestoを包含) を使用しています。
このシステムの一データの取り扱いおよび、データの流れは以下のとおりです:

  1. 店舗の売上データを日次バッチ処理で、Ceph のバケットに 収集 
  2. バケットにアップロードされると、Cephのバケット通知を使用して、コンテナ上のサーバレス上でリアルタイムでの分類処理、その後再度バケットに格納
  3. Spark のジョブでデータのクレンジング処理を実行
  4. Presto 側で非構造化データから構造化データに変換。その後、公開用バケットにそのデータを配置
  5. 小売部門による BI ツールを使用して公開用バケットにアクセスし、分析業務を実行

■主なストレージ要件

  • バケットにファイルが更新された後、後続処理を実現するための外部通知機能
  • ユーザー認証(SSO、OpenID Connect)によるセキュアなバケットデータ・アクセス
  • OSS 分析ツール(Spark、Presto)との親和性

■ディスカッションのやりとり(抜粋)

  • ランサムウェアなどの外部からデータを保護するためには、イミュータブルなデータを保証できる仕組みが必要
  • ユーザー認証やデータの暗号化対応に、外部製品との柔軟な組み合わせができるとソリューションの幅が広がってよい
  • ストレージの機能に不要なデータを自動削除できる機能があると、無駄に逼迫するリスクが減るのでよい


認証・暗号化、OSS ツールの連携など、外部ソリューションとの組み合わせの話題が上がりました。
弊社の IBM Storage Ceph もそうですが、データ統合基盤は今後もこのような外部連携の強化が求められると感じます。

最後に


イグアス野澤様より、締めのお言葉として以下のコメントをいただきました。
「企業は色々なデータを持っていますので、様々な媒体を使って皆様と一緒に勉強しながら、
データをどのようにうまく活用できるのか、歩んでいければと思っております」

IBM Japan ストレージ は 今後も今回のようなディスカッション形式のイベントを増やしていき、
皆様と一緒に切磋琢磨しながら盛り上げて行きたいと思っておりますので、乞うご期待ください!

0 comments
14 views

Permalink