IBM TechXchange AIOps Group Japan

AIOps Group Japan

当ユーザーグループは、AIOps製品(Instana, Turbonomic, Cloud Pak for Watson AIOps, IBM SevOne NPM, Flexera One with IBM Observability, IBM Workload Scheduler等)

 View Only

パーソルホールディングスが挑む「DX推進と一体のIT運用保守改革」|2025/6/5開催イベントレポート

By Miho Kataoka posted 2 days ago

  

20256月5日に「IT Leadership Agenda 2025」が、「ビジネスを牽引するITの最適解~AIを用いたIT運用の自動化とアプリ基盤のモダナイズ~」をテーマに、東京都港区のザ・グランドホールにて開催されました。その中で行われた講演の抄録をお届けします。

   

【講演抄録】20256月5開催 IT Leadership Agenda 2025 お客様事例講演

パーソルホールディングスが挑む「DX推進と一体のIT運用保守改革」

   

DX推進によりシステムが増えた結果、運用保守のコストも大きく増加してしまったという組織は多いでしょう。この課題に「DX推進と運用保守改革は表裏一体」との考えから挑んでいるのがパーソルホールディングス株式会社(以下、パーソルホールディングス)です。同社は、より高品質で効率的な運用保守とコスト抑制を両立させる運用保守DXの実現に向け、IBMの運用保守自動化ツール群のPoCProof of Concept)を実施。コストを抑えながら全体で80%の工数を削減する見通しを得ました。

   

パーソルホールディングス株式会社
グループAIデジタル変革推進本部 ビジネスITアーキテクト部
コーポレートDX室 兼 テッククオリティアンドイノベーション推進室 室長
菅井 俊氏

   

   

DX推進によりシステム運用保守費も大きく増加

   

「“はたらくWell-being”創造カンパニー」として、2030年には「人の可能性を広げることで、100万人のより良いはたらく機会を創出する」ことを目指しているパーソルグループ。現在はテクノロジードリブンの⼈材サービス企業を目指し、テクノロジーを事業成長のエンジンのひとつとして定義しています。

グループ共通業務のデジタル化の旗振り役を務めているのがパーソルホールディングスのグループAIデジタル変革推進本部 ビジネスITアーキテクト部です。同部でコーポレートDX室の室長を務める菅井俊氏は、パーソルホールディングスがDXを推進する中で直面している課題の一つとして「運用保守費の増加」を挙げます。

   

2024年度は業務効率化と高度化による生産性向上を目的に99件の施策を実施し、年間25,000時間の削減効果を得ました。それによりシステムの初期導入費やライセンス費が増えるのは当然として、運用保守費もかなり増えています」(菅井氏)

   

ビジネスITアーキテクト部がサービス提供しているシステムは2023年度から2025年度の間に40%増えて105個となり、Amazon Web ServicesAWS)のEC2で運用するサーバーの台数は230台に達しています。

   

   

運用保守の品質向上とコスト抑制に最新ツールで挑む

   

DX推進に伴うこれらの変化は、AWSの利用料やパートナーに委託しているサーバー保守要員、重度のシステム障害の増加など、ビジネスITアーキテクト部のIT運用保守にさまざまな影響を及ぼしています。リスク・アセスメントの対象も大きく増えました。

   

「多くのサーバーを抱えているため、脆弱性の件数も膨大です。ライフサイクル管理も必要であり、EOL(サポート終了)を迎えるソフトウェアも数多くあります。システム数が増えればセキュリティー対策としてログ分析による監視も強化しなければなりません」(菅井氏)

   

これらの変化に対応していくにはどうすべきでしょうか。運用保守のやり方を現状のままとするなら維持コストが増えますし、維持コストをそのままにするなら、システムを選別して優先順位を設定しリスクが高まることを許容するかの二択になるのが一般的です。 

しかし、ビジネスITアーキテクト部は、「全ての基準を引き上げながらコストも抑え、効率化を進めてIT運用保守のDXを実現する」というチャレンジに挑むことを決断します。そのための解決策を考えるに当たり、前述した変化によって生じている課題を次のように見定めました。

   

  • コストの増加AWSのリソース管理が課題
  • 障害件数の増加:アプリケーション・モニタリングが課題
  • リスク・アセスメント対象の増加IT資産管理が課題
  • セキュリティー・インシデントへの対応:ログ分析が課題

   

これらをすべて手作業が中心のアナログで行ってきた同社は、それぞれの課題に対して次のツールを活用することを検討。20247月より各ツールのPoCProof of Concept)を順次進めました。

   

   

出典:パーソルホールディングス株式会社

   

   

AWSのリソース最適化を6.25時間から10分に短縮

   

リソース管理における改善対象は、AWSのリソース使用量を最適化するプロセスです。このプロセスは「調査」「計画実行」「確認」の3フェーズから成りますが、前半のフェーズで高いスキルが求められます。全プロセスを行うのに1回当たり6.25時間かかり、230台のEC2サーバーのリソース最適化を年4回行うとすれば単純計算で5,750時間が必要です。これでは最適化に要するコストがAWSのコスト削減分を上回ってしまいます。

   

「そこで、調査だけでも効率化したいと考えました。当社はAzureも使っているのでAWSと一元管理したいですし、経験の浅いメンバーでも簡単に調査できる方法が必要です」(菅井氏)

   

この課題に有効なのがTurbonomicです。ITリソースとコストの最適化を図るツールであり、AWSAzureなどを一元管理できます。クラウド上のサーバーに逐一アクセスしなくてもリソース管理が行えるためリモート接続が不要であり、セキュリティー・リスクも低減できます。

   

「常に適切なリソース量を提案してくれるので、人による調査や判断は不要です。導入の決め手となったポイントは、提案されたプランに問題がなければ『実行』ボタンをクリックするだけで自動的に設定を変更してくれる点です」(菅井氏)

   

これにより誤設定のリスクを減らせるだけでなく、設定した日時になったら過去のデータに基づいて最適なプランに自動変更するなど、リソース管理プロセス自体を自動化することもできます。

PoC20数台のEC2サーバーで行い、AWSの利用料を20%削減できるほか、サーバー1台当たりの作業工数を6.25時間から10分程度と97%削減できることがわかりました。

   

出典:パーソルホールディングス株式会社

   

   

2,500時間のインシデント調査時間を半分に削減

   

アプリケーション・モニタリングについては、1回のインシデント調査にかかる時間を約50時間と仮定しています。年間50件のインシデントが発生する場合、約2,500時間の調査時間がかかります。

インシデント調査では、大きく「原因分析」と「予防対応」の活動を行いますが、それぞれについて「ログ調査はアプリケーションを開発したパートナーに頼まなければならない」「インシデントの原因調査や新たなアラートの設定ではアプリケーションの改修が必要」「エスカレーションのための報告書作成に多くの手間と時間がかかる」といった課題がありました。

これらの問題の解決策として検討したのが、システムの可観測性(オブザーバビリティー)を高めるInstanaの活用です。実際にスクラッチで開発したシステムの挙動を改修を行わずにInstanaで可視化し、さまざまな情報を子細に見られることが確認できました。特に菅井氏が「感動した」と話すのは次の点です。

   

  • バッチ処理の進行状況を自動的に可視化してチャートで表示するため、どこがボトルネックなのか、どこで処理が止まったのかがログ解析をしなくてもわかる
  • 事前にしきい値を設定し、それを超えたらアラートで通知させることができる
  • 通常時と異なる挙動を検知するとAIが自動的にアラートを上げるため、インシデントの予防ができる
  • AIが検知した異常値を即座にアラートとして設定できる

   

これらの特徴により、調査や解析の時間を大幅に短縮して復旧対応に注力できることが大きなメリットです。

   

「何か問題に気づいた際、今見ているダッシュボード画面のリンクをそのまま他のメンバーやパートナーに送ることもできます。時間と設定が反映されたユニークなリンクを送れるので、スクリーンショットなどを撮る必要もなく、即座に情報共有できます」(菅井氏)

   

出典:パーソルホールディングス株式会社

   

Instanaの活用により、これまでの方法では2,500時間を要していたインシデント調査の時間を50%は短縮できると想定しています。

   

   

4回・368時間のリスク・アセスメント・シート作成が不要に

   

IT資産管理では、保有するIT資産についてリスクアセスメント・シートを作成し、脆弱性の件数の把握やライフサイクル・マネジメントなどを行います。これらの作業に際しては「IT資産の全量把握」が大きな負担となります。ビジネスITアーキテクト部の場合、1回の全量把握とリスクアセスメント・シート作成の作業に92時間を要しており、年4回実施した場合は368時間かかります。

この問題の解決策として検討したのが、IT資産を可視化して一元的管理を実現するFlexera Oneの活用です。同ツールについて菅井氏が非常に高く評価するのは、利用しているソフトウェアの情報(インベントリー・データ)を正規化する機能です。

   

「例えば、Microsoft SQL Serverが『SQL Server』『MS SQL 』など異なる名前で登録されている場合、IT製品の知識が豊富な担当者でなければ正確な状況を把握できませんが、Flexera Oneならば用語が正規化されているためスムーズに現状把握が可能です。各ソフトウェアの脆弱性の件数やEOL期限などもダッシュボードで一元管理できます」(菅井氏)

   

出典:パーソルホールディングス株式会社

   

PoCの結果、菅井氏は「リスク・アセスメントシートの作成に関してはFlexera Oneで十分だ」と話します。サーバーを最初に立てた段階でFlexera Oneを導入すれば、これまで年4回実施した場合に368時間かかっていたリスク・アセスメント・シートの作成時間をゼロに削減できます。

   

   

インシデント発生時のログ分析の時間を95%短縮

   

セキュリティー・インシデントの対応プロセスでは、セキュリティー侵害の兆候をログを分析して調査します。ビジネスITアーキテクト部の場合、この調査に1システム当たり凡そ1時間を要しています。

   

「課題はアプリケーション担当者による調査をいかに迅速化するかということでした。セキュリティー・インシデントの兆候を受け、関連する42のシステムを調査すれば単純計算でトータル42時間かかりますが、これでは対応が間に合いません」(菅井氏)

   

 調査に時間がかかる理由は、スクラッチで開発したシステムが多いため適当な解析ツールがなく、人が直接ログを解析しなければならないためです。この問題の解決策として検討したのが、ログ解析ツールのQRadarです。同ツールを使うことで、人による手作業のログ解析が不要となります。

   

QRadarはリアルタイムのログ解析もできますが、その場合は少しコストがかかります。『様子がおかしい』という際に随時解析するだけでも影響範囲を速やかに特定できますし、高いサーバー・スペックやコストも要求されません」(菅井氏)

   

必要なログ・データを常にQRadarに転送しておき、インシデント発生時には解析を実行するだけと使い方も簡単であり、42システムで42時間かかるログ解析の時間を95%削減して2時間に収められると想定しています。

   

出典:パーソルホールディングス株式会社

   

   

全体で80%の工数削減。人はオペレーターから計画実行者へとステップアップ

   

PoCにより、TurbonomicInstanaFlexera OneQRadarを使うことで、アナログだった運用保守プロセスの多くを自動化できることがわかりました。これにより、人の役割をオペレーターから計画実行者へとステップアップすることが可能となります。期待される削減効果も大きく、全体として80%以上の工数を削減できる見込みです。

菅井氏は最後に、「DXを推進して業務生産性を高めていくとともに、常に安心してシステムを利用できる体制を構築することも大事であり、この2つを実現した先に従業員体験の向上がある」と強調し、次のように述べて講演を締めくくりました。

   

「企業においてシステムは水道や電気と同様のインフラであり、朝会社に来てPCを立ち上げたら使えるのが当たり前だとユーザーは考えています。その当たり前を維持していくために、今後も運用保守の改革に挑み続けます」(菅井氏)

0 comments
23 views

Permalink