IT運用の現場では、問合せ対応やシステムの監視、障害対応などの多くのプロセスにおいて「人」が対応しています。またITシステムも複雑化しており、対応にも時間がかかる傾向があります。IT人材不足が深刻化する中、IT運用においてもより一層の効率化・高度化を行う必要性が高まっています。本稿では、AIを活用した自動化によってIT運用を支援するソリューションである「IT運用の高度化 - AI for ITOps 」について、事例とともにご紹介します。
小林 武彦 Takehiko Kobayashi
|
日本アイ・ビー・エム株式会社 コンサルティング事業本部 AIOps Technology ITアーキテクト
|
有馬 拓弥 Takuya Arima |
日本アイ・ビー・エム株式会社 コンサルティング事業本部 GenAI Delivery アプリケーション ディベロッパー
|
田端 真由美 Mayumi Tabata |
日本アイ・ビー・エム株式会社 コンサルティング事業本部 ハイブリッド・クラウド・サービス 技術理事、AI & Automation CTO
|
2008年に日本IBMに入社以降、主にJavaを用いた開発案件に従事。Watsonを活用したチャットボット構築やコールセンター高度化案件を複数件リード。現在は、AIを活用したIT運用高度化推進を担当。
|
2016年に中途入社以降、Watsonを活用したチャットの開発や、RPAを活用したIT自動化のプロジェクトに従事。現在は生成AIを活用して、お客様の業務の適用検討を支援。
|
金融機関向けのシステム開発プロジェクトでITアーキテクトとして経験を積んだ後、IBM Watsonを活用したシステムの設計・開発に従事。現在はAIやRPAなどさまざまな先進テクノロジーを組み合わせたシステム開発・運用の高度化・自動化ソリューションの開発、コンサルティング、構築、運用までを提供する組織をリードする。
|
日本は少子高齢化が進み、労働人口は年々減少しています。IT業界においてもエンジニアの人材不足に加えて、人材の流動化やシステムを熟知している経験豊富な社員の退職により、自社のシステムに精通した人材が減少していることも問題になっています。一方で、IT技術の進化は益々加速し、エンジニアは新しい技術を習得する時間が必要ですが、日常業務に忙殺されて、時間の確保が困難な状況にあります。
帝国データバンクの『DX推進に関する企業の意識調査』[1]では、DXに取り組む上での課題として、必要なスキルやノウハウがない(44%)、対応できる人材がいない(47%)が上位を占めています。
IT運用や保守の現場では、利用者からの問い合わせやシステムの監視、障害対応や対応策検討から実行までを「人」が担っており、とくにトラブル対応については有識者の知見や経験に強く依存しています。しかしIT人材不足が深刻化する中、人に依存したこれまでのIT運用業務の体制は持続困難です。IT運用においてもAIや自動化技術を活用して高度化、効率化を図り、プロセス全体の最適化を行うことが必要です。これにより、エンジニアはより高度な技術を必要とする業務に注力し、新しいスキルを習得する時間を創出することができます。
IBMでは、AIを活用した自動化によってIT運用を支援するソリューションとして、「IT運用の高度化 - AI for ITOps」を提供しています。本稿では図1に示すAI for ITOpsを構成する、UserAssist、IBM Consulting Automated IT Operation Service(AITOS)、IBM BlueBuddy、watnsx Code Assistant for Red Hat Ansible Lightspeed の4つをご紹介します。
User Assist
User Assistは、利用者からの問い合わせや定型作業の依頼にチャットボットを使用して対応するソリューションです。User Assistを導入することによりヘルプデスクの業務負荷が軽減し、複雑な問い合わせや依頼事項にオペレーターが集中できるようにすることで、利用者の利便性も向上させることが可能です。
簡単な例として、オペレーターへ利用者からシステムのパスワードのリセットについて、問い合わせがあります。このような場合に、User Assistでパスワードのリセットの依頼を受け付けることで定型化されたパスワードのリセット作業が自動的に実行され、人の手を介さずに対応を完了することが可能です。
ある企業のヘルプデスクでは、社員からの電話による問い合わせに対応していましたが、オペレーターが不在の時間帯は利用できず、休み明けは問い合わせが集中することが課題となっていました。また、社内のFAQは多岐にわたっているため、利用者自身で解決することも困難でした。
User Assistを導入後は、オペレーターがいない時間帯や休日でも問い合わせることができるようになり、利用者の利便性が向上するとともに、休み明けのオペレーター負荷の平準化も実現されました。利用者が些細な質問や人に聞きづらい質問に関して、User Assistに気軽に問合せしやすくなったという声もあります。
AITOS
IBM Consulting Automated IT Operation Service(以降AITOS)は、高度なIT運用の仕組み、主にインシデント管理と要求実現(定型作業)に対応するソリューションです。
インシデント管理では、システムに発生した問題をいかに迅速に解決させ、ダウンタイムを最小化するかが重要になります。昨今のハイブリッド・マルチクラウド環境では、アーキテクチャーが複雑化しインシデント発生時に発生個所や影響範囲を特定することが難しくなってきています。そこで、InstanaやIBM Cloud Pak for AIOpsといった製品を活用し、高い可観測性(Observability)を実現し、障害発生個所や影響範囲の特定を迅速化します。
加えて、自動化ツールを用いてインシデントに対する自動復旧を行い、ダウンタイムの最小化を実現します。もちろん、すべてのインシデントが自動復旧できるわけではなく、オペレーターによる手動復旧も組み合わせた対応が必要なこともあります。AITOSでは、検知したアラートからのインシデント・チケットの自動起票、自動復旧・手動復旧の判断や両方をカバーするインシデント運用フローが定義されており、短期間で高度なIT運用を開始することができます。
要求実現(定型作業)においても、オペレーターや保守担当者による手動対応が多いと対応完了までに時間がかかり、依頼者を待たせることになってしまいます。
AITOSでは、定型作業の受付から処理完了までを自動化することで、依頼者の待ち時間を減らし満足度向上に寄与できます。AITOSは個別に導入する以外にも、マネージド・サービスとして提供するメニューもあります。センシティブなデータを扱うことを考慮し、データは国内に保管しオペレーターも国内から作業することで、海外へのデータ転送を行わないようにしています。
ある企業では、アプリケーションが業務上正しく稼働しているかを監視するため、全体の応答速度や稼働状況を把握したいと考えていましたが、基盤観点での監視しかできていませんでした。そこで、可観測性を向上させることによりアプリケーション全体の状況を把握できるようにしました。また、セキュリティー・アラートや監視ツールからのアラートを、オペレーターがメールなどで受信し手動でチケット起票を行っていました。そのため、調査開始までに時間がかかる、転記ミスなどが発生する、オペレーターの業務を圧迫するといった課題がありました。そこで、アラートから自動的にチケットを起票することにより、年間1000件近い手動処理を削減しています。自動化によって作業ミスがなくなると共に調査着手への時間も短縮することができ、迅速な対応を実現しました。バックアップ取得などの定型作業の一部も自動化し、オペレーターの負荷軽減を推進しています。
IBM BlueBuddy
インシデントの発生から対応まではスピードと正確性を求められます。同時に、インシデント発生箇所の調査や発生原因の分析にはスキルやノウハウが不可欠であり、マニュアルを適切に読解し解決策を導き出す能力も必要です。そのため、対応するエンジニアの教育には時間とコストが必要であり、経験豊富なエンジニアに負荷が集中する傾向があります。作業の負荷が偏ることによって、運用の属人化に陥る原因にもなり、担当者が変わった際の品質の担保や対応スピードの維持が困難になります。
IBM BlueBuddyは、システムのインシデントが発生したときに、問い合わせ対応や障害内容から過去の類似事象や関連情報を検索し、得られた情報を元に生成AIが回答案や解決策を提案します。これにより経験の浅い担当者でも過去の知見やノウハウを利用することができ、システム・エラー発生から問題解決にかかる時間の削減に貢献します。
ある企業では、IBM BlueBuddyを導入した結果、94%の回答案が有用であったと評価されました。インシデント対応は、経験の浅いエンジニアは経験豊富なエンジニアと比較して調査や分析に時間がかかる傾向がありますが、IBM BlueBuddyを活用することで生産性も向上し、インシデント対応の工数が20%削減できました。
watsonx Code Assistant for Red Hat Ansible Lightspeed
運用作業の自動化ツールの1つとして、Red Hat社のAnsibleがあり、各種基盤作業やミドルウェアの設定作業などを自動化することができます。作業を自動化することで、迅速な対応やオペレーションミスの低減を実現することができます。一方、Ansibleで作業を自動化するには、作業内容・手順を定義するプレイブックを作成する必要がありますが、作成に時間がかかる・プレイブック作成のスキルが必要という課題があります。
watsonx Code Assistant for Red Hat Ansible Lightspeed(以降WCA4ALS)は、生成AIを活用してプレイブックの作成を支援する製品です。自動化したいタスクを自然言語で記述すると、WCA4ALSがプレイブックの生成を支援します。WCA4ALSを活用することで、プレイブックのスキルが十分にない開発者であっても、作成時間を削減でき、迅速な自動化が可能になります。
例えば、新たなセキュリティ上のリスクが発見された場合、該当する全サーバーに対して対応を実施する必要があります。各サーバーへの対応を手動で対応するのは時間も手間もかかります。Ansibleによる自動化を行うにしても、プレイブック作成の熟練者が必要となってしまいます。WCA4ALSを活用することで、短時間で全サーバーに対するプレイブックを生成し自動実行することができます。
IBM社内では、WCA4ALSを活用することで、60%のプレイブックを自動的に生成し、30%の生産性向上を果たしています。また、WCA4ALSを活用することでプレイブック作成の経験が少ないメンバーでも開発が可能となることで、プレイブック作成の負荷が平準化され、担当部門全体での効率化を実現しています。また、海外の企業においても、WCA4ALSを活用することで運用作業自動化の開発工数と関連コストを30%削減し、自動化の推進によってシステム運用コストも40%以上削減することができました。
Ansibleによる自動化をUser AssistやAITOSと組み合わせることで、各種作業のセルフサービス化を行い、迅速な対応やユーザーエクスペリエンスの向上、オペレーターの負担低減を実現します。
まとめ
AIに経験者のスキルやノウハウを学習させることにより、経験者の知見を他メンバーが活用できます。学習したAIを経験の少ない人材が活用することで、活躍できる範囲が広がり有識者への依存を減らすことを可能にし、全体的な効率化を実現します。効率化によって生み出された時間は、新技術の習得や新規サービス検討など更なる価値向上に向けた時間に充てることが可能になります。ITシステムは今や社会インフラの一部であり、それらを維持・運用していくIT運用の重要性も増してきています。少子高齢化で労働人口も減っていく中で、効率的なIT運用へのシフトは“待ったなし”です。
今回ご紹介した仕組みをさらに進化・深化させ、最終的には人の関与を最小限とした「自律型IT運用」を目指していきます。
*「IT変革のためのAI」テーマの他の記事はこちら↓
IT変革のためのAI : ソリューションでAI活用推進
IT変革のためのAI :コード生成のためのAI(Java編)
参考文献
[1] 帝国データバンク(2022)「DX推進に関する企業の意識調査(2022年9月)」https://www.tdb-di.com/2022/10/sp20221028.pdf
IBM、IBM ロゴは、米国やその他の国におけるInternational Business Machines Corporationの商標または登録商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である場合があります。現時点でのIBMの商標リストについては、https://www.ibm.com/legal/copyright-trademarkをご覧ください。
ProVision一覧はこちらから