
DXやデジタル化が急速に進む中、様々なシステムやサービスが展開され、ビジネスで扱うデータ量が増加し続け、その運用に多大なコストやリソースが必要とされています。
経済産業省が発表したレポート「IT人材需給に関する調査」の中でも、IT人材は2030年には最大79万人不足するというデータがあります。このような状況の中、システムの運用を効率化することができるAI(人工知能)や機械学習の技術が注目されています。
本記事では、AIや機械学習を活用してシステム運用を自動化し、運用を効率化させることができる運用手法として注目されている「AIOps」について解説していきます。
<目次>
AIOpsを導入する主なメリット
・人的ミスを防ぎ、アラート予測で生産性向上
・保守運用コスト・リソースの削減
・リアルタイムなデータの集約と分析が可能
AIOpsの活用が期待される場面
・パフォーマンス監視・分析
・異常検知
・原因の特定・分析
・ITサービス管理
・自動化
AIOpsとは?
AIOpsは、Artificial Intelligence for IT Operationsの略称であり、「AIを活用したIT運用」という意味です。AIや機械学習の技術で大規模で複雑化したネットワークデータを学習させ、煩雑化するITシステムの運用を自動化することで運用の効率化が期待できる運用手法です。
AI・機械学習の技術によって、これまで人の手で行われてきたシステム運用業務をサポートすることができ、より正確且つ効率的に運用することが可能となります。機械学習とは、膨大なデータからパターンやルールを学習することで、正しい結果を導き出すことができる技術です。
たとえば、ECサイトに出てくる「あなたにおすすめの商品」は、過去の閲覧や購入履歴、同じ商品を購入した人とのパターンを分析して興味がありそうな商品を自動で提案してくれています。これもAIの技術です。従来の商品の売り方では店員が顧客の興味や趣向を記憶して提案していましたが、これをAIが自動化してくれます。
このように、人の手で実施してきた業務をサポートする技術をITのシステム運用へ活用するのがAIOpsです。
AIOpsが注目されるワケ
AIOpsが注目されている背景には、冒頭でも述べたエンジニア不足が起因しています。現代では企業のDX推進やデジタル化が急務とされ、あらゆる業務でシステム化が進んでいます。
その結果、システム運用の業務負荷が重くなり、運用業務に対して貴重なエンジニアリソースやコストを割かなければならないケースが増えています。また、あらゆるネットワークやシステムから膨大なデータが出力されるため、それを分析・解析するエンジニアの負担も大きくなっています。
Gartner社が発表したレポートによると、2017年時点でわずか5%の企業しかAIOpsの活用は進んでいませんでしたが、2022年までに大手企業の40%がビックデータと機械学習を組み合わせることで、運用監視やサービスデスクなど様々な業務をサポート・効率化させていくと予測しています。つまりAIOpsを活用した運用業務を行う企業が大幅に増加することを予想しているのです。
今後、企業の成長において、システム運用に必要なコストやリソースを最低限に抑えることが重要で、必要不可欠な要素となっていくでしょう。これらの問題を打破する手段として、運用業務を自動化し、システム運用をサポートしてくれるAIOpsが注目されるようになったのです。
AIOpsを導入する主なメリット
本章では、AIOpsを導入した場合、どのようなメリットが得られるのかを具体的に説明します。今回は大きなメリットである3点を紹介します。
人的ミスを防ぎ、アラート予測で生産性向上
最初のメリットは、AIによる安定した自動化やサポートによりヒューマンエラーを防止することができる点です。人の手では体調や環境によりパフォーマンスが安定しませんが、AIであればパフォーマンスを一定に保つことができます。
また、発生したアラートやその対処方法をAIが分析・学習することにより、対処不要なアラートと重大なアラートを自動で切り分けることやアラートを予測し未然にアラートに対処することでシステムダウンのリスクを回避することができます。その結果、問題の処理にかかる時間を短縮できるほか、運用業務の確実性・生産性を高めることが可能です。結果として顧客満足度の向上につながることも期待できます。
保守運用コスト・リソースの削減
アラート発生の原因と分析、修復を自動で実施してくれるAIOpsは、貴重なエンジニアのリソースを節約・削減することができます。また、基本的なアラート対応など単純な作業を自動化することができれば、運用に伴うコスト面に大きなメリットが得られます。
これにより、ビジネスの重要な決断やクライアントとの信頼関係構築など、人にしかできない重要な業務へ注力することができるのです。
リアルタイムなデータの集約と分析が可能
企業のDX戦略に伴う業務のデジタル化が進んだことにより、サーバー、クラウド、ネットワーク機器やファイアウォールをはじめとするセキュリティ機器など、異なるソースから膨大なログやデータが出力されます。
これらの膨大なデータを集約し、分析を行うのは人の手だけではとても追いつきません。だからこそAIOpsを導入し、集積された膨大なデータを自動的にデータ整形し、分析する一連の流れを実現することで、リアルタイムでのデータ分析が可能となります。大きな変化にも柔軟に対応できる力が必要とされるビジネスにおいてもリアルタイムのデータ分析は必要不可欠だと言えるでしょう
AIOpsの活用が期待される場面
AIOpsを導入することによって多くのメリットが得られることを説明してきましたが、実際にどのような場面で活用することができるか気になる人もいるのではないでしょうか。
今回は具体的にAIOpsの活用が期待できる場面を4点紹介します。
パフォーマンス監視・分析
保守・運用の監視現場では、常に機器からアラートやイベントログなどの大量のデータが送られてきます。耐障害性や柔軟性を重視したインフラ環境は、複雑なネットワークや多くの機器を導入することになるため、監視業務は大きな負担となっています。
AIOpsは高度な機械学習機能により、様々なデータ形式や膨大なデータ量、複雑なインフラ環境に対しても問題なく高レベルな監視、分析、保守業務を自動で行い、システムのパフォーマンスを正常に保つためのサポートが可能です。
異常検知
従来では、異常検知は人の判断が必要でした。なぜなら、条件により「異常の基準」が異なるためです。大量のアラートが検知されれば、全て確認しなければなりません。
このシステムの異常検知にもAIOpsの活用は期待できます。リンクダウンやシステムダウンといった大きな異常だけではなく、過去のデータやスコアと比較分析してKPIを学習するため、一定条件の中で閾値を超えた値に対して「異常」と判断し、検知することが可能です。
原因の特定・分析
イベントやアラートを検知した場合、その原因を特定した上で分析しなければ適切な対応を実施することはできません。そのため、原因の特定や分析には多くの工数やリソースが必要となっていました。
AIOpsでは機械学習による根本原因の分析と、それを解決する方法を特定することが可能です。また原因分析により、対処が必要か不要かの判断もできるため、運用コスト削減にも大きく貢献してくれます。
ITサービス管理
ユーザーに適切なITサービスを提供するため、ITサービスの設計からサポートまでマネジメントするITサービス管理(ITSM)にもAIOpsは有効な手段となります。
パフォーマンス管理やストレージ管理をはじめとするデバイスの管理を、ビックデータを基に分析した正確な予測により、利用状況の傾向や問題解決などを適切に実施することが可能です。
自動化
従来では、一つの機器からアラートが発生した場合、関係する他の機器の情報を人の手で取得し、原因の分析を行う必要がありました。なぜなら、アラートの内容やタイミングによって、どの機器情報が必要かは人の判断がなければ対応できなかったからです。
これらの判断を自動化することがAIOpsで可能となります。発生したインシデントに対して必要となる機器からログやイベントを取得、分析することによって対応が必要か不要かを判断することができるのです。
まとめ
本記事では、AIOpsとはどのようなものか概要を解説した上で、メリットや具体的な活用シーンを紹介しました。
AIOpsの導入は、スモールスタートでも始めることが可能です。最初から全社のシステムへ導入するのではなく、特定の部署や1つのシステムから段階的に導入することができます。AIOpsの多くのメリットを得るためにも、まずはスモールスタートからの導入を検討してみてはいかがでしょうか。