連載コラム 第96回:Redmine を使ったインシデント管理

昨今のコロナウイルス禍で、IT 部門においては、在宅勤務環境を整えるためにネットワークやサーバーなどのシステム強化・更改、オンライン会議システムなど円滑なリモートワークのための多種にわたるシステム導入や切り替えがおこなわれたかと思います。

また、IT 運用・保守の現場では、リモートワークによる柔軟な業務変更により監視の強化や業務フローの変更、思わぬトラブル対応に追われるケースがあるかもしれません。

IT システム導入後の運用は、システム維持管理のために、リソース状態や死活・サービス・プロセスなどを 24 時間体制で監視し異常把握や対処などおこなわれているかと思います。

監視システムから異常が発生した際、今まではオフィス内でのコミュニケーションで調整し必要な対応を業務フローに従い円滑におこなえていたかと思います。ですが、with コロナ時代においては、リモートワークと出社のハイブリットな勤務形態によりメンバー同士での共通認識の形成が難しくなったり、急なアラート対応に遅れが出てしまったりしているのではないでしょうか。

そこで、本コラムでは、インシデントの管理ツールとして「Redmine」で、IT システム情報管理ソフトウェア 「System Answer G3」からのアラートを管理する方法をご紹介します。

「System Answer G3」は、1 分間隔で収集した過去 5 年間の非圧縮データを保持し、過去データから現在そして未来の傾向や稼働比較など予防保守にかかわる対応や分析などがおこなえます。
一方、「Redmine」は、プロジェクト管理ツールであり、タスクの進捗管理などがおこなえます。

「Redmine」を活用することで、「System Answer G3」で監視した結果のアラートをインシデント管理のプロジェクトに対しチケットとして発行し、発行したチケットの対応有無を管理することで、アラートへのインシデント管理をおこないやすくし、漏れなどを防ぐことにも役立ちます。