ヤフー子会社のファーストサーバは2012年7月31日、6月20日に発生した大規模障害(関連記事)についての調査報告書(最終報告書)を公表した(写真)。報告書は、ファーストサーバに利害関係のない3人の委員による「第三者調査委員会」(関連記事)が作成した。同社Webサイトに「要約版」を掲載している。
報告書は調査対象とする事故を、6月20日に発生した「第1事故」と、第1事故で消失したデータが想定外の場所に復元された「第2事故」(関連記事)の2つとしている。
1人だけ自作プログラムでメンテナンス
報告書は、第1事故の事実関係について次のように言及している。ファーストサーバではシステム変更を実行する際、社内マニュアルに沿って実行することになっており、第1事故の原因となったシステム変更の担当者(A氏)以外は社内マニュアルに従っていた。
ところが、A氏だけはマニュアルに従わず、自作の「更新プログラム」を利用してシステム変更を行っていた。A氏は今回の事故発生時だけではなく、以前から独自の作業手順を実行しており、上長もこれを認識していながら容認していた。
6月20日の第1事故発生前の午後5時頃に、A氏はメールシステムの障害対策を行うため、自作の「更新プログラム」をさらに改変して、対象サーバー群で実行しようとした。この改変時に「“対象外サーバー群”についてファイルを削除する」というコマンドを消し忘れた。
このため、“対象外サーバ群”のデータがバックアップも含めて全て削除されてしまった。A氏は午後5時48分頃、監視システムによるアラートで異常に気づき、更新プログラムを緊急停止したが、この時点でほとんど全てのデータが消失していたという。
報告書は、この第1事故の事実関係を検討したうえで、「過失の内容及びその程度」について言及している。