お知らせブログ Information

【報告】サーバー障害について

2011-04-22 (Fri) 17:00
この度は、お客様に多大なご迷惑をお掛け致します事をお詫び申し上げます。

下記、日時にサービスにアクセスできない状態が発生しました。
尚、現在は負荷を考えアクセス解析を除いた形で公開しております。

さらりとWEBのサービス提供会社より今回の障害について下記経緯の報告がございましたのでお伝えいたします。

-------------------------------------------
□日時:
2011年4月22日 午前1時 から 午後15時40分まで

□症状:
アクセスが出来ない状態

□原因:
詳細現在も調査中ですが、RAIDモジュールに問題があり外付けのHDDを認識できなかった可能性が高い。
今後もログを解析し詳細を割り出していきます。

□対応:
(1)サーバすべての機能を細部まで確認。
(2)RAIDモジュールのリセットを実施。→正常に稼働。
(3)RAIDモジュールの前倒しにて東京より航空便で取り寄せ(交換は日程を決め実施予定)
※RIDモジュール(サーバで利用する基盤)

□□□障害の対応状況について□□□          
4月22日(金)午前1時00分
弊社で毎分ごとに行っていますサーバチェックにより、サーバの障害の兆候がみられた為、
即サーバ会社様に連絡を取り、原因の調査を行ってもらう手配をお願いしました。

4月22日(金)午前4時30分
サーバ会社様の調査及び弊社とのやり取りでハード自体に故障が発生している可能性があるかも知れないという
予測が濃厚になってきましたが、引き続き調査を続行してもらいました。

4月22日 午前6時00分
ハード面と仮定し、サーバ会社様よりメーカー技術者様に連絡を取っていただき調査を依頼。
原因が予測ではあるが仮定出来ましたのでお取扱店様に1回目のご案内(ホームページ並びにメール)を
させていただきました。

4月22日午前9時00分
メーカー技術者様が、現地で調査開始。
併せて最悪の場合を想定して、弊社にて新サーバ構築を同時進行を開始しました。

4月22日午前11時00分
現地で細かいハードの切り分け調査を継続。
かなり細部まで調べている為、原因追究に、時間がかかりました。
お取扱店様に2回目のご案内をさせて頂きました。

4月22日午後15時00分
RAIDモジュールの可能性が濃厚になり、前倒しで早急にRAIDモジュールの部品を取り寄せ。
(本日、東京より現地に18時着)
その後、調査の為RAIDモジュールのリセットを実施。その後、すべてが正常に稼働。
様々なテストを行い、現状、部品を交換せず共、公開しても大丈夫と判断。

4月22日午後15時40分
アクセス解析の負荷を考え、アクセス解析を除いた形で暫定的に公開。
お取扱店様に3回目のご案内をさせて頂きました。
現在は、サーバも問題なく稼働しております。
今後共、注意深く確認して参ります。

なお、取り寄せました部品、RAIDモジュールはログを解析しながら近日中に判断し、
定期メンテナンスと同時に入れ替え予定でございます。

この度は、長時間にわたりお客様に多大なご迷惑をお掛けしました事を、重ねてお詫び申し上げます。

今回の件で、お客様への連絡方法及びサーバの危機管理など
たくさんの課題が発生いたしました。
しっかりと考えさせて頂き、改善案が固まり次第、
再度、ご報告させて頂き実行させて頂きます。
その他に問題点がございましたら、ご連絡頂けますと幸いでございます。

安定した設備や設計や運用を行うよう努力して参りますので、今後ともよろしくお願いいたします。
この度は、本当に申し訳ございませんでした。
心からお詫び申し上げます。
PAGETOP