2014年03月06日

OCNでメール障害

 本日、日本最大級のプロバイダの一つであるOCNのメールサービスが朝7時過ぎから夕方16時頃まで止まったそうです。
 これを伝えるニュースは、障害発生の時間並びに200万人のユーザーが被害を受けた、と簡潔に書いていました。
 自分は、二年前まで、OCNからメールサービスの提供を受けていた会社でシステム管理をやっていました。その経験があるため、その短い記事を読めば、、実際に何が起きたかが即座に想像できます。そして、身の毛のよだつような気分になりました。

 ちなみに、もし本日、私がその会社にいたら、以下のような一日になったでしょう。
 まず、朝出勤するやいなや、社内メール(こちらはOCNを使っていない)と電話で、「電子メールが使えない」という複数の連絡に対処をする事になります。
 この時点では、まだ通信の障害なのか、メールサーバーの不具合なのかの区別はつきません。
 したがって、まずその切り分けに追われる事になります。
 ちなみに、当時いた会社は、北は北海道から南は石垣島まで、全国で100近い拠点があり、その半分以上は、電子メールを使って、取引先などとやりとりしています。
 情報を調べたり、OCNに連絡して、1時間後くらいにやっとメールサーバーの障害だという事が解ります。それを上に報告した後、社内掲示板で告知するわけです。
 現場の人達が一番知りたいのは復旧見込み時刻です。しかし、こちらでは分かりようがありません。しかしながら、現場や上からは、自分宛に「いつ治るんだ」という問合せが頻繁に来ることになります。
 特に現場によっては、メールが使えないと仕事にならない所も多いので、死活問題に近いでしょう。OCNの不手際ではあるのですが、取引先にとってはそんなの関係なく、こちらの会社の不手際と見なされてしまいます。
 そして、他の日常業務や突発業務もこなしながら、復旧まで過ごすわけです。昼食休憩は最長15分、ヘタすれば昼飯抜きです。

 その会社にいた4年間、その類のトラブルで、何度もこのような経験をしました。したがって、辞めて2年経ったいまでも、本日、何があったかは我が事のように推測出来ました。
 そして、私の後任の人はもちろんですが、全国各地で、OCNのメールサーバーと契約している会社の何百人ものシステム管理者が、そのような目にあった事も容易に想像ができました。
 もちろん、絶対に故障しない機械は存在しません。とはいえ、それなりの料金を取ってやっているわけです。
 OCNにおいては、サーバー管理の担当者数と予算をそれぞれ従来の二倍くらいに増やし、絶対に同じ過ちを起こさないように改めて欲しいものです。現在は他人事であるにも関わらず、強くそう思いました。

2014年03月06日 23:43