
「不適切な画像」の投稿などのユーザーレベルでの運用上の問題はいくつか出たものの、サーバー自体はリリース後一週間の間なんの問題もなく稼働していたPhotoShare。今日は天気のよい日曜日なので、家でのんびりしようとPhotoShareで遊んでいると、朝の9時(シアトル時間)を過ぎたあたりからどうも動作がおかしくなる。サービスそのものは稼働しているようだが、画像の読み込みに失敗しているようだ。
あわてて増井君に連絡をして調べてもらうと、ユーザーから投稿してもらった写真をしまってあるAmazonのS3サーバーが落ちているという。Amazonのウェブサービスのステータスページを見ると、どうやらS3は全滅らしい。
幸いなことに、ユーザーがPhotoShareにアップした画像は、一度EC2側のアプリケーション・サーバーにキャッシュし、そこから非同期でS3に移すというアーキテクチャになっているため、S3が落ちてから投稿された新しい画像にはアクセスできるので、「最新の画像」のコーナーに何も見えなくなる、ということはない。
それでも、ユーザーアイコンは表示できなくなるし、「お気に入り」や「人気の写真」などが軒並み全滅なので、既存ユーザーが離れてしまうかもしれないし、新規ユーザーは写真の投稿すらしてくれなくなる可能性もある。リリース後わずか一週間のPhotoShareとしては一大事だ。
とは言っても問題はAmazon側にあるため、こちらで出来ることはあまりない。仕方がないので、S3へのwrite-throughの部分を一時的にオフにして、とりあえず今日投稿される画像だけは確実にキャッシュした上でS3の復旧を待つことに。
管理人の私は、ユーザーに対するステータスを15分ごとに報告するぐらいしかできることはない(この報告そのものも画像で行うところがPhotoShareの特徴)。
「アルファ・ユーザーたちからの写真の投稿がなかったらどうしよう」という気持ちではらはらしながら午前中を過ごしたのだが、正午過ぎにファンの数で1・2位を争う{smash}とMagdalenaからの投稿があり、少し安心する。
4時半を過ぎたあたりから徐々にS3が復活し始め、それと同時に他のアルファ・ユーザーたちも投稿を開始し、なんとか最悪の事態は避けられた感じではある。
しかし、Amazonを信頼してPhotoShareをホスティングしてもらっているのに、7時間半もS3をダウンさせてしまうとは困ったものだ。まあ、この手の問題は自分たちでサーバーを管理しても起こりうる話とは言え、こんな風に「自分では何も出来ない状況」に陥る可能性があるのが、クラウドコンピューティングを使う時のリスクであることを再認識したしだいである。
それにしても、日曜の朝からこれは勘弁して欲しい。ああ、疲れた--;