AWS障害発生!〜私も被りました〜

日常

いや〜、AWS東京リージョンの大規模障害がありまして、今日のTwitterは阿鼻叫喚でしたね!

いろんな企業やサービスに影響が出てしまったようです。

AWS障害、大部分の復旧完了 原因は「サーバの過熱」

原因は冷却システムの制御に障害が起きた結果、サーバーが加熱してしまい大規模障害になってしまったようです。

マルチaz構成でも障害が起きたという報告があった一方、障害が出ていると言われるazでも特に問題が起きなかったという人もいて、運ゲー感がかなり大きかったですね……。

私の場合

個人開発のサービスのうち、choobunはelasticbeanstalk(docker)、個人ブログ新刊リストはlightsailでそれぞれ運用しています。

基本全部同じaz(ap-northeast-1a)で稼働していたはずで、これは障害が起きたazらしいんですが、choobunは特に問題が起きず、個人ブログと新刊リストは落ちました。

また、個人ブログの方がなぜか数時間早く復旧し、新刊リストの方が遅れました。

その日のうちに特に何もすることなく元どおりの状態に戻ったのでそれは良かったのですが、なんだか不思議だなあと思いますね。

ブログとか小規模サービスはケチって簡単なlightsail使ってるんですけど、バックアップとか特にとってなかったので、障害起きている間は「ブログのデータ消えたら嫌だなあ…」と思っていました(笑)

DBをRDSとか使うとこういう時のためのバックアップも取りやすいし可用性も高いんですが、いかんせん高いんですよねー。

なので、elasticbeanstalkの方とDBだけでも統合しちゃおうかな?とも悩み中です。でも、あんまりビジネス用と個人ブログを混ぜちゃうの良くないと思うんですよね……。

まあ結局、どこのサービスを使っていても障害は起きるときは起きますし、マルチリージョン等はコストやレイテンシ等の問題がありますしで、こんだけ大きな障害はもう開き直るしかないですね!

コメント