本日自分が仕事している裏側でAWSの障害が発生していたみたいなので、どんな事が起きて、どんな影響があったのかをまとめつつ追っていきたいと思います。
障害の概要
- 発生日時:2025年4月15日(火)午後4時40分頃~午後5時43分頃
- 影響範囲:東京リージョン内の単一アベイラビリティゾーン(apne1-az4)
- 原因:主電源および予備電源の両方が停止したことによる停電
- 影響内容:
- Amazon EC2インスタンスの接続障害
- 一部のAWSサービス(例:Lambda、RDS、CloudWatchなど)でのエラー率増加やレイテンシーの上昇
- 影響を受けたインスタンスを利用する他のAWS APIにも問題が発生
おおよそ1時間くらいで復旧していますね。使ってる側としては1時間稼働しないことで大きな損害はあるかもだけど、システム屋的には1時間で解決できるのはすげえよ。日本企業だったらどう報告するかを決めるだけでもっと時間かかるぞ。
影響を受けた主なAWSサービス
以下のAWSサービスに影響があった模様。
- Amazon EC2(仮想サーバー)
- AWS Lambda(サーバーレス実行環境)
- Amazon RDS(リレーショナルデータベースサービス)
- Amazon CloudWatch(監視サービス)
- AWS Systems Manager(インスタンス管理)
- Amazon Elastic Container Service(ECS)
- AWS Transit Gateway(ネットワーク接続ハブ)
- Amazon Elastic Load Balancing(負荷分散)
- AWS NAT Gateway(プライベートネットワークの外部通信)
- AWS VPCE PrivateLink(プライベートなVPC通信)
- Amazon Redshift(データウェアハウスサービス)
- AWS Network Firewall(ネットワークレベルのセキュリティ)
いやあ、ほとんど触ったことないわ。一応職場の開発環境はEC2に乗ってるんだけどね。まあ開発工程始まってねえけど。このブログもAmazonlightsailに乗ってるけど、正直あんまり意識しないレベルでしか触ってない。まあ運用フェーズだし、そもそも個人ブログだしそんなもんだろうとは思うけどね。
影響を受けた主な企業・サービス
- PayPay:支払いやチャージ、送金が一時的に利用できない状態に。
- au PAY:一時的に不具合が発生し、支払いなどに影響。
- 日本航空(JAL):搭乗に必要なQRコードが読み取れなくなるシステム障害が発生。
- &be(アンドビー):公式オンラインストアにアクセスできない不具合が発生。
- 複数のスマートフォンゲーム:「ファイナルファンタジー ブレイブエクスヴィアス」「デュエル・マスターズ プレイス」「アサルトリリィ Last Bullet」「プロジェクトセカイ カラフルステージ! feat. 初音ミク」など。
これらはちょっと調べたら出てきたやつだけど、おそらくもっと多くのサービスに影響があったんだろうなって思う。
参考リンク
最後に
AWSの可用性は99%/年となっている。なので、年間トータル3日は何かしらの障害で正常稼働ができない。業種にもよるが、これが致命的になるケースもあるし、なんなら日本の顧客は年間100%の可用性を求めることが多い。一時期はクラウド移行が多かったが、恐らく近年は大手ほどオンプレに戻っているのが現状だと思う。
AWS Well-Architected フレームワーク 可用性
それと、よく聞くのがサーバー運用費の問題。AWSは稼働状態や為替の影響で毎月使用料が変動するため、運用コストの計算が難しい。利用しない時間帯はサーバーを落としたりと、結構工夫しなければいけないこともある。
何となく日本の文化とめっちゃ相性悪い気がしているが、個人利用している分には快適だ。TeraTermやらWinSCPやら職場でよく見るやつらも使えるし、シェルスクリプト作るときとかの実験環境にもできる。
今のところまだ職場でAWSを触る機会は少ないけれど、開発フェーズに入ったらゴリゴリ触ることになると思うので、その時を楽しみにしたいと思う。
Excelおじさん万歳!まあ工程的にみんなExcelばっか触ってるけどね。飽きたぜ!
コメント