Amazon、インターネットの一部が削除された障害の原因を説明

Amazon、インターネットの一部が削除された障害の原因を説明

Amazonは12月7日の機能停止の理由を説明し、今後、事件とその原因についてより適切に報告すると約束している。

Amazonはすでに、12月7日に数時間にわたってキャンバスの一部にアクセスできなくなったウェブサービス上のバグの原因を説明しており、それまでの間、同じことが再発する可能性があるかどうかをより明確にすることを約束したCNBC によると、Amazon は、自動スケール機能が社内ネットワークの顧客の「予期せぬ動作」を引き起こしていることを発見しました。この内部ネットワークを AWS に接続するデバイスが過負荷になり、データが停止しました。

アマゾン、12月7日の停電の理由を説明

アメリカの巨人によれば、このインシデントの性質そのものが、実際にはチームが問題を特定して修正することを妨げていたという。何が起こったのかを調べるにはログを使用する必要があり、一部の内部ツールも影響を受けました。関係者は、まだ動作していたものをすべて壊さないように、さまざまなサービスの復元に「細心の注意を払って」取り組みました。彼らは、ネットワーク クライアントのシャットダウンを妨げ、システムに回復の機会を与える「隠れた問題」を解決する必要がありました。

AWS は問題の原因となったこのスケーリング機能を一時的に無効にし、適切な解決策が見つかるまで再度有効にすることはありません。Amazon によると、隠れたバグの修正版は今後 2 週間以内に提供される予定です。繰り返し障害が発生した場合にデバイスを保護するためのネットワーク構成の追加レイヤーもあります。

将来的には、事件とその原因をより良く報告することを約束します

次回このようなエラーが発生した場合は、さらに注意する必要があることに注意してください。実際、AWS Service Health Dashboard の新しいバージョンは 2022 年にリリースされる予定で、現在さまざまな問題の視覚化と説明が改善されており、マルチリージョンのヘルプ システムがこれに役立ちます。Amazonは顧客との連絡をより簡単にします。インシデント発生時には AWS のサービスがすぐに復旧することはありませんが、少なくとも顧客は質問に答えてもらうことができます。これは Disney+ や Roomba 掃除機に関しては非常に重要です。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です