T-Mobile screwups caused nationwide outage, but FCC isn’t punishing carrier

Enlarge / 2020年10月15日にニューヨークのタイムズスクエアで行われたT-Mobileの広告。
Getty Images|SOPA Images

連邦通信委員会は、アジット・パイ委員長が “容認できない “としたネットワーク障害についてTモバイルの調査を終了しました。 しかし、FCCは携帯電話会社を罰するのではなく、T-モバイルの障害を防ぐことができたかもしれない「業界で認められたベストプラクティス」を電話会社に「思い出させる」ために公告を出すだけです。

6月15日に12時間にわたって全国で発生した障害により、911の緊急電話を含むテキストと通話サービスが中断した後、パイは「T-モバイルネットワークの障害は受け入れられない」「FCCが調査を開始する」と書いています。 このような事態を受け、T-Mobileは、「FCCは調査を開始し、我々は答えを要求しており、アメリカの消費者も同じだ」と述べています。 昨日、FCCがT-Mobileに対する調査から得られた結果を発表した際にも、そのようなことが起こったようです。 パイは、T-Mobileの停電は、キャリアがそれを防ぐか最小限に抑えることができるベストプラクティスに従わなかったので、「T-Mobileの停電は失敗だった」と述べたが、何の罰も発表しなかった。 昨日の発表からこの問題は解決したように見えるが、我々は本日パイ会長の事務所に、T-Mobileに対する何らかの処罰があるのかどうか問い合わせた。 4385>

FCC details T-Mobile mistakes

スタッフ調査報告書では、T-Mobileが米国南東部で新しいルータを設置していたときに始まった停電の間に、T-Mobileが犯したいくつかのミスが指摘されている。 この地域のファイバー伝送リンクに障害が発生したとき、T-Mobileのネットワークは別のリンクでトラフィックを転送するはずでした。 しかし、キャリアは “ルーターの1つへのリンクの重さを誤って設定していた “ため、”意図した通りにトラフィックが新しいアクティブなルーターに流れないようにした “のです。 T-Mobile は、誤設定を防ぐためのフェイルセーフ プロセスも、ネットワーク エンジニアに問題を警告するためのプロセスも実装していませんでした。

アトランタ市場はネットワークの残りの部分から「孤立」し、その地域のすべての LTE ユーザーが接続を失う原因となりました。 ソフトウェアのエラーにより、アトランタ地域のモバイル デバイスが Wi-Fi 経由で IP マルチメディア サブシステムに再登録できないため、事態はさらに悪化しました。 登録システムは、デバイス登録の試みを別のノードにルーティングする代わりに、「各モバイル デバイスの再登録の試みを、市場の孤立により利用できなかった、記録に残っている最後のノードに繰り返しルーティングしました」

広告

ソフトウェア エラーは、T-モバイルのネットワークに数ヶ月前から存在していたものでした。 “T-Mobileがこのソフトウェアをネットワークに統合して以来、今回の停電が初めて顕著な市場隔離となったことから、このソフトウェア・エラーは今回の停電発生前には問題を引き起こしていなかった可能性が高い “とFCCは述べています。 定期的なテストにより、「生電話に影響を与える前に、ソフトウェアの欠陥とルーティングの誤設定を発見できたはずだ」ともFCCは述べています。

6月15日のトラブルが始まった後、Tモバイルのエンジニアは「結局、問題を誤診したために影響を悪化させる結果となった」とも述べています。 FCCの報告書は続けている:

T-Mobileは、その日のうちに故障したファイバー輸送リンクが、進行中の障害を引き起こしていると考えていた。 この信念に基づき、T-Mobile は手動でこのリンクをシャットダウンし、そこからトラフィックを転送しようと試みました。 しかし、オープン・ショートスト・パスファースト・ウェイトがまだ設定されていなかったため、この措置によって障害の初期状態が再現されました。 アトランタ市場の LTE ユーザーは、再び LTE ネットワークから切断され、Wi-Fi 経由で通話を確立することを余儀なくされ、登録の試みは再び失敗し、T-Mobile の IP Multimedia Subsystem にさらなる混雑をもたらす登録嵐を引き起こしました。 しかし、リンクを復元することによって問題を解決することはできませんでした。なぜなら、リモートでそれを行うために必要なネットワーク管理ツールが、ちょうど無効にしたのと同じパスに依存していたからです。 T-Mobileのエンジニアが現場で機器にアクセスし、1時間後にリンクを復元してミスを修正すると、アトランタ市場の顧客は再びVoLTEへの登録を試みることができるようになりました。 しかし、T-Mobile のエンジニアは、登録の完了を妨げるソフトウェア エラーにまだ対処していなかったため、これは再び追加の混雑を引き起こしました。

Outage goes nationwide

FCC の報告書は、停電がアトランタ市場から全国的に広がったことを説明しています。 アトランタのシステムに向けられた外部トラフィックが他の地域にリダイレクトされ、「それらの登録システムに十分な混雑を生じさせ、T-Mobile ネットワークが登録の試みを他のノードに送ることになった」のです。 ソフトウェアのエラーにより、再び再登録の試みが記録上の最後のノードにルーティングされましたが、そのノードはすでに深刻な混雑を経験していたようです。” その直後、「IP マルチメディア サブシステム、VoLTE、および Voice over Wi-Fi の登録が全国的に失敗し始めました」

T-Mobile の顧客の大多数は Voice over LTE または Voice over Wi-Fi ネットワークに接続できなかったため、「デバイスが VoLTE ネットワークへの登録試行を継続しながら通話するには T-Mobile の 3G および 2G 回線交換ネットワークにフォールバックしていました」。 その結果、3Gと2Gの輻輳が発生し、多くの電話通話が失敗した。 ネットワーク・ノードは、通話が終了した後もこれらの通話セッションのリソースを保持し続け、ノードのコンピューティング・リソースを圧迫し、さらに多くの通話障害を引き起こしたのです。

広告

911 通話は通常、モバイル デバイスが IP マルチメディア サブシステムへの登録を完了できない場合でも行うことができますが、この場合、「2G および 2G ネットワーク向けの通話にゲートウェイを選択する同じネットワーク ノードが 911 通話のゲートウェイも選択するので」、3G および 2G ネットワーク輻輳の影響を受けていました。 FCCは、「これらのノードのコンピューティングリソースが放棄されたコールセッションのリソース予約に圧倒されたとき、多くの911コールが失敗する原因にもなった」と述べています。

T-Mobile はFCCに対し、停電中の混雑により、911への 23,621 コールが公共安全の応答ポイントに届かなかったと報告しています。 また、111,253件の緊急通報は正常に完了したとのことです。

T-Mobileが「合理的な911ネットワーク監視」を実施していれば、「停電がPSAP管理回線のコールブロックを引き起こしていることをリアルタイムでT-Mobileに明らかにできただろう」と、FCCは述べている。

広告

T-Mobileはその後、停電によって特定された技術的問題を修正し、将来の停電の深刻さを防止または軽減するために他の変更を行ったと委員会報告書は述べている。

Hey T-Mobile-please don’t do that again

昨日のプレスリリースで、Paiは再びT-モバイルを批判している。 “T-Mobileの停電は失敗だった “とPaiは言っています。 このような事態を招いたのは、「T-Mobileが、停電を防ぐか、少なくともその影響を軽減することができたであろう、いくつかの確立されたネットワーク信頼性のベストプラクティスに従わなかったからだ」と、我々のスタッフの調査は明らかにしています。 すべての電気通信事業者は、関連する業界のベストプラクティスを遵守していることを確認しなければならず、私はネットワーク信頼性標準化団体が、この報告書で特定された問題に対して専門知識を適用し、さらなる研究を行うことを奨励する」

にもかかわらず、Paiは何の処罰も発表しませんでした。

広告

「これまでの慣行に従い、同局は今回の障害やその他の最近の障害の分析に基づき、FCCの通信セキュリティ、信頼性、相互運用性協議会が推奨するものを含む業界で受け入れられているベストプラクティスとその重要性について企業に注意を喚起する公告を発表予定だ」と、FCCは述べている。 “さらに、同局は大手輸送事業者に連絡を取り、ネットワーク慣行について話し合い、小規模事業者への支援を提供し、わが国の通信ネットワークが堅牢で信頼性が高く、回復力のある状態を維持できるようにする”

これは昨年、フロリダ州のハリケーン・マイケルに対する携帯電話事業者の対応に関するFCC調査により、事業者が自らの自主ローミング約束を守らず、不必要に停止時間を延長していたことが分かったことと同様である。 Pai氏は、このハリケーンに対する通信事業者の対応を「全く受け入れられない」としながらも、ハリケーン対応の悪さについては何の罰も課さず、再発防止のための自主的措置に頼り続けた。

Pai氏のFCCも、Verizon、T-Mobile、US Cellularが公式な提出書類で4Gカバレッジを誇張していると分かった後、何も処罰せずに放免した。 Paiは、AT&T、Verizon、T-Mobile、Sprintの4社に対して、電話位置データの違法販売を罰する罰金を提案しましたが、1社あたり1200万~9100万ドルの罰金は、消費者への害に比して十分に大きくないと民主党から批判されました

コメントを残す

メールアドレスが公開されることはありません。