La Federal Communications Commission a fini d’enquêter sur T-Mobile pour une panne de réseau que le président Ajit Pai a qualifié d' »inacceptable ». Mais au lieu de punir l’opérateur mobile, la FCC se contente de publier un avis public pour « rappeler » aux compagnies de téléphone les « meilleures pratiques acceptées par l’industrie » qui auraient pu empêcher la panne de T-Mobile.
Après la panne nationale de 12 heures du 15 juin qui a perturbé les services de textos et d’appels, y compris les appels d’urgence 911, Pai a écrit que « la panne de réseau de T-Mobile est inacceptable » et que « la FCC lance une enquête. Nous exigeons des réponses – et les consommateurs américains aussi. »
Pai a l’habitude de parler durement avec les transporteurs et de ne pas suivre avec des punitions qui pourraient avoir un effet plus dissuasif que des avertissements formulés sévèrement. C’est ce qui semble s’être produit hier encore lorsque la FCC a annoncé les conclusions de son enquête sur T-Mobile. M. Pai a déclaré que « la panne de T-Mobile était un échec » parce que l’opérateur n’a pas suivi les meilleures pratiques qui auraient pu l’empêcher ou la minimiser, mais il n’a annoncé aucune sanction. L’affaire semble être close d’après l’annonce d’hier, mais nous avons contacté le bureau du président Pai aujourd’hui pour demander si une sanction de T-Mobile est prévue. Nous mettrons à jour cet article si nous obtenons une réponse.
La FCC détaille les erreurs de T-Mobile
Le rapport d’enquête du personnel a identifié plusieurs erreurs commises par T-Mobile pendant la panne, qui a commencé alors que T-Mobile installait de nouveaux routeurs dans le sud-est des États-Unis. Lorsqu’un lien de transport en fibre optique dans la région est tombé en panne, le réseau de T-Mobile aurait dû transférer le trafic sur un autre lien. Mais l’opérateur « avait mal configuré le poids des liens vers l’un de ses routeurs », ce qui « empêchait le trafic de circuler vers le nouveau routeur actif comme prévu ». T-Mobile n’avait pas mis en place de processus à sécurité intégrée pour empêcher la mauvaise configuration ou pour alerter les ingénieurs réseau du problème.
Le marché d’Atlanta « s’est isolé » du reste du réseau, ce qui a fait perdre la connectivité à tous les utilisateurs LTE de la région. Une erreur logicielle a aggravé la situation en empêchant les appareils mobiles de la région d’Atlanta de se réenregistrer auprès du sous-système multimédia IP par Wi-Fi. Au lieu d’acheminer les tentatives d’enregistrement des appareils vers un nœud différent, » le système d’enregistrement a acheminé à plusieurs reprises les tentatives de réenregistrement de chaque appareil mobile vers le dernier nœud retenu dans ses registres, qui était indisponible en raison de l’isolement du marché. «
L’erreur logicielle existait dans le réseau de T-Mobile depuis des mois. « Cette erreur logicielle n’a probablement pas causé de problèmes avant que cette panne ne se produise, car la panne a été le premier isolement notable du marché depuis que T-Mobile a intégré ce logiciel dans son réseau », a déclaré la FCC. Des tests réguliers « auraient pu découvrir la faille logicielle et la mauvaise configuration du routage avant qu’elles n’aient un impact sur les appels en direct », a également déclaré la FCC.
Après le début des problèmes le 15 juin, les ingénieurs de T-Mobile « ont fini par exacerber l’impact parce qu’ils ont mal diagnostiqué le problème. » Le rapport de la FCC poursuit :
T-Mobile croyait que le lien de transport de fibre qui avait échoué plus tôt dans la journée continuait à causer la panne en cours. Agissant sur cette croyance, T-Mobile a coupé manuellement le lien dans une tentative de transférer le trafic loin de lui. Cependant, en raison de la mauvaise configuration des poids de l’Open Shortest Path First, ces mesures ont recréé les conditions initiales de la panne. Les clients LTE du marché d’Atlanta ont à nouveau été déconnectés du réseau LTE et forcés d’établir des appels sur le Wi-Fi, et leurs tentatives d’enregistrement ont à nouveau échoué et créé une tempête d’enregistrement qui a ajouté une congestion supplémentaire au sous-système multimédia IP de T-Mobile.
Les ingénieurs de T-Mobile ont presque immédiatement reconnu qu’ils avaient mal diagnostiqué le problème. Cependant, ils n’ont pas été en mesure de résoudre le problème en rétablissant la liaison, car les outils de gestion du réseau nécessaires pour le faire à distance s’appuyaient sur les mêmes chemins qu’ils venaient de désactiver. Lorsque les ingénieurs de T-Mobile ont pu accéder à l’équipement sur place et corriger leur erreur en rétablissant la liaison une heure plus tard, les clients du marché d’Atlanta ont à nouveau pu tenter de s’inscrire à la VoLTE . Cependant, cela a de nouveau créé une congestion supplémentaire parce que les ingénieurs de T-Mobile n’avaient pas encore corrigé l’erreur logicielle qui empêchait les inscriptions de se terminer.
La panne s’étend à tout le pays
Le rapport de la FCC a expliqué comment la panne s’est propagée à partir du marché d’Atlanta, s’étendant à tout le pays. Le trafic externe destiné au système d’Atlanta a été redirigé vers d’autres régions, ce qui « a créé suffisamment de congestion dans ces systèmes d’enregistrement pour que le réseau T-Mobile envoie les tentatives d’enregistrement vers d’autres nœuds ». L’erreur logicielle a de nouveau acheminé les tentatives de réenregistrement vers le dernier nœud enregistré, qui était probablement déjà fortement congestionné. » Peu après, « les enregistrements du sous-système multimédia IP, de la VoLTE et de la Voix sur Wi-Fi ont commencé à échouer dans tout le pays »
La grande majorité des clients de T-Mobile n’ont pas pu se connecter aux réseaux Voix sur LTE ou Voix sur Wi-Fi et se sont donc « rabattus sur les réseaux à commutation de circuits 3G et 2G de T-Mobile pour passer et recevoir des appels pendant que l’appareil poursuivait ses tentatives d’enregistrement sur le réseau VoLTE. » Cette situation a entraîné une congestion des réseaux 3G et 2G, provoquant l’échec de nombreux appels téléphoniques. Les nœuds du réseau ont continué à conserver des ressources pour ces sessions d’appel après la fin des appels, submergeant les ressources informatiques des nœuds et provoquant encore plus d’échecs d’appels.
Les appels 911 peuvent généralement être effectués même lorsque les appareils mobiles ne peuvent pas terminer l’enregistrement avec le sous-système multimédia IP, mais dans ce cas, le 911 a été affecté par la congestion des réseaux 3G et 2G « parce que les mêmes nœuds de réseau qui choisissent les passerelles pour les appels destinés aux réseaux 2G et 2G choisissent également les passerelles pour les appels 911. Lorsque les ressources informatiques de ces nœuds ont été submergées par les réservations de ressources des sessions d’appel abandonnées, cela a également provoqué l’échec de nombreux appels 911 », a déclaré la FCC.
T-Mobile a déclaré à la FCC que 23 621 appels au 911 n’ont pas atteint les points de réponse de la sécurité publique en raison de la congestion pendant la panne. Par ailleurs, 111 253 autres appels d’urgence ont été menés à bien. En incluant les appels au 911 et les appels non urgents, au moins 41 % des appels sur le réseau de T-Mobile ont échoué pendant la panne, a déclaré la FCC.
Cela aurait pu être évité ou minimisé si T-Mobile avait mis en œuvre une « surveillance raisonnable du réseau 911 », qui « aurait révélé à T-Mobile en temps réel que la panne provoquait le blocage des appels sur les lignes administratives des PSAP », a déclaré la FCC.
T-Mobile a depuis corrigé les problèmes techniques identifiés en raison de la panne et a apporté d’autres changements pour prévenir ou réduire la gravité des futures pannes, selon le rapport de la commission.
Hey T-Mobile- please don’t do that again
Dans un communiqué de presse hier, Pai a de nouveau critiqué T-Mobile. « La panne de T-Mobile a été un échec », a déclaré Pai. « L’enquête de notre personnel a révélé que l’entreprise n’a pas suivi plusieurs meilleures pratiques établies en matière de fiabilité du réseau qui auraient pu soit empêcher la panne, soit au moins atténuer son impact. Tous les fournisseurs de télécommunications doivent s’assurer qu’ils adhèrent aux meilleures pratiques pertinentes de l’industrie, et j’encourage les organismes de normalisation de la fiabilité des réseaux à appliquer leur expertise aux questions identifiées dans ce rapport pour une étude plus approfondie. »
Malgré cela, Pai n’a annoncé aucune sanction.
« Conformément à la pratique passée, le Bureau prévoit de publier un avis public, basé sur son analyse de cette panne et d’autres pannes récentes, rappelant aux entreprises les meilleures pratiques acceptées par l’industrie, y compris celles recommandées par le Conseil de la sécurité, de la fiabilité et de l’interopérabilité des communications de la FCC, et leur importance », a déclaré la FCC. « En outre, le Bureau contactera les principaux fournisseurs de transport pour discuter de leurs pratiques de réseau et offrir une assistance aux petits fournisseurs pour aider à garantir que les réseaux de communication de notre nation restent robustes, fiables et résilients. »
Ceci est similaire à ce qui s’est passé l’année dernière lorsqu’une enquête de la FCC sur la réponse des transporteurs mobiles à l’ouragan Michael en Floride a révélé que les transporteurs n’ont pas respecté leurs propres engagements volontaires d’itinérance, prolongeant inutilement les pannes. Pai a qualifié les réponses des transporteurs à l’ouragan de « complètement inacceptables », mais n’a imposé aucune sanction liée à la mauvaise réponse à l’ouragan et a continué à s’appuyer sur des mesures volontaires pour éviter que cela ne se reproduise.
La FCC de Pai a également laissé Verizon, T-Mobile et US Cellular s’en tirer sans aucune sanction après avoir constaté qu’ils avaient exagéré leur couverture 4G dans des dépôts officiels. Pai a proposé des amendes pour AT&T, Verizon, T-Mobile et Sprint pour punir les ventes illégales de données de localisation des téléphones par les transporteurs, mais les pénalités de 12 millions à 91 millions de dollars par transporteur ont été critiquées par les démocrates comme n’étant pas assez importantes par rapport au préjudice subi par les consommateurs.