Comisia Federală pentru Comunicații a terminat de investigat T-Mobile pentru o întrerupere a rețelei pe care președintele Ajit Pai a numit-o „inacceptabilă”. Dar, în loc să pedepsească operatorul de telefonie mobilă, FCC se limitează să emită un anunț public pentru a „reaminti” companiilor de telefonie „cele mai bune practici acceptate de industrie” care ar fi putut preveni întreruperea T-Mobile.
După ce întreruperea de 12 ore la nivel național din 15 iunie a întrerupt serviciile de mesaje text și apeluri, inclusiv apelurile de urgență 911, Pai a scris că „întreruperea rețelei T-Mobile este inacceptabilă” și că „FCC lansează o investigație”. Cerem răspunsuri – și la fel și consumatorii americani.”
Pai are un istoric de discuții dure cu operatorii de telefonie și nu le dă curs cu pedepse care ar putea avea un efect de descurajare mai mare decât avertismentele formulate cu severitate. Se pare că acest lucru s-a întâmplat din nou ieri, când FCC a anunțat concluziile anchetei sale asupra T-Mobile. Pai a declarat că „întreruperea de la T-Mobile a fost un eșec”, deoarece operatorul nu a urmat cele mai bune practici care ar fi putut preveni sau minimiza întreruperea, dar nu a anunțat nicio pedeapsă. Chestiunea pare să fie închisă pe baza anunțului de ieri, dar am contactat astăzi biroul președintelui Pai pentru a întreba dacă va urma vreo pedeapsă pentru T-Mobile. Vom actualiza acest articol dacă vom primi un răspuns.
FCC detaliază greșelile T-Mobile
Raportul de investigație al personalului a identificat mai multe greșeli făcute de T-Mobile în timpul întreruperii, care a început în timp ce T-Mobile instala noi routere în sud-estul SUA. Atunci când o legătură de transport prin fibră optică din regiune a cedat, rețeaua T-Mobile ar fi trebuit să transfere traficul pe o altă legătură. Dar operatorul de transport „a configurat greșit greutatea legăturilor către unul dintre routerele sale”, ceea ce „a împiedicat traficul să circule către noul router activ, așa cum era prevăzut”. T-Mobile nu implementase niciun proces de siguranță pentru a preveni configurarea greșită sau pentru a alerta inginerii de rețea cu privire la problemă.
Piața din Atlanta „a devenit izolată” de restul rețelei, ceea ce a făcut ca toți utilizatorii LTE din zonă să piardă conectivitatea. O eroare de software a înrăutățit situația, împiedicând dispozitivele mobile din zona Atlanta să se reînregistreze cu subsistemul multimedia IP prin Wi-Fi. În loc să direcționeze încercările de înregistrare a dispozitivelor către un nod diferit, „sistemul de înregistrare a direcționat în mod repetat încercările de reînregistrare pentru fiecare dispozitiv mobil către ultimul nod reținut în evidențele sale, care era indisponibil din cauza izolării pieței.”
Eroarea de software exista în rețeaua T-Mobile de luni de zile. „Această eroare de software probabil că nu a cauzat probleme înainte de apariția acestei întreruperi, deoarece întreruperea a fost prima izolare de piață notabilă de când T-Mobile a integrat acest software în rețeaua sa”, a declarat FCC. Testarea regulată „ar fi putut descoperi defectul de software și configurația greșită de rutare înainte ca acestea să aibă impact asupra apelurilor în direct”, a mai spus FCC.
După ce au început problemele din 15 iunie, inginerii T-Mobile „au sfârșit prin a exacerba impactul deoarece au diagnosticat greșit problema”. Raportul FCC a continuat:
T-Mobile a crezut că legătura de transport prin fibră optică care a cedat mai devreme în cursul zilei a continuat să cauzeze întreruperea în curs. Acționând pe baza acestei convingeri, T-Mobile a oprit manual legătura în încercarea de a transfera traficul departe de aceasta. Cu toate acestea, din cauza greutăților Open Shortest Path First încă neconfigurate, acești pași au recreat condițiile inițiale ale întreruperii. Clienții LTE de pe piața din Atlanta au fost din nou deconectați de la rețeaua LTE și forțați să stabilească apeluri prin Wi-Fi, iar încercările lor de înregistrare au eșuat din nou și au creat o furtună de înregistrări care a adăugat și mai multă congestie la subsistemul multimedia IP al T-Mobile.
Inginerii T-Mobile au recunoscut aproape imediat că au diagnosticat greșit problema. Cu toate acestea, ei nu au putut rezolva problema prin restabilirea legăturii deoarece instrumentele de gestionare a rețelei necesare pentru a face acest lucru de la distanță se bazau pe aceleași căi pe care tocmai le dezactivaseră. Când inginerii T-Mobile au reușit să acceseze echipamentul la fața locului și să își corecteze greșeala prin restabilirea legăturii o oră mai târziu, clienții de pe piața din Atlanta au putut din nou să încerce să se înregistreze la VoLTE . Cu toate acestea, acest lucru a creat din nou o congestie suplimentară, deoarece inginerii T-Mobile nu rezolvaseră încă eroarea de software care a împiedicat finalizarea înregistrărilor.
Întreruperea se extinde la nivel național
Raportul FCC a explicat modul în care întreruperea s-a răspândit de pe piața din Atlanta, extinzându-se la nivel național. Traficul extern destinat sistemului din Atlanta a fost redirecționat către alte regiuni, ceea ce „a creat o congestie suficientă în acele sisteme de înregistrare pentru a determina rețeaua T-Mobile să trimită încercările de înregistrare către alte noduri”. Eroarea de software a direcționat din nou încercările de reînregistrare către ultimul nod înregistrat, care, probabil, se confrunta deja cu o congestie severă”. La scurt timp după aceea, „înregistrările IP Multimedia Subsystem, VoLTE și Voice over Wi-Fi au început să eșueze la nivel național.”
Marea majoritate a clienților T-Mobile nu s-au putut conecta la rețelele Voice over LTE sau Voice over Wi-Fi și, prin urmare, „au revenit la rețelele T-Mobile 3G și 2G cu comutare de circuite pentru a efectua și a primi apeluri, în timp ce dispozitivul și-a continuat încercările de înregistrare la rețeaua VoLTE.” Acest lucru a dus la congestia 3G și 2G, ceea ce a făcut ca multe apeluri telefonice să eșueze. Nodurile de rețea au continuat să rețină resurse pentru aceste sesiuni de apeluri și după ce apelurile s-au încheiat, ceea ce a copleșit resursele de calcul ale nodurilor și a provocat și mai multe eșecuri ale apelurilor.
În mod normal, apelurile 911 pot fi efectuate chiar și atunci când dispozitivele mobile nu pot finaliza înregistrarea cu subsistemul multimedia IP, dar, în acest caz, 911 a fost afectat de congestia rețelelor 3G și 2G „deoarece aceleași noduri de rețea care aleg gateway-uri pentru apelurile destinate rețelelor 2G și 2G aleg gateway-uri și pentru apelurile 911. Atunci când resursele de calcul ale acestor noduri au fost copleșite de rezervările de resurse ale sesiunilor de apeluri abandonate, acest lucru a făcut ca și multe apeluri 911 să eșueze”, a declarat FCC.
T-Mobile a declarat FCC că 23.621 de apeluri către 911 nu au ajuns la punctele de răspuns de siguranță publică din cauza congestiei din timpul întreruperii. Alte 111.253 de apeluri de urgență au fost finalizate cu succes. Incluzând atât apelurile la 911, cât și cele care nu sunt de urgență, cel puțin 41% dintre apelurile din rețeaua T-Mobile au eșuat în timpul întreruperii, a declarat FCC.
Acest lucru ar fi putut fi evitat sau minimizat dacă T-Mobile ar fi implementat „o monitorizare rezonabilă a rețelei 911”, care „ar fi dezvăluit T-Mobile în timp real că întreruperea a cauzat blocarea apelurilor pe liniile administrative PSAP”, a declarat FCC.
De atunci, T-Mobile a corectat problemele tehnice identificate din cauza întreruperii și a făcut alte modificări pentru a preveni sau a reduce gravitatea viitoarelor întreruperi, se arată în raportul comisiei.
Ei, T-Mobile – te rog să nu mai faci asta din nou
Într-un comunicat de presă de ieri, Pai a criticat din nou T-Mobile. „Întreruperea T-Mobile a fost un eșec”, a spus Pai. „Ancheta personalului nostru a constatat că societatea nu a respectat mai multe bune practici stabilite de fiabilitate a rețelei care ar fi putut fie să prevină întreruperea, fie cel puțin să atenueze impactul acesteia. Toți furnizorii de telecomunicații trebuie să se asigure că respectă cele mai bune practici relevante din industrie și încurajez organismele de standardizare a fiabilității rețelelor să își aplice expertiza la problemele identificate în acest raport pentru a fi studiate în continuare.”
În ciuda acestui fapt, Pai nu a anunțat nicio pedeapsă.
„Conform practicilor anterioare, Biroul intenționează să publice un anunț public, pe baza analizei sale a acestei întreruperi și a altor întreruperi recente, reamintind companiilor cele mai bune practici acceptate de industrie, inclusiv cele recomandate de Consiliul pentru securitate, fiabilitate și interoperabilitate în comunicații al FCC, precum și importanța acestora”, a declarat FCC. „În plus, Biroul va contacta principalii furnizori de transport pentru a discuta practicile lor de rețea și va oferi asistență furnizorilor mai mici pentru a contribui la asigurarea faptului că rețelele de comunicații ale națiunii noastre rămân robuste, fiabile și rezistente.”
Acest lucru este similar cu ceea ce s-a întâmplat anul trecut, când o investigație a FCC privind răspunsul transportatorilor de telefonie mobilă la uraganul Michael din Florida a constatat că transportatorii nu și-au respectat propriile angajamente voluntare de roaming, prelungind în mod inutil întreruperile. Pai a calificat răspunsurile transportatorilor la uragan drept „complet inacceptabile”, dar nu a impus nicio pedeapsă legată de răspunsul defectuos la uragan și a continuat să se bazeze pe măsuri voluntare pentru a preveni repetarea situației.
De asemenea, FCC-ul lui Pai a lăsat Verizon, T-Mobile și US Cellular să scape fără nicio pedeapsă după ce a constatat că aceștia și-au exagerat acoperirea 4G în documentele oficiale. Pai a propus amenzi pentru AT&T, Verizon, T-Mobile și Sprint pentru a pedepsi vânzările ilegale de date de localizare a telefoanelor de către operatorii de telefonie, dar sancțiunile de 12 milioane de dolari până la 91 de milioane de dolari pentru fiecare operator au fost criticate de democrați ca fiind insuficient de mari în raport cu prejudiciul adus consumatorilor.
.