Las meteduras de pata de T-Mobile provocaron un apagón nacional, pero la FCC no castiga a la compañía

Ampliar / Anuncio de T-Mobile en Times Square de Nueva York el 15 de octubre de 2020.
Getty Images | SOPA Images

La Comisión Federal de Comunicaciones ha terminado de investigar a T-Mobile por un corte de red que el presidente Ajit Pai calificó de «inaceptable». Pero en lugar de castigar a la compañía móvil, la FCC se limita a emitir un aviso público para «recordar» a las compañías telefónicas las «mejores prácticas aceptadas por la industria» que podrían haber evitado el apagón de T-Mobile.

Después de que el apagón de 12 horas en todo el país, el 15 de junio, interrumpiera los servicios de mensajes de texto y de llamadas, incluidas las llamadas de emergencia al 911, Pai escribió que «el apagón de la red de T-Mobile es inaceptable» y que «la FCC está iniciando una investigación. Exigimos respuestas, al igual que los consumidores estadounidenses».

Ver más

Pai tiene un historial de hablar duro con las compañías y no seguir con castigos que podrían tener un mayor efecto disuasorio que las severas advertencias. Eso parece ser lo que ocurrió ayer cuando la FCC anunció los resultados de su investigación sobre T-Mobile. Pai dijo que «el apagón de T-Mobile fue un fracaso» porque la compañía no siguió las mejores prácticas que podrían haberlo evitado o minimizado, pero no anunció ningún castigo. El asunto parece estar cerrado a tenor del anuncio de ayer, pero hoy nos hemos puesto en contacto con la oficina del presidente Pai para preguntar si se va a imponer algún castigo a T-Mobile. Actualizaremos este artículo si obtenemos una respuesta.

La FCC detalla los errores de T-Mobile

El informe de la investigación del personal identificó varios errores cometidos por T-Mobile durante el apagón, que comenzó cuando T-Mobile estaba instalando nuevos routers en el sureste de Estados Unidos. Cuando falló un enlace de transporte de fibra en la región, la red de T-Mobile debería haber transferido el tráfico a través de un enlace diferente. Pero la compañía «había configurado mal el peso de los enlaces a uno de sus routers», lo que «impidió que el tráfico fluyera hacia el nuevo router activo como estaba previsto». T-Mobile no había implementado ningún proceso a prueba de fallos para evitar la mala configuración o para alertar a los ingenieros de la red del problema.

El mercado de Atlanta «quedó aislado» del resto de la red, haciendo que todos los usuarios de LTE de la zona perdieran la conectividad. Un error de software empeoró las cosas al impedir que los dispositivos móviles de la zona de Atlanta se volvieran a registrar en el subsistema multimedia IP a través de Wi-Fi. En lugar de dirigir los intentos de registro de dispositivos a un nodo diferente, «el sistema de registro dirigió repetidamente los intentos de nuevo registro de cada dispositivo móvil al último nodo conservado en sus registros, que no estaba disponible debido al aislamiento del mercado»

Publicidad

El error de software había existido en la red de T-Mobile durante meses. «Es probable que este error de software no causara problemas antes de que se produjera esta interrupción, ya que ésta fue el primer aislamiento notable del mercado desde que T-Mobile integró este software en su red», dijo la FCC. Las pruebas periódicas «podrían haber descubierto el fallo de software y la mala configuración del enrutamiento antes de que pudieran afectar a las llamadas en directo», dijo también la FCC.

Después de que comenzaran los problemas el 15 de junio, los ingenieros de T-Mobile «acabaron agravando el impacto porque diagnosticaron mal el problema.» El informe de la FCC continuó:

T-Mobile creía que el enlace de transporte de fibra que falló anteriormente en el día seguía causando la interrupción en curso. Basándose en esta creencia, T-Mobile apagó manualmente el enlace en un intento de transferir el tráfico fuera de él. Sin embargo, debido a los pesos de Open Shortest Path First aún mal configurados, estos pasos recrearon las condiciones iniciales de la interrupción. Los clientes de LTE en el mercado de Atlanta volvieron a desconectarse de la red LTE y se vieron obligados a establecer llamadas a través de Wi-Fi, y sus intentos de registro volvieron a fallar y crearon una tormenta de registros que añadió más congestión al subsistema multimedia IP de T-Mobile.

Los ingenieros de T-Mobile reconocieron casi inmediatamente que habían diagnosticado mal el problema. Sin embargo, no pudieron resolver el problema restableciendo el enlace porque las herramientas de gestión de red necesarias para hacerlo de forma remota dependían de las mismas rutas que acababan de desactivar. Cuando los ingenieros de T-Mobile pudieron acceder al equipo in situ y corregir su error restableciendo el enlace una hora más tarde, los clientes del mercado de Atlanta pudieron volver a intentar registrarse en VoLTE . Sin embargo, esto volvió a crear una congestión adicional porque los ingenieros de T-Mobile aún no habían solucionado el error de software que impedía que se completaran los registros.

La interrupción se extiende a todo el país

El informe de la FCC explicó cómo la interrupción se extendió desde el mercado de Atlanta, pasando a todo el país. El tráfico externo destinado al sistema de Atlanta fue redirigido a otras regiones, lo que «creó suficiente congestión en esos sistemas de registro como para que la red de T-Mobile enviara los intentos de registro a otros nodos». El error de software volvió a dirigir los intentos de registro al último nodo registrado, que probablemente ya estaba experimentando una grave congestión.» Poco después, «los registros del subsistema multimedia IP, VoLTE y Voz sobre Wi-Fi empezaron a fallar en todo el país»

La gran mayoría de los clientes de T-Mobile no pudieron conectarse a las redes de Voz sobre LTE o Voz sobre Wi-Fi y, por tanto, «volvieron a las redes de conmutación de circuitos 3G y 2G de T-Mobile para hacer y recibir llamadas mientras el dispositivo continuaba con sus intentos de registro en la red VoLTE.» Esto provocó la congestión de las redes 3G y 2G, causando el fracaso de muchas llamadas telefónicas. Los nodos de la red siguieron reteniendo recursos para estas sesiones de llamadas después de que estas terminaran, lo que sobrecargó los recursos informáticos de los nodos y provocó aún más fallos en las llamadas.

Publicidad

Las llamadas al 911 pueden realizarse normalmente incluso cuando los dispositivos móviles no pueden completar el registro con el subsistema multimedia IP, pero en este caso, el 911 se vio afectado por la congestión de las redes 3G y 2G «porque los mismos nodos de red que eligen pasarelas para las llamadas destinadas a las redes 2G y 2G también eligen pasarelas para las llamadas al 911». Cuando los recursos informáticos de esos nodos se vieron desbordados por las reservas de recursos de las sesiones de llamadas abandonadas, también provocaron el fallo de muchas llamadas al 911″, dijo la FCC.

T-Mobile dijo a la FCC que 23.621 llamadas al 911 no llegaron a los puntos de respuesta de seguridad pública debido a la congestión durante la interrupción. Otras 111.253 llamadas de emergencia se completaron con éxito. Incluyendo tanto las llamadas al 911 como las que no son de emergencia, al menos el 41 por ciento de las llamadas en la red de T-Mobile fallaron durante la interrupción, dijo la FCC.

Esto podría haberse evitado o minimizado si T-Mobile hubiera implementado un «control razonable de la red del 911», que «habría revelado a T-Mobile en tiempo real que la interrupción estaba causando el bloqueo de llamadas en las líneas administrativas del PSAP», dijo la FCC.

Publicidad

T-Mobile ha corregido desde entonces los problemas técnicos identificados debido a la interrupción y ha realizado otros cambios para prevenir o reducir la gravedad de futuras interrupciones, según el informe de la comisión.

Oye T-Mobile-por favor, no vuelvas a hacer eso

En un comunicado de prensa ayer, Pai volvió a criticar a T-Mobile. «La interrupción de T-Mobile fue un fracaso», dijo Pai. «Nuestra investigación del personal descubrió que la compañía no siguió varias de las mejores prácticas establecidas de fiabilidad de la red que podrían haber evitado el apagón o, al menos, haber mitigado su impacto. Todos los proveedores de telecomunicaciones deben asegurarse de que se adhieren a las mejores prácticas relevantes de la industria, y animo a los organismos de normas de fiabilidad de la red a aplicar su experiencia a las cuestiones identificadas en este informe para su posterior estudio».

A pesar de ello, Pai no anunció ningún castigo.

Publicidad

«De acuerdo con la práctica anterior, la Oficina tiene previsto publicar un Aviso Público, basado en su análisis de este y otros cortes recientes, recordando a las empresas las mejores prácticas aceptadas por la industria, incluidas las recomendadas por el Consejo de Seguridad, Fiabilidad e Interoperabilidad de las Comunicaciones de la FCC, y su importancia», dijo la FCC. «Además, la Oficina se pondrá en contacto con los principales proveedores de transporte para discutir sus prácticas de red y ofrecer asistencia a los proveedores más pequeños para ayudar a asegurar que las redes de comunicaciones de nuestra nación sigan siendo robustas, fiables y resistentes»

Esto es similar a lo que ocurrió el año pasado cuando una investigación de la FCC sobre la respuesta de las compañías móviles al huracán Michael en Florida encontró que las compañías no siguieron sus propios compromisos voluntarios de itinerancia, prolongando innecesariamente los cortes. Pai calificó las respuestas de las compañías al huracán de «completamente inaceptables», pero no impuso ningún castigo relacionado con la mala respuesta al huracán y siguió confiando en las medidas voluntarias para evitar que se repitan.

La FCC de Pai también dejó libres a Verizon, T-Mobile y US Cellular sin ningún tipo de castigo después de descubrir que exageraban su cobertura 4G en las presentaciones oficiales. Pai propuso multas para AT&T, Verizon, T-Mobile y Sprint para castigar la venta ilegal de datos de localización de teléfonos por parte de las operadoras, pero las sanciones, de entre 12 y 91 millones de dólares por operadora, fueron criticadas por los demócratas por considerarlas insuficientes en relación con el daño causado a los consumidores.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.