Cómo se desconectó el sistema satelital Galileo debido a la confusión organizacional y otros problemas

Error de una persona, copias de seguridad perdidas, reinicios completos, caos organizacional, secreto y autorregulación




Los detalles clave están comenzando a surgir con respecto a la falla del sistema europeo de navegación por satélite Galileo que ocurrió este verano, y resultan ser bastante feos.

Uno de los gerentes del proyecto trató de culpar a una persona por la falla de todo el sistema, pero las fuentes dentro del proyecto advierten que el caos organizacional, el secreto excesivo y las prácticas inusuales de autorregulación también tienen la culpa.

Junto con estos problemas, la batalla de las organizaciones europeas por el control del sistema satelital y el retraso en la presentación de informes independientes sobre el enchufe de julio indican serios problemas para el competidor europeo con el GPS estadounidense. Quizás el sistema tiene una sacudida desde hace mucho tiempo.

A mediados de julio, la agencia responsable de la operación de la red de 26 satélites, la agencia europea de sistemas mundiales de navegación por satélite EGSA, advirtió sobre el "deterioro del servicio", pero prometió que todos los problemas se resolverían rápidamente.

Sin embargo, no pudieron resolverse, e incluso seis días después, el sistema no solo no funcionó: sus lecturas se hicieron cada vez menos precisas , y la ubicación de los satélites que informaron fue radicalmente diferente de la real. Este era un problema grave para un sistema cuyo único propósito era proporcionar datos de posicionamiento con un error de hasta 20 cm.

Miles de millones de organizaciones, individuos, teléfonos, aplicaciones y otras cosas en todo el mundo simplemente dejaron de usar Galileo. Es difícil imaginar un desastre mayor, excepto si estos satélites golpean la Tierra.

Pero, a pesar de la denegación de servicio y las fuertes críticas de los responsables de la incapacidad de explicar lo que estaba sucediendo, las agencias y organizaciones involucradas en este proyecto prácticamente no dieron ninguna información.

Investigación


En septiembre se anunció que se había planeado una investigación independiente sobre las causas del incidente, principalmente debido a la falta de información. Las "recomendaciones preliminares" de la investigación prometieron ser entregadas en octubre. Y aún no hay información.

Luego, a principios de noviembre, la persona a cargo de todo el sistema, el subdirector Pierre Delso, rompió el silencio en una reunión de funcionarios de política espacial europea en Washington.

Durante la sesión de preguntas y respuestas después de las presentaciones, se le preguntó a Delso sobre los motivos de la falta de información, la opacidad y la falta de un sistema de respaldo. Explotó, alegando que el problema fue causado por una persona que cometió un error y no realizó correctamente las acciones para eliminarlo. Dijo que este error era "inaceptable" y afirmó que "nunca volvería a suceder".

Delso no dijo nada sobre las copias de seguridad o la falta de información y transparencia. Pero otros funcionarios europeos tampoco respondieron a estas preguntas, lo que indica que el problema se discutió en una conferencia reciente; después de esto, algunos amantes del espacio enterraron la información del sitio web del Instituto de Navegación, de la página de la conferencia en Miami, celebrada en septiembre.

Uno de estos investigadores fue Bert Hubert, un experto en DNS que se interesó en el desastre que había estado sucediendo con Galileo este verano y decidió crear su propio recurso independiente para monitorear el estado del sistema. A principios de noviembre, Hubert publicó un informe sobre lo que había descubierto desde el comienzo de su investigación, enumerando algunos de los problemas organizativos y políticos que tenía Galileo.

Sin números


Entre los detalles más interesantes relacionados con el Galileo, hay una de esas cosas: de 26 satélites en el espacio, solo 21 funcionan; sin embargo, para lograr la precisión planificada, el sistema requiere al menos 24 satélites.

Está previsto lanzar satélites adicionales el próximo año, pero la probabilidad de su introducción en órbita está disminuyendo constantemente, especialmente en vista de la disputa entre la Agencia Espacial Europea y la Unión Europea.

ESA ha creado el sistema Galileo y está trabajando en una versión actualizada del sistema para la cual es necesario lanzar nuevos satélites. Pero debido a las políticas de la UE que han empeorado debido al Brexit , la UE quiere lograr un control más estricto sobre este proyecto.

La UE va a crear una nueva agencia espacial europea, EUSA, que, en esencia, será un simple cambio de nombre de la agencia existente de sistemas mundiales de navegación por satélite. Y otra agencia espacial, GSA, se convertirá en la agencia del programa espacial de la UE, y la UE pronto designará un nuevo director para la "industria de la defensa y el espacio". En resumen, hay mucha agitación política, lo que lleva a una variedad de problemas.

Resumen breve


Y en el proceso de todo esto, el emblemático sistema europeo de navegación por satélite de Galileo está completamente abandonado, y nadie puede explicar en un lenguaje sencillo qué sucedió y por qué. Esto es lo que sabemos sobre la base de un informe basado en la conferencia de septiembre de Miami y detalles adicionales excavados por Hubert y otros.

  • Los brumosos informes del equipo de Galileo, que afirmaban que todo estaba bien y que no tenía nada de qué preocuparse, se relacionaban con el hecho de que físicamente todos los satélites estaban funcionando (con la excepción de los que no funcionaban) y en las posiciones esperadas. En otras palabras, todo era normal con hierro en órbita; los satélites no chocaron con nada y no volaron a ninguna parte.
  • El verdadero problema está casi seguramente relacionado con el software que resuelve la compleja tarea de sincronizar todo el sistema. Es bastante difícil observar la precisión en nanosegundos de los relojes atómicos con los que están equipados los satélites que vuelan en diferentes órbitas. Durante la actualización, se produjo una cierta anomalía en el sistema relacionada con el tiempo de referencia (este fue el error del operador) debido a que todo el sistema se desmoronó.
  • Por razones que no estaban claras, el sistema de copia de seguridad no estaba disponible, por lo que no podía retroceder a la versión anterior. Como resultado, todo comenzó a funcionar cada vez con menos precisión.
  • Además, aparentemente, en el momento de la falla, el sistema no estaba configurado correctamente, por lo que fue muy difícil para los ingenieros descubrir cómo hacerlo funcionar nuevamente.
  • Al final, se decidió que si lleva tanto tiempo encontrar la respuesta a la pregunta de qué salió mal, será más fácil reiniciar todo el sistema. Lo que hicieron los ingenieros. Pero como el sistema es extremadamente complejo, tardó varios días en reiniciarse.

Esta es la información más completa del incidente. Sin embargo, hay información pequeña pero valiosa sobre cómo y por qué todo salió mal, y por qué el sistema no tenía un método de recuperación adecuado.

Dificultad


Cada vez es más probable que una parte importante del problema sea el complejo entrelazamiento de las organizaciones responsables del mantenimiento y desarrollo de varias partes de este sistema. Inmediatamente después de que todo se descompuso, quedó claro que en el marco del proyecto Galileo no había un esquema efectivo para el intercambio de información, y también que todos comenzaron a culparse mutuamente por los problemas, que solo empeoraron la situación.


Esquema de gestión del proyecto Galileo incompleto por Bert Hubert

Además, está la cuestión de si una organización en particular, GMV, tiene la responsabilidad adicional de toda esta confusión. Después de todo, ella controla no menos de tres partes diferentes de la estructura de Galileo.

Lo que es particularmente notable, ella administra el departamento de Procesamiento de sincronización orbital (OSPF), que es responsable de emitir los datos que entraron en la separación en este caso: las efemérides . Además de las efemérides, GMV está subordinado al departamento de procesamiento de integridad de datos, que monitorea y rastrea independientemente los mismos datos.

¿Fue una de las razones del colapso que una empresa se verifica a sí misma?

En cuanto a las relaciones públicas, ni una sola organización de la constelación que rodea a Galileo se consideró autorizada a hablar sobre lo que estaba sucediendo, y dejó esta tarea a los funcionarios, ninguno de los cuales sabía lo que estaba sucediendo. En otras palabras, fue un fracaso clásico en el intercambio de información.

Todavía no imaginamos exactamente lo que sucedió, pero esperamos que como resultado de una investigación independiente se publique pronto un informe detallado. Debería completarse antes de fin de año.

Mientras tanto, el peligroso volumen de maniobras políticas está obligando a los ingenieros a no sobresalir. Es una pena, porque, aparentemente, gastan grandes volúmenes de trabajo complicados por el caos organizacional.

En resumen, Galileo es una empresa europea clásica: una gran idea en la implementación de personas con talento, convertida en un desastre burocrático en el que nadie quiere ser responsable de los problemas derivados de dificultades organizativas injustificadas.

Source: https://habr.com/ru/post/477790/


All Articles