11 juin 2021

Orange rend publiques les conclusions de l’enquête interne sur la crise du 2 juin 2021, ayant affecté les appels notamment vers les numéros d’urgence

A la suite de l’incident technique ayant impacté l’acheminement d’une partie des appels vers les numéros d’urgence le 2 juin 2021, Stéphane Richard, Président – Directeur général d’Orange a mandaté l’Inspection générale du Groupe pour réaliser une enquête sur cette crise, afin d’en identifier les causes précises et d’émettre des recommandations visant à en tirer tous les enseignements. Orange présente aujourd’hui la synthèse des premières conclusions.

L’origine de la crise

Le 2 juin, de 16h45 à minuit, les services voix d’Orange ainsi que l’accès à certains services d’urgence ont été perturbés sur le plan national. Pendant cette période environ 11 800 appels, soit 11% du total d’appels, n’ont pas été acheminés vers les services d’urgence. L’enquête confirme qu’il s’agit bien d’un dysfonctionnement logiciel.

Le dysfonctionnement a porté sur l’interconnexion entre les services voix mobile, voix sur IP d’une part et ceux hébergés sur le réseau commuté (la plupart des numéros d’urgence étant sur cette technologie) d’autre part, suite à une opération de modernisation et d’augmentation capacitaire du réseau, débutée début mai, pour répondre à l’accroissement du trafic.

L’interconnexion repose sur une plateforme de calls servers. Un dysfonctionnement de la plateforme de service est intervenu et a provoqué les perturbations. Ce dysfonctionnement est la conséquence d’un bug dans les logiciels des calls servers. Ce bug s’est activé suite à des commandes usuelles de reconnexion, perturbant le fonctionnement global des calls servers malgré leur redondance entre les six sites distincts.

Cette défaillance logicielle est désormais identifiée par le partenaire fournisseur des équipements concernés et un correctif a été adressé.

Les processus d’alerte

Les équipes d’Orange ont identifié le dysfonctionnement logiciel immédiatement, grâce aux systèmes d’alerte internes, et ont alors engagé les premières opérations techniques, qui n’ont malheureusement pas permis de rétablir immédiatement le service.

La complexité de la panne, la variété des technologies et des architectures réseau des services d’urgence ont retardé le diagnostic. Une fois l’analyse établie, la résolution s’est effectuée en quelques heures grâce à la mobilisation d’une centaine d’experts.

Malgré la mobilisation des équipes techniques, le retard dans l’activation de la cellule de crise managériale a entrainé une communication tardive vers toutes les parties prenantes.

Le 3 juin, en accord avec le comité interministériel de crise, Orange a mis en place une cellule d’accueil visant à traiter au cas par cas les situations locales résiduelles remontées par les préfectures. Cette cellule a été maintenue en veille jusqu’au lundi 7 juin.

Les recommandations

L’enquête reconnait l’implication immédiate et la forte mobilisation des acteurs techniques dès l’apparition des premières perturbations et la collaboration avec les autorités pour revenir à la normale.

Il est néanmoins relevé la nécessité d’améliorer la rapidité de la diffusion de l’information vers les différentes parties prenantes de cette crise : les pouvoirs publics, les services d’urgence et les médias.

Il ressort de l’enquête de l’Inspection générale du Groupe, plusieurs recommandations structurantes :

- Renforcer la supervision de bout en bout des services vitaux et des numéros d’urgence
- Réduire de deux heures à 30 minutes maximum le délai de déclenchement d’une cellule de crise, en cas de perturbation touchant les appels aux services d’urgence et services vitaux au niveau national.
- Accompagner les services de l’Etat dans l’accélération de la migration vers la technologie IP des centres d’appel des services publics et des entreprises en RTC, pour renforcer la résilience de ces équipements.
- Proposer de mettre en place un numéro dédié, disponible 24h sur 24h et 7 jours sur 7, pour les parties prenantes (services de l’Etat, CHU, samu…) en cas de dysfonctionnement sur les numéros d’urgence
- Proposer l’utilisation, en concertation avec chaque acteur concerné, d’un mécanisme de diffusion massive par SMS de consignes d’usage en cas de panne affectant les services d’urgence
- Poursuivre une analyse comparative de l’événement avec des incidents similaires intervenus dans d’autres pays européens comme en Allemagne, au Royaume-Uni, en Belgique ou encore aux Etats-Unis.

En tant que Président de la GSMA, Stéphane Richard proposera de mettre en place, au niveau mondial, la création d’une cellule chargée de répertorier et analyser les dysfonctionnements réseau sensibles afin de partager les retours d’expérience entres opérateurs.

Cet évènement rare rappelle le caractère crucial et essentiel des réseaux. Orange poursuit ses investigations en lien avec les services de l’Etat pour renforcer les enseignements de cette crise et participera notamment aux travaux de l’ANSSI. Orange rappelle que la piste « cyberattaque » a été écartée dès le 2 juin.

Orange est conscient de cette responsabilité, renouvelle ses excuses à toutes les personnes directement ou indirectement touchées par ce dysfonctionnement, et reste pleinement mobilisé pour fournir à ses clients des services de qualité.

 

 

 

 

Marc PINON
11/06/2021 17:13 CEST