LES PRINCIPALES CAUSES DE PANNE ÉLECTRIQUE EN DATACENTER
Garantir la continuité de l’alimentation électrique des équipements IT constitue l’une des fonctions fondamentales des Datacenters. Pourtant, parmi les nombreux articles de presse relatant les incidents de production dont les Centres de données font encore l’objet (et l’année 2017 fût à ce titre particulièrement féconde…), les départs de feu et les arrêts électriques intempestifs représentent les menaces dont la concrétisation est la plus fréquente. Les concepteurs de Datacenters veillent pourtant à l’implantation judicieuse de ces bâtiments spécifiques en s’assurant de la qualité, de la densité, de la robustesse et de la redondance de l’offre énergétique locale tout en évitant autant que possible l’occurrence de risques environnementaux. La tâche est plus ardue pour les exploitants de salles in-house, contraints par la localisation historique du site et ne bénéficiant pas toujours d’une infrastructure de bâtiment à la hauteur des enjeux.
En premier lieu, l’impératif de continuité du service IT, et donc de l’approvisionnement énergétique sous-jacent, n’échappe pas aux conséquences d’une éventuelle erreur humaine. Soulignons qu’il est rare que ce paramètre intervienne comme seule et unique cause explicative d’une panne électrique. L’erreur de manipulation, ou de jugement, se constate plutôt lors de la conduite d’opérations inhabituelles de remise en fonction dès lors qu’un premier incident électrique, sous contrôle et sans conséquence pour la production, s’est déjà produit : une consigne ambigüe, non comprise, faiblement documentée ou encore dont la réalisation n’est pas réassurée par un second exploitant produit alors l’effet inverse de celui escompté.
A mi-chemin entre l’erreur humaine et l’impact d’une faiblesse dans la stratégie d’exploitation des processus de soutien, une autre catégorie de cause courante tient dans le non-fonctionnement d’un mécanisme de secours, lequel laisse l’IT sans électricité. Par exemple, une défaillance régionale des fournisseurs d’énergie couplée à des groupes électrogènes non opérationnels au moment voulu, parce-que leur maintien en conditions opérationnelles n’a pas été géré de façon optimale en dépit des méthodes éprouvées et largement documentées pour ce faire.
Une qualité de l’air non conforme soit en salle, soit au sein de ses dépendances techniques, peut également causer des incidents d’impact particulièrement inhabituels à diagnostiquer et à résoudre. Les matériels en charge de l’acheminement de l’électricité embarquent des circuits imprimés de plus en plus miniaturisés, exempts de soudure au plomb et sensibles à la corrosion occasionnée par les polluants gazeux et les particules en suspension. Des composants électriques intégrés simultanément sur deux voies énergétiques distinctes mais soumis à un même air pollué subissent une détérioration de semblable intensité et endurent pontages non sollicités et courts-circuits à la même période, prenant de court la stratégie de haute-disponibilité énergétique mise en place par le concepteur du Datacenter.