Aperçu des différents types d'échec



En ce qui concerne les sources de danger liées à une panne de serveur, les experts distinguent les menaces internes et externes. Les menaces internes peuvent prendre plusieurs formes, notamment des dysfonctionnements de votre propre infrastructure informatique, des paramètres inappropriés ou le mauvais comportement d'un employé. Les menaces externes, quant à elles, comprennent les attaques irréfléchies de l'extérieur ou les événements imprévisibles tels que les accidents et les catastrophes.



Sources de risques internes :



Incendie dans le centre de données



Blackout dans le centre de données



Défaillance matérielle (crash du disque dur, surcharge, surchauffe)



Défaillance du logiciel (dysfonctionnement de la base de données)



Problèmes de réseau



L'erreur humaine



Sources de risques externes



Infiltration (attaque de l'homme du milieu, phishing, ingénierie sociale)



Sabotage (attaques sur le système SCADA)



Virus, chevaux de Troie, vers



Attaques DDoS (déni de service distribué)



Vol de matériel



Force majeure (tremblement de terre, foudre, inondation)



Accidents (crash d'avion)



Attaques



Il est généralement plus facile pour les entreprises de se préparer contre les risques internes que contre les menaces externes. La raison en est que les pirates mettent à jour leurs schémas d'attaque en fonction des dernières normes de sécurité et que les réseaux d'entreprise sont constamment confrontés à des stratégies d'infiltration et à des programmes malveillants. En revanche, les risques internes peuvent être évités par les entreprises disposant de systèmes électriques à l'épreuve des pannes, de mesures de prévention des incendies, de serveurs à haute disponibilité et d'une formation continue à la sécurité.

Conséquences d'une panne de serveur



Une panne de serveur entraîne des dommages économiques. Cela est clair pour tous les entrepreneurs. Mais quel est le coût d'une heure d'indisponibilité d'un serveur, selon une étude réalisée par Techconsul en 2013. Pour le compte de HP Allemagne, une société d'études de marché a mené une étude dans toute l'Allemagne auprès de 300 entreprises de taille moyenne comptant entre 200 et 4 999 employés. Environ 77 % des entreprises avaient connu des dysfonctionnements de leurs systèmes informatiques critiques au cours de l'année précédant l'étude. Entre autres, les informations sur les produits, la production et les ventes ont été affectées. En moyenne, il y a eu quatre cas de dysfonctionnement par entreprise. Le temps moyen pour le dépannage et la récupération des données est de 3,8 heures.



Les coûts encourus par heure d'indisponibilité du serveur varient selon la taille de l'entreprise. Alors que les entreprises de moins de 500 employés encourent des coûts d'environ 20 000 euros par heure, les coûts par heure d'arrêt pour les entreprises de plus de 1 000 employés s'élèvent à environ 40 000 euros. En moyenne, une heure d'indisponibilité du serveur entraîne une perte de 25 000 euros pour les moyennes et grandes entreprises. Le temps de dépannage et de récupération des données doit également être pris en compte. En Allemagne, les entreprises de taille moyenne perdent en moyenne 380 000 euros par an.



Fiabilité du serveur



En particulier dans les entreprises de taille moyenne, l'impact des problèmes informatiques sur leur activité est sous-estimé. Cela s'explique notamment par la grande fiabilité des composants standard utilisés aujourd'hui par les entreprises informatiques. Une disponibilité de 99,9 % est généralement garantie. Cela peut sembler élevé, mais le temps d'arrêt maximal est de neuf heures par an. Si cela se produit pendant les heures de pointe, même une courte panne de serveur peut être très coûteuse pour l'entreprise.



Les systèmes informatiques offrant une disponibilité de 99,9 % sont désormais la norme pour permettre l'ouverture des données et l'exécution des programmes essentiels. Pour ces derniers, un temps d'arrêt de 52 minutes maximum par an est garanti. Certains experts informatiques parlent même d'une disponibilité de 99,999 %, ce qui signifie que ces systèmes ne permettraient pas plus de 5 minutes d'interruption par an.



Le problème de ces indications est qu'elles ne font référence qu'à la sécurité contre les défaillances matérielles du serveur. La définition de l'IEEE (Institute of Electrical and Elcetronics Engineers) considère donc qu'un système est hautement disponible, s'il est capable de garantir la disponibilité de ses ressources informatiques malgré la défaillance de ses composants :



"La haute disponibilité (HA en abrégé) fait référence à la disponibilité des ressources dans un système informatique, à la suite de défaillances de composants dans le système."



Cette disponibilité est obtenue, par exemple, par la redondance des serveurs. Tous les éléments clés sont dupliqués, et en particulier les processeurs, les puces de stockage et les unités d'entrée/sortie. Cela permet d'éviter qu'un défaut dans un composant ne paralyse le serveur, mais la haute disponibilité ne protège évidemment pas contre un incendie dans le centre de données, des attaques ciblées par des logiciels malveillants et des attaques DDoS, le sabotage ou le contrôle du serveur par des pirates. Dans la réalité, cependant, les entrepreneurs doivent tenir compte de temps d'arrêt beaucoup plus longs et donc mettre en œuvre des mesures appropriées de prévention et de limitation des dommages.



D'autres stratégies visant à compenser la défaillance des serveurs comprennent des systèmes de secours et des grappes à haute disponibilité. Les deux systèmes sont basés sur la connexion de deux ou plusieurs serveurs qui, ensemble, mettent à disposition plus de ressources matérielles que nécessaire pour un fonctionnement normal.



Un système de secours est un second serveur qui sert à sécuriser le système principal et prend en charge ses fonctions dès qu'il cesse de fonctionner en raison d'un problème matériel ou logiciel. Le transfert du contrôle des services vers un autre serveur est appelé basculement et est mis en œuvre par le biais d'un logiciel de gestion de cluster (c'est-à-dire un logiciel dédié à la gestion des ordinateurs de cluster), sans nécessiter l'intervention d'un administrateur. Une telle structure composée d'un nœud actif et d'un nœud passif peut être considérée comme un cluster asymétrique à haute disponibilité. En revanche, si tous les nœuds du cluster permettent le fonctionnement normal des services, on parle de structure symétrique.



Comme il y a un délai lors de la migration d'un service d'un système à un autre, les systèmes de secours et les grappes à haute disponibilité peuvent subir une courte interruption.