Hot! Les 3 petits cochons (une interprétation pragmatique des niveaux TIER)

Vous vous rappelez de l’histoire des 3 petits cochons ?

Le premier avait construit sa maison en paille, le second en avait fait une en bois, et le dernier, vu qu’il avait autre chose à faire que de se laisser bouffer par un grand méchant loup, avait décidé de construire la sienne en brique (il avait aussi lu et suivi les conseils de ce blogue).

Vous serez peut-être surpris, mais si l’on veut décrire les différents types de salles de serveurs à un VP Finances, cette analogie est sans doute l’une des plus représentatives, elle permet en plus une interprétation des plus amusante de ce concept.

Bien entendu, les critères de conception et de construction d’une salle de serveurs sont un peu plus complexes que ceux utilisés par Naf-Naf lors de la construction de sa maison de briques n’empêche que, de mon point de vue, c’est à peu près ça.

Quel type d’installation désirons-nous? Ça peut être une salle ultrasécurisée, comme pour une institution financière qui transige des millions de dollars à chaque minute, mais ça peut aussi parfois ressembler à un sous-sol à moitié aménagé, avec des murs en préfini, le tout construit sur un vieux tapis cramoisi (cette dernière stratégie est, soit dit en passant, nettement déconseillée).

Les budgets étant rarement illimités, un équilibre doit être atteint entre les sommes requises pour obtenir des installations conformes aux besoins de l’utilisateur, et les risques contre lesquels celui-ci doit raisonnablement se prémunir.Il existe 1001 possibilités !

La question à 100 piastres est simple, à quel prix faut-il éviter les arrêts de service ?

Logiquement, il s’avère essentiel de, tout d’abord, qualifier le type d’installations que l’on désire obtenir, en les situant par rapport à des normes d’industrie, en termes de robustesse, de fiabilité et de disponibilité.

Au Québec, comme un peu partout ailleurs sur la planète, on les qualifiera en fonction de recommandations émises par des sources de références reconnues, commecelles de : l’Uptime Institute™ (aussi reprisent par ANSI/BICSI 002-2011 et TIA-942), qui classe ce type d’installations en 4 catégories nommées « TIERS».

TIER I(au moins ça marche)

Il s’agit d’un environnementre-la-ti-ve-ment « amélioré », comparativement à un environnement de travail traditionnel.

Si on utilise l’analogie de l’histoire des3 petits cochons, on pourrait dire que ça représente la maison de paille, ou alors qu’une salle TIER I, c’est toujours mieux que pas de salle du tout.La salle de serveurs de classe TIER I sera munie de quelques systèmes pouvant permettre un fonctionnement continu et ponctuel des serveurs, sans plus (par exemple, un système UPS).

La configuration typique ne comprend qu’une seule source d’alimentation électrique et de climatisation (N) sans source alternative d’approvisionnement en relève ou secondaire, pour des fins de redondance et/ou d’entretien des systèmes.

Selon l’Uptime Institute®, une salle de classe TIER I, offre un rendement en disponibilité de système de 99.67 %, avec un impact annuel d’interruption de services de 1.19 jour en moyenne, incluant les interruptions planifiées aux fins d’entretien et non planifiées (défaillance)

TIER II (ça marche assez souvent)

Cette classe comprend tous les attributs d’un site de type TIER I avec, en plus, des composantes mécaniques et électriques redondantes, mais à l’intérieur d’une seule source d’approvisionnement (N+1). C’est donc plus que du bonbon, le bois étant un peu plus solide que la paille, mais toujours moins que la brique.

En effet, la défaillance, l’entretien, ou la réparation de n’importe quel élément non N+1 entraînera l’interruption des opérations informatiques.

Selon l’Uptime Institute®, un site de type TIER II, offre un rendement en disponibilité de système de 99.75%, ou 22 heures d’interruption de services par année, en moyenne.

TIER III (on dirait que ça marche presque tout le temps)

Il s’agit d’une solution qui offre les mêmes caractéristiques qu’un site de type TIER II, en plus d’ajouter une fonctionnalité d’entretien et de réparation permissible des systèmes sans interruption des opérations informatiques.

En termes simples, ça signifie que le grand méchant loup ne devrait pas vous atteindre trop souvent, à moins d’être vraiment, mais alors là vraiment méchant, vu que vous êtes à l’abri dans une maison de briques.

Tous les éléments et composantes d’une source d’approvisionnement d’une salle de type TIER III peuvent être retirés, remplacés, réparés et entretenus, sans interruption des opérations informatiques, grâce à la disponibilité de pipelines d’approvisionnement mécanique et électrique secondaire de relève (2N), en plus de la source avec éléments redondants N+1, inclus avec la configuration TIER II.

Cette solution est généralement envisagée dans le cadre d’une vision à long terme, car elle s’avère souvent réalisable, en procédant à certains ajouts en même temps que ceux pouvant s’avérer requis pour supporter la croissance de la charge.

Selon l’Uptime Institute®, un centre de traitement de type TIER III, offre un rendement en disponibilité de système de 99.98%, ou à peine 1.6 heure d’interruption de services par année en moyenne;

TIER IV (mais comment ça pourrait arrêter ?!)

Les 3 petits cochons n’avaient pas songé à construire leurs maisons de cette façon (mais en donnant un peu plus de temps et d’argent à Naf-Naf le briqueleur, peut-être que…).

L’infrastructure de ce type d’environnement est drôlement robuste ! Elle est composée de multiples sources d’approvisionnement mécaniques et électriques actives, redondantes et physiquement isolées, pouvant être individuellement retirées, remplacées, réparées et entretenues, sans avoir à recourir à l’interruption des opérations informatiques.

Ces salles dites « tolérantes aux défaillances » le sont habituellement devenues, suite à l’implantation initiale d’une salle de catégorie TIER III, qui a été modifiée graduellement avec le temps, afin d’éventuellement inclure tous les attributs d’un environnement TIER IV.

C’est comme si Naf-Naf avait ajouté du béton armé, construit un champ de mines autour de sa maison, et ajouté en plus une tourelle avec des canons.

Une salle TIER IV permet finalement, en théorie, de réduire les interruptions de services a une période de quatre (4) heures tous les 5 ans, ou environ 27 minutes sur une base annuelle (ou un rendement de disponibilité de système de 99.99%), incluant les arrêts de service planifiés et non planifiés.

Résumé (niveaux TIER)

Si on va à l’essentiel, on peut résumer la performance des différents indices de disponibilité de cette façon :

Vous avez des questions, des commentaires, souhaitez partager une expérience, prière de communiquer avec moi via pmally@groupebiotope.com, je serai flatté d’en discuter davantage avec vous !

Bonne semaine à tous

Pierre

À propos de l'auteur

Pierre Mally

Pierre Mally est associé principal et consultant indépendant chez Groupe Biotope, une firme d’experts-conseils qui assiste les gestionnaires responsables de salles de serveurs (Data Centre) dans le développement, et surtout la mise en application, d’une stratégie d’occupation plus saine, plus durable et plus en lien avec la réalité des TICs d’aujourd’hui.

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Champs requis *