Chapitre 1 Les Centres de Donnees
Chapitre 1 Les Centres de Donnees
Chapitre 1 Les Centres de Donnees
Datacenter
Environnement hautement sécurisé
Caractéristiques
Les composants informatiques
Niveaux de disponibilité
Le Capacity Planning
Le DRP, “Disaster Recovery Plan”
malick.gaye@Hotmail.com 2
Datacenter
Généralité sur la virtualisation
Qu’est-ce que la virtualisation
Les types de virtualisation
Comment fonctionne la virtualisation des serveurs
Les composants d’un centre de données virtualisé
Les types d’hyperviseur
Qu’est-ce qu’une machine virtuelle
Infrastructure physique et virtuelle
Avantages de la virtualisation
malick.gaye@Hotmail.com 3
Datacenter
Généralité sur la virtualisation
Les outils de virtualisation des SE
Outils propriétaires
VMware
Hyper-V
Outils open source
Proxmox (KVM)
Citrix xen
Virtualisation des conteneurs
Proxmox (OpenVZ)
Docker
malick.gaye@Hotmail.com 4
Les outils de virtualisation des SE
Proxmox VE
Présentation de Proxmox VE
Installation
Configuration requise
Configuration de l’Hôte Proxmox VE
Déploiement de VM et de conteneurs
Gestion des machines virtuelles
Gestion des conteneurs
Clustering avec Proxmox VE
Mise en place d’un cluster
Réplication de données avec DRBD
Le stockage
Migration de conteneurs et de VM
Configuration de HA
Sauvegarde et restauration avec VZdump
malick.gaye@Hotmail.com 5
Les outils de virtualisation des SE
VMware vSphere
Les produits et quelques fonctionnalités de VMware vSphere
L’hyperviseur ESXi
VMware vSphere client
VCenter serveur
Stockage
Fonctionnalités avancées
malick.gaye@Hotmail.com 6
Les outils de virtualisation des SE
Hyper-V
Présentation de Hyper V
Installation et configuration d’Hyper-V
Live migration (Migration dynamique)
La réplication avec Hyper-V
La haute disponibilité avec clustering et basculement
System center VMM
malick.gaye@Hotmail.com 7
Les réseaux et le stockage virtuels
Les SDNs
Le stockage
Types et protocoles de stockage
RAID
DAS
NAS
SAN
Snapshot et Backup
Mise place d’un SAN avec Windows Serveur
malick.gaye@Hotmail.com 8
Datacenter
Introduction
Environnement hautement sécurisé
Caractéristiques
Les composants informatiques
Niveaux de disponibilité
Le Capacity Planning
Le DRP, “Disaster Recovery Plan”
Conclusion
malick.gaye@Hotmail.com 9
Le Datacenter, une infrastructure au cœur des services numériques
Un Datacenter est une infrastructure immobilière et technique destinée à
l’hébergement d’une concentration importante d’équipements
informatiques.
malick.gaye@Hotmail.com 10
De salles sécurisées pour accueillir les équipements informatiques
les baies, armoires de raccordement pour les serveurs, aux dimensions
standardisées ;
les serveurs applicatifs, sur lesquels sont exécutés les logiciels ;
les serveurs de données, qui assurent le stockage des données ;
d’équipements réseau interconnectant les serveurs. il s’agit notamment des
routeurs, parefeu, répartiteurs et commutateurs ;
d’infrastructures techniques assurant la continuité de l’alimentation
électrique, du refroidissement
des serveurs et de l’accès au réseau à très Haut Débit pour l’ensemble
de ces ressources ;
de points d’accès aux réseaux électriques à haute tension et aux
réseaux de télécommunication très Haut Débit,
malick.gaye@Hotmail.com 11
Un datacenter est toujours constitué de trois composants élémentaires :
L’infrastructure, c’est à dire l’espace et les équipements nécessaires au
support des opérations du datacenter. Cela comprend les transformateurs
électriques, les alimentations sans interruption (UPS), les générateurs, les
armoires de climatisation (CRAC), les systèmes de distribution électrique,
etc. Dans certains Datacenter, cette infrastructure consomme deux fois
plus d’espace que l’espace destiné à héberger les équipements
informatiques
Les équipements informatiques comprenant les racks, les serveurs, le
stockage, le câblage ainsi que les outils de gestion des systèmes et des
équipements réseaux.
Les opérations, c’est à dire le personnel d’exploitation qui pilote,
entretient et répare les systèmes IT et non IT lorsque cela est nécessaire.
malick.gaye@Hotmail.com 12
la haute disponibilité est définie comme « la caractéristique d’un service
des systèmes d’information qui minimise les effets d’une panne de
composant sur les activités utilisateurs ». un service en haute disponibilité
doit donc rester continuellement disponible pour ses utilisateurs.
Pour assurer une « Haute disponibilité », il est important que les ressources
nécessaires à la mise à disposition d’un service puissent pallier toute
défaillance. les Datacenters dupliquent donc les infrastructures et incluent
des mécanismes de redondance permettant de basculer automatiquement
les données et applications sur un site de repli en cas de défaillance du
site principal.
malick.gaye@Hotmail.com 13
Divers dispositifs assurent la sécurité du bâtiment et des équipements
informatiques.
La sécurité d’accès regroupe du gardiennage 24 h / 24 et des
technologies d’authentifcation multizones : badges, code, lecteur
empreintes digitales, etc.
Le datacenter intègre également des systèmes de prévention des
risques environnementaux. On trouve notamment un système de
détection d’eau chargé d’alerter en cas de fuite (les climatiseurs
fonctionnent en effet sur la base d’un réseau d’eau glacée).
malick.gaye@Hotmail.com 14
Divers dispositifs assurent la sécurité du bâtiment et des équipements
informatiques.
Les datacenter disposent également d’un système de détection
incendies basé sur deux technologies différentes pour garantir la fabilité
de l’information.
Un système complexe d’extinction y est relié, basé couramment sur la
diffusion rapide et globale d’un gaz neutre destiné à absorber l’oxygène.
Ces éléments, clairement constitutifs d’un datacenter, impactent les
conditions d’exploitation et la complexité du datacenter. Au même titre
que les autres, ils doivent être maintenus et supervisés.
malick.gaye@Hotmail.com 15
Disponibilité électrique
1. Fournir de l’électricité en quantité suffisante
2. Fournir de l’électricité de haute-qualité
Systèmes de refroidissement
1. Refroidissement des équipements
2. Refroidissement des baies :
3. Implantation des baies dans les salles
malick.gaye@Hotmail.com 16
Pour traiter, stocker et router des informations, le datacenter contient un
grand nombre de baies. Ces armoires accueillent différents composants
informatiques. Que ce soit le serveur, le stockage ou les éléments
réseaux, ils peuvent tous faire l’objet d’amélioration énergétique,
l’objectif étant de réduire la consommation et les dépenses
énergétiques à la source
malick.gaye@Hotmail.com 17
Serveurs
Un serveur est, par défnition, une machine sur laquelle des logiciels
s’exécutent. Les serveurs peuvent être classés suivant leur format et
leur capacité de traitement. On distingue trois grandes catégories :
Les serveurs traditionnels (standalone) sont les plus couramment
utilisés à l’heure actuelle. Ils hébergent une à deux applications par
machine physique, dotée d’un seul système d’exploitation.
malick.gaye@Hotmail.com 18
Serveurs
Les serveurs lame (blade) sont conçus pour un très faible encombrement.
Plusieurs de leurs composants sont mutualisés dans un châssis capable d’accueillir
plusieurs serveurs lames. Le châssis fournit l’alimentation électrique, le
refroidissement, l’accès au réseau, la connectique pour écran, clavier et souris. Le
contenu ou le rôle du châssis peut varier d’un constructeur à l’autre.
malick.gaye@Hotmail.com 19
Serveurs
malick.gaye@Hotmail.com 20
Serveurs
Les serveurs virtualisés sont des copies logicielles de serveurs
physiques standalone qui s’exécutent sur une seule machine
physique. Comme les serveurs standalone ne sont exploités qu’à 10
à 20% de leurs capacités, regrouper plusieurs serveurs virtuels sur
une même machine peut s’avérer économiquement et
énergiquement rentable.
La virtualisation des serveurs a donc un impact important sur
l’effcience énergétique : on mutualise sur une seule machine
plusieurs serveurs, leurs alimentations électriques, et leur
dissipation de chaleur. Le refroidissement, le routage et l’accès au
réseau sont alors réduits.
malick.gaye@Hotmail.com 21
Une baie de brassage ou armoire de brassage ou armoire réseau est
une armoire technique qui centralise des éléments de réseaux
informatiques et de téléphonie.
malick.gaye@Hotmail.com 22
Stockage
La consommation électrique liée au stockage des données représente environ 30% de celle
du datacenter. Selon ESG, lorsque la majorité des serveurs aura été virtualisée, le stockage
sera le premier poste de consommation énergétique, représentant la moitié de la facture
électrique liée à l’informatique. Cette énergie est utilisée pour écrire et lire l’information
mais aussi pour garder l’information inscrite et disponible sur l’emplacement qu’on lui a
donné
malick.gaye@Hotmail.com 23
On retrouve trois grandes technologies de stockage :
Dans les salles de petite taille et dans les nouveaux datacenters
géants, il n’est pas rare de stocker l’information sur le serveur qui
l’utilise, on parle alors de DAS (DirectAttached Storage). Seul le
serveur qui héberge le disque dur peut accéder aux données.
malick.gaye@Hotmail.com 24
Dans les salles de taille moyenne ou de grande taille, on dédie à
certaines machines une fonction de stockage.
Elles constituent alors une «baie de stockage».
La plupart des baies sont connectées aux serveurs de traitement soit
en SAN (Storage Area Network) ou en NAS (Network Attached
Storage).
Le NAS est directement rattaché au réseau local Ethernet et se
comporte comme un serveur de fchiers.
Le SAN est un réseau local à part entière qui nécessite un accès haut
débit
malick.gaye@Hotmail.com 25
L’information stockée en local (DAS) doit souvent être
répliquée partout où l’information en question sera utile,
générant donc plus de Consommation d’énergie que si elle
n’était stockée qu’une seule fois.
Cependant, l’information ne peut pas être stockée qu’une
seule fois pour des raisons de sécurité. On doit alors
prendre en compte dans le choix de la technologie utilisée
pour stocker l’information sa criticité et son niveau de
disponibilité nécessaire.
malick.gaye@Hotmail.com 26
Réseau
Les éléments réseau servent à router les informations entre les utilisateurs
et les serveurs.
Ils sont principalement constitués de commutateurs (switch), routeurs
(router), coupesfeux (frewalls) et répartiteurs de charge (load balancers).
Physiquement, ils sont reliés par différents types de médias : fbre optique
pour de longues distances, câble cuivre réseau, liaison radio, etc.
Ces éléments supportent des fonctions de qualité de service (QoS) qui leur
permettent de gérer plusieurs réseaux distincts en toute sécurité. On peut
ainsi mutualiser le routage de plusieurs réseaux sur un même équipement
et ainsi consommer moins d’énergie.
Le réseau virtuel des VM
malick.gaye@Hotmail.com 27
Les Datacenters sont conçus sur deux critères principaux qui sont la haute
disponibilité, pour que les applications informatiques ne s’arrêtent jamais
et l’efficacité énergétique pour minimiser la facture énergétique.
Les Datacenters étaient jusqu’à maintenant classés par le niveau de
disponibilité de
‘1’ avec peu de redondance d’équipements,
à ‘4’ avec redondance multiple d’équipements pour une fléxibilité optimale
de l’exploitation.
malick.gaye@Hotmail.com 28
Que signifent les Tier ?
Le Uptime Institute - une association nord américaine - a créé une
classifcation des datacenters en 4 niveaux (appelés Tier en anglais) Chaque
Tier correspond à des niveaux d’équipements et de disponibilités différents
:
Tier 1 désigne les datacenters n’ayant qu’une seule voie pour
l’alimentation électrique et le refroidissement, sans redondance des
éléments. Ces centres ont une disponibilité nominale correspondant à un
temps d’arrêt cumulé moyen de 28,8 heures par an.
malick.gaye@Hotmail.com 29
Tier 2 groupe les datacenters n’ayant aussi qu’une seule voie pour
l’alimentation électrique et le refroidissement, mais ayant par ailleurs des
éléments redondants permettant d’atteindre une disponibilité nominale de
99,749% (soit 22 heures d’arrêt)
Tier 3 est plus évolué : Il comporte plusieurs voies d’alimentation et de
refroidissement dont une seule est active. Des éléments sont doublés et la
maintenance peut se faire souvent sans avoir à arrêter les machines. La
disponibilité est de 99,982%, soit 1,6 heure d’arrêt dans l’année
Tier 4 est plus exigeant : il possède plusieurs voies actives en parallèle
pour les alimentations et le refroidissement. Beaucoup d’éléments
d’infrastructure sont doublés et « tolérants aux pannes ». La disponibilité
résultante est de 99,995% correspondant à 0,4 heure d’arrêt par an
malick.gaye@Hotmail.com 30
malick.gaye@Hotmail.com 31
Le Capacity Planning consiste à estimer l'espace, le matériel
informatique, les logiciels et les ressources de l'infrastructure de
connexion qui seront nécessaires au cours d'une période future.
Les entreprises ont besoin de savoir s’il y a assez de ressources
nécessaires (CPU, mémoire, stockage) pour faire face à une
augmentation du nombre d'utilisateurs ou du nombre
d'interactions.
Le capacity planning prend en compte l'ajout de CPU, de
mémoire et de stockage à un serveur physique ou virtuel.
malick.gaye@Hotmail.com 32
Le Capacity Planning est une question d'optimisation - il s'agit
de maximiser les avantages commerciaux de l'informatique sans
dépenser trop, en équilibrant la productivité de l'entreprise avec
les coûts informatiques. Tout DSI ou responsable informatique
disposant d'un temps, d'argent ou d'un budget personnel limité
devrait être motivé à faire du Capacity Planning pour :
Prédire quand l’infrastructure ne sera plus en mesure d'atteindre les niveaux de service.
Se préparer aux charges de travail futures, qu'elles soient prévues ou inattendues.
Déterminer quels éléments de l'infrastructure informatique deviendront des goulets
d'étranglement futurs en matière de performance.
Prévoir la configuration de production la plus rentable avant le déploiement d'une
nouvelle application.
…
malick.gaye@Hotmail.com 33
Un plan de reprise d’activité (Disaster Recovery Plan – DRP) a
pour objectif de planifier le rétablissement, dans les meilleurs
délais, d’une infrastructure informatique. Il vise à permettre la
reprise opérationnelle des services en cas de sinistre.
Le plan de reprise d’activité se distingue du plan de continuité
d’activité.
Le plan de reprise d’activité se caractérise par son approche
technique de la reprise suite à un sinistre informatique.
Le plan de continuité d’activité est un document générique et
surtout stratégique, planifiant et détaillant les types d’actions
pour gérer une catastrophe ou un sinistre grave.
malick.gaye@Hotmail.com 34
Le plan de reprise d'activité doit permettre un basculement vers
une infrastructure informatique « alternative » dédiée à la survie
du business ou de l’activité.
Les plans de reprise d’activité sont conçus et évoluent en fonction
des besoins du business.
Tout DRP doit être construit sur la base des deux notions suivantes
RTO : La Durée maximale d'interruption admissible (Return Time
on Objective – RTO)
RPO : La Perte de Données Maximale Admissible (Recovery Point
Objective – RPO)
malick.gaye@Hotmail.com 35
En règle générale, la reprise sur panne s’appuie sur deux
mécanismes génériques:
un des nœuds est chargé de surveiller en permanence
l’ensemble des nœuds du système par envoi périodique de
messages de contrôle (heartbeat); en cas d’interruption de la
communication, on va considérer qu’une panne est intervenue;
la méthode de reprise s’appuie sur la redondance des services
et la réplication des données: pour tout composant fautif, on
doit pouvoir trouver un autre composant doté des mêmes
capacités.
malick.gaye@Hotmail.com 36
Les data centers sont de plus en plus nombreux à
implémenter des logiciels cloud privés.
Le cloud permet d’augmenter le niveau d’automatisation et
de self-service grâce à la virtualisation.
L’objectif est de permettre aux utilisateurs individuels de
profiter de ressources informatiques à la demande sans
avoir à recourir aux administrateurs informatiques. Il est
également de plus en plus fréquent de s’en remettre à un
fournisseur de cloud public.
malick.gaye@Hotmail.com 37
malick.gaye@Hotmail.com 38