Flux RSS - La vie du site - Nouveautés et mises à jour
Assiste.com - Sécurité informatique - Décontamination - Antivirus - Protection - Protection de la Vie Privée Assiste.com - Sécurité informatique préventive - Décontamination - Antivirus - Protection - Protection de la Vie Privée

RAID - Disques montés en RAID

Dernière mise à jour : 2018-10-12T14:52 - 12.10.2018
18.06.2013 - 18h50 - Paris - (Assiste - Pierre Pinard)

RAID - Disques montés en RAID - Technologies nées de la baisse des prix des disques durs. Les disques sont montés en matrices avec recherche de performances et/ou de fiabilité des données et/ou de tolérance de pannes etc. ...

RAID - Disques montés en RAID - Les différentes technologies RAIDRAID - Disques montés en RAID - Les différentes technologies RAIDRAID - Disques montés en RAID - Les différentes technologies RAID

RAID fut une idée née de la baisse massive des coûts des disques durs.

RAID (Redundant Arrays of Inexpensive Disks)
Traduit par diverses expressions dont le sens général fut, initialement : " Matrice redondante de disques économiques ". Aujourd'hui, le sens général est plutôt compris comme " Redondance par Matrice de disques indépendants ".

L'acronyme RAID a été créé en 1987, dans le titre d'un article de Jakob Østergaard et Emilio Bueso, publié par l'Université de Berkeley, et intitulé " A Case for Redundant Arrays of Inexpensive Disks (RAID) ", mais les concepts de l'un des usages de la technologie RAID furent brevetés en 1978 (par un employé d'IBM).

L'utilisation d'une matrice de disques peut se faire de différentes manières pour différents usages, et ces usages ont été tous appelés RAID suivi d'un numéro (qui ne correspond pas à la chronologie de mise au point).

C'est le contrôleur disque, sur la carte mère, qui est capable de l'une ou l'autre (ou plusieurs) de ces technologies.

D'une manière générale, la matrice de disques est préférentiellement constituée de 2 à plusieurs disques de même marque, même capacité et même modèle. Dans la plupart des technologies RAID, si les disques de la matrice ont des performances différentes, la matrice aura les performances du plus faible d'entre eux.

Pour mémoire, lors des gigantesques salons informatiques " SICOB " (n'existe plus - se tenaient au CNIT à La Défense), des démonstrations de systèmes " Non Stop " spectaculaires faisaient reposer les câbles d'un système en fonctionnement sur un billot. On donnait une hache aux visiteurs en leur demandant de couper un câble au hasard. On pouvait voir le système s'écrouler quelques secondes et reprendre sa vitesse de croisière en quelques secondes (la marque Tandem, en particulier, avait des système entièrement à tolérance de panne, où tout était redondant, y compris les processeurs et les programmes. Le MTBF (Temps moyen entre deux pannes) se comptait en années là ou n'importe quel système observait plusieurs de pannes "normales" par an. Tandem se poursuit encore aujour'hui : La société a été rachetée en 1997 par Compaq, qui désirait une ligne de serveurs haut de gamme. Compaq a été racheté en mai 2002 par Hewlett-Packard et la gamme NonStop a été rebaptisée Integrity NonStop.).

RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")

Dans cette configuration RAID, les données écrites / lues sont découpées en fragments (dont la taille est paramétrable par l'utilisateur) qui sont écrites / lues sur plusieurs disques simultanément. La matrice de disques est vue comme un unique volume de grande taille. En théorie, on obtient des débits dont la vitesse serait la somme des débits de chacun des disques, jusqu'à atteindre le débit maximum du canal / bus disques :
  • SATA I ou SATA 150 : Débit théorique Gbit/s : 1,5, Débit théorique Mo/s : 187,5, Débit pratique Mo/s : 150
  • SATA II ou SATA 300 : Débit théorique Gbit/s : 3,0, Débit théorique Mo/s : 375,0, Débit pratique Mo/s : 280
  • SATA III ou SATA 600 : Débit théorique Gbit/s : 6,0, Débit théorique Mo/s : 750,0, Débit pratique Mo/s : 600
  • SCSI-3 Ultra-160 SCSI (ou Ultra3 Wide SCSI) : Vitesse Bus (Mo/s) 160
  • SCSI-3 Ultra-320 SCSI : Vitesse Bus (Mo/s) 320
  • SCSI-3 Ultra-640 SCSI : Vitesse Bus (Mo/s) 640
  • PCIe 1x 250 MO/s
  • PCIe 2x 500 MO/s
  • PCIe 4x 985 MO/s
  • PCIe 8x 1969 MO/s
  • Etc. ...
Le Striping (RAID 0), emporte une multiplication du risque, car, les données (un fichier) étant découpées en " bandes " sur plusieurs disques, la défaillance d'un seul d'entre eux entraîne la perte de toutes les données. La défaillance d'un cluster entraîne la perte totale du fichier, y compris les " bandes " sur les autres disques de la matrice. RAID 0 ne devrait d'ailleurs pas faire partie des technologies RAID puisqu'il n'y a pas de Redondance des données.

RAID 0 peut être exploité, simultanément, avec une autre technologie effectuant un mirroring en temps réel, appelée RAID 1 (on parle alors de RAID 0+1 ou RAID 1+0 où performances et permanence du service sont assurées simultanément).

La taille des fragments doit être calculée en fonction de la nature des données manipulées. Définir de grandes " bandes " alors que l'on manipule de tout petits fichiers, entraîne une perte considérable de volume de stockage. Dans les autres implémentations RAID, la taille des blocs n'est pas paramétrable.

RAID 0 est extrêmement populaire. Minimum 2 disques.

RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")RAID 1 - Permanence du service " Non Stop "ou " A tolérance de panne " (appelé " Mirroring ")RAID 1 - Technologie de recherche de permanence du service sur des machines " Non Stop "ou " A tolérance de panne " (appelée " Mirroring ")

Dans cette configuration, les disques vont par paires et l'un est le miroir de l'autre. En cas de défaillance de l'un des disques, tout bascule sur le miroir sans interruption du service. Le disque défaillant peut être retiré à chaud et un autre peut être inséré à chaud - la reconstruction est transparente.
Lorsque tout va bien, la lecture peut se faire simultanément sur les originaux et les miroirs, augmentant la vitesse de lecture de ce type de matrice.
L'écriture en RAID 1 provoque de net ralentissements lorsque la technologie RAID est uniquement logiciel.
L'écriture en RAID 1 provoque quelques ralentissements lorsque la matrice est prise en charge par un contrôleur RAID. Le choix de la marque / modèle du contrôleur est déterminant.
L'écriture en RAID 1 ne provoque aucun ralentissement lorsque l'implémentation se fait avec un contrôleur RAID par disque. On parle alors de duplexing. Solution très onéreuse.

RAID 1 est très populaire.
Minimum deux disques.

RAID 0+1 - Technologie alliant performance et permanence (RAID 0 + RAID 1)RAID 0+1 (RAID 01) - Technologie alliant performance et permanence (RAID 0 + RAID 1)RAID 0+1 - Technologie alliant performance et permanence (RAID 0 + RAID 1)

Si vous avez une matrice de 3 disques en RAID 0, il vous faut une seconde matrice de 3 disques pour ajouter RAID 1 à RAID 0.
Dito RAID 1+0 mais au niveau du block.
Pas de contrôle de parité.
Minimum 4 disques vus comme un unique volume.

RAID 0+1 est très populaire mais moins populaire que RAID 1+0 (moins bonne tolérances de pannes et moins bonnes performances).
Minimum 4 disques.

RAID 2 - Bit level striping et relative tolérance de panneRAID 2 - Bit level striping et relative tolérance de panneRAID 2 - Bit level striping et relative tolérance de panne

RAID théorique, pas utilisé. Les données ne sont pas splittées (striping) en grands tronçons (bandes) comme dans RAID 0 mais au niveau du bit. Code de parité de Hamming. Les codes de Hamming (aussi appelés par le nom de la famille de ce type de codes : ECC - Error Checking and Correcting - Détection et correction d'erreur) permettent de détecter jusqu'à deux erreurs de parité dans un mot (octet) et de corriger une erreur de parité. Ils ne prennent pas trop de place (redondance faible).
Les codes de Hamming sont calculés et écrits, de manière logiciel (pilote du contrôleur RAID) lors de l'écriture des données, et recalculés à la lecture puis comparés à ceux calculés lors de l'écriture.
Les codes de Hamming sont stockés sur un volume dédiés.
La sollicitation intensive du disque dédié aux contrôles de parité constitue un goulot d'étranglement et ralentit, globalement, la matrice, en cas d'entrées / sorties disques nombreuses.

RAID 2 n'est plus implémenté car les codes de contrôle ECC sont désormais pris en charge par le contrôleur RAID.
Minimum 3 disques vus comme un unique volume.

RAID 3 - Byte level striping et relative tolérance de panneRAID 3 - Byte level striping et relative tolérance de panneRAID 3 - Byte level striping et relative tolérance de panne

Les données ne sont pas splittées (striping) en grands tronçons (bandes) comme dans RAID 0 mais au niveau du byte (octet) et écrites pas blocs de 512 octets (voire 1024 octets). Contrôle de parité.
L'un des volumes, dédié, est utilisé pour contenir les contrôles de parité.
Technologie implémentée mais peu utilisée.
La sollicitation intensive du disque dédié aux contrôles de parité constitue un goulot d'étranglement et ralentit, globalement, la matrice, en cas d'entrées / sorties disques nombreuses.

Peu utilisé
Minimum 3 disques vus comme un unique volume.

RAID 4 - Block level striping et relative tolérance de panneRAID 4 - Block level striping et relative tolérance de panneRAID 4 - Block level striping et relative tolérance de panne

C'est du RAID 3 amélioré.
Les données ne sont pas splittées (striping) par grands tronçons (bandes) comme dans RAID 0 mais au niveau du block. Contrôle de parité.
Le découpage et la manipulation en blocks améliore les performances. L'un des volumes, dédié, est utilisé pour contenir les contrôles de parité.
Technologie implémentée mais pratiquement pas utilisée.
La sollicitation intensive du disque dédié aux contrôles de parité constitue un goulot d'étranglement et ralentit, globalement, la matrice, en cas d'entrées / sorties disques nombreuses.

Peu utilisé
Minimum 3 disques vus comme un unique volume.

RAID 5 - Intégrité des données et tolérance de panne : Block level striping avec ECC distribuéRAID 5 - Intégrité des données et tolérance de panne : Block level striping avec ECC distribuéRAID 5 - Intégrité des données et tolérance de panne : Block level striping avec ECC distribué

C'est du RAID 4 amélioré par la diffusion des codes ECC sur tous les volumes.
Les données ne sont pas splittées (striping) en grands tronçons (bandes) comme dans RAID 0 mais au niveau du block. Contrôle de parité.
Les codes de contrôle de parité sont distribués sur tous les volumes de la matrice ce qui élimine le goulot d'étranglement de RAID 2, RAID 3, et RAID 4.
La tolérance de panne est améliorée par la distribution des codes ECC, chaque fois, sur un autre volume que celui de la donnée contrôlée.
En cas de panne de l'un des disques de la matrice, les codes ECC perdus peuvent être reconstitués à partir des données préservées sur les autres disques et,, corrolaire, en cas de données perdues, elles peuvent être reconstituées à partir des codes ECC sur les autres disques.
Le disque défaillant peut être retiré à chaud et un autre peut être inséré à chaud - la reconstruction est transparente.
En cas de panne de plus d'un disque de la matrice, tout est perdu.

Technologie RAID très populaire.
Minimum 3 disques vus comme un unique volume.

RAID 6 - Intégrité des données et tolérance de panne : Block level striping avec double ECC distribuéRAID 6 - Intégrité des données et tolérance de panne : Block level striping avec double ECC distribuéRAID 6 - Intégrité des données et tolérance de panne : Block level striping avec double ECC distribué

Amélioration de RAID 5 avec deux codes de contrôle de parité correcteur d'erreur, distribués.
Les codes de contrôle de parité sont distribués sur tous les volumes de la matrice.
Le calcul des codes de parité peut ralentir un peu les phases d'écriture. Pas d'incidence en lecture.
Tolérance de panne de deux disques dans la matrice. Performances légèrement inférieure à RAID 5 mais tolérance de panne accrue.
Utilisé lorsque l'intégrité des données est critique.
Minimum 3 disques vus comme un unique volume.

RAID 7 - Technologie de recherche de l'intégrité des données (tolérance de panne)RAID 7 - Technologie de recherche de l'intégrité des données (tolérance de panne)RAID 7 - Technologie de recherche de l'intégrité des données (tolérance de panne)

Seul standard industriel parmi les implémentations RAID.
Implémentation de RAID 3 ou RAID 4 mais avec contrôleur doté de processeurs rapides et d'une mémoire cache amortissant le goulot d'étranglement des écritures des ECC sur le volume dédié.
Contrôleur extrêmement cher proposé uniquement par SCC (Storage Computer Corporation).
Peu utilisé
Minimum 3 disques vus comme un unique volume.

RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")RAID 1+0 (RAID 10) - Technologie alliant performance et permanence (RAID 1 + RAID 0)RAID 0 - Technologie de Recherche de vitesse (appelée " Striping " ou " Entrelacement ")

Dito RAID 0 mais au niveau du block + RAID 1.
Pas de contrôle de parité.
Très populaire - Meilleures tolérances de pannes et meilleures performances que RAID 0+1
Minimum 4 disques vus comme un unique volume.

RessourcesRessources" Ressources "

8 SSD montés en RAID 6