S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology

Alertes failles
de sécurité et
de mises à jour

Contribuer - Questionner
Faire un lien

S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology : (SMART). Prévision, en partie normalisée, de panne des disques durs.

cr 02.01.2012 r+ 07.09.2022 r- 20.10.2024 Pierre Pinard. (Alertes et avis de sécurité au jour le jour)

Dossier (collection) : Acronymes, sigles et abréviations
Introduction Liste Malwarebytes et Kaspersky ou Emsisoft (incluant Bitdefender)

Sommaire (montrer / masquer)
01 S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology 02 S.M.A.R.T. : Description et notes 03 Historique et prédécesseurs de S.M.A.R.T. 04 Liste des attributs S.M.A.R.T. connus Derrière le rideau Autour de ce sujet dans Assiste FAQ

S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology

L'acronyme S.M.A.R.T. est utilisé pour : Self-Monitoring, Analysis, and Reporting Technology.

Aidez et soutenez Assiste – autorisez quelques publicités et cliquez dessus.

S.M.A.R.T. : Description et notes

En français, S.M.A.R.T. est traduit en « Technique d’Auto-surveillance, d’Analyse et de Rapport ».

Presque chaque disque dur peut rendre compte d'un ensemble de données sur son état et sa santé. C'est ce que l'on appelle S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology).

Selon les données signalées, une panne de disque dur peut souvent être détectée très tôt. Les températures des disques durs font partie des données lues et il est utile d'identifier les composants en surchauffe qui pourraient réduire la fiabilité des données et la durée de vie du disque.

SpeedFan, un petit logiciel gratuit, offre une caractéristique unique (appelée « analyse en ligne approfondie ») qui compare les données S.M.A.R.T. de votre disque dur avec un modèle théorique de données S.M.A.R.T. établi à partir de milliers ou millions de rapports S.M.A.R.T. du même modèle de disque dur. Cela permet de mieux identifier si un disque dur spécifique est en dehors des valeurs « normales » (habituelles) de ce même modèle.

SpeedFan (Sondes température, voltage, ventilateur, S.M.A.R.T.)

Attention : S.M.A.R.T., parfois écrit SMART, n’est pas une norme ou un standard. C’est un système de prévision des pannes des disques durs et la seule partie normalisée de S.M.A.R.T. est le mode de communication (le « protocole ») entre le firmware d’un disque dur et le système d’exploitation de l’appareil hôte du disque dur.

« S.M.A.R.T. », par erreur subtilement conduite, a introduit dans l’esprit du consommateur un niveau de confiance élevé dans un disque dur avant son achat et analyse. Tous les fabricants de disques durs déclarent donc leurs disques « S.M.A.R.T. » ou « compatibles S.M.A.R.T. », même s'ils ne fournissent qu’une seule mesure, sans réelle importance.

Les mesures elles-mêmes fournies aux systèmes d’exploitation ne sont pas les mêmes et, lorsque ce sont les mêmes, elles ne sont pas calculées de la même manière chez un fabricant ou un autre.

En gros, S.M.A.R.T. est un truc dont les mesures sont assez floues, en signification comme en calcul de leurs mesures.

S.M.A.R.T. Self-Monitoring, Analysis, and Reporting Technology (recherches avec google)
S.M.A.R.T. Self-Monitoring, Analysis, and Reporting Technology (recherches avec qwant)

Aidez et soutenez Assiste – autorisez quelques publicités et cliquez dessus.

Historique et prédécesseurs de S.M.A.R.T.

Une des premières technologies de surveillance de disques durs a été introduite par IBM en 1992 dans ses baies de disques IBM 9337 pour serveurs AS/400 utilisant des unités de disque IBM 0662 SCSI-2 (l’annonce SZG92-0289 d’IBM n’existe plus sur le WEB, ni même dans les archives du WEB). Plus tard, elle a été nommée « Technologie d'analyse prédictive des défaillances » (Predictive Failure Analysis (PFA) technology). Elle mesurait plusieurs paramètres clés de santé de l'appareil et les évaluait dans le micrologiciel (firmware) du périphérique. Les communications entre l'unité physique et le logiciel de surveillance étaient limitées à un résultat binaire (0 ou 1), à savoir :

« L'appareil est OK »
« Le lecteur est susceptible de tomber en panne bientôt »

Plus tard, une autre variante, nommée IntelliSafe, a été créée par le fabricant d'ordinateurs Compaq et les fabricants de disques durs Seagate, Quantum et Conner (annonce). Les lecteurs de disque mesureraient les « paramètres de santé » du disque et les valeurs seraient transférées au système d’exploitation et au logiciel de surveillance de l'espace utilisateur. Chaque fournisseur d'unité de disque était libre de décider quels paramètres devaient être inclus pour la surveillance et quels devraient être leurs seuils. La seule unification (normalisation) se faisait au niveau du protocole de communication avec l'hôte.

Compaq a soumis IntelliSafe au comité Small Form Factor (SFF) pour normalisation au début de 1995. IntelliSafe était soutenu par IBM, par les partenaires de développement de Compaq, Seagate, Quantum et Conner, et par Western Digital, qui ne disposait pas de système de prévision des pannes à l'époque. Le Comité a choisi l'approche d'IntelliSafe, car elle offrait plus de flexibilité. Compaq a placé IntelliSafe dans le domaine public le 12 mai 1995.

Cette norme IntelliSafe développée conjointement décrivait un protocole de communication permettant à un hôte ATA d'utiliser et de contrôler la surveillance et l'analyse d’un disque dur, mais ne spécifiait aucune métrique ou méthode d'analyse particulière. Cette norme a ensuite été nommée S.M.A.R.T.. (Seagate parle d'IntelliSafe et de S.M.A.R.T. PDF anglais).

Plus tard, S.M.A.R.T. est venu à être compris (bien que sans aucune spécification formelle) comme faisant référence à une variété de métriques et de méthodes spécifiques, or il est impossible de produire des métriques homogènes avec des systèmes de disques et de connexions aussi différents que SCSI, Fibre Channel, ATA, SATA, SAS, SSA, etc. Un système RAID est vu comme un disque unique alors qu’il est constitué de plusieurs disques.

Liste des attributs S.M.A.R.T. connus

Il n’y a pas d’accord entre les constructeurs, ni sur une définition précise des attributs, ni sur leurs unités de mesure. Chaque métrique, qui est évaluée de 1 à 253 (1 étant le pire et 253 le mieux), n’a aucune norme d’évaluation (l’évaluation est en fonction du constructeur, à la tête du fabricant) et les fabricants de disques considèrent certaines métriques comme des secrets.

Attributs S.M.A.R.T. connus

Légende
	Une valeur haute est désirée
	Une valeur basse est désirée
	Valeur n'existant plus
Critique	Indicateurs potentiels d’une panne électromécanique imminente
Articles en relation ou de référence	Disque dur Disque dur - test de la surface disque (commande CHKDSK) Disque dur - secteur Disque dur - cluster Disque dur - gap Disque dur - cylindre Disque dur - flottement des têtes Disque dur - atterrissage des têtes Disque dur - cache disque Disque dur - gestion des caches d'écriture différée Disque dur - attribuer une lettre à un disque Disque dur - notion de partition et partitionner un disque dur Disque dur - notions de fragmentation et de défragmentation Disque dur - compression disque et accélération

ID	Hex	Nom de l’attribut	Désiré	Description
01	0x01	Read Error Rate		Indique le taux d’erreur matérielle lors de la lecture de la surface du disque. Une valeur élevée indique un problème soit avec la surface du disque, soit avec les têtes de lecture/écriture. (Valeur brute spécifique au fournisseur.) Stocke les données liées au taux d'erreurs de lecture matérielle survenues lors de la lecture de données à partir d'une surface de disque. La valeur brute a une structure différente pour différents fournisseurs et n'est souvent pas significative en tant que nombre décimal.
02	0x02	Throughput Performance		Performance de débit générale en sortie du disque dur. Si la valeur de cet attribut diminue, il y a une forte probabilité qu'il y ait un problème avec le disque dur.
03	0x03	Spin-Up Time		Temps moyen de mise en rotation (de zéro RPM [tour par minute] jusqu’au fonctionnement complet) [en millisecondes].
04	0x04	Start/Stop Count		Décompte des cycles de démarrage/arrêt du disque dur. Le disque dur démarre, et par conséquent le compteur est augmenté, à la fois lorsque le disque dur est allumé après avoir été complètement éteint auparavant (déconnecté de la source d'alimentation) et lorsque le disque dur revient après avoir été précédemment mis en mode veille.
05	0x05	Reallocated Sectors Count		Nombre de secteurs réalloués. Quand le disque dur rencontre une erreur de lecture/écriture/vérification sur un secteur, il note ce secteur (en réalité tout le cluster dans lequel se trouve ce secteur) comme réalloué et transfère les données vers une zone saine de la surface disque. Ce processus est aussi connu sous le nom de remapping et les secteurs réalloués sont appelés remaps. C’est pourquoi, sur les disques dur modernes, on ne peut pas voir de « mauvais » blocs lorsque l'on teste la surface du disque (tous les mauvais secteurs sont cachés dans les secteurs réalloués). Cependant, plus il y a de secteurs réalloués, plus la vitesse d’écriture/lecture diminue. Lire : Disque dur Disque dur - test de la surface disque (commande CHKDSK) Disque dur - secteur Disque dur - cluster Disque dur - gap Disque dur - cylindre Disque dur - flottement des têtes Disque dur - atterrissage des têtes Disque dur - cache disque Disque dur - gestion des caches d'écriture différée Disque dur - attribuer une lettre à un disque Disque dur - notion de partition et partitionner un disque dur Disque dur - notions de fragmentation et de défragmentation Disque dur - compression disque et accélération
06	0x06	Read Channel Margin		Marge du canal pendant la lecture des données. La fonction de cet attribut n’est pas spécifiée.
07	0x07	Seek Error Rate	NC N/A	(Valeur brute spécifique au fournisseur.) Taux d'erreurs de recherche des têtes magnétiques. En cas de défaillance partielle du système de positionnement mécanique des têtes, des erreurs de recherche se produiront. Une telle défaillance peut être due à de nombreux facteurs, tels que l'endommagement d'un servomoteur ou la dilatation thermique des plateaux du disque dur avec la montée en température. Une augmentation de ce nombre indique une dégradation du disque. La valeur brute a une structure différente selon chaque fabricant et n'est souvent pas significative en tant que nombre décimal. Lire ces articles.
08	0x08	Seek Time Performance		Performance moyenne des opérations d’accès des têtes magnétiques. Si cet attribut diminue, c’est un signe de problèmes avec le sous-système mécanique.
09	0x09	Power-On Hours (POH)		Nombre d’heures de fonctionnement. La valeur brute de cet attribut indique le nombre total d’heures (ou de minutes ou de secondes, selon le constructeur) de fonctionnement du disque. Quand cette valeur se rapproche du niveau critique (durée de vie du disque donnée par le constructeur), le temps moyen entre deux pannes ou MTBF tend vers zéro. Cependant, en réalité, même si le MTBF chute à zéro, cela n’implique pas obligatoirement que le disque va cesser de fonctionner normalement.
10	0x0A	Spin Retry Count		Nombre d’essais de relancement de la rotation. Cet attribut stocke le nombre total d’essais de relancement de la rotation pour atteindre la pleine vitesse de fonctionnement (à condition que la 1^re tentative soit un échec). Une augmentation de cet attribut est signe de problèmes au niveau du sous-système mécanique du disque dur.
11	0x0B	Recalibration Retries		Cet attribut indique le nombre de fois qu’une recalibration a été relancée (à condition que la 1^re tentative soit un échec). Une augmentation de cet attribut est signe de problèmes au niveau du sous-système mécanique du disque dur.
12	0x0C	Device Power Cycle Count		Cet attribut indique le nombre total de cycles marche/arrêt complets du disque dur.
13	0x0D	Soft Read Error Rate		Taux d’erreurs non corrigées transmises au système d’exploitation.
22	0x16	Current Helium Level		Spécifique aux lecteurs He8 de HGST. Cette valeur mesure l'hélium à l'intérieur du lecteur de disque dur spécifique à ce fabricant. Il s'agit d'un attribut de pré-échec qui se déclenche une fois que la sonde détecte que l'environnement interne est hors spécifications.
170	0xAA	Available Reserved Space		Voir attribut 0xE8 (ID 232)
171	0xAB	SSD Program Fail Count		(Kingston) Nombre total d'échecs de fonctionnement du programme flash depuis le déploiement du lecteur. Identique à l'attribut 181.
198	0xA0	Uncorrectable Sector Count		Nombre total d'erreurs incorrigibles (de secteurs incorrigibles) lors de la lecture/écriture d'un secteur. Une augmentation de la valeur de cet attribut indique des défauts de la surface du disque et/ou des problèmes dans le sous-système mécanique. Lire ces articles.
	0xA1	Valid Spare Blocks		Blocs de rechange valides
	0xA3	Initial Invalid Blocks		Blocs non valides initiaux
	0xA4	Total TLC Erase Count		Nombre total d'effacements Triple Level Cell
	0xA5	Maximum TLC Erase Count		Nombre maximal d'effacements Triple Level Cell
	0xA6	Minimum TLC Erase Count		Nombre minimal d'effacements Triple Level Cell
	0xA7	Average TLC Erase Count		Nombre moyen d'effacements Triple Level Cell
	0xA9	Percentage Lifetime Remaining		Pourcentage de vie restante du disque (pour SSD).
181	0xB5	Program Fail Count Total ou Non-4K Aligned Access Count		Nombre d'accès aux données utilisateur (à la fois en lecture et en écriture) où les LBA ne sont pas alignés sur 4 Kio (LBA% 8! = 0) ou où la taille n'est pas le module 4 Kio (nombre de blocs! = 8), en supposant une taille de bloc logique (LBS) = 512 B. [Micron : The SMART Command Feature Set – Anglais PDF 26 pages]
182	0xB6	Erase Fail Count		Nombre d'échecs d'effacement. Attribut "Pre-Fail" utilisé au moins dans les appareils Samsung.
183	0xB7	SATA Downshift Error Count ou Runtime Bad Block		Attribut Western Digital, Samsung ou Seagate : Nombre de rétrogradations de la vitesse de la liaison (par exemple de 6 Gbit / s à 3 Gbit / s) ou Nombre total de blocs de données avec des erreurs détectées et incorrigibles rencontrées en fonctionnement normal. Bien que la dégradation de ce paramètre puisse être un indicateur du vieillissement du disque dur et/ou indiquer des problèmes électromécaniques potentiels, elle n'indique pas directement une panne imminente du disque dur.
184	0xB8	Data transfer through RAM buffer cache between host and hard drive		Transfert des données à travers le cache tampon RAM entre l' hôte et le disque dur
187	0xBB	Reported Uncorrectable Errors		Le nombre d'erreurs qui n'ont pu être corrigées par le code correcteur (?) (voir attribut 195)
188	0xBC	Command Timeout		Nombre d'opérations interrompues à cause d'un timeout du disque dur.
190	0xBE	Airflow Temperature (WDC)		Température de l’air sur les disques Western Digital (la même que la température (C2), mais la valeur de l’attribut est inférieure de 50).
191	0xBF	G-sense Error Rate		Nombre d'erreurs dues à des chocs externes et/ou vibrations.
192	0xC0	Power-off Retract Count		Indique le nombre d'arrêts d'urgence, c'est-à-dire, le nombre total d'arrêts non sécuritaires du disque dur, souvent causés par un arrêt forcé de l'ordinateur ou un choc violent.
193	0xC1	Load/Unload Cycle		Nombre de cycles de chargement/déchargement dans la position où la tête magnétique est posée.
194	0xC2	Temperature		Température interne actuelle.
195	0xC3	Hardware ECC Recovered	NC N/A	Temps entre les erreurs corrigées par code correcteur (?) (augmente et diminue, une faible valeur est probablement mauvaise).
196	0xC4	Reallocation Event Count		Nombre d’opérations de réallocation (remap). La valeur brute de cet attribut est le nombre total de tentatives de transfert de données entre un secteur réalloué et un secteur de réserve. Les essais fructueux et les échecs sont tous comptés au même titre.
197	0xC5	Current Pending Sector Count		Nombre de secteurs « instables » (en attente de réallocation). Quand des secteurs instables sont lus avec succès, cette valeur est diminuée. Si des erreurs se produisent à la lecture d’un secteur, le disque va tenter de récupérer les données, puis de les transférer vers la zone de réserve et va marquer le secteur comme réalloué.
198	0xC6	Uncorrectable Sector Count		Nombre total d’erreurs incorrigibles à la lecture/écriture d’un secteur. Une augmentation de cette valeur indique des défauts de la surface du disque et/ou des problèmes avec le sous-système mécanique.
199	0xC7	UltraDMA CRC Error Count		Nombre d’erreurs dans le transfert de données via le câble d’interface comme déterminé par l’ICRC (Interface Cyclic Redundancy Check, littéralement vérification des redondances cycliques de l’interface).
200	0xC8	Write Error Rate / Multi-Zone Error Rate		Nombre total d’erreurs à l’écriture d’un secteur.
201	0xC9	Soft Read Error Rate / Soft Read Error Rate		Nombre total d’erreurs off-track.
220	0xDC	Disk Shift		Distance de laquelle le disque est déplacé par rapport à son axe de rotation (habituellement à cause des chocs). L’unité de mesure est inconnue.
221	0xDD	G-Sense Error Rate		Nombre d’erreurs résultant de chocs ou de vibrations externes.
222	0xDE	Loaded Hours		Temps de fonctionnement passé en charge de données (mouvement de l’armature des têtes magnétiques).
223	0xDF	Load/Unload Retry Count		Nombre d'essais infructueux de chargement/déchargement de la tête avant changement effectif du statut.
224	0xE0	Load Friction		Résistance causée par la friction dans les parties mécaniques en cours de fonctionnement.
226	0xE2	Load 'In'-time		Temps total de charge sur l’actuateur des têtes magnétiques (temps qui n’est pas passé en zone de positionnement fixe).
227	0xE3	Torque Amplification Count		Nombre de tentatives de compensation des variations de la vitesse de rotation du plateau.
228	0xE4	Power-Off Retract Cycle		Nombre de fois que l’armature magnétique a été rétractée automatiquement à la suite d'une coupure d’alimentation.
230	0xE6	GMR Head Amplitude		Amplitude des « à-coups » (amplitude du mouvement d’avance et de recul répétitif de la tête)
231	0xE7	Life Left (SSDs) or Temperature (HDDs)		Sur un disque SSD, indique la durée de vie approximative qu'il lui reste, que ce soit en termes de cycles d'écriture (program/erase cycles) ou au niveau du nombre de blocks réservés encore disponibles. Il s'agit d'un indice compris entre 0 et 100 : de manière normalisée, la valeur 100 correspond à un disque SSD neuf, tandis que la valeur seuil de 10 indique que le SSD doit être remplacé rapidement. Une valeur de 0 peut signifier que le disque fonctionne en mode "lecture-seule" afin de permettre la récupération des données présentes sur le disque. Avant 2010, cet attribut était occasionnellement utilisé pour rapporter la température du disque (mais on utilise plus généralement l'attribut 0xC2 pour cela).
232	0xE8	Endurance Remaining ou Available Reserved Space		Nombre de cycles d'effacement physique effectués sur le SSD en pourcentage du nombre maximal de cycles d'effacement physique que le disque SSD est prévu de supporter. Les SSD Intel indiquent l'espace réservé disponible sous forme de pourcentage de l'espace réservé initial.
240	0xF0	Head Flying Hours		Temps total où les têtes mécaniques sont au-dessus des plateaux, et pas dans une position parquée (en heure)

Aidez et soutenez Assiste – autorisez quelques publicités et cliquez dessus.

Derrière le rideau

Voir les articles :

]
Autour de ce sujet dans Assiste.com

Les encyclopédies
Encyclopédie des termes et concepts informatique et Internet Liste
Encyclopédie des acronymes, sigles et abréviations Liste
Encyclopédie de la terminologie officielle française Liste
Encyclopédie de la terminologie Warez, DDL et P2P Liste

S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology : (SMART). Prévision, en partie normalisée, de panne des disques durs.

S.M.A.R.T. - Self-Monitoring, Analysis, and Reporting Technology

S.M.A.R.T. : Description et notes

Historique et prédécesseurs de S.M.A.R.T.

Liste des attributs S.M.A.R.T. connus

Derrière le rideau

] Autour de ce sujet dans Assiste.com Les encyclopédiesEncyclopédie des termes et concepts informatique et Internet ListeEncyclopédie des acronymes, sigles et abréviations ListeEncyclopédie de la terminologie officielle française ListeEncyclopédie de la terminologie Warez, DDL et P2P Liste

Autour de ce sujet dans Assiste.com