Glossaire informatique de Libelle 9e partie : Que signifie le terme "Mean Time Between Failures" ?

AuteurDaniel Krüger

Catégories

Glossaire Libelle Libelle BusinessShadow^®

La fiabilité d’une machine ou d’un logiciel informatique est une caractéristique qui a toujours été au cœur du développement.). En règle générale, pour mesurer cette fiabilité, on étudie la durée de fonctionnement d’un composant entre deux pannes. Le terme technique employé est MTBF : Mean Time Between Failure, soit Temps Moyen Entre les Pannes.

Définition du terme Mean Time Between Failures (MTBF)

Le Mean Time Between Failures est donc une unité de mesure de la fiabilité des composants logiciels et système. Il ne s'agit pas d'une valeur absolue, mais d'une valeur moyenne. En effet, le MTBF permet de déterminer une tendance centrale qui décrit la fiabilité de l'ensemble des données d'uncomposant donné. (Schéma ci-dessous). (source)

Le Mean Time Between Failures est estimé, pour la plupart des composants, à mille ou dix mille heures jusqu'à ce qu'une défaillance du matériel ou du logiciel concerné se produise. Le MTBF prédéfini sert donc souvent d'objectif ou de base au développement de nouveaux produits. Dans ce contexte, les "tests de résistance" intensifs des produits existants sont importants pour améliorer en permanence le temps moyen entre deux pannes.

Mais quels sont les exemples concrets de MTBF ?

Exemples de Mean Time Between Failures (temps moyen entre pannes)

L’exemple courant qui concerne tout matériel est sa durée de fonctionnement. Concrètement, un disque dur a par exemple un MTBF d'environ 300.000 heures. Le Mean Time Between Failures sert donc également d'indicateur pour les clients lors de l'achat d'un produit. Ainsi, de nombreux fabricants font de la publicité pour le MTBF élevé de leurs produits. Cela répond à la tendance actuelle de la durabilité et de la longévité des produits, tendance qui occupe une place de plus en plus importante dans la société de consommation actuelle. (source)

Dans le domaine des logiciels, le Mean Time Between Failures est axé sur la probabilité d'une application logicielle sans erreur. Le principe relève d’une durée spécifiée mais également des conditions du milieu. Comme les applications logicielles ne sont pas de nature matérielle, elles ne sont pas soumises à des mécanismes d'usure, comme c'est souvent le cas pour les composants matériels. Le taux d'erreur est donc indépendant de facteurs tels que l'âge ou la fréquence d'utilisation.

Les trois types principaux types d’erreurs dans le domaine des logiciels sont les suivants : ‍

Exigence erronée : toutes les erreurs au sein d’une exigence logicielle (cahier des charges) qui spécifie les conditions environnementales dans lesquelles le logiciel est utilisé.
Erreur de conception : erreur de conception par rapport à l'exigence spécifiée.
Erreur de programmation : erreur de programmation par rapport à la conception du logiciel (source).

‍
Néanmoins, le logiciel n'est pas indépendant du matériel car il est généralement installé sur des composants matériels, ce qui crée une certaine dépendance. Ainsi, les sources d'erreurs matérielles peuvent avoir un impact négatif sur le taux d'erreurs d'un logiciel.

L'exemple suivant, appliqué à une installation technique d'une entreprise, pourrait illustrer la manière dont le Mean Time Between Failures peut être calculé :
Une installation peut par exemple avoir fonctionné 1.000 heures en un an. Au cours de cette année, cette installation est tombée huit fois en panne. Le MTBF de cet équipement est donc de 125 heures.

Pour obtenir une mesure précise du MTBF, vous devez collecter des données sur les performances réelles de l'installation. Chaque installation fonctionne dans des conditions différentes et est influencée par des facteurs humains, tels que la conception, le montage, l'entretien, les erreurs logicielles et autres.

Possibilités d'optimisation dans le domaine du "Mean Time Between Failures"

De telles pannes sont donc également un problème économique auquel les entreprises doivent faire face. C'est pourquoi le Mean Time Between Failures est souvent considéré comme la base d'un plan de service ou de maintenance du produit concerné. On pourrait également dire que le MTBF sert de délai général avant la défaillance d'un composant. Ainsi, la mesure du MTBF est un moyen d'obtenir plus d'informations sur une éventuelle panne et d'en réduire les conséquences. Le calcul du temps moyen entre deux pannes est un moyen d'éviter les temps d'arrêt non planifiés dans votre entreprise. Il existe des dizaines de raisons pour lesquelles une installation peut tomber en panne. Réaliser un diagnostic est la première étape pour prendre connaissance du problème et le résoudre.

Prévenir l'urgence avec Libelle BusinessShadow®

Avec notre solution Libelle BusinessShadow® qui permet la reprise après sinistre et la haute disponibilité des systèmes, vous pouvez répliquer des bases de données, des paysages SAP® et d'autres applications en différé. Votre entreprise est ainsi protégée non seulement contre les conséquences des erreurs matérielles et applicatives, mais aussi contre les conséquences des dommages naturels, du sabotage ou des pertes de données dues à des erreurs humaines.

Vous souhaitez en savoir plus sur les termes utilisés dans l'informatique ? Par exemple, que signifient exactement la haute disponibilité et la continuité des activités ? N'hésitez pas à consulter notre glossaire informatique Libelle ou à nous suivre sur notre page LinkedIn.