17 décembre 2021

Glossaire informatique Libelle 4 : La différence entre données productives et données synthétiques

AuteurMichael Schwenk

La protection des données est un sujet important depuis de nombreuses années et, dans le domaine des logiciels en particulier, de nombreuses entreprises s'occupent de la sécurisation et du traitement conforme au RGPD des jeux de données.

Les développeurs sont confrontés au défi que les tests de logiciels ne sont vraiment utiles et conformes au RGPD qu'avec des données logiquement cohérentes et conformes au RGPD. C'est pourquoi les données de test devraient, dans le meilleur des cas, être aussi similaires que possible aux données productives, sans pour autant permettre de tirer des conclusions sur les personnes concernées. Mais qu'est-ce que les données productives ? Et en quoi se distinguent-elles des données synthétiques ? Dans la quatrième partie de notre glossaire informatique Libelle, nous examinons ces questions de plus près.

Que sont exactement les données productives ?

Le règlement de base de l'UE sur la protection des données (RGPD) signifie que les entreprises doivent prendre des mesures pour assurer la meilleure protection possible des données personnelles dans toutes les applications utilisées. Cela couvre l'ensemble du cycle de vie des données productives, de leur collecte à leur archivage.

Les données productives sont les données qui sont réellement "productives", c'est-à-dire utilisées en direct. Elles sont par exemple utilisées pour l'établissement de devis et de factures. Ces données sont utilisées dans le système productif, qui constitue le cœur d'un environnement système.
Chacun de ces paysages de systèmes informatiques est constamment adapté aux besoins de l'entreprise et de ses clients. Il convient de noter que des tests approfondis doivent être effectués lors de la création de nouvelles applications ou même lors de la maintenance des systèmes.

Définition et utilité des données synthétiques

Contrairement aux données productives, les données synthétiques sont générées artificiellement et donc pas à partir d'événements "réels". Elles sont créées à l'aide d'algorithmes et utilisées comme données de test.

Les données synthétiques offrent ainsi la possibilité de tester par exemple de nouvelles applications sans prendre le risque d'identifier un seul client.

Par exemple, nos clients mettent en place des systèmes de test de charge, c'est-à-dire des systèmes qui doivent disposer d'une base de données proche de la production, afin de soumettre des applications nouvelles ou développées à un test de charge ou de stress. Et dans ces systèmes, il ne doit y avoir aucune déduction sur des clients, partenaires commerciaux ou autres existant réellement.

D'autres clients souhaitent effectuer des analyses et des calculs statistiques avec les données des collaborateurs. Les données collectées à cet effet ne doivent en aucun cas être liées à des personnes individuelles, à l'ensemble du personnel ou à des départements de l'entreprise.

Garantir la protection et l'utilisation des données

Les données synthétiques permettent aux entreprises de travailler avec des ensembles de données réalistes lors du développement. Elles peuvent ainsi, entre autres, obtenir des connaissances spécifiques à leur secteur ou améliorer la collaboration interne et externe avec les partenaires et les services. Et tout cela en conformité avec le RGPD.

Le Libelle IT Group a développé ici avec Libelle DataMasking une solution pour l'anonymisation et la pseudonymisation nécessaires. La solution a été conçue pour l'utilisation conforme au RGPD de données anonymisées et logiquement cohérentes sur les systèmes de développement, de test et d'assurance qualité sur toutes les plates-formes.

Les méthodes d'anonymisation utilisées fournissent des valeurs réalistes et logiquement correctes qui permettent de décrire des cas d'entreprise pertinents et de les tester de manière pertinente de bout en bout. En outre, les développeurs et les utilisateurs disposent d'une base de données "propre" qui leur permet de ne pas se soucier de la protection des données.

Plus de termes du glossaire informatique de Libelle

Vous souhaitez en savoir plus sur les termes informatiques ? N'hésitez pas à consulter notre blog ou à nous suivre sur LinkedIn.


Articles recommandé
28 septembre 2022 Glossaire informatique de Libelle, partie 17 : Qu'est-ce que l'automatisation des processus informatiques ?
15 septembre 2022 Pourquoi les copies de système et l'anonymisation des données vont-elles de pair ?

Tous les articles du blog