Fil d'actualité Protection des données personnelles

Protection des données personnelles

Centre national de la recherche scientifique

Accueil du siteGuides, rapports et documentsBig Data : Seizing Opportunities, Preserving Values (mai 2014)

Big Data : Seizing Opportunities, Preserving Values (mai 2014)

Page publiée le 21 octobre 2015

BIG DATA : SEIZING OPPORTUNITIES, PRESERVING VALUES

Source whitehouse.gov et actuairesbigdata.wordpress.com et france-science.org


Rapport sur le Big Data réalisé par le bureau exécutif du président des Etats Unis d’Amérique en mai 2014

Barack Obama a commandé à son conseiller, John Podesta, de réaliser une étude sur les enjeux liés à la fois au Big Data et à la protection des données. C’est ainsi que la Maison Blanche a publié le 1er mai deux rapports matérialisant les 90 jours de réflexion d’experts autour de la régulation des applications du Big Data aux Etats Unis. Le premier, intitulé "Big Data : Seizing Opportunities, Preserving Values" [2] analyse les répercussions du Big Data sur la vie privée tandis que le second, titré "Big Data and privacy : a technological perspective" porte un regard plus technique sur les technologies liées au Big Data.

Le rapport de la Maison Blanche propose des réponses sur quelques points clefs. Il est par exemple mis en avant que les méthodes d’anonymisation pour la protection des données des individus ne fonctionnent pas toujours (page 8 du rapport). L’intégration de plusieurs sources peut permettre d’aisément déduire les informations personnelles issues de données supposées non identifiables (on parle d’effet mosaïque), et c’est là la puissance du Big Data !

Sont également abordés les risques associés à l’utilisation du Big Data pour la médecine prédictive. En effet, et si son utilisation offre des résultats très prometteurs pour la prédiction de contraction de maladie ou de la réponse d’un organisme face à un traitement, les informations recueillies par la médecine préventive sont particulièrement sensibles. A terme, l’objectif sera de recueillir des données sur des groupes ou catégories de personnes et de les utiliser pour identifier les maladies avant ou très tôt après l’apparition des symptômes cliniques. L’un des problèmes est alors que l’information collectée s’étend au-delà des données propres à un individu, et s’étend également à d’autres personnes, telles que celles ayant potentiellement des gènes similaires (enfants ou famille proche). Sur ce thème, le rapport fait état d’un cadre réglementaire peut-être mal adapté pour répondre aux développements futurs tout en favorisant les innovations (page 23 du rapport).

Le rapport met également en garde à propos de la "surrèglementation" de la collecte des données. Le Big Data permet aux scientifiques d’amasser des quantités massives de données, y compris de données non structurées. Par exemple en génétique, les chercheurs peuvent bénéficier d’un accès à de plus grands ensembles de données d’informations génétiques sensibles, mais les lois de la vie privée peuvent limiter leur accès à ces données. Des chercheurs en génétique donnent l’exemple de la détection d’une variante génétique liée à la schizophrénie : impossible avec 3500 jeux de données génétiques, mais rendue possible avec une base de 35.000 cas (page 7 du rapport).

Conclusions du "Big Data : Seizing Opportunities, Preserving Values"

  • 1. Préserver les valeurs de la « privacy » : adaptation de la législation américaine, le « Consumer Privacy Bill of Rights » devenant insuffisant ; rendre plus transparente l’activité des « data brokers » ; le gain social en matière de prédictibilité médicale ne pourra s’effectuer qu’au prix d »améliorations substantielles » de la protection des données de santé.
  • 2. Amélioration de l’éducation « à l’ère du numérique », notamment dans les populations les moins favorisées, tout en protégeant de manière renforcée les données concernant les mineurs.
  • 3. Big Data et discrimination : si les process de décision sont de plus en plus automatisés, le risque de discrimination (illégale) augmente en prenant en considération des données sensibles et notamment des données de santé ; risque de pratiques de prix discriminatoires (illégales) lorsque la tarification prend en compte la situation de chaque consommateur.
  • 4. Le Big Data peut améliorer la sécurité nationale en améliorant l’application de la loi ; L’Electronic Communications Privacy Act doit être révisé ; La prédictibilité doit, dans le domaine judiciaire, être appliquée avec précaution sans remettre en cause la présomption d’innocence ; Les agences fédérales qui justifient d’une expertise dans le domaine des traitements de données assisteront les instances judiciaires fédérales et locales pour déployer les techniques de big data.
  • 5. Les données comme ressource publique. Principe : les données gouvernementales sont une ressource nationale, qui doit être largement disponible dans le public ; elles doivent être stockées de manière sécurisée et autant que possible « ouvertes » et accessibles.

Télécharger le rapport

PDF - 1 Mo

Sources
http://www.whitehouse.gov/sites/def...
http://www.france-science.org/La-Ma...
http://www.france-science.org/La-Ma...