La plupart des Américains ne réalisent pas ce que les entreprises peuvent prédire à partir de leurs données

Soixante-sept pour cent des utilisateurs de smartphones font confiance à Google Maps pour les aider à se déplacer rapidement et efficacement.

L'une des principales caractéristiques de Google Maps est sa capacité à prédire combien de temps prendront les différentes trajets. C'est possible parce que le téléphone mobile de chaque personne utilisant Google Maps envoie des données sur son emplacement et sur sa vitesse aux serveurs de Google, où ses données sont analysées pour générer de nouvelles données sur les conditions de trafic.

De telles informations sont utiles pour la navigation. Mais les mêmes données que celles qui sont utilisées pour prédire les tendances du trafic peuvent également être utilisées pour prédire d'autres types d'informations - des informations que les gens seraient mal à l'aise de révéler.

Par exemple, les données sur les lieux et les déplacements antérieurs d'un téléphone mobile peuvent être utilisées pour prédire là où vit une personne, qui est son employeur, où elle assiste à des services religieux et la tranche d'âge de ses enfants en fonction du lieu où elle les dépose à l'école.

Ces prédictions indiquent qui vous êtes en tant que personne et permettent de deviner ce que vous êtes susceptible de faire dans le futur. La recherche montre que les gens ignorent en grande partie que ces prédictions sont possibles et, s'ils en prennent conscience, cela les rebute. À mon avis, en tant que personne qui étudie comment les algorithmes prédictifs affectent la vie privée des gens, c'est un problème majeur pour la vie privée numérique aux États-Unis.


Comment tout cela est-il possible ?

Chaque appareil que vous utilisez, chaque entreprise avec laquelle vous faites affaire, chaque compte en ligne que vous créez ou que chaque programme de fidélisation auquel vous adhérez, et même le gouvernement lui-même recueille des données vous concernant.

Les types de données qu'ils recueillent comprennent votre nom, votre adresse, votre âge, votre numéro de sécurité sociale ou celui de votre permis de conduire, l'historique de vos transactions d'achat, vos activités de navigation sur le Web, vos renseignements sur votre inscription sur les listes électorales, si vous avez des enfants vivant avec vous ou parlant une langue étrangère, les photos que vous avez affichées sur les médias sociaux, le prix de votre maison, si vous avez récemment vécu un événement comme votre mariage, votre score de crédit (ndrl : une note attribuée à chaque américain disposant d'un numéro de sécurité sociale), quel type de véhicule vous utilisez, combien d'argent vous consacrez aux courses, combien vous avez de crédit par carte et les emplacements de votre téléphone mobile.

Ce que les courtiers en données savent

Les courtiers en données peuvent recueillir des données et faire des prédictions sur un large éventail de vos caractéristiques personnelles, telles que celles énumérées ci-dessous :

* Données d'identification (Nom, noms précédemment utilisés, adresse, historique des adresses, longitude et latitude, numéros de téléphone, adresse électronique).

* Données d'identification sensibles (Numéro de sécurité sociale, numéro de permis de conduire, date de naissance, date de naissance des membres d'une famille).

* Données démographiques (l'âge, la taille, le poids, le sexe, l'ethnie, le pays d'origine, la religion (par nom de famille au niveau du ménage), la langue, la situation matrimonial, présence d'un parent âgé, présence d'enfants dans le ménage, niveau de scolarité, la profession, les liens familiaux, les caractéristiques démographiques des membres de la famille au foyer, le nombre de noms de famille au foyer, ancien combattant dans le ménage, grand-parent dans la maison, hispanophone, quelle langue parle le ménage, ménage avec un chef de ménage d'origine hispanique ou latino, employé (blanc ou col bleu), travail à domicile, durée de résidence, taille du ménage, district du Congrès, parent isolé avec enfants, affiliation ethnique et religieuse).

* Données judiciaires et données des dossiers publics (Faillites, infractions et condamnations criminelles, jugements, privilèges, actes de mariage, licences et enregistrements d'état, enregistrement des votes et identification des partis).

* Données d'intérêt général (Préférences vestimentaires, participation à des événements sportifs, dons de bienfaisance, jeux de hasard (casinos ou loteries d'État), aînés ayant des économies, événements de la vie (retraite, jeunes mariés, futurs parents), abonnements aux magazines et aux catalogues, canaux médiatiques utilisés, participation à des activités extérieures (golf, motocyclisme, ski, camping), participation à des tirages au sort ou à des concours, animaux domestiques, propriétaires de chiens, tendances politiques, code d'assimilation, célébrités préférées, genres de films préférés, genres musicaux préférés, préférences de lecture et d'écoute, donateurs (causes religieuses, politiques, de santé), abonnés aux bulletins financiers, titulaires de cartes de débit, baby boomer aisé, mères au travail, femmes, professionnelles afro-américaines, motard/hell's angel, styles de vie bibliques, styles de vie New Age/écologique).

* Données sur les médias sociaux (Achat d'électronique, réseaux d'amis, type de connexion Internet, fournisseur d'accès Internet, niveau d'utilisation, utilisateur Facebook, utilisateur Twitter, utilisateur Twitter avec plus de 250 amis, est membre de plus de 5 réseaux sociaux, influence en ligne, système d'exploitation, achats de logiciels, type de média affiché, photos téléchargées, utilisation des services d'appel interurbain, présence du propriétaire d'ordinateur, utilisation des appareils mobiles, médias sociaux et comptes intéressants (par ex. sur LinkedIn, Amazon, Flickr, NBA.com).

* Données sur le domicile et le quartier (Données du secteur de recensement, adresse codée comme logement public ou gouvernemental, type de logement, chauffage et climatisation, valeur nette du logement, montant du prêt hypothécaire et taux d'intérêt, taille du logement, type de prêteur, durée de résidence, prix d'inscription, valeur marchande, date du déménagement, données criminelles, démographiques et commerciales du quartier, nombre de bains publics, nombre de pièces, nombre d'unités, nombre de foyers, présence de garage, présence de piscine, type de propriétaire, prix du loyer, type de toit et année de construction).

Il importe peu que ces données aient été recueillies séparément par différentes sources et qu'elles ne contiennent pas votre nom. Il est encore facile de les comparer à d'autres informations vous concernant contenues dans cet ensemble de données.

Par exemple, il y a des identificateurs dans les bases de données d'archives publiques, comme votre nom et votre adresse personnelle, qui peuvent être comparés aux données de localisation GPS d'une application sur votre téléphone mobile. Cela permet à une tierce partie de relier votre l'adresse de votre domicile à l'endroit où vous passez la plupart de vos heures du soir et de la nuit - probablement là où vous vivez. Cela signifie que le développeur de l'application et ses partenaires ont accès à votre nom, même si vous ne le leur avez pas donné directement.

Aux États-Unis, les entreprises et les plateformes avec lesquelles vous interagissez sont propriétaires des données qu'elles recueillent à votre sujet. Cela signifie qu'ils peuvent légalement vendre cette information à des courtiers en données.

Les courtiers en données sont des entreprises qui achètent et vendent des ensembles de données provenant d'un large éventail de sources, y compris les données de localisation de nombreux opérateurs de téléphonie mobile. Les courtiers en données combinent les données pour créer des profils détaillés de personnes individuelles, qu'ils vendent à d'autres entreprises.

Des ensembles de données combinés peuvent être utilisés pour prédire ce que vous voudrez acheter afin de vous proposer des publicités ciblées. Par exemple, une entreprise qui a acheté des données vous concernant peut faire des choses comme relier vos comptes de médias sociaux et votre historique de navigation sur le Web à l'itinéraire que vous empruntez lorsque vous faites des courses et à votre historique d'achats à votre épicerie locale.

Les employeurs utilisent de grands ensembles de données et des algorithmes prédictifs pour prendre des décisions sur les personnes à rencontrer pour un entretien d'embauche et pour prévoir qui pourrait démissionner. Les services de police dressent des listes de personnes qui peuvent être plus susceptibles de commettre des crimes violents. FICO, la même entreprise qui calcule le score de crédit, calcule également un "score d'adhésion aux médicaments" qui prédit qui cessera de prendre ses médicaments sur ordonnance.

Jusqu'à quel point les gens sont-ils au courant de cela ?

Même si les gens savent que leur téléphone mobile est équipé d'un GPS et que leur nom et leur adresse se trouvent quelque part dans une base de données d'archives publiques, il est beaucoup moins probable qu'ils réalisent comment leurs données peuvent être combinées pour faire de nouvelles prédictions. Cela s'explique par le fait que les politiques de protection de la vie privée n'incluent généralement qu'un langage vague sur la façon dont les données recueillies seront utilisées.

Dans un sondage réalisé en janvier, le projet Pew Internet and American Life a interrogé les utilisateurs adultes de Facebook aux États-Unis sur les prédictions que Facebook fait au sujet de leurs caractéristiques personnelles, à partir des données recueillies par la plateforme et sur celle de ses partenaires. Par exemple, Facebook attribue une catégorie " affinité multiculturelle " à certains utilisateurs, devinant à quel point ils sont semblables à des personnes de race ou d'origine ethnique différente. Ces informations sont utilisées pour les cibler de publicités.

L'enquête a révélé que 74 % des gens ne connaissaient pas ces prévisions. Environ la moitié d'entre eux ont dit qu'ils n'étaient pas à l'aise avec le fait que Facebook prévoie des informations comme celle-ci.

Dans mes recherches, j'ai découvert que les gens ne sont au courant que des prédictions qui leur sont montrées dans l'interface utilisateur d'une application, et cela a du sens étant donné la raison pour laquelle ils ont décidé d'utiliser l'application. Par exemple, une étude réalisée en 2017 auprès d'utilisateurs de trackers de fitness a montré que les gens savent que leur tracker collecte leur position GPS lorsqu'ils font de l'exercice. Mais cela ne se traduit pas par une prise de conscience du fait que l'entreprise peut prédire où ils vivent.

Dans une autre étude, j'ai découvert que les utilisateurs de Google Search savent que Google collecte des données sur leur historique de recherche et que les utilisateurs de Facebook savent que Facebook sait qui sont leurs amis. Mais les gens ne savent pas que leurs "amis" sur Facebook peuvent être utilisés pour prédire avec précision leur affiliation à un parti politique ou leur orientation sexuelle.

Que peut-on faire à ce sujet ?

L'Internet d'aujourd'hui repose en grande partie sur les personnes qui gèrent leur propre vie privée numérique.

Les entreprises demandent d'emblée aux gens de consentir à des systèmes qui recueillent des données et font des prédictions à leur sujet. Cette approche fonctionnerait bien pour la gestion de la vie privée, si les gens refusaient d'utiliser des services qui ont des politiques de confidentialité qu'ils n'aiment pas, et si les entreprises ne violaient pas leurs propres politiques de confidentialité.

Mais les recherches montrent que personne ne lit ou ne comprend ces politiques de confidentialité. Et même lorsque les entreprises font face à des conséquences pour avoir manqué à leurs promesses en matière de protection de la vie privée, cela ne les empêche pas de récidiver.

Exiger des utilisateurs qu'ils donnent leur consentement sans comprendre comment leurs données seront utilisées permet également aux entreprises de rejeter la responsabilité sur l'utilisateur. Si un utilisateur commence à avoir l'impression que ses données sont utilisées d'une manière avec laquelle il n'est pas vraiment à l'aise, il n'a pas le droit de se plaindre, parce qu'il a consenti, n'est-ce pas ?

À mon avis, il n'existe aucun moyen réaliste pour les utilisateurs d'être au courant des types de prévisions qui sont possibles. Les gens s'attendent naturellement à ce que les entreprises utilisent leurs données que pour des raisons liées aux raisons qui les ont poussées à interagir avec l'entreprise ou l'application en premier lieu. Mais les entreprises ne sont généralement pas tenues par la loi de limiter la façon dont elles utilisent les données personnelles aux seules choses auxquelles les utilisateurs peuvent s'attendre.

Une exception, en l'Allemagne, où l'office de lutte fédéral contre les cartels (Bundeskartellamt) a statué le 7 février que Facebook doit spécifiquement demander à ses utilisateurs la permission de combiner les données recueillies à leur sujet sur Facebook avec des données recueillies auprès de tiers. La décision stipule également que si les gens n'y consentent pas, ils devraient quand même pouvoir utiliser Facebook.

Je crois que les États-Unis ont besoin d'une réglementation plus stricte en matière de protection de la vie privée, afin que les entreprises soient plus transparentes et responsables envers les utilisateurs non seulement en ce qui concerne les données qu'elles recueillent, mais aussi en ce qui concerne les types de prévisions qu'elles produisent en combinant des données provenant de sources multiples.

Par Emilee Rader (Professeur agrégé de médias et d'information, Michigan State University)

sauce :
https://theconversation.com/most-americans-dont-realize-what-companies-can-predict-from-their-data-110760

Enregistrer un commentaire

Les commentaires sont validés manuellement avant publication. Il est normal que ceux-ci n'apparaissent pas immédiatement.

Plus récente Plus ancienne