Les traits de caractères et habitudes des individus peuvent être prédis grâce aux traces de leur activité en ligne. C’est la conclusion de l’étude menée par Michal Kosinsk du centre de psychométrie de l’université de Cambridge en partenariat avec Microsoft Research. Celle-ci a été publiée dans le journal “Proceedings of the National Academy of Sciences of the United States of America” (PNAS) le 11 mars 2013.
Retrouvez l’étude originale ici (PNAS) : http://bit.ly/XILzR1 et son auteur ici, : Michal Kosinsk http://bit.ly/X732Pp
Pour ce faire, les « Like » de plus de 58 000 volontaires utilisateurs de Facebook ont été étudiés afin de prédire traits et attributs de caractères, la pertinence de ces résultats a été mesurée par comparaison avec les résultats de questionnaires et tests de personnalité. En moyennes ces tests ont été réalisés avec une moyenne de 68 « Like » par individu, et plus ceux-ci sont nombreux plus les prévisions réalisées sont précises. Ainsi l’équipe a pu mesurer avec fiabilité des données telles que :
- Statut relationnel d’un individu avec 67% de fiabilité.
- Son appartenance éthique avec 95% de fiabilité.
- Son sexe avec 93% de fiabilité.
- Sa religion avec 82% de fiabilité.
- Son orientation politique avec 93% de fiabilité.
- Son orientation sexuelle avec 88% de fiabilité pour les hommes et 75% pour les femmes.
- Sa consommation de tabac, d’alcool ou de drogues illégales avec respectivement 73%, 70% et 65% de fiabilité.
- Et enfin le fait que ses parents se soit séparés avant qu’il ait atteint ses 21 ans avec 60% de fiabilité.
De même, et toujours par analyse prédictive de « Like », l’équipe est parvenue à prédire de façon significative des attributs tels que le degré de satisfaction dans la vie, l’intelligence, la stabilité émotionnelle, l’extraversion, l’ouverture d’esprit, ou la densité du réseau d’amis des individus. La signifiance de ces prédictions a été mesurée face à celles de tests de personnalité (« International Item Pool » ou IPP ) et d’intelligence (« Raven’s Standard Progressive Matrices » ou SPM ).
Certains « Like » se sont révélés particulièrement utiles pour prédire des traits de caractères. Ainsi es meilleurs « Like » pour prédire un haut degré d’intelligencel sont « Thunderstorms » (orages), « The Colbert Report » (une émission satirique diffusée sur Comedy Chanel) et « Curly Fries » (un type de frites spiralées rares en France). En contrepartie d’autres prédisent une degré d’intelligence inférieur à la moyenne : « Sephora », « I Love Being a Mom » (J’aime être une mère), « Harley Davidson », et « Lady Antebellum ».
Concernant l’orientation sexuelle, les Like « No H8 Campaign » (une organisation de protestation silencieuse contre un projet de loi interdisant le mariage sexuel en Californie : la proposition 8), « Mac Cosmetics » (une chaine de boutiques dédiées à la cosmétique » et « Wicked the Musical » sont les « Like » représentant les plus importants indices d’homosexualité. A l’inverse « Liker » « Wu-Tang Clan », « Shaq » (pour Shaquille O’Neal) et « Being Confused After Waking Up From Naps » (Se réveiller dans le vague après une sieste) sont les meilleurs révélateurs de l’hétérosexualité des utilisateurs associés. Il est intéressant de noter que peu d’internautes révélaient volontairement leurs attributs. En effet moins de 5% des homosexuels étaient connectés avec des groupes à forte connotation homosexuelle comme « Being Gay » (Etre Gay), « Gay Marriage » (Mariage Gay), « I love Being Gay » (J’aime Etre Gay), et « We Didn’t Choose To Be Gay We Were Chosen » (Nous n’avons pas choisis d’être gay, nous avons été choisis).
Si la prédiction de ces attributs et traits de caractères à des fins commerciales peut paraitre intrusive voire scandaleuse, l’étude précise que l’âge, le sexe, le niveau de responsabilités professionnelles, le niveau de formation, et même la personnalité peuvent être prédits par les habitudes de surfs des internautes. De même il a été également montré que la place occupée dans un réseau d’amis sur Facebook peut prédire l’orientation sexuelle de l’utilisateur. Ces informations sont accessibles par des développeurs (de vos navigateurs, de vos applications, de vos logiciels…), par les gouvernements, et par les moteurs de recherches. D’autres types d’informations peuvent également prédire efficacement votre comportement en tant que consommateur ( historique de carte de crédit, nature des titres musicaux écoutés en ligne etc… ). La principale différence des « Like » Facebook par rapport à ces informations est que ceux-ci sont disponibles publiquement par défaut. Associés à des modèles prédictifs efficaces ils deviennent donc des données de choix dans l’utilisation de « Big Data ».
Cependant, les dérives ne sont pas loin, et l’article évoqué dans ce billet revient sur une dérive potentielle, imaginez la prédiction de grossesse chez des consommatrices dans le but de leurs transmettre des offres commerciales adaptées (bons de réduction pour vitamines prénatales, prêt à porter pour nourrissons, etc…). Qu’adviendrait-t-il si ces offres indiquait à l’entourage d’une femme sa grossesse alors que celle-ci ne l’a pas encore annoncé ?
Vous l’aurez compris les nouvelles technologies peuvent nous en faire dire plus que nous le souhaiterions. Comment l’interpréter ? Adopter la méfiance quant aux informations que l’on choisi d’afficher sur son profil ? Quelles perspectives pour les professionnels du marketing et de la publicité ?