Les données privées du réseau Facebook

Posted by | juin 15, 2011 | analyse, Études de cas | 2 Comments

« I want everybody here to be careful about what you post on Facebook, because in the YouTube age whatever you do, it will be pulled up again later somewhere in your life. »
Barack Obama, président des États-Unis (AssociatedPress, 2009)

Ce texte est le dernier d’une série de 7 études de cas, pour un dossier spécial sur le Big Data.

Alors que le nerf de la guerre pour Facebook et Google est de faire des profits avec les revenus publicitaires, ils ont une vision très différente pour le faire. L’innovation chez Google est un service mis directement au profit de ses utilisateurs, alors que chez Facebook, c’est un divertissement, une machine à collecter des données à propos du mode de vie de ses utilisateurs. À ce propos, il est nécessaire de rappeler la différence entre naviguer sur le Web en général et naviguer sur Facebook.

Lorsqu’un internaute navigue sur le Web, il peut arriver qu’un site sur lequel il passe du temps collecte des informations sur ses interactions. Ces données sont habituellement utilisées afin d’optimiser le site Web ou bien pour consolider la relation avec l’internaute et ainsi mieux cibler ses préférences. Des techniques plus ou moins intrusives sont utilisées pour amasser ces données. Au bas de l’échelle, les méthodes moins intrusives collectent les données de façon anonyme (comme avec les cookies, par exemple). Au haut de l’échelle, les méthodes intrusives récoltent des informations personnellement identifiables (nom, courriel, code postal, sexe, etc.). C’est ainsi que les entreprises peuvent créer des profils assez complets des internautes qui consultent leurs actifs numériques.

Plus une méthode pour collecter des données est intrusive, et plus elle permet de maximiser l’effet du marketing comportemental et d’optimiser les objectifs d’affaires d’une entreprise. Mais plus elle est potentiellement sujette à de multiples questionnements éthiques et juridiques sur les limites de ce qui est acceptable en matière de collecte et d’utilisation de données comportementales. D’autant plus que cette pratique se fait souvent à l’insu des internautes et qu’il semble y avoir un vide juridique à cet égard :

“we are at the most liberal and lenient point of consumer privacy in the history of time. It’s primarily because digital data is spewed by consumers with each click, like, Tweet, share, and update with reckless abandon. Consumers are barely aware of the digital footprints they’re creating and we don’t know how to handle it. There are no rules here” (Lovett, 2010).

Habituellement, lorsqu’un internaute quitte un site, le lien entre lui et les applications qui collectent ses données d’interaction est brisé. Il arrive cependant que certaines entreprises maximisent l’effet du marketing comportemental en s’associant avec d’autres sites pour partager les données qu’ils recueillent.

“Online behavioral advertising — which is also sometimes called « interest-based advertising » — uses information gathered through your browser about your visits over time and across different websites in order to help predict your preferences and show you ads that are more likely to be of interest to you. For example, a sporting goods manufacturer might work with an advertising network that collects and uses online behavioral advertising information to deliver ads to the browsers of users that have recently visited sports-related sites, or an airline might direct ads to users that recently visited travel sites” (aboutads.info, 2010).

C’est donc dire qu’une trace de votre passage est disponible sur le Web et que les données que laisse cette trace sont plus ou moins importantes, en fonction de la taille du réseau sur laquelle elle se profile. Plus une trace est importante, et plus votre présence est continue lorsque vous passez d’un site à un autre ; moins elle est importante et plus votre présence est en discontinuité sur Internet. L’importance de votre trace virtuelle permet aux entreprises de définir de mieux en mieux vos habitudes de vie, vos comportements et vos réactions, ce qui est fort utile pour savoir comment, où et quand vous cibler, pour ainsi susciter votre intérêt.

C’est à propos de la persistance de cette trace que le génie de Facebook devient fort évident. En mettant en place un réseau qui est basé sur la relation sociale entre les individus, et en réussissant à rassembler des millions d’individus dans ce système fermé – soit l’application de Facebook – , Marc Zuckerberg a réussi à créer une machine redoutable pour profiler les individus. C’est d’autant plus vrai qu’en 2011, Facebook compte maintenant plus de 500 millions d’utilisateurs dont la moitié s’authentifient chaque jour sur le réseau dans plus de soixante-dix langues et interagissent avec plus de 900 millions d’ “objets” (pages, groupes, évènements, et applications de toutes sortes). En fait,“more than 30 billion pieces of content (web links, news stories, blog posts, notes, photo albums, etc.) shared each month” (Facebook, 2011).

Rappelons quelques aspects fondamentaux de Facebook:

● Le réseau comporte des centaines de millions d’utilisateurs dont les faits et gestes sont suivis à la trace.

● Il est non seulement possible de décoder les intérêts et les habitudes de vie des utilisateurs, mais aussi leur influence à l’intérieur du réseau. Ces données peuvent être croisées pour construire de complexes algorithmes comportementaux.

● Le réseau peut virtuellement s’agrandir à l’infini, car il est basé sur un amalgame d’applications sur lesquelles peuvent se greffer des milliers d’autres applications (un virus informatique?).

● Le réseau est lentement en train d’envahir le reste de l’Internet en se propageant à l’extérieur de son système clos via des widgets de toutes sortes, qui peuvent être insérés sur un site Web, sur un téléphone intelligent, sur une Playstation, etc. (facebook connect, bouton like, systèmes de commentaires, partager avec un ami, etc.). Comme le dit si bien Avinash Kaushik : “Sites that use Facebook’s Like buttons send your visit data back to Facebook (currently from more than a million websites)” (Kaushik).

Le plus ironique est qu’au fondement même de Facebook se trouve l’attrait d’un réseau privé. Contrairement au reste du Web qui est ouvert, que tout le monde peut voir, Facebook est réservé à un groupe d’amis, un réseau communautaire restreint où il est possible de faire et de dire ce que l’on veut. Cette illusion de liberté est d’ailleurs une des raisons pour lesquelles Facebook est si populaire chez les jeunes et les moins jeunes. Or voilà que toutes les données personnelles qui sont partagées dans son réseau sont pourtant enregistrées par Facebook et utilisées pour permettre aux annonceurs de mieux cibler leurs clients.

Facebook pousse même l’audace encore plus loin jusqu’à prendre possession de tous les droits sur les contenus qui sont publiés sur sa plateforme:

“pour le contenu protégé par les droits de propriété intellectuelle, comme les photos ou vidéos (« propriété intellectuelle »), vous nous donnez spécifiquement la permission suivante, conformément à vos paramètres de confidentialité et paramètres d’applications : vous nous accordez une licence non-exclusive, transférable, sous- licenciable, sans redevance et mondiale pour l’utilisation des contenus de propriété intellectuelle que vous publiez sur Facebook ou en relation à Facebook (« licence de propriété intellectuelle »). Cette licence de propriété intellectuelle se termine lorsque vous supprimez vos contenus de propriété intellectuelle ou votre compte, sauf si votre compte est partagé avec d’autres personnes qui ne l’ont pas supprimé” (Facebook, 2010).

Et comme si ce n’était pas assez, voilà que Facebook exige de ses utilisateurs qu’ils lui donnent aussi aux accès aux informations qui ne proviennent pas de son système. Déjà, en 2007, Nelson note que Facebook mentionne dans sa politique de vie privée (qui est toujours en train de se transformer):

“we may use information about you that we collect from other sources, including but not limited to newspapers and Internet sources such as blogs, instant messaging services and other users of Facebook, to supplement your profile” (Nelson, 2007).

Pour le résumer:

“privacy on Facebook is undermined by three principal factors:users disclose too much, Facebook does not take adequate steps to protect user privacy, and third parties are actively seeking out end-user information using Facebook” (Soltren, 2005).

Mais qu’importe, le potentiel du retour sur investissement n’en est qu’à ses balbutiements. Pour l’instant, le modèle d’affaires de Facebook est assez simple : ses revenus proviennent de la publicité, la location de son espace à des développeurs d’application de parti tiers (Farmville, Zynga, etc.) desquels il peut collecter encore plus de revenus publicitaires, et la vente directe d’objets virtuels (Jorganson, 2008). Mais Facebook pourrait capitaliser big time lorsqu’il décidera de vendre les données qu’il collecte aux marketeurs du monde entier:

“to marketers, the Facebook data is potentially more valuable than the data collected by other massively popular sites, like Google. That’s because Facebook collects a rich set of personally identifiable information (PII) from its user profiles. The data contains not only the user’s demographic data, but also data about their online and offline likes and dislikes–and those of their friends. The personal and social detail of Facebook’s data could give marketers unprecedented power to find new customers” (Sullivan, 2010).

Pour l’instant, ce type de pratique serait inacceptable selon les politiques de confidentialité et de vie privée de Facebook, mais fort est à parier que lorsque le temps sera venu, ce ne sera qu’une formalité de le faire.

La photo provient de Sécurité, Internet et réseau.