Web : souriez vous êtes analysés !

L’analyse sémantique de contenus existe bel et bien, pour mieux espionner ce que nous faisons en ligne.

Christine Tréguier  • 27 février 2013
Partager :

Le web sémantique ou web 3.0, on en parle depuis longtemps comme de la prochaine révolution informatico-communicationnelle, mais beaucoup s’imaginent que c’est encore de la science-fiction. Pourtant, l’analyse sémantique de contenus existe bel et bien, et on trouve sur ce secteur innovant tous ceux qui se font des brouzoufs en espionnant ce que nous faisons en ligne.

On en parlait justement il y a deux semaines (voir « Vie privée, rien ne va plus ! »), chacune de nos actions – que ce soit sur Internet ou sur son ersatz le « web des applis » – génère des données qui sont méthodiquement collectées, conservées et traitées pour anticiper sur ce que nous aimons, cherchons, lisons, achetons, la musique que nous écoutons et les films que nous regardons, nos centres d’intérêts, nos hobbies, nos passions même les plus secrètes.

Détecter la langue, les personnes, entreprises ou lieux évoqués…

Ces données très personnelles intéressent passionnément les magnats de l’industrie du search et du contenu que sont Google-Apple-Microsoft and Co, mais aussi les opérateurs de télécom et de services en ligne, les réseaux sociaux, les cybermarchands type Amazon, eBay, Fnac, Auchan et j’en passe. Si la loi informatique et libertés leur interdit (pour le moment) de sonder nos orientations politiques, sexuelles, religieuses, ils ne se gênent pas pour aspirer des masses de données tout aussi bavardes et privées, dans une totale opacité, pour, disent-ils main sur le cœur, nous offrir de meilleurs services. Pour du prétendu « sur mesure » qui suppose que non seulement ils nous suivent à la trace et analysent par le menu quelles pages ou fragments de page web nous lisons, mais aussi qu’ils  « écoutent », grâce à ces analyseurs sémantiques, tous les messages que nous laissons quotidiennement sur les nombreux forums, réseaux sociaux, blogs, etc. que nous fréquentons.

Ils savent aujourd’hui détecter la langue, les personnes, entreprises ou lieux évoqués, les termes employés, la tonalité (positif/négatif) et le sujet (politique, sport etc.). Ce type d’analyse est déjà utilisée, quoique prudemment, par Google et son knowkedge graph , par Amazon ou encore par les pros de la e-réputation, de la sécurité informatique, des banques et de l’ Open data/Big data. Exemple, l’analyse très récente, dans le cadre du projet WeDoData (France Inter), de 50 ans de discours politiques, qui a permis, dit-on, d’évaluer l’évolution de la relation franco-allemande. 

-Le site LivesOn

-Le projet WeeDoData

-Deux articles du Guardian et de CNet News

-Un article de Geek.com

-Un docu-fiction de et sur Lean Mean Fighting Machine

L’exemple est sans conséquence néfastes, mais en poussant un peu plus loin le raisonnement, demain, il est plausible et probable qu’ils sachent extraire la part signifiante de nos écrits en ligne, presqu’aussi sûrement qu’en décachetant l’enveloppe, en espionnant le téléphone ou en obligeant votre bibliothèque à donner la liste de vos emprunts. Pas pour nous fliquer, pour la plupart, mais certains succomberont à la tentation de la surveillance et du relevé d’empreintes sémantiques – pour contrôler leurs employés, détecter et anticiper ceci ou cela. Et ces données et analyses étant disponibles, l’État et la police ne se gêneront pas pour les requérir, connaître nos pensées et intentions, et nous suspecter, voire nous condamner pour une pensée déviante ou une « intention de faire ». Comme ce fut le cas pour le groupe de Tarnac.

Des messages post-mortem

Aujourd’hui, certains sont déjà prêts à aller loin dans la quête de « l’appli sémantique qui tue ». Le site LivesOn, par exemple, qui proclame «   quand votre cœur s’arrêtera, vous continuerez à tweeter !   » Cette application Twitter, annoncée pour mars, se veut être une « intelligence artificielle », capable de poster pour vous des messages de 140 signes depuis votre compte de défunt twittos . Il s’agirait d’un algorithme analysant la syntaxe et la sémantique de vos tweets, pour pouvoir, le moment venu, vous remplacer et envoyer des kyrielles de messages post-mortem sur vos sujets et actualités favoris. À condition d’avoir, avant de passer l’arme à gauche, initié votre bot et nommé un exécuteur en charge d’activer ce compte. Trop mortel ! «   La cryogénie coûte une fortune , ça c’est gratuit, et je parie que ça marchera mieux qu’une tête congelée » , a déclaré au Guardian l’un des créatifs de l’agence de pub londonienne Lean Mean Fighting Machine (en français littéral Machine de combat moyennement maigre) qui lance LivesOn. 

Illustration - Web : souriez vous êtes analysés ! - Source [thedrum.com->http://www.thedrum.com/news/2013/02/20/liveson-unveiled-promise-when-your-heart-stops-beating-youll-keep-tweeting]

L’application a déclenché un énorme buzz médiatique et peu de professionnels de la profession semblent avoir mis en doute cette annonce qui a pourtant le goût, l’odeur et la couleur d’un joli canular. Attendons donc mars pour en avoir le cœur net. Que l’annonce soit aujourd’hui véridique ou non importe peu. Elle rappelle juste que ce type de sondes intrusives sont dans les cartons des industriels, que certaines existent et sont déjà utilisées, et que pas grand monde n’y trouve à redire. Qu’on appelle cela du profilage détaillé ou du web sémantique, ces bots fouineurs, ces millions d’agents du web marchand 3.0 vont nous scanner sans relâche. C’est aussi ça que le quatuor de la « Machine de combat moyennement maigre » essaie de nous faire comprendre avec beaucoup de talent et un humour so british.  Messieurs, chapeau bas !

Photo : AFP / ALAIN JOCARD
Publié dans
Les blogs et Les blogs invités
Temps de lecture : 5 minutes
Soutenez Politis, faites un don !

Envie de soutenir le journal autrement qu’en vous abonnant ? Faites un don et déduisez-le de vos impôts ! Même quelques euros font la différence. Chaque soutien à la presse indépendante a du sens.

Faire Un Don