Bilan

L’EPFL ausculte les candidats en ligne

Que nous apprend le web sur les candidats à la présidentielle française? Depuis plusieurs mois, le Social Media Lab de l’EPFL scrute Twitter et la toile pour discerner les tendances.
  • Les échos positifs en ligne des cinq principaux candidats (en date du 18 avril).

    Crédits: Image: Bilan/EPFL
  • Crédits: Geoffroy Van der Hasselt/Joël Saget/AFP

«On dirait des œuvres d’art. On aimerait en accrocher certaines comme des tableaux abstraits»: quand Jean-Luc Jaquier évoque les infographies issues du Social Media Lab dont il gère les opérations, il n’en oublie pas la vision graphique. Mais il revient très vite à l’explication prosaïque de ces milliers de points et lignes très fines qui les relient: les 250 000 points représentent des personnes, leurs messages sur Twitter et les articles référencés. Les traits de différentes couleurs chacun une action (tweet, retweet, mention). Cela donne une photographie à un instant T des opinions exprimées sur la toile, retranscrites de manière simplifiée dans le graphique ci-dessus.

L'activité en ligne au sujet des candidats aux présidentielles

 

Après deux premières expériences dans le domaine politique avec le Brexit et l’élection présidentielle américaine l’an dernier, la campagne présidentielle française est le nouveau champ d’expérimentation pour l’analyse des tendances en ligne, développé en 2015 pour mesurer l’écho donné à la COP21 sur le climat. En partenariat avec Swissquote, l’EPFL a activé depuis un mois et demi son Social Media Opinion Index en se focalisant sur l’écho donné sur Twitter et le web aux cinq principaux candidats à l’Elysée. A noter que les contenus Facebook et Snapchat n’ont pu être pris en compte sur cette analyse en raison de la complexité à les repérer. Chaque jour, les tweets, retweets, mentions, partages d’articles relatifs à François Fillon, Benoît Hamon, Marine Le Pen, Emmanuel Macron et Jean-Luc Mélenchon sont repérés et analysés.

Lire aussi: Présidentielle 2017: un jour en France

D’emblée, Jean-Luc Jaquier insiste sur un point crucial: «Cet outil n’a absolument pas vocation à remplacer ou concurrencer les sondages, qui sont des enquêtes d’opinion basées sur des échantillons représentatifs de la population. Notre Social Media Opinion Index vient amener un éclairage différent sur les tendances en ligne.»

La vague de mise en question des sondages, qui se sont plus ou moins largement trompés sur le Brexit ou l’élection de Donald Trump face à Hillary Clinton, a certes incité nombre d’observateurs à chercher de nouveaux outils pour prendre le pouls de l’opinion. Mais le Social Media Lab de l’EPFL ne veut pas susciter de faux espoirs.

D’ailleurs, sur les courbes des tendances d’échos positifs, Marine Le Pen accuse un certain retard sur Emmanuel Macron et vient juste de passer devant François Fillon: «A l’instar des sondages où des électeurs de Marine Le Pen éprouvent une certaine gêne à annoncer leur vote à un enquêteur, il y a peut-être aussi une forme de retenue en ligne, chez ceux qui ne sont pas des militants convaincus, à partager des contenus positifs en faveur de la candidate du Front national», explique Jean-Luc Jaquier.

Echos positifs en ligne sur les cinq principaux candidats au 18 avril

Fondé sur le big data et le machine learning

Par contre, l’outil présente de nombreux avantages, dont un repérage très en amont des tendances. Et surtout une dimension double de «texte dans le contexte». Concrètement, quel est le principe? «L’outil s’appuie sur le big data et le machine learning: chaque tweet ou partage d’un contenu favorable ou défavorable à un candidat est scanné et analysé par des algorithmes capables de distinguer les éléments de langage, le Natural Language Processing (NLP). Mais surtout, la publication est ensuite mise dans le contexte de celui qui en est l’auteur, comment elle a été partagée, par quelles communautés», décrypte Jean-Luc Jaquier.

Ainsi, l’électeur lambda «Jean Martin» qui publie un tweet favorable à Benoît Hamon est repéré par les outils, mais ceux-ci vont analyser les interactions qu’il a avec d’autres internautes, et si ceux-ci partagent également très majoritairement des contenus favorables au candidat socialiste, la probabilité que «Jean Martin» soit en faveur de ce dernier sera renforcée. A contrario, s’il évolue dans un environnement où s’expriment des opinions très diverses, voire plutôt favorables à François Fillon, la probabilité de le voir glisser un bulletin Benoît Hamon dans l’urne le jour de l’élection sera tempérée.

Lire aussi: Le profil du "présidentiable"

Sur un cas unique d’une publication par un utilisateur, la mesure de l’opinion peut être risquée, mais elle devient plus précise quand ce même avis est répété plusieurs fois. La force de cet indice est aussi de s’appuyer sur une masse considérable de données: sur les seuls réseaux sociaux, plus de 2,3 milliards de comptes actifs sont répertoriés à l’échelle planétaire, avec des centaines de millions de publications chaque jour. Et grâce au deep machine learning développé par les chercheurs de l’EPFL, l’outil s’améliore sans cesse.

«Nous sommes capables de distinguer huit émotions différentes, de la peur à la joie en passant par la colère. Et l’outil arrive maintenant à repérer l’ironie ou le second degré dans les formulations des internautes quand ils accompagnent leur publication d’un commentaire», détaille Jean-Luc Jaquier.

Lire aussi: Mulhouse se forge un avenir sans usine

Cependant, pour arriver à des mesures pertinentes, il faut disposer d’une masse critique d’informations. «Pour les élections françaises, nous enregistrons les discussions sur les cinq principaux candidats depuis le 1er mars. Pour le premier tour, nous nous focalisons sur les échos positifs et, pour le deuxième tour, nous publierons aussi un autre indice basé sur les échos négatifs: ce sera très intéressant car le 2e tour d’une telle élection se joue souvent autant, voire plus, sur le rejet d’un candidat que sur l’adhésion à son opposant», annonce Jean-Luc Jaquier. 

Le «bruit» des candidats

En France, la controverse sur les sondages fait rage. Les équipes de François Fillon, relayées par certains médias comme Valeurs actuelles, mettent en doute les enquêtes d’opinion traditionnelles et s’appuient sur des outils d’analyse du web comme ceux proposés par la société canadienne Filteris, qui placent le candidat de droite devant Emmanuel Macron (contrairement aux sondages). Or, Filteris s’appuie sur le «bruit» généré par chaque candidat en ligne, ne distinguant pas les échos positifs des échos négatifs. Au contraire des algorithmes du Social Media Lab de l’EPFL, qui distingue les contenus positifs de ceux à teneur négative.   

Matthieu Hoffstetter
Matthieu Hoffstetter

JOURNALISTE À BILAN

Lui écrire

Titulaire d'une maîtrise en histoire et d'un Master de journalisme, Matthieu Hoffstetter débute sa carrière en 2004 au sein des Dernières Nouvelles d'Alsace. Pendant plus de huit ans, il va ensuite couvrir l'actualité suisse et transfrontalière à Bâle pour le compte de ce quotidien régional français. En 2013, il rejoint Bilan et se spécialise dans les sujets liés à l'innovation, aux startups, et passe avec plaisir du web au print et inversement. Il contribue également aux suppléments, dont Bilan Luxe. Et réalise des sujets vidéo sur des sujets très variés (tourisme, startups, technologie, luxe).

Du même auteur:

Offshore, Consortium, paradis fiscal: des clefs pour comprendre
RUAG vend sa division Mechanical Engineering

Les newsletters de Bilan

Le cercle des lecteurs

Le Cercle des Lecteurs est une plate-forme d'échanger sur tout ce qui touche votre magazine. C'est le reflet de vos opinions, et votre porte-parole le plus fidèle. Plus d'info


Image Footer

"Tout ce qui compte.
Pour vous."