Trois étudiants ingénieurs de l’université de technologie de Compiègne ont lancé Semiotweet, un outil qui analyse le contenu sémantique des tweets publiés par les 11 candidats à la présidentielle. Alors nous avons joué avec l’outil pour tenter de répondre à une question : quels profils peut-on dresser des candidats depuis leurs tweets ?

Quels sont les termes les plus récurrents dans les tweets des 11 candidats à l’élection présidentielle ? Qui tweete quoi, à quel moment et depuis quel support ? L’outil en ligne Semiotweet, lancé ce lundi 27 mars, permet de dégager les tendances dominantes parmi les aspirants à l’Élysée.

Nous l’avons utilisé pour établir le profil de chaque candidat(e) tel qu’il ou elle est défini(e) par son utilisation du réseau social, tout en les accompagnant d’explications et de précisions des créateurs de Semiotweet, Julien Jerphanion, Valentin Montupet & Félix Boisselier. Le trio d’étudiants ingénieurs de l’université de technologie de Compiègne partageait la même idée : se pencher sur les candidats de manière plus objective.

twitter-france

« L’idée d’analyser de façon mathématique [leurs] dires m’a paru intéressante et j’étais curieux de voir ce que ça allait donner, surtout que ça permet de s’affranchir des sondages où l’on demande au final pour qui l’on va voter » explique ainsi Félix Boisselier. Le système, amené à évoluer grâce aux retours des utilisateurs, repose actuellement sur un décompte des tweets « totalement arbitraire » reconnu par Julien Jerphanion : « On [a récupéré pour commencer] les 3 000 derniers tweets de chaque candidat et à chaque mise à jour, on récupère les derniers postés. »

L’ingénieur reconnaît que la méthode gagnerait à être améliorée mais espère que cette base trouvera son utilité : « Il faudrait que l’on se base sur l’ensemble des tweets ou sur les tweets depuis la déclaration de candidatures pour chaque candidat. »

François Fillon, quand le verbe « vouloir » devance les « Français »

fillon

Le candidat des Républicains est celui qui utilise largement le plus le verbe « vouloir », avec 299 occurrences, au point que celui-ci devance même les termes « France » et « Français » dans la catégorie des lemmes (rapporter à un seul et même mot plusieurs termes proches par leur syntaxe). François Fillon est aussi accro à la formule « [il] faut » et à son « projet ». Une tendance relevée de manière globale avec amusement par Valentin Montupet : « Pour l’ensemble des candidats, il est plus facile de dire ‘vouloir’ que ‘pouvoir’, ‘devoir’ et ‘falloir’ ».

François Fillon est accro à la formule « [il] faut » et à son « projet »

On ne trouve évidemment aucune mention des affaires qui le poursuivent, ni de Penelope Fillon parmi ses termes les plus communs tandis que le mot « travail » ne compte que 68 occurrences.

Outre un pic d’activité à 7 heures du matin, François Fillon reste relativement discret sur le réseau social jusqu’à 18 heures, l’horaire à partir duquel il déclenche une véritable force de frappe avec 628 tweets postés au total puis un peu plus de 400 à 19 heures.

Comme ses adversaires, le candidat aux 470 000 abonnés tweete majoritairement depuis la plateforme originale de Twitter et de son iPhone.

Marine Le Pen, la France qui « doit »

lepen

Contrairement à la tendance dominante parmi les 11 candidats, où le verbe « vouloir » s’avère dominant, Marine Le Pen est plutôt adepte des formulations en « devoir » et « pouvoir », à connotation plus performative.

La candidate du Front national, au 1,35 million d’abonnés, tweete principalement en début de matinée et vers 14h, pour débuter l’après-midi, à contrecourant de ses adversaires plutôt focalisés sur la fin de journée, emploie majoritairement — et sans surprise — les termes « France » et « Français », qui sont aussi ceux employés les plus globalement par les candidats.

Depuis le début du décompte, Marine Le Pen est aussi celle qui tweete le plus avec 3 249 tweets au total

Depuis le début du décompte, Marine Le Pen est aussi celle qui tweete le plus avec 3 249 tweets au total, juste devant Nicolas Dupont-Aignan.

De manière plus surprenante, on trouve, à la troisième place de ses mots les pluse employés, le « MENL » pour le groupe « Mouvement pour une Europe des nations et des libertés », qui rassemble, au parlement européen, le Front national, la Ligue du nord italienne, le PVV néerlandais ou encore le FPÖ autrichien. Retour du printemps oblige, elle parle aussi beaucoup du #1ermaiFN, le rendez-vous annuel du parti.

Enfin, la fille de Jean-Marie Le Pen utilise principalement Twitter depuis sa plateforme classique (twitter.com), mais aussi par le biais d’un iPhone.

Benoît Hamon, la « gauche » qui « veut »

hamon

Le candidat du Parti socialiste, aux 356 000 abonnés, poste majoritairement vers 11 heures du matin avant d’entretenir son fil d’actualité pendant plusieurs heures et de remiser sur de nombreux tweets entre 18 et 20 heures.

Ses statistiques sémantiques sont dominées par le hashtag #hamon2017, celui-ci étant utilisé à la moindre occasion, suivi de près par le verbe « vouloir » puis par la « gauche ». Il est d’ailleurs le seul à nommer aussi régulièrement sa famille politique, qui n’apparaît pas dans les mots les plus communs de ses adversaires.

Ses statistiques sémantiques sont dominées par le hashtag #hamon2017

Le candidat adepte de la plateforme basique Twitter.com et des tweets depuis l’iPhone est aussi celui qui recourt le plus au mot « merci » et qui évoque, logiquement, le revenu universel, sa mesure phare.

Emmanuel Macron, « c’est » le « projet » avant tout

macron

Le candidat d’En Marche ! ne tweete quasiment pas depuis son mobile, préférant largement la plateforme web de Twitter (161 tweets contre 2 014 tweets), lui qui est suivi par près de 600 000 abonnés.

Macron est celui qui emploie le plus le terme générique « c’est »

Comme François Fillon, il est particulièrement adepte des verbes « vouloir » et « falloir » mais dans une mesure moindre. Emmanuel Macron, souvent accusé par ses rivaux de multiplier les prises de parole sans réel engagement ou promesse concrète, est, de fait, celui qui emploie le plus le terme générique « c’est ». « Projet » figure aussi dans son top 3 des mots les plus récurrents, ce qui rappelle forcément sa célèbre saillie « Parce que c’est notre projet !!!! » de son meeting parisien en décembre 2016.

Il est aussi le prétendant à l’Élysée à évoquer l’« Europe » de manière suffisamment récurrente pour que celle-ci figure dans son top 4.

Jean-Luc Mélenchon, ou le carnet de campagne numérique auprès des « gens »

melenchon

Les mots les plus utilisés — sous forme de hashtag — par le candidat de La France insoumise retracent les moments forts de sa campagne : « #18mars2017 » pour son grand meeting à la Bastille, « #jlmchiffrage » pour le direct de 5 heures sur YouTube au cours duquel il avait chiffré son programme ou encore « #jlmhologramme » pour son fameux double meeting simultané à Lyon et à Paris.

En terme de sémantique pure, Mélenchon a pour point commun avec Fillon de favoriser l’expression « [il] faut », largement en tête de ses mots avec 299 occurrences. Il est aussi celui qui évoque le plus les « gens ».

J.-L. Mélenchon est aussi celui qui évoque le plus les « gens »

Le candidat de la France insoumise ne quitte pas la plateforme basique de Twitter, largement devant son utilisation mobile, plutôt sur iPhone.

Assez discret pendant la matinée — avec un pic d’activité à 11 heures — et une partie de l’après-midi, il connaît comme Benoît Hamon un sursaut d’activité à 18 heures et ce jusqu’à 20 heures mais peut en revanche se targuer d’avoir beaucoup plus d’abonnés, en ayant dépassé la barre du million.

Nicolas Dupont-Aignan, « #nda2017 »

dupontaignan

Le candidat de Debout la France ! a deux mots d’ordre : « #nda2017 » et « Nicolas », suivis de près par « France » et « Français ».

Signe de son programme tourné vers la réacquisition pour les Français des droits censés avoir été perdus ou confisqués, il est friand du verbe « retrouver » et ne manque pas d’annoncer qu’il est « invité » dès qu’il est convié à une émission. Ses deux cibles principales s’appellent « Fillon » et « Macron ».

Le candidat de Debout la France ! a deux mots d’ordre : « #nda2017 » et « Nicolas »

Sa présence sur les réseaux sociaux est quasi-permanente, avec de nombreux tweets postés entre 6 heures et 14 heures, un léger creux à 15 heures puis une reprise en flèche à compter de 17 heures et ce jusqu’à 20 heures.

Nicolas Dupont-Aignan est le seul candidat à recourir à parts quasi-égales aux applis Twitter pour Android et pour iOS afin de s’adresser à ses 96 000 abonnés.

Philippe Poutou, « contre » la « loi travail » et pour les « salariés »

poutou

L’ombre d’Olivier « Besancenot » plane sur le compte Twitter de son successeur, Philippe Poutou. Le candidat du Nouveau parti anticapitaliste peut au moins se targuer de porter fidèlement ses engagements, résumés par ses mots clé les plus fréquents : « contre », « gouvernement », « droite » ou encore la « loi travail », ses cibles privilégiées et la « grève » son moyen d’action favori.

Les mots préférés de Philippe Poutou ? « contre », « gouvernement », « droite »

Philippe Poutou, aux 100 000 abonnés est surtout le seul à utiliser majoritairement le service HootSuite, qui permet de centraliser les flux de ses comptes sur les différents réseaux sociaux : Facebook, Twitter, LinkedIn…

Nathalie Arthaud, la voix Twitter des « travailleurs »

arthaud

L’unique candidate communiste ne ferait pas rougir Arlette Laguiller et son célèbre « travailleurs, travailleuses » popularisé par les Guignols de l’info, puisque le terme « travailleurs » est son mot le plus employé (87 occurrences) sur le réseau social où elle reste assez discrète avec ses 3 251 followers.

Le mot travailleurs est son mot le plus employé

Le reste de son lexique est, comme celui de Philippe Poutou, consacré à la cause défendue : « loi travail », « lutte », « salariés », « patronat », « intérêts »… mais aussi à son propre nom.

Cette utilisatrice de Twitter sur Android (comme sur Mac et iPhone) tweete essentiellement en début et en fin de journée.

Jean Lassalle, la « marche » régulière

lassalle

Jean Lassalle parle essentiellement de sa campagne et de lui-même pour tenter de faire connaître son mouvement au plus grand nombre. La « marche » (526 occurrences du hashtag) de celui qui a réalisé un tour de France à pied d’avril à décembre 2013 pour aller à la rencontre des Français et en a fait son mouvement politique reste le sujet fétiche de celui qui tweete à ses 12 500 abonnés à un rythme quasi-stable de 9h à 17h et qui alterne quasiment entre toutes les plateformes de tweet disponibles.

Jacques Cheminade, « Dialogue avec la nation »

cheminade

Utilisateur assidu de Tweetdeck, Jacques Cheminade tweete essentiellement au sujet de son mouvement et de lui-même, en mettant notamment en avant les #DALN, pour « Dialogue avec la nation », ses vidéos où il répond aux questions des internautes.

Jacques Cheminade tweete essentiellement au sujet de son mouvement et de lui-même

Assez discret sur le réseau social où il compte 4 685 abonnés, il y publie essentiellement en fin d’après-midi.

François Asselineau, entre « UPR » et « Brexit »

asselineau

Comme sur ses affiches collées aux quatre coins de la France, François Asselineau aborde en priorité son mouvement, l’UPR (Union populaire républicaine), sur son compte Twitter, à la fois sous forme de hashtag mais aussi comme terme commun.

Ce partisan de la sortie de l’Union européenne et de l’Otan consacre une place d’importance au « Brexit », deuxième terme le plus utilisé sur son compte, juste avant les « #regionales2015 » bien que celles-ci remontent à deux ans.

Il est incontestablement le candidat à tweeter — essentiellement depuis l’interface basique de Twitter — le plus tôt puisque la grande majorité de ses tweets sont publiés entre 6h et 7h du matin, un record qu’il n’égale pas le reste du temps, y compris en fin de journée.

François Asselineau aborde en priorité son mouvement, l’UPR

Si ces profils donnent un aperçu des informations offertes par Semiotweet — disponible en téléchargement sur Github –, Julien Jerphanion précise que l’outil est voué à évoluer et à s’améliorer : « L’objectif principal est de mettre à disposition les propos publics des candidats et surTout de mettre en exergue le sens de ceux-ci. Ce n’est pas une tâche simple : les choix techniques ne sont pas neutres et sont largement critiquables. » Son collègue Valentin Montupet précise : « Très bientôt, il sera possible de comparer les candidats deux à deux. De nouveaux graphiques et de nouveaux indicateurs seront aussi mis en place ».

Retrouvez tous les programmes des candidats à la présidentielle en matière de tech et numérique sur Numerama.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !