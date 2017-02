Charlie Thompson, expert en données en tout genre et mathématicien, a récemment découvert et appliqué une équation permettant de mesurer la puissance mélancolique d'une chanson. Forcément, c'est avec Radiohead qu'il a réalisé son expérience. Passionnant.

Sur le très sérieux Revolution où il est question de projet open-source pour traiter de la data grâce au langage informatique R, cette semaine, c’était Radiohead qui tenait la tête d’affiche d’un billet hautement précis sur la mesure de la tristesse par la donnée. Le groupe de York a inspiré à un expert en traitement des données, Charlie Thompson, une passionnante étude qui intéressera autant les matheux que les mélomanes.

L’objectif de Thompson était de créer, littéralement, une mesure fondée sur la data de « la chanson la plus dépressive de Radiohead. » Pour y parvenir, le scientifique a d’abord cherché à obtenir le plus de données possibles sur les morceaux du groupe. Pour commencer, il a utilisé, à l’instar d’Aiaiai, l’API de Spotify qui permet d’accéder aux nombreuses informations que collecte le service sur chaque titre de son catalogue.

Positivité, lexique, intensité, les variables de l’équation mélancolie

Pour chacun des neufs albums studio, Thompson a donc extrait ce que Spotify appelle la valence de chaque titre. Une donnée que le géant du streaming décrit comme la mesure, sur une échelle de 0.0 à 1.0 de la positivité musicale transmise par un morceau. Ainsi, selon l’échelle du scandinave, True Love Waits et We Suck Young Blood sont les deux chansons possédant le plus bas score (elles partagent toutes les deux un petit 0.0378).

Mais Thompson ne souhaitait pas se limiter à ce seul critère qui ne dépend finalement que du jugement des algorithmes de Spotify. Il s’est donc également intéressé aux paroles pour y repérer tous les mots qui partagent le champs lexical de la tristesse selon une grande étude crowdsourcée du Canada National Research Council. L’enquête menée par les canadiens a réalisé une quantification émotionnelle des mots en fonction d’associations d’idées. L’alchimiste de la data a donc mêlé cette étude aux paroles du groupe trouvées grâce à l’API de Genius.com. Enfin, pour chaque chanson, il a réalisé un pourcentage de la quantité de mots reliés à la tristesse. Selon cette méthode, le titre proposant les paroles les plus tristes est High and Dry avec un beau résultat de 36 % de mots tristes.

Malgré toutes ces données, notre savant n’était pas encore satisfait. Il a considéré, à juste titre, qu’il fallait également prendre en compte l’importance des mots dans les chansons. Donc dans son équation finale, Thompson a introduit une notion de densité lyrique, autrement dit, l’importance des paroles dans la chanson. À la fin de ses recherches, le matheux a fini par établir l’équation suivante :

De fait, pour mesurer la tristesse de Thom York et de ses comparses, Charlie Thompson a pris en compte toutes les données compilées afin d’arriver à la formule magique qui prend en compte les nombreuses manifestations de la tristesse dans une chanson. L’équation donne un résultat compris entre 1 et 100 permettant de rapidement déterminer l’étourdissante mélancolie des créateurs d’OK Computer. (Les détails de ses opérations et scripts sont à retrouver ici.)

Enfin, la chanson la plus triste de Radiohead est officiellement True Love Waits avec un impressionnant indice de tristesse de 1. Pour les connaisseurs du groupe, le résultat ne sera peut-être pas si surprenant : rappelons que York y chante, ou plutôt narre, une déclaration de détresse à l’être aimé.

I’m not living, I’m just killing time

Your tiny hands, your crazy-kitten smile

Just don’t leave

Don’t leave