L'éditeur de logiciel Salesforce vient de faire une avancée considérable dans le développement d'algorithmes qui permettent de synthétiser des textes. Grâce au mélange de différentes techniques, son IA pourrait faire gagner un temps considérable dans la lecture de nos mails et autres tâches quotidiennes.

Avant qu’Internet ne se démocratise, l’accès à l’information de tout genre pouvait parfois être difficile. Maintenant qu’il fait partie intégrante de notre quotidien, le problème qui se pose est plutôt celui du temps que nous consacrons à cette information. Rien que sur l’année 2017, une personne devrait passer en moyenne près de 12 heures et 7 minutes, chaque jour, devant ses réseaux sociaux, ses mails ou ses journaux en ligne, selon … L’éditeur américain de logiciel Salesforce pense y avoir trouvé une réponse, avec le développement d’une intelligence artificielle capable de réaliser cette tâche à votre place et donc de vous faire gagner du temps.

Salesforce vient en effet d’annoncer des avancées considérable dans son projet de logiciel de synthèse de textes et d’articles. Celui-ci permet d’extraire les informations et mots essentielles d’un papier, afin de produire des résumés cohérents, traduisant en quelques phrases le sens d’un long paragraphe.

Une évolution permise grâce à deux progrès technique faisant évoluer le travail de l’algorithme : la lecture par codeur-décodeur et l’attention temporelle, le tout à l’aide de machine learning. Un travail notamment rendu possible par l’acquisition, en avril dernier, de la startup MetaMind, spécialisée dans le deep learning.

Une meilleure contextualisation

La première technique utilise la récapitulation abstractive — en opposition à l’extractive, qui résume uniquement un texte avec des mots issus de celui-ci. Elle est ici capable d’analyser les phrases plusieurs fois et dans différents sens de lecture, améliorant de fait la cohérence des retours. La seconde ajoute quant à elle une attention temporelle, permettant à l’IA de consulter d’autres parties du texte pour mieux contextualiser et ainsi proposer de nouveaux mots, en cohérence avec le sens initial du papier — tout en évitant les répétitions.

Pour faire évoluer leur algorithme, les équipes de recherche y ont ajouté un système d’évaluation interne. Plutôt que de souligner les mots inutiles ou mal utilisés, une version améliorée du système ROUGE (Recall-Oriented Understudy for Gisting Evaluation) va juger les résumés produits avec un score, comme dans un jeu vidéo.

Si celui-ci est élevé, l’algorithme va enregistrer sa production afin de la réutiliser sous différente formes, mais si le résultat est plutôt négatif, alors l’IA sera pénalisée et changera de procédure pour gérer ses prochains résumés.

Avec ces améliorations, Salesforce vise avant tout à un gain de productivité. L’éditeur y voit un potentiel pour les entreprises et employés de tout type d’industrie, qui pourraient ainsi réduire le temps consacré à la lecture de mails ou de briefings pour le consacrer au travail. 

Et si l’on en croit les résultats communiqués par l’éditeur, il semblerait que son algorithme se montre déjà d’une efficacité bien plus élevée que les modèles de synthèse automatique déjà existants. Mais des évolutions et améliorations sont possibles, et l’entreprise travaille encore dessus, puisqu’aucune annonce de sortie n’a pour l’instant été communiquée.

À lire sur Numerama : Data science, machine learning  : et si vous faisiez résoudre des problèmes à des algorithmes  ?

Partager sur les réseaux sociaux