Vous n'aurez peut-être plus à consulter vos mails : une IA parvient à les résumer
Avant qu’Internet ne se démocratise, l'accès à l'information de tout genre pouvait parfois être difficile.
Salesforce vient en effet d’annoncer des avancées considérable dans son projet de logiciel de synthèse de textes et d'articles. Celui-ci permet d’extraire les informations et mots essentielles d’un papier, afin de produire des résumés cohérents, traduisant en quelques phrases le sens d’un long paragraphe.
Une évolution permise grâce à deux progrès technique faisant évoluer le travail de l’algorithme : la lecture par codeur-décodeur et l’attention temporelle, le tout à l'aide de machine learning. Un travail notamment rendu possible par l’acquisition, en avril dernier, de la startup MetaMind, spécialisée dans le deep learning.
Une meilleure contextualisation
La première technique utilise la récapitulation abstractive — en opposition à l'extractive, qui résume uniquement un texte avec des mots issus de celui-ci. Elle est ici capable d'analyser les phrases plusieurs fois et dans différents sens de lecture, améliorant de fait la cohérence des retours. La seconde ajoute quant à elle une attention temporelle, permettant à l’IA de consulter d’autres parties du texte pour mieux contextualiser et ainsi proposer de nouveaux mots, en cohérence avec le sens initial du papier -- tout en évitant les répétitions.
Pour faire évoluer leur algorithme, les équipes de recherche y ont ajouté un système d’évaluation interne. Plutôt que de souligner les mots inutiles ou mal utilisés, une version améliorée du système ROUGE (Recall-Oriented Understudy for Gisting Evaluation) va juger les résumés produits avec un score, comme dans un jeu vidéo.
Si celui-ci est élevé, l’algorithme va enregistrer sa production afin de la réutiliser sous différente formes, mais si le résultat est plutôt négatif, alors l’IA sera pénalisée et changera de procédure pour gérer ses prochains résumés.
Avec ces améliorations, Salesforce vise avant tout à un gain de productivité. L’éditeur y voit un potentiel pour les entreprises et employés de tout type d’industrie, qui pourraient ainsi réduire le temps consacré à la lecture de mails ou de briefings pour le consacrer au travail.
Et si l’on en croit les résultats communiqués par l’éditeur, il semblerait que son algorithme se montre déjà d'une efficacité bien plus élevée que les modèles de synthèse automatique déjà existants. Mais des évolutions et améliorations sont possibles, et l’entreprise travaille encore dessus, puisqu’aucune annonce de sortie n’a pour l’instant été communiquée.
https://www.numerama.com/tech/245929-data-science-machine-learning-et-si-vous-faisiez-resoudre-des-problemes-a-des-algorithmes.html