Google a démontré l’intérêt de sa technologie de reconnaissance de ce qui apparaît dans les photographies avec le projet LIFE Tags, qui attribue automatiquement les bons mots-clés aux photos du célèbre magazine américain LIFE.

Une image vaut mille mots, dit-on. Mais pour classer et retrouver des photographies, rien ne vaut une description basée sur des mots-clés, surtout si l’archive en question contient plus de 4 millions de clichés. Pour accomplir ce travail de titan, à savoir associer des termes pertinents en fonction de ce que représente chaque cliché, une intervention humaine n’est pas ce qui constitue l’approche la plus efficiente.

La technologie offre heureusement des outils pour automatiser cette tâche : c’est justement ce que Google propose, via son département Arts & Culture. Afin de rendre l’immense banque de photographies du magazine LIFE facile à parcourir, la firme de Mountain View a mis à disposition ses algorithmes d’apprentissage automatique (le machine learning).

magazine Life

Un reportage dans le magazine LIFE.
CC manhhai

Plus de 9 000 mots clés

Objet d’un reportage mené par Mashable, ce projet, LIFE Tags, consiste à laisser les systèmes du géant du net mouliner pour produire des tags cohérents avec les photos. Le résultat a donné lieu à un site web dans lequel les quelques 4 millions de clichés sont décrits en 9 322 mots-clés, certains servant énormément (« voyage aérien » sert plus de 26 000 fois, par exemple), d’autres juste une fois (« Lamborghini 350GT »).

En fonction des mots-clés que vous affichez, Google vous en propose d’autres qu’il juge être en rapport. Un champ de recherche en haut à droite est aussi disponible, afin que vous puissiez inscrire un terme et voir s’il existe dans la base de données. Des suggestions sont aussi affichées au fil de la frappe, un peu comme la fonction de saisie semi-automatique qui existe sur le moteur de recherche.

stanford-id-03.jpg

Google travaille depuis des années à automatiser la description des photos.

L’entreprise américaine a acquis au fil des ans une expertise solide dans l’identification de ce qui apparaît sur une photographie. Elle n’est certes pas la seule sur ce créneau, mais on se souvient par exemple qu’en 2014, lors d’un partenariat avec l’université de Stanford, les algorithmes conçus par les ingénieurs donnaient déjà de bons résultats. Et s’il le faut, Google n’hésite pas à s’offrir des talents extérieurs.

Si l’expérience de Google a parfois connu des ratés, selon les constatations de Mashable, c’est en tout cas une démonstration convaincante de ce genre d’algorithme. Car comme le rappelle notre consoeur, le magazine américain n’a jamais pu publier toutes les photos en sa possession. Cependant, grâce aux outils technologiques, il est possible de tout explorer, facilement, sans que cela ne donne lieu à un grand désordre.


Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !