Chez Google, des spécialistes de l'intelligence artificielle se sont demandés si cette technologie pourrait deviner quand une photo est jugée esthétique par un humain. L'IA qu'ils ont mis au point repose sur un réseau neuronal particulier, dit « convolutif ».

Les intelligences artificielles développées dans le giron de Google sont nombreuses en cette fin d’année. Outre cette IA qui repère les regards indiscrets en direction de votre smartphone, l’entreprise de Mountain View a mobilisé cette technologie pour créer un système champion aux échecs, ou pour découvrir des exoplanètes en compagnie de la Nasa.

D’autres salariés de Google spécialistes de l’IA ont trouvé une nouvelle utilité aux algorithmes qu’ils entraînent. Ils ont cherché à mettre au point une intelligence artificielle capable d’identifier si une photographie sera jugée esthétique par un être humain.

Cette IA ne se contente pas de rendre un résultat en fonction d’une catégorisation basique — par exemple, déduire qu’une image sera appréciée parce que l’IA y identifie, admettons, un chat ou un paysage. Ici, les algorithmes évaluent l’esthétisme d’une image différemment.

Réseau neuronal convolutif

Les chercheurs présentent un procédé baptisé NIMA, pour « neural image assessment » (que l’on pourrait tenter de traduire par « évaluation neuronale d’image »). Ce NIMA consiste à entraîner un réseau neuronal convolutif dont le fonctionnement s’inspire de mécanismes visuels observés chez les animaux : les cellules du cortex visuel, permettant de détecter la lumière, se chevauchent dans des zones appelées champs réceptifs.

Résumés sommairement, les réseaux de neurones convolutifs sont constitués de deux types de cellules de base du champ réceptif : les cellules simples repèrent des éléments caractéristiques (contraste, intensité, taille d’un objet) tandis que les cellules les plus complexes ont des champs récepteurs plus importants.

L’IA pourrait trier des photos identiques

Transposé au modèle du NIMA, cela signifie que l’intelligence artificielle examine à la fois les pixels d’une image et son apparence globale. L’IA combine ces deux observations pour estimer la probabilité qu’un humain apprécie cette image. « Notre modèle est capable de guider un filtre CNN pour trouver ses paramètres esthétiques optimaux, comme la luminosité, les réhauts et les ombres », notent les chercheurs dans une publication de blog.

Finalement, à quoi pourrait servir cette IA ? Probablement à opérer un tri dans une sélection de photographies identiques. Par exemple, lorsque vous prenez plusieurs photos d’une même scène, les algorithmes seraient capables de supprimer les images jugées les moins esthétiques par l’être humain.

Partager sur les réseaux sociaux