La firme chinoise Baidu annonce avoir battu Google dans la reconnaissance d'images par une intelligence artificielle.

Les ingénieurs du moteur de recherche chinois Baidu annoncent avoir battu le record précédemment établi par Google pour la reconnaissance des images par une intelligence artificielle. Grâce à un super-ordinateur spécialement conçu pour former un réseau neuronal artificiel, composé de 72 processeurs (CPU) et 144 processeurs graphiques (GPU), ainsi qu'à de nouvelles techniques d'apprentissage-machine, les Chinois ont réussi à atteindre une précision de 95,42 % au Challenge ImageNet, contre 95,2 % pour Google, et 95,06 % pour Microsoft. C'est mieux que le score obtenu par un adulte.

Le Challenge ImageNet consiste à nourrir une intelligence artificielle avec un ensemble de 1,5 millions d'images décrites par des métadonnées, classées dans 1 000 catégories différentes, et à demander ensuite à l'IA de décrire automatiquement le contenu de 100 000 autres images pour lesquelles elle n'a aucune information (c'est le même principe que celui utilisé par Flickr pour ajouter des tags sans votre permission). L'intelligence artificielle doit alors fournir cinq propositions par image, et si l'une d'elle est exacte, la réponse est considéré comme une bonne réponse (ce n'est donc pas tout à fait 95,42 % de réponses exactes). En 2012, le meilleur n'atteignait que 83,58 % de précision.

Pour battre ses concurrents, Baidu a fourni à son super-ordinateur Deep Image des images d'une meilleure résolution, et implémenté de nouvelles techniques d'augmentation de l'échantillon de base. L'une d'elle consiste à modifier les images fournies pour l'apprentissage en partant du principe que changer la balance des blancs, ajouter du bruit, étirer les bords ou recadrer l'image ne changerait pas le sujet présenté par la photo, mais permettrait à l'IA d'être moins influencée par les aspects techniques de la photo :

Grâce à ces techniques, Deep Image a été capable de reconnaître toutes les images ci-dessous. La première ligne montre l'image tirée de l'échantillon ImageNet, et les autres montrent la même image photographiée depuis un smartphone :

Partager sur les réseaux sociaux

Articles liés