Facebook rend open-source sa technologie de compréhension des images

Résumé par IA, vérifié par Numerama

Recevez tous les soirs un résumé de l’actu importante avec Le Récap’

Facebook a mis en ligne le code source de trois librairies qui permettent de délimiter et reconnaître automatiquement les objets présents sur une image.

Même si l’intelligence artificielle est au cœur des progrès technologiques qui permettent aux géants du web d’envisager de nouvelles fonctionnalités lucratives, le partage des connaissances pour faire avancer la science ensemble reste plus stratégique que le secret industriel. C’est ainsi que Facebook a décidé jeudi de rendre open-source un ensemble de technologies développées par son laboratoire FAIR (Facebook Artificial Intelligence Research), concernant l’analyse des images.

Concrètement, Facebook publie les codes sources d’implémentation et les spécifications de trois algorithmes qui peuvent être associés, DeepMask, SharpMask et MultiPathNet.

Les deux premiers permettent de délimiter précisément les zones clés d’une image, en comprenant la forme et le plan de chaque objet principal. C’est quelque chose que le cerveau humain sait faire naturellement et sans effort, mais qui est beaucoup plus complexe pour un ordinateur pour qui une image n’est qu’un aplat de pixels mis les uns à côté des autres. De son côté, MultiPathNet est un système d’intelligence artificielle qui permet de reconnaître et d’étiqueter les objets ainsi reconnus qui se trouvent dans l’image.

Des démonstrations technologiques peuvent être trouvées sur cette page, qui montrent comment SharpMask et DeepMask délimitent les différents objets présents sur une photo, pour les fournir ensuite à l’IA MultiPathNet qui devra les reconnaître et les tagger.

Ce type de technologies permet aussi de reconnaître ce que les gens font dans des vidéos, ou encore de décrire le contenu d’une photo ou d’une vidéo à une personne à vision réduite ou aveugle. Facebook avait déjà présenté une telle technologie en avril dernier.

Interrogé par The Verge, Facebook explique que « nous espérons que d’autres pourront travailler avec nous pour améliorer nos outils et technologies ». Car pour Facebook, le principal n’est pas d’être le seul à disposer de tels outils, mais plutôt d’avoir au final les outils les plus perfectionnés possibles, à appliquer sur les millions de photos ou de vidéos que les internautes partagent sur son réseau social. Plus Facebook pourra comprendre ce que partagent les internautes, plus il pourra affiner leur profil publicitaire et proposer des contenus en rapport avec leurs centres d’intérêts.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Tous nos articles sont aussi sur notre profil Google : suivez-nous pour ne rien manquer !