Facebook a mis en ligne le code source de trois librairies qui permettent de délimiter et reconnaître automatiquement les objets présents sur une image.

Même si l’intelligence artificielle est au cœur des progrès technologiques qui permettent aux géants du web d’envisager de nouvelles fonctionnalités lucratives, le partage des connaissances pour faire avancer la science ensemble reste plus stratégique que le secret industriel. C’est ainsi que Facebook a décidé jeudi de rendre open-source un ensemble de technologies développées par son laboratoire FAIR (Facebook Artificial Intelligence Research), concernant l’analyse des images.

Concrètement, Facebook publie les codes sources d’implémentation et les spécifications de trois algorithmes qui peuvent être associés, DeepMask, SharpMask et MultiPathNet.

Les deux premiers permettent de délimiter précisément les zones clés d’une image, en comprenant la forme et le plan de chaque objet principal. C’est quelque chose que le cerveau humain sait faire naturellement et sans effort, mais qui est beaucoup plus complexe pour un ordinateur pour qui une image n’est qu’un aplat de pixels mis les uns à côté des autres. De son côté, MultiPathNet est un système d’intelligence artificielle qui permet de reconnaître et d’étiqueter les objets ainsi reconnus qui se trouvent dans l’image.

Des démonstrations technologiques peuvent être trouvées sur cette page, qui montrent comment SharpMask et DeepMask délimitent les différents objets présents sur une photo, pour les fournir ensuite à l’IA MultiPathNet qui devra les reconnaître et les tagger.

detection detection2

Facebook-elephants

Ce type de technologies permet aussi de reconnaître ce que les gens font dans des vidéos, ou encore de décrire le contenu d’une photo ou d’une vidéo à une personne à vision réduite ou aveugle. Facebook avait déjà présenté une telle technologie en avril dernier.

Interrogé par The Verge, Facebook explique que « nous espérons que d’autres pourront travailler avec nous pour améliorer nos outils et technologies ». Car pour Facebook, le principal n’est pas d’être le seul à disposer de tels outils, mais plutôt d’avoir au final les outils les plus perfectionnés possibles, à appliquer sur les millions de photos ou de vidéos que les internautes partagent sur son réseau social. Plus Facebook pourra comprendre ce que partagent les internautes, plus il pourra affiner leur profil publicitaire et proposer des contenus en rapport avec leurs centres d’intérêts.

Nouveauté : Découvrez

La meilleure expérience de Numerama, sans publicité,
+ riche, + zen, + exclusive.

Découvrez Numerama+

Si vous avez aimé cet article, vous aimerez les suivants : ne les manquez pas en vous abonnant à Numerama sur Google News.