Microsoft annonce que l'un de ses outils de deep learning, CNTK, est désormais publié en open source. Chacun est libre de s'en emparer. Une ouverture qui est capitale pour l'entreprise.

Microsoft aussi veut occuper le devant de la scène dans le domaine de l’intelligence artificielle. Et pour y parvenir, la firme de Redmond n’a pas trente-six solutions devant elle : il lui faut ouvrir ses outils au plus grand nombre si elle veut espérer les imposer auprès des chercheurs et des développeurs.

La puissance déportée
La puissance déportée
Microsoft

C’est donc pour cette raison que l’entreprise vient d’annoncer cette semaine la publication de son kit de développement sous licence MIT, c’est-à-dire en code source ouvert. Pour faire simple, celle-ci donne le droit à n’importe qui d’utiliser gratuitement le logiciel comme bon lui semble pour ses propres travaux.

Le système dont il est question, surnommé CNTK (pour « Computational Network ToolKit »), repose sur l’apprentissage profond (ou « deep learning »). Cette méthode consiste à faire ingérer des quantités considérables de données à une machine pour qu’elle puisse par la suite travailler en autonomie sur un sujet.

Par exemple, le deep learning permet d’enseigner à un ordinateur la faculté de reconnaître un animal sur une photo après lui avoir montré des milliers d’exemples. Cette approche est aussi utile dans le domaine de la reconnaissance vocale, pour identifier ce que le locuteur dit à voix haute, en prenant en compte le contexte.

 

CNTK
Les performances comparées.

D’après Microsoft, CNTK affiche des performances sans commune mesure avec d’autres solutions du même type. C’est surtout vrai lorsque plusieurs processeurs graphiques sont mobilisés : l’écart avec Theano, TensorFlow, Torch7 et Caffe est relativement faible sur un GPU. Mais lorsqu’on en combine plusieurs, tout change.

Ces très bons résultats sont cruciaux pour améliorer la qualité des traitements que le deep learning est amené à faire.

« Ces résultats ont permis aux chercheurs de créer des systèmes qui peuvent identifier précisément des conversations et même les traduire, ainsi que des solutions capables de reconnaître des images et même de répondre à des questions les concernant », explique Microsoft pour souligner la pertinence du CNTK.

L’apprentissage profond est un domaine en vogue chez les géants de la high-tech.

Google est sur le coup avec TensorFlow, qu’il a lui-aussi rendu open-source en novembre. Tout comme Facebook et sa branche dirigée par un  Français, Yann LeCun, un spécialiste des réseaux de neurones artificiels, considéré comme l’un des pionniers de la discipline du deep learning.

Neurones
Le principe des neurones en réseau.

Comme Microsoft l’explique sur son blog, son souhait de partager CNTK s’est manifesté dès le mois d’avril 2015. Mais à l’époque, il fallait être chercheur universitaire pour avoir le droit de s’en servir. De plus, la licence utilisée était bien plus restrictive. Ces freins sont maintenant de l’histoire ancienne.

Déjà à la mi-janvier, Microsoft partageait une partie de son savoir-faire en publiant ses interfaces de programmation applicative (API) dans le domaine de l’IA.

L’ouverture de CNTK, tout comme celle de TensorFlow, n’est pas désintéressée.

Ne pas laisser un boulevard aux concurrents.

Google comme Microsoft ont bien l’intention de profiter de l’expertise de la communauté des chercheurs en IA pour améliorer leurs outils respectifs. Améliorations qui pourront ensuite rejaillir sur leurs produits. On pense par exemple à Skype (traduction orale) et Cortana (reconnaissance vocale) pour Microsoft.

Et de toute façon, les entreprises n’ont plus vraiment le choix. Dès que l’une d’elles a pris la décision d’ouvrir son outil, les autres sont obligées de suivre le mouvement pour éviter de voir leur solution disparaître. Reste maintenant à convaincre développeurs, chercheurs et experts d’utiliser tel système plutôt que celui de la concurrence.

Partager sur les réseaux sociaux

Articles liés