Avec l’aide technique d’un institut suédois et le financement de la puissance publique, la fondation Wikimedia prépare un moteur de synthèse vocale open-source pour rendre les quelques 300 langues de l’encyclopédie collaborative accessibles aux non-voyants.

La Wikimedia Foundation se joint à un groupe de chercheurs suédois du KTH, l’institut royal de technologie de Suède, pour développer un moteur de synthèse vocale polyglotte.

Conformément aux valeurs de la fondation, le moteur développé sera open-source et fonctionnera avec tous les sites Wikimedia. Une nouvelle étape pour démocratiser le savoir disponible sur la plateforme, ici en faveur des non-voyants ou des personnes mal voyantes.

Le défi pour les chercheurs est de créer un moteur capable de parler les plus de 300 langues présentes sur les diverses fiches de Wikipedia. Et ainsi reproduire une lecture de chacune le plus proche possible d’une voix naturelle, sans dépendre des API de synthèse vocale déjà proposées par des acteurs externes comme Microsoft ou Google (via Android).

Capture d’écran (117)

L’intérêt est double pour la fondation et l’Internet tout entier. L’outil sera effectivement une nouvelle étape pour l’accessibilité du site, une question essentielle lorsque l’on aborde les fractures numériques dues aux handicaps. Mais par ailleurs, le projet universitaire sera aussi un projet très intéressant pour l’ensemble du web, qui pourrait en profiter au delà de Wikipédia s’il est permis d’exploiter librement le moteur pour d’autres projets.

En effet le communiqué du KTH parle d’une technologie qui sera « open source » mais ne précise pas encore la licence choisie. S’il s’agit bien d’une licence libre, et le contraire serait surprenant, il sera possible pour les développeurs d’utiliser le moteur de synthèse vocale de Wikipedia sur leurs propres sites ou applications.

Dès 2017, l’anglais, l’arabe et le suédois seront les premières langues lues par le moteur. Les autres langues suivront progressivement, peut-être avec l’aide de la communauté.

On ne peut que se féliciter de cette entreprise, qui aidera à favoriser l’accessibilité d’un Web sur lequel il est encore difficile de naviguer pour des personnes handicapées. Mais pas seulement. La PTS, l’Autorité de régulation des télécommunications suédoise, qui finance le projet, indique que plus de 25% des utilisateurs actuels de Wikipédia préféreraient entendre plutôt que lire le contenu.

Une tendance animée non seulement par les mal-voyants, mais à l’évidence aussi, par les accrocs aux podcasts et aux contenus dynamiques, qui préfèrent des contenus sonores ou vidéo à l’écrit.


Abonnez-vous à Numerama sur Google News pour ne manquer aucune info !