L'Unicef teste le conseil médical par intelligence artificielle
Dans des pays qui manquent de docteurs, l'intelligence artificielle peut-elle être un recours ?
L'initiative s'appuie sur l'application open-source U-Report, lancée initialement en 2011 en Ouganda pour faciliter le journalisme citoyen en permettant aux utilisateurs de faire remonter des informations par SMS. Le service permet aussi aux très nombreux utilisateurs de l'application en Zambie de poser des questions d'ordre médical, et d'obtenir des réponses formulées par des bénévoles de l'Unicef. Or les Zambiens envoient des milliers de questions chaque mois, et toutes les traiter manuellement devient difficile.
Le consultant et expert en technologies humanitaires Patrick Meier s'est donc rapproché d'un chercheur du Qatar, Muhummad Imran, et d'un chercheur espagnol, Carlos Castillo, pour mettre au point avec l'Unicef un système d'intelligence artificielle qui permettrait, d'abord de trier les questions reçues, puis d'y répondre automatiquement.
Le système se base sur le code source de AIDR, un système open-source de classification automatisée des SMS et des tweets envoyés en situation de catastrophe, mis au point pour aider les autorités à faire face aux urgences. Nourri par des messages d'abord classés par des humains, le système apprend progressivement à classer lui-même les SMS en fonction des mots clés et des structures qui reviennent régulièrement, grâce à des algorithmes d'apprentissage-machine désormais incontournables en matière d'IA.
Pour U-Report, l'Unicef classait manuellement les SMS reçus en huit catégories :
Description de symptômes
Demandes de définitions
Questions sur la circoncision
Tests du VIH
Questions sur des traitements
Questions sur la grossesse
Questions sur la transmission du VIH
Questions sur la prévention du VIH
Les chercheurs ont donc pu exploiter 60 000 messages collectés par l'Unicef en Zambie, et tester la classification automatique des messages. Malgré le langage SMS et l'orthographe approximative qui rend l'analyse complexe, le système a été capable de classer correctement 82 % des messages, selon l'échantillon de 740 messages qui ont fait l'objet d'une vérification manuelle.
Dans un premier temps, le système permet surtout d'obtenir des statistiques sur les demandes qui reviennent le plus souvent, pour mieux guider les FAQ publiées et accessibles via U-Report. Mais à terme, les chercheurs espèrent mettre au point des réponses automatisées ou semi-automatisées, qui pourront être complétées par des humains en cas de besoin.