La Bibliothèque du Congrès et Twitter ont signé un accord destiné à conserver tous les messages publics diffusés sur Twitter. Cela représente des milliards de messages qui serviront notamment à analyser l’opinion mondiale à l’aune de grands évènements internationaux.

Mise à jour – La Bibliothèque du Congrès et Twitter ont officiellement signé mercredi l’accord qui permet au premier d’archiver l’ensemble des messages publics publiés sur le second, depuis sa création en 2006.

Seuls les messages publics sont concernés par cette opération. Les comptes verrouillés et les messages privés ne seront pas enregistrés. Pour un maximum d’efficacité, les données seront directement récupérées sur les serveurs de Twitter.

Cela devrait tout de même représenter des milliards de messages à gérer. Si aucun projet précis n’a été annoncé, on peut imaginer que des chercheurs s’intéresseront à l’évolution de l’opinion mondiale en fonction des évènements d’actualité, grâce à cette immense ressource.

Le décès de Michael Jackson, la mort d’Oussama Ben Laden, la catastrophe de Fukushima, l’amerrissage d’un Airbus A320 sur le fleuve américain de l’Hudson sont quelques exemples d’évènements qui ont été massivement commentés sur Twitter. De précieuses informations pourraient être tirées de ces commentaires à chaud.

Sujet du 15 mai 2010 – Voici un exemple qui, le jour où NKM lance sa consultation publique sur le droit à l’oubli, montre que toute régulation sur le sujet sera quasiment impossible à mettre en pratique concrètement.

La Bibliothèque du Congrès s’est associée à Twitter pour conserver dans ses murs l’ensemble des messages publics diffusés par ses utilisateurs sur le service de micro-blogging. Dès lors, même la suppression d’un message par Twitter sur ses propres bases de données pourrait ne pas avoir d’effet sur la mémoire, inaltérable, de la Bibliothèque du Congrès.

La plus grande bibliothèque au monde pourra accéder à l’ensemble des messages publics, qui représentent la grande majorité des messages publiés sur Twitter, et les archiver dans ses propres bases de données. Mais elle ne pourra les exploiter qu’en respectant un délai de 6 mois après publication, pour un usage uniquement interne, à but non commercial, pour être consultables dans la bibliothèque et dans un but de préservation de la mémoire.

« Nous avons plaisir à donner l’accès à l’ensemble de l’archive publique des Tweets à la Bibliothèque du Congrès à des fins de préservation et de recherche« , indique Twitter sur son blog officiel. Le service annonce égalemet un partenariat avec Google qui, à travers Google Replay, permet de rechercher les tweets publiés à un moment précis du passé. « Google Replay ne revient pour le moment que quelques mois en arrière mais il finira par revenir aux tous premiers Tweets jamais créés« , indique Twitter.


Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !