Les messages sur Twitter seront archivés par la Bibliothèque du Congrès

Guillaume Champeau - publié le Jeudi 08 Décembre 2011 à 15h30 - posté dans Société 2.0

La Bibliothèque du Congrès et Twitter ont signé un accord destiné à conserver tous les messages publics diffusés sur Twitter. Cela représente des milliards de messages qui serviront notamment à analyser l'opinion mondiale à l'aune de grands évènements internationaux.

Mise à jour - La Bibliothèque du Congrès et Twitter ont officiellement signé mercredi l'accord qui permet au premier d'archiver l'ensemble des messages publics publiés sur le second, depuis sa création en 2006.

Seuls les messages publics sont concernés par cette opération. Les comptes verrouillés et les messages privés ne seront pas enregistrés. Pour un maximum d'efficacité, les données seront directement récupérées sur les serveurs de Twitter.

Cela devrait tout de même représenter des milliards de messages à gérer. Si aucun projet précis n'a été annoncé, on peut imaginer que des chercheurs s'intéresseront à l'évolution de l'opinion mondiale en fonction des évènements d'actualité, grâce à cette immense ressource.

Le décès de Michael Jackson, la mort d'Oussama Ben Laden, la catastrophe de Fukushima, l'amerrissage d'un Airbus A320 sur le fleuve américain de l'Hudson sont quelques exemples d'évènements qui ont été massivement commentés sur Twitter. De précieuses informations pourraient être tirées de ces commentaires à chaud.

Sujet du 15 mai 2010 - Voici un exemple qui, le jour où NKM lance sa consultation publique sur le droit à l'oubli, montre que toute régulation sur le sujet sera quasiment impossible à mettre en pratique concrètement.

La Bibliothèque du Congrès s'est associée à Twitter pour conserver dans ses murs l'ensemble des messages publics diffusés par ses utilisateurs sur le service de micro-blogging. Dès lors, même la suppression d'un message par Twitter sur ses propres bases de données pourrait ne pas avoir d'effet sur la mémoire, inaltérable, de la Bibliothèque du Congrès.

La plus grande bibliothèque au monde pourra accéder à l'ensemble des messages publics, qui représentent la grande majorité des messages publiés sur Twitter, et les archiver dans ses propres bases de données. Mais elle ne pourra les exploiter qu'en respectant un délai de 6 mois après publication, pour un usage uniquement interne, à but non commercial, pour être consultables dans la bibliothèque et dans un but de préservation de la mémoire.

"Nous avons plaisir à donner l'accès à l'ensemble de l'archive publique des Tweets à la Bibliothèque du Congrès à des fins de préservation et de recherche", indique Twitter sur son blog officiel. Le service annonce égalemet un partenariat avec Google qui, à travers Google Replay, permet de rechercher les tweets publiés à un moment précis du passé. "Google Replay ne revient pour le moment que quelques mois en arrière mais il finira par revenir aux tous premiers Tweets jamais créés", indique Twitter.

Publié par Guillaume Champeau, le 8 Décembre 2011 à 15h30
 
 
22
Commentaires à propos de «Les messages sur Twitter seront archivés par la Bibliothèque du Congrès»
 

1
2
Avec les réseaux informatiques et leur accès grand public, c'est une révolution des mentalités qui commence ...

comme l'a été l'invention de l'écriture puis celle de l'imprimerie....

Dur pour les veilles générations ...
A 35 ans, on fait déjà partie d'une vieille génération? :D
Ben voyons. Parce que la Bibliothèque du Congrès refusera bien entendu toute commission rogatoire ou investigation des autorités, hein.

Quand on lit l'inanité, la connerie insigne de ce qui transite majoritairement sur Twitter, on se dit que c'est encore de l'argent et de l'énergie bien employés, ça. Yeah.
Ulf, le 15/04/2010 - 10:42
Ben voyons. Parce que la Bibliothèque du Congrès refusera bien entendu toute commission rogatoire ou investigation des autorités, hein.

Quand on lit l'inanité, la connerie insigne de ce qui transite majoritairement sur Twitter, on se dit que c'est encore de l'argent et de l'énergie bien employés, ça. Yeah.

Je ne suis pas d'accord avec vos propos. L'intérêt de twitter à ce niveau, au-delà de la pauvreté apparente d'un gazouilli de 140 caractères est l'intérêt que comporte l'analyse des message à tel moment ou sur une telle période et relative à un sujet donné.

C'est un petit peu figer une cartographie de l'intelligence collective et c'est en cela très intéressant pour des chercheurs (historiens, sociologues, anthropologues, économistes, sciences cognitives, ingénieurs et j'en passe...)
Je rajouterais qu'ils pourraient très bien supprimer les données personnelles attachés au compte (qui sont de toute façon très réduite et se limite au maximum au nom et prénom de la personne (qui ne sont pas obligatoires) car là n'est pas l'important.
bah didonc... et ça servira a quoi ?
Parce que vu le contenu de la plupart des tweets que je vois, ca pourrais servir de source d'entropie... mais à par ca...
obcd, le 15/04/2010 - 12:59
bah didonc... et ça servira a quoi ?
Parce que vu le contenu de la plupart des tweets que je vois, ca pourrais servir de source d'entropie... mais à par ca...

Twitter n'est pas simplement du "micro-facebooking" du genre "j'ai mangé une pomme" ou "je t'embrasse", c'est aussi un grand nombre de messages avec de l'actualité, de la veille sur de très nombreux domaines et j'en passe.

Quand bien même ce serait un grand nombre de messages "sans importance" c'est une aussi une partie de la mémoire de l'humanité comme quand il s'agit de conserver des archives de l'internet regroupant les données de sites existants à un moment donné.

Je le répète, un message seul peut être sans intérêt mais des millions de messages de ce type peuvent être très intéressant à analyser je t'assures.
WebOliver, le 15/04/2010 - 10:31
A 35 ans, on fait déjà partie d'une vieille génération? :D

Et à 57 ans ...
J'étais déjà à travailler sur des "Apple IIE" que tu n'étais même pas né.
Je commence à en avoir ras le cigare de cette "mentalité" de stigmatiser les vieux ... comme des analphabètes ... et des ignorants.
Equilibre, le 15/04/2010 - 12:04
Je rajouterais qu'ils pourraient très bien supprimer les données personnelles attachés au compte (qui sont de toute façon très réduite et se limite au maximum au nom et prénom de la personne (qui ne sont pas obligatoires) car là n'est pas l'important.

Et c'est bien là le "hic" ... c'est que le Congrès n'a peut-être pas les même objectifs d'analyses scientifiques que tu cites ...
Et peut-être "seules" les données personnelles pourraient l'intéresser ...
Je ne suis ni sur twit ni sur Face ...
mortiche, le 15/04/2010 - 16:05
[Et à 57 ans ...J'étais déjà à travailler sur des "Apple IIE" que tu n'étais même pas né.Je commence à en avoir ras le cigare de cette "mentalité" de stigmatiser les vieux ... comme des analphabètes ... et des ignorants.
Qui a stigmatisé les vieux? Pas moi en tout cas.
mortiche, le 15/04/2010 - 16:10
Equilibre, le 15/04/2010 - 12:04
Je rajouterais qu'ils pourraient très bien supprimer les données personnelles attachés au compte (qui sont de toute façon très réduite et se limite au maximum au nom et prénom de la personne (qui ne sont pas obligatoires) car là n'est pas l'important.

Et c'est bien là le "hic" ... c'est que le Congrès n'a peut-être pas les même objectifs d'analyses scientifiques que tu cites ...
Et peut-être "seules" les données personnelles pourraient l'intéresser ...
Je ne suis ni sur twit ni sur Face ...

Je ne vois pas l'intérêt de la bibliothèque du congrès si ce n'est pas à but scientifique. On ne parle pas de la NSA ici...
Ulf, le 15/04/2010 - 10:42
Ben voyons. Parce que la Bibliothèque du Congrès refusera bien entendu toute commission rogatoire ou investigation des autorités, hein.

Quand on lit l'inanité, la connerie insigne de ce qui transite majoritairement sur Twitter, on se dit que c'est encore de l'argent et de l'énergie bien employés, ça. Yeah.
Pour ton info, la bibliothèque nationale française fait déjà la même chose depuis belle lurette avec toutes les publications papier: le dépôt légal.
Même lorsqu'il s'agit de la gazette des chasseurs de galinette cendrée, de l'annuaire de la famille trucmuche, ou de toute autre "inanité ou connerie insigne".
Ce qui lui a permis d'acquérir à moindre frais un trésor inestimable.

Quant à la "Library of congress", ça fait longtemps qu'elle ne se contente pas des publications papier. Et ça n'est pas nécessairement de l'argent et du temps gaspillé. Exemple: http://www.loc.gov/f...fe/rounder.html

(j'ai d'ailleurs dans ma collection un CD de Son House (du blues rustique) qui s'intitule "The complete library of congress sessions, 1941-1942" :) )


Et indépendamment d'une hypothétique rentabilité (qui n'est pas le but), ça ouvre quand-même (et surtout) pas mal de possibilités aux chercheurs de tous poils qui voudraient étudier quoi que ce soit allant de la culture américaine rurale à la crise iranienne...
Même lorque twitter n'existera plus.



edit:
Pour ceux que ça intéresse, sur le site de la library of congress, au moins dans la rubrique "Digital collections", on peut trouver un certain nombre de MP3s libres d'accès, d'intérêt divers (blues, gospel, musique amérindienne etc...)

(mais ça n'est évidemment pas une plateforme de téléchargement; faut être un minimum motivé et/ou savoir exactement ce que l'on recherche pour espérer y faire des trouvailles... Et ce sont rarement des enregistrements de qualité optimale)
"La douceur de la gloire est si grande, qu'à quelque objet qu'on l'attache, même à la mort, on l'aime."

"Il faut se connaître soi-même: quand cela ne servirait pas à trouver le vrai, cela au moins sert à régler sa vie, et il n'y a rien de plus juste"

"Nous courons sans soucis dans le précipice, après que nous avons mis quelque chose devant nous pour nous empêcher de le voir"

"J'aurais bien plus de peur de me tromper, et de trouver que la religion chrétienne soit vraie, que non pas de me tromper en la croyant vraie"

"Si on soumet tout à la raison, notre religion n'aura rien de mystérieux et de surnaturel. Si on choque les principes de la raison, notre religion sera absurde et ridicule"

"Comme la mode fait l'agrément, aussi fait-elle la justice"

"L'homme n'est ni ange ni bête, et le malheur veut que qui veut faire l'ange fait la bête"

"Si c'est un aveuglement surnaturel de vivre sans chercher ce qu'on est, c'en est un terrible de vivre mal, en croyant dieu"

[etc...]






(Pascal aurait-il pu twitter les plus courtes de ses pensées?)
Equilibre, le 15/04/2010 - 12:02
Ulf, le 15/04/2010 - 10:42
Ben voyons. Parce que la Bibliothèque du Congrès refusera bien entendu toute commission rogatoire ou investigation des autorités, hein.

Quand on lit l'inanité, la connerie insigne de ce qui transite majoritairement sur Twitter, on se dit que c'est encore de l'argent et de l'énergie bien employés, ça. Yeah.

Je ne suis pas d'accord avec vos propos. L'intérêt de twitter à ce niveau, au-delà de la pauvreté apparente d'un gazouilli de 140 caractères est l'intérêt que comporte l'analyse des message à tel moment ou sur une telle période et relative à un sujet donné.

C'est un petit peu figer une cartographie de l'intelligence collective et c'est en cela très intéressant pour des chercheurs (historiens, sociologues, anthropologues, économistes, sciences cognitives, ingénieurs et j'en passe...)

Ne pas se leurrer. ça n'est révélateur que de ce qui concerne les gens inscrits sur Twitter.

Exactement comme ceux qui se piquent de faire du zoning relatif au "bien-être" des populations à partir des mood Facebook. ça ne veut pratiquement rien dire, d'un point de vue scientifique.

Je pense (et j'espère) que l'intelligence collective, pour autant qu'on puisse la cartographier, dépasse ce que peuvent en dire des statistiques tirées de Facefuck ou Twitter...
jestheonlyone, le 15/04/2010 - 23:55
Ulf, le 15/04/2010 - 10:42
Ben voyons. Parce que la Bibliothèque du Congrès refusera bien entendu toute commission rogatoire ou investigation des autorités, hein.

Quand on lit l'inanité, la connerie insigne de ce qui transite majoritairement sur Twitter, on se dit que c'est encore de l'argent et de l'énergie bien employés, ça. Yeah.
Pour ton info, la bibliothèque nationale française fait déjà la même chose depuis belle lurette avec toutes les publications papier: le dépôt légal.
Même lorsqu'il s'agit de la gazette des chasseurs de galinette cendrée, de l'annuaire de la famille trucmuche, ou de toute autre "inanité ou connerie insigne".
Ce qui lui a permis d'acquérir à moindre frais un trésor inestimable.

Je le sais parfaitement.

La BnF essaie d'ailleurs de faire de même avec les logiciels, mais l'Etat est tellement largué sur ces questions qu'il n'a pas publié les décrets qui permettent de le faire.

Mais ça n'a rien à voir, il n'y a aucune comparaison possible entre le recensement des libvres écrits, des périodiques, des magazines, etc... et la comptabilisation de millions de petits messages de 140 caractères, dont la grande majorité relève de l'ordre du SMS creux...

jestheonlyone, le 15/04/2010 - 23:55

Quant à la "Library of congress", ça fait longtemps qu'elle ne se contente pas des publications papier. Et ça n'est pas nécessairement de l'argent et du temps gaspillé. Exemple: http://www.loc.gov/f...fe/rounder.html

(j'ai d'ailleurs dans ma collection un CD de Son House (du blues rustique) qui s'intitule "The complete library of congress sessions, 1941-1942" :) )


D'accord avec toi. Mais justement, ce que recense la Library a eu, jusqu'ici, des activités moins stériles, me semble-t-il. Les tweets, ça permet de saisir les vagues et contre-vagues médiatiques. Rien de très profondément sociologique, si tu veux mon avis. Bref, pas l'affaire du siècle.

jestheonlyone, le 15/04/2010 - 23:55

Et indépendamment d'une hypothétique rentabilité (qui n'est pas le but), ça ouvre quand-même (et surtout) pas mal de possibilités aux chercheurs de tous poils qui voudraient étudier quoi que ce soit allant de la culture américaine rurale à la crise iranienne...
Même lorque twitter n'existera plus.

edit:
Pour ceux que ça intéresse, sur le site de la library of congress, au moins dans la rubrique "Digital collections", on peut trouver un certain nombre de MP3s libres d'accès, d'intérêt divers (blues, gospel, musique amérindienne etc...)

(mais ça n'est évidemment pas une plateforme de téléchargement; faut être un minimum motivé et/ou savoir exactement ce que l'on recherche pour espérer y faire des trouvailles... Et ce sont rarement des enregistrements de qualité optimale)

Yes. Intéressant.

Je suis habitué d'Archive.org, mais toute source est bonne à prendre.
Ulf, le 16/04/2010 - 12:29
jestheonlyone, le 15/04/2010 - 23:55
Pour ceux que ça intéresse, sur le site de la library of congress, au moins dans la rubrique "Digital collections", on peut trouver un certain nombre de MP3s libres d'accès, d'intérêt divers (blues, gospel, musique amérindienne etc...)

(mais ça n'est évidemment pas une plateforme de téléchargement; faut être un minimum motivé et/ou savoir exactement ce que l'on recherche pour espérer y faire des trouvailles... Et ce sont rarement des enregistrements de qualité optimale)

Yes. Intéressant.

Je suis habitué d'Archive.org, mais toute source est bonne à prendre.
Intéressant, sans aucun doute... mais surtout pour les sociologues et compagnie...

Je précise quand même que même sur mon CD de Son House, acheté chez un disquaire (probablement introuvable à la fnac(*) & co), il y a un moment où en entend un train passer (ça a été enregistré là où il y avait l'electricité, à savoir: à proximité du chemin de fer :D )

(mais indépendament de ça, il y a 2 ou 3 bijoux, sur ce CD, pour ceux qui apprécient le genre :) )



(*) ceci dit, il m'est arrivé d'acheter "pire" à la fnac: un live de Howlin' wolf (du blues aussi) tout simplement inaudible (probablement un pirate enregistré parmi le public, avec les moyens de l'époque). Je me le suis fait rembourser... ("Ah oui, en effet", dixit un vendeur, après écoute de l'objet du délit :rire: )
Le décès de Michael Jackson, la mort d'Oussama Ben Laden, la catastrophe de Fukushima, l'amerrissage d'un Airbus A320 sur le fleuve américain de l'Hudson sont quelques exemples d'évènements qui ont été massivement commentés sur Twitter. De précieuses informations pourraient être tirées de ces commentaires à chaud.
PS : Michael Jackson n'es pas mort.
Le décès de Michael Jackson, la mort d'Oussama Ben Laden, la catastrophe de Fukushima, l'amerrissage d'un Airbus A320 sur le fleuve américain de l'Hudson sont quelques exemples d'évènements qui ont été massivement commentés sur Twitter. De précieuses informations pourraient être tirées de ces commentaires à chaud.
PS : Michael Jackson n'es pas mort.

Disons qu'il n'est pas au top de sa forme quoi lol
et pendant ce temps en France, on interdit de citer les mots twitter ou facebook à la télé (publique ou privé)

Va comprendre, Charles...
Ne pas se leurrer. ça n'est révélateur que de ce qui concerne les gens inscrits sur Twitter.
Mais bien entendu.
Tout comme quand les historiens nous expliquent l'état d'esprit de la population au temps de Jeanne d'Arc, ils se basent sur une toute petite poignée de textes écrits à cette époque et dans les 50 ans qui ont suivi.

C'est quand même la première fois qu'on a un échantillon en direct de ce qu'écrivent et pensent vraiment les gens. Ou du moins les gens inscrits sur Twitter. Mais c'est le rôle des historiens de prendre en compte ce biais et de le comparer à d'autres sources d'informations comme la presse par exemple ou les interventions des parlementaires.

et pendant ce temps en France, on interdit de citer les mots twitter ou facebook à la télé (publique ou privé)
Non on n'interdit pas de les citer. On interdit de faire de la publicité clandestine pour eux.

PS : Michael Jackson n'es pas mort.
Non, il joue à la belote avec Elvis Presley, Ben Laden et Khadafi

1
2
Télécharger
FrostWire
Gnutella - Clone de LimeWire
 
RSS Xpress
Lecteur RSS - Lecteur RSS gratuit
 
Hide Folders XP
Cryptage - Cacher et protéger des dossiers
 
Half-Life : Day of Defeat
Tir subjectif (FPS) - Mod pour Half-life sur la seconde guerre mondiale
 
Active GIF Creator
Animation - Création de GIF animés
 
Décembre 2011
 
Lu Ma Me Je Ve Sa Di
28 29 30 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8
Matoumba
EntrepreNantes
Numerama est un site du réseau PressTIC