Une erreur dans le texte ?

C'est le bon endroit pour nous l'indiquer !
Attention, ce formulaire ne doit servir qu'à signaler une erreur. N'hésitez pas à utiliser la page de contact pour nous contacter ou nous faire part de vos suggestions. Merci.

Etape 1

Cliquez sur les paragraphes contenant des erreurs !

La BNF va archiver le web français au titre du dépôt légal

Un décret publié mercredi au Journal Officiel permet à la Bibliothèque Nationale de France de mettre en oeuvre le dépôt légal des publications numériques, prévu par la loi DADVSI de 2006. L'archivage du web français sera réalisé à travers un système automatisé de collecte des contenus publiés sur Internet, et au besoin par l'obligation faite à certains éditeurs de fournir eux-mêmes les contenus et les moyens de les lire.

Cinq ans après la promulgation de la loi DADVSI qui l'a instauré dans son principe, le dépôt légal numérique a enfin son décret d'application, publié mercredi au Journal OfficielLa loi défendue par Renaud Donnedieu de Vabres avait en effet modifié le code du patrimoine pour étendre l'obligation du dépôt légal à toutes les personnes physiques ou morales qui "éditent ou produisent en vue de la communication au public par voie électronique (...) des signes, signaux, écrits, images, sons ou messages de toute nature". Mais faute de décret, la Bibliothèque Nationale de France (BNF) ne pouvait commencer son travail d'archivage du web, ce qui est désormais réglé.

Le décret n° 2011-1904 du 19 décembre 2011 dispose en effet que tous les services en ligne - quels que soient leur contenu ou leur mode d'accès - sont soumis à l'obligation de dépôt légal à la BNF, dès lors qu'ils utilisent un nom de domaine en .fr (ou autre géré par l'AFNIC), ou que ces sites sont "enregistrés par une personne domiciliée en France ou produits sur le territoire français". Seuls les services de télévision et de radio traditionnels y échappent, leur dépôt étant effectué auprès de l'INA.

Contrairement aux publications traditionnelles imprimées, l'éditeur n'a pas à effectuer lui-même le dépôt légal. Concrètement, la BNF pourra en effet collecter les contenus sur tous les sites internet français "au moins une fois par an", par principe selon "des procédures automatiques", et sans que les éditeurs puissent s'y opposer. Elle utilise pour ce faire le robot Heritrix, publié sous licence libre par l'Internet Archive, qui fonctionne à la manière des crawlers des moteurs de recherche. 

Mais si le robot de la BNF ne peut pas accéder à certains contenus ou les télécharger, le décret prévoit (ce qui risque de faire bondir) que "l'éditeur doit, à la demande de la Bibliothèque nationale de France, lui fournir les mots de passe et les clés d'accès aux documents protégés nécessaires à sa collecte, ou lui remettre une copie de ces documents". Il doit aussi "fournir toutes les données techniques nécessaires à la communication et à la conservation à long terme des documents", ce qui interdit a priori tout DRM.

Sur son site internet, la Bibliothèque Nationale de France prévient déjà qu'elle ne peut pas tout archiver, et donc qu'elle "procède par échantillonnage, selon des critères visant à assurer la meilleure représentativité possible".

Une fois les contenus archivés, la BNF les met à la disposition des "chercheurs dûment accrédités" à travers une "consultation sur place", soit directement à la Bibliothèque nationale, soit "dans tout organisme habilité à mettre en œuvre cette consultation par arrêté du ministre chargé de la culture". Ces chercheurs devront utiliser des "postes individuels équipés d'interfaces d'accès, de recherche et de traitement fournies (par la BNF)".