Commentaires : La BNF va archiver le web français au titre du dépôt légal

bnf
dadvsi
dépôtlégal
Tags: #<Tag:0x00007f920a51e660> #<Tag:0x00007f920a51e4d0> #<Tag:0x00007f920a51e390>

#1
Cinq ans après la promulgation de la loi DADVSI qui l'a instauré dans son principe, le dépôt légal numérique a enfin son décret d'application, publié mercredi au Journal Officiel. La loi défendue par Renaud Donnedieu de Vabres avait en effet modifié le code du patrimoine pour étendre l'obligation du dépôt légal à toutes les personnes physiques ou morales qui "éditent ou produisent en vue de la communication au public par voie électronique (...) des signes, signaux, écrits, images, sons ou messages de toute nature". Mais faute de décret, la Bibliothèque Nationale de France (BNF) ne pouvait commencer son travail d'archivage du web, ce qui est désormais réglé.

Le décret n° 2011-1904 du 19 décembre 2011 dispose en effet que tous les services en ligne - quels que soient leur contenu ou leur mode d'accès - sont soumis à l'obligation de dépôt légal à la BNF, dès lors qu'ils utilisent un nom de domaine en .fr (ou autre géré par l'AFNIC), ou que ces sites sont "enregistrés par une personne domiciliée en France ou produits sur le territoire français". Seuls les services de télévision et de radio traditionnels y échappent, leur dépôt étant effectué auprès de l'INA.

Contrairement aux publications traditionnelles imprimées, l'éditeur n'a pas à effectuer lui-même le dépôt légal. Concrètement, la BNF pourra en effet collecter les contenus sur tous les sites internet français "au moins une fois par an",  par principe selon "des procédures automatiques", et sans que les éditeurs puissent s'y opposer. Elle utilise pour ce faire le robot Heritrix, publié sous licence libre par l'Internet Archive, qui fonctionne à la manière des crawlers des moteurs de recherche. 

Mais si le robot de la BNF ne peut pas accéder à certains contenus ou les télécharger, le décret prévoit (ce qui risque de faire bondir) que "l'éditeur doit, à la demande de la Bibliothèque nationale de France, lui fournir les mots de passe et les clés d'accès aux documents protégés nécessaires à sa collecte, ou lui remettre une copie de ces documents". Il doit aussi "fournir toutes les données techniques nécessaires à la communication et à la conservation à long terme des documents", ce qui interdit a priori tout DRM.

Sur son site internet, la Bibliothèque Nationale de France prévient déjà qu'elle ne peut pas tout archiver, et donc qu'elle "procède par échantillonnage, selon des critères visant à assurer la meilleure représentativité possible".

Une fois les contenus archivés, la BNF les met à la disposition des "chercheurs dûment accrédités" à travers une "consultation sur place", soit directement à la Bibliothèque nationale, soit "dans tout organisme habilité à mettre en œuvre cette consultation par arrêté du ministre chargé de la culture". Ces chercheurs devront utiliser des "postes individuels équipés d'interfaces d'accès, de recherche et de traitement fournies (par la BNF)".

Lire la suite


#2

Sans blague ? ^^


#3

Ce qui serait drôle, c’est que les réseaux P2P archivent la BNF.


#4

Cool, mes statuts Facebook vont être archivé ad vitam à la BNF :D


#5

[quote name='Captain44800' date='21/12/2011 - 13:55' timestamp='1324472117' post='1423576']Cool, mes statuts Facebook vont être archivé ad vitam à la BNF :D[/quote]

Non parce que Facebook n'est pas français <img src="/discussions/images/emoji/emoji_one/wink.png?v=3" title=":wink:" class="emoji" alt=":wink:"/>


#6

Non parce que Facebook n’est pas français ;)[/quote]
Je te cite :

tous les services en ligne - quels que soient leur contenu ou leur mode d’accès - sont soumis à l’obligation de dépôt légal à la BNF, dès lors qu’ils utilisent un NOM DE DOMAINE EN .FR (ou autre géré par l’AFNIC), OU que ces sites sont “enregistrés par une personne domiciliée en France ou produits sur le territoire français”.

Pour moi Facebook correspond à ces critères.


#7

facebook.fr redirige sur fr-fr.facebook.com si je ne m’abuse. donc non.


#8

Quelque chose me paraît quand même étrange, malgré le passage en gras :
[quote name='Guillaume Champeau' date='21/12/2011 - 13:44' timestamp='1324471467' post='1423571']
Mais si le robot de la BNF ne peut pas accéder à certains contenus ou les télécharger, le décret prévoit (ce qui risque de faire bondir) que "l'éditeur doit, à la demande de la Bibliothèque nationale de France, lui fournir les mots de passe et les clés d'accès aux documents protégés nécessaires à sa collecte, ou lui remettre une copie de ces documents". Il doit aussi "fournir toutes les données techniques nécessaires à la communication et à la conservation à long terme des documents", ce qui interdit a priori tout DRM.
[/quote]
Ça veut dire que la BNF peut demander l'accès à n'importe quel contenu protégé, du moment qu'elle considère que ce contenu est "nécessaire à sa collecte" ? D'ailleurs, comment elle sait que c'est nécessaire si elle n'y a pas accès ?
Parce qu'en lisant le texte sur légifrance, j'ai du mal à voir exactement où peut s'arrêter le pouvoir de "réquisition" de mot de passe de la BNF.
Si quelqu'un a la réponse...


#9

Quelqu’un connait les ips du crawler (c’est pour créer une règle iptables ;)) ?

Merci.


#10

Et la loi informatique et libertés ne s'applique pas ici ? S'ils archivent une page contenant nos infos on a pas un droit d'accès et suppression ?

EDIT


#11

Le web est déjà une bibliothèque mise a jour en permanence. A quoi bon archiver des sites qui ne seront plus d'actualité...
Et l'obligation de se déclarer quand on exploite un .fr vous ne trouvez pas ça choquant ? D'une part c'est pour fliquer les gens, d'autre part ca ne sert a rien si ce n'est rajouter des contraintes administratives. Il manque plus que les dépôts deviennent payant et là c'est la cerise sur le gateau.


#12

C'est quoi l'excuse pour mettre en place un tels système cette fois?

Scénario catastrophe:
Le web français devient centralisé par la BNF
Accédez uniquement à du contenu labellisé et approuvé par l'état
liliane-bettencourt.apoil.fr deviens le seul site de streaming pornographique autorisé.


#13

[quote name='croustibat' date='21/12/2011 - 14:09' timestamp='1324472985' post='1423585']facebook.fr redirige sur fr-fr.facebook.com si je ne m'abuse. donc non.[/quote]
Oui, facebook.fr redirige sur fr-fr.facebook.com mais ça n'empêche que Facebook "utilise un nom de domaine en .fr".
Ce n'est qu'un détail technique qui dépasse surement de très loin les compétences de ces gens là (des bibliothécaires améliorés).
Il y a plein de bonnes raisons de ne pas archiver Facebook (le bon sens, par exemple). Mais qu'on site utilise un nom de domaine par une redirection plutôt qu'en direct je ne vois pas ce que ça change.


#14

lol


#15

Archiver le web ? Ils sont conscients du nombre de péta-octets que ça représente rien qu’en France ?

Ils sont fous…


#16

non mais ça va se faire au cas par cas...si mes soupçons sont justes, c'est juste pour apporter une preuve légale "d'authenticité" et "d'antériorité" en cas de plainte/poursuite (un bousin administratif quoi).


#17

[quote name='croustibat' date='21/12/2011 - 14:09' timestamp='1324472985' post='1423585']facebook.fr redirige sur fr-fr.facebook.com si je ne m'abuse. donc non.[/quote]
Et alors ? Il utilise quand même un nom de domaine en .fr...


#18

Archiver le web ? Ils sont conscients du nombre de péta-octets que ça représente rien qu'en France ?

Ils sont fous...
ça pourra quand même être utile dans 1000 ans, on est bien content d'avoir des pétas-octets de choses qui ne servent pas à grand chose de nos jours dans nos archives, il faut bien aider les chercheurs de demain.


#19

[quote name='tass_' date='21/12/2011 - 15:06' timestamp='1324476388' post='1423624'][quote name='croustibat' date='21/12/2011 - 14:09' timestamp='1324472985' post='1423585']facebook.fr redirige sur fr-fr.facebook.com si je ne m'abuse. donc non.[/quote]
Et alors ? Il utilise quand même un nom de domaine en .fr...[/quote]
Et le contenu de ton compte est rédigé par toi même, donc "par une personne domiciliée en France ou produits sur le territoire français".


#20

Je n’ai pas eu le temps de relire la loi entière en version intégrée (avec la mise à jour des articles), ou j’ai peut-être raté quelque chose mais, pour l’application de cet article, quelle est la définition du “web français” ?

  • les sites en “.fr” ?
  • les sites mis en ligne par une personne française, morale ou physique ?
  • les sites hébergés sur des serveurs français ?
  • les site EN français ?
  • les sites créés / dirigés par des français partout dans le monde ?
  • ou quoi ?

Et qu’en est-il :

  • des sites typiquement français mais pas en .fr ?

  • d’un site .fr hébérgé hors de France ?

  • de l’article d’un français-personne morale ou p^hysique) publié en français sur un blog belge ? Et si le blog est américain ?

  • etc

Et, plus encore :

Sur un forum avec une section privée réservée à des personnes précises et protégée par mot de passe, cette section peut-elle être dévoiléee ? Ne sommes-nous pas dans un cas de correspondance privée ?

Dernière question : la BNF paie-t-elle la taxe copie privée sur les disque durs ? :stuck_out_tongue: (Bon, je sors…)