Exclusif : l'Hadopi ne collectera pas de preuve matérielle... pour l'instant

Guillaume Champeau - publié le Mercredi 27 Mai 2009 à 15h11 - posté dans Société 2.0

Selon une communication du ministère de la Culture dont Numerama a pu prendre connaissance, il n'est pas prévu pour le moment que l'Hadopi s'assure avant un avertissement ou une sanction qu'un téléchargement illégal a bien été réalisé depuis l'adresse IP de l'abonné suspecté. Mais le ministère s'attend à devoir renforcer ses preuves, et peut-être à stocker une partie de chaque fichier illégal téléchargé avec chaque saisine. Ce qui risque de faire tomber la riposte graduée dans un gouffre financier.

La semaine dernière, Numerama a révélé en exclusivité le contenu des clauses administrative particulières (CCAP) et des clauses techniques particulières (CCTP) qui fixent le premier cahier des charges de l'Hadopi pour la passation du marché public.

On apprenait alors que dans le schéma des processus généraux sous-tendant l'activité de l'HADOPI, une phase de "notarisation et d'échantillonnage" s'intercalait entre la phase de collecte de masse des adresses IP, réalisée en amont par les ayants droit, et la phase d'avertissement et de sanction, réalisée en aval par l'Hadopi (cliquez pour agrandir l'image) :

Comme nous l'avions expliqué, l'échantillonnage consiste à ne retenir que certaines des plaintes transmises à l'Hadopi, pour ne traiter que celles qui intéressent le plus l'administration. Nous avions ainsi découvert que l'Hadopi ne sanctionnera pas au hasard les abonnés à Internet, mais qu'un système d'algorithmes permettra de cibler en priorité les récidivistes potentiels, y compris peut-être d'après leur provenance géographique.

La phase de notarisation est tout aussi importante, voire plus encore. Selon le CCTP, elle "consiste à qualifier les données et enregistrer les éléments essentiels de la transaction chez un tiers de confiance", c'est-à-dire à enregistrer tous les éléments probants du téléchargement, ou plutôt de la mise à disposition d'un fichier protégé par le droit d'auteur. "Le contenu, l'origine, la date de réception, la clé d'identification de l'expéditeur et la destination du fichier constituent ces éléments essentiels", précisait le document. En cas de recours de l'abonné, ces éléments dupliqués sur des serveurs sécurisés devront constituer des preuves suffisantes, au risque d'annuler la procédure.

Mais elles ne seront pas suffisantes, et le ministère s'attend à être sanctionné sur ce point. Soit par le Conseil constitutionnel par une réserve d'interprétation, soit par la CNIL si elle renforce ses exigences lors de la révision des conditions de collecte des adresses IP d'internautes suspectés de téléchargement illégal.

En effet, Numerama a pu prendre connaissance d'une information complémentaire transmise par le ministère de la Culture à un candidat au marché public, qui s'interrogeait sur ce qu'il faut inclure dans le "contenu" à notariser. S'agit-il uniquement des éléments permettant d'identifier le contenu, ou du fichier illégal lui-même ?

"En principe", répond le ministère, "il s'agit seulement des éléments permettant d'identifier le contenu. Cependant, s'il s'avère que les nécessités de la procédure de recours rendaient obligatoire avec l'envoi de la saisine le transfert de "chunk" des fichiers téléchargés, il en serait fait mention dans le cahier des charges de réalisation du système cible".

Ce qui peut paraître un détail n'en est pas un. Selon toutes vraisemblances, les sociétés de collecte d'adresses IP employées par les ayants droit n'ont pas l'obligation d'initier le téléchargement d'un fichier illégal sur l'adresse IP repérée. Or l'on a vu par le passé qu'il est très facile d'injecter des adresses IP innocentes dans les réseaux P2P, et que le fait d'initier un téléchargement est le seul moyen de s'assurer de ne pas accuser à tort un abonné.

L'Hadopi ne laissant aucune place à la présomption d'innocence, il lui faut être sûre de la fiabilité des relevés d'adresses IP sur laquelle elle va baser ses avertissements et ses sanctions. D'où l'idée du ministère de prévoir, peut-être, si "les nécessités de la procédure de recours" l'exigent, l'obligation de joindre une partie du fichier mis à disposition par l'internaute (un "chunk") avec chaque saisine. En "notarisant" ce morceau de fichier, l'Hadopi garderait une preuve matérielle de l'infraction.

Au delà du problème juridique qu'une telle exigence risque de poser, le fait de télécharger et d'archiver systématiquement un "chunk" du fichier contrefait pose un problème pratique et économique certain. Selon les premières estimations de l'Hadopi, sans chunk, "le poids d'une saisine n'excède pas les 200 Ko". La collecte, également, reste peu coûteuse. Mais avec un chunk, la saisine va devenir obèse. Sur eDonkey/eMule, un chunk pèse en effet 9,5 Mo. C'est un coût de stockage considérable, avec l'objectif d'au moins 10.000 saisines traitées par jour. Mais c'est surtout un surcoût de collecte que ne pourront pas se permettre d'avoir les ayants droit, qui payent la facture de la délation des pirates.

L'impact d'une telle exigence sur le coût de la recherche des pirates serait donc "colossal", avait confié à Numerama l'expert Frédéric Aidouni, lui-même auteur d'un logiciel de collecte des adresse IP pour la gendarmerie. "Tout dépend du mode opératoire utilisé par les enquêteurs, mais de toutes les façons il convient de télécharger des contenus pour valider le constat d'infraction", prévenait-il. A défaut, il estime que les preuves ne sont pas suffisantes.

Par ailleurs, même les "éléments permettant d'identifier le contenu" dont se contente pour le moment le ministère semblent insuffisants.

Le CCTP précisait en effet que sur demande, les abonnés avertis ou sanctionnés par l'Hadopi pourront obtenir le nom des oeuvres téléchargées, leur nature (film, musique,..), la date du téléchargement, la taille des oeuvres, et les coordonnées de l'organisme d'ayants droit ayant saisi l'Hadopi. Mais il ne semble pas prévu de communiquer la signature numérique (le hash) du ou des fichiers contrefaits, qui est le seul élément technique permettant de s'assurer qu'un fichier contient bien le contenu suspecté. Il serait balo qu'un abonné soit sanctionné alors qu'il n'a téléchargé, par exemple, que la bande annonce d'un film.

Publié par Guillaume Champeau, le 27 Mai 2009 à 15h11
 
 
109
Commentaires à propos de «Exclusif : l'Hadopi ne collectera pas de preuve matérielle... pour l'instant»
 

1
2
3
4
5
6
>>>On a oublié la facture d'éléctricité et oui tout c'est DD pour enregistrer ces fameuses preuves cela va bouffer en ju. merci pour la planète monsieur le président du supermarché.

Oh ben oui. A 100 euros le disque de 1 To et à 11 centimes le prix du Kilowatt, c'est sûr que c'est ça qui va gréver le déficit de la France.

>>>car ça revient à dire qu'il faut télécharger tout ce qui est suspect, et ça commence a faire du débit.
Pourquoi tu veux télécharger "tout" ce qui est suspect ? Ils vont se concentrer sur des gros téléchargements.


>>>4TO par mois, environs 400€,
Ah bon ! Parce que tu penses que tous les mois, ils vont ajouter 4 To de disque. Les systèmes de stockage, ça te dit quelque chose ? Et est-ce que tu sais que les disques, on peut les réutiliser plusieurs fois ... dingue, non ? Quand une donnée est obsolète, on l'efface et on la remet.

Et puis qui te dit qu'il est besoin de garder le chunk dans son intégralité ? Tu n'as jamais remarqué que beaucoup de distribs Linux (ou autres téléchargement) sont parfaitement authentifiées par un code md5 (exemple : http://doc.ubuntu-fr...de_son_image_cd ) ?
Alors cette empreinte md5 que les linuxiens trouvent suffisant pour comparer un fichier téléchargé avec le fichier mis à disposition ne pourrait pas faire l'affaire pour vérifier la concordance de deux chunks ?

Si vous voulez vous battre contre Hadopi, trouvez des arguments sérieux, pas des trucs : oh ben ouh la la, 4 To de données, ...
'maxou1501', le 01/01/1970 - 01:00
Et les milliers de fake qui circulent comment ils vont prouver que je télécharge les bisounours si c'est un film de cul?

Si on innonde les réseaux p2p de fake imaginez le bordel que ca va créer!
C'est ce que j'allais dire =)


Suffit de reprendre l'argument d'Albanel :D
(qui, rappelons-le, était une n-ième vraie fausse étude des majors à l'époque de Dadvsi pour inciter les politiques à faire une loi)
selon Albanègre donc, qui après avoir fait "une expérience", dit-t-elle, 40 % des recherches sur les films pour enfants sont en fait des films pornos. J'oubliais, sur Edonkey qui est un protocol pirate bien sûr :rolleyes:
( http://www.dailymoti...-christine_news )

Ben il suffit de dire qu'on voulait télécharger une vidéo de cul amateur :biggrinthumb:
et qu'on est tombé sur un fake... un vrai film ^^


Plus sérieusement, sans parler des problèmes de coût évidents,
le chunk n'est évidemment pas non plus une preuve, déjà, il faut prouver que le chunk en question est bien celui d'une oeuvre copyrightée, donc stocker le hash du chunk, son numéro/position, ainsi que la liste de tous les autres chunks du fichier, leur position et leur hash respectif... Puis le hash du fichier pour vérifier que tout ça est bien concordant.

Et même avec tout ça, Rien ne prouve que le chunk a bien été envoyé par la personne mise en cause, et non un autre
ça serait facile... on balance la liste d'IP de 100 téléchargeurs présumés, en se basant juste les IP observées, puis on stock un seul chunk reçu...

Bref, sans confiscation du disque dur, stricte impossibilité d'avoir une preuve concrète.


@ enter : sensationnalisme qui doit te plaire, visiblement, vu que tu restes =)
Si je comprend bien c'est 9.5 Mo par fichier et donc par téléchargeur, ce qui fait 95 Go par jours pour les 10 000 saisines journalière soit presque 3 Téra par mois; et encore si on calcul sur la base de "10 000 avertissements + 3 000 lettres recommander + 1 000 déconnexions quotidienne" on arrive à 133 GO/jour et quasiment 4 Téra/mois!!!

Franchement, 4 To/mois, la belle affaire. Le To coûte aujourd'hui moins de 100€. Vu les sommes déjà mises en jeu par l'HADOPI, c'est une paille.


Putain c'est beau les gens qui n'ont aucune idee des realites.
Alors, histoire de, le stockage n'a pas "tout a fait" le meme cout pour un particulier et pour une entreprise, ensuite quand tu dois garantir l'integrite, et la perenite des donnees ca coute encore plus cher, ensuite cela implique des locaux plus grand, ensuite cela implique les machines pour faire tourner le stockage en question, et a partir d'un certain moment, quand tu as suffisemment de disques differents, tu as statistiquement un certain nombre de pannes/an qu'il faut gerer, remplacer, et surtout avoir l'infrastructure pour gerer.

Il y a une ENORME difference entre un branleur de 18-25 ans qui stocke 2/3/4/5To de series, films de culs, films chez lui en n'y accedant presque pas, et sans aucune obligation de perenite ni de garantie d'integrite, et la meme chose quand c'est des centaines de Tera annuels a gerer, avec une obligation de conservation de plusieurs annees (oui parce qu'au minimum c'est jusqu'a la fin de la procedure et de la suspension), le tout accessible et avec tout ce que ca implique derriere (y compris les gens a payer pour s'en servir, et les couts energetiques et organisationnels...).

C'est d'ailleurs pour ca qu'il y a un tel marche du stockage et de la virtualisation de celui ci a l'heure actuelle, c'est parce que, contrairement a ce que les neophytes kikoolol pensent, il y a de vraies contraintes a cette echelle....
Pas “balo” mais ”ballot” :-)
Le calcul sur un chunk de 9.5 Mo est érroné.
Je comprend que Ratiatum, pardon Numerama, cherche à dévaloriser la démarche du gouvernement sur cette affaire, mais si on veut etre réaliste il faut noter :

- Sur Bittorent, les chunks sont souvent de 500 Ko seulement, meme si on en trouve de 2 Mo (peut-être plus, je ne suis pas un gros téléchargeur)

- Sur eMule, selon mes observations, si un "chunk" fait 9.28 Mo celui-ci est divisé en "sub-chunks". Si un chunk est identifié avec un hash unique et permet de vérifié qu'il n'y a pas d'erreur de téléchargement, le téléchargement chez un uploadeur se fait par "sub-chunk" de quelques centaines de ko (180 ko ?). Je suppose que le Hash du fichier + hash du Chunk + bits du sub-chunk en provenance de l'accusé suffit à prouver que ce fichier était bien partagé par l'accusé. => cela réduit sensiblement l'espace de stockage nécessaire.

De plus comme le signale Brio, vu le prix des disque dur actuel, même 4 To / mois n'est pas vraiment important, même avec redondance.
Après avoir lu les 3 pages de commentaires que j'ai loupé la première fois j'ajoute :

- Le SCSI es très cher, mais il n'est nécessaire que lorsque l'on doit accéder souvent aux données. Pour simplement du stockage long terme, il existe des solutions plus économiques, non seulement les disques Sata, mais aussi les bandes (actuellement 800 Go à partir de 50€)....

- Hadopi n'a besoin que de stocker les preuves;
4To / mois = 14 Mbps. Ce n'est pas négligeable, mais pas démentiel non plus.
Pour la bande passante de recherche, c'est le problème des ayant droit. Comme ils sont nombreux, et que c'est eux qui sont demandeurs, ce n'est pas un problème.

- "Ben il suffit de dire qu'on voulait télécharger une vidéo de cul amateur
et qu'on est tombé sur un fake... un vrai film ^^"
Sans rire, avec un Vin Diesel qui fait un des films xXx...

- Pour ce qui est de la validité de la preuve du téléchargement d'un Chunk, ou de n'importe quelle preuve, il vient toujours un moment ou c'est ta parole contre la mienne. Si un huissier peut affirmer que le relevé des chunks Ip est fait de manière fiable, est-il possible de le remettre en cause ?
@enter : certes mais on pousse le resainnement en ironisant, si ce type d'infrastructure est retenue apres nous avoir fait le cout du grenelle de l'environnement faire tourner des fermes de serveurs et des clims et tout ce qui va avec, c'est montrer comment le gouvernement fait peu de cas de notre ecosysteme et prefere maintenir sous perfusion une industrie du disque (attention j'ai bien dit disque) moribonde.

PS: ah oui toi qui veut qu'on soit si precis, le bon tarif du kW pour les pro en version de base en heure pleine est de 8.03 centimes et 4.72 centimes (hors abonnement). Il y a bien un abonnement a 9.89 mais bon 3kVA pour la ferme ca me parait juste.
@enter toujours: j'ai oublié de citer ma source http://www.edfpro.fr...bleu-99258.html
@enter ...
Le stockage a des fins pro est en effet totalement different de celui des particuliers, comme certain l'ont deja expliqué ...
1-les baies de stockages sont en raid 5 ou (1.0), ce qui multiplie par 4 o moins ou plus (suivant solution) le nbre de Terra necessaire
2-il faut egalement inclure le cout de l'infrastructure (serveur /reseau /securité ...)
3-le stockage doit avoir une redondance ! (donc o moins 2 sites distants)
4-il faut coster egalement le cout de verification de l'integrité des datas et de synchronisation entre les sites
5-en général, on procede egalement a un "archivage" sur support externalisable, ce qui a un cout egalement

En conclusion, une solution de stockage pro (type gde entreprise) est extremement couteuse !!!!
Actuellement, de gdes entreprises "louent" le stockage au Go !!!! Cela t'aidera surement a entrevoir le cout réel de ces solutions ...
Pour ce qui est de la validité de la preuve du téléchargement d'un Chunk, ou de n'importe quelle preuve, il vient toujours un moment ou c'est ta parole contre la mienne. Si un huissier peut affirmer que le relevé des chunks Ip est fait de manière fiable, est-il possible de le remettre en cause ?

Le truc c'est la fiabilité de la preuve, vu les sanctions encourues je suis désolé mais c'est grave. C'est comme être dans une foule, se taper une tomate dans la nuque, pis tu te retourne et y a 10 personnes derrières toi... Hop délit de faciès, t'en prends un au pif.

Tout comme on ne condamne pas une personne pour meurtre juste parce qu'on retrouve du sang dans son salon... Il faut qu'un laboratoire agrégé démontre que c'est bien le même sang que celui de la victime...

Pour rappel ce sont les ayant-droits qui cherchent et font chercher ces "preuves", pas l'Hadopi. donc personne d'assermenté là dedans.
C'est vrai que si Numerama ne fait pas dans le sensationnalisme, le site perd un peu de son attractivité critique.

Déjà vu, les disques rayées c'est pas top.

Et même si il s'agit d'un prototype, ça soulève bien les problèmes auxquels ils sont confrontés, et on voit clairement le mur dans lequel il vont.


@Enter : Le stockage des données est un enjeu majeure de notre époque, le sous estimer est une grave erreur, je ne vais pas répéter ce que quelqu'un a dit dans un post au dessus mais c'est vrai (Raid 5, ...).
Si je comprend bien c'est 9.5 Mo par fichier et donc par téléchargeur, ce qui fait 95 Go par jours pour les 10 000 saisines journalière soit presque 3 Téra par mois; et encore si on calcul sur la base de "10 000 avertissements + 3 000 lettres recommander + 1 000 déconnexions quotidienne" on arrive à 133 GO/jour et quasiment 4 Téra/mois!!!
Il ne faut pas oublier que HADOPI a ete pondu par des gens ne connaissant rien à l'Internet ..... Mais bon je ne desespere pas de les voir realiser l'enormite de leur betise devant l'enorme enormite des chiffres

la france est gouvernée par des gens qui ne comprennent rien à la démocratie et au principe républicain...

alors internet penses tu... ils s'en contrefichent
Vous avez vraiment l'air d'avoir aucun sens des réalités, OK vos prix vont de 400€ à 150 000€ et même si c'est le prix le plus élevé, objectivement c'est peanuts pour le gouvernement... Donc j'aimerais que l'on m'explique où est le gouffre financier. On parle d'un gouvernement...
>>>Numerama a révélé en exclusivité le contenu des clauses administrative particulières (CCAP) et des clauses techniques particulières (CCTP) qui fixent le premier cahier des charges de l'Hadopi pour la passation du marché public. Acquisition d'un prototype de gestion de la mission de protection des oeuvres et objets auxquels est attaché un droit d'auteur ou un droit voisinC'est dingue cette propension à absolument vouloir ne pas savoir lire.

C'est dingue cette propension à absolument vouloir NE PAS LIRE !
C'est marqué en noir et blanc dans les CCAP et/ou CCTP (vérifie) que le prototype sera la base du système définitif, qui ne fera qu'ajouter des couches supplémentaires de fonctionnalités.
Pour info, actuellement, chez un gd nom de l'infogerance, le prix du stockage est, en moyenne, de 1€ le Go/mois ...
soit, hypothese basse 4To x4 X 2 = 32 To soit au bas mot 32 000 € les 4 premiers To /mois, plus la retention des datas sur 6 mois, on aurait schematiquement, 64 000 € le second mois, 128 000 € le 3eme, 256 000 le 4 eme, etc ! cout financier non négligeable tout de même et surtout non budgeté !
Donc, le 6eme mois on arriverait a environs 1 million d'Euros le stockage /mois, prix, qui si on applique juste la rétention de 6 mois, ne devrait plus varier ensuite ... soit sur la 1ere année a peu pret 7,5 millions d'euros, et 12 millions pour les années suivantes ...
Bah remarque c'est pas grand chose pour l'Etat mais bon quand même, on a de l'argent a dépensé autre part je pense.
>>>En conclusion, une solution de stockage pro (type gde entreprise) est extremement couteuse !!!!
Bla bla bla ! Dans toutes les infrastructures informatiques, les postes sont par ordre de coût décroissant : 1) le personnel 2) les frais annexes 3) le logiciel 4) le matériel.

Le coût des disques durs, qu'il soit de 100, 1000 ou 10000 euros, c'est du peanuts. Surtout si on stocke, comme je l'ai indiqué uniquement les empreintes md5 (ce qui est largement suffisant pour s'assurer de la concordance de deux fichiers).

>>>C'est marqué en noir et blanc dans les CCAP et/ou CCTP (vérifie) que le prototype sera la base du système définitif,
Eh bien voila ! LA BASE, pas le système. Tu fais la différence entre les fondations d'une maison et la maison. C'est exactement la définition d'un prototype (à ne pas confondre avec maquette, ce qui est encore différent). Mais parfois, après avoir fait la base, on s'aperçoit que le système qu'on va construire dessus est bancal et on envisage un autre prototype.

Quand les mecs de Renault font un prototype de moteur, ce n'est pas ce proto qui sera mis en place dans les voitures. C'est juste un moteur chargé d'étudier et de mettre au point tel ou tel aspect. Il y a d'ailleurs des protos qui partent à la poubelle parce qu'ils montrent une impossibilité technique.

Bien sûr que quand on spécifie un prototype, c'est pour servir de base à quelque chose de plus complet. Mais ce n'est pas inéluctable non plus. Si le proto ne fonctionne pas ou montre des problèmes, on le fait évoluer ou on le fout aux oubliettes. Ne soit pas si primaire : "ils ont dit que le proto serait la base, donc ce sera obligatoirement la base". Fais la différence entre un souhait (c'est un proto, pas une maquette exploratoire) et une obligation.

Donc maintenant que tu as reconnu que le cahier des charges parle uniquement du prototype, tu vas peut-être arrêter d'entretenir la confusion entre le prototype du système d'Hadopi et le système Hadopi ?
Pour tout ceux qui ne disent que ce n'est pas grand chose même pour un gouvernement, il faut se rappeler qu'un budget n'est pas extensible à l'infini et qu'ici on ne parle pas de cout fixes mais de couts qui vont aller croissants les mois passant. Et quand tu ne l'as pas budgeté dès le début, tu pars droit dans le mur..

Et enter juste pour information, le md5 n'est plus considéré comme fiable aujourd'hui, alors autant choisir une autre techno.
Oui les histoires de prototype et tout ça tout ça je veux bien, n'empêche qu'ils espèrent l'appliquer bientôt, donc je les vois mal faire une étude de plusieurs années maintenant pour voir si ça va aller ou pas ce qui est le cas quand on fait de "VRAI" prototype. (CQFD).

Pour ce qui est du MD5 il n'est en effet plus sur, ils expliquent pourquoi sur Wikipédia (je ne link pas car personnellement je n'ai rien compris :o)

1
2
3
4
5
6
Télécharger
IrfanView
Albums et visionneuses - Visualiseur d'images performant et gratuit
 
VueMinder Lite
Organiseur - Le calendrier qu'il vous faut.
 
Okozo Desktop
Optimisation - Mettez un fond d'écran dynamique sur votre bureau Windows
 
StarLine Messenger
Communication - Messagerie instantanée universelle / client IRC
 
Mai 2009
 
Lu Ma Me Je Ve Sa Di
27 28 29 30 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
1 2 3 4 5 6 7
Matoumba
EntrepreNantes
Numerama est un site du réseau PressTIC