Dans le cadre de sa mission d'observation, la Hadopi a confié au DREV (Département Recherche, Études et Veille) le soin d'analyser l'utilisation licite et illicite des œuvres sur Internet. Après avoir passé au crible les contenus hébergés par les sites de streaming vidéo (YouTube, Dailymotion), le DREV s'est intéressé aux fichiers présents sur les plateformes de téléchargement direct.
Observer le téléchargement direct à travers trois sites
En fait, seuls trois hébergeurs ont été passés en revue : 1Fichier, RapidGator et SpeedyShare. Les autres services ont tous été écartés de l'étude, dans la mesure où la méthodologie d'échantillonnage développée pour ce travail n'était pas utilisable sur tous les sites web. Regrettable, car certains d'entre eux sont au moins aussi populaires que les plateformes retenues par le DREV.
Dès lors, la photographie que cherche à obtenir le DREV du panorama du téléchargement direct risque d'être réduite en l'absence de BayFiles, CloudZer, Turbobit, Uploaded ou encore UpToBox. Qu'importe, les auteurs de l'étude indiquent que les trois services en question ont attiré "2,9 millions d'internautes français (soit 6 % des internautes français)" en juillet 2013. Ce qui est assez pour être pertinent, selon eux.
(répartition générale des fichiers sur les trois plateformes de téléchargement direct, selon leur nature)
La méthodologie
Pour élaborer ses statistiques, la Hadopi a appliqué une méthode très particulière que ne renieraient pas des hackers. Pour dégager un échantillon de 1200 fichiers par plateforme, elle a testé aléatoirement des liens sans savoir à l'avance s'ils étaient valides. Si le l'URL était valide, la Hadopi pouvait ensuite observer son contenu
Par exemple, pour 1Fichier, l'identifiant de chaque fichier est composé de 6 caractères alphanumériques, ce qui représente plus de 2,1 milliards de possibilités testables. Mais contactée, l'Hadopi n'a pas su nous dire dans l'immédiat combien de combinaisons ont effectivement été testées pour trouver les 1200 fichiers.
Selon le DREV, cette méthode évite deux écueils : d'abord, elle permet de prendre en compte les liens circulant dans le web profond et pas uniquement ceux visibles dans le web indexé. En outre, son caractère aléatoire évite une sélection de liens qui seraient plus populaires dans une classe d'internautes que dans une autre. Mais cette décision limite les perspectives d'analyse.
Comme l'indique le rapport, il n'est pas possible de commenter si le lien obtenu par la génération aléatoire est un contenu très populaire chez les internautes ou non. On peut le supposer pour certains fichiers, à partir de leurs métadonnées, mais par pour tous. En outre, il n'est pas possible d'en déduire les usages spécifiques aux internautes français, puisque certains liens dénichés peuvent concerner d'autres populations.
(qualification et quantification des logiciels sur 1Fichier)
Métadonnées et fichiers personnels
La mission de la Hadopi s'intéressant exclusivement à la sphère culturelle, tous les fichiers ne relevant pas de cette catégorie ont été regroupés dans une rubrique fourre-tout intitulée "autre". Contactée, la Hadopi précise que le protocole d'étude a été fixée en accord avec la CNIL. En cas de détection d'un fichier non culturel, il est simplement comptabilisé dans "autre". Il n'est pas téléchargé.
Plus généralement, l'étude s'est concentrée sur les métadonnées des fichiers (nom, taille…). Selon la Hadopi, cela permet de ne procéder à aucun téléchargement direct. Cependant, cela peut altérer sensiblement le résultat, dans la mesure où les métadonnées d'un fichier peuvent ne pas décrire fidèlement son contenu véritable.
(qualification et quantification des documents sur SpeedyShare)
Forte proportion de contenus appartenant aux ayants droit
Dans son étude, le DREV se garde de qualifier la nature des contenus entrant dans son champ d'analyse, même si la question du piratage se pose en filigrane au regard des constats faits. Ainsi, les auteurs constatent "la forte proportion de contenus issus des industries culturelles". Leur présence est-elle licite ? Le DREV ne dit rien. Mais les ayants droit ne passent pas par ces hébergeurs.
- Parmi les contenus vidéo de 1fichier.com (62 %) on trouve 24 % d'épisodes de séries complets et 7% de films complets. À cela s'ajoute 4% de parties d'épisodes de séries et 22 % de parties de films.
- Parmi les 21 % de contenus audio présents sur RapidGator, 75 % sont des albums complets.
- Parmi les 12 % de logiciels présents sur SpeedyShare, 21 % sont des jeux vidéo.
(qualification et quantification des fichiers sonores repérés sur SpeedyShare)
Une "spécialisation" poussée par les internautes
Le DREV constate par ailleurs que les plateformes de téléchargement direct n'ont pas toutes les mêmes finalités d'usage. Si chacune héberge de tout, il y a quand même une certaine spécialisation qui s'est opérée avec le temps. Et ce sont les usagers eux-mêmes qui en sont à l'origine, en choisissant plutôt de téléverser tel fichier dans tel service, plutôt que d'opter pour un concurrent.
"Les vidéos sont au contraires largement prédominantes sur RapidGator et 1fichier. […] Sur RapidGator par exemple, les vidéos pornographiques représentent près la moitié des contenus vidéos. Elles sont beaucoup moins représentées sur SpeedyShare. Les jeux vidéos sont beaucoup plus présents parmi les logiciels hébergés sur 1fichier que parmi ceux identifiés sur RapidGator", souligne le DREV.
(qualification et quantification des vidéos repérés sur 1Fichier)
Des fichiers qui ouvrent des questions
Dans sa conclusion, le DREV constate que "l'espace disque occupé par un fichier est lié à la fois à la bande passante nécessaire à son téléchargement, le cas échéant aux quotas fixés aux utilisateurs par les plateformes, et aux coûts de son hébergement C’est un élément déterminant de l’économie des plateformes de téléchargement".
Mais pas seulement. L'étude conduite par le DREV devrait vraisemblablement fournir des munitions aux partisans d'une "rémunération proportionnelle du partage", qui se concrétiserait par une taxe sur les intermédiaires commerciaux, et aux tenants de la ligne dure, avec à la clé des mesures coercitives diversifiées. Celles-ci devraient être précisées en 2014.
+ rapide, + pratique, + exclusif
Zéro publicité, fonctions avancées de lecture, articles résumés par l'I.A, contenus exclusifs et plus encore.
Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Abonnez-vous gratuitement à Artificielles, notre newsletter sur l’IA, conçue par des IA, vérifiée par Numerama !