Un premier outil libre et open-source pour Hadopi-Data

Guillaume Champeau - publié le Mercredi 05 Janvier 2011 à 15h55 - posté dans Société 2.0

Nous en avions rêvé, l'auteur du CMS Philum l'a fait. Lorsque nous avons mis en ligne le site Hadopi-Data.fr pour réunir les témoignages d'internautes ayant reçu un courrier de l'Hadopi, nous avions expliqué que toutes les données collectées étaient libres. "Nous proposons à ceux qui y trouvent intérêt de télécharger toute la base de données au format XML, pour présenter les données comme ils le souhaitent et réaliser des croisements statistiques", avions-nous écrit.

Notre appel a été entendu, puisqu'en attendant nos propres graphiques, que nous activerons lorsque nous estimerons avoir un échantillon statistique suffisamment fiable, vous pourrez voir sur cette page une première représentation graphique des données déjà compilées.

Nous attirons votre attention sur le fait qu'il s'agit de données entrées par les internautes anonymement, sans vérification possible de leur sincérité, et qu'elles ne sauraient donc être prises pour des données scientifiquement exactes. Seul un échantillon beaucoup plus important que les quelques 80 témoignages enregistrés à ce jour permettra de dresser les premières tendances.

Le script qui permet de traiter le fichier XML d'Hadopi-Data peut être téléchargé ici (.zip), sous licence GPL 3.0. Une version sera bientôt proposée qui prendra également en compte les dates de réception des avertissements, et de collecte de l'adresse IP.

Publié par Guillaume Champeau, le 5 Janvier 2011 à 15h55
 
 
19
Commentaires à propos de «Un premier outil libre et open-source pour Hadopi-Data»
 
Stats fai : à part free en tête, le reste correspond aux parts de marché. Les abonnées à free sont-ils majoritaires chez numérama ?
Stats support : film en tête
Stats département : les plus peuplés en premier... Stats sans grande valeur, surtout avec plus de départements que d'individus !
Free en tête, c'est logique.
Seuls les geeks ou assimilés ont eu connaissance de ce site et ils sont plus nombreux chez free que chez les autres opérateurs.
Enfin c'est l'explication que je vois.
Je voudrais bien participer mais je n'ai pas reçu de mail de l'HADOPI :X
Je vois que vous n'avez as prévu de case "séries" dans les téléchargements, seulement musique, films et jeux vidéos. J'ai pourtant l'impression que les séries font partie des contenus qui sont beaucoup téléchargées, pourquoi ce choix?
@captainkiller : j'ai pensé à ça aussi.
@Pititeflo : bah série => film.
Mais c'est vrai on aurait pu rajouter beaucoup plus de questions ça aurait été plus instructif.
papamacer, le 05/01/2011 - 16:25
Stats sans grande valeur

Guillaume, le 05/01/2011 - 15:55
Seul un échantillon beaucoup plus important que les quelques 80 témoignages enregistrés à ce jour permettra de dresser les premières tendances.

papamacer, le 05/01/2011 - 16:25
surtout avec plus de départements que d'individus
82 individus - 39 départements
il devat parler du rapport "individus sondés"/"départements existants"
sinon, en effet, le Freenaute moyen est 1. geek 2. pauvre, donc le profil classique du téléchargeur pirate. Il reçoit même un NAS avec 250Go pour lui faciliter le boulot avec la V6.
je viens d installer ubuntu je galere un peu desolè
-matubo-, le 05/01/2011 - 16:56
il devat parler du rapport "individus sondés"/"départements existants"
Ok donc on en revient à la taille de l'échantillon trop faible qui est déjà mentionnée dans la news, le but de cette dernière n'étant pas de nous annoncer les premières tendances mais de nous faire part de l'existence d'un outil open-source pour traiter les données du site Hadopi-Data.
golazwe : 100 départements, 82 individus, etc, etc...
et même avec 10000 individus, tu comptes voir quoi ? Un déterminisme géographique de la piraterie ? On n'apprendra rien.
date_collecteIP
2011 janvier 27

Y a que moi que ça choque? Y en a pas qu'une des bourdes du genre..
Cronycs, le 05/01/2011 - 17:16
date_collecteIP
2011 janvier 27

Y a que moi que ça choque? Y en a pas qu'une des bourdes du genre..

oui c'est pris en compte (mis à jour sur le download) il suffit d'isoler les dates ultérieures à la date du jour :
http://w41k.info/plu...pi_autonome.php

Merci à Guillaume
papamacer, le 05/01/2011 - 17:14
et même avec 10000 individus, tu comptes voir quoi ? Un déterminisme géographique de la piraterie ? On n'apprendra rien.
A la base Hadopi-Data.fr est censé être un élément de réponse à l'opacité qui entoure le fonctionnement d'Hadopi et s'assurer que les abonnés français sont traités de manière équitables donc indépendamment de leur FAI et de leur lieu géographique.

Or justement dans cet article, Numerama s'inquiétait qu'Hadopi ne concentre ses sanctions sur certains lieux plutôt que d'autres :

Au chapitre du "module d'exploitation et des statistiques", il est en effet prévu que l'Hadopi puisse extraire des données statistiques d'une grande précision, notamment... géographiques ! "Afin de faciliter l’extraction, une recherche multicritère permettant de filtrer les données sera prévue (ex. plaque ADSL, département, fournisseur d’accès, type d’oeuvre, nom de l’agent de la Haute Autorité, période du traitement, récidive O/N, …)", prévoit ainsi le cahier des charges.

On peut dès lors imaginer que les adresses IP des saisines seront géolocalisées, et que pour les besoins de son échantillonnage, l'Hadopi décide de concentrer ses sanctions, au hasard, sur les abonnés de Seine-Saint-Denis plutot que ceux de Neuilly-Sur-Seine.

Donc oui il est légitime de s'intéresser aussi à ce critère.
Ce serais bien d'inviter des députés de tout borts a visiter HADOPI-data est de leurs expliquer sont fonctionnement.
@golazwe : ok autant pour moi
softangel, le 05/01/2011 - 16:30
Je voudrais bien participer mais je n'ai pas reçu de mail de l'HADOPI :X
Tu sais ce qu'il te reste à faire pour tenter ta chance aux prochains tirages.
Pas de VPN , lancer la mule et téléchargé le dernier album de Christophe Maé ... ça doit augmenter les chances de participer au tirage.
HADOPI 100% des pardant on tentés leur chance. et oui c'est du qui perd gagne dans ce jeu*


*jeu d'argent en ligne non agréé par l'arjel.
Télécharger
Axalot
Sauvegarde - Sauvegardez facilement vos données en ligne
 
Kastor free audio extractor
Capture et enregistrement - Pour extraire les pistes audio de vos vidéos.
 
Everest Ultimate Edition
Diagnostic - Disséquez votre PC sans tournevis !
 
All Media Fixer
Divers - Outil de réparation de fichiers multimédia
 
Mozilla Thunderbird
Courrier email - Client mail de Mozilla
 
Janvier 2011
 
Lu Ma Me Je Ve Sa Di
27 28 29 30 31 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31 1 2 3 4 5 6
Matoumba
EntrepreNantes
Numerama est un site du réseau PressTIC