Comment sauver les URL raccourcies à long terme ?

Guillaume Champeau - publié le Lundi 16 Novembre 2009 à 15h19 - posté dans High-Tech

Stowe Boyd, le directeur de l'Internet Archive, a décidé de s'attaquer au problème des services d'URL raccourcies et de la pérennité des liens qu'ils administrent. 21 services, dont le leader Bit.ly, ont accepté de joindre l'initiative 301Works et de fournir régulièrement à Internet Archive une copie de leur base de données. Ils fournissent aussi des garanties visant à assurer la relève en cas de fermeture.


(CC joelogon)

Les services d'URL raccourcies comme Bit.ly ou le précurseur TinyURL prennent une place croissante sur Internet, en particulier sous l'avènement de Twitter et de Facebook. Ils étaient auparavant utilisés surtout pour éviter les URL tronquées par les anciens clients de messagerie électronique, et pour simplifier l'impression des URL en notes de bas de page dans les livres. Avec ses 140 caractères maximum par message, Twitter a cependant incité un grand nombre d'utilisateurs à employer aujourd'hui ce genre de services pour diffuser des adresses qui auraient été sinon trop longues pour un simple post. Ce sont ces URL raccourcies qui sont le plus souvent "buzzées".

Grâce à ces services, une adresse un peu trop longue comme "/comparer-les-prix/h/vaisselle" devient simplement "http://bit.ly/3f9hyx" L'efficacité est certaine. Mais ces services ne sont pas sans poser un grand nombre de problèmes dans la philosophie et la pérennité d'Internet. En principe, un lien hypertexte est résolu par le serveur DNS du fournisseur d'accès à Internet, qui renvoie le navigateur vers le serveur de l'éditeur de la page souhaitée. Tous les serveurs DNS des FAI dans le monde partagent la même base de données, automatiquement répliquée. Mais les services d'URL raccourcies ajoutent une couche supplémentaire entre le DNS du FAI et l'éditeur du site, et tous possèdent leur propre base de données unique. Ils agissent comme un DNS supplémentaire, propriétaire, sans la sécurité architecturale qui a préludé à l'invention du web.

S'ils tombent, les services d'URL raccourcies font tomber toutes les adresses qu'ils "hébergent". Il est déjà arrivé par le passé que des adresses deviennent inutilisables parce qu'elles ne respectaient pas les conditions d'utilisation du service, parce que la base de données a été effacée par erreur, ou tout simplement parce que le service a fermé faute de rentabilité. En juin dernier, Cli.gs, l'un des services les plus populaires, a été hacké. Plus de 2 millions d'adresses ont été redirigées vers un site tiers, révélant les risques de contournement à des fins de phishing ou à des fins publicitaires (notamment si un site décide de se vendre au plus offrant, qui pourra redirigier des millions d'adresses vers une page commerciale). 7 % des adresses hébergées n'avaient pas pu être restaurées, faute de sauvegarde assez récente.

Les services d'URL raccourcis posent donc de nombreux problèmes, que leur utilité ne doit pas masquer. Pour prendre ce problème à bras-le-corps, le directeur du célèbre Internet Archive a décidé de monter un groupe de travail baptisé 301Works, qui rassemble pour le moment 21 services d'URL autour d'une série d'engagements. On y trouve notamment Bit.ly, le leader, mais pas encore TinyURL.

Les membres du groupe 301Works acceptent de céder le contrôle de leur service de redirection en cas de cession d'activité. Internet Archive aura aussi la possibilité d'archiver au moins une fois par mois les bases de données des services, mais ne les communiquera au public qu'en cas de non respect des engagements sur une période d'au moins deux mois.

Les sites participants seront encouragés à utiliser un logo 301Works pour marquer leur adhésion à ces engagements.

Publié par Guillaume Champeau, le 16 Novembre 2009 à 15h19
 
 
22
Commentaires à propos de «Comment sauver les URL raccourcies à long terme ?»
 
Inscrit le 24/09/2003
958 messages publiés
Pour moi ce genre de services, ne sert pas a raccourcir une adresse uniquement (on n'est pas obligé de montrer l'adresse lorsqu'on écrit un lien), c'est surtout pour cacher au site cible, de quel site on vient.
Très utilisé dans les sites "illégaux"
Inscrit le 12/05/2009
888 messages publiés
MattCoalman, le 16/11/2009 - 15:29
Pour moi ce genre de services, ne sert pas a raccourcir une adresse uniquement (on n'est pas obligé de montrer l'adresse lorsqu'on écrit un lien), c'est surtout pour cacher au site cible, de quel site on vient.
Très utilisé dans les sites "illégaux"


Ah? T'est sur de ton coup là, parce qu'honnetement y a plein de site pirate qui s'embettent pas avec les tinyurl...
Inscrit le 25/01/2007
2899 messages publiés
MattCoalman, le 16/11/2009 - 15:29
Pour moi ce genre de services, ne sert pas a raccourcir une adresse uniquement (on n'est pas obligé de montrer l'adresse lorsqu'on écrit un lien), c'est surtout pour cacher au site cible, de quel site on vient.
Très utilisé dans les sites "illégaux"


c'est pas le site qui est illégal mais la pratique de la copie sauvage de fichiers protégés par un copyright.

c'est dommage que les hadopistes utilisent trop souvent les termes de sites illégaux, piratage ou p2p pour masquer leurs intentions néfastes de contrôle du web à des fins de censure...
Inscrit le 28/11/2008
3041 messages publiés
MattCoalman: faux, le referer est quand même envoyé.
Fais-toi plaisir: http://bit.ly/4nG89

Image IPB

En tout cas, bonne initiative ce "cache" d'url raccourcies.
[message édité par Arkados le 16/11/2009 à 16:00 ]
Inscrit le 02/03/2009
698 messages publiés
excellente initiative! on pourrait espérer plus solide et conceptuel pour l'avenir, à savoir un service 'tinyURL' dans le protocole DNS, mais au moins c'est pragmatique et rétroactif
[message édité par Zedd le 16/11/2009 à 16:13 ]
Inscrit le 24/09/2003
958 messages publiés
pleindeuss, le 16/11/2009 - 15:55
MattCoalman, le 16/11/2009 - 15:29
Pour moi ce genre de services, ne sert pas a raccourcir une adresse uniquement (on n'est pas obligé de montrer l'adresse lorsqu'on écrit un lien), c'est surtout pour cacher au site cible, de quel site on vient.
Très utilisé dans les sites "illégaux"


c'est pas le site qui est illégal mais la pratique de la copie sauvage de fichiers protégés par un copyright.

c'est dommage que les hadopistes utilisent trop souvent les termes de sites illégaux, piratage ou p2p pour masquer leurs intentions néfastes de contrôle du web à des fins de censure...

Blabla bla .... C'est pour ca que j'ai mis le mot entre guillements. Vous avez tous très bien compris ce que je voulais dire.
En tout cas, ca me fait rire te voir partir au quart de tour. Bizarre, tu n'as pas dis que je suis Sarkozyste.... Surement un oublie de ta part.
Inscrit le 24/09/2003
958 messages publiés
Arkados, le 16/11/2009 - 15:57
MattCoalman: faux, le referer est quand même envoyé.
Fais-toi plaisir: http://bit.ly/4nG89



En tout cas, bonne initiative ce "cache" d'url raccourcies.

Etonnant. Mais ca dépends peut-etre du site lui meme de d'URL raccourcies, non ?
Parceque sinon je ne vois pas trop l'interet de ce genre d'url raccourcies, parceque http://www.numerama....le/1/popularite,1012_12+couverts,1020_A est quand meme plus parlant que http://bit.ly/3f9hyx ....
[message édité par MattCoalman le 16/11/2009 à 16:21 ]
Inscrit le 25/01/2007
2899 messages publiés
MattCoalman, le 16/11/2009 - 16:15
pleindeuss, le 16/11/2009 - 15:55
MattCoalman, le 16/11/2009 - 15:29
Pour moi ce genre de services, ne sert pas a raccourcir une adresse uniquement (on n'est pas obligé de montrer l'adresse lorsqu'on écrit un lien), c'est surtout pour cacher au site cible, de quel site on vient.
Très utilisé dans les sites "illégaux"


c'est pas le site qui est illégal mais la pratique de la copie sauvage de fichiers protégés par un copyright.

c'est dommage que les hadopistes utilisent trop souvent les termes de sites illégaux, piratage ou p2p pour masquer leurs intentions néfastes de contrôle du web à des fins de censure...

Blabla bla .... C'est pour ca que j'ai mis le mot entre guillements. Vous avez tous très bien compris ce que je voulais dire.
En tout cas, ca me fait rire te voir partir au quart de tour. Bizarre, tu n'as pas dis que je suis Sarkozyste.... Surement un oublie de ta part.


bah comme quoi associer aussitôt les réducteurs de liens, les sites de ddl et le p2p au piratage et à l'illégalité vous fait passer aussi sec pour un hadopiste/réducteur des libertés individuelles. c'est la rançon de la gloire mon ami.
Inscrit le 28/11/2008
3041 messages publiés
(astuce pour le referer: copiez-collez le raccourci dans la barre d'adresse au lieu de cliquer dessus, ça enverra un referer vide et le webmaster ne saura pas d'où vous venez )

Techniquement, c'est une redirection PHP, donc côté serveur. Avec une redirection côté client comme javascript ou html (meta-refresh), le referer change. Là est la différence entre ces sites à raccourcis et des sites "proxy referer" qui dissimulent la provenance (par exemple Facebook, je suis incapable de dire qui a mis un lien sur son mur vers mon blog, le referer passant à chaque fois par www.facebook.com/home.php avec une redirection côté client)

Sinon oui c'est vrai que c'est pratique pour les sites qui font des permaliens à se tirer une balle, genre http://www.sitetrucm...nicolas-sarkozy,hadopi:loi-adoptée (la plupart des parseurs de liens échouent à la virgule, dont celui de Numerama ou Twitter, je le devine avant d'envoyer ce commentaire).

Edit: MattCoalman: pour avoir des liens moins longs d'où l'intérêt pour twitter.
Tiens, une url de redirection d'un résultat de recherche Google:
http://www.google.fr...JiXvymodELR2n6Q

Mignon, hein ;D
[message édité par Arkados le 16/11/2009 à 16:30 ]
Inscrit le 30/05/2008
258 messages publiés
L'un de mes futurs investissement : http://bit.ly/3f9hyx
Inscrit le 30/05/2008
258 messages publiés
L'un de mes futurs investissement : http://bit.ly/3f9hyx
Inscrit le 22/02/2005
2271 messages publiés
le problème de ces url c'est qu'on ne sait pas top ce qui se cache derrière...enfin je crois que y'a des site qui permettent de savoir qu'elle est la véritable url de la tiny url avant daller voir soi même ( au cas où c'est un site virusé)
Inscrit le 16/11/2009
1 messages publiés
mmmh! je ne suis pas certain que l'impact soit si grave que ca, certe les miniliens sont foireux si l'hebergeur tombe mais dans la plupart des cas ces adresses servent principalement aux réseaux sociaux et surtout twitter et facebook, de ce fait ils ont une pérénnités déja limité par le reseau social. Rare sont les liens qui servent encore 1 semaine après leur diffusions.
Cela reste effectivement un problème mais un problème qui reste relatif.
Inscrit le 28/11/2008
3041 messages publiés
notorious59: Pour Firefox, Adblock et NoScript forment une première ligne de défense et de confort.

Ensuite, quelques antivirus (je pense à AVG) "pré-visitent" les sites des liens et affichent une icone à côté du lien si c'est du bon.

Enfin et surtout, WOT pour Firefox met un écran on ne peut plus explicite si le site est dangereux quand on veut le visiter.

Possibilité: copier-coller l'url raccourcie et la chercher sur Google: si le lien est présent sur des messages de forums se ressemblant, il y a fort risque que ça soit un robot malveillant.

En cas de doute: voici outil pratique:
http://www.webrankin...tils/header.php

Taper l'url raccourcie et tu verras la réponse "location" vers où ça mène, sans y aller.
Exemple:
http://www.webrankin...//bit.ly/3f9hyx
Inscrit le 23/09/2009
2 messages publiés
À noter que plusieurs services ne participent pas encore à l'initiative 301Works, dont le Microsoft du genre: tinyurl.com, et mon petit préféré: is.gd.
Inscrit le 08/11/2008
3327 messages publiés
>>>"Parceque sinon je ne vois pas trop l'interet de ce genre d'url raccourcies"

Justement pour des messages style Tweeter, c'est expliqué dans l'article.
Inscrit le 23/09/2009
2 messages publiés
J'ai contacté par e-mail le responsable d'is.gd pour lui demander s'il comptait participer à l'initiative 301Works.

Il a exprimé quelques réserves:

· Il n'est pas très favorable à l'éventualité d'une contribution annuelle qui serait demandée aux participants (possibilité évoquée dans les pages de présentation du projet); le service is.gd est sans but lucratif et ne collecte pas de données statistiques.
· Il est également réservé sur le fait que des raisons autres que la fermeture d'un service pourraient entraîner la mise à disposition publique de sa base de liens; comme, par exemple, le fait de ne pas effectuer de mises à jour suffisamment régulièrement, ou de ne pas répondre diligemment aux courriers adressés par 301Works.
· Il souligne que, 301Works étant situé aux États-Unis, les informations qui seraient transmises à l'initiative seraient soumises aux lois américaines sur la protection des données, ce qu'il préférerait éviter, car is.gd est basé au Royaume-Uni, où la réglementation est sensiblement différente.

----

Ces observations sont intéressantes, et les craintes et réticences exprimées seraient sans doute partagées par d'autres prestataires de service, particulièrement hors des États-Unis.

L'initiative 301Works est une avancée prometteuse, mais la solution idéale aux problèmes des URL raccourcies (solution qui soit à la fois internationale, respectueuse de l'indépendance entrepreneuriale, et des exigences démocratiques) reste à trouver.
Inscrit le 16/11/2009
1 messages publiés
J'aimerais bien savoir qui est ce fameux Stowe Boyd directeur de Internet Archive, car je travaille a internet archive et je ne l'ai jamais vu ou meme entendu son nom.
Inscrit le 17/01/2006
3318 messages publiés
Apparamment c'est une erreur de traduction reprise à droite à gauche. Il semblerait que Stowe Boyd soit bien à l'origine du projet 301Works, mais ne soit pas le directeur d'Internet Archive. C'est juste que Internet Archive a accepté "d'héberger" le projet (apparamment pas au sens hébergement web, mais au sens où l'infrastructure et l'administration serait gérée par Internet Archive). Du moins c'est ce que j'ai compris de quelques minutes de fouilles sur le sujet.
Inscrit le 29/08/2004
107 messages publiés
On s'en fout un peu, non?
L'architecture des sites changent souvent et il n'est pas rare qu'un lien normal soit périmé après quelques années seulement.

Sinon le référent, ça se désactive avec Firefox.
Dans about:config
network.http.sendRefererHeader 0

Mais certains sites s'en servent. Mieux vaut utiliser une extensiom pour activer/désactiver à volonté.
Inscrit le 10/12/2008
1426 messages publiés
notorious59, le 16/11/2009 - 16:39
le problème de ces url c'est qu'on ne sait pas top ce qui se cache derrière...enfin je crois que y'a des site qui permettent de savoir qu'elle est la véritable url de la tiny url avant daller voir soi même ( au cas où c'est un site virusé)


Oui ce site par ex: http://longurl.org/
Il permet d'extraire l'URL sous-jacente et d'afficher une miniature de la page avec qqes infos.
Inscrit le 08/07/2010
1 messages publiés
Sinon tu peux avoir directement l'url d'origine avec certains site comme tinyurl via un lien spécifique.
Sur koowa.fr c'est pareil... Sur bit.ly j'ai pas tester.
Envoyer

Tous les champs doivent être remplis.

Tous les champs doivent être remplis.

Tous les champs doivent être remplis.

Télécharger
FileAnalyser
Diagnostic - Cataloguer et ordonner vos fichiers
 
SC Audio Converter
Encoder ou convertir - Conversion et enregistrement audio
 
RapidShare Leecher
Téléchargeurs et aspirateurs - Téléchargez facilement sur Rapidshare
 
AIMP
Lecteur audio et vidéo - Lecteur audio / enregistreur / convertisseur / éditeur de tag
 
RssReader
Lecteur RSS - Logiciel de lecture et d'affichage de flux RSS
 
Novembre 2009
 
Lu Ma Me Je Ve Sa Di
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 1 2 3 4 5 6
Matoumba
EntrepreNantes
Numerama est un site du réseau PressTIC