Weboob banni de Debian

sexisme
linux
debian
Tags: #<Tag:0x00007f9218b0e800> #<Tag:0x00007f9218b0e6c0> #<Tag:0x00007f9218b0e580>

#1

Weboob accusé de sexisme a été banni de Debian

Weboob est un logiciel libre qui permet d’utiliser des services Web sans utiliser un navigateur Web. Techniquement le logiciel envoie des requêtes HTTP auprès des services concernés, puis extrait l’information avec des analyseurs (parsers et scrapers en anglais) afin d’en restitué son contenu sous une autre forme (ligne de commande, interface graphique). C’est en quelque sorte une interface de programmation (API) que des logiciels peuvent utiliser pour interagir avec des services web comme une banque par exemple.

Jusque là rien d’extraordinaire me direz vous. Sauf que le nom de ce logiciel fait polémique, pour vous situer le contexte voici apparemment comment le nom a été choisi d’après ce commentaire sur Linuxfr.org.

--- Day changed Sat Feb 13 2010
...
13:02  > bon donc il nous faut un nouveau nom
13:02  > enfin, un nom
13:09  pankkake> grob
13:09  pankkake> Get Rid of Browsers
13:10  pankkake> bad (Browsers are Doomed)
13:11  > grob, ça me plait
13:12  pankkake> et en tout cas y a pas de paquet nommé « grob » sous gentoo
13:12  > idem debian
13:13  > ou woob (Web Out Of the Browser)
13:13  > (variante de ton wootb, en mieux)
13:14  > http://www.urbandictionary.com/define.php?term=woob
13:14  pingouine> [Link Info] title: Urban Dictionary: woob
13:14  pankkake> sauf que éliminer of et pas the, c’est pas logique
13:14  pankkake> bon on peut dire que « out of » c’est un vrai mot
13:14  > Web Out Of Browsers, ça se dit pas ?
13:14  pankkake> si
13:14  > bah voilà
13:15  > et woob ça te plait comme mot ?
13:15  pankkake> ouais, c’est rigolo
13:15  > ça va être dur par contre de grimper dans google
13:16  > bon moi woob ça me plait, on part là dessus ?
13:16  > à moins que tu aies d'autres suggestions
13:16  pankkake> non, j’en ai pas
13:17  > ça fait juste chier que le mot existe, en fait :)
...
17:25  > warning
17:26  > il y a déjà un projet nommé woob
17:26  > (plus ou moins)
17:26  > https://www.ohloh.net/p/wooboard
17:26  pingouine> [Link Info] title: wooB
17:27  > bon on va dire que c'est pas grav
17:27  > e
17:29  > hmm, ça peut être weboob (WEB Out Of Browsers)
17:29  > pankkake: t'en penses uqoi ?
17:31  > ook: pareil
17:31  > (même si tu t'en cognes)
17:39  pankkake> pas mal, y a boob dedans :)

Étant donné que je n’ai pas réussi à trouver les logs d’origine de cette conversation, l’information reste à prendre avec des pincettes.

Il n’empêche que cette polémique a été suffisamment grande pour qu’un ticket soit ouvert auprès des équipes de Debian:

D’autres problèmes similaires ont été remontés sur la plateforme Gitlab du projet:

Les équipes anti harcèlement de Debian ont jugés que ces problèmes étaient contraire au code de bonne conduite et par conséquent le paquet weboob a été supprimé des dépôts de la version testing. Les développeurs de Debian n’ont finalement pas fait un fork du projet comme il l’avait déjà fait avec Firefox (pour un problème de droit sur le logo).

Une triste histoire de sexisme dans le milieu du logiciel libre.

Sources:


#2

Une triste histoire de “mise à l’écart” surtout, pas très “debian / linux” comme pratique…


#3

Je crois que le mainteneur s’en tape le coquillard.

http://laurent.bachelier.name/2013/12/weboob-the-asshole-detector/


#4

C’est ce qui a fait débat dans les commentaires sur linuxfr.org: Qu’est ce qui n’est pas très “debian / linux” ?

  • Le fait que des minorités se sentent mal à l’aise à cause de remarques sexistes dans un logiciel ?
  • Le fait qu’un logiciel libre a été supprimé des dépôts officiels ?

Je pense que ce débat est similaire au débat de liberté totale d’expression vs les droits des minorités, je préfère personnellement défendre le droit des minorités, mais dans ce cas particulier je suis partagée car l’utilisateur final est pénalisé.


#5

Je pense que l’erreur c’est justement d’opposer les 2 Alors qu’ils vont ensemble:

Limiter la liberté d’expression, c’est également bafouer les droits des minorités (et de la même façon, défendre les droits des minorités, c’est défendre la liberté d’expression)


#6

Je ne suis pas d’accord.
De quelles minorités tu parles ?
Quand je disais minorités je parlais des minorités qui subissent des discriminations sur leur couleur de peau, leur genre, leur orientation sexuelle, je ne parle pas de l’extrême droite qui se plaint à longueur de journée “on ne peut plus rien dire !”
Je pense qu’il est tout à fait acceptable à ce qu’une communauté ou un État pose des limites sur les discours haineux et discriminants. Je ne pense pas qu’il soit souhaitable de vivre dans un monde où on peut se faire insulter harceler avec des menaces de mort et de viol à longueur de journée, où des néo-nazis peuvent en toute tranquillité monter des milices prête à la guerre civile.


#7

De toutes.

Je suis pour une liberté d’expression.totale.

A partir du moment où on estime que l’état peut poser des limite sur les discours “haineux”, alors c’est pas l’extreme droite que tu interdis, c’est tout ce qui n’est pas politiquement correct pour l’état.

Hors dans une démocratie, la possibilité pour absolument tout le monde de s’exprimer est indisepnsable.

Sans liberté d’expression sur le non politiquement correct, les minorités sur la couleur de peau, leur genre, leur orientation sexuelle, que tu veux défendre, bah ils pourraient pas s’exprimer, car justement, c’est “pas correct”

Liberté d’expression ne veut pas dire liberté d’action.

Dans toute société, s’en prendre physiquement à des membres de cette société est en principe une des choses les plus graves qui soit.


#8

J’ai envie de parler du produit et non de la polémique.

C’est un agent web en ligne de commande et il joue un rôle qu’on a toujours pressenti lors de la création du www mais dont l’usage ne s’est jamais développé.

Le web n’est pas qu’une collection de pages de lectures. C’est aussi une base de données plus ou moins structurée.

Le tarif de la société machin, la température des villes en France, les petites annonces immobilières, les horaires de la SNCF peuvent s’afficher dans une soupe de HTML avec des machins qui gigotent. Il peuvent aussi être servi sous forme de XML dont votre agent fera une exploitation, tri, comparaison, suivi, graphiques, etc.

C’est la première option qui domine. On a complètement oublié la seconde et c’est très dommageable pour le web qui aurait pu être un outil beaucoup plus moderne, plus puissant qu’une collection de pages à lire. L’informatique c’est l’automation. C’est un truc inventé par des feignants pour faire faire le boulot aux machines. Alors si c’est pour se coltiner des pages de lecture, c’est pas la peine.

Malgré une somme de travail monumentale depuis HTML 1.0, les navigateurs web sont toujours idiots. Incroyable !

Un simple script pourrait interroger 100 vendeurs et vous retourner prix et dispos. Vous auriez les horaires du train pour Pau pour tous les jours de la semaine et du mois sous forme de tableau. Et les locations de vacances à Bandol pour la semaine du 8 au 14, tout ça sans vous coltiner 120 pages pleines de sirènes et gyrophares.

Comme les assistants “intelligents”, Weboob - je suppose - va tenter de restructurer l’information dégradée en scrutant la soupe de HTML, à grand renfort d’heuristiques et de divination. Un processus toujours risqué et voué à se planter lorsque le site change la recette de la soupe. (La vitesse de l’USB3 est de 480 MB/s, oups, j’avais pas vu la virgule. Exemple réel).

On va dire poliment que c’est mieux que rien.

Je n’ai rien téléchargé, parce que je sais que c’est un pis-aller pour les raisons ci-dessus. Je me suis contenté d’aller voir Traveloob (oui, ils persistent) , me souvenant de la déculottée phénoménale qu’avait administrée le site de la Deutsche Bahn à celui de la SNCF en sortant les horaires du train pour Pau en ASCII en 0.25s. Et ma foi, 20 ans après, on arrive à peu près au même résultat :

http://weboob.org/applications/traveloob

De l’information, pas du blabla.

Passez outre la polémique et donnez leur chance aux agents web.


#9

J’ai rarement lu des bêtises aussi énormes: en quoi les navigateurs webs sont idiots ? Toi tu veux un navigateur web qui fassent des scripts ou je ne sais pas quoi, OK très bien, mais ce n’est pas ce pourquoi le navigateur web existe. Je t’explique:
Un navigateur web, il est là pour récupérer une page web, et l’afficher correctement. Il va gérer correctement les cookies et autres specs afin d’optimiser la navigation, et voilà.
Tous le reste, ce sont des programmes qui se greffent sur le navigateur.

Alors dit que nos navigateurs web sont idiots lol: je te regarde volontiers développer ton propre navigateur :’)

À propos de tes scripts pour interroger 100 vendeurs là, enfait tu es entrain de râler parce que tu voudrais que ton navigateur récupère des données pour toi, et les affiche comme tu veux. oh wait: tu connais les API ?
Si les API existent en face des pages web, ce n’est pas pour rien, non ?


#10

Ca fait des années que dev_tty croit y connaître quelque chose au web, mais post après post on voit qu’il est aussi nul là dedans que dans ses relations avec les femmes.


#11

Précisément parce que

et que la PAO c’est mignon, mais le web est capable de bien plus que ça.

Tu connais la notion de user agent ?


#12

On voit bien que tu n’y connais rien mon pauvre… comment veux tu faire ça ? On t’écoute.


#13

Tu connais les extension des navigateurs ?


#14

What?! C’est quoi le rapport ? :joy::joy::joy::joy::joy::joy:
Si tu penses qu’un site devrait afficher son contenu sous forme de beaux tableaux comme tu voudrais suivant ton User-Agent, tu te fourres ton doigt (que dis-je, ta main) dans l’œil.

Précise toi: tu dis qu’ils sont idiots parce qu’ils ne font pas ce que toi tu veux. Absurde ? lol

error: use of undeclared identifier ‘le web’
C’est quoi le web ? Non parce qu’il existe le protocole HTTP, voilà tout le monde le connait, sinon le web c’est basiquement HTML avec CSS et (malheureusement) JS. Le reste c’est de la construction par dessus le web.
Tu vois la différence ?
C’est comme si tu disais que la Twingo de Renault était une voiture idiote car elle ne sait pas se garer toute seule, ou parce qu’elle n’a pas les néons multicolores que tu aimes.

Btw, je ne connais pas la PAO, j’ai un peu regardé, et tu me parles du truc que lorsque tu souhaites imprimer une page, ça t’affiche la page rendue dans une feuille A4 ou quoi ? Encore une fois: Whaaat!? :joy::joy:


#15

Ils sont idiots comme un terminal idiot (dumb terminal). lol

C’est ça qui est idiot (peu intelligent) : afficher une page rendue sur un écran. Il y a autant d’intelligence que dans une imprimante.

Souvent, tu ne cherches pas de la lecture mais de l’information. Par exemple, je veux les chiffres de la pollution de ma rivière. Mais je ne veux pas les trucs inutiles autour. Juste

 { date:12-Jul-2018 , escherichia:509 , coliformes:380 }

Alors, je n’ai rien à cirer que ce soit de l’helvetica 12 points cadre rouge sur fond vert pomme avec image d’une bactérie.

Et avec ça, je vais instruire mon user agent à faire des graphiques de 1999 à 2018.

Et tu ne connais pas non plus le web sémantique.

The concept of the semantic network model was formed in the early 1960s by researchers such as the cognitive scientist Allan M. Collins, linguist M. Ross Quillian and psychologist Elizabeth F. Loftus as a form to represent semantically structured knowledge. When applied in the context of the modern internet, it extends the network of hyperlinked human-readable web pages by inserting machine-readable metadata about pages and how they are related to each other. This enables automated agents to access the Web more intelligently and perform more tasks on behalf of users. The term “Semantic Web” was coined by Tim Berners-Lee,[4]

Whaaat!?


#16

Wow, tu sais qu’on a des API pour ça ? Et que les sites internet ne sont que des front qui interrogent ces APIS ?

“vite vite je veux des données formatées en parsant des front en HTML alors que je peux interroger des back via des API”

De plus en plus rigolo, arrête de t’inventer des vie dans le web.


#17

Oukilé l’API?

http://baignades.sante.gouv.fr/baignades/consultSite.do?isite=044000587&dptddass=044&annee=2015&objectId=1839&plv=04400133825#d

Hein? Oukilé?


#18

T’es un bon toi. Parce qu’un site ne propose pas d’API alors le navigateur doit pouvoir on ne sait trop comment te formater les données… Mais bien sûr…

“Mon boucher n’a pas fait la traçabilité de sa viande, je vais demander à ma fourchette de me dire si elle est française ou pas”.

Tiens on va voir la source de ce que tu as c/c :

"<td height="40" width="10%" class="cadre_dotted fondBon">
																						<strong> 02/06/2015 </strong> <br>
																					
																								        Bon
																								       
																						<a href="consultSite.do?isite=044000587&amp;dptddass=044&amp;annee=2015&amp;objectId=1839&amp;plv=04400133820#d">
																							<img src="images/fr/boutons/fleche_ronde.gif" alt="accès aux détails" width="15" height="15" border="0"> 
																						</a>
																					</td>"

Bon courage déjà rien que pour faire la règle de parsing, et qui ne marchera que pour CE site et CETTE version du front, avant qu’ils ne fassent une refonte graphique / de code.
Alors bien sûr avoir ça pour tous les sites qui font des tableaux… On voit bien que tu n’y connais rien, c’est impossible dans l’état.

C’est comme avec le web sémantique : si personne n’utilise les balises, ça risque pas de marcher.


#19

Hé oui, bonne réponse !!!
Il n’y a pas d’API.


#20

BRAVO LE VEAU ! Et donc au lieu de gueuler au service concerné tu voudrais que ton navigateur internet puisse parser TOUTES les infos de TOUS les sites (et bien sûr se mettre à jour dès qu’ils se mettent à jour) !

Quelle intelligence !