Quand la BBC demande à Google de déréférencer la page d’accueil de Dailymotion
Situation Dailycate
Le 12 mai 2015 à 13h00
3 min
Droit
Droit
Google a reçu voilà plusieurs jours une demande de déréférencement de la page d’accueil de la version britannique de Dailymotion. Le géant de l’internet n’a pas donné de suite favorable à cette requête présentée au nom de la BBC, pas plus d’ailleurs qu’à trois autres demandes qui visaient des pages IMDb de films et séries.
Perçu par de nombreux ayants droit comme une porte dorée vers le piratage, Google croule depuis plusieurs années sous les demandes dites DMCA – du nom de la législation américaine applicable aux hébergeurs. En vertu de cette procédure, le célèbre moteur de recherche est prié de ne plus faire apparaître certaines pages au sein de ses résultats, au motif que celles-ci permettraient la diffusion illégale de films, ebooks, séries, etc.
Une demande à côté des clous
Le problème est que les ayants droit envoient ces requêtes à tour de bras (345 millions de demandes en 2014), bien souvent à l’aide de programmes informatiques qui ont du mal à faire la différence, à partir de simples mots-clés, entre contenus licites ou illicites... Le dernier exemple de cet effet de bord notoire a une nouvelle fois été repéré par TorrentFreak. Le 2 mai, Google a reçu une demande transmise au nom du groupe BBC Worldwide, propriétaire de la célèbre chaîne britannique et des nombreuses séries et émissions que celle-ci produit.
Sur son Transparency Report, la firme de Mountain View indique ainsi qu’il lui a été demandé de déréférencer la page d’accueil de Dailymotion UK, « www.dailymotion.com/gb ». Une page qui permet certes de lire des vidéos pouvant être illicites, mais dont le contenu évolue très fréquemment... Google n’a d’ailleurs pas donné suite à cette requête.
Le moteur de recherche a d’autre part été prié de ne plus faire apparaître trois pages du site IMDb, le père spirituel anglophone d'Allociné. Là non plus, Google n’a procédé à aucun déréférencement puisque les pages signalées contenaient de simples descriptifs d’une série financée par la BBC, « The Game », ainsi que d’émissions « Top Gear ».
Des exemples de plus en plus nombreux
Si un géant tel que Google a les moyens d’éviter que des contenus illégitimement dénoncés ne soient retirés, ce n’est malheureusement pas le cas de tous les hébergeurs... La publication de nombreuses données par le géant de l’internet montre pourtant que les dérives peuvent parfois être très larges : page d’accueil de Gmail, fiches Wikipédia, vidéos sous licence Creative Commons, livres appartenant au domaine public, pages de téléchargement de logiciels gratuits (Skype, VLC, OpenOffice...), etc.
En France, le fait, pour toute personne, de signaler « un contenu ou une activité comme étant illicite dans le but d'en obtenir le retrait ou d'en faire cesser la diffusion, alors qu'elle sait cette information inexacte, est puni d'une peine d'un an d'emprisonnement et de 15 000 euros d'amende » (article 6 de la loi pour la confiance dans l’économie numérique).
Quand la BBC demande à Google de déréférencer la page d’accueil de Dailymotion
-
Une demande à côté des clous
-
Des exemples de plus en plus nombreux
Commentaires (54)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 12/05/2015 à 13h06
Soit les algorithme de google sont bien plus pertinent et arrive à trier les requêtes juste des mauvaises. Soit ils doivent avoir une armés de personne qui ce charge de cela.
Bon et sinon comme d’hab à quand un permis a point pour les demandes DMCA.
Le 12/05/2015 à 13h06
De toute façon, depuis qu’ils ont viré Jeremy Clarkson, ils méritent juste de crever ^^
Le 12/05/2015 à 13h08
Bring
Back
Clarkson
Le 12/05/2015 à 13h09
Le 12/05/2015 à 13h11
Oui et bien faudrait que les compagnies qui envoie les requêtes fassent également le trie AVANT au lieu d’en abuser. Mais tant qu’il n’y aura pas de sanction pour requête abusive…
Le 12/05/2015 à 13h16
demander un déréférencement d’une Page qui NE leur APPARTIENT PAS ! " />
“rien …QUE ça, ‘Google” DOIT REFUSER !
sinon : moi AUSSI je vais demander de déréf… le voisin (il a une tête qui me revient pas), hop ..!!!
Le 12/05/2015 à 13h19
Le 12/05/2015 à 14h13
Le salaire serait probablement minable, mais l’économie en terme de dépenses culturelles serait substantielle avec tous les liens qu’ils pourraient collecter. " />
Ca doit bien pouvoir compter comme un avantage du même type que le tarif EDF non ? " />
Le 12/05/2015 à 14h17
en fait son calcul est juste, c’est son explication qui est fausse " />
345 millions /220 jours /150 personnes / 8 heures / 60 minutes donne bien 22 requêtes à analyser par minute et par personne… ;)
après, ça me fait marrer ceux qui disent qu’il faut moins d’une seconde pour lire une url… dailymotion.com… ok… mais un truc à rallonge sur un site pas connu… je vois pas comment un gars peut dire en moins de 3 secondes si c’est légitime ou pas…
Le 12/05/2015 à 14h19
Pas d’accord, The PirateBay AFk (licence CC) s’est bien fait déréférencer alors que les ayants-droits n’avaient justement pas les droits dessus (alors qu’on sait tous que TPB ne sert qu’à télécharger des ISO Linux " />).
Le 12/05/2015 à 14h25
Le 12/05/2015 à 14h26
Ah oui, en effet ^^
Bon, cela dit, même pour google, ça me parait beacoup, 150 personnes à temps plein, juste pour gérer les demandes de retrait…
Il y a surement un système de tri préalable, retrait des doublons, etc.
Le 12/05/2015 à 14h28
Le 12/05/2015 à 14h29
Certains diront que c’est un “dommage collatéral” du système.
Si le film s’est fait déréférencer, c’est qu’il était sur TPB (ou un miroir) ! C’est d’ailleurs révélateur de ce que je dis plus haut : si l’adresse appartient au domaine à thepiratebay.com/* alors c’est direct.
C’est toujours comme ça : les erreurs d’un algo sont plus révélatrices de son fonctionnement que les “bons résultats”.
C’est d’ailleurs un axe de travail très courant en cryptographie.
Le 12/05/2015 à 14h33
Depuis que le salaire est basé sur le mérite.
Le 12/05/2015 à 14h37
a mon avis quand le PR de la page est elevé (ou que sa categorie n’a rien a voir avec du P2P) google verifie a la main
Le 12/05/2015 à 14h38
Voir ma réponse au dessus (bug dans le mode réponse)
Le 12/05/2015 à 14h44
pour moi ils ont justement un indicateur de “sérieux” ( est ce que le site est populaire, est ce qu’il est hosté aux US/pays favoris, est ce qu’il existe depuis longtemps, est ce que d’autres site “sérieux” le cite, etc…), qui est pris en compte par le page rank.
c’est cette stat qui ( d’après moi ) leurs permet de faire une liste a bannir automatiquement ( c’est quand même la plupart des cas), et une liste à vérifier à la main
Le 12/05/2015 à 14h55
Ca ne répond pas à la question.
Le 12/05/2015 à 15h00
J’y peut rien, tout ce qui tourne autour de la justification des différences de salaires n’apporte aucune réponse rationnelle." />
Le 12/05/2015 à 15h07
Que je sache niveau pénibilité, infirmière ou technicien de surface, voir éboueur c’est un chouilla plus que trader pour un salaire bien inférieur, donc le mérite n’a pas de lien avec la pénibilité.
Mais sinon oui, on est d’accord c’est un peu n’imp ^^’
Le 12/05/2015 à 15h24
Utiliser son cerveau n’est pas moins pénible… Mais en général quand on bosse dans un bureau on est forcément dans un boulot non pénible..
Le 12/05/2015 à 15h49
Le 12/05/2015 à 13h21
Sous-titre excellent " />
" /> pour ce fou rire
Le 12/05/2015 à 13h24
Mmmmm " /> Je l’iaime bien, mais là il l’a quand même cherché. " />
Le 12/05/2015 à 13h25
Le 12/05/2015 à 13h29
C’est pas si gigantesque que ça en fait.
345 millions de requêtes en 1 an. Je suppose une année composée de 220 jours ouvrés, travaillés 8 heures. Ca donne 3267 requêtes à traiter par jour. Avec une équipe de 150 personnes (c’ést grand, mais c’est loin de représenter une “armée”), ça donne un peu moins de 22 requêtes à traiter par minute.
Vérifier à la main 22 URL par minute, c’est jouable, surtout que dans certains cas, l’URL suffit à déterminer l’invalidité sans avoir à cliquer dessus pour accéder au contenu.
En supposant encore que cette partie est automatisée par des algos maison de Google, ce qui ne fait pas l’ombre d’un doute, il doit rester quoi, 30% tout au plus des requêtes qui doivent être vérifiées à la main.
Le 12/05/2015 à 13h35
Le 12/05/2015 à 13h44
22 Requêtes minutes? C’est quand même beaucoup je trouve.
Le 12/05/2015 à 13h45
Navré pour toi…
Le 12/05/2015 à 13h48
Le 12/05/2015 à 13h48
Le 12/05/2015 à 13h56
Le 12/05/2015 à 14h00
C’est fortement possible pour le coté semi automatique. Mais c’était juste le 22 requêtes minutes qui me choquait. (on est pas des robots) Mais oui il doit y avoir un très gros pourcentage fait en automatique. Des 100% validés (délit flagrant), des 100% invalidés (page racine) et des doutes du robot qui seront traité en manuel.
Le 12/05/2015 à 14h00
Le 12/05/2015 à 14h01
Le 12/05/2015 à 14h04
Le 12/05/2015 à 14h06
Le 12/05/2015 à 14h11
Déjà en ayant des listes blanches de site “officiels” et sans doutes possibles (genre tout ce qui est imdb.com/*) dégage les requêtes frauduleuses.
Ensuite pour une url de vilains pirates, je pense que les sites reviennent régulièrement. Donc si domaine possède genre 3 adresses “pirates”, alors les requêtes suivantes seront traitées automatiquement.
Donc en combinant des listes blanches (remplie à la main) et des blacklist remplies quasi automatiquement, google doit écrémer avant d’envoyer à ses employés.
Et faire ce genre de chose pour Google, c’est clairement pas kiffant mais ils ont les personnes, les connaissances et les finances pour plier le truc.
Le 12/05/2015 à 15h49
Il n’y a certes pas que le travail physique qui est pénible mais les salaires n’ont absolument jamais eu d’indexation sur le mérite (ou alors ils faut m’expliquer ce sens du mot mérite). Le salaire est un mélange de mérite, environnement, coup de pouce, chance … Et je pense que le mérite est l’un des éléments qui joue le moins sur le salaire.
Le 12/05/2015 à 16h08
Google devrait surtout mettre en place un système qui, en cas de demande abusive de déréférencement, déréférencie l’ensemble des sites web du demandeur.
Ils y regarderaient à 2 fois avant d’envoyer toutes leurs listes à la con.
edit: ah j’allais oublier:
Bring
Back
Clarkson
Le 12/05/2015 à 16h35
Le 12/05/2015 à 16h39
Le 12/05/2015 à 17h02
Ca dépend tu es tendance marxciste ou tu es de ceux qui juge que ceux qui n’ont pas de chance mérite un salaire encore plus faible?
Le 12/05/2015 à 17h05
Le 12/05/2015 à 22h00
Une news à ce genre de sujet à chaque coup ? Sérieusement ? : /
Le 13/05/2015 à 05h43
“En France, le fait, pour toute personne, de signaler « un contenu ou
une activité comme étant illicite dans le but d’en obtenir le retrait
ou d’en faire cesser la diffusion, alors qu’elle sait cette information
inexacte, est puni d’une peine d’un an d’emprisonnement et de 15 000
euros d’amende » (article 6 de la loi pour la confiance dans l’économie numérique).”
Cette loi est faite pour faire condamner les petites gens, elle ne s’applique pas aux gros requins !
Le 13/05/2015 à 07h20
Close enough ? :)
Bring
Back
Clarkson
Le 13/05/2015 à 07h27
Google ne possèdant pas (encore) l’internet, oui ça veut juste dire supprimer des résultats de recherche. Après comme de moins en moins d’utilisateurs lambda savent qu’on peut aussi taper une URL, pour certains ça revient presque au meme.
Le 13/05/2015 à 07h27
Autant pour moi, je voulais bien entendu dire 3267 requêtes par minute (345000000/220/8/60).
Le 13/05/2015 à 07h31
Oui c’est certain, ça gaverait n’importe qui, mais c’est pas insurmontable, ce que je voulais dire par ce calcul c’est que c’est humainement possible sans algo amont. Et comme on parle de Google, on sait tous très bien qu’ils doivent déjà avoir un algo (le genre d’IA qui apprend au fur et à mesure de son utilisation donc qui devient de plus en plus performant) pour réduire cette charge de travail humaine au strict minimum.
Le 13/05/2015 à 08h16
ok !
(j’ai mal compris la New)
Le 13/05/2015 à 10h32
OK, mais je n’avais pas de doute sur ce point.
Après, même si on sait qu’on peut “taper une URL” " />, le déréférencement complique l’accès à des sites qu’on ne connait pas. Mais bon ce n’est pas la panacée (du point de vue des éditeurs)
Le 14/05/2015 à 18h49
Et ne plus, Google n’est pas l’unique moteur de recherche sur la Toile, ça ne va pas être simple de faire le tri chez DuckDuckGo et Co.
" />