Le détournement de page par redirection
Ce billet est une traduction de l’article « Spammers hijack web site listings in Google » rédigé par Per Koch le 13/09/2004. Je remercie son auteur de m’avoir autorisé à traduire son article.
Un grand nombre de webmasters doivent faire face à un nouveau cauchemar lié aux moteurs de recherche : se faire piquer leurs positionnements dans Google par d’autres sites.
Les moteurs de recherche luttent constamment contre des spammeurs, c’est-à-dire des personnes qui essaient de manipuler les résultats des moteurs de recherche pour augmenter leur trafic (NDLR : ce qu’on appelle le spamdexing). En début d’année Pandia a même trouvé quelqu’un qui avait copié de grandes parties du site Pandia en les faisant passer pour son propre site.
C’est évidemment un problème de droit fondamental puisque cette personne vole un contenu sans tenir compte du droit d’auteur.
Du point de vue du moteur de recherche, le problème est vu différemment, car Google considère que les contenus dupliqués sont des tentatives de spam du moteur de recherche. C’est pour cette raison que Google bannit l’un voire les deux sites. Oui ! Votre site peut se retrouver banni parce que quelqu’un d’autre l’a copié !
Des cas de ce type enfreignent les lois internationales sur le droit de propriété intellectuelle et peuvent être jugées au tribunal. Cependant, les spammeurs ont trouvé aujourd’hui une nouvelle façon de s’appropier des positionnements dans les moteurs de recherche : ils utilisent la redirection par la balise « meta refresh ».
La balise meta refresh est une balise meta que vous mettez au début du code HTML, dans l’entête du document (entre les balises <head> et </head>), et qui indique au navigateur qu’il faut charger une autre page au bout d’un certain temps.
Imaginez qu’un spammeur utilise une balise de ce type sur sa page www.spammeur.com/index.html :
<meta http-equiv= »Refresh » content= »0; url=http://www.honnete-homme.com/index.html »>
Ce code indique au navigateur qu’il faut charger la page www.honnete-homme.com/index.html au bout de 0 seconde, c’est-à-dire immédiatement.
Google de son côté interprète ce code en retenant que la page www.spammeur.com/index.html possède le même contenu que la page www.honnete-homme.com/index.html, c’est-à-dire qu’elles sont identiques.
Cela dit, cela ne devrait pas poser de problème dans la mesure où Google reconnaît que www.honnete-homme.com/index.html est le site d’origine et www.spammeur.com/index.html est la copie. Il pourrait bannir le site www.spammeur.com pour manipulation de l’index.
Cependant, comme l’ont indiqué de nombreux webmasters dans le forum WebMasterWorld, Google semble en réalité bannir le site d’origine, considérant que le nouveau site remplace l’ancien. Au final les internautes tombent toujours sur la même page, mais ce n’est plus votre site qui apparaît dans Google, c’est celui du spammeur.
Pourquoi diable le spammeur fait-il cela ? Après tout, l’internaute pourra toujours lire votre page sur votre site. Une motivation possible est de chercher à nuire à un concurrent, en l’occurrence vous, en faisant disparaître vos positionnements dans les résultats de Google. Une autre raison est de bénéficier des backlinks qui pointent vers votre site (NDLR : vers votre page pour être plus précis), et de remplacer plus tard cette page avec un meta refresh par une page classique de leur site.
Si Google considère vraiment que le site du spammeur remplace le site d’origine, le spammeur peut même hériter du PageRank du site d’origine (NDLR : de votre page pour être plus précis). Certains ont remarqué qu’il existe des outils de gestion des liens (NDLR : par exemple le module de liens de Xoops) basés sur ce système. D’ailleurs certains webmasters détournent ainsi d’autres pages sans même le savoir.
Google n’a pas encore réglé le problème et n’a pas fourni de réponse aux webmasters de WebMasterWorld qui ont expliqué le problème. C’est ennuyeux surtout que Google doit être au courant de ceci depuis déjà longtemps. Nous espérons que Google fasse quelque chose le plus rapidement possible.
Copyight Pandia.com 2004
Source: http://www.prweaver.fr/blog/2004/09/21/13-detournement-par-redirection