Ce que j’aime mieux à propos de MSN
Trouvé le 21 septembre 2004 à 8:05 par s2m - 160 vues
Il s’agit du problème relatif au robots.txt car le webmaster s’étonne du fait que malgré l’interdiction dans robots.txt de crawler certaines pages, elles apparaissent quand même dans les résultats de recherche de Google alors que MSN respecte l’interdiction.
GoogleGuy explique :
« Si une page est dans robots.txt, nous n’allons pas la crawler, mais nous pouvons l’afficher dans les résultats de recherche si nous avons des raisons de penser qu’elle est pertinente par rapport à la requête. Dans ce cas, nous n’afficherons que l’URL (pas de titre, pas de description et pas de cache).
Voici un bon exemple : pendant longtemps, le California Department of Motor Vehicles (DMV) avait un robots.txt qui ne laissait pas les moteurs crawler les pages. Seulement, pour une recherche comme « california dmv » nous pouvions retourner une URL, même si nous ne pouvions crawler la page.
Si tu ne veux pas que la page apparaissent du tout, tu peux le garantir en laissant Google voir la meta tag « noindex » lors du crawl.
Pour les curieux, nous avons réussi à convaincre DMV de laisser les moteurs crawler leur site, mais nous avons du prendre un rendez-vous et nous avons fait la queue pendant un moment. ;-)
Source: http://googleguy-fr.blogspot.com/2004/09/ce-que-jaime-mieux-propos-de-msn.html
Publié dans Archives | Réagir »
Sélection d'articles sur le même thème
- Fréquence de mise à jour du cache DNS de Google - 531 vues
- Pas de date dans les résultats de Google - 179 vues
- Yahoo Slurp 3.0, nouvelle version du crawler de Yahoo - 541 vues
- What I like better about MSN compared to Google… so far - 155 vues
- Est-ce que les redirections sont mauvaises pour Google ? - 192 vues
- Enlever une URL de l’index de Google - 786 vues
- Page en cache : update partiel possible ? - 172 vues
- When Your Host Toasts Your Domains… GBot knocks, but can’t get in… - 164 vues
