Article

19 mars 2024
Neper

Effet des Erreurs 4xx sur la recherche Google

Codes d’état HTTP

Les codes d’état HTTP sont des codes renvoyés par un serveur en réponse à une requête demandée par un utilisateur via un navigateur ou un robot d’exploration comme Googlebot.

Chaque code a une signification différente, le code d’état 2xx indique un contenu pouvant être indexé mais ici nous allons nous intéresser aux codes d’état HTTP 4xx.

A noter, les codes d’état HTTP 4xx sont visibles dans la Google Search Console lorsqu’un robot d’exploration de Google reçoit ce type de code d’un serveur.

Codes d’état HTTP 4xx les plus courants rencontrés par Googlebot

400 (bad request)
401 (unauthorized)
403 (forbidden)
404 (not found)
410 (gone)
411 (length required)
429 (too many requests)

Comment Google traite les codes d’état HTTP 4xx ?

Toutes les erreurs 4xx, sauf l’erreur 429, sont traitées de la même manière : Googlebot déclare à la partie indexation que le contenu n’existe pas, ce contenu est ignoré. Les urls qui renvoient un code 4xx ne peuvent pas être indexées.

Si l’url crawlée fait partie de l’index et qu’elle renvoie un code 4xx, alors cette url sera supprimée de l’index.

A noter, si le code d’état HTTP 4xx ne change pas, la fréquence d’exploration diminue progressivement.

Cas particulier l’erreur 429 : Googlebot traite le code d’état 429 comme un signal indiquant que le serveur est surchargé et donc comme une erreur de serveur.