En SEO, la question de la gestion des pages 404 et de leur impact sur vos positionnements est une interrogation récurrente. De nouvelles informations viennent d’être transmises par Google (par l’intermédiaire de John Mueller lors d’un hangout) à l’attention des gestionnaires de site. Nous allons voir ensemble pourquoi il est vital de faire la part des choses entre les annonces officielles du géant américain et la réalité technique et marketing sous-jacente. Avant de commencer, rappelons quelques définitions utiles :
- Définition d’un code 404 : il s’agit d’une erreur de navigation due à un lien brisé. Sur l’url indiquée, le navigateur ne trouve pas la page souhaitée et renvoie une erreur 404.
- Définition d’un code 410 : contrairement au code 404, le code 410 indique que la page n’est plus accessible, le serveur informe le navigateur que cette page a donc été supprimée définitivement.
Constater des erreurs 404 sur son site n’est pas un problème en soi
L’usage a toujours été de conseiller aux webmasters de réduire au maximum le nombre d’erreurs 404, notamment afin d’utiliser au mieux le « budget crawl » alloué par Google.
En effet, il est toujours préférable que vos pages les plus importantes, et surtout vos pages actives, soient indexées en priorité par les moteurs de recherche. C’est sur ce point que John Mueller a voulu se montrer rassurant, en expliquant que les erreurs 404 ne comptent pas dans le budget crawl (contrairement au duplicate content qui a un impact important). Pour faire simple, le Googlebot crawle l’ensemble des pages de votre site, et si son temps de passage alloué sur votre site n’est pas entièrement utilisé, il va vérifier les erreurs 404 relevées lors d’un crawl précédent.
En elle-même, les pages 404 ne constituent pas une pénalité de votre site, mais sont une alerte du serveur pour vous signaler les contenus manquants sur celui-ci. Quand Google vous remonte une page en 404, il faut bien comprendre qu’une page de votre site indexée par Google, n’est plus disponible. Il est cependant recommandé de passer en 410 les pages qui sont définitivement supprimées (comme dans le cas d’une landing promotionnelle pour une période particulière). John Mueller a donc fait les déclarations suivantes sur ce sujet :
Des déclarations à nuancer en termes de bonnes pratiques
Bien que les erreurs 404 ne soient pas pénalisées en soi par Google, le ratio entre les pages affichant un code 200 et 404 ne doit pas être négligé. En effet, il est un indicateur global de la qualité du site, et une augmentation brutale du nombre d’erreurs 404 est presque toujours un indicateur de défaillance.
Les pages identifiées en 404, peuvent avoir été bien indexées par Google, et recevoir des backlinks d’autres sites. Elles présentent donc un intérêt pour votre référencement naturel. Il faut dans ce cas mettre en place une redirection 301 des anciennes urls vers leurs remplaçantes sur votre site pour veiller à garder le maximum de notoriété SEO. Il faut penser à la qualité de navigation et à la valeur ajoutée de votre site pour l’internaute. Si celui-ci pensait trouver une information particulière sur une page qui remonte dans le moteur de recherches, il faut lui permettre d’accéder à ce contenu. Pour cela, la redirection 301 est le meilleur outil. Quand elle est non souhaitable (urls sans jus SEO), votre page 404 doit servir de relais. Elle doit permettre à l’internaute de visualiser des liens intéressants afin de continuer sa navigation sur votre site, et de trouver la page pertinente.
Le rôle d’une agence de webmarketing est aussi de vous appuyer sur cette tâche, grâce à des outils de crawl qui permettent de relever les erreurs d’arborescence par exemple. Si vous êtes confrontés à ce problème, n’hésitez pas à nous contacter.