La Google Search Console fait régulièrement apparaître des pages qui répondent en 404 sur votre site et vous ne savez pas comment résoudre ce problème ? Le rapport d’erreurs s’allonge de jour en jour et vous souhaitez pouvoir y remédier ? YATEO va vous aider à comprendre pourquoi ces messages d’erreurs sont générées et de quelle façon les corriger. 

Qu’est-ce qu’une page d’erreur 404 ?

Une erreur 404 désigne une page introuvable, une ressource non trouvée par le navigateur lorsque, côté serveur, l’url spécifiée ne renvoie pas de réponse. Une page d’erreur 404 peut très bien avoir existé par le passé, au même titre qu’elle a pu être indexée par les moteurs de recherche fut un temps. Néanmoins, lors de son dernier passage, le robot d’indexation a détecté un message d’erreur et c’est pour cette raison que la Search Console vous le remonte comme tel.

Est-ce un problème pour le SEO lorsque Google rencontre une page d’erreur 404 ?

Il est naturel, dans la vie d’un site Internet, que ce dernier génère, bon gré mal gré des pages 404. D’ailleurs, toutes les 404 ne sont pas nécessairement à traiter ou à corriger. Il est même préférable de se focaliser uniquement sur celles qui auront un impact, plus ou moins important sur le positionnement de votre site web. C’est surtout le volume de pages 404 présentes sur un site qui pourrait avoir un impact négatif sur le référencement naturel.

 

Oui mais, comment reconnaître les pages d’erreurs 404 à corriger ?

Pour savoir si une page 404 peut poser un problème technique d’un point de vue SEO, il faut remonter à la source et analyser son historique, son ancienneté. Est-elle maillée depuis d’autres pages de votre site Internet ? Reçoit-elle des liens externes depuis des sites référents ? Génère t-elle du trafic en tant que page de destination SEO ? Se positionne-t-elle sur des mots-clés stratégiques susceptibles de vous apporter non seulement de l’audience mais aussi des conversions ou des ventes ? Est-elle temporaire ou définitive ? Bref, vous devez comprendre le contexte autour de chaque URL en erreur 404 avant de prendre une décision ferme et définitive sur le traitement que vous allez accorder à chacune d’entre elles.

Les pages 404 générées par des liens internes en erreur

Votre site fait un ou plusieurs liens internes vers des pages qui répondent en 404 ? La page de destination n’existe plus ou vous avez mal recopié une URL ? Veillez à corriger ces liens internes pour la simple et bonne raison qu’ils nuisent à l’expérience utilisateur et au crawl des robots d’indexation des moteurs de recherche.

Comment détecter les liens internes en 404 ?

C’est très simple ! Si vous ne l’avez pas déjà installé, téléchargez le logiciel Screaming Frog SEO Spider sur votre PC. Cet outil va vous permettre de crawler l’intégralité des liens présents à l’intérieur de votre site. Le crawler va suivre chaque lien et renvoyer un florilège d’informations telles que l’entête HTTP, les balises metas et les balises Hn associées, le nombre de mots à l’intérieur de la page, le niveau de profondeur dans l’arborescence, les directives (canonical, index/follow…). Vous allez également pouvoir exporter la liste des pages et des liens internes correspondants afin de ne conserver que les liens qui renvoient une erreur, en vue de les corriger manuellement ou dynamiquement selon les cas de figure.

trouver les erreurs 404 sur screaming frog

Vous pouvez tout aussi bien utiliser la Search Console… Seul problème : elle ne remonte que les 1000 premiers liens en erreur et elle ne permet pas de connaître l’URL d’origine qui pointe vers la page de destination en 404. Screaming Frog est l’outil gratuit tout en un qui va vous permettre d’aller véritablement dans le détail pour prendre les meilleures décisions concernant chaque URL.

Astuce : pensez également à crawler les liens présents au sein de votre fichier sitemap.xml. Bien souvent, nombreuses sont les URLs du sitemap à renvoyer un code réponse 404. Or, le fichier sitemap.xml est l’un des fichiers les plus visités par Googlebot, au même titre que le fichier robots.txt. Par conséquent, mieux vaut envoyer les bots vers des pages qui répondent en 200.

Comment corriger les liens internes qui répondent en 404 ?

3 solutions sont possibles :

  1. L’URL en 404 est liée à une erreur de saisie, auquel cas modifiez simplement l’URL de destination pour la faire pointer vers la bonne page qui répond en 200
  2. L’URL en 404 n’existe plus de façon permanente, auquel cas, vous pouvez, au choix, décider de la rediriger en 301 vers une page sémantiquement proche si elle bénéficiait d’un certain historique en termes de positionnement, de trafic et de backlinks,
  3. L’URL en 404 n’existe plus de façon permanente mais elle n’a aucun historique de positionnement, de popularité, de trafic… auquel cas, profitez-en pour la passer en 410, un code réponse qui permet d’indiquer aux robots d’indexation que la page d’erreur n’est plus accessible et qu’ils peuvent définitivement la supprimer de leur index.

Les pages 404 générées par des liens externes en erreur

Comme n’importe quel site, le vôtre reçoit naturellement, ou artificiellement des backlinks si vous avez mis en place une stratégie de netlinking. Or, certains de ces liens sont susceptibles de pointer vers des pages en erreur. Il se peut que certains backlinks aient beaucoup d’ancienneté et qu’ils pointent vers des URLs qui n’existent plus ou que vous avez oubliées de rediriger consécutivement à une migration. Votre site ne bénéficie donc plus des acquis référentiels de ces liens, ce qui peut être dommageable et pénaliser votre positionnement en référencement naturel.

Comment détecter les liens externes en 404 ?

Pour repérer les backlinks qui pointent vers des pages d’erreurs, vous pouvez utiliser plusieurs outils, à commencer par la Google Search Console qui liste les liens externes détectés par GoogleBot, ainsi que les pages de destination de votre site recevant ces backlinks.

Pour aller plus loin, vous pourrez utiliser des outils payants comme Majestic, Ahrefs ou SEObserver pour exporter le fichier des backlinks, puis filtrer uniquement votre tableau Excel sur les pages de destination qui remontent en 404.

Comment corriger les liens externes qui répondent en 404 ?

2 solutions sont possibles :

  • Vous pouvez dans un premier temps contacter les webmasters des sites référents pour leur demander de modifier l’url de destination finale afin qu’elle renvoie un code réponse en 200
  • Vous pouvez dans un second temps rediriger vos pages de destination en 404 vers des pages sémantiquement proches afin de conserver la popularité et préserver le linkjuice

Vous souhaitez approfondir le sujet de la détection et de la gestion des liens morts sur votre site ou en dehors de votre site ? Lisez notre article dédié !

Liens morts : comment les trouver et les réparer ?

Que faire une fois vos liens corrigés ?

Dès lors que vous aurez nettoyé votre site des liens internes et externes qui pointaient vers des pages en 404, vous pouvez vous rendre directement dans la Search Console pour marquer comme corrigés l’intégralité des liens en 404 dans le rapport de couverture. Quelques semaines plus tard, revenez dans la GSC et jetez un œil pour savoir si les bots de Google ont rencontré de nouvelles URLs répondant en 404. Logiquement, au vu de votre premier passage, vous devriez avoir réduit considérablement le nombre de pages d’erreurs sur votre site. Dans le cas contraire, reproduisez les opérations précédentes.