L’analyse des logs d’erreur 404 (page introuvable) est très intéressantes pour savoir s’il y a des URL qui sont recherchées par des robots ou logiciels ou même par des utilisateurs malveillants. Cet article va présenter une liste de fichiers que vous pouvez créer pour réduire la taille du log d’erreur 404, tout en améliorant l’impact de votre site web auprès des logiciels qui ont besoins de ces ressources pour le moment inexistantes.
Liste des fichiers
Voici une liste de fichiers qui sont souvent recherchés sur un site web, associé aux explications adéquates.
- robots.txt : fichier qui permet de donner des directives aux robots. Permet notamment de bloquer l’accès d’un site à un robot si c’est spécifié dans ce fichier. Au minimum il est possible de créer ce fichier avec les directives de bases spécifiant que toutes les pages du site sont accessible. Pour en savoir : « comprendre et utiliser le fichier robots.txt« .
- favicon.ico : petite icône qui est utilisée par les navigateurs web dans les onglets de navigation pour mieux représenter visuellement le site web. Certains navigateurs web essaient d’accéder par défaut à ce fichier si rien n’est spécifié dans le code HTML. Pour en savoir plus : « comprendre le favicon« .
- apple-touch-icon-precomposed.png : icône de favoris pour iPhone, iPad ou iPod Touch. Pour en savoir plus, consultez l’excellent article d’Alsacréations : « Ajouter une icône pour iPhone/iPod Touch/iPad« .
- apple-touch-icon.png : idem mais avec des coins arrondis et un effet de brillance
- apple-touch-icon-120×120-precomposed.png : idem avec une taille prédéfinie de 120 pixels de haut et de large
- apple-touch-icon-120×120.png : idem
- apple-touch-icon-152×152-precomposed.png : idem
- apple-touch-icon-152×152.png : idem
- apple-touch-icon-114×114-precomposed.png : idem, à savoir : 114px est la dimension minimalede l’icône pour l’iPhone (supérieur au 4).
- apple-touch-icon-114×114.png : idem
- apple-touch-icon-76×76-precomposed.png : idem
- apple-touch-icon-76×76.png : idem
- apple-touch-icon-72×72-precomposed.png : idem, à savoir : 72 pixels est la dimension minimale de l’icône pour l’iPad.
- apple-touch-icon-72×72.png : idem
- browserconfig.xml : spécifications utilisées par Internet Explorer. Microsoft à mis en place une page d’explication officielle et très bien détaillée : « Browser configuration schema reference« . La page explique notamment la balise meta à utiliser pour spécifier à Internet Explorer que le site ne souhaite pas utiliser ce fichier.
- humans.txt : inventé en 2011, le fichier humans.txt a pour ambition de présenter les humains qui ont participé à la création d’un site web. Des extensions Firefox et Chrome permettent d’être informé de l’existence de ce fichier et génèrent donc des erreurs 404 s’il n’existe pas. Pour en savoir plus, consultez le site officiel humanstxt.org.
- crossdomain.xml : fichier utilisé par Flashplayer.
- labels.rdf : l’organisation ICRA a pour but de classer les sites qui pourraient heurté la sensibilité des plus jeunes. Leurs robots parcours les sites web et cherchent le fichier « labels.rdf » qui contient des informations spécifiques à ce sujet. Créez un fichier vide pour vous débarrasser de cette erreur 404.
Faites bon usage de ces informations, créez les fichiers cités et utilisez un outil quelconque vous permettant d’enregistrer les erreurs 404. Cette liste n’est pas exhaustive et peut évoluer au fil du temps, notamment s’il devait y avoir l’émergence d’un nouveau type de fichier.
Connaître ses erreur 404 sur WordPress
Sur WordPress, le célèbre plugin Redirection est connu pour facilement gérer des redirections permanentes. Il est un peu moins connu pour enregistrer le log des erreurs 404. Pourtant, dans la base de données la table `wp_redirection_404` grossi à vu d’oeil en enregistrant chacune des erreurs 404. Vous pouvez exploiter les données de cette table pour connaître les plus populaires de vos pages introuvables. Utilisez la requête SQL suivante au sein de PhpMyAdmin pour connaître les URL d’erreurs :
SELECT url, referrer, COUNT(*) AS count_url FROM `wp_redirection_404` GROUP BY url, referrer ORDER BY count_url DESC
Pour aller plus loin
N’hésitez pas à partager votre propre expérience dans les commentaires afin que cela soit bénéfique au plus grand nombre.