Crawler de fichiers interne à un site

Les crawlers de fichiers ont un intérêt pour lister rapidement toutes les pages ou images d’un site web. Cela permet d’automatiser la tache qui peut être longue et pénible s’il fallait le faire manuellement. Cet article présente un crawler qui liste tous types de fichier présent sur votre espace d’hébergement.

Présentation

Le script fournit sur cet article est à installer à la racine d’un site web, puis il suffit de l’ouvrir avec un navigateur web pour voir s’afficher la liste de tous les fichiers présents.

Sur le web, il existe une multitude de crawler qui fouille sur une page web distante, mais il y a moins de projet (à ma connaissance) qui s’installe directement sur le serveur d’un site et qui liste les fichiers en interne du site. Cela possède l’avantage de pouvoir lister les pages et fichiers orphelins (qui ne sont pas utilisés ou liée au site web).

Type d’utilisation envisageable :

Télécharger

Le lien ci-dessous permet de télécharger le script. Une fois téléchargé, il suffit de le dézipper et de le placer à la racine de votre site.

(Fichier compressé. 2,01Ko)

J’ai l’intention dans les prochains jours de donner des exemples d’utilisation et des modifications possible de ce script.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.