Référencement: robots.txt

Catégorie: Référencement | Commentaires fermés | 220 lectures

Avant de parcourir votre site web, la plupart des robots font appel au fichier robots.txt. Comme son nom l'indique, il s'agit d'un fichier texte qui contient des règles d'exclusion vis à vis de certains moteur de recherche. La pratique montre le respect de ces règles par la plupart des moteurs mais aucune garantie ne peut être apportée.

Ce fichier n'est pas obligatoire. En son absence, le robot considère qu'il peut tout indexer. Il répond également à une norme d'exclusion (Robots Exclusion Standard) qui est censée être universelle.

Créer un fichier robots.txt

Pour créer le fichier, ouvrez un éditeur de texte de type Bloc-notes de Windows. Enregistrer le document sous le nom de « robots.txt » (en minuscules et au pluriel) puis envoyez-le sur le serveur distant à la racine du site. Il faut pour cela posséder un nom de domaine car les offres d'hébergement gratuites ne permettent pas de remonter à la racine du site.

Capture écran du fichier Robots.txt

La première ligne est un commentaire. Il doit toujours commencer par # et tenir sur une ligne. Ce document comporte un commentaire suivi de deux enregistrements. Chaque enregistrement commence par définir le type de robot visé (User-agent) ensuite les instructions à suivre. Dans l'exemple, l'enregistrement s'adresse à tous les robots (*) et doit ignorer (disallow) tout ce qui se trouve dans le répertoire private ainsi que tous les documents private. Le deuxième enregistrement est séparé par un retour à la ligne vide. Il interdit au robot de Google (Googlebot) d'indexer tous les fichiers textes dans le dossier import ainsi que la page referencement.html qui se trouve dans le dossier acorriger.

Visitez l'outil statistiques fournit par votre hébergeur pour connaître les robots d'indexation. Sur mon blog, les principaux sont: MSN Bot, Google Bot et Google Bot Image, Cuil et Slurp (Yahoo). Si cette option n'est pas comprise dans votre forfait, utilisez un utilitaire en ligne comme SpyWords.com.


Commentaires

Les commentaires sont fermés pour cette note.