juil
17
Les meta-données
Catégorie: Référencement | Commentaires fermés | 253 lectures
Les metas-données sont des informations contenues dans le head de chaque page. Elles ne sont pas visibles dans la page et sont destinées au serveur web, aux navigateurs et aux moteurs de recherche. Chaque information est identifiée par un nom et un contenu. Le nom de l'information est défini dans les attributs name ou http-equiv, et la valeur associée est contenue dans l'attribut content. Cette liste n'est pas exhaustive et aucun standard n'a été établi par le W3C.
Les discussions vont bon train sur les forums pour savoir si ces informations sont utiles ou non. La plupart déclare une dépréciation progressive de certaines métadonnées en raison des abus. Tout n'est évidemment pas à jeter [¹].
Déclaration du document
Content-Type — Elle déclare le type (MIME) de document et son jeu de caractère utilisé. Dans l'exemple, le type est text/html. En XHTML, il devrait toujours être application/xhtml+xml mais la plupart des navigateurs n'ont pas la moindre idée de ce que c'est. Pour une image JPG, le type MIME est image/jpeg, pour un fichier CSS c'est text/css. Le jeu de caractère utf-8 est préférable à l'iso-8859-1 propre à la langue française mais limité dans l'affichage des caractères.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
Content-Language — Elle déclare la langue utilisée dans la page. De plus en plus utile maintenant que les moteurs de recherche ont inclus la langue dans leurs critères de recherche. Indispensable également pour les synthétiseurs vocaux destinés aux non-voyants. Si votre site est multilingue, séparé les codes par une virgule.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta http-equiv="Content-Language" content="fr">
</head>
Référencement
Une question souvent posée concerne la pertinence des meta pour les moteurs de recherche. Il faut bien avouer que les meta ne sont pratiquement plus pris en considération par la plupart des moteurs de recherche. Google par exemple, ne tient compte que de la meta description et la meta robots. Cette situation est la conséquence du référencement abusif depuis 1999 (spamdexing).
En ce qui concerne les annuaires de recherche, les meta-données n'ont aucune influence car le référencement des sites web se fait par intervention humaine. Les personnes responsables de la validation du site ne s'amusent pas à aller fouiner dans le code HTML.
Description — La meta description est importante pour le créateur de site car son incorporation dans un document sert à l'indexation des pages web par les moteurs de recherche (exit les annuaires). Elle doit contenir une description concise du contenu de la page en une ou deux phrases (sujet + verbe + complément); c'est-à-dire 200 caractères maximum (espace compris).
Il est fortement recommandé d'utiliser cet élément car si vous ne donnez pas vous-même une description, les moteurs de recherche utilisent les premières lignes de votre page qui ne sont pas nécessairement les plus explicites. Soyez le plus objectif et évitez les messages commerciaux ou trop racoleurs.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="description" content="Une phrase avec les mots clés.">
</head>
Keywords — Cette balise a perdu de son importance en raison des abus (Google ne l'utilise plus depuis 2007). Elle contient une série de mots-clés séparés par une virgule. Tout comme la meta précédente, elle doit être personnalisée pour chaque page. Évitez l'utilisation des capitales, insérez les termes sans accents et avec une accentuation codée (elephant, éléphant), ajoutez les formes au féminin et au pluriel si elles existent ainsi que les mots mal orthographiés qu'un internaute pourrait taper dans un moteur de recherche. Ne dépassez pas 100 mots clés représentatifs du contenu de la page sous peine d'être mis sur une liste noire. Dernier conseil, l'ordre des mots à son importance: les premiers ont un poids plus fort que les derniers.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="keywords" content="mot-clé1, mot-clé2, mot-clé3">
</head>
Robots — Cette valeur permet de donner des directives aux robots des moteurs de recherche. En fonction de la valeur de l'attribut content, vous pouvez choisir la manière dont vos pages seront indexées. Par défaut, les moteurs indexent automatiquement les pages. Autrement dit, les valeurs all, index et follow sont inutiles si c'est la seule règle. Pour créer des restrictions, vous pouvez également concevoir un fichier robots.txt à la place de cette meta. Les moteurs prétendent respecter les instructions mais rien n'est moins sûr.
La valeur content="none" ou "noindex" empêche l'indexation, contrairement à all par défaut. La valeur content="index" autorise l'indexation de la page. La valeur content="follow" autorise l'indexation simultanée de la page et des pages qui sont les cibles des liens contenus dans cette page.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="robots" content="commande1, commande2">
</head>
Revisit-after — Malgré ce que beaucoup de webmasters prétendent, cette meta est totalement ignorée par les robots. Elle fut un temps employée par une minorité mais elle n'a jamais été adoptée par les moteurs de recherche. En théorie, elle indique la périodicité des passages du robot sur le site.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="revisit-after" content="15 days">
</head>
Refresh — La valeur content est exprimée en secondes et force le navigateur à recharger la page toutes les N secondes. Cette meta est utilisée pour un site aux informations renouvelées très fréquemment, par exemple un site de cotation boursière. Elle peut servir également à la redirection automatique du visiteur ou au roulement de publicités sur la page [²].
Attention: les redirections avec un délais très court (entre 0 et quelques secondes) sont souvent associées à du spam et votre site risque d'être pénalisé dans les moteurs de recherche et certains annuaires. Mieux vaut les éviter et choisir une redirection de type 301.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="refresh" content="10; http://www.monsite.com/">
</head>
Les metas sans importance
Author — Indique le nom de l'auteur sans pour autant créer un copyright. Cette meta intéressera plutôt le visiteur curieux que les moteurs de recherche.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="author" content="Jean-Pierre Dupont">
</head>
Generator
Aucune influence, ni pour les moteurs de recherche, ni pour le navigateur utilisé. Cette information intéresse cependant les responsables marketing des sociétés proposant des éditeurs HTML pour calculer la part de marché de leur produit.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="generator" content="Macromedia Dreamweaver MX">
</head>
Identifier URL — Il est parfois utile de rappeler l'adresse de la page d'accueil de votre site pour ceux qui y sont entrés par une des pages de celui-ci.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="identifier-url" content="http://www.monsite.com/">
</head>
Reply-to — Cette meta permet à l'internaute averti de connaître votre adresse e-mail si elle n'apparaît pas sur la page qu'il consulte. Notons qu'il est assez farfelu de penser que le webmaster indique son adresse électronique dans une meta et pas dans sa page web. D'autre part, le pourcentage des personnes qui consultent le code source est minime.
1 2 3 4 5 6 7
<head>
<title>Titre de la page</title>
<meta name="reply-to" content="jp_dupont@mail.com">
</head>
[¹] Pour approfondir le sujet: « À quoi servent les balises META ? »
[²] À lire également: « Empêcher le rafraichissement automatique »
