jan
21
Débusquer les liens morts
Catégorie: Webmastering | Commentaires fermés | 2 225 lectures
En allant voir mes statistiques, j'ai une concentration de liens morts de type 404. Je suis en partie responsable depuis le changement de maquette de ce blog et la migration des dossiers. Du coup, les hotlinks laissés sur les forums et les blogs ne sont plus en mesure d'afficher les images. À chaque chargement de la page, je reçois alors une erreur 404. Il en va de même pour certains agrégateurs en ligne, devenus de redoutables archives et capables de faire ressurgir les billets les plus lointains.
Il m'arrive de temps en temps de supprimer des pages, des billets désuets ou sans intérêt. J'estime que tout ce qui s'écrit n'est pas forcément destinés à perdurer. J'ai donc pris l'habitude de faire du rangement. Mais avant de détruire ce contenu du serveur, d'autres reprennent l'information et pointent vers la source. Au final, j'ai des erreurs 404 en pagaille.

Capture Dicodunet.com
Les liens sur vos pages
Avant de commencer à rechercher les erreurs, il faut différencier les liens que vous hébergez et les liens externes dirigés vers votre site. Dans le premier cas, les sources d'erreurs sont variées:
- fichier ou dossier déplacé, renommé ou supprimé
- changement de nom de domaine
- changement du rétrolien sur un blog
- vous faites une faute dans le lien hypertexte
- vous bloquez l'accès à une page (commentaire fermé)
Un gestionnaire de sites comme Dreamweaver est capable de vérifier tous ces liens. La correction est rapide et efficace pour les liens internes. Pour ce qui est des liens externes, il faudra repasser avec un logiciel plus performant.

Vérificateur de liens dans Dreamweaver MX
Il existe des logiciels adaptés à cet effet. Pendant longtemps, j'ai utilisé le freeware Xenu. Il génère parfois une myriade de liens erronés sans justification. Il semble également allergique aux liens vers Wikipedia et Dailymotion. Je préfère de loin Link Examiner. Il est plus propre dans ses résultats et le tableau est plus riche: code HTTP, nofollow, mots-clés, description, titre, temps d'accès, niveau de profondeur... Il lui manque un scan programmé de manière périodique. L'outil est efficace mais doit être géré avec délicatesse. Par exemple, une erreur 404 ne signifie pas que la page est définitivement supprimée.

Link Examiner marque les liens brisés en rouge
Cet outil de détection est efficace mais n'est pas à toute épreuve. À un moment donné, vous avez ajouté un lien dans l'un de vos articles. Le propriétaire du site abandonné n'a pas pris la peine de renouvelé le nom de domaine. Tombé dans le domaine public, il a été automatiquement repris par une ferme de liens. Du coup, le lien sur votre article est fonctionnel mais pointe vers un contenu erroné, à savoir de la publicité. Je n'ai pas (encore) trouvé de solutions pour ce type de problème.
Les liens sur le web vers vos pages
À l'inverse, il existe une série d'erreurs dont vous avez une action fort limitée. Les liens défectueux ne se trouvent pas sur vos pages mais disséminées un peu partout sur le web.
- un webmaster fait une erreur dans votre lien
- un webmaster héberge un lien désuet (cf les raisons ci-dessus)
- un internaute fait une faute de frappe dans l'adresse du site
- un internaute teste la présence d'une page (ex pour une série d'images)
- un robot teste des pages pour tenter de pirater le site
Il est vain de partir à la conquête des liens brisés laissés sur d'autres sites. Ces liens orphelins sont éparpillés tout azimut et resteront sans vie jusqu'au bon vouloir de l'hébergeur. Par contre - pour les liens pointant vers un même nom de domaine - il serait dommage d'en rester là et de ne pas profiter du trafic généré [¹]. L'exemple le plus courant est le renommage des permaliens [²]. Utilisez les redirections permanentes (type 301) pour dévier les hypertextes. WordPress possède d'ailleurs un plug-in assez génial: Redirection. L'administration est simple comme bonjour et évite de passer par le fichier .htaccess. L'extension gère également les erreurs 404.
Conclusion
La gestion des hyperliens doit être un travail quotidien sous peine de se retrouver à gérer un volume d'erreurs énorme. Pensez à nommer correctement vos URL dès le départ, de manière concise et contenant les bons mots clés. En cas de renommage, utilisez un système de redirection automatique pour vous épargner cette tâche rébarbative. Enfin, faite de la veille sur tous vos liens, non seulement les liens morts mais également les redirections.
[¹] La redirection peut être indépendante de votre volonté. C'est le cas des services en ligne pour raccourcir les adresses (du genre TinyURL).
[²] À lire: « Personnaliser ses permaliens »
