Optimiser sa sitemap avec des regex
20 juillet 2012 par Ronan ChardonneauIl n’y a rien de plus pénible que d’optimiser une sitemap notamment lorsque l’on ne sait pas vers quel logiciel se tourner, ni même comment bien l’organiser. Du coup je tenais à vous montrer un petit tuto sur la façon dont vous pouvez optimiser une sitemap… avec des regex s’il vous vous plait
Modifier sa sitemap avec des regex
En fait quand vous allez créer votre sitemap vous allez avoir une structure telle que celle ci:
Comme vous pouvez le constater les lignes contiennent: des retours à la ligne, des tabulations, des balises et du texte… bon ben tout cela on peut l’écrire en regex non?
Une tabulation c’est \t
Un retour à la ligne \n
Un nombre infini de caractères .*
Donc si l’on souhaite par exemple supprimer toute une URL de notre sitemap on aura une regex de type (ou .* prendra la valeur que l’on souhaite rechercher puis remplacer par exemple):
\t<url>\n\t\t<loc>.*</loc>\n\t\t<lastmod>.*</lastmod>\n\t\t<changefreq>.*</changefreq>\n
Concrètement:
Et voilà comment gagner énormément de temps en optimisant ces sitemap en quelques lignes d’expressions régulières. Sympa non?



