Optimiser sa sitemap avec des regex

20 juillet 2012 par

Il n’y a rien de plus pénible que d’optimiser une sitemap notamment lorsque l’on ne sait pas vers quel logiciel se tourner, ni même comment bien l’organiser. Du coup je tenais à vous montrer un petit tuto sur la façon dont vous pouvez optimiser une sitemap… avec des regex s’il vous vous plait :)

Modifier sa sitemap avec des regex

En fait quand vous allez créer votre sitemap vous allez avoir une structure telle que celle ci:

Sitemap regex

Comme vous pouvez le constater les lignes contiennent: des retours à la ligne, des tabulations, des balises et du texte… bon ben tout cela on peut l’écrire en regex non?

Une tabulation c’est \t

Un retour à la ligne \n

Un nombre infini de caractères .*

Donc si l’on souhaite par exemple supprimer toute une URL de notre sitemap on aura une regex de type (ou .* prendra la valeur que l’on souhaite rechercher puis remplacer par exemple):

\t<url>\n\t\t<loc>.*</loc>\n\t\t<lastmod>.*</lastmod>\n\t\t<changefreq>.*</changefreq>\n

Concrètement:

regex en sitemap

Et voilà comment gagner énormément de temps en optimisant ces sitemap en quelques lignes d’expressions régulières. Sympa non?

Laisser une réponse

Notifiez-moi des commentaires à venir via email. Vous pouvez aussi vous abonner sans commenter.