Web2e

Les regex seo pour nettoyer vos données, affiner vos rapports et booster la performance de vos contenus

Les regex seo pour nettoyer vos données, affiner vos rapports et booster la performance de vos contenus

Les regex seo pour nettoyer vos données, affiner vos rapports et booster la performance de vos contenus

Si vous faites du SEO sérieusement, vous passez forcément du temps dans Google Analytics, Google Search Console, vos logs, vos exports… et vous vous retrouvez avec des données parfois sales, mal segmentées, difficiles à lire.

Adresses URL avec des paramètres inutiles, requêtes « brand » mélangées au reste, pages de pagination dans vos rapports, spam, tracking interne… Tout ça vient polluer vos analyses, vos décisions, et au final vos résultats.

La plupart des SEO laissent passer ça. Les autres utilisent un outil sous-coté : les regex.

Non, les regex (expressions régulières) ne sont pas réservées aux développeurs. Utilisées intelligemment, elles deviennent une arme pour :

On va voir comment, de façon concrète et actionnable.

Pourquoi les regex sont un game changer en SEO

Les regex, c’est un langage ultra compact pour filtrer, regrouper ou transformer des chaînes de caractères (URL, requêtes, hostnames, événements…).

En SEO, ça change la donne pour trois raisons :

Et surtout : c’est réutilisable. Une bonne regex, vous pouvez la copier-coller entre Analytics, Data Studio (Looker Studio), Google Search Console, voire vos outils maison.

Où utiliser les regex dans votre stack SEO

Vous n’avez pas besoin de tout refondre dans vos outils. Commencez là où l’impact est direct.

L’idée n’est pas de devenir expert regex, mais de maîtriser 20 % des patterns qui vous donneront 80 % des gains.

Les bases des regex à connaître pour le SEO

Pas besoin d’apprendre un nouveau langage. Gardez juste ces briques en tête :

Exemple simple :

^/blog/.* = toutes les URLs qui commencent par /blog/.

Exemple un peu plus utile :

^/(blog|guide|ressources)/.* = toutes les URLs qui commencent par /blog/ ou /guide/ ou /ressources/.

Des patterns très utiles tout de suite

Voici quelques regex « prêtes à l’emploi » qui couvrent la majorité des cas SEO.

1. Exclure les pages de pagination

Vous avez des URLs du type : /categorie/?page=2, /categorie/?page=3

Regex :

\?page=[0-9]+

Utilisation typique : exclure ces URLs de certains rapports de performance pour se concentrer sur les pages principales.

2. Cibler uniquement les pages produits

Vos produits suivent le pattern /produit/nom-du-produit ou /product/....

Regex :

^/(produit|product)/.+

3. Exclure les paramètres de tracking

Vous avez des URLs avec utm_source, utm_medium, fbclid, etc.

Regex (pour identifier ces paramètres) :

(utm_(source|medium|campaign)|fbclid|gclid)=

Ensuite, vous pouvez les exclure de vos rapports ou les normaliser en amont via vos outils.

4. Séparer brand vs non-brand dans vos requêtes SEO

Votre marque est « Web2e » (ou une variante).

Regex brand :

(web2e|web 2e|web-2e)

Vous pouvez filtrer :

5. Filtrer les requêtes transactionnelles

Vous voulez isoler les requêtes avec intention « achat ». Exemple pour un site e-commerce généraliste :

(acheter|prix|pas cher|promo|réduction|code promo)

À utiliser dans Google Search Console sur les requêtes pour voir ce que génère vraiment « l’intention business » de votre SEO.

Nettoyer vos données : le socle d’un bon pilotage SEO

Un SEO qui se respecte ne prend pas de décisions sur des données sales. Les regex vous aident à rendre vos rapports à peu près honnêtes.

1. Éliminer le bruit des URLs parasites

Typiquement, vous voulez :

Une regex possible pour exclure ces pages dans GA4 :

^/(wp-admin|wp-login\.php|wp-json|api|staging|test)/

2. Fusionner des variations d’URLs

Problème classique : la même page se retrouve en plusieurs versions dans vos rapports à cause de paramètres ou de trailing slash.

Exemples :

Avec une regex, vous pouvez par exemple :

3. Assainir les rapports de logs

Les fichiers de logs sont souvent une décharge totale. Vous pouvez rapidement :

Résultat : vous vous concentrez sur ce qui intéresse vraiment les bots de Google côté SEO.

Affiner vos rapports : passer de « joli » à « utile »

Un rapport SEO sans segmentation, c’est de la décoration. Les regex permettent de construire des segments pertinents, directement exploitables.

1. Segmenter par type de contenu

Supposons que vos URL suivent ce type de structure :

Regex de regroupement dans Looker Studio :

En créant un champ calculé « Type de contenu » basé sur ces regex, vous pouvez analyser :

par type de contenu, et pas URL par URL.

2. Construire un vrai rapport brand vs non-brand

Dans Google Search Console :

Vous saurez enfin :

3. Isoler les pages qui comptent vraiment dans les KPI

Toutes les pages ne valent pas la même chose. Vous pouvez :

Exemple pour un e-commerce :

^/(produit|categorie|panier|checkout)/

Appliqué dans GA4, ce filtre vous donne une vision « business-first » de votre SEO.

Booster la performance de vos contenus avec les regex

À partir du moment où vos données sont propres et vos rapports segmentés, vous pouvez utiliser les regex pour aller chercher des opportunités très concrètes.

1. Identifier les contenus à fort potentiel latent

Dans Google Search Console, sur l’onglet « Performances » :

Vous pouvez raffiner encore avec une regex sur les requêtes :

2. Repérer les requêtes mal adressées par vos contenus

Vous pouvez créer des regroupements de requêtes par intention grâce aux regex :

En filtrant par cluster de requêtes, vous voyez immédiatement :

3. Prioriser les optimisations on-page

En combinant :

vous obtenez une short-list précise :

C’est là que vos efforts on-page (titre, H1, structure, enrichissement sémantique, UX) vont rapporter le plus vite.

Un workflow simple pour intégrer les regex dans votre quotidien SEO

Pour ne pas vous perdre, structurez votre usage des regex comme un process.

Étape 1 : cartographiez vos patterns

Étape 2 : créez une bibliothèque de regex

Étape 3 : testez systématiquement

Étape 4 : industrialisez dans vos rapports

Étape 5 : faites évoluer vos patterns

Les pièges classiques à éviter

Quelques erreurs récurrentes qui font perdre du temps (ou des données) :

Passer à l’action dès maintenant

Si vous deviez résumer l’usage des regex en SEO en une phrase : elles vous permettent de voir ce qui compte vraiment dans vos données.

Pour les intégrer à votre pratique, vous pouvez dès aujourd’hui :

Vous verrez très vite la différence : moins de bruit, plus de signal, et surtout des décisions SEO plus nettes.

Les regex ne rendent pas votre contenu meilleur par magie. En revanche, elles vous donnent une vision beaucoup plus claire de là où vos efforts éditoriaux et techniques auront le plus d’impact. Et pour un SEO orienté performance, c’est exactement ce dont vous avez besoin.

Quitter la version mobile