Information
Déverrouillez le pouvoir des REGEX dans la Search Console et boostez votre SEO
Les quoi ?
Non, il ne s’agit pas du dernier produit ménager à la mode pour obtenir un carrelage étincelant. En informatique, les REGEX, ou expressions régulières, correspondent à un modèle ou une séquence de caractères utilisée pour trouver une correspondance avec des modèles spécifiques dans des chaînes de texte.
Dans le contexte de l’optimisation pour les moteurs de recherche (SEO), les expressions régulières sont un moyen efficace de manipuler et d’extraire des informations à partir de grandes quantités de données textuelles afin notamment de mieux comprendre vos positionnements dans la Google Search Console.
On vous explique comment faire.
Pourquoi utiliser les REGEX en SEO ?
Avant cela, il convient d’indiquer que les expressions régulières sont extrêmement utiles dans l’optimisation des moteurs de recherche (SEO) pour plusieurs raisons clés.
Analyse des données
Les REGEX vous permettent d’extraire et d’analyser des modèles à partir de grandes quantités de données. En SEO, vous pouvez utiliser des regex pour analyser les journaux de serveur, les données d’analyse ou les feuilles de calcul pour identifier des modèles, tels que des tendances de mots-clés, des modèles d’URL ou des schémas de comportement des utilisateurs. Cette analyse peut vous aider à prendre des décisions éclairées en matière d’optimisation de votre site Web.
Identification de l'intention de recherche
Les REGEX peuvent vous aider à comprendre l’intention derrière les requêtes de recherche des utilisateurs. Par exemple, vous pouvez utiliser des regex pour identifier les requêtes transactionnelles (par exemple, contenant des mots tels que « acheter », « prix » ou « meilleur »), les requêtes informatives (contenant des mots tels que « comment », « quoi » ou « guide ») ou les requêtes locales (contenant des termes tels que « près de moi »). Cette compréhension peut vous aider à adapter votre contenu et vos stratégies de mots-clés pour mieux répondre aux besoins des utilisateurs.
Filtrage et segmentation
Les REGEX vous permettent de filtrer et de segmenter les données en fonction de critères spécifiques. Vous pouvez utiliser des regex pour filtrer les pages ou les requêtes qui correspondent à un modèle particulier, par exemple, les pages de produits ou les articles de blog. Cette segmentation vous permet d’analyser les performances de différentes sections de votre site Web et d’optimiser en conséquence.
Comment utiliser les REGEX dans la Search Console ?
Pour utiliser des expressions régulières dans Google Search Console, vous pouvez suivre ces étapes :
- accédez à Google Search Console. Connectez-vous à votre compte Google Search Console et sélectionnez le site Web approprié si vous en avez plusieurs configurés ;
- accédez au rapport « Performances ». Dans le menu de navigation de gauche, cliquez sur l’onglet « Performances ». Ce rapport fournit des informations sur la façon dont votre site Web apparaît dans les résultats de recherche Google, notamment les requêtes de recherche, les pages de destination, les clics, les impressions, etc ;
- choisissez le type de filtre. Dans le rapport Performances, vous verrez une option « Filtrer » au-dessus des tableaux de données. Cliquez sur le bouton « Filtrer » et sélectionnez « Requête » ou « Page » pour spécifier si vous souhaitez appliquer le filtre regex aux requêtes de recherche ou aux URL de page.
Comprendre les caractères regex de base
Les expressions régulières, ou regex, utilisent des caractères spéciaux pour créer des modèles de correspondance flexibles et puissants. Voici les caractères regex de base et leur signification :
- « ^ ». Ce caractère assure la correspondance du début. Lorsqu’il est utilisé au début d’une expression régulière, il indique que la correspondance doit commencer au début de la chaîne. Par exemple, ^chat correspond à toute chaîne commençant par « chat » ;
- « $ ». Ce caractère appelé « dollar » ou fin d’ancrage assure la correspondance de la fin. Lorsqu’il est placé à la fin d’une expression régulière, il indique que la correspondance doit se terminer à la fin de la chaîne. Par exemple, chat$ correspond à toute chaîne commençant par « chat » ,
- « . ». Ce caractère est appelé « point » et il correspond à n’importe quel caractère unique, à l’exception d’une nouvelle ligne. Par exemple, a.b correspond à « aab », « abb » ou « acb » ;
- « : ». Ce caractère est appelé « astérisque » ou « fermeture d’étoile » et il correspond à zéro, une ou plusieurs occurrences du caractère ou du groupe précédent. Par exemple, ab*c correspond à « ac », « abc » ou « abbbbc ».
- « + ». Ce caractère est appelé « plus » et il correspond à une ou plusieurs occurrences du caractère ou du groupe précédent. Par exemple, ab+c correspond à « abc », « abbc », « abbbc », etc ;
- « ? ». Ce caractère est appelé « point d’interrogation » et il correspond à zéro ou une occurrence du caractère ou du groupe précédent. Par exemple, ab?c correspond à « ac » ou « abc » ;
- « | ». Ce caractère est appelé « barre verticale » ou « barre de séparation » et il fournit une correspondance alternative. Il correspond à l’élément avant ou après la barre verticale. Par exemple, chat|chien correspond à « chat » ou « chien » ;
- « [] ». Les crochets sont utilisés pour créer des ensembles de caractères. Ils correspondent à tout caractère unique à l’intérieur des crochets. Par exemple, [abc] correspond à « a », « b » ou « c ». Vous pouvez également spécifier une plage de caractères, comme [a-z], qui correspond à tout caractère alphabétique minuscule ;
- « () ». Les parenthèses sont utilisées pour créer des groupes de capture. Ils vous permettent de capturer une partie spécifique d’une correspondance pour une utilisation ultérieure. Tout contenu mis entre parenthèses peut être rappelé et référencé. Par exemple, dans (chat)s, le « chat » peut être capturé comme groupe distinct ;
- « \ ». La barre oblique inverse est utilisée pour échapper à des caractères spéciaux, ce qui signifie qu’ils sont traités comme des caractères littéraux plutôt que comme des métacaractères. Par exemple, si vous souhaitez faire correspondre le caractère « $ » littéralement, vous devez l’échapper comme « $ ».
Filtrez, analysez et expérimentez
Pour finir :
- appliquer un filtre regex. Dans le champ de filtre, entrez votre expression régulière en utilisant les caractères ci-dessus. Par exemple, pour trouver toutes les requêtes contenant le mot « chat », vous pouvez utiliser le filtre regex « chat » ;
- analyser les résultats. Après avoir appliqué le filtre, Google Search Console mettra à jour les tableaux de données pour afficher uniquement les lignes correspondant à votre expression régulière. Vous pouvez analyser ces données pour obtenir des informations sur les performances de recherche de ces pages ou requêtes spécifiques ;
- expérimenter et ajuster. Les expressions régulières peuvent être complexes, alors n’ayez pas peur d’expérimenter et d’ajuster votre regex pour obtenir les résultats souhaités. Vous pouvez utiliser des outils en ligne tels que « Regex101 » ou « Regex Tester » pour tester et déboguer vos expressions régulières.
7 REGEX à utiliser dans votre Search Console pour votre SEO
Trouver les mots-clés à longue traîne :
^[\w\W\s\S]{75,}$
Cette regex correspond à toute requête contenant plus de 75 caractères. Vous pouvez ajuster la valeur numérique pour répondre à vos besoins spécifiques.
Extraire les requêtes transactionnelles :
(acheter|achetez|acheté|commander|commandez|commandé|vendre|vendez|vendu|prix|coût|coût|cher|bon marché|offres|deals|rabais|promo)
Cette REGEX capture les requêtes indiquant une intention d’achat ou une sensibilité aux prix.
Extraire les questions des prospects :
(qui|quand|comment|où|pourquoi|qu’est-ce que|comment faire pour)[ » « ]
Cette REGEX permet d’identifier les requêtes sous forme de questions, ce qui peut vous aider à créer du contenu ciblé.
Filtrer les requêtes par saison :
(hiver|printemps|été|automne)[ » « ]
Cette regex vous permet de filtrer les requêtes en fonction des saisons, ce qui est utile pour les entreprises sensibles à la saisonnalité.
Correspondance avec des nombres :
[0-9]
Cette REGEX simple correspond à toutes les requêtes contenant des nombres, ce qui peut être utile pour identifier les références de produits ou le contenu lié à une année spécifique.
Correspondance avec des URL non sécurisées :
http:\/\/.+?(?<!https:)
Cette REGEX correspond aux URL non sécurisées (HTTP au lieu de HTTPS), ce qui peut être utile pour identifier les pages qui doivent être migrées vers HTTPS.
Extraire les recherches de conseils ou de guide :
(comment|guide|tutoriel|conseils|astuces)
Cette REGEX correspond aux requêtes dans lesquelles les utilisateurs recherchent des informations ou des conseils. Ces termes indiquent souvent une intention informative, et la création de contenu ciblant ces requêtes peut aider à attirer le bon trafic sur votre site web.