Aller au contenu

Comment identifier des balises Hn vides avec Screaming Frog ?

Antoine Brisset
Antoine Brisset
Temps de lecture : 2 min
Comment identifier des balises Hn vides avec Screaming Frog ?
Photo by Zdeněk Macháček / Unsplash

Table des matières

L'étude du balisage sémantique fait partie des nombreux points de ma checklist lorsque je réalise un audit SEO.

À ce niveau, je m'attarde généralement en priorité sur :

  • la présence d'une balise h1
    • non dupliquée
    • unique dans la page
  • la hiérarchie des élements dans le DOM : d'abord un h1, puis éventuellement un h2, puis éventuellement un h3, etc.
  • le bon usage des balises header, nav, section, article, aside, footer

Je regarde aussi, pour chaque template de page, si des balises Hn vides ne trainent pas dans le code source.

Et oui, ça peut paraître fou mais c'est un problème que je rencontre souvent, et qui peut avoir des causes multiples :

  • un oubli du développeur
  • une mauvaise manipulation lors de l'ajout d'un saut de ligne via l'éditeur de texte (courant sur WordPress)
  • un bug dans la matrice

Pour corriger ce genre d'écueil, j'utilise l'excellent plugin Headings Map en passant au crible, manuellement, chaque template de page.

Mais quand le problème se répète de façon anarchique, dans des dizaines voire des centaines d'articles de blog par exemple, cela devient beaucoup trop chronophage de faire ce travail à la main.

Alors comment procéder pour automatiser la vérification des balises Hn vides lors d'un crawl avec Screaming Frog par exemple ?

Nativement, ce n'est pas possible. Enfin si, mais partiellement.

Pour les balises h1 et h2, on a en effet l'info de la longueur de la balise dans les onglets H1 et H2, mais uniquement pour les 2 premières balises h1 ou h2 trouvées dans la page. Si celle-ci en compte davantage, on n'a tout simplement pas l'info.

Pour les balises h3 à h6, en revanche, nada.

Ce qui serait cool, c'est d'avoir une colonne avec le nombre de balises Hn vides trouvées, pour chaque URL crawlée.

Du coup, ce qu'on va faire, c'est qu'on va utiliser la (géniale) fonctionnalité "Custom Extraction" que vous retrouverez dans le menu Configuration > Custom > Extraction.

Il suffit de donner un titre à notre champ, par exemple "h2 vides" et de renseigner le xpath suivant :

count(//h2[normalize-space(.)=""])

Explications :

  1. je récupère le contenu des h2 figurant dans le document avec //h2
  2. je nettoie celui-ci en supprimant les espaces éventuels via normalize-space(.)
  3. je ne garde que ceux qui sont vides (="")
  4. et je les compte grâce à la fonction count
Extraction personnalisée

Je sélectionne ensuite "Function Value" dans le dernier champ, je valide et je lance le crawl.

Pour chaque URL, je retrouve alors le nombre de balises h2 vides dans l'onglet Custom Extraction. S'il n'y en a aucune, la valeur affichée sera 0.

Bien entendu, on peut répéter l'opération avec l'ensemble des balises Hn, de h1 à h6.

Enjoy !

Screaming Frog

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.

Commentaires


Articles Similaires

Membres Public

Comment identifier les ancres de liens génériques avec Screaming Frog ?

Screaming Frog dispose, depuis la version 17.0, d'une fonctionnalité permettant d'identifier les liens internes utilisant des ancres génériques, aka non-descriptive anchor text. Plutôt cool pour corriger/améliorer son maillage interne. Le hic, c'est que par défaut, les ancres de liens définies comme "non descriptives" sont en anglais. Tu peux

Comment identifier les ancres de liens génériques avec Screaming Frog ?
Membres Public

Comment identifier des mentions sans lien avec Screaming Frog ?

Aujourd'hui, j'aimerais te partager une petite astuce pour identifier facilement les mentions sans lien avec Screaming Frog. La recherche de ces "unbranded brand mentions" figure parmi les premiers quick wins à aller chercher en matière de netlinking. C'est plutôt adapté aux sites ayant déjà une certaine notoriété, c'est vrai, mais

Comment identifier des mentions sans lien avec Screaming Frog ?
Membres Public

Comment enrichir le rapport liens externes de la Search Console avec Screaming Frog ?

La Search Console est vraiment un super outil. Pourtant, certains rapports sont à mon sens peu exploités. C'est le cas notamment de celui sur les liens externes (Liens > Exporter les liens externes > Liens les plus récents). Alors, c'est vrai, il a plusieurs inconvénients : * il est long à se mettre à

Comment enrichir le rapport liens externes de la Search Console avec Screaming Frog ?