Aller au contenu

Comment identifier des balises Hn vides avec Screaming Frog ?

Antoine Brisset
Antoine Brisset
Temps de lecture : 2 min
Comment identifier des balises Hn vides avec Screaming Frog ?
Photo by Zdeněk Macháček / Unsplash

Table des matières

L'étude du balisage sémantique fait partie des nombreux points de ma checklist lorsque je réalise un audit SEO.

À ce niveau, je m'attarde généralement en priorité sur :

  • la présence d'une balise h1
    • non dupliquée
    • unique dans la page
  • la hiérarchie des élements dans le DOM : d'abord un h1, puis éventuellement un h2, puis éventuellement un h3, etc.
  • le bon usage des balises header, nav, section, article, aside, footer

Je regarde aussi, pour chaque template de page, si des balises Hn vides ne trainent pas dans le code source.

Et oui, ça peut paraître fou mais c'est un problème que je rencontre souvent, et qui peut avoir des causes multiples :

  • un oubli du développeur
  • une mauvaise manipulation lors de l'ajout d'un saut de ligne via l'éditeur de texte (courant sur WordPress)
  • un bug dans la matrice

Pour corriger ce genre d'écueil, j'utilise l'excellent plugin Headings Map en passant au crible, manuellement, chaque template de page.

Mais quand le problème se répète de façon anarchique, dans des dizaines voire des centaines d'articles de blog par exemple, cela devient beaucoup trop chronophage de faire ce travail à la main.

Alors comment procéder pour automatiser la vérification des balises Hn vides lors d'un crawl avec Screaming Frog par exemple ?

Nativement, ce n'est pas possible. Enfin si, mais partiellement.

Pour les balises h1 et h2, on a en effet l'info de la longueur de la balise dans les onglets H1 et H2, mais uniquement pour les 2 premières balises h1 ou h2 trouvées dans la page. Si celle-ci en compte davantage, on n'a tout simplement pas l'info.

Pour les balises h3 à h6, en revanche, nada.

Ce qui serait cool, c'est d'avoir une colonne avec le nombre de balises Hn vides trouvées, pour chaque URL crawlée.

Du coup, ce qu'on va faire, c'est qu'on va utiliser la (géniale) fonctionnalité "Custom Extraction" que vous retrouverez dans le menu Configuration > Custom > Extraction.

Il suffit de donner un titre à notre champ, par exemple "h2 vides" et de renseigner le xpath suivant :

count(//h2[normalize-space(.)=""])

Explications :

  1. je récupère le contenu des h2 figurant dans le document avec //h2
  2. je nettoie celui-ci en supprimant les espaces éventuels via normalize-space(.)
  3. je ne garde que ceux qui sont vides (="")
  4. et je les compte grâce à la fonction count
Extraction personnalisée

Je sélectionne ensuite "Function Value" dans le dernier champ, je valide et je lance le crawl.

Pour chaque URL, je retrouve alors le nombre de balises h2 vides dans l'onglet Custom Extraction. S'il n'y en a aucune, la valeur affichée sera 0.

Bien entendu, on peut répéter l'opération avec l'ensemble des balises Hn, de h1 à h6.

Enjoy !

Screaming Frog

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et j'automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.


Articles Similaires

Membres Public

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !

Quand je reçois des contenus au format Word ou Google Docs, il arrive souvent qu'en les collant dans l'éditeur WordPress (ou un autre éditeur WYSIWIG), les titres soient automatiquement mis en gras. Ce qui donne par exemple ce type de code HTML : <h2><

Balise strong dans une balise hn : détectez la suroptimisation avec Screaming Frog !
Membres Public

Comment vérifier ses liens d'affiliation avec Screaming Frog ?

Quand on fait de l'édition de sites, on passe beaucoup de temps à créer du contenu, à le promouvoir, à faire des liens. Mais on oublie parfois le plus important : s'assurer que les liens d'affiliation qu'on a glissés dans nos contenus sont

Comment vérifier ses liens d'affiliation avec Screaming Frog ?
Membres Public

Brotli, tu connais ?

Il y a quelques mois, j'avais partagé l'astuce suivante sur Twitter. Petit tips #ScreamingFrog La configuration par défaut de Screaming Frog n'ajoute pas automatiquement la compression Brotli au champ "Accept-Encoding" (il n'y a que Gzip). — Antoine Brisset (@ABrisset) March 27,

Brotli, tu connais ?