Aller au contenu

Comment récupérer les URLs d'un sitemap XML avec Screaming Frog (sans les crawler) ?

Antoine Brisset
Antoine Brisset
Temps de lecture : 1 min
Comment récupérer les URLs d'un sitemap XML avec Screaming Frog (sans les crawler) ?
Photo by Tevin Trinh / Unsplash

Table des matières

Il y a quelques semaines, j'ai découvert dans cet article une astuce toute bête mais très pratique pour extraire les URLs d'un sitemap XML avec Screaming Frog.

L'idée c'est d'utiliser le mode liste de Screaming Frog de la façon suivante :

  • cliquer sur Download XML Sitemap
  • coller l'URL du sitemap
  • lancer le crawl
  • mettre immédiatement le crawl en pause
  • exporter les URLs (Bulk Export > Queued URLs)

Ce qui est cool, c'est que ça fonctionne même avec les index de sitemaps : on récupère directement les URLs listées dans chaque sitemap enfant !

Quand j'ai vu ce hack, je me suis dit qu'on pouvait faire encore plus simple.

En fait, dès que Screaming Frog a terminé de lire toutes les URLs, il suffit de copier toutes les données à partir du 1er "Found" jusque "Completed Reading".

Chargement des URLs dans Screaming Frog

Puis d'ouvrir une feuille de calcul Google Sheets (https://sheets.new/), de coller les données et de cliquer sur Données > Scinder le texte en colonnes.

Extraction des URLs dans Google Sheets

Et voilà !

Screaming Frog

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.


Articles Similaires

Membres Public

Comment faire une analyse rapide du maillage interne d'une page avec Screaming Frog ?

La semaine dernière, en lisant la newsletter de Soumettre, je suis tombé sur cet excellent article de Cyrus Shepard sur les ancres de liens. L'auteur y dévoile les résultats de plusieurs tests qu'il a menés pour déterminer quelles sont les ancres de liens prises en compte par Google quand une

Comment faire une analyse rapide du maillage interne d'une page avec Screaming Frog ?
Membres Public

Vérification du contenu dupliqué avec Screaming Frog : attention au contenu "boilerplate"

La semaine derrière, j'ai suivi quelques unes des conférences de la SEO Garden Party organisée par Linksgarden. J'ai notamment écouté avec beaucoup d'attention l'intervention de Sylvain Peyronnet sur le sujet de l'audit algorithmique. Sylvain a évoqué la question de la duplication interne et a expliqué pourquoi il était judicieux de

Vérification du contenu dupliqué avec Screaming Frog : attention au contenu "boilerplate"
Membres Public

Comment identifier les ancres de liens génériques avec Screaming Frog ?

Screaming Frog dispose, depuis la version 17.0, d'une fonctionnalité permettant d'identifier les liens internes utilisant des ancres génériques, aka non-descriptive anchor text. Plutôt cool pour corriger/améliorer son maillage interne. Le hic, c'est que par défaut, les ancres de liens définies comme "non descriptives" sont en anglais. Tu peux

Comment identifier les ancres de liens génériques avec Screaming Frog ?