Aller au contenu

Cache Google : quelques petites réflexions

Antoine Brisset
Antoine Brisset
Temps de lecture : 3 min
Cache Google : quelques petites réflexions

Table des matières

Bonjour et bienvenue dans cette 100ème (!) édition de la newsletter SEO Memento.

Et voilà, encore une fonctionnalité qui disparaît de la page de résultats Google : le lien vers la version en cache.

Depuis quelque temps déjà, le lien avait été "dissimulé" dans la fenêtre modale qui s'affichait au clic sur les 3 petits points verticaux, à côté de chaque résultat de recherche.

Aujourd'hui, ce lien a disparu.

Quelle solution pour voir le cache ?

Pour obtenir la version mise en cache par Google, il reste deux solutions (mais pour combien de temps encore ?) :

  • taper la commande cache: suivi de l'URL à vérifier, exemple cache:https://www.seomemento.com/
  • utiliser un bookmarklet pour ouvrir directement le cache d'URL en cours
javascript:var a=location.href;window.open("https://webcache.googleusercontent.com/search?q=cache:"+a)
Version en cache de seomemento.com

À noter qu'il est possible de jouer avec les paramètres de l'URL pour obtenir directement le résultat souhaité :

  • version texte (sans les CSS/JS) : ajouter le paramètre strip=1

Exemple : https://webcache.googleusercontent.com/search?q=cache:https://www.seomemento.com/&strip=1

  • version HTML : ajouter le paramètre vwsrc=1 ("vwsrc" pour "view:source")

Exemple : https://webcache.googleusercontent.com/search?q=cache:https://www.seomemento.com/&vwsrc=1

Version en cache version dans l'index

Petit rappel d'importance : ce que Google affiche dans la version texte ne correspond pas forcément à ce que les robots de Google ont indexé.

En effet, comme expliqué dans la doc, le cache correspond à la version HTML brute obtenue par les robots de Google.

Version que le navigateur essaie d'interpréter lorsqu'il charge la page à l'adresse https://webcache.googleusercontent.com/search?q=cache:monsite.com.

Il est donc possible (mais toutefois pas garanti) que Google ait indexé du contenu supplémentaire lors de la phase de rendering, et donc que celui-ci ne soit pas visible dans la version "en texte seul".

Le cache m'affiche une page "cassée", pourquoi ?

Cross-Origin Resource Sharing (CORS)

Si le cache en version intégrale affiche une page cassée – typiquement à cause de fichiers JS non exécutés – c'est en général lié au mécanisme CORS (Cross Origin Requests).

En effet, par mesure de sécurité, les navigateurs modernes empêchent tout nom d'hôte non autorisé (en l'occurrence ici https://webcache.googleusercontent.com) de charger une ressource lorsque le header Access-Control-Allow-Origin est absent de la réponse HTTP.

Erreurs CORS dans la console Chrome

Pour en savoir plus : https://developer.mozilla.org/fr/docs/Glossary/CORS.

Problème de CSS

Autre hypothèse : le fichier CSS utilisé par la page a été mis à jour, ce qui a généré un nouveau nom de fichier.

Si Google n'est pas encore repassé sur la page, il n'a pas connaissance de ce nouveau fichier. La page en cache appelle donc encore l'ancienne URL du fichier CSS, qui répond en 404. Résultat : aucun style n'est chargé.

C'est souvent le cas avec les frameworks modernes, qui génèrent un nouveau hash à chaque modification de fichier CSS et/ou JS. L'objectif étant de "forcer" les navigateurs à télécharger la nouvelle version.

Le cache est-il fiable ?

On a pu le voir avec les points précédents, il ne faut pas se fier au cache Google car ce n'est pas une représentation exacte de ce que Google "voit".

C'est utile :

  • pour voir à quelle date Google a exploré une page pour la dernière fois (et si les changements effectués sur celle-ci ont été pris en compte)
  • pour inspecter, éventuellement, le snapshot HTML qui a été récupéré
  • pour détecter un cloaking

Mais ce n'est pas un outil suffisant pour aider à la prise de décision.

Pour être sûr de ce que Google "voit", mieux vaut tester ce qui s'affiche dans la Search Console (Inspection de l'URL > Tester l'URL active)

Test dans la GSC

Empêcher Google de mettre une page en cache

Dernière chose, il est possible d'empêcher Google d'afficher un lien en cache en utilisant la valeur noarchive de la meta robots.

Voilà, j'espère que ça pourra t'aider à y voir plus clair sur le cache de Google 😀

DiversBookmarklets

Antoine Brisset Twitter

Consultant SEO depuis 2010. Je traque les clics inutiles et j'automatise les tâches répétitives pour gagner du temps dans mon quotidien de travailleur du web.


Articles Similaires

Membres Public

Comment sélectionner un texte et en extraire automatiquement les liens avec un bookmarklet ?

Ça faisait un petit moment que je n'avais pas partagé de bookmarklets et la semaine dernière, coup sur coup, je suis tombé sur cette vidéo de Luca Fancello et sur cet article de Yapasdequoi ! La vidéo de Luca est une introduction aux bookmarklets, avec des démos et un

Comment sélectionner un texte et en extraire automatiquement les liens avec un bookmarklet ?
Membres Public

Sais-tu ce que Google pense de ton site ?

Aujourd'hui, j'aimerais te parler d'une fonctionnalité Google assez méconnue. Il s'agit du menu "À propos de ce résultat" que Google affiche quand on clique sur les 3 petits points à droite des résultats de recherche. Pourtant, celui-ci contient des informations

Sais-tu ce que Google pense de ton site ?
Membres Public

Comment extraire le root domain d'une liste d'URLs en bulk ? (OUTIL GRATUIT)

C'est un problème qui revient régulièrement dans la sphère SEO : comment extraire le domaine racine d'une URL ? J'ai souvent vu passer des tweets à ce sujet, comme ici ou là. Nicolas de Tremplin Numérique en a même parlé dernièrement dans sa conférence sur les

Comment extraire le root domain d'une liste d'URLs en bulk ? (OUTIL GRATUIT)