Le « not provided », bête noire du SEO

not provided

24 juil Le « not provided », bête noire du SEO

Le « not provided » fait désormais partie du quotidien de chaque utilisateur de logiciels analytics essayant d’en savoir plus sur les performances du référencement naturel de son site. Si sa signification est relativement simple, l’explication de sa présence sur nos Web analytics s’avère plus compliquée, et nécessite un retour en arrière de quelques années pour comprendre les raisons de son apparition.

Les origines du « not provided »

Jusqu’au deuxième trimestre de l’année 2011, les données Web analytics disponibles pour le référencement naturel regorgeaient de mots-clés et d’indications sur la valeur de chacun (sessions, ventes…). Ces informations sont fournies par le referrer qui transmet à un serveur, l’adresse de la page précédemment visitée par l’internaute. Le referrer peut donc renvoyer à l’adresse d’une page de résultats d’un moteur de recherche, comme d’une page web d’un site tiers.

Supposons que l’on se rende sur le site e-commerce d’un vendeur de chaussures suite à la recherche « chaussure » sur Google, l’adresse fournie par le referrer était la suivante (jusqu’en 2011) :


http://www.google.fr/search?q=chaussure


Le mot-clé « chaussure » apparaissait alors dans le Web analytics du marchand comme étant à l’origine d’une visite en référencement naturel sur la période considérée, voire d’une vente si l’internaute réalisait ensuite une transaction.

Tout allait pour le mieux dans le meilleur des mondes du webmarketing, jusqu’à ce que Google décide de renforcer la confidentialité des recherches des utilisateurs de son moteur de recherche et de ses activités connexes. La firme de Mountain View va recourir au protocole SSL, initialement créé pour sécuriser les paiements sur internet, pour renforcer la sécurité de son moteur de recherche. Cet encodage est d’ailleurs observable au début de chaque URL avec l’acronyme HTTPS qui représente la combinaison du HTTP avec la méthode de chiffrement des données citée précédemment.

Google choisira à partir de cet instant de ne plus fournir qu’un referrer tronqué de l’information relative à la « query », autrement dit les mots-clés de la recherche. L’adresse transmise par le referrer devient la suivante :


https://www.google.fr/search?q=


En conséquence, les Web analytics reconnaissent toujours un referrer leur indiquant une session générée par Google, mais n’ont plus l’information concernant la query. C’est là qu’apparaît alors le « not provided », qui traduit simplement l’absence de la donnée de mots-clés.

 En 2011, cette tendance concernait uniquement les utilisateurs naviguant avec un compte Google, soit moins de 10% des recherches de l’époque. Sept mois plus tard, Google généralisait cette pratique à l’ensemble des recherches émises sur son moteur de recherche.

not-provided

Evolution du “not provided” en France entre Janvier 2013 et Janvier 2014 d’après d’AT Internet

Si vous souhaitez suivre la progression du « not provided », il est possible de l’observer sur www.notprovidedcount.com qui réalise une moyenne en temps réel de la progression du “not provided” sur 60 sites.

La controverse du not provided

Bien que tous deux relèvent de la dynamique de confidentialité initiée par Google fin 2011, l’instauration du HTTPS et l’apparition du « not provided » sont deux événements synchrones, mais distincts.

L’explication officielle du passage au HTTPS prend racine dans la philosophie même de Google et de ses 10 principes fondamentaux, plus précisément de son adage principal : « Recherchez l’intérêt de l’utilisateur ; le reste suivra. ». En effet, d’après un communiqué officiel du 18 Octobre 2011, Google affirme que la protection des données issues de l’activité de ses utilisateurs représente un enjeu majeur dans le cadre de la garantie d’un service de qualité, en parallèle à l’augmentation significative des recherches exprimées sur son moteur.

Si le recours au protocole SSL/TLS est justifié dans une optique de confidentialité renforcée, la suppression de la données de mot-clé est-elle plus discutable. Danny Sullivan, rédacteur chez Search Engine Land a publié le 22 Octobre 2011 un article de référence sur la question et expose les arguments suivants :

– Les campagnes Adwords permettaient toujours aux annonceurs travaillant avec Google d’avoir accès à un referrer complet afin de pouvoir évaluer l’impact de leurs campagnes marketing. En supprimant les données de mots-clés du referrer, seuls les clients de Google avaient ainsi le privilège d’analyser le potentiel de conversions des mots-clés. Cette critique se retrouve dans l’article de Renaud Joly : « Chez Google, la protection de la vie privée s’arrête aux portes de la régie publicitaire. »

Ce n’est qu’en Avril 2014 que Google, suite au tollé général qu’a provoqué cette situation ambiguë, décida de supprimer également la donnée de mot-clé du referrer sur Adwords, jusque-là encore présent.

Une migration progressive des moteurs de recherche vers le not provided

Depuis le changement opéré par Google en 2011, de nombreux moteurs de recherche ont progressivement migré vers le HTTPS et supprimé la donnée de mot-clé du referrer :

  • En Juin 2014, le moteur de recherche russe Yandex publie officiellement sur son blog l’annonce du passage au 100% “not provided”.
  • Fin Juin 2015, le moteur de recherche chinois Baidu confirme également le recours au HTTPS.

A terme, ce sont donc tous les principaux moteurs de recherche qui ont adopté le modèle HTTPS concomitamment à la suppression de la query.

Une solution miracle au not provided ?

Dans la vie, il n’y a pas de magie. Lorsqu’une donnée n’est plus fournie, il est impossible d’y accéder. Il existe cependant quelques outils et astuces pour en savoir plus sur les requêtes des internautes qui ont amené du trafic et des ventes sur votre site. Nous y reviendrons plus en détail dans un prochain article.

Un outil incontournable dans la récupération des mots clés qui font des visites sur votre site : Google Search Console.