In den letzten Monaten ließ sich in Google Analytics ein besonderer Eintrag in der Auflistung der organischen Suchbegriffe beobachten: (not provided). Inzwischen dürfte die Zeile bei den meisten Websites der erste Eintrag sein. Was steckt dahinter?
Im vergangenen Jahr startete Google eine große Kampagne zu Verbesserung der Datensicherheit seiner Nutzer. Seitdem wird für Nutzer, die sich in ihren Google Account einloggen, die Verbindung mit SSL verschlüsselt, also über https geleitet. Das heißt, sobald ein Nutzer für Gmail, Google+, die personalisierte Suche oder irgendeinen anderen Dienst angemeldet ist, läuft die Übertragung per https. Außerdem lässt sich Google auch direkt per https aufrufen. Das macht z.B. die Suchbox des neuen Firefox in der Grundeinstellung so.
In all diesen Fällen verändert sich – neben der Verschlüsselung – noch ein weiteres Detail auf der Suchergebnisseite. Den Weiterleitungslinks, die zur Zielseite führen und als Referrer im Tracking ankommen, fehlt der eingegeben Suchbegriff. Somit kommt im Trackingcode auf der Website kein Suchbegriff mehr an – egal welches Tool man nutzt, nicht nur bei Google Analytics.
Kleiner Exkurs: Wenn man von einer https Seite auf eine unverschlüsselte Seite verlinkt, wird gar kein Referrer vom Browser übertragen. Das ist ein Sicherheitsfeature. Google leitet inzwischen auch die organischen Ergebnisse alle zunächst über eine interne URL, die immer über http läuft. Die URL der Suchergebnisseite kommt also eh nie bei der Website an, sondern dafür immer diese Weiterleitung. Die Ziel-URL setzt Google als Alt-Text, so dass sie im Browser erscheint, wenn man mit der Maus darüber fährt. Im Quelltext taucht sie aber nicht auf.
Google stellte bei den amerikanischen Seiten im November 2011 um, in Europa im März 2012. Im Durchschnitt machen notprovided-Zugriffe etwa 25% aus, im Amerika rund 30% – je nach Website und Besuchertyp. In einer Studie von AT Internet wird die Entwicklung für Amerika und Frankreich (vergleichbar mit Deutschland) deutlich. Bei jedem vierten Besucher wird der verwendete Suchbegriff nicht mehr übergeben.
Die Webanalyse Tools haben zwar alle das gleiche Problem, aber der Umgang damit ist unterschiedlich. Sie können zwar noch erkennen, dass der Besucher von Google kam – die Sucheingabe fehlt aber. Google Analytics weißt diesen Besuchen das Keyword (not provided) zu, so dass man immerhin erkennen kann, wer mit einer Suche kam. Webtrekk nennt es ebenfalls not provided, kennt es aber anscheinend erst seit Ende Juli
AT Internet gibt dem Eintrag einfach keinen Namen, Daten werden seit Beginn erfasst
Bei etracker gibt es anscheinend keinen “Sammeleintrag” für die fehlenden Begriffe – immerhin werden die Besucher aber weiterhin Suchmaschinen zugerechnet.
Was sind die Konsquenzen für die Webanalyse?
Die Gesamtzahl der Suchen über Google bleibt identisch. Solange das Auswertungsprogramm die Referrer betrachtet, wird es auch die organischen Sucher weiterhin korrekt ausweisen. Manche Tools gehen aber nach vorhandenen Keywordparametern im Referrer – bei ihnen sinkt die Zahl der Suchenden und die Zahl der Links von Google steigt.
Der Platzhalter notprovided steht nicht für ein einzelnes Keyword, sondern ist so etwas wie ein Sammelbecken. Der Anteil von High-Traffic Keywords (etwa Brand-Namen) dürfte ähnlich sein wie bei unverschlüsselten Besuchern. Bei den Longtail Keywords – also Eingaben, mit denen Besucher nur ein einziges mal auf die Seite kamen – sieht das anders aus. Sie sind entweder im sichtbaren Teil oder eben notprovided. Der Anteil unterschiedlicher Eingaben sinkt also.
Kritisch wird es, wenn die Trafficdaten einzelner Keywords betrachtet werden, etwa zusammen mit dem Ranking. Die absolute Zahl der Visits über ein Keyword geht zurück. Im zeitlichen Vergleich muss man das berücksichtigen, wenn man z.B. bei saisonalen Angeboten aufs Vorjahr schaut. Gleiches gilt für Conversions pro Keyword oder jede andere Kennzahl bezogen auf ein einzelnes Keyword oder Keywordset.
Was kann man tun?
Nicht viel. Kein Websitebetreiber hat ein Recht auf die Keywordeingaben von Google. Die Suchmaschine könnte die Keywords auch komplett unterbinden und niemand hätte dagegen eine Handhabe. Die Google Webmastertools werden als Datenquelle wichtiger, allerdings sind die Daten weitaus ungenauer und im Longtail noch unvollständiger.
Wem nützt das?
Bleibt die abschließende Frage, was Google mit der ganzen Aktion bezweckt. Schützt es die Privatspähre der Besucher, wenn der Suchbegriff nicht an die Zielseite übergeben wird? Dann sollte der Begriff doch für alle Nutzer gesperrt werden, nicht nur für die SSL Nutzer. Verschafft sich Google einen Vorteil gegenüber Mitbewerbern? Werbenetzwerke sammeln alle Daten über Besucher, die sie bekommen können, auch Sucheingaben. Behält Google einen Teil für sich, werden diese Profile ungenauer und im Umkehrschluss die von Google wertiger – das ist zugegeben schon etwas um die Ecke gedacht. Näherliegend wäre die Idee, die Daten in einem Google-eigenen Dienst auszuweisen, zum Beispiel den Webmastertools oder Analytics. Das würde beide Dienste zu einem defacto Must-Have machen und einen Vorteil vor Systemen von Drittanbieter bringen.
Eine kommerzielle Nutzung – also gegen Bezahlung – halte ich für unwahrscheinlich, so hat Google bisher nie gedacht. Vielleicht verschwinden die Daten tatsächlich im Nirgendwo und es gibt einen rechtlichen Hintergrund – den könnte Google aber doch einfach benennen.