Zusammen oder Auseinander: Keyword-Unterscheidungen
Bill Slawski hat in seinem hervorragenden Blog SEO by the SEA ein Patent ausgegraben, dass sich mit der Schreibweise bzw. dem Zusammenschreiben von Keywords auseinandersetzt. Im nachfolgenden schaue ich mir den Beitrag an und verschaffe einfach mal einen Überblick. Ich denke, dass hier ein Testing oder eine Abfrage im großen Umfang bessere Ergebnisse liefern würde.
Das Patent ist vor allem auf Adsense gemünzt, da es hier um eine Analyse der Inhalte auf einer Seite geht und die entsprechenden Anzeigen auszuliefern. Innerhalb des Patentes wird aber auch die Übertragung auf andere Bereiche (Webseiten, Sprachen oder auch zur Information) hingewiesen:
Although the above description refers to a content item such as an advertisement, content items such as video and/or audio files, web pages for particular subjects, news articles, etc. can also be used. Also, the implementations can be used with other compound words such as for example, Finnish, as well as other languages that include compound words.
Furthermore, while the above description refers to online advertisements, the implementation described can also be used with other possible applications such as, for example, machine translation, speech recognition, information retrieval, etc.
Ich wähle bewusst ein anderes Beispiel (bei Bill ice cream und paper clips), dass es für den deutschsprachigen Raum ein wenig deutlicher macht. Im Vergleich zum angelsächsischen Sprachraum ist das Deutsche geprägt durch relativ viele Zusammenschreibweisen. Durch das “Füge-S” lassen sich relativ viele Wörter zu einem Wort kombinieren. Als Beispiel werde ich Autoversicherung wählen.
Wortsplitting
Die Frage ist nun, wie schafft Google es zu analysieren, dass Auto Versicherung das gleiche bedeutet wie Autoversicherung. Die Basis hierfür ist das sogenannte “Wortsplitting”, bei dem die Suchmaschine einzelne Wörter in die Buchstaben aufsplittet. Google versucht passende Anzeigen zu den vorhandenen Wörtern zu schalten und nutzt hier für das Wortsplitting und vergleicht die getrennten Wörter mit der Anzahl der Suchanfragen und der eingebuchten Wörter bei Adwords. Darüber hinaus fügt Google an diese getrennten Wörter weitere Segemente (Morpheme) an, um auch diese zu überprüfen. Ein Beispiel für ein Morphem wäre z.B. -en, d.h. die Pluralbildung für Autoversicherung, aber auch -n für Partnersuchen.
Am Beispiel Autoversicherung soll kurz die Segmentierung gezeigt werden:
- A Au Aut Auto Autov Autove Autover Autovers Autoversi Autoversic Autoversich Autoversiche Autoversicher Autoversicheru Autoversicherun Autoversicherung
- u ut uto utov utove utover utovers utoversi utoversic utoversich utoversiche utoversicher utoversicheru utoversicherun utoversicherung
- t to tov tove tover tovers toversi toversic toversich toversiche toversicher toversicheru toversicherun toversicherung
- o ov ove over overs oversi oversic oversich oversiche oversicher oversicheru oversicherun oversicherung
- v ve ver vers versi versic versich versiche versicher versicheru versicherun versicherung
- etc.
Wie bewertet Google nun die unterschiedlichen Wort-Strings? Hier wird ein Bewertungsverfahren genutzt, dass die Strings mit Suchanfragen vergleicht und die Bewertung zu teilt. Bei Autoversicherung erhalten wir durch das Splittung sinnvollerweise einige Wörter, die eine Bewertung (fiktiv) aus den Suchanfragen Logs erhalten:
- Vers (4)
- Verse (durch anfügen von -s) (6)
- Auto (80)
- Autos (70)
- Versicherung (40)
- Versicherungen (30)
“Auto” hat die höchste Bewertung nach der Anzahl der Suchanfragen erhalten und macht bei einer Summe von 220 Suchanfragen insgesamt einen prozentualen Anteil von 36%. Das Wort Vers hat nun relativ wenig mit dem thematischen Umfeld von Autos und Versicherungen gemeinsam, so dass hier sicherliche eine Instanz zwischengeschaltet wird, die vergleicht, welche Suchanfragen in einer starken, d.h. häufigen Beziehung zu einander stehen.
Darüber hinaus lassen sich weitere Beziehungen über den Anchortext von Links zu einem Dokument herstellen: Wenn ein Dokument mit Autoversicherung und Auto Versicherung angelinkt wird, dann impliziert dies, dass das Keyword den selben Inhalt beschreibt - ob nun zusammengeschrieben oder auseinander.
Sicherlich nutzt Google auch externe Quellen wie Wörterbücher, Lexika oder auch Telefonbücher um zu analysieren, welche Wörter auseinander geschrieben werden können. Explizit nennt Bill auch ein Beispiel, wo eine Trennung nicht sinnvoll ist: “The patent filing gives the example of German place names which end with “strasse” or “dorf,” and which are proper nouns that shouldn’t be “decompounded” or split into substrings.” Um einfach mal ein Beispiel aus meiner Heimat zu bringen: Großkummerfeld würde durch die Trennung in Groß, Kummer und Feld segmentiert, macht aber keinen wirklichen Sinn.
Abschließend wirft Bill noch einige Fragen auf, wie Google Zusammenschreibweisen in den SERPs benutzt und ob es Unterschiede gibt, ob der Suchende nach der einen oder anderen Schreibweise sucht. Stellt Google diese gleich oder nur nahe zu gleich?
Suchanfragen laut Keyword-Tool (exact):
Autoversicherung: 74.000
Auto versicherung: 22.200
Suchergebnisse:
Autoversicherung: 1.050.000
Auto versicherung: 3.190.000
Die kurzen Abfragen zeigen, dass es hier noch deutliche Unterschiede gibt, die insbesondere auch in einer Keywordrecherche einfließen müssen.
Ein Positionsvergleich (13.03.09) zeigt, dass hier eine Schnittmenge von 80% vorhanden ist.
Auto Versicherung Autoversicherung
1 www.autoversicherung-online.info/ www.toptarif.de/autoversicherung
2 www.toptarif.de/autoversicherung autoversicherung.einsurance.de/
3 autoversicherung.einsurance.de/ www.autoversicherung-online.info/
4 www.financescout24.de/versicherungen/autoversicherung.aspx www.adac.de/Versicherungen/Kfz_Versicherung/default.asp
5 www.tarifsuche24.de/ www.versicherung.net/autoversicherung.html
6 www.adac.de/Versicherungen/Kfz_Versicherung/default.asp www.directline.de/autoversicherung.html
7 www.finanztip.de/recht/verkehr/kfz-versicherung-ratgeber.htm www.allianz24.de/
8 www.versicherung.net/autoversicherung.html www.financescout24.de/versicherungen/autoversicherung.aspx
9 www.versicherungen-blog.net/tipps/kfz-versicherung-autoversicherung www.tarifsuche24.de/
10 www.directline.de/ www.versicherungsvergleich.de/autoversicherung/
Interessant ist, dass scheinbar bei der getrennten Schreibweise ein Matching zwischen “Auto versicherung” als gesuchtes Keyword und als “Autoversicherung” als gehighlightetes Keyword. Dies funktioniert übrigens auch nur in die eine Richtung. Bzgl. dem Ranking muss natürlich auch noch eine Vielzahl anderer Faktoren hinzugezogen werden, aber insgesamt ist die Überschneidung schon deutlich.
Aber insgesamt schon interessant. Müssten man einmal matchen mit dem Patent zur Systems and methods for highlighting search results.

























Freja sagt
am 11. August 2010 @ 13:55
Hallo an alle, ich suche eine gute Private Krankenversicherung. Kann mir da vielleicht jemand weiterhelfen. Ich kenne mich da überhaupt nicht mit aus!
RoddrickR sagt
am 12. August 2010 @ 06:50
Hallo, wer kannn mir helfen: Brauche eine neue Krankenversicherung, will dafür aber nicht zu viel zahlen. Gibt es da eine zuverlässige Vergleichsquelle?