Amazon ist eine Suchmaschine
Wenn die meisten Personen von Amazon sprechen, dann sprechen diese häufig von dem weltweit größten Marktplatz. Aber diese Analogie trifft es nicht ganz. Über einen Marktplatz schlendere ich von einem Händlerstand zum nächsten. Bei Amazon gebe ich in den Suchschlitz ein, was ich suche und bekomme dann passende Ergebnisse präsentiert. Amazon ist also in erster Linie eine Suchmaschine - mit der Option die gefundenen Produkte auch zu kaufen.
Amazon hat daher große Ähnlichkeiten mit Google. Dabei ist Googles Startseite noch deutlich reduzierter und besteht fast nur aus einem Suchschlitz. Die Herausforderung ist bei beiden Unternehmen gleich: Aus einer Vielzahl von sog. "Dokumenten" müssen die Suchmaschinen von Amazon und Google die relevanten herausfiltern und dann sortieren von "sehr relevant" bis "weniger relevant". Bei den Dokumenten handelt es sich im Falle von Google im wesentlichen um Webseiten, bei Amazon um die Produkte.
Amazons Algorithmus A9
Wenn von Amazons Suchmaschine die Rede ist, dann spricht man häufig von A9. Dieses Kürzel steht für das in 2003 gegründete gleichnamige Unternehmen A9.com Inc., welches ursprünglich angetreten ist, eine eigenständige Suchmaschine für das World-Wide-Web (WWW) zu sein. Die Suchmaschine war unter a9.com erreichbar und war zuletzt eine Meta-Suchmaschine, die sich anderen Quellen wie Wikipedia, Google oder der IMDB bediente. Auch Bücher auf Amazon konnten schon damals durchsucht werden. In 2008 wurde das Portal a9.com eingestellt und seitdem wird unter dem Dach der Firma Amazons eigene Suchtechnologie kontinuierlich weiterentwickelt.
Die Herausforderungen von Amazons Suche sind damals wie heute die gleichen. Die Suchmaschine muss einen immensen, stetig wachsenden Korpus and Produkten durchsuchen, indexieren und auf Wunsch des Users in Bruchteilen einer Sekunde Ergebnisse liefern.
Amazon selbst beschreibt die Herausforderung wie folgt:
product search typically operates in two stages: matching and ranking
Unter matching versteht Amazon die zur Suchanfrage passenden Produkte zu identifizieren und unter ranking die Aufgabe, diese im Anschluss zu sortieren. Auf beides wollen wir im folgenden näher eingehen.
Relevante Produkte finden
In einem 2019 erschienen Artikel zum Thema Semantische Suche visualisiert Amazon die Suche wie folgt:
Um relevante Produkte zu finden, nutzt Amazon unterschiedliche Ansätze.
Direkte Übereinstimmung Keywords
Amazon schreibt in dem Paper "Products that contain words in the query (Qi) are the primary candidates.". Amazon nutzt hier die Texte, die im Produktlisting enthalten sind und gleicht diese mit der Suchanfrage ab. Gibt es eine Übereinstimmung, so hält der Algorithmus das Produkt für relevant und es landet in der nächsten Stufe der Verarbeitung.
Dieser Ansatz hat aber auch diverse Nachteile. So schreibt Amazon:
Pure lexical matching falls short in this respect due to several factors: a) lack of understanding of hypernyms, synonyms, and antonyms, b) fragility to morphological variants (e.g. “woman" vs. “women"), and c) sensitivity to spelling errors.
Unter Hypernymen versteht man die Verallgemeinerung eines Ausdrucks, Synonyme sind sinnverwandte Wörter ("Brieftasche" vs. "Portemonnaie") und unter Antonymen versteht man gegenteilige Ausdrücke. Beispiel für ein Antonym: Sucht eine Person nach "Handschuhe ohne latex" dann besteht die Gefahr, dass Amazon auch "Latex Handschuhe" einblendet, da zwei von drei Suchbegriffe im Produkt enthalten sind. Nicht immer verstehen Suchmaschinen Modifizierer wie das Wort "ohne" oder "frei" korrekt.
Weitere Probleme bestehen bei Singular- und Pluralschreibweisen. Hier bedient sich eine Suchmaschine häufig der Technik des Stemming, d.h. die Wörter wie Abfragen werden bewusst gekürzt, um unterschiedliche Endungen (Singular, Plural, weibliche / männliche Form) zu vereinheitlichen.
Auch was Falschschreibweisen angeht, so ist es nicht immer leicht, diese korrekt zu erkennen und der richtigen Suchphrase zuzuordnen. Schätzungen zufolge werden 10-15% aller Anfragen falsch geschrieben. Amazon muss diese korrigieren und verstehen, was der Kunde wirklich sucht. Um Fehlschreibweisen zu vermeiden nutzt Amazon u.a. auch die sog. Suggest Funktion, bei der es auf Basis der ersten Eingaben, diese versucht zu vervollständigen und Suchvorschläge unterbreitet.
Aber auch korrekt geschriebene Suchanfragen sind für eine Maschine nicht immer leicht zu verstehen, so sucht wohl jemand, der nach "business anzug" sucht, nach einem Anzug. Bei der Phrase "Socken Anzug" hingegen, wird eher nach Socken gesucht, obwohl in beiden Phrasen das Wort "Anzug" enthalten ist.
Semantische Übereinstimmung
Eine weitere Herausforderung ist, dass Amazon bei dem Ansatz der direkten Übereinstimmung abhängig von der Qualität der Produktbeschreibung ist. Gibt sich die Händlerin keine Mühe, die Produkte ausführlich zu beschreiben und nutzt z.B. keine Synonyme, so schlägt der reine Vergleich mit der Suchphrase ggfs. fehl, obwohl das Produkt relevant wäre. Suchmaschinen bilden hier häufig einen erweiterten Index zu einem Produkt und klassifizieren es im Hintergrund mit allen zu einem Begriff passenden Synonymen und Hypernymen.
Amazon bedient sich hier nicht nur aus den Texten, die die Händlerin oder die Herstellerin bereithält, sondern greift hier auch auf die Inhalte von z.B. Amazon Rezensionen zurück (Quelle). In Amazon Rezensionen beschreiben Kunden nochmal anders, wofür diese ein Produkt nutzen. Diese Information speichert Amazon ab und versucht die Suchintention auch aus der jeweiligen Suchanfrage zu ermitteln. Gibt es einen Match, so ist das Produkt relevant.
Käuferverhalten
Aus den oben genannten Gründen ist es daher häufig nicht ausreichend, auf eine rein lexikalische Überprüfung zwischen Suchphrase und Textkorpus des Produktes zu setzen. Amazon lässt daher auch Käufersignale mit in die Relevanzbetrachtung einfließen. Signale, die die Käufer aussenden sind z.B. Klicks auf ein Produkt, das Hinzufügen eines Produktes zum Warenkorb und natürlich auch der Kauf. Doch es gibt auch negative Signale: Ein Kunde schaut ein Produkt an, kauft es aber nicht. Letzteres könnte ein Indiz sein, dass das Produkt nicht zur Suchintention des Kunden passt.
Bei solchen Signalen muss man natürlich aufpassen, dass man diese normalisiert. So ist die Wahrscheinlichkeit, dass ein Kunde auf ein Ergebnis in den Top 3 klickt deutlich höher als bei einem Produkt auf Seite 3. Umgekehrt muss man aufpassen, dass Produkte ohne Käufersignale nicht völlig ausgeschlossen werden, da diese vielleicht unter dem Henne-Ei-Problem leiden (keine Sales, keine Sichtbarkeit, keine Sichtbarkeit, keine Sales). Klickraten werden daher um die zu erwartenden Klickraten auf einer bestimmten Suchergebnisposition adjustiert und man betrachtet nur unter- oder überdurchschnittliche Werte.
Richtig interpretiert sind solche Signale daher goldwert. Signale wie der Kauf eines Produktes sind die ultimative Bestätigung, dass der Kunde letztlich das gefunden hat, wonach er usprünglich gesucht hat. Auf diese Weise kann Amazon Suchphrasen mit dazu passenden Produkten verknüpfen.
Amazon Rankings ermitteln
Als wäre die Ermittlung relevanter Produkte nicht schon schwer genug, folgt noch die Königsdisziplin: Das Sortieren der Ergebnisse, bzw. die Bestimmung des Rankings der gefundenen Produkte.
Amazon schreibt in einem weiteren Paper:
Learning to rank (LTR) models rely on several features to rank documents for a given query. Many LTR features are based on users’ interactions with documents such as impressions, clicks, and purchases. We call these features behavioral features. Ranking models are trained to optimize user engagement, and therefore, such behavioral features tend to be the most important training signals.
Auch hier spielen Usersignale eine große Rolle. Nun sind jedoch nicht alle Käuferinnen gleich, viele haben unterschiedliche Präferenzen. Ein "one-size-fits-all" Ansatz greift hier zu kurz. Amazon experimentiert daher zusätzlich mit personalisierten Ergebnissen. Lernt Amazon z.B. während einer Session, dass eine Kundin immer wieder Produkte einer bestimmten Marke sucht, so könne der Algorithmus das Ergebnis verbessern, indem er Produkte dieser Marke priorisiert. Bei Google sind personalisierte Ergebnisse schon die Regel, nicht zuletzt, weil Amazon auch regional unterschiedliche Ergebnisse ausspielt.
Amazon schreibt hierzu:
We reformulate product search as a dynamic ranking problem where we leverage users’ implicit feedback on the presented products as short-term context and refine the ranking of remaining items when the users request the next result pages.
Häufig geht es bei Ranking-Modellen darum, die relevante "Features" (Eigenschaften) zu identifizieren, die für ein "gutes" Ranking entscheidend sind, folglich den Nutzer das finden lassen, was dieser sucht. Das sog. "Feature-Engineering" kann jedoch auf ganz unterschiedliche Weisen durchgeführt werden und insbesondere die starke Weiterentwicklung des maschinellen Lernens und der neuronaler Netze (künstliche Intelligenz), öffnet die Tür für viele neue Ansätze. Den richtigen Ansatz zu finden, ist eher eine Kunst als eine Wissenschaft. So müssen solche Systeme erst aufwändig trainiert werden, wobei die Auswahl des Trainingssets weitesgehend das Ergebnis bestimmt. Zudem liegen nicht für alle Suchanfragen ausreichende Daten vor.
Bestimmte Kategorien erfordern außerdem eine abweichende Herangehensweise. So klicken Käuferinnen in der Kategorie "Kleidung" häufig auch auf teure "high-fashion" Produkte, ohne diese jemals zu kaufen. Das Signal des Klicks wäre hier also übergewichtet. Andererseits möchten Kundinnen auch solche Produkte sehen. Wären nur die günstigen Produkte sichtbar, so hätten sie das Gefühl, auf dem Grabbeltisch unterwegs zu sein und nicht in einer Boutique.
Fazit
Amazon stellt sich durch wechselnde Sortimente und sich änderndes Kaufverhalten stets der Herausforderung, seinen Suchalgorithmus neu zu justieren. Dabei müssen aber auch eigene Interessen (z.B. Profitabilität) berücksichtig werden. Minimale Verbesserungen im Suchalgorithmus können massive Auswirkungen auf das (finanzielle) Ergebnis von Amazon haben. Amazon ist daher stetig bemüht, seinen Algorithmus zu verbessern und arbeitet hier mit den besten Wissenschaftlern der Welt zusammen.
Als Händler ist es schwierig, sich darauf einzustellen. Was heute noch als richtig gilt, um den Algorithmus für seine Zwecke zu nutzen, kann morgen schon veraltet sein.Dennoch ist es für Händler sinnvoll, sich mit dem Thema Amazon SEO zu beschäftigen.
Übrigens: Falls Sie sich für die Unterschiede und Gemeinsamkeiten in der Suchmaschinenoptimierung zwischen Google und Amazon interessieren, haben wir den folgenden spannenden Artikel für Sie verfasst: Amazon SEO vs. Google SEO - Unterschiede und Gemeinsamkeiten
Kostenlose Testphase
Registrieren Sie sich einfach für eine 14-tägige kostenlose Testphase für AMALYTIX und wir zeigen Ihnen, wie unser Amazon Seller Tool und Amazon Vendor Tool Ihnen bei Ihrer Suchmaschinenoptimierung auf Amazon helfen kann. Jetzt kostenlose Testphase starten