3 Min.

Der nächste Meilenstein für Suchmaschinen – BERT

Suchmaschinen fällt es oft schwer, die in schriftlichen und mündlichen Suchanfragen ausgedrückte Absicht richtig zu interpretieren. Da kommt BERT ins Spiel – der nächste Meilenstein im Suchbereich.

Catherine Davis

Sep. 11, 2020

3 Min.

Im Grunde geht es bei Suchanfragen darum, Sprache zu verstehen.

Vor 20 Jahren tippte man in der Regel einfach unzusammenhängende Stichwörter ein. Heute hat die Verwendung von Suchmaschinen wie Google die Nutzer tendenziell daran gewöhnt, komplexere Fragen in ein Suchfeld einzugeben oder einem Sprachassistenten zu stellen. Wieso? Beim Sprechen reihen wir üblicherweise nicht einfach unzusammenhängende Wörter aneinander. Und auch Computer haben sich in dieser Hinsicht weiterentwickelt.

Unter maschineller Sprachverarbeitung. (Natural Language Processing, NLP) wird eine Kombination aus KI und Linguistik verstanden, mithilfe derer Computerprogramme menschliche Sprache lesen, verstehen und deren Bedeutung erschließen können. Daran wird bereits seit mehr als 50 Jahren geforscht, doch erst durch moderne Fortschritte in diesem Bereich können Suchmaschinen im Laufe der Zeit immer intelligenter werden. Da fast jedes zweite Wort in der englischen Sprache mehr als eine Bedeutung hat, fällt es Suchmaschinen oft schwer, die von Benutzern in schriftlichen und mündlichen Suchanfragen ausgedrückte Absicht richtig zu interpretieren.

Da kommt BERT ins Spiel.

BERT steht für Bidirectional Encoder Representations from Transformers und ist ein bahnbrechendes Open-Source-Framework für maschinelles Lernen von NLP. Es wurde von Google im Herbst 2019 entwickelt und für ein besseres Verständnis von Benutzersuchanfragen konzipiert. Mit BERT kann das Sprachmodell mehrere umliegende Wörter zur Ermittlung des Wortkontexts heranziehen – statt nur das jeweils unmittelbar vorhergehende oder nachfolgende Wort.

Person, Ort oder Ding?

Seit der Einführung unseres Produkts Yext Answers für die Website-Suche haben wir dessen Suchalgorithmus laufend verbessert, um Unternehmen dabei zu unterstützen, ihren Kunden auf ihrer eigenen Website relevantere Ergebnisse anzuzeigen. Vor Kurzem haben wir Milky Way, das neueste Upgrade des Answers-Algorithmus, herausgebracht. Es unterscheidet mithilfe von BERT-Technologie genauer zwischen Standorten und anderen Entitäten. Der Hauptaspekt besteht hier darin, dass Namen von Standorten (Orte) häufig mit denen von Leuten (Personen) oder Produkten (Dinge) identisch sind. Folgende Suchanfragen enthalten zum Beispiel beide das Wort „Orlando":

In der einen Anfrage bezieht sich der Benutzer ganz klar auf die Stadt Orlando (also auf einen Ort) und in der anderen auf jemanden, der Orlando heißt (also eine Person). Der Prozess, anhand dessen das erste „Orlando" als Ort und das zweite als Name einer Person erkannt werden kann, heißt Named Entity Recognition (NER). Somit ist es möglich, in einem unstrukturierten Text erwähnte benannte Entitäten in vordefinierte Kategorien einzuteilen.

Menschen können den Unterschied zwischen den beiden Suchanfragen leicht erkennen, da wir „Orlando" nicht isoliert, sondern im Kontext der umliegenden Worte betrachten. Im ersten Beispiel folgt auf „Bank in der Nähe von" wahrscheinlich der Name eines Ortes. Im zweiten Beispiel ist mit „Orlando" direkt neben „Bloom" ganz klar der bekannte Schauspieler gemeint. Hier ist BERT von unschätzbarem Wert. Es wurde dafür konzipiert, die kontextuelle Beziehung zwischen Wörtern in einem Text zu verstehen. Zuvor kam es gelegentlich vor, dass Yext Answers ein standortbasiertes Ergebnis für „Orlando" in der Suchanfrage „Orlando Bloom" lieferte. Mit dieser neuen Herangehensweise kann Yext Answers nun solche Unterschiede verstehen.

BERT hilft weiter

Wir von Yext erstellen die offizielle Answers-Engine. Der Einsatz von BERT in unserem Answers-Algorithmus ist ein wichtiger Meilenstein auf dem Weg dahin, Unternehmen in die Lage zu versetzen, möglichst genaue – und offizielle – Antworten zu liefern. Wir wissen, dass eine falsche Antwort enorm hohe Opportunitätskosten nach sich ziehen kann – entweder in Form entgangener Einnahmen oder eines kostspieligen Anrufs beim Kundenservice. Durch eine genauere Erfassung der Absicht von Kunden können Unternehmen diese Risiken senken und auf ihrer eigenen Domain ein hervorragendes Kundenerlebnis gewährleisten.

Share this Article