Brancheneinblicke
KI braucht Struktur – so trainieren Sie Modelle richtig
Metas jüngstes KI-Update zeigt: Intelligente Modelle funktionieren nur mit intelligenten Daten. Erfahren Sie, wie Sie Ihre Daten für die Sichtbarkeit in der generativen Suche strukturieren können.

Sam Davis
Mai 1, 2025

Das neue Meta-Update zum KI-Training ist eine Erinnerung, dass intelligentere Modelle auf intelligenteren Daten basieren
Meta hat soeben eine neue Phase des KI-Trainings in Europa angekündigt. Ab diesem Monat lernen die generativen Modelle des Unternehmens aus öffentlichen Inhalten erwachsener Nutzer*innen in der EU auf Facebook und Instagram sowie aus deren Interaktionen mit Meta AI.
Dies ist ein bedeutender Schritt, der transparent kommuniziert wird und dem Benutzer*innen widersprechen können. Doch jenseits der Schlagzeilen offenbart sich eine Wahrheit, die für jede Marke gilt:
KI ist immer nur so intelligent wie die Daten, mit denen sie versorgt wird.
Und gerade jetzt wird KI zu einem wichtigen Discovery-Kanal, über den Kund*innen Fragen stellen und Entscheidungen treffen – oft, ohne jemals Ihre Website zu besuchen. Wenn Sie in KI-gestützten Suchanfragen, Chats oder Empfehlungen erscheinen möchten, müssen Sie also dafür sorgen, dass Ihre Markendaten auffindbar, vertrauenswürdig und für das KI-Training geeignet sind.
Was ist LLM-Training und warum ist es wichtig?
KI ist immer nur so intelligent wie die Daten, mit denen sie trainiert wird. Nur mit Training kann ein großes Sprachmodell bzw. Large Language Model (LLM) lernen, zu funktionieren. Stellen Sie sich vor, Sie geben einem Kind Tausende von Büchern, Artikeln und Gesprächen zum Lesen und Lernen, damit es eines Tages Aufsätze schreiben, Fragen beantworten oder sich überzeugend mit Menschen unterhalten kann. Diese Modelle, wie ChatGPT oder Meta AI, „verstehen“ Sprache nicht wie Menschen. Stattdessen analysieren sie riesige Textmengen, um Muster zu erkennen, die aus Wörtern und Ideen bestehen.
Warum möchte Meta seine Modelle mithilfe von App-Benutzer*innen aus der EU trainieren? Sprachen bestehen nicht nur aus Worten, sie umfassen Dialekte, Slang, Humor, kulturelle Anspielungen und sogar unterschiedliche Arten, Emotionen auszudrücken. Bedenken Sie beispielsweise, wie sich das irische Englisch vom amerikanischen Englisch unterscheidet oder wie ein Witz aus Italien in Schweden möglicherweise nicht die gleiche Wirkung hat. Wenn eine KI nur mit Inhalten aus den USA trainiert wurde, kann es passieren, dass sie von Menschen aus Frankreich oder Deutschland missverstanden wird. Durch das Training mit öffentlichen Beiträgen und Interaktionen von Erwachsenen in Europa lernt die KI von Meta zum Beispiel Folgendes:
- die verschiedenen Sprachen und Dialekte, die in Europa gesprochen werden (es gibt Dutzende!),
- regionale Sprichwörter, Humor und kulturelle Anspielungen, die Gespräche natürlich erscheinen lassen,
- wie Menschen in verschiedenen Ländern Sprache online nutzen, etwa ob sie eher formell oder informell schreiben oder welche Emojis sie bevorzugen.
So antwortet Meta AI auf Ihre Fragen in einer Weise, die relevant und vertraut wirkt – unabhängig davon, ob Sie in Lissabon, Warschau oder Helsinki leben.
Ohne regionale Beispiele wie die Sprache der Menschen, ihre Fragen und kulturell relevante Themen kann das Modell keine lokal passenden Antworten liefern. Es benötigt mehr Daten, die besser und lokal relevant sind.
Wenn Sie sich also fragen, wie generative KI weiß, was sie sagen soll, sei es Meta AI, Google Gemini oder ChatGPT, ist die Antwort einfach: Sie wird mit dem trainiert, was sie finden kann.
Was macht die Daten Ihrer Marke für KI nützlich?
Bei Yext haben wir erkannt: KI ist Ihr neuer Kunde. Und dieser Kunde benötigt von Ihnen die folgenden vier Dinge:
- Saubere, strukturierte Informationen, denen die KI vertrauen kann, d. h. Inhalte für mehrere Entitäten, strukturiertes Schema-Markup, Einträge, FAQ, Produktdetails usw. Das sind alles strukturierte Daten.
- Einheitliche Informationen auf jeder Plattform, sichtbar bei Hunderten von globalen und EU-spezifischen Publishern
- Aktualisierte Informationen, die aktuell auf Ihre Marke, Produkte und Dienstleistungen zutreffen
- Inhalte, die so klingen, wie Menschen tatsächlich sprechen
Die KI von Meta (und alle anderen Modelle) kann nur dann hilfreich sein, wenn sie aus Daten lernt, die die reale Sprache und den lokalen Kontext widerspiegeln.
Das Update von Meta ist nur ein Beispiel, aber es verdeutlicht die Realität: Wenn Ihre Daten nicht strukturiert, aktuell und akkurat sind, wird die KI sie nicht verwenden. Und Kund*innen werden Sie nicht sehen.
Trainieren Sie das Modell – oder es wird ohne Sie lernen
Sie können nicht kontrollieren, mit welchen Daten Meta oder OpenAI oder irgendein anderes Modell trainiert. Aber Sie können beeinflussen, ob Ihre Marke diese Modelle mit nützlichen Daten versorgt. Das funktioniert so:
- Fügen Sie Schema-Markup hinzu, damit KI-Tools Ihre Inhalte interpretieren können.
- Sorgen Sie dafür, dass Einträge und Geschäftsdaten mithilfe eines Wissensgraphen plattformübergreifend synchronisiert bleiben.
- Aktualisieren Sie regelmäßig die wichtigsten Attribute wie Öffnungszeiten, Informationen zu Dienstleistungen, Speisekarten-Informationen, FAQ usw.
- Verfassen Sie Inhalte, die dem E-E-A-T-Prinzip folgen (Experience, Expertise, Authority, Trust bzw. Erfahrung, Expertise, Autorität, Vertrauen) und auf natürliche, gesprächsähnliche Suchanfragen abgestimmt sind. Noch besser: Wenn Ihre Marke lokal präsent ist, denken Sie in Kategorien von „Local E-E-A-T“. Dabei handelt es sich um sogenannte „Thema-und-Ort“-Strategien, also Inhalte, die gezielt hyperlokale Fragen beantworten, zum Beispiel:
- Produkt + Ort z. B. „Jeans für Herren am Kurfürstendamm“
- Service + Ort, z. B. „Gitarrenbünde erneuern lassen im Hamburger Stadtzentrum“ (Sorry, ich musste hier irgendwo ein Gitarrenthema einbauen.)
- Person + Ort z. B. „Finanzberater für Altersvorsorge in der Kölner Innenstadt“
All dies macht die Informationen Ihrer Marke abrufbarer, verständlicher und vertrauenswürdiger, was die Wahrscheinlichkeit erhöht, dass sie in generativen Antworten verwendet werden.
Intelligentere Eingaben = intelligentere Ergebnisse
Die Ankündigung von Meta erinnert uns daran, dass eine intelligentere KI auf intelligenteren Daten basiert.
Da sich KI zu einem primären Entdeckungskanal entwickelt, sollten sie Ihre Informationen so strukturieren, dass die KI sie finden und verstehen kann. Füttern Sie das Modell, um zu verhindern, dass Sie in dieser neuen Generation der Suche unsichtbar werden.
Das Modell wird sowieso trainiert. Stellen Sie sicher, dass es auch von Ihnen lernt.
Lassen Sie Ihre Daten für Sie arbeiten. Holen Sie sich unsere Checkliste für die KI-Suche.