Schema Markup für KI: Ein praktischer Guide
Strukturierte Daten sind seit über zehn Jahren Teil der SEO-Praxis. Mit dem Aufstieg generativer KI-Systeme ändert sich ihre Rolle: Sie sind nicht mehr nur ein Bonus für Rich-Snippets in den SERPs, sondern eine der direktesten Möglichkeiten, einem Modell zu sagen, wer du bist und was du tust. Dieser Guide führt durch die Grundlagen, die wichtigsten Schema-Typen und gibt Copy-Paste-Snippets für die drei zentralen Bausteine.
Was ist JSON-LD?
JSON-LD („JSON for Linked Data") ist ein vom W3C standardisiertes Format, um strukturierte Informationen in eine Webseite einzubetten. Technisch ist es ein <script>-Block im HTML-Kopf oder -Body, der einen JSON-Baum enthält und einem Crawler sagt: „Die folgenden Informationen sind keine Fließtext-Prosa, sondern maschinenlesbare Fakten."
Warum gerade JSON-LD und nicht Microdata oder RDFa? Zwei Gründe. Erstens: Es ist vom eigentlichen HTML entkoppelt, man kann Inhalte anreichern, ohne den Seitencode umzuschreiben. Zweitens: Google, Microsoft und die meisten KI-Crawler dokumentieren JSON-LD als bevorzugtes Format. In der Praxis bedeutet das: Wer strukturierte Daten ausliefert, tut es heute fast ausschließlich über JSON-LD.
Für KI-Modelle hat JSON-LD noch einen weiteren Vorteil: Es ist in sich ein graphisches Datenformat. Das „LD" in JSON-LD steht für „Linked Data". Jede Entität kann explizit auf andere Entitäten verweisen. Eine Organisation verlinkt ihre Gründer, ein Artikel verlinkt seinen Autor, ein Produkt verlinkt den Hersteller. Für ein LLM ist dieser Graph genauso wertvoll wie der Fließtext selbst, weil er die Beziehungen zwischen Entitäten formalisiert. Ohne diesen Graph muss das Modell die Beziehungen aus dem Kontext ableiten, mit allen Ungenauigkeiten, die das mit sich bringt.
Welche Schema-Types sind für KI relevant?
Nicht alle Schema-Typen sind gleich wichtig. Je nach Branche und Ziel-Plattform lohnen sich andere Schwerpunkte. Die folgende Tabelle zeigt, welche Typen von welchen Plattformen besonders gewichtet werden (eigene Beobachtungen aus laufenden Scans, keine offiziellen Herstellerangaben):
| Schema-Type | Wofür | ChatGPT | Claude | Perplexity | Gemini |
|-----------------|------------------------------------------|---------|--------|------------|--------|
| Organization | Firmenidentität (Name, URL, Ort) | hoch | hoch | hoch | hoch |
| Person | Gründer, Experten, Autoren | hoch | hoch | mittel | hoch |
| FAQPage | Frage/Antwort-Paare auf der Seite | hoch | mittel | hoch | hoch |
| Article | Blogartikel, Fachbeiträge | hoch | hoch | hoch | mittel |
| Product | Produktdetails inkl. Preis | mittel | mittel | hoch | hoch |
| LocalBusiness | Lokales Unternehmen, Öffnungszeiten | hoch | mittel | hoch | hoch |
| BreadcrumbList| Seitenstruktur | mittel | niedrig| mittel | mittel |
Als pragmatische Ausgangsbasis genügt der Dreiklang: Organization auf der Startseite, FAQPage auf allen Seiten mit echten FAQs, Article auf allen Blog-Artikeln. Alles Weitere ist produkt- oder branchenspezifisch.
Typische Ergänzungen, die sich je nach Geschäftsmodell lohnen: LocalBusiness bei jedem Unternehmen mit physischem Standort, weil darin Öffnungszeiten, Adresse und Servicegebiet formalisiert werden. Product mit Offer bei allem, was einen Preis hat, auch bei SaaS-Abos, nicht nur bei physischen Artikeln. Event bei Webinaren, Konferenzen und Veranstaltungen. Course bei Trainings- und Weiterbildungsangeboten. Jeder dieser Typen eröffnet dem Modell ein eigenes Attributs-Feld, das ohne Schema nur im Fließtext stünde, mit allen Nachteilen, die das für die Extraktion hat.
Snippet 1: Organization auf der Startseite
Dies ist das wichtigste Markup überhaupt. Es definiert deine Marke als Entität und gibt Modellen einen stabilen Referenzpunkt.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Organization",
"@id": "https://arawai.de/#organization",
"name": "Arawai",
"alternateName": ["Arawai GmbH"],
"url": "https://arawai.de",
"logo": {
"@type": "ImageObject",
"url": "https://arawai.de/logo.png",
"width": 512,
"height": 512
},
"description": "GEO-Plattform für den DACH-Markt. Misst KI-Sichtbarkeit über ChatGPT, Claude, Gemini und Perplexity.",
"foundingDate": "2025",
"founders": [{
"@type": "Person",
"@id": "https://arawai.de/#founder-julius",
"name": "Julius Knüpfer"
}],
"address": {
"@type": "PostalAddress",
"addressLocality": "Dresden",
"addressCountry": "DE"
},
"sameAs": [
"https://de.wikipedia.org/wiki/Arawai",
"https://www.wikidata.org/wiki/Q0000000",
"https://www.linkedin.com/company/arawai"
]
}
</script>
Worauf es hier besonders ankommt:
@id: Eine stabile, URL-förmige Identität, über die andere Schema-Blöcke auf diese Entität verweisen können. Kein Zufallsstring, sondern idealerweise eine URL auf deiner Domain mit einem Fragment (#organization).sameAs: Hier dockst du deine Marke explizit an externe Knoten im Knowledge-Graph an. Wikipedia und Wikidata sind die stärksten Anker. Wenn dort ein Eintrag existiert, verlinke ihn.founders: Person-Entitäten bekommen eigene@ids, damit sie in Autor-Markup auf anderen Seiten sauber referenziert werden können.
Snippet 2: FAQPage für Frage-Antwort-Strukturen
Jede Seite, die mehr als zwei echte Fragen beantwortet, sollte ein FAQ-Markup tragen. Die Fragen sollten real sein, nicht erfunden, damit das Schema gefüllt ist.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "FAQPage",
"mainEntity": [
{
"@type": "Question",
"name": "Was misst Arawai konkret?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Arawai führt Prompts gegen ChatGPT, Claude, Gemini und Perplexity aus und misst, ob und wie deine Marke erwähnt wird, inklusive Sentiment, Position und Share-of-Voice gegen definierte Wettbewerber."
}
},
{
"@type": "Question",
"name": "Wie oft werden Scans aktualisiert?",
"acceptedAnswer": {
"@type": "Answer",
"text": "Im Starter-Paket täglich, im Pro-Paket stündlich für definierte Kern-Prompts."
}
}
]
}
</script>
Pragmatischer Tipp: Schreibe die Antworten so, dass sie isoliert aus dem Kontext verstanden werden. Vermeide „Wir" ohne vorhergehende Namensnennung. Nicht „Wir scannen stündlich", sondern „Arawai scannt die Pro-Pakete stündlich". Das Modell zitiert einzelne Antworten oft ohne Kontext, deine Aussage muss allein stehen können.
Noch ein praktischer Hinweis zur Frageformulierung: Schreibe Fragen so, wie Nutzer sie tatsächlich in KI-Systeme eingeben. Kurze, natürlichsprachliche Fragen („Wie oft scannt Arawai?") performen besser als SEO-optimierte Long-Tails („Wie oft führt Arawai automatisierte KI-Visibility-Scans durch?"). Der Grund: LLMs matchen Nutzer-Prompts semantisch mit deinen Fragen; Übereinstimmung in Tonfall und Länge erhöht die Wahrscheinlichkeit, dass deine Antwort als direkteste Entsprechung angesehen wird.
Snippet 3: Article für jeden Blog-Beitrag
Artikel-Markup teilt Modellen mit, dass eine Seite ein redaktioneller Inhalt mit Autor, Datum und Thema ist. Das erhöht die Wahrscheinlichkeit, dass Inhalte als zitierbare Quelle behandelt werden.
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"@id": "https://arawai.de/blog/schema-markup-fuer-ki#article",
"headline": "Schema Markup für KI: Ein praktischer Guide",
"description": "JSON-LD Snippets für Organization, FAQPage und Article. Plus Validierung.",
"datePublished": "2026-04-24",
"dateModified": "2026-04-24",
"author": {
"@type": "Person",
"@id": "https://arawai.de/#founder-julius",
"name": "Julius Knüpfer"
},
"publisher": {
"@id": "https://arawai.de/#organization"
},
"mainEntityOfPage": {
"@type": "WebPage",
"@id": "https://arawai.de/blog/schema-markup-fuer-ki"
},
"inLanguage": "de-DE",
"articleSection": "Technisch"
}
</script>
Beachte die Referenz "publisher": { "@id": ... }: sie zeigt auf die @id der Organization, die wir weiter oben definiert haben. So entsteht ein verknüpfter Graph: Artikel gehört zu Organization, Organization hat Gründer, Gründer ist zugleich Autor dieses Artikels. Je dichter dieser Graph, desto mehr Kontext hat das Modell.
Validierung: Zwei Werkzeuge, die du bookmarken solltest
Strukturierte Daten, die nicht validiert sind, sind Lotterie. Zwei Werkzeuge reichen:
- Schema.org Validator prüft rein gegen die Schema.org-Spezifikation. Zeigt fehlende Required-Felder, ungültige Types und Warnungen. Strenger als Google, deswegen ein guter erster Test.
- Google Rich Results Test prüft gegen Googles konkrete Erwartungen. Hilfreich, weil viele Crawler (auch AI-Bots, die über Google-Infra laufen) sich an diese Erwartungen halten.
Zusätzlich empfehlenswert ist ein JSON-LD-Playground wie der Digital Bazaar Playground, um komplexe Graphen vor dem Deployment durchzuspielen.
Häufige Fehler
Aus mehreren hundert Audits haben sich vier Anti-Patterns als besonders hartnäckig herausgestellt:
Falscher oder fehlender @context. Muss immer "https://schema.org" sein, nicht "http://..." (kein HTTPS) und nicht "schema.org" ohne Protokoll. Sonst ignorieren viele Parser den Block.
Fehlende @id-Felder. Ohne stabile IDs sind deine Entitäten anonym und können nicht referenziert werden. In jeder Entität, die von mehr als einer Seite gemeint ist (Organization, Person, Product), gehört eine @id.
Doppelte Entitäten. Zwei Organization-Blöcke mit verschiedenen Werten auf derselben Seite. Klassisch, wenn ein Theme eigenes Markup ausspielt und das SEO-Plugin noch eins obendrauf setzt. Modelle reagieren darauf mit Unsicherheit und gewichten die Aussagen niedriger. Konsolidieren.
Markup ohne sichtbares Gegenstück. Wenn du eine FAQ im Markup behauptest, die auf der Seite nicht sichtbar ist, verstößt du gegen die Guidelines und riskierst, dass Crawler deine strukturierten Daten generell abwerten. Regel: Jede Aussage im Schema muss auch auf der Seite als Text oder UI-Element sichtbar sein.
Falsche oder veraltete datePublished- bzw. dateModified-Werte. Automatisch generierte Artikel-Markups, die dateModified bei jedem Deploy aktualisieren, wirken auf Crawler wie manipulierte Frische-Signale und werden zunehmend ignoriert. Aktualisiere dateModified nur dann, wenn der Inhalt tatsächlich redaktionell bearbeitet wurde.
Zu tief verschachtelter Graph. Versuche nicht, auf einer einzelnen Seite einen kompletten Unternehmens-Graph zu deklarieren: Mitarbeiter, Tochtergesellschaften, Produktportfolio, Event-Historie alles auf einmal. Je komplexer das Markup, desto anfälliger ist es für Fehler und desto langsamer parsen Tools. Besser: Gib jeder Entität eine eigene Seite mit fokussiertem Markup und verlinke via @id.
Bonus: Was Arawai hier automatisiert
Der praktische Schmerz liegt weniger im einmaligen Schreiben von Snippets, sondern in der laufenden Wartung: Ist das Markup nach dem letzten Theme-Update noch intakt? Stimmen die Daten mit dem Impressum überein? Sind die FAQs noch synchron mit dem, was im Support-Postfach landet?
Arawai scannt automatisiert alle deine Seiten, listet gefundenes und fehlendes Schema-Markup auf, prüft Konsistenz gegen deine Haupt-Entitäten und schlägt konkrete Ergänzungen vor, inklusive fertiger JSON-LD-Blöcke, die du direkt ins CMS übernehmen kannst. Besonders relevant für Teams ohne dedizierte Technical-SEO-Rolle: Arawai erkennt Drift, also wenn Markup und sichtbarer Inhalt auseinanderlaufen, und meldet konkret, welche Aussagen in Schema und DOM nicht mehr übereinstimmen. So wird aus einem einmaligen Schema-Setup ein monitorter Zustand, nicht ein technisches Artefakt, das nach sechs Monaten niemand mehr pflegt.
Wenn du die Tiefe dieser Analyse für deine Domain sehen willst, schau dir die Features an. Der Schema-Audit ist Teil jedes Scans. Du musst dafür nichts zusätzlich buchen.