Eine neue Analyse aus dem Mai 2026 zerlegt das Thema KI-Sichtbarkeit in 22 messbare Einzelfaktoren. Sie zeigt, welche technischen und redaktionellen Hebel wirklich dazu führen, dass ChatGPT, Claude und Gemini Inhalte als Quelle zitieren, und welche zwar viel diskutiert werden, in der Praxis aber kaum wirken. Für den deutschen Mittelstand ist das die erste belastbare Liste, an der sich konkrete Arbeit ableiten lässt, statt allgemeiner Empfehlungen zu folgen.

Die Analyse aus dem Mai 2026 sortiert 22 Einflussgrößen für KI-Zitate nach Wirkung. Strukturierte Daten, eindeutige Quellenangaben und maschinenlesbare Faktendichte zeigen messbare Effekte, hyped Lösungen wie eine reine llms.txt-Datei dagegen nicht. (Bild: Collective Brain)
Die Studie Generative Engine Optimization von Aggarwal et al., präsentiert auf der ACM-SIGKDD-Konferenz 2024, hat den Ausgangspunkt geliefert. Sie zeigt, dass gezielt eingesetzte Zitate, belastbare Zahlen und ausgewiesene Quellen die Sichtbarkeit eines Inhalts in generativen Antworten um bis zu vierzig Prozent steigern können. Die Folgeanalyse aus dem Mai 2026 bricht diesen Befund weiter auf und benennt 22 Einzelfaktoren mit jeweils unterschiedlich starker Wirkung. Erstmals gibt es damit einen Maßnahmen-Katalog, der für den Mittelstand priorisierbar ist, statt einer allgemeinen Best-Practice-Wolke.
Wer in KI-Antworten auftauchen will, muss seine Inhalte so bauen, dass ein Crawler in wenigen Sekunden Antworten extrahieren kann. Das ist eine ingenieurtechnische Frage, keine Marketing-Frage.— Arno Hoffrichter, CTO Collective Brain
Welche der 22 Faktoren messbar wirken
Die wichtigste Einsicht der Analyse: Nicht jeder Hebel zählt gleich. In der oberen Hälfte der Rangliste stehen Faktoren, die mit klarer semantischer Struktur und maschinenlesbarer Faktendichte zu tun haben. Dazu gehören vollständiges Schema.org-Markup für Artikel, Autor und Organisation, eine konsistente publisher-Angabe in JSON-LD, klar nummerierte Aussagen mit Quellenfußnote, eindeutige Headings mit eigenständigen id-Attributen und eine logisch fortlaufende Headline-Hierarchie. Auch die Sichtbarkeit der wichtigsten Aussage im ersten Absatz, also das, was klassische Redaktionen als Vorspann oder BLUF kennen, ist überdurchschnittlich relevant.
Die offizielle Google-Dokumentation zu strukturierten Daten für Artikel beschreibt die technischen Mindestanforderungen. Wer hier Lücken hat, fällt nicht nur in der klassischen Suche zurück, sondern wird auch in generativen KI-Antworten seltener als Quelle gewählt. Die Anthropic-Empfehlung zu klaren, strukturierten Tags bestätigt das Bild aus Modell-Sicht: Inhalte mit erkennbarer Struktur sind für die Antwort-Extraktion einfacher zu verarbeiten und werden deshalb häufiger zitiert.
Welche Faktoren überbewertet sind
Die Analyse zeigt auch, was im Mai 2026 in Vorträgen, Newslettern und Agentur-Decks oft hochgespielt wird, sich aber empirisch nicht durchsetzt. An erster Stelle steht llms.txt. Die Spezifikation von Jeremy Howard sieht eine Markdown-Datei im Site-Root vor, die einen Index der wichtigsten Inhalte für KI-Crawler bereitstellt. Anthropic pflegt eine eigene llms-full.txt für die Developer-Dokumentation als Referenz. In der Auswertung der 22 Faktoren konnte aber kein Anbieter zeigen, dass eine isolierte llms.txt-Datei die Wahrscheinlichkeit eines Zitats messbar erhöht. Weder ChatGPT noch Claude noch Perplexity haben öffentlich bestätigt, dass sie sie aktiv suchen.
Auch reine Domain-Autorität, ausgedrückt in klassischen SEO-Kennzahlen, hat in der Studie weniger Gewicht als oft angenommen. KI-Modelle gewichten thematische Konsistenz und Faktendichte des einzelnen Beitrags höher als eine generische Backlink-Stärke der Domain. Für den Mittelstand ist das eine Chance: Wer in seinem Themenbereich tief und konsistent arbeitet, kann gegen Großverlage bestehen, auch wenn dort die Linkprofile stärker sind. Diese Verschiebung deckt sich mit unserer Analyse zur Attribution in Google AI Overviews: Sichtbarkeit ist heute eine Frage der thematischen Konsistenz, nicht der reinen Linkmacht.
Sechs konkrete Maßnahmen für die nächsten vier Wochen
Die Analyse erlaubt eine klare Priorisierung, statt sich an dreißig Maßnahmen gleichzeitig zu versuchen. Wir haben den Befund auf den deutschen Mittelstand übersetzt und dabei auch unsere Erfahrungen aus der Bitkom-Auswertung zu KI-Nachzüglern im Mittelstand berücksichtigt: dort liegt die Lücke seltener am Wissen und meistens am Umsetzungs-Backlog. Aus den 22 Faktoren lassen sich für den Mittelstand sechs realistische Umsetzungsschritte ableiten, die in den nächsten vier Wochen messbare Bewegung erzeugen. Erstens, ein vollständiges JSON-LD-Audit der Top-zwanzig-Beiträge mit echten author– und publisher-Objekten. Zweitens, Quellenangaben in jeden Beitrag, die auf Erstquellen zeigen und nicht auf Sekundärartikel. Drittens, ein Vorspann pro Beitrag, der die Hauptaussage in zwei bis drei Sätzen vor allem anderen liefert. Viertens, eindeutige Heading-IDs für jede Sektion, damit Crawler einzelne Antwort-Fragmente präzise referenzieren können. Fünftens, eine konsistente Autoren-Box pro Beitrag mit Klarname, jobTitle, Bild und LinkedIn-Profil. Sechstens, eine wöchentliche Stichprobe in ChatGPT und Claude, ob eigene Inhalte zu Kern-Themen erwähnt werden.
Wie Markup und Redaktion zusammenspielen
Die Studie schließt mit einem Befund, der für Mittelstands-Teams besonders relevant ist. Technisches Markup und redaktionelle Substanz sind kein Entweder-Oder, sondern bedingen einander. Ein Beitrag, der perfekt strukturiert ist, aber inhaltlich nichts beiträgt, wird seltener zitiert als ein dichter, gut recherchierter Beitrag mit nur halb gepflegtem Markup. Umgekehrt verliert ein exzellenter Beitrag ohne saubere Headings, ohne Schema.org-Article und ohne klare Quellenfußnoten messbar Sichtbarkeit, weil die KI-Modelle ihn schlicht nicht eindeutig zuordnen können. In unserer Beratungspraxis sehen wir das vor allem bei mittelständischen Verlagen und Fachblogs, die jahrelang gute Inhalte produziert haben, ohne ihre technische Basis aktuell zu halten. Drei bis fünf Stunden Markup-Audit pro Monat reichen, um den Rückstand aufzuholen, vorausgesetzt, die Redaktion arbeitet konsequent mit Quellenangaben. Wer hier in den nächsten Monaten konsistent arbeitet, gewinnt in einem Wettbewerb, in dem viele Mittelständler noch gar nicht angetreten sind. Bemerkenswert ist auch, dass die Wirkung kumulativ ist: Saubere Markups auf zehn Artikeln nutzen weniger als saubere Markups auf hundert, weil die Modelle dann ein konsistentes Bild der Themen-Autorität bekommen.
Häufige Fragen
Reicht eine llms.txt-Datei, um in ChatGPT oder Claude zitiert zu werden?
Nein, nach der aktuellen Datenlage nicht. Die Spezifikation von Jeremy Howard ist sinnvoll als zusätzlicher Index, aber kein eigenständiger Sichtbarkeits-Hebel. Keiner der großen Anbieter, weder OpenAI noch Anthropic noch Perplexity, hat öffentlich bestätigt, dass eine isolierte llms.txt-Datei die Zitierwahrscheinlichkeit erhöht. Der Standard ist eine Ergänzung zu sauberem Schema.org-Markup, nicht ein Ersatz dafür.
Welche der 22 Faktoren sollte ein Mittelständler zuerst angehen?
Drei Faktoren haben den größten Hebel im Verhältnis zum Aufwand. Erstens, ein vollständiges Article- oder NewsArticle-Schema mit author- und publisher-Objekt. Zweitens, eine Hauptaussage in den ersten zwei Sätzen jedes Beitrags. Drittens, mindestens drei Quellenangaben pro Beitrag, die auf Primärquellen zeigen. Diese drei Maßnahmen lassen sich in wenigen Wochen für die zwanzig wichtigsten Beiträge umsetzen und decken einen Großteil der messbaren Wirkung ab.
Sind Domain-Autorität und Backlinks für KI-Zitate noch wichtig?
Sie zählen, aber weniger als oft angenommen. Generative KI-Modelle gewichten die thematische Konsistenz eines einzelnen Beitrags und die Klarheit der dort genannten Fakten höher als eine generische Backlink-Stärke der Domain. Für mittelständische Anbieter mit fokussiertem Themenbereich ist das eine Chance, weil tiefe Spezialisierung in einer Nische gegen breite Allgemeinheit gewinnt. Voraussetzung ist eine technisch saubere Umsetzung und eine konsistente Faktendichte.
Wie messe ich, ob meine Inhalte in KI-Antworten auftauchen?
Die einfachste Methode ist eine wöchentliche manuelle Stichprobe in ChatGPT, Claude und Perplexity zu den eigenen Kern-Themen. Wer es systematischer braucht, nutzt spezialisierte Tools für KI-Visibility-Tracking, die Erwähnungen über zehn bis zwanzig Modelle hinweg loggen. Wichtig ist, dieselben Prompts in regelmäßigen Abständen zu wiederholen, sonst lassen sich Veränderungen nicht zuordnen. Wir empfehlen Mittelständlern, mit zehn fest definierten Prompts zu starten und diese alle zwei Wochen auszuwerten.
Wie schnell zeigt sich, ob die Markup-Optimierung wirkt?
Die ersten Veränderungen in KI-Antworten sind typischerweise nach vier bis acht Wochen sichtbar, sobald die wichtigsten Modelle den eigenen Inhalt neu indexiert haben. Bei Beiträgen, die ChatGPT oder Claude bereits vor der Optimierung kannten, geht es schneller, manchmal innerhalb von zwei Wochen. Wichtig ist, in dieser Phase keine großen Inhalts-Umbauten zu machen, sonst lässt sich der Effekt der Markup-Arbeit nicht von einem inhaltlichen Effekt trennen. Wer parallel die Quellenangaben pflegt, sieht den größten Sprung.
Müssen wir für KI-Sichtbarkeit unseren Schreibstil ändern?
Nicht den Stil, aber die Struktur. Inhalte sollten weiterhin so geschrieben sein, dass sie für Menschen interessant sind. Hilfreich ist es allerdings, klare Aussagen mit konkreten Zahlen oder Namen früh im Beitrag zu platzieren und längere Argumentationsketten in nummerierte oder klar gegliederte Abschnitte zu zerlegen. Das ist guter redaktioneller Stil, der zufällig auch die KI-Extraktion erleichtert. Wer für SEO bereits klare H2-Headings und Vorspänne nutzt, hat den größten Teil der Arbeit hinter sich.
Quellen & Referenzen
- Aggarwal, Pranjal et al. · Generative Engine Optimization (KDD 2024)
- Google Search Central · Article structured data documentation
- Anthropic Docs · Use XML tags to structure your prompts
- llmstxt.org · llms.txt specification by Jeremy Howard
- Anthropic · llms-full.txt reference example
- Schema.org · NewsArticle definition
- BfDI · Datenschutz und KI

