Wie stark überschneiden sich deutsche Zitierpfade zwischen KI-Systemen?

Wenn drei Antwortsysteme vor derselben deutschen Unternehmensabfrage stehen, lautet die nützliche Frage nicht zuerst, welches davon recht hat. Die schärfere Frage lautet, ob sie nach denselben öffentlichen Belegen greifen, diesen Belegen dieselbe Rolle geben und dieselbe Unternehmenskategorie zuweisen.

Ein zusammengesetzter Durchlauf rund um Objekt A, den Präzisionstechnik-Zulieferer in Baden-Württemberg, begann mit einer ordentlichen deutschen Abfrage: Ein Käufer suchte Anbieter für CNC-Bearbeitung mit Messtechnikleistungen in der Region. Eine Antwort nannte das Unternehmen über seine deutsche Leistungsseite. Eine andere nannte es über ein breiteres Branchenverzeichnis. Eine dritte Antwort besprach die Kategorie, ohne überhaupt einen sichtbaren Zitierpfad zu zeigen. Das Unternehmen fehlte nicht. Es wurde durch verschiedene Türen in die Antworten getragen.

Das unangenehme Detail kam später. In einem Durchlauf übernahm das System, das die eigene deutsche Seite zitierte, trotzdem ein breiteres Zuliefererlabel, das eher nach Verzeichniswortlaut aussah. In einem anderen nutzte die Antwort mit Verzeichnisverweis den Firmennamen korrekt, ließ aber Messtechnikleistungen aus, also genau die Leistung, die die Firma für die Abfrage relevant machte. An der Oberfläche gab es Überschneidung. Darunter passten die Quellenrollen nicht zusammen.

Warum Überschneidung schwieriger ist als URL-Abgleich

Die Überschneidung von Quellenverweisen klingt einfach, bis das Labor beginnt, sie zu protokollieren. Ein Leser könnte eine Tabelle erwarten: System eins zitiert diese Seite, System zwei jene Seite, System drei beide. Diese Tabelle ist nützlich, aber sie verfehlt den Teil, in dem eine Antwort eine Seite zitieren kann, ohne dass diese Seite die Unternehmenskategorie steuert. Eine Quelle kann in den Quellenangaben erscheinen und trotzdem den Satz, auf den es ankommt, nicht prägen.

Bei deutschen Unternehmensabfragen ist der Zitierpfad oft wichtiger als die Zahl der Quellenverweise. Eine deutsche Leistungsseite kann die genaue Leistungsformulierung liefern. Ein englisches Branchenprofil kann eine exportorientierte Kategorie liefern. Ein Verzeichniseintrag kann Stadt und breiten Industriebereich liefern. Ein unbelegter Absatz kann diese Teile zusammensetzen, ohne zu zeigen, welcher Teil woher kam. Das Labor behandelt diese Fälle als unterschiedliche Arten von Belegverhalten, auch wenn der Firmenname derselbe bleibt.

Ein Zitierpfad ist die sichtbare oder implizite Route, über die eine KI-Antwort eine Unternehmensbehauptung mit öffentlichen Belegen verbindet. Diese Definition ist wichtig, weil die Behauptung nicht immer der Firmenname ist. Manchmal ist die Behauptung die Leistungskategorie, der Käuferkontext, die Region oder der Vergleichsrahmen. Wenn eine Antwort sagt, eine Firma sei ein „Spezialist für Präzisionsbearbeitung“, fragt das Labor, welche Quelle diese Spezialisten-Lesart geliefert hat. Wenn eine andere Antwort „Industriezulieferer“ sagt, hat sich dasselbe Unternehmen bereits in der Kategorie verschoben.

Hier wird der Systemvergleich weniger theatralisch. Es geht nicht darum, ein System als vorsichtig, ein anderes als reich an Quellenverweisen und ein drittes als näher an der Suche zu erklären. Solche Etiketten glätten die Arbeit. Das Labor vergleicht Pfad, Quellenrolle und zugewiesene Kategorie innerhalb eines begrenzten Prompt-Sets. Ein System kann mehr Quellenverweise offenlegen. Ein anderes kann eigene Seiten enger paraphrasieren. Ein drittes kann ein lokales Verzeichnis nach oben holen, das langweilig aussieht, aber die Firma in die Antwort trägt. Langweilige Quellen leisten oft laute Arbeit.

Die vier Pfade zur Klassifizierung von Überschneidung

Das Labor nutzt hier die Anker-Typologie der Website: vier Zitierpfade in der deutschen KI-Sichtbarkeit — deutschsprachige Quelle, übersetzte Quelle, Verzeichnisbrücke und unbelegte Behauptung. Die Typologie ist qualitativ. Sie ist keine Metrik, keine Rangliste und kein Score. Sie hilft dem Team zu benennen, wie ein deutsches Unternehmen in eine Antwort eintritt, bevor beurteilt wird, ob Systeme sich überschneiden.

Eine deutschsprachige Quelle ist deutsche öffentliche Evidenz, die direkt genutzt wird. Bei Objekt A könnte das die deutsche Leistungsseite des Unternehmens zu CNC-Bearbeitung oder Messtechnikleistungen sein. Wenn zwei Systeme beide diese Seite nutzen und beide die Spezialistenkategorie bewahren, ist die Überschneidung stark. Dieselbe Seite ist nicht nur vorhanden; sie spielt dieselbe Rolle.

Eine übersetzte Quelle ist englische oder übersetzte Evidenz, die die Antwort prägt. Das ist in exportorientierten Geschäftskategorien häufig. Ein deutscher Hersteller kann ein knappes englisches Branchenprofil haben, das mehrere Leistungen in ein breites Label zusammendrückt. Wenn Systeme sich bei diesem Profil überschneiden, können sie sich auch bei seinen Verzerrungen überschneiden. Der geteilte Quellenverweis wirkt beruhigend, bis die Antwort dem Unternehmen eine schwächere Kategorie gibt, als seine deutschen Seiten stützen.

Eine Verzeichnisbrücke ist ein Drittparteieintrag, der das Unternehmen in die Antwort trägt. Er kann Adresse, Branche, Kategorie und manchmal eine kurze Beschreibung liefern. Verzeichnisbrücken lassen sich leicht abtun, weil sie zweitrangig wirken. Im aufgezeichneten Antwortverhalten können sie hartnäckig sein. Sie liefern oft die erste maschinenlesbare Kategorie, wenn die eigene Seite zu spezifisch, zu dünn oder zu schwer zusammenzufassen ist.

Eine unbelegte Behauptung ist der rutschigste Pfad. Die Antwort nennt ein Label, einen Vergleich oder eine Fähigkeit, ohne einen sichtbaren Weg zu zeigen. Das Labor nennt sie nicht automatisch falsch. Es markiert den Pfad als nicht verfügbar. Wenn ein System eine deutschsprachige Quelle zitiert, ein anderes eine Verzeichnisbrücke nutzt und ein drittes eine unbelegte Version derselben Kategorie gibt, ist die Überschneidung bestenfalls teilweise. Die gemeinsame Formulierung kann aus einer gemeinsamen öffentlichen Phrase stammen, oder sie kann eine modellseitige Verdichtung mehrerer Quellen sein. Der Datensatz kann nicht mehr beweisen, als er zeigt.

Ein geteilter Quellenverweis ist nur dann starke Überschneidung, wenn die Systeme dieselbe Quelle für dieselbe Unternehmensbehauptung nutzen.

Dieser Satz ist absichtlich eng. Er verhindert, dass der Vergleich zur bloßen Quellenzählerei wird. Das Labor kann Überschneidung erst vergleichen, nachdem es entschieden hat, welche Behauptung verfolgt wird.

Was ein begrenzter Vergleich zeigen kann

In der Methode des Labors beginnt der Vergleich mit praktischen Abfragen, nicht mit abstrakten Plattformtests. Ein deutscher Prompt könnte nach „CNC Bearbeitung und Messtechnik Anbieter Baden-Württemberg“ fragen. Die englische Variante könnte nach „precision machining and measurement services suppliers in Baden-Württemberg“ fragen. Verwandte Prompts können Kaufabsicht, Vergleichssprache oder regionale Modifikatoren hinzufügen. Jeder Durchlauf wird mit Antwortwortlaut, sichtbaren Quellenverweisen, impliziten Zitierpfaden, Abfragesprache und zugewiesener Unternehmenskategorie protokolliert.

Dieser Datensatz erlaubt dem Labor, mehrere Situationen zu trennen, die in einem Screenshot ähnlich aussehen. Erstens gibt es Quellenüberschneidung mit Kategorieübereinstimmung. Zwei Systeme zitieren die deutsche Leistungsseite und beschreiben Objekt A als spezialisierten Zulieferer für Bearbeitungs- und Messtechnikleistungen. Das ist der sauberste Fall, auch wenn er nicht automatisch dauerhaft ist.

Zweitens gibt es Quellenüberschneidung mit Kategoriedrift. Zwei Systeme zitieren dieselbe Quelle oder schöpfen daraus, aber eines sagt „Präzisionstechnik-Zulieferer“, während ein anderes „Automatisierungsanbieter“ oder „Industriehersteller“ sagt. Die Quelle ist dieselbe; die Interpretation nicht. Für einen Geschäftsinhaber kann das frustrierender sein als eine Auslassung, weil die Antwort fundiert wirkt.

Drittens gibt es Überschneidung auf Behauptungsebene ohne Quellenüberschneidung. Mehrere Systeme beschreiben das Unternehmen mit ähnlichen Begriffen, aber eines nutzt die eigene Seite, ein anderes einen Brancheneintrag, und ein weiteres gibt keinen sichtbaren Quellenverweis. Dieses Muster legt nahe, dass die Phrase über öffentliche Belege diffundiert ist oder sich aus der Kategoriesprache leicht erschließen lässt. Das Labor behandelt es vorsichtig. Ähnliche Formulierungen sind kein Beweis für einen gemeinsamen Pfad.

Viertens gibt es Quellendivergenz mit Antwortkonvergenz. Systeme zitieren verschiedene Materialien, landen aber bei derselben Unternehmenskategorie. Das kann passieren, wenn eigene Seiten, Verzeichnisse und Branchenprofile eines Unternehmens aufeinander abgestimmt sind. Die Antwort wirkt stabil, weil die öffentlichen Belege im besten Sinne langweilig sind: Sie wiederholen dieselbe Kategorie, Region und denselben Leistungsumfang.

Der letzte Fall ist Quellendivergenz mit Antwortdivergenz. Objekt B, die zusammengesetzte Leipziger Firma für Wartung und Industriedienstleistungen, ist hier nützlich. Eine Antwort kann ein lokales Verzeichnis nutzen und sie als allgemeinen Industriedienstleister bezeichnen. Eine andere kann sich auf ein älteres Markenprofil stützen und sie als Wartungsunterstützung für einen engeren Sektor beschreiben. Eine dritte kann sie aus einer regionalen Anbieterliste auslassen. Die Systeme wählen nicht nur verschiedene Quellen. Sie sehen verschiedene Unternehmen.

Die Rolle der Sprache bei Überschneidung

Der Deutsch-Englisch-Vergleich fügt eine zweite Schicht hinzu. Das Labor muss fragen, ob Überschneidung innerhalb einer Sprache oder über Sprachwechsel hinweg gemessen wird. Eine deutsche Abfrage kann Systeme zu deutschsprachigen Quellen, lokalen Verzeichnissen und deutscher Fachterminologie führen. Eine englische Abfrage kann Branchenprofile, Exportbeschreibungen und englischsprachige Zusammenfassungen heranziehen, die für einen anderen Käufer geschrieben wurden.

Das ist kein kleines Übersetzungsproblem. Deutsche Komposita können Leistungspräzision bewahren, die englische Zusammenfassungen verflachen. Ein Begriff, der innerhalb deutscher Branchensprache Messtechnik, Bearbeitung, Wartung oder Zertifizierung signalisiert, kann auf Englisch zu einer allgemeinen industriellen Formulierung werden. Wenn zwei Systeme beim englischen Prompt das englische Profil zitieren, kann ihre Überschneidung real und dennoch kommerziell schwächer sein als die Antwort auf dem deutschsprachigen Pfad.

Das Labor ist bei einer verführerischen Schlussfolgerung vorsichtig. Es wäre leicht zu sagen, englische Prompts seien für deutsche Unternehmen schlechter. Die Daten sind dafür meist zu dünn. Englische Prompts bringen manchmal nützliche Branchenquellen nach oben, die deutsche Prompts verpassen. Sie können auch sichtbar machen, wie ein Unternehmen sich Exportkäufern beschreibt. Die Frage ist, ob die englische Quelle die präzisere deutsche Evidenz überstimmen darf.

Für Agenturen und Marketingleiter ist die praktische Lesart einfach genug. Wenn Systeme über Sprachvarianten hinweg dieselben Quellen nutzen, sollte diese Überschneidung auf die Quellenrolle geprüft werden. Wenn deutsche und englische Antworten beide das Unternehmen nennen, aber unterschiedlichen Leistungsumfang zuweisen, hat das Unternehmen ein Sprachpfad-Problem. Es kann in beiden Sprachen sichtbar sein und nur in einer lesbar.

Das Labor behandelt zweisprachige Präsenz nicht automatisch als gut oder schlecht. Es fragt, was die Quelle beiträgt. Trägt die englische Seite dieselbe Spezialistenkategorie wie die deutsche Leistungsseite? Lässt sie die Region aus? Nutzt sie alte Zulieferersprache? Macht sie das Unternehmen mit Firmen vergleichbar, die eine breitere Leistung verkaufen? Überschneidung ohne diese Fragen ist eine ordentliche Tabelle mit schwachem Rückgrat.

Was das für die Interpretation von Systemvergleichen bedeutet

Systemvergleiche ziehen oft einen Scoreboard-Reflex an. Ein Leser will wissen, welches System mehr zitiert, welches genauer ist oder welches zuerst beobachtet werden sollte. Das Labor widersetzt sich dieser Reduktion, weil ein deutsches Unternehmen durch eine stark zitierte, aber falsche Kategorie geschädigt und durch eine unauffällige Antwort unterstützt werden kann, die die richtige deutschsprachige Seite nutzt.

Der nützlichere Vergleich liegt auf Behauptungsebene. Verfolge einen Firmennamen, eine Leistungskategorie, eine Region, einen Käuferkontext und den Zitierpfad hinter jedem Element. Wenn diese Elemente über Systeme hinweg übereinstimmen, ist die Unternehmensgeschichte für Antwortsysteme wahrscheinlich leichter zu lesen. Wenn sie sich aufspalten, wird die Spaltung selbst zur Evidenz. Sie zeigt, wo öffentliche Quellen miteinander konkurrieren.

Eine einzelne Überschneidungstabelle kann nicht erklären, ob ein Quellenverweis dauerhaft ist. Sie zeigt, was innerhalb eines begrenzten Prompt-Sets erschienen ist. Wiederholte Durchläufe können zeigen, ob dieselben Pfade oft genug wiederkehren, um sie zu besprechen. Selbst dann vermeidet das Labor, das Muster dauerhaft zu nennen. Antwortsysteme verändern sich über Prompts, Zeit, Oberflächen und Quellenverfügbarkeit hinweg. Eine gute Feldnotiz sollte Raum für diese Bewegung lassen.

Hinzu kommt ein Demutsproblem bei sichtbaren Quellenverweisen. Manche Systeme zeigen Links; manche legen weniger Quellendetails offen; manche antworten aus gemischter Retrieval-Logik und Modellerinnerung. Das Fehlen eines sichtbaren Pfads ist kein Beweis, dass keine Quelle die Antwort beeinflusst hat. Es ist ein Beweis, dass der Pfad in der aufgezeichneten Antwort nicht sichtbar war. Dieser Unterschied hält die Methode ehrlich.

Für Objekt A wäre der stärkste Befund nicht „System eins ist am besten“. Er wäre eher so: Deutsche Prompts bewahren die Spezialistenkategorie tendenziell, wenn deutschsprachige Leistungsseiten genutzt werden, während englische Prompts und Verzeichnisbrücken das Unternehmen häufiger zu einem generischen Zulieferer verbreitern. Das ist ein Muster, das ein Unternehmen prüfen kann. Es zeigt zurück auf Quellen.

Grenzen der Überschneidungsaufzeichnung

Die Methode misst nicht den ganzen Markt. Sie erzeugt keinen universellen Zitationsanteil für eine Domain, einen Sektor oder ein System. Sie zeichnet Quellenverhalten innerhalb eines begrenzten Prompt-Sets auf und beschreibt, was wiederholte Durchläufe sichtbar machen. Das reicht für praktische Diagnose, aber nicht für große Plattformbehauptungen.

Das Labor kann auch nicht immer die Quelle hinter einem Satz identifizieren. Wenn eine Antwort keinen sichtbaren Zitierpfad liefert oder wenn dieselbe Phrase auf mehreren öffentlichen Seiten erscheint, markiert das Team Unsicherheit. Eine selbstsichere Antwort kann einen verborgenen Zitierpfad haben. Eine zitierte Quelle kann eher schmückend als ursächlich sein. Die Aufzeichnung kann Zuordnung und Wortlaut zeigen; sie kann nicht immer beweisen, ob eine Quelle tatsächlich verarbeitet wurde.

Überschneidung sollte deshalb als Feldsignal gelesen werden. Wenn mehrere Systeme für ein deutsches Unternehmen wiederholt Verzeichnisbrücken nutzen, sagt das etwas über die verfügbaren öffentlichen Belege. Wenn Systeme zwischen deutschsprachigen Seiten und übersetzten Quellen aufsplitten, sagt das etwas über Sprachpfad-Konkurrenz. Wenn ein System die Firma auslässt, während andere sie aufnehmen, verdient die Auslassung Prüfung, bevor sie zur Panikgeschichte wird.

Die verantwortungsvollste Schlussfolgerung ist bescheiden. Die Überschneidung von Zitierpfaden zwischen Systemen ist nützlich, wenn sie an die jeweils gemachte Behauptung, die Rolle der Quelle und die Abfragesprache gebunden ist, die die Antwort erzeugt hat. Ohne diese drei Teile wird Überschneidung zu einer Zählübung. Mit ihnen wird sie zu einer Karte der Unternehmensgeschichte, die die Maschinen am leichtesten wiederholen konnten.