Messung und Kennzahlen
Hyokiyure: Wie japanische Schreibvarianten die KI-Messung verfälschen — und wie man Markenerwähnungen korrekt zählt | Suparanku
Hyokiyure (表記ゆれ) bezeichnet mehrere Schreibweisen desselben Namens — キヤノン, キャノン, Canon. KI erwähnt Marken in wechselnden Schreibweisen; ein Abgleich über eine einzige Zeichenkette übersieht Erwähnungen systematisch. Alias-Listen plus morphologische Analyse sind die Voraussetzung japanischer KI-Sichtbarkeits-Messung.
Warum japanische Markennamen in Varianten zerfallen
Das Japanische bietet mehrere Möglichkeiten, denselben Namen zu schreiben: Katakana vs. lateinische Schrift (スーパーランク / Suparanku), Groß- und Kleinschreibung (Canon / CANON), offizielle vs. umgangssprachliche Schreibweise (Canons offizielles Katakana verwendet ein großes ヤ — キヤノン —, viele schreiben aber キャノン, wie man es spricht), dazu Abkürzungen und Altbezeichnungen. Alle bezeichnen dasselbe Unternehmen; als Zeichenketten sind sie verschieden.
KI-Assistenten lernen aus vielfältigen Webtexten und verwenden in ihren Antworten je nach Kontext unterschiedliche Schreibweisen. Stellen Sie sich vor, Sie stellen dieselbe Frage neunmal: Die Antworten könnten dreimal die lateinische Schreibweise, viermal das offizielle Katakana und zweimal die umgangssprachliche Form verwenden. Eine solche Streuung ist normal — Studien zeigen, dass derselbe Prompt fast nie zweimal dieselbe Antwort liefert.
Was naiver String-Abgleich anrichtet
Suchen Sie Erwähnungen nur über die Zeichenkette „Suparanku“, wird jede Katakana-Erwähnung als „nicht erwähnt“ gewertet. Die Sichtbarkeit wirkt niedriger, als sie ist; im schlimmsten Fall schickt der Fehlschluss „null Präsenz bei diesem Thema“ Budget in unnötige Arbeit.
Den umgekehrten Fehler gibt es auch: Eine kurze Abkürzung als Suchbegriff trifft unbeteiligte Alltagswörter und bläht die Sichtbarkeit auf. In beide Richtungen gilt: Eine kaputte Messung macht jede darauf gebaute Entscheidung kaputt.
Eine Messung entwerfen, die richtig zählt
- Eine Alias-Liste pflegen — führen Sie pro Marke jede plausible Schreibweise auf (Katakana, lateinische Schrift, Abkürzungen, Altbezeichnungen). Suparanku unterstützt bis zu 50 Aliasse pro Marke und hebt Erwähnungen in jeder davon hervor.
- Mit morphologischer Analyse abgleichen — das Japanische trennt Wörter nicht durch Leerzeichen; wer Sätze vor dem Abgleich mit einem Analyzer wie kuromoji segmentiert, unterdrückt falsche Teiltreffer.
- Neue Varianten aus Antworten lernen — verwendet die KI eine nicht registrierte Schreibweise, sollte das Mess-System sie erkennen und als Kandidaten vorschlagen. Eine Alias-Liste wächst mit den Antwortdaten — sie wird nicht einmal geschrieben und dann vergessen.
Fazit
Hyokiyure ist ein Messproblem, das im Japanischen besonders akut ist — Schreibvarianten betreffen auch andere Sprachen, etwa koreanische und russische Markenschreibweisen — und genau das, was englisch ausgerichtete Tools am leichtesten übersehen. Erst mit Alias-Design und morphologischem Abgleich darunter verdienen die Zahlen zu Sichtbarkeit, Sentiment und Share of Voice Vertrauen. Alias-Design und morphologischer Abgleich sind dabei notwendig, aber nicht hinreichend: Vertrauenswürdige Sichtbarkeitszahlen erfordern außerdem wiederholtes Sampling jedes Prompts — ein einzelner Durchlauf ist trügerisch präzise.
Verwandte Begriffe: Hyokiyure, Sichtbarkeits-Score, Sentiment-Analyse