← Zurück zum Blog

Messung und Kennzahlen

Hyokiyure: Wie japanische Schreibvarianten die KI-Messung verfälschen — und wie man Markenerwähnungen korrekt zählt | Suparanku

Hyokiyure (表記ゆれ) bezeichnet mehrere Schreibweisen desselben Namens — キヤノン, キャノン, Canon. KI erwähnt Marken in wechselnden Schreibweisen; ein Abgleich über eine einzige Zeichenkette übersieht Erwähnungen systematisch. Alias-Listen plus morphologische Analyse sind die Voraussetzung japanischer KI-Sichtbarkeits-Messung.

Maksim Gurchenkov (CEO, Apurichoumi Inc.)

Warum japanische Markennamen in Varianten zerfallen

Das Japanische bietet mehrere Möglichkeiten, denselben Namen zu schreiben: Katakana vs. lateinische Schrift (スーパーランク / Suparanku), Groß- und Kleinschreibung (Canon / CANON), offizielle vs. umgangssprachliche Schreibweise (Canons offizielles Katakana verwendet ein großes ヤ — キヤノン —, viele schreiben aber キャノン, wie man es spricht), dazu Abkürzungen und Altbezeichnungen. Alle bezeichnen dasselbe Unternehmen; als Zeichenketten sind sie verschieden.

KI-Assistenten lernen aus vielfältigen Webtexten und verwenden in ihren Antworten je nach Kontext unterschiedliche Schreibweisen. Stellen Sie sich vor, Sie stellen dieselbe Frage neunmal: Die Antworten könnten dreimal die lateinische Schreibweise, viermal das offizielle Katakana und zweimal die umgangssprachliche Form verwenden. Eine solche Streuung ist normal — Studien zeigen, dass derselbe Prompt fast nie zweimal dieselbe Antwort liefert.

Was naiver String-Abgleich anrichtet

Suchen Sie Erwähnungen nur über die Zeichenkette „Suparanku“, wird jede Katakana-Erwähnung als „nicht erwähnt“ gewertet. Die Sichtbarkeit wirkt niedriger, als sie ist; im schlimmsten Fall schickt der Fehlschluss „null Präsenz bei diesem Thema“ Budget in unnötige Arbeit.

Den umgekehrten Fehler gibt es auch: Eine kurze Abkürzung als Suchbegriff trifft unbeteiligte Alltagswörter und bläht die Sichtbarkeit auf. In beide Richtungen gilt: Eine kaputte Messung macht jede darauf gebaute Entscheidung kaputt.

Eine Messung entwerfen, die richtig zählt

  1. Eine Alias-Liste pflegen — führen Sie pro Marke jede plausible Schreibweise auf (Katakana, lateinische Schrift, Abkürzungen, Altbezeichnungen). Suparanku unterstützt bis zu 50 Aliasse pro Marke und hebt Erwähnungen in jeder davon hervor.
  2. Mit morphologischer Analyse abgleichen — das Japanische trennt Wörter nicht durch Leerzeichen; wer Sätze vor dem Abgleich mit einem Analyzer wie kuromoji segmentiert, unterdrückt falsche Teiltreffer.
  3. Neue Varianten aus Antworten lernen — verwendet die KI eine nicht registrierte Schreibweise, sollte das Mess-System sie erkennen und als Kandidaten vorschlagen. Eine Alias-Liste wächst mit den Antwortdaten — sie wird nicht einmal geschrieben und dann vergessen.

Fazit

Hyokiyure ist ein Messproblem, das im Japanischen besonders akut ist — Schreibvarianten betreffen auch andere Sprachen, etwa koreanische und russische Markenschreibweisen — und genau das, was englisch ausgerichtete Tools am leichtesten übersehen. Erst mit Alias-Design und morphologischem Abgleich darunter verdienen die Zahlen zu Sichtbarkeit, Sentiment und Share of Voice Vertrauen. Alias-Design und morphologischer Abgleich sind dabei notwendig, aber nicht hinreichend: Vertrauenswürdige Sichtbarkeitszahlen erfordern außerdem wiederholtes Sampling jedes Prompts — ein einzelner Durchlauf ist trügerisch präzise.

Verwandte Begriffe: Hyokiyure, Sichtbarkeits-Score, Sentiment-Analyse

Quellen

  1. Wikipedia (ja), “表記揺れ”
  2. kuromoji (Japanese morphological analyzer)
Kostenloser Check Vertrieb kontaktieren