KI scheitert am Mainzer Dialekt

18. Mai 2026
1 min Lesezeit

KI scheitert am Mainzer Dialekt

Rheinland-Pfalz - Was ist passiert – was dahinter steckt

Gesellschaft: Herausforderungen für Sprachmodelle in Mainz

() – Große Sprachmodelle haben erhebliche Schwierigkeiten, den Mainzer Dialekt zu verstehen. Das hat ein Forschungsteam der Johannes Gutenberg-Universität Mainz (JGU) in einer neuen Studie herausgefunden, wie die Universität mitteilte.

Die Forscher erstellten zunächst ein digitales Wörterbuch mit 2.351 Dialektwörtern auf Basis eines Lexikons aus dem Jahr 1966.

Anschließend testeten sie mehrere Open-Source-Sprachmodelle. Die KI musste sowohl die Bedeutung von Meenzerisch-Wörtern erklären als auch aus standarddeutschen Definitionen die passenden Dialektwörter finden.

Die Ergebnisse fielen eindeutig aus: Beim Erklären der Wörter erreichten die Modelle eine Trefferquote von durchschnittlich nur 4,24 Prozent, beim Erzeugen der Dialektwörter sogar nur 0,56 Prozent.

„Die Resultate zeigen sehr klar, dass heutige Sprachmodelle Meenzerisch bislang kaum verstehen“, sagte Ko-Autor Peter Herbert Kann von der Universität . Eine Ursache sehen die Forscher darin, dass Dialekte vor allem gesprochen werden und daher wenig Textdaten für das Training der KI existieren.

Die Studie wurde im Rahmen der Language Resources and Evaluation Conference in Palma de Mallorca veröffentlicht.

Text-/Bildquelle: Übermittelt durch www.dts-nachrichtenagentur.de
Bildhinweis: Roboter (Archiv)

Häufig gestellte Fragen (FAQ)

Was ist passiert?

  • Forschungsteam der Johannes Gutenberg-Universität Mainz untersucht Verständnis von großen Sprachmodellen für den Mainzer Dialekt.
  • Ergebnisse zeigen eine sehr geringe Trefferquote beim Erklären und Erzeugen von Dialektwörtern.
  • Mangel an Textdaten für Dialekte wird als Grund für die Schwierigkeiten der KI angesehen.

Warum ist das wichtig?

  • Große Sprachmodelle haben Schwierigkeiten mit regionalen Dialekten, was ihre Einsatzmöglichkeiten einschränkt.
  • Niedrige Trefferquoten bei der Erkennung und Erklärung von Dialektwörtern zeigen, dass aktuelle KI-Modelle noch verbessert werden müssen.
  • Die Studie unterstreicht die Bedeutung von Dialekten für die Sprachverarbeitung in der KI.

Wer ist betroffen?

  • Große Sprachmodelle
  • Nutzer von Dialektkommunikation
  • Forschungsteam der Johannes Gutenberg-Universität Mainz

Zahlen/Fakten?

  • 2.351 Dialektwörter im digitalen Wörterbuch
  • Trefferquote beim Erklären der Wörter: durchschnittlich 4,24 Prozent
  • Trefferquote beim Erzeugen der Dialektwörter: nur 0,56 Prozent

Wie geht’s weiter?

  • Weitere Forschung zur Verbesserung des Verständnisses von Dialekten durch Sprachmodelle
  • Entwicklung spezifischer Trainingsdatensätze für Dialekte
  • Zusammenarbeit mit Linguisten zur Optimierung der KI-Modelle
Deutsche Textservice Nachrichtenagentur GmbH

Don't Miss