machine translation

Maschinelle Übersetzung: eine bereits gegenwärtige Zukunft – jedoch mit dem Menschen im Mittelpunkt

Maschinelle Übersetzung hält in allen Bereichen Einzug, von der Wirtschaft bis zur Entertainmentbranche. Doch können ihre Ergebnisse die höchsten Qualitätsstandards erfüllen?

Seit einigen Jahren verzeichnet der Markt für Übersetzungs- und Sprachdienstleistungen ein kontinuierliches Wachstum. Bestimmte Sektoren haben sogar von einer Entwicklung profitiert, die im Zusammenhang mit der ab 2019 aufgetretenen Pandemie steht: den signifikanten Zuwächsen vor allem im Gesundheitsbereich und bei Social-Media-Plattformen. Obwohl andere Bereiche unter der Ausbreitung von Covid stark gelitten haben (Reisen, Veranstaltungen und Verkehr), setzt die Übersetzungs- und Sprachdienstleistungsbranche weltweit jedes Jahr zig Milliarden Euro um, was einen mehr als zufriedenstellenden Gesundheitszustand bestätigt.

Dieses Wachstum ist das Ergebnis einer Reihe von Faktoren, unter denen sich drei Hauptdynamiken abzeichnen:

  • Globalisierung und die damit verbundene Notwendigkeit, Inhalte im Zusammenhang mit Unternehmen, digitalen Diensten, kultureller Produktion und Freizeit für eine noch größere Community bereitzustellen
  • Entwicklung von Informationstechnologien – etwa Augmented Reality oder künstliche Intelligenz, die nicht nur im klassischen World Wide Web, sondern zunehmend auch für Produkte und alltägliche Dienstleistungen eingesetzt werden (vom Online-Banking über Autos bis hin zu den Feeds für unsere Profile in sozialen Netzwerken)
  • Erforschung neuer Grenzen im Bereich der Computerlinguistik, auf Basis der effektivsten Methoden der maschinellen Übersetzung (MÜ)

Von CAT-Tools bis hin zur maschinellen Übersetzung

Um der enormen Nachfrage nach „Content Localization“ und den damit verbundenen Lieferzeiten gerecht zu werden, haben ÜbersetzerInnen und Agenturen begonnen, Abläufe neu zu organisieren sowie auf neue Technologie zu setzen. Plattformen und Softwareprodukte, die sogenannten „CAT Tools“ (Computer-Aided Translation, computergestützte Übersetzung), haben unter anderem dank Übersetzungsspeicherfunktion und Terminologiedatenbanken zu verkürzten, optimierten und in gewisser Hinsicht auch zu verbesserten Arbeitsprozessen geführt.

In den letzten Jahren kamen Programme – hauptsächlich SaaS-Modelle – hinzu, die noch einen Schritt weiter gingen: Sie ließen die gesamte Übersetzung selbstständig von der „Maschine“ durchführen. Google Translate und DeepL sind zwei der bekanntesten, und auch wenn man bis vor kurzem noch der Meinung war, dass die Ergebnisse zu wünschen übrig ließen, zeigen einige Studien mittlerweile eine weit verbreitete Zufriedenheit unter professionellen NutzerInnen, die viele automatische Übersetzungen von „akzeptabel“ bis „sehr gut“ bewerten.

Wenn die maschinelle Übersetzung mit menschlichen Kompetenzen ergänzt wird, um den inzwischen überholten Gegensatz zwischen menschlicher und automatischer Übersetzung zu überwinden (also mit einem gut durchdachten Mix), werden auch die Chancen für diejenigen, die in der Lage sind, von dem neuen Szenario zu profitieren, „sehr gut“: Potenziell jedes Unternehmen kann daraus Gewinn schlagen. Denn durch die Reduzierung des Zeit- und Kostenaufwands für Übersetzungen steigen nicht nur die Gewinne, sondern sie können sich auch einem globalen Publikum und Märkten öffnen und diese in neue Wachstums- und Ertragschancen für sich verwandeln.

Die Entwicklung der maschinellen Übersetzung

Eigentlich ist der Ursprung von maschineller Übersetzung alles andere als neu – die ersten Experimente reichen bis in die 1940er Jahre zurück. Trotz der wenig ermutigenden Ergebnisse hat die Forschung nie aufgehört, bis sie ab Ende des letzten Jahrhunderts mit neuen Modellen zu neuer Stärke fand. Die drei wichtigsten Errungenschaften ab den 1960ern lauten:

  • regelbasierte maschinelle Übersetzung
  • statistische maschinelle Übersetzung
  • neuronale maschinelle Übersetzung

Bei der ersten Methode (regelbasiert) wird ein System syntaktischer und lexikalischer Regeln eingesetzt, mit denen der Satz zerlegt, die Funktion jedes Wortes ermittelt und der Satz in der Zielsprache rekonstruiert wird.

Der seit den frühen 2000er Jahren verbreitete statistische Ansatz basiert im Wesentlichen auf riesigen Archiven übersetzter Texte. Sie bilden das Korpus, mit dem der Computer eigene numerische und prozentuale Häufigkeits- und Kontextanalysen durchführt, um die beste Wahl zu treffen.

Am aktuellsten und hinsichtlich der Ergebnisqualität aussichtsreichsten ist die neuronale maschinelle Übersetzung, die mittels Hierarchisierung von Konzepten funktioniert. Die Maschine ist in der Lage, komplexe Funktionen (wie das Übersetzen) auszuführen, da diese in einer formalen Sprache beschrieben sind, die auf hierarchischen Abhängigkeiten fußt. So wird eine kontinuierliche Umgestaltung mit der Verknüpfung immer tiefer gehender Konzepte (Deep Learning) ermöglicht, bei dem die künstliche Intelligenz ständig dazulernt. Ein detaillierter und sehr technischer Artikel von ScienceDirect über die Mechanismen der linguistischen Automatisierung kann hier nachgelesen werden.

Genau auf diesem Gebiet scheinen Online-Übersetzungsdienste regelrecht zu wuchern. Vielversprechend ist beispielsweise die neue Datenbrille, die dieses Jahr erstmals von Google angekündigt wurde: Sie soll zwei oder mehr Personen mit unterschiedlichen Sprachen ermöglichen, miteinander zu sprechen. Apple plant dagegen einen Dienst, der simultane Untertitel für Inhalte aller Art auf den wichtigsten Apple-Geräten bereitstellt. Ganz zu schweigen vom Universum der Möglichkeiten, das das Metaverse (noch immer) in sehr naher Zukunft vorhersagt. Zu den Herausforderungen des Metaversums, denen sich Zuckerberg mit Meta stellen will, gehört ausgerechnet die Abschaffung sämtlicher Sprachbarrieren.

Ist MÜ also eine Gefahr oder ein Verbündeter?

Um auf den Kern der Sache zurückzukommen: Wie hoch ist die Qualität maschineller Übersetzungen im Jahr 2022?

Aus objektiver Sicht lautet die erste Antwort, dass die bisher durch KI erreichten Ergebnisse sicherlich nicht zu einem Szenario führen werden, bei dem arbeitslose ÜbersetzerInnen in Scharen den Computern bei der Arbeit – die einmal ihre war – zusehen müssen.

Menschlich, zu menschlich bleibt der notwendige Beitrag, um geschriebene Sprache in einen gut lesbaren, kohärenten, tiefgründigen Text zu verwandeln. Der emphatische Begriffe, Anspielungen, eine nicht dem Register entsprechende Wortwahl, Deutungsnuancen, bedeutungsverändernde Satzzeichen, spezielle Konnotationen – möglicherweise das Ergebnis syntaktischer Verschiebungen – und viele weitere Mechanismen erfassen und mit der Corporate Language oder einem persönlichen, literarischen Stil verweben kann.

Hinzu kommen technische Schwierigkeiten, die vor allem Sprachpaare mit einer geringen Sprecherzahl betreffen: Für sie wird der Weg noch länger dauern.

Alles in allem stellt die maschinelle Übersetzung von heute eine große Chance für FachübersetzerInnen dar: Sie ist ein Werkzeug – kein Ersatz –, um stärker an der Textfunktion orientierte Entscheidungen zu treffen, Zeit und Ressourcen zu optimieren und letztendlich effektivere Inhalte zu produzieren. Auch und vor allem dank menschlicher Intervention: Mittels „Human-in-the-Loop“-Ansatz können die Maschinen lernen, der beste Verbündete von ÜbersetzerInnen zu werden. Zudem sind die Wachstumsprognosen für den Sprach- und Übersetzungsdienstleistungsmarkt mehr als ermutigend: Laut diesem Ranking von Nimdzi wird der Sektor im Jahr 2022 einen Wert von 64,7 Milliarden Dollar aufweisen. Für 2026 sind 84,9 Milliarden bei einem konstanten Durchschnittswachstum von 7 % (!) prognostiziert. Es ist also besser, sich zu verbünden, als einen Krieg gegen Maschinen zu führen.