fbpx
Maschinelle Übersetzung

08/2022 – Ljubica Negovec

Maschinelle Übersetzung:
Methoden und Schwierigkeiten

Unter maschineller Übersetzung versteht man das Übersetzen von Texten durch ein digitales Programm. Man kennt das von diversen Online-Anbietern, die einem oft Ergebnisse liefern, die eher der Belustigung als der Bereicherung dienen. Grund genug, sich der maschinellen Übersetzung, ihrer Entwicklung, ihren Methoden und ihren Schwierigkeiten mit einem kritischen Auge anzunähern.

Maschinelle Übersetzung im Wandel: Geschichte und Zukunft der MÜ

Die ersten Gehversuche auf dem Feld der maschinellen Übersetzung (auch MÜ oder MT für engl. machine translationgab es bereits in den 1960er-Jahren: das US-Militär entwickelte damals ein rudimentäres Russisch-Englisch-Übersetzungsprogramm, dessen Qualität gewiss noch zu wünschen übrig ließ. Das US-Verteidigungsministerium stufte die automatische Übersetzung bald darauf als unrealisierbar ein, was die Forschung bis in die 80er-Jahre zum Erliegen brachte.

Dann jedoch gelang Japan der Durchbruch: Das Land erarbeitete sich mit den weltweit ersten kommerziellen maschinellen Übersetzern für PCs eine Vorreiterfunktion. Seitdem hat sich die Machine Translation immer schneller weiterentwickelt.

Spätestens seit 2006 ist die maschinelle Übersetzung dank Google auch privaten Nutzern zugänglich. Die anfängliche Qualität des Google-Übersetzers hat der MÜ allerdings einen eher wenig schmeichelhaften Ruf eingebracht. Doch diesen hat sie heute längst nicht mehr verdient: Seit 2016 kommen KI-Übersetzer zum Einsatz, die für riesige Qualitätssprünge gesorgt haben.

Ob die tiefliegenden Schwierigkeiten der Übersetzung von kleinsten Sprachnuancen mithilfe der künstlichen Intelligenz (fast) gänzlich überwunden werden können, wird sich zeigen. Fest steht, dass fleißig daran geforscht wird, da man sich davon verspricht, globalisierte kommunikative Abläufe in Wirtschaft, Diplomatie und Militär künftig effizienter gestalten zu können.

Methoden: Wie funktioniert maschinelles Übersetzen?

Digitale Vorgänge hinter einer Anwendung bleiben den Usern oft verborgen. Man füttert die Maschine mit einem zu übersetzenden Satz und bekommt den Satz in der Zielsprache ausgespuckt. Wir sehen uns diesen Vorgang genauer an und stellen uns die Frage: Wie funktioniert maschinelle Übersetzung eigentlich und welche Methoden gibt es?

Regelbasierte maschinelle Übersetzung

Zunächst widmen wir uns der regelbasierten maschinellen Übersetzung. Sie baut, wie der Name schon sagt, auf sprachliche Regelwerke – genauer gesagt eine Kombination aus Sprachalgorithmen, die die grammatischen Regeln der Sprachen enthalten, und den konkreten Wörtern.

Die einfachste und älteste Variante stellt hierbei die direkte Methode dar, bei der tatsächlich wortwörtlich übersetzt wird. Das Ergebnis wird im Nachhinein entsprechend dem sprachlichen Regelsystem korrigiert. Auf dieser Methode beruhte etwa das Russisch-Englisch-System des US-Militärs. Wie man bereits erahnen kann, ist dies die fehleranfälligste Methode und daher mittlerweile obsolet.

Die regelbasierte maschinelle Übersetzung wurde selbstverständlich weiterentwickelt. Die Transfer-Methode schlüsselt den Input z. B. erst in eine Baumstruktur auf, leitet daraus die Bedeutung und Tiefenstruktur ab und überträgt diese in die Zielsprache. Ähnlich ist das Vorgehen bei der Interlingua-Methode, mit dem Unterschied, dass der Transfer in eine Zwischensprache erfolgt, ehe in Richtung der Zielsprache übersetzt wird.

Beispielbasierte maschinelle Übersetzung

Ein beispielbasierter maschineller Übersetzer arbeitet mit einem Übersetzungsspeicher, in welchem ganze Phrasen abgelegt sind. Diese Phrasen können dann gemeinsam mit ihrer Entsprechung abgerufen werden, statt sie Wort für Wort zu übersetzen. Die Eingangsphrase wird zunächst mit allen ähnlichen Phrasen im Speicher verglichen, anschließend wählt das maschinelle Übersetzungssystem die beste Entsprechung.

Statistische maschinelle Übersetzung

Bei der statistischen maschinellen Übersetzung wird dem Programm erst ein Textkorpus aus Ausgangs- und Zielsprache zur Verfügung gestellt, das es vergleichen kann und woraus es Übertragungsregeln ableitet. Diese dienen dann als Basis für die Übersetzung von Texten, die jenen des ursprünglichen Textkorpus ähneln.

Neuronales Netz für die maschinelle Übersetzung

Neuronale maschinelle Übersetzung

Der interessanteste – und neueste – Ansatz in der Machine Translation ist die neuronale maschinelle Übersetzung. Die Arbeit übernimmt hier ein künstliches, neuronales Netz, das die Zusammenhänge zwischen zwei Sprachen erkennt und sich selbst Übersetzungsregeln beibringt.

Das funktioniert dank Deep Learning – einem Prozess, der das Lernen im menschlichen Gehirn imitieren soll. Dazu sind riesige Datenmengen nötig, aus denen die KI lernen kann. Wie genau der maschinelle Übersetzer hier zu seinem Ergebnis kommt, ist allerdings gar nicht so einfach nachzuvollziehen, da das System völlig selbstständig arbeitet. Das Potenzial ist jedenfalls groß.

Maschineller Übersetzer vs. CAT-Tool

Nicht zu verwechseln sind maschinelle Übersetzungssysteme mit den sogenannten CAT-Tools. CAT steht für „Computer-Aided Translation“, ein Computerprogramm hilft also dem menschlichen Übersetzer. Das geschieht mithilfe einer Übersetzungsdatenbank (Translation Memory), in welcher alle bereits getätigten Übersetzungen für einen Kunden abgespeichert werden.

So kann beispielsweise ein Englisch-Übersetzungsbüro dafür sorgen, dass Ihre Firmenterminologie stets einheitlich mit denselben englischen Begriffen übersetzt wird. Der Übersetzer muss denselben Satz zudem nur einmal übersetzen, was Zeit und Geld spart.

Schwierigkeiten und Probleme: Warum ist Machine Translation nicht perfekt?

Sprache ist ein hochkomplexes System, das zwar mit logischen grammatischen Regeln erklärt, aber niemals in seiner Ganzheit abgebildet werden kann. Computer hingegen arbeiten logisch und binär. Kommunikation besteht aber nicht nur aus 1 und 0, weswegen es Maschinen nicht unbedingt immer leicht haben, der korrekten Bedeutung auf die Spur zu kommen.

Ambiguität und andere Eigenschaften natürlicher Sprachen

Bei Sprache hat man es auf beinahe allen ihren strukturellen Ebenen mit Ambiguität zu tun. Das hat damit zu tun, dass die Sprache nicht aufgrund von logischen Überlegungen erstellt wird, sondern sich organisch entwickelt. Durch die Vieldeutigkeit, die ein einziger Ausdruck in verschiedenen Kontexten haben kann, hat man bei der Übersetzung oft viel zu tun.

Wir geben zu: die 3 Sätze im vorherigen Absatz sind vielleicht nicht sonderlich elegant formuliert, vor allem nicht in dieser sich wiederholenden Konstellation, aber es zeigt etwas Interessantes auf. „Zu tun haben“ kann abhängig von der Position im Satz, der Kombination mit Präpositionen und weiteren semantisch-syntaktischen Einheiten unterschiedliche Bedeutungen haben. Ein solches Beispiel schafft das Übersetzungsprogramm, …oder? *)

Schwierigkeiten auf lexikalisch-semantischer Ebene

Wörter setzen sich nicht nur aus einer einzigen Bedeutung zusammen. Sie umfassen ein streng umrissenes und doch variables Feld an Bedeutungen, das sich nicht zwangsläufig genau mit dem Bedeutungsfeld einer fremdsprachigen Entsprechung decken muss. Manchmal sind die Felder enger, manchmal weiter oder es besteht nur eine gewisse Schnittmenge zwischen den Feldern. Dieses Phänomen wird belegt durch ein recht bekanntes „Google-Translate-Fail“ das im Internet kursiert.

maschinelle uebersetzung

Dieser Versuch des Google-Übersetzers, den ersten Satz des Wikipediaartikels zum Thema Volkswirtschaftslehre zu übersetzen, wurde bereits 2017 publiziert. Unser Selbstversuch im Jahr 2019 zeigte, dass die maschinelle Übersetzung des Online-Tools sich zumindest ein kleines Stück verbessert hatte (oder sich die englische Sprache in Bezug auf das Thema differenziert hat). 2019 lautete die Übersetzung immerhin schon wie folgt:

„Economics (also economics, economic political science or social economy, or economics), is a branch of economics.“

Immer noch nicht ideal und sicher auch für die menschliche Übersetzung eine kleine Herausforderung, aber es zeigt die Grenzen, an welche die maschinelle Übersetzung in puncto Semantik stößt.

Ein weiterer Versuch im Jahre 2022 zeigt nun folgendes Ergebnis:

“Economics (also known as national economics, economic state sciences or social economics, or VWL for short) is a sub-area of economics.”

Leider findet der Google-Übersetzer immer noch keine Möglichkeit, Volkswirtschaftslehre und Wirtschaftswissenschaften getrennt zu benennen. VWL wird hingegen gar nicht übersetzt. Man sieht, dass die künstliche Intelligenz weiterlernt, doch bis zur perfekten automatischen Übersetzung ist es immer noch ein weiter Weg.

Syntax korrekt übertragen

Die Syntax ist noch das, womit die maschinelle Übersetzung potenziell am besten zurechtkommt. Sie unterliegt je nach Sprache strengen Regeln, die in die binäre Logik und Denkweise von Maschinen übertragbar sind. Probleme entstehen dabei meist aus mangelndem Input, wenn der Maschine schlicht zu wenige grammatische Regeln zur Verfügung stehen, um sinnvolle Übersetzungsentscheidungen zu treffen.

Stilnuancen erkennen und korrekt übersetzen

Die maschinelle Übersetzung ist momentan noch an einem Punkt, an dem sie hauptsächlich mit neutralen Sachtexten zurechtkommt, deren Sprache weniger ambivalent ist als etwa literarische Texte, gesprochene Sprache oder gar Slang. Gilt es jedoch, Stilnuancen zu erkennen und in einer anderen Sprache korrekt wiederzugeben, scheitert die Maschine oftmals.

Kultureller Hintergrund

Die Bedeutungsnuancen einer kommunikativen Äußerung ergeben sich oft nur aus dem Kontext oder den jeweiligen Konnotationen. Kommen noch große kulturelle Unterschiede hinzu, die sich in der Sprache sehr oft widerspiegeln, wird es noch schwieriger. Die maschinelle Übersetzung muss das Gesagte so übertragen, dass es von den Sprechern der anderen Sprache auf dieselbe Art und Weise verstanden wird. Für eine Maschine, die kein menschliches Weltwissen besitzt, ist das eine beinahe unlösbare Aufgabe.

Maschineller Übersetzer und Mensch

Vor- und Nachteile: menschliche vs. maschinelle Übersetzung

Fassen wir beinahe am Ende dieses Beitrages noch zusammen, worin nun die Vor- und Nachteile der jeweiligen Übersetzungsmethoden liegen. Worin liegen Schwierigkeiten oder vielleicht sogar Gefahren von maschinellen Übersetzungssystemen und wobei ziehen sie den menschlichen Übersetzern davon?

  • Geschwindigkeit: Ein maschineller Übersetzer ist dem menschlichen Übersetzer bezüglich Geschwindigkeit meilenweit voraus. Aufgaben, für die man sonst etwa eine Stunde brauchen würde, erledigt die Maschine in Sekunden oder Sekundenbruchteilen.
  • Korrektheit: Dafür steht eine korrekte Übersetzung, die durch fundierte sprachliche, kontextuelle und kulturelle Kenntnisse durchgeführt wurde, weit über einer wackeligen, nicht sehr sicheren Übersetzung des binär denkenden Computers.
  • Konstante Ergebnisse: Was die Maschine hingegen gut beherrscht, sind stets gleich qualitative Texte, die keine Flüchtigkeitsfehler enthalten. Menschen sind immer ein wenig von ihrer Tagesverfassung abhängig.
  • Flexibilität: Ein Mensch wiederum passt seine Übersetzung flexibel an die Bedingungen an: Branche, Textsorte, Fachterminologie oder Laienbegriffe, emotional oder sachlich, kulturelle Eigenheiten u. v. m.
  • Datenschutz: Zu bedenken ist außerdem der Datenschutz. Wenn die Programme für maschinelles Übersetzen mit diversen Schnittstellen verknüpft sind, sind sie auch anfällig für Angriffe von außen. Dadurch werden die zu übersetzenden Texte bzw. Korpora vielleicht für Hände zugänglich gemacht, in denen sie nicht landen sollten.
YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Maschinelle Übersetzung per Online-Anbieter oder PC-Übersetzungsprogramm?

Bei der Qualität einer maschinellen Übersetzung geht es außerdem darum, ob man sich auf Anbieter im freien Internet verlässt, oder sich von offiziellen, hochentwickelten und meist kostenpflichtigen Übersetzungsprogrammen helfen lässt. Was gratis vor allem für private Nutzer zur Verfügung gestellt werden kann, ist vielleicht nicht unbedingt am neuesten Stand der Forschung und kann peinliche Übersetzungsfehler enthalten. Für den privaten Zweck reicht das, ein Unternehmen sollte solche Fehler besser nicht riskieren.

Kostenpflichtige maschinelle Übersetzungstools sind beispielsweise:

  • DeepL (Pro-Version)
  • Systran
  • SDL Language Cloud
  • ModernMT

Weitere Tipps haben wir in unserem Ratgeber zu den besten Übersetzungstools zusammengestellt.

Wenn Qualität ein Muss ist:
maschinelle Übersetzung mit Post-Editing

Wenn Sie professionelle Qualität benötigen, empfehlen wir Ihnen jedenfalls eine maschinelle Übersetzung mit Full-Post-Editing. Dabei kombinieren Sie das Beste aus beiden Welten: Die Maschine fertigt eine grobe automatische Übersetzung an, die dann vom menschlichen Übersetzer korrigiert und auf das gewünschte Niveau angehoben wird.

Bei ALLESPRACHEN setzen wir dabei übrigens auf das 4-Augen-Prinzip: Machine Translation inklusive Post-Editing durch zwei speziell geschulte Übersetzer. So gehen wir sicher, dass unsere Arbeit stets den strengen Qualitätskriterien nach ISO 17100 und ISO 18587 entspricht.

Mehr zum Post-Editing

Hat maschinelle Übersetzung also eine Zukunft?

Zusammenfassend lässt sich sagen, dass die maschinelle Übersetzung wohl noch in den Kinderschuhen steckt. Für eine einwandfreie Übersetzung, die in der Zielsprache keine Fragen offenlässt oder gar Unverständlichkeit verursacht, werden Maschinen und Programme wohl noch einige Jahre brauchen. Ob sie jemals vollständige Perfektion erreichen werden? Nun ja – wir sind noch nicht überzeugt.

Bis dahin ist jedenfalls auf ausgebildete Menschen Verlass, die die Ambivalenz von ‚schaffen‘ im Sinne von ‚etwas zustande bringen‘ und ‚sehr anstrengen, mitnehmen‘*) im Kontext erkennen können.
____________________________________

*) etw. schaffen: entstehen, zustande kommen lassen; zustande bringen vs. jmdn. schaffen: sehr anstrengen, mitnehmen, erschöpfen, Quelle: Duden

Bildquellen: © ryzhi – stock.adobe.com; © immimagery – stock.adobe.com; © Who is Danny – stock.adobe.com

FAQ – häufige Fragen zur maschinellen Übersetzung

Welche maschinellen Übersetzungstools gibt es?

Die bekanntesten maschinellen Übersetzer sind Google Translate und DeepL. Beide Systeme nutzen die neuronale maschinelle Übersetzung, mit sehr guten Ergebnissen. Darüber hinaus gibt es zahlreiche weitere Tools, z. B. Systran, ModernMT, Microsoft Translator, NLLB-200 u. v. m.

Welches ist der beste Sprachübersetzer?

Für viele Experten ist DeepL die unangefochtene Nummer 1 unter den maschinellen Übersetzungssystemen. Doch auch Tools wie der Google-Übersetzer, Microsoft Translator, Systran oder ModernMT liefern äußerst überzeugende Ergebnisse. Wichtig ist jedoch stets, dass Sie im professionellen Umfeld nicht blind darauf vertrauen, sondern auf ein menschliches Post-Editing setzen.

Wie funktioniert neuronale maschinelle Übersetzung?

Die neuronale maschinelle Übersetzung basiert auf einer künstlichen Intelligenz und riesigen Datenmengen. Mithilfe eines neuronalen Netzwerks – ähnlich dem menschlichen Gehirn – verarbeitet das System die Daten und leitet daraus selbst Übersetzungsregeln ab. Basierend auf dem Gelernten spuckt es dann die beste Übersetzung aus.

Können Maschinen lernen?

Ja, maschinelles Lernen ist möglich, dank der Forschung an künstlichen neuronalen Netzwerken. Damit kann eine Maschine Daten nutzen und verarbeiten, um daraus Schlüsse zu ziehen und selbst Entscheidungen zu treffen. Allerdings ist dieser Prozess längst nicht so ausgereift, wie es beim menschlichen Gehirn der Fall ist.