Vorhin habe ich mir mal wieder ein paar Minuten Zeit genommen, um mir den ein oder anderen TEDtalk anzuhören – ich finde es immer wieder aufs Neue spannend, in so kurzer Zeit so vieles über die unterschiedlichsten Themen zu lernen.
Da wurde mir eine Benachrichtigung angezeigt: “TED jetzt auch auf Deutsch”. Bei einzelnen Videos gibt es jetzt auch die Möglichkeit, mithilfe von KI die übersetzten Untertitel lippensynchron vertonen zu lassen, ähnlich wie bei einem im Original englischsprachigen Spielfilm, den wir in der deutschen Version sehen.
Der Clou: die KI passt die originalen Lippenbewegungen des Sprechers / der Sprecherin an die ausgewählte Audiospur an. Noch erkennt man, dass hier etwas nicht ganz stimmt, aber wie sieht das in ein paar Monaten oder Jahren aus?

Obwohl diese Entwicklung ohne Zweifel beeindruckend ist, finde ich sie auch etwas beunruhigend. KI ist in vielen Bereichen sicherlich eine Bereicherung, doch wenn wir uns in Zukunft bei nichts mehr sicher sein können, ob es echt oder generiert ist, dann geht die Entwicklung in eine falsche Richtung.

Zudem: Wozu dienen diese Versuche, Mehrsprachigkeit fast schon zu verschleiern? Ist es nicht, gerade auf einer so internationalen Bühne wie bei TED immer wieder aufs Neue schön zu erleben, dass Menschen von überall her ein Thema haben, dass sie mit der Welt teilen wollen? Stört die originale Lippenbewegung mein Sehvergnügen wirklich so sehr, dass eine KI notwendig ist, um diese an die verschiedensten Audiospuren anzupassen und die Unterscheidung zwischen Original und Übersetzungsleistung (bald) unmöglich zu machen?

Ich glaube nicht.

Share: