8. December2023

Wer spricht da? KI-Stimmen in der Kommunikation.

KI / Tools / Audio

„Jetzt. Links. Abbiegen.“ – die Sprachausgaben von Navis haben uns oft mit ihrem roboterhaften, blechernen Klang zum Lachen gebracht. Siri, Alexa und Ok Google waren da schon anders und jetzt verschlägt es uns die Sprache, wenn wir hören, wie weit KI bei Stimmen und Sprache mittlerweile ist. Ob mit der eigenen Stimme oder einer geliehenen, ob in unseren Muttersprachen oder welchen, die wir nie gelernt haben – KI spricht immer makelloser zu und mit uns. Das ist nicht nur im Alltag spannend, sondern auch für die Kommunikation von Unternehmen und Institutionen:

KI liest vor: TTS (Text to Speech)

Wer Sprecher:innen braucht, durchforstet eine Datenbank für ein passendes Aufnahmebeispiel. Das läuft auch mit KI so: In der Google Datenbank zum Beispiel werden über 380 Stimmen in über 50 Sprachen angeboten, die Sie z.B. für Produktvideos oder YouTube nutzen können. Noch ist das kein Ersatz für hochwertige Sprachaufnahmen in Filmen oder Podcasts, aber für edukative Filme wie Schulungs- oder Erklärvideos sind die Stimmen oft schon durchaus brauchbar.

Ob englisch oder deutsch, die Stimme passend zur Sprache gewählt werden, sonst kommt nur Kauderwelsch: Für TikTok wird eher die Sprachsoftware murf verwendet. Auch sie ist polyglott und spricht mehrere Sprachen wie Italienisch, Portugiesisch und sogar Tamilisch.

Die klingt wie ich: Voice Cloning
Kennen Sie den noch?

Pumuckl. Im Moment treibt er auf Kino-Leinwänden wieder allerhand Schabernack. Und im Gegensatz zu vielen Kinderfilmen, die irgendwann neu produziert wurden und neue Stimmen bekommen mussten, spricht er noch genau wie früher: mit der Stimme von Hans Clarin. Nur, dass die Stimme jetzt von einer KI kommt, die den Klang des verstorbenen Sprechers „geklont“ hat.

Mit dieser Methode können Kindheitsheld:innen erhalten bleiben und auch zum Beispiel mal heisere Hosts in Podcasts oder einer Morning Show entlastet werden. Apple bietet diese Feature auf IOS 17 übrigens allen User:innen an – erstmal aber nur auf Englisch.

Eine weniger schöne Verwendung findet die Technologie im Enkeltrick: Wo Stimmen gekapert werden, um Großeltern am Telefon weißzumachen, dass ihre Enkel:innen angeblich dringend Geld brauchen.

Wir sind bald alle multilingual: Übersetzungen

Sie sprechen nur 1-2 Sprachen und wollen aber ein globales Publikum erreichen? Daran arbeitet zum Beispiel Audio PaLM und übersetzt Gesprochenes in eine andere Sprache und versucht dabei die Stimme nachzuempfinden. Zum Beispiel von Deutsch auf Englisch oder von Serbisch ins Englische.

KI wie HeyGen kann in Videos sogar die Mundbewegung so verändern, dass sie zur angeblich gesprochenen Sprache passt. Das wird die Synchronisation in Filmen grundlegend verändern, denn die Originalschauspielenden müssen bald nicht mehr mühevoll und teuer übersetzt und nachvertont werden. Apps wie Deep Dub aus Israel stehen dafür schon in den Startlöchern.

Sprecht uns nach: STS (Speech to Speech) Conversion

Hier dient die eigene Sprachart als Vorlage für andere Stimmen. Dabei geht es nicht wie beim Cloning darum, die Stimme an sich zu übernehmen, sondern ihr Stimmmuster, die Betonung, das Sprachtempo und auch Räusperer oder „ähm“ und „öhm“ auf eine andere Stimme zu übertragen, um sie lebendiger zu machen.

So könnte ein Film in Zukunft von nur einer Sprecher:in eingesprochen, aber in alle verschiedenen Stimmen und Personen übertragen werden. Noch hört man dabei oft Akzente, aber an der Lösung dafür wird bereits gearbeitet: So wird dann aus einer Original-Aufnahme schnell eine weibliche Stimme oder ganz andere Sprecher:innen.

Fazit

KI hört sich schon ziemlich gut an, aber noch ist sie nicht auf menschlichem Niveau: Menschliches Knowhow und unsere Vorstellungskraft und Ziele sind noch unabdingbar. Davon abgesehen treten natürlich auch hier Urheber- und Persönlichkeitsrechtsfragen auf. Und nicht zu vergessen: Die Deep Fakes, die KI für Abzocke und Betrug nutzen. Es wird also darauf ankommen, dass wir einen guten Umgang damit finden, der uns Arbeit, Aufwand und Kosten abnimmt, aber nicht zu Missbrauch führt.

Weitere Einträge

  • Silent Islands geben was auf die Ohren: Ruhe

    3. September
    Jetzt gilt: lieber stille Inseln als einsame. Denn für eine Silent Island müssen Sie weder Schiffbruch begehen noch die Zivilisation verlassen. Sie bieten in alltäglichen hektischen Umgebungen Momente der Ruhe und Entspannung – passend zu Ihrer Marken- oder Produktbotschaft.
  • Bayerische Demenzwoche: Stille brechen, Bewusstsein schaffen

    3. September
    Demenz ist ein Thema, um das es uns oft zu still ist. Um darüber aufzuklären, Austausch zu schaffen, Solidarität zu steigern und auch die Prävention zu fördern, gibt es deshalb einmal jährlich die Bayerische Demenzwoche.
  • Binaurale Sounds: Umgeben von Stille

    3. September
    Stille ist am schönsten, wenn sie wie Natur klingt – Waldrauschen, Insektenschwirren, Wasser. Binaurale Sounds verstärken diesen Eindruck und lassen uns in diese Welt eintauchen.
  • Wir sind so frei: auf TikTok laut für unsere Demokratie

    3. September
    Freiheit ist das Einzige, was zählt – das stimmt nicht nur für Westernhagen Fans. Deshalb wollen wir dafür eintreten, politisch aufklären und damit: Demokratie sichern. Auf TikTok. Die Idee haben wir schon, jetzt brauchen wir noch einen Partner, der sie mit uns umsetzt.
  • Alle mal still sein: was uns Ruhe bringt

    3. September
    In der Ruhe liegt die Kraft. Deshalb beginnt auf Bali jedes Jahr mit dem Tag der Stille. Wenn es um Achtsamkeit geht, ist uns der Ferne Osten ja meist etwas voraus. Aber wir holen auf: auch bei uns hält die Stille Einzug als Mittel der Reflexion, Entspannung und zur Kommunikation.
  • Illusioneer Studio? Echt jetzt?

    7. May
    Hier ist der Illusionskünstler nicht die Person, sondern die Bühne: Im ILLUSIONEER Studio werden Bühnen und Sets virtuell erstellt und in Echtzeit gesteuert, um Shows und Events zu streamen. Und genau wie bei menschlichen Illusionskünstler:innen fragen wir uns: Wie funktioniert das?
  • Fake oder echt? Die Frage gilt jetzt auch bei OOH

    7. May
    Haben Sie schon digitale Plakate gesehen, aus denen Wasser geschwappt ist? Oder ein Sneaker wortwörtlich herausgetreten ist? Dann sind Sie schon voll dabei an den beiden großen Trends in der Außenwerbung und dem digitalen Marketing: 3D-DOOH und FOOH.
  • Ice Ice Promo – von Eisbullis bis Workshops.

    7. May
    Wer ist im Sommer nicht heiß auf Eis? Genau: Gibt’s nicht. Die kühle, schmelzende Süße verbindet uns alle. Damit ist sie perfekt, um mit Kund:innen in Kontakt zu treten oder Mitarbeitende zu überraschen – nicht nur als leckeres Give-away, sondern auch als coole Promo-Aktion.
  • Mir reicht’s – ich geh schaukeln

    7. May
    Das Studio für neue Schaukelkultur baut Schaukeln für Erwachsene. Für drinnen und für draußen. Für Wohnungen, für die Arbeit, für Messen, Events und für soziale Einrichtungen. Für alle Momente, in denen wir mal den Kopf frei kriegen und ein bisschen Schwung holen wollen.

Unsere Arbeiten

Was wir so zu bieten haben

Unser Leistungsspektrum

brandarena

Kommunikation & Event

Wir freuen uns von Ihnen zu hören

brandreport

Bleiben Sie up to date
Inspirationen und Input