Play
Foto: Bokheestore / shutterstock.com
Bild: BokheeStore | shutterstock.com

Zurück zum Thema | Stimmsynthese

Wie verändern synthetische Stimmen unsere Gesellschaft?

Softwares wie Lyrebird geben Texte in Sprachfluss aus – so täuschend echt, dass man sie am Telefon nicht vom Original unterscheiden kann. Wir fragen: Wie verändert Stimmsynthese unsere Gesellschaft?

Der „Fake President“ ruft an

Freitagnachmittag im Büro. Bald ist Feierabend – da kommt noch ein Anruf: Der Chef! Er möchte, dass umgehend ein hoher Geldbetrag auf das Konto einer Firma im Ausland überwiesen wird. Hinterfragen wird man das in der Eile nicht, war ja auch der Chef – den kennt man ja. Wird schon stimmen. Das Geld wird also überwiesen – und ist weg. Denn wie sich herausstellt, ist gar nicht der Chef am Telefon gewesen, sondern nur seine Stimme.

Mit Google duplex kann man sein Smartphone telefonieren lassen. Und wenn man sich das anhört, dann ist das schon so, dass eine Maschine mit einem Menschen telefoniert und der Mensch nicht unbedingt merkt, dass da eine Maschine mit ihm spricht.

Sandra Müller, Radiomacherin bei fair radio

Schon seit ein paar Jahren schreibt der „Fake President“, so der Name der Betrugsmasche, Mails mit Überweisungswünschen von gehackten Konten. Das hat bislang schon zu Schäden in Millionenhöhe geführt. Im März letzten Jahres markierte ein Vorfall in der britischen Niederlassung eines deutschen Unternehmens eine neue Qualität: Zum ersten Mal ist die Stimme eines Vorgesetzten so täuschend echt simuliert worden, dass sie am Telefon nicht vom Original zu unterscheiden war. Möglich wurde das durch die Stimmsynthese-Software „Lyrebird“.

Ein Vöglein in der Tiefe des Waldes

Namensgeber der Software ist der australische Leierschwanz (engl. Lyrebird). Diese Vögel können jede Art von Geräuschen, auch die menschliche Stimme, täuschend echt imitieren. Aber die Software „Lyrebird“ ist ihrem Paten bereits einen Schritt voraus: Wo Leierschwänze nur imitieren können, kann „Lyrebird“ getippte Texte in der Stimme und Sprachmelodie jedes beliebigen Menschen ausgeben – vorausgesetzt, Lyrebirds tiefes neuronales Netzwerk wurde vorher mit ausreichend Audiomaterial vom Original gefüttert.

Hinter „Lyrebird“ steht ein kanadisches Start-Up, das in der Software ein gewaltiges Potenzial sieht: Patienten mit Amyotropher Lateralsklerose kann die Software zum Beispiel ihre verlorene Stimme zurückgeben. Aber überwiegen tatsächlich die Chancen?

Die Stimme ist ja auch ein Sympathiefaktor. Und dementsprechend stehen für manche Produkte die Chancen gar nicht so schlecht, dass durch bessere Stimmen die Akzeptanz bei Verbrauchern erhöht werden kann.

Dagmar Schuller, Geschäftsführerin von audEERING

Nico van Capelle von detektor.fm hat sich mit der heise-Redakteurin Dorothee Wiegand die Evolution der synthetischen Stimme genauer angeschaut. Die Radiomacherinnen Sandra Müller und Katharina Thoms hat er gefragt, wie der Stand der Entwicklung in Sachen Stimmsynthese ist. Und Dagmar Schuller, Geschäftsführerin der Firma audEERING, kennt sich mit den möglichen Anwendungsfeldern aus. Wir fragen: Wie verändern synthetische Stimmen unsere Gesellschaft?