Direkt zum Inhalt

KI imitiert Stimmen

Welche Risiken und Herausforderungen birgt die KI-basierte Stimmen-Nachahmung und welche Gefahren lauern für uns im Alltag?

Die Stimme ist in der digitalen Welt neben dem Gesicht ein Medium, mit dem sich Menschen identifizieren lassen, ohne dass wir ihnen gegenüber stehen. So ist es möglich, Passwörter mit der eigenen Stimme einzusprechen oder am Telefon wichtige Geschäfte abzuwickeln.
Die Stimme ist in der digitalen Welt neben dem Gesicht ein Medium, mit dem sich Menschen identifizieren lassen, ohne dass wir ihnen gegenüber stehen. So ist es möglich, Passwörter mit der eigenen Stimme einzusprechen oder am Telefon wichtige Geschäfte abzuwickeln.

Die Möglichkeiten der Künstlichen Intelligenz entwickeln sich rasant weiter. Mittlerweile gibt es Tools, die in der Lage sind, Stimmen eines Menschen im Original wiederzugeben. Auch lassen sich Videos von lebensechten Personen erstellen, die mit ihrer originalen Stimme sprechen. Die Videos unterscheiden sich nicht von solchen, die in der Realität aufgenommen wurden. Gleiches gilt für die Stimmen: Sie sind in der Lage, Gefühle und verschiedene Tonlagen zu interpretieren. Doch welche Konsequenzen hat die Weiterentwicklung dieser künstlichen Intelligenz für die Menschen und den Alltag? Als IT-Sicherheitsexperte bietet Thomas Kress individuelle Beratungen und Gastvorträge an. Dazu gehört auch das weite Themenfeld der Künstlichen Intelligenz und die Herausforderungen und Risiken, die mit dem Einsatz in Alltag und Beruf verbunden sind.

Stimmenimitation durch Künstliche Intelligenz

Es ist schon faszinierend, wenn Michael Jackson plötzlich live singen würde oder wenn der lange verstorbene Peter Frankenfeld mit den verschiedenen Dialekten, die er beherrschte, ein modernes Hörspiel aufnehmen würde. Das Programm VALL-E soll dies und viele andere Dinge ermöglichen. Um die perfekte Tonlage mit Gefühlen und Stimmmelodie zu kopieren, benötigt das Programm nur drei Sekunden. Bislang ist das Programm noch nicht marktreif, doch andere Entwickler sind schneller: Schon heute ist es möglich, Künstliche Intelligenz zur Stimmenimitation zu verwenden. Und das kann nicht die Faszination auslösen, wenn sich bereits verstorbene Persönlichkeiten beispielsweise zur aktuellen Lage äußern.

Gefahren im Alltag durch künstlich erzeugte Stimmen

Die Stimme ist in der digitalen Welt neben dem Gesicht ein Medium, mit dem sich Menschen identifizieren lassen, ohne dass wir ihnen gegenüber stehen. So ist es möglich, Passwörter mit der eigenen Stimme einzusprechen oder am Telefon wichtige Geschäfte abzuwickeln. Auch vertrauensvolle Telefonate innerhalb der Familie oder unter Freunden sind nur möglich, weil die Stimme der Person bekannt ist. Nun ist die Künstliche Intelligenz in der Lage, Stimmen so genau zu imitieren, dass auch vertraute Personen die Kommunikation mit dem Computer nicht erkennen. Hier liegen Gefahren, die derzeit noch gar nicht abzusehen sind. Zwei Beispiele für eine gefährliche Stimmenimitation

Anzeige
Der Enkeltrick funktioniert bei älteren Menschen leider auch ohne die Imitation von Stimmen. Mit jedem Lebensalter kommen bei den meisten Senioren Einschränkungen hinzu, auch in der Merkfähigkeit und in der Fähigkeit, sich Namen von Personen zu merken oder diese auseinanderzuhalten.
Der Enkeltrick funktioniert bei älteren Menschen leider auch ohne die Imitation von Stimmen. Mit jedem Lebensalter kommen bei den meisten Senioren Einschränkungen hinzu, auch in der Merkfähigkeit und in der Fähigkeit, sich Namen von Personen zu merken oder diese auseinanderzuhalten.

Der Enkeltrick

Der Enkeltrick funktioniert bei älteren Menschen leider auch ohne die Imitation von Stimmen. Mit jedem Lebensalter kommen bei den meisten Senioren Einschränkungen hinzu, auch in der Merkfähigkeit und in der Fähigkeit, sich Namen von Personen zu merken oder diese auseinanderzuhalten. Dies machen sich Betrüger mit dem sogenannten Enkeltrick zunutze: Sie rufen ältere Menschen an, geben sich als Enkel, Urenkel oder Großneffe/Großnichte aus und erzählen wortreich, dass sie in finanziellen Schwierigkeiten sind. Ziel ist es, das Opfer so weit zu bringen, dass es Geld an die Betrüger überweist. Der Trick fliegt häufig auf, weil die Senioren aufgrund der Stimme oder der Art, sich auszudrücken, stutzig werden. Ganz anders würde es sich verhalten, wenn die echte Stimme des Enkelkindes zu hören wäre. Oder die, die von der Künstlichen Intelligenz erzeugt wurde.

Wie kann Künstliche Intelligenz (KI) im Risikomanagement eingesetzt werden?
KI im Einsatz beim Risikomanagement
Wie kann Künstliche Intelligenz (KI) im Risikomanagement eingesetzt werden? Wie müssen Prozesse und Richtlinien dazu aussehen? Michael Jahn-Kozma, Vorstandsmitglied der RMA Risk Management & Rating Association e.V. und Corporate Risk Manager bei der Kuka AG, gibt Antworten.

Telefonische Interviews mit Politikern

Politiker haben in der Regel einen langen Arbeitstag mit vollem Terminkalender. Das Führen von persönlichen Interviews ist nicht immer möglich: Der Journalist befindet sich an einem ganz anderen Ort oder das Treffen lässt sich einfach nicht in den Terminplan integrieren. Aus diesen Gründen sind telefonische Interviews eine Alternative zum persönlichen Gespräch, die sich im politischen Journalismus etabliert hat. Die Stimmen der Politiker sind aus dem Fernsehen, aus dem Radio und aus dem Internet bekannt. Jeder hält regelmäßig Reden oder gibt Interviews vor der Kamera. Somit konnten Journalisten bislang sicher sein, dass sie ein Interview mit der Person führen, die sie sprechen wollten. Die Künstliche Intelligenz kann diese Sicherheit beenden. Wenn sie in der Lage ist, die Stimmen mit täuschend echter Ähnlichkeit zu imitieren, liegt in jedem Interview eine Gefahr: Die Künstliche Intelligenz gibt Stellungnahmen zu einem brisanten Thema ab, die der Journalist über die Medien verbreitet. Hat der Politiker dies gar nicht gesagt, weil der Journalist mit der Künstlichen Intelligenz gesprochen hat, kann dies zu Fehlinformationen mit ungeahnten Folgen führen.

Künstliche Intelligenz steuern

Die Künstliche Intelligenz ist in immer mehr Lebensbereichen präsent. Die Frage ist, wie viel der Mensch zulassen möchte. Wollen wir von computergesteuerten Filmen mit Figuren und Stimmen unterhalten werden oder doch lieber menschliche Schauspieler sehen? Möchten wir, dass der Nachrichtensprecher animiert ist und das spannende Buch von der KI geschrieben wurde? Oder wollen wir nicht alles ausschöpfen, was die KI kann, und die einzelnen Bereiche steuern? Der IT-Sicherheitsexperte Thomas Kress hat Antworten auf alle Fragen rund um die KI und beantwortet diese gern persönlich oder im Rahmen eines Interviews.

Thomas Kress, IT-Sicherheitsexperte und Inhaber der TKUC Group mit den Marken TKUC und The Unified

Passend zu diesem Artikel