Wer ist am anderen Ende der Telefonleitung?

Jürgen Vollmer, Director Central & Eastern Europe, Pindrop
Jürgen Vollmer, Director Central & Eastern Europe, Pindrop

In der vergangenen Woche hat Google seine neue Version des KI-Assistenten vorgestellt – „Google Duplex“. Die Software kann in Zukunft selbständige Telefongespräche im Auftrag ihres Nutzers führen. Dabei kann ein Zuhörer kaum hören, welche Stimme bei dem Anruf einem Menschen und welche einem Computer gehört. Doch dürfen im Zeitalter von Fake News, Cyberangriffen und CEO-Fraud Maschinen so tun, als seien sie Menschen?

Geht es um das Thema Sicherheit von persönlichen Daten, wird derzeit im Zuge der DSGVO viel getan, doch der bis dato wenig ins Visier geratene Telefonkanal bleibt weitestgehend unberücksichtigt. Und doch ist es heute mit entsprechenden Mitteln ein leichtes Spiel, Stimmen zu verfremden und sich auf diesem Wege Daten zu beschaffen oder noch viel schlimmer, Banktransaktionen durchzuführen. Dass die Stimme im Zuge der Digitalisierung aber eine zunehmende Rolle spielen wird, sieht man an dem Google-Duplex Beispiel sehr deutlich.

Da sich die menschliche Stimme nach und nach verändert, wird eine herkömmliche Sprachauthentifizierung schnell nicht mehr richtig funktionieren. Die Unternehmen müssen deshalb nach einem System suchen, das in der Lage ist, kontinuierlich zu lernen und sich eigenständig an die Stimme des Benutzers anzupassen. Außerdem werden nicht nur die biometrischen Verfahren immer besser, sondern auch der Modus Operandi der Betrüger. Wenn ein Betrüger merkt, dass ein Unternehmen Sprachbiometrie einsetzt, wird er versuchen, Tricks anzuwenden, um die Schutzmechanismen zu überlisten. Stimmen werden synthetisiert, verfälscht, aufgenommen und wieder passend zusammengesetzt. Um sich und die Kunden wirklich schützen zu können, müssen Unternehmen deshalb unbedingt sämtliche Einfallsmöglichkeiten berücksichtigen. Unerlässlich ist außerdem eine mehrschichtige Abwehrstrategie, die außer der Stimme noch weitere Kriterien wie das Endgerät, die Kommunikationsinfrastruktur sowie das Eingabeverhalten zu einer Multifaktor-Authentifizierung heranzieht.

Sprachauthentifizierung mit technischen Mitteln entwickelt sich schnell zu einer Selbstverständlichkeit. Gleich, ob Geld abgehoben oder online eingekauft wird – künftig wird es die Stimme sein, die diese Transaktionen tätigt, nicht mehr die Computermaus. Die Unternehmen müssen beginnen, sich auf die bevorstehende sprachgesteuerte Revolution vorzubereiten.

Mittlerweile gibt es Technologien wie „Deep Voice“, die auf den bestehenden Grundlagen der Sicherheitsüberprüfung mittels Sprachbiometrie aufbauen und hochentwickelte Multi-Faktor-Authentifizierung bieten. „PhonePrinting“ ist in der Lage, spezifische Komponenten jedes Anrufs zu erkennen und Anomalien zu den Metadaten zu ermitteln, von welchem Land und durch welchen Netzwerkanbieter ein Anruf kommt, welches Gerät der Anrufer verwendet, ob es sich um ein Mobil- oder Festnetztelefon handelt und ob das Unternehmen mit diesem Telefon schon früher kontaktiert wurde. Mit der Toneprinting-Technologie werden passiv tonbasierte Signale jedes Tastendrucks durch Anrufer analysiert. Dadurch kann dem Kunden ein Eingabeverhaltensmuster zugewiesen werden. Maschinell gestützte Eingabeverfahren (Dialer) oder typische Verhaltensweisen bei einer versuchten Kontoübernahme können mit der Toneprinting-Technologie unterbunden werden.

Im Zusammenspiel dieser verschiedenen Technologien ist es möglich, Betrüger zu erkennen, bevor sie ihr Ziel erreichen. Zudem sind sie ein zukunftsweisender Schritt, mit dem die Stimme wirksam vor den zunehmenden Betrugsversuchen geschützt werden kann.

#Netzpalaver #Pindrop