Israëlisch bedrijf komt met nieuwe fintech die weet of je stem overeenkomt met je gezicht
- Joop Soesan
- 16 jul 2024
- 4 minuten om te lezen
Foto Corsound
Corsound hoopt online fraudeurs te kunnen bestrijden door onderscheid te maken tussen een echte stem en een gekloonde stem, en door te identificeren of een foto van een nieuwe klant overeenkomt met zijn of haar stem.
Je gezicht is niet langer van jou. En je stem ook niet.
Fraudeurs kunnen ze allebei van internet stelen. En met behulp van de kracht van AI kunnen ze een deepfake- versie van jou creëren die zo overtuigend is dat hij de bankbeveiliging overtreft.
Banken en financiële instellingen maken tegenwoordig steeds vaker gebruik van stembiometrie om de identiteit van een beller te bevestigen.
En criminelen maken steeds vaker op twee manieren misbruik van deze stembiometrie.
Ze klonen de stem van een beller om de computer van de bank te laten geloven dat hij een bestaande klant is.
En ze creëren een volledig valse identiteit om een nieuw account te openen.
Corsound, een startup gevestigd in Tel Aviv, heeft voor beide problemen een oplossing. Ten eerste heeft het technologie ontwikkeld om een gekloonde stem te detecteren.
Criminelen halen een stemfragment uit sociale media, een YouTube-filmpje of zelfs een online vergadering.
Vervolgens klonen ze het met behulp van gratis online software om de echte klant na te bootsen.
Corsound kan het verschil horen tussen een echte stem en een gekloonde stem.
Ten tweede kan het systeem vaststellen of een foto van de klant die een nieuwe rekening opent, overeenkomt met de stem van de persoon in kwestie.
Als een fraudeur dus een foto van A en de stem van B gebruikt, wordt de aanvraag direct afgewezen.
Dat komt omdat het op basis van iemands uiterlijk weet hoe iemand zal klinken.
Van een stem een gezicht maken
Dat is behoorlijk verbazingwekkend als je het vertaalt naar je eigen levenservaring. Jij en ik pakken de telefoon op van een vreemde en hebben geen idee hoe die vreemde eruitziet. Maar Corsound wel.
En er wordt momenteel gewerkt aan geavanceerde technologie die daadwerkelijk iemands gezicht schetst, gebaseerd op niets meer dan vijf of zes seconden van een stemopname.
Een schets gegenereerd door een audiostembestand. Foto met dank aan Corsound
Het luistert naar je via de telefoon – wat vaak audio van slechte kwaliteit is – en creëert een foto van hoe je eruitziet. Het koppelt je stem niet aan een bestaande foto in een database. Het genereert direct een foto vanaf nul.
Het bedrijf beschrijft het als ‘magie’ en ‘de enige technologie ter wereld die een gezicht kan creëren uit alleen een stem’.
Orel Agmon Halido, hoofd verkoop bij Corsound, benadrukt tegenover ISRAEL21c dat dit nog in ontwikkeling is – en daarom moet hij teleurstellen toen ik om een persoonlijke demo vroeg – maar hij geeft wel een inkijkje in hoe het werkt.
“Wij zijn als een muziekinstrument”, zegt hij. “Onze stem komt door onze longen en keel, en wordt beïnvloed door de vorm van ons gezicht, de mondholte, de neuskanalen, de lippen, dit hele gebied. Kortom, we trainen ons model om onderscheid te maken tussen al die verschillen.”
De AI leert, door het verwerken van talloze voorbeelden, welke gezichten bij welke stem passen. En welke niet.
"Als je het meerdere keren doet, duizenden en tienduizenden keren, kun je begrijpen hoe een stem eruitziet", zegt Halido tegen ISRAEL21.
“Ons doel is eigenlijk om het gezicht van een persoon te schetsen, maar ik zal heel eerlijk tegen je zijn. Daarvoor hebben we nog steeds heel veel data nodig.”
Overstappen naar commerciële modus
De technologie is gebaseerd op onderzoek uit 2019 van MIT (Massachusetts Institute of Technology) naar de correlatie tussen stem en gezicht.
Onderzoekers ontdekten dat een snelle opname van audio een enorme hoeveelheid gegevens onthult over iemands geslacht, leeftijd, etniciteit, huidskleur, neus- en kaakvorm, en meer.
Foto Corsound
Corsound werd in juni 2020 opgericht als dochteronderneming van het in Tel Aviv gevestigde AI-bedrijf Cortica, om manieren te ontwikkelen om die technologie te implementeren. Het heeft momenteel 17 medewerkers in Tel Aviv, waarvan de meesten werken in R&D op basis van meer dan 200 AI-patenten van het moederbedrijf.
Corsound heeft tot nu toe $3,5 miljoen opgehaald bij het Canadese durfkapitaalbedrijf Awz Ventures en bij de Israel Innovation Authority.
Nu er een aantal POC's (proofs of concept) klaar zijn, gaat het bedrijf volgens Halido van de ontwikkelingsmodus naar de commerciële modus en zoekt het naar klanten.
"Voor zover wij weten is het de eerste keer dat er een technologie is die identiteitsdiefstal kan voorkomen", zegt hij.
De bedreigingen van generatieve AI zijn al enorm, en worden nog groter.
“Banken moeten er alles aan doen om klanten te beschermen. En daarom moeten ze nieuwe technologieën omarmen om de bedreigingen te begrijpen die met de AI-technologie gepaard gaan.”
Synthetische gesproken waarschuwing
Hoewel banken traditioneel vrij conservatief zijn als het gaat om het omarmen van technologie, vormen bank- en financieringsmaatschappijen volgens hem de grootste doelgroep van Corsound.
Het bedrijf demonstreerde zijn technologie in februari aan potentiële bankklanten tijdens de Finovate 2024-conferentie in Londen, met gesimuleerde oproepen van klanten.
In de eerste belt een Australische vrouw om $ 2.000 over te maken naar haar man. De stem is nep, maar het misleidt bestaande beltechnologie die volgens Corsound momenteel een marktaandeel van 90 procent heeft.
Dezelfde opname wordt vervolgens afgespeeld met de technologie van Corsound en wordt onmiddellijk gemarkeerd als 'Fraud: Synthetic Voice Alert', omdat deze weet dat de stem digitaal is gemanipuleerd.
Halido simuleert vervolgens het onboardingproces voor een nieuwe bankklant met behulp van de technologie van zijn bedrijf.
“Mijn identiteit is veilig omdat mijn stem mijn wachtwoord is”, vertelt hij tegen de computer van de bank. “Verifieer mij alstublieft.” Corsound verifieert onmiddellijk dat zijn stem echt is – want dat is het ook.
Vervolgens uploadt hij een ‘gestolen foto’ – een afbeelding van de CEO van het bedrijf, Gal Haselkorn – in plaats van een foto van zichzelf.
De AI wijst zijn aanvraag onmiddellijk af, omdat hij weet dat het gezicht dat hij heeft opgegeven niet overeenkomt met zijn stem.
De technologie van Corsound zal, zegt Halido, de financiële en banksector miljarden dollars per jaar aan frauduleuze transacties besparen.
De voice-to-face-technologie heeft ook bredere toepassingen en zou een revolutie teweeg kunnen brengen in onderzoeken bij wetshandhaving, waarbij gezichtsstructuren en gezichtsschetsen alleen op basis van stemopnames kunnen worden gegenereerd.
Comments