Ik kan niet vaak publiekelijk iets uit de doeken doen over het soort zaken dat we bij het Nederlands Forensisch Instituut doen met behulp van AI, maar op de afgelopen EuroPython 2023 in Praag heb ik namens het NFI iets kunnen vertellen over een zaak die een paar jaar terug speelde en waar het NFI al eerder een persbericht over uitstuurde: het Threat-to-Life-project.
Politie kon live meelezen met criminelen
Het was de politie in 2020 gelukt om live mee te kunnen lezen bij een aanbieder van zogenaamde cryptotelefoons: gemodificeerde telefoons die — tegen een flinke betaling — gebruikt werden om versleuteld te communiceren in het criminele circuit. Het was niet de eerste keer en ook niet de laatste dat de politie dat lukte. Het gebeurt dusdanig vaak dat er intussen zelfs een een overzichtslijstje bestaat van dergelijke operaties tegen aanbieders van cryptotelefoons.
In de praktijk blijkt dat sommige criminelen zich bijzonder veilig wanen bij het gebruik van dergelijke cryptotelefoons. Ze sturen dan ook zonder blikken of blozen de meest gevoelige en belastende berichten onverbloemd over de lijn. Communicatie is key in de zakenwereld blijkbaar, wat voor soort zaken je ook doet.
Detecteren van threat-to-life-berichten
Kunnen meelezen is één ding, maar als het gaat om een grote stroom berichten dan wil je dat sommige typen berichten wel echt op tijd door de politie beoordeeld worden. Als er bijvoorbeeld gesproken wordt over het voorbereiden van mishandelingen, ontvoeringen en liquidaties, dan moet er op tijd actie ondernomen kunnen worden om die te kunnen voorkomen. Daar was dus iets voor nodig: een threat-to-life-detector.
Ziedaar de uitdaging: train een classificatie-model dat threat-to-life berichten kan vinden in grote verzamelingen niet-threat-to-life-berichten afkomstig van cryptotelefoons. En hoewel de taak — classificatie — op zich niet zo vernieuwend is, is het nog niet triviaal om zo’n model van de grond te krijgen. Je moet immers een model maken dat kan omgaan met het soort taal dat in dit soort berichten voorkomt: informeel en doorspekt met straattaal en jargon. Heel wat anders dat de taal die tegenkomt als je Wikipedia scrapet dus.
Daarnaast moet je voldoende trainingsdata weten te verzamelen — voorbeelden van het soort berichten waar je naar op zoek bent. En die waren dus relatief zeldzaam in de grote stroom met andere berichten. Een beetje een kip-ei-probleem eigenlijk.
EuroPython 2023
Hoe we die problemen opgelost hebben kan je zien in de live-opname van mijn praatje hieronder. Het was een relatief kort praatje voor een publiek van programmeurs, niet per sé van data scientists. Ik heb er daarom voor gekozen om niet heel diep op de details van de deep learning in te gaan, en in plaats daarvan wat meer tijd te besteden aan de context van het hele verhaal.
Maar juist daarom is het denk ik een aardig kijkje in de keuken: het laat zien waar je tegenaan loopt bij de inzet van AI voor een zaak als deze.
Tientallen zware geweldsmisdrijven voorkomen
En het resultaat? In het persbericht van de politie uit juli 2020 werd de voorlopige balans opgemaakt van de politieoperatie. Daaruit blijkt ook wat de politie heeft kunnen doen met de threat-to-life-signalen die uit het onderzoek voortkwamen.
Hieronder de voorlopige balans:
- Meer dan 100 verdachten aangehouden voor zeer zware delicten
- Bijna 20 miljoen euro cash in beslag genomen
- De inbeslagname van 8000 kilo cocaïne en ruim 1200 kilo crystal meth
- Er zijn 19 synthetische drugslabs ontmanteld
- Ook werden tientallen vuurwapens van straat gehaald
- Alleen al in Nederland werden de afgelopen maanden ruim 3000 signalen verwerkt die levensbedreigend leken. Door steeds tijdig in te grijpen heeft de politie tientallen zware geweldsmisdrijven kunnen voorkomen, waaronder op handen zijnde ontvoeringen, afpersingen, liquidaties en martelingen.
Intussen, drie jaar later, is Europol nog steeds de score aan het bijhouden van de hele operatie. Volgens hun staat de teller intussen op meer dan 6.500 arrestaties en is er voor bijna 900 miljoen euro aan cash en tegoeden in beslag genomen.
En nu?
Cryptotelefoons en ontcijferde berichten waren en zijn nog steeds zeer actueel in strafzaken. Dat wordt nogmaals geïllustreerd door een recent nieuwsartikel van NOS over hoe de digitale afdeling van het NFI honderden individuele crypotelefoons wist te kraken.