BigScience Bloom

De boot gemist: waarom het Nederlands ontbreekt in het belangrijkste open Europese taalmodel

Drie vrijwilligers. Een paar weken aan werk. Dat is wat er nodig was om een taal op te nemen in BigScience BLOOM, het open meertalige taalmodel met maar liefst 176 miljard parameters dat halverwege 2022 uitkwam. Het moest een open, meertalig alternatief voor GPT-3 worden. Uiteindelijk zijn er 46 talen van over de hele wereld beland in de dataset waarmee BLOOM getrained is. Ook relatief kleine talen als het Baskisch en het Catalaans kregen het voor elkaar om opgenomen te worden....

18 september 2023 · 10 min · Edwin Rijgersberg
Screenshot of talk at EuroPython 2023

Mijn praatje op EuroPython 2023: "Threat to Life — Preventing Planned Murders with Python"

Ik kan niet vaak publiekelijk iets uit de doeken doen over het soort zaken dat we bij het Nederlands Forensisch Instituut doen met behulp van AI, maar op de afgelopen EuroPython 2023 in Praag heb ik namens het NFI iets kunnen vertellen over een zaak die een paar jaar terug speelde en waar het NFI al eerder een persbericht over uitstuurde: het Threat-to-Life-project. Politie kon live meelezen met criminelen Het was de politie in 2020 gelukt om live mee te kunnen lezen bij een aanbieder van zogenaamde cryptotelefoons: gemodificeerde telefoons die — tegen een flinke betaling — gebruikt werden om versleuteld te communiceren in het criminele circuit....

11 september 2023 · 4 min · Edwin Rijgersberg