Universiteit Leiden

nl en

Synthetische dataset beschermt privacy bij criminologisch onderzoek

Er zijn weinig openbare datasets beschikbaar voor criminologisch onderzoek, vooral als het gaat om moorden. Privacywetten verhinderen vaak het delen van data. Het SENSYN-project heeft hiervoor een oplossing gevonden: synthetische datasets. Marieke Liem, hoogleraar Veiligheid en Interventies, vertelt over deze unieke innovatie.

Waarom synthetische data bij moordonderzoek?

‘De beschikbaarheid van gevoelige en waardevolle datasets omtrent moordonderzoek blijft schaars. Dit wordt deels veroorzaakt door onderzoekers die weigeren om hun gegevens te delen vanwege privacywetgeving en een gebrek aan een cultuur die dergelijke praktijken stimuleert, wat weer gevolgen heeft voor het beleid op het gebied van misdaad en justitie. Een gebrek aan transparantie kan het vertrouwen in onderzoek en het daarop gebaseerd beleid verminderen. In dit onderzoeksgebied kunnen synthetische gegevens nuttig zijn, die algoritmisch zijn gegenereerd om te lijken op echte data maar niet herleidbaar zijn naar echte individuen. Deze kunnen vervolgens gebruikt worden om misdaadpatronen te analyseren en politiemodellen te ontwikkelen.’ 

Wat zijn de resultaten van het SENSYN-project?

‘We hebben aangetoond dat het synthetiseren van gevoelige gegevens (zoals moorddata) mogelijk is. Het is gelukt om een synthetische dataset te genereren die toegankelijk is voor iedereen op een publiek toegankelijke website, waar gebruikers hun eigen figuren, grafieken en tabellen kunnen creëren. 

Kortom, synthetische gegevens maken het makkelijker om data te delen en FAIR-principes toe te passen (dit betekent dat data gevonden, begrepen en gebruikt kunnen worden door zowel mensen als computers), vooral bij gevoelige informatie. Met deze techniek kun je datasets maken die lijken op echte gegevens zonder dat privé-informatie wordt gedeeld.’ 

Publieke toegang: welk voordeel heeft dit?

‘De beschikbare dataset biedt mogelijkheden voor het brede publiek om misdaadstatistieken te onderzoeken. Onder meer beleidsmakers en ngo'’s kunnen hierbij veel baat hebben om meer inzicht te krijgen in trends en ontwikkelingen in het criminele milieu. De dataset is toegankelijk op Zenodo, waar gebruikers zelf analyses kunnen uitvoeren op specifieke misdaadtrends.'

Hoe zien de toekomstplannen van het project eruit en komen er mogelijke uitbreidingen?

‘We hopen deze techniek te kunnen gebruiken bij het delen van data over specifieke vormen van (fataal) geweld. Daarnaast hebben we, nu we een proof-of-concept hebben, ook aanleiding om deze techniek toe te passen op andere gevoelige data, bijvoorbeeld op patiëntendata.’ 

Wie speelden een grote rol in deze interdisciplinaire samenwerking?

‘Het succes van het SENSYN-project is mede te danken aan de unieke samenwerking tussen verschillende disciplines en instituten, waaronder het Leiden Institute of Advanced Computer Science (LIACS), het Leiden Universitair Medisch Centrum (LUMC) en het Institute of Security and Global Affairs (ISGA). Interdisciplinaire samenwerking en interdisciplinair denken gaat niet vanzelf: het is hard werken, je moet als het ware elkaars “taal” leren spreken, elkaars vocabulaire kennen en elkaars manier van denken. Het is enorm inspirerend om met zoveel talent in de universiteit te werken – je leert dat collega’s vanuit verschillende disciplines op een hele frisse, andere blik naar je vakgebied kijken. Daar wordt je eigen onderzoek alleen maar beter van.’ 

Tekst: Job Van de Waeter

Deze website maakt gebruik van cookies.  Meer informatie.