
Succesvol onderzoek ontsluiting Oral History
Succesvol onderzoek ontsluiting Oral History
Verhalen over de Tweede Wereldoorlog gaan over vrijheid en onvrijheid, democratie, rechtsstaat, keuzes, geweld, discriminatie en uitsluiting. Tijdloze thema’s die uitnodigen tot debat en reflectie. Het waarborgen van deze verhalen is van maatschappelijk belang, zeker nu er steeds minder ooggetuigen zijn die deze verhalen uit eerste hand kunnen vertellen. Vanuit WO2Net zijn we dan ook altijd op zoek naar oplossingen om deze verhalen op een toegankelijke manier beschikbaar te maken voor het brede publiek.
Ooggetuigen interviews
Oral history draagt eraan bij deze verhalen blijvend een stem te geven. Het gaat hierbij om persoonlijke verhalen die zijn vastgelegd in opgenomen interviews met ooggetuigen. Een waardevolle bron dus, maar veelal weinig toegankelijk. De interviews zijn uitgebreid en kunnen uren duren. Daarbij bevatten ze ook niet-historische content, zoals de setup van het interview zelf.
Tijdrovend en kostbaar
Het handmatig segmenteren van interviews is tijdrovend en kostbaar. Om deze reden wordt er al gebruikgemaakt van Large Language Models (LLMs, GPT-5.2) om dit proces te automatiseren. LLMs hebben echter de neiging om onduidelijke concepten te genereren door bijvoorbeeld een fragment aan te duiden met “Vertelt over de oorlog” in plaats van “Arrest in Rotterdam”.
Optimaliseren interview segmentatie
Als onderdeel van hun minor Digital Humanities and Social Analytics deden VU-studenten Feruza Bakhtiyorova en Dunya Boon begin dit jaar onderzoek naar mogelijkheden om dit geautomatiseerde segmentatieproces te optimaliseren.
Zij keken hierbij naar de 1.250 commentaren van de vrijwilligers aan het Oral History crowdsourceproject en vonden dat 66% van de fragmenten gemarkeerd was voor herziening.
Na het analyseren van deze commentaren, konden zij de markeringen categoriseren in:
- conceptfouten (37,3%)
- titelbewerkingen (20,1%)
- tijdverschuivingen (11,2%)
- fragmentverwijdering (6%)
Aanscherpen prompt engineering
Op basis van deze inzichten richten zij zich op het verbeteren van het segmentatieproces door de prompt engineering aan te scherpen, met focus op het verwijderen van technische setup, het samenvoegen van gefragmenteerde inleidingen en het controleren van fragmentlengte en overlap. Om de aangepaste strategie te testen, voerden ze een vergelijkende analyse uit op tien interviews.
In zes van de tien gevallen waren de tijdverschuivingen positief, wat betekent dat dat de verfijnde promptstrategie succesvol was in het verwijderen van niet-historische technische introducties. In de andere vier gevallen was er bij voorbaat geen sprake van een markering van het fragment, dus diende er niks aangepast te worden.

Studenten Feruza Bakhtiyorova en Dunya Boon met twee van hun begeleiders vanuit WO2Net, Daan Raven en Micon Schorsij.
Fijne samenwerking
Zowel WO2Net als de studenten kijken met een positief gevoel terug op het project:
“Afsluitend is het segmentatieproces van deze interviews van maatschappelijk belang en zijn wij als studenten tevreden met ons werk.
Verder zijn we blij dat wij deze kans hebben gekregen om met een fijne organisatie als WO2Net samen te mogen werken. Onze resultaten geven een indicatie voor verfijnde resultaten met betrekking tot LLM-gegenereerde interviewsegmentaties. Ondanks de begrenzingen van ons project zijn dit resultaten waarop kan worden voortgeborduurd.”
Feruza Bakhtiyorova en Dunya Boon
“Het is altijd inspirerend om samen te werken met studenten uit de Digital Humanities. Ze kijken met een frisse blik naar ons werk en dagen ons uit om anders te denken. Die wisselwerking levert ons veel nieuwe inzichten op.”
Daan Raven (Dataspecialist WO2Net)
Meer activiteiten?
WO2Netwerkdag 2026
9 juni - Beeld & Geluid Hilversum
Monitor Kennisoverdracht jongeren
Terugblik online presentatie
Verslag online bijeenkomst: De verhalen achter het Paspoortarchief
Op 11 november 2025 vond er een online bijeenkomst plaats in het kader van het crowdsource project rondom het Indisch Oud-Paspoortarchief, uitgevoerd door Stichting WO2Net.
Direct naar
Contactgegevens
Stichting WO2Net
Weesperstraat 107
1018 VN Amsterdam
RSIN-nummer: 865055993
©2024 – Alle rechten voorbehouden



