Martijn Aslander

May 6, 2026

Een oplossing voor het versnipperde archieflandschap van WO2

ca4c92ec-1fb9-4641-a557-33509e153fc4.png

De meeste mensen kennen de Tweede Wereldoorlog uit boeken, documentaires en herdenkingen. Verhalen over individuele mensen, verteld door historici die jarenlang in archieven graven. Dat werk is onmisbaar. Maar er zit een blinde vlek in: elk archief staat op zichzelf.
 
Oorlogsbronnen.nl bevat miljoenen bronnen uit meer dan 250 collecties; daarvan haalde ik 1,5 miljoen observaties binnen (losse claims uit bronnen, niet hele dossiers). Het Rode Kruis-archief in Bad Arolsen, ooit de International Tracing Service, heeft er 211.000 over Nederlandse slachtoffers. Het Joods Monument 104.000. De Oorlogsgravenstichting, het US Holocaust Memorial Museum, de Commonwealth War Graves Commission en de Westerbork-administratie zijn samen goed voor nog eens tientallen duizenden registraties (en ik ben ongetwijfeld archieven vergeten).
 
Die bronnen kruisen niet onderling. Wie in vier archieven voorkomt, krijgt vier records die los van elkaar blijven staan. De International Tracing Service werd in 1948 onder geallieerde leiding opgericht om vermisten op te sporen, en werd lange tijd beheerd door het Internationale Rode Kruis. Na de oorlog groeide het uit tot het grootste archief over slachtoffers van de nazi-vervolging, met dertig miljoen documenten. Maar het archief zat decennialang op slot. Pas in 2007 ging het open, na jarenlange internationale politieke druk. Het Joods Monument is een Nederlands herdenkingsproject. Oorlogsbronnen een platform van de WO2-herinneringssector. De Oorlogsgravenstichting beheert graven. Het zijn verschillende organisaties, uit verschillende landen met hele verschillende doelen.
 
Maar bronnen samenvoegen is één ding. De vraag is wat je mag geloven als ze elkaar tegenspreken, of als ze over dezelfde persoon gaan maar net iets anders zeggen.
 
Archivistische intelligentie
WOZ staat voor WOII-OS. Ik werk in mijn systeem met korte afkortingen die ik makkelijk kan onthouden en typen. LLS voor het Life Lens System. MOS voor het Mouseion, mijn bronbibliotheek, vernoemd naar de kennisbibliotheek van Alexandrië. En WOZ voor dit oorlogsarchief.
 
Maar de intelligentie in dit systeem is geen artificial intelligence. Het is archivistische intelligentie: de AI leest de pixels, mijn informatiearchitectuur en scripts maken er een robuust geheel van. De kracht zit niet in een slim algoritme, maar in elegant informatieontwerp.
 
De architectuur is epistemologisch, gebouwd op de vraag: wanneer mag je iets geloven? Elke bron levert observaties op, elke observatie heeft een betrouwbaarheidsscore en elke kruising wordt nauwkeurig gewogen. Het systeem zegt niet "dit is waar." Het zegt "dit wordt ondersteund door drie onafhankelijke bronnen met deze mate van zekerheid." Die architectuur komt uit het Life Lens System, een methode om onzekerheid expliciet te maken die ik eerder ontwikkelde.
Op dit moment bevat WOZ 2,1 miljoen observaties over ruim 1 miljoen unieke personen. Van die miljoen zijn er 377.000 bevestigd door twee of meer onafhankelijke bronnen, en dat aantal blijft elke maand groeien. Niet omdat een neuraal netwerk het zegt, maar omdat het ontwerp steeds meer bronnen tegen elkaar weegt.
 
De aanleiding
Nadat ik mijn methode had gebouwd en erover had gepubliceerd, had ik contact met Monique Brinks. Zij is historica, verbonden aan WO2Net als Senior Publiek & Innovatie. Als directeur van Stichting OVCG leidde zij destijds de digitalisering van het Gronings Verzetsarchief,inclusief de collecties van mensen die zij persoonlijk kende. Zij was dan ook de aangewezen persoon om te beoordelen wat mijn aanpak werkelijk toevoegt.
Toen zij haar archief met mijn methode bevroeg, leverde dat ineens allerlei nieuwe vragen op. Vragen waarvoor ik nieuwe archieven moest integreren. Dat liep, zacht gezegd, nogal uit de hand. Wat begon met één archief, groeide uit tot een geïntegreerd oorlogsarchief van 2,1 miljoen observaties uit acht databases, aangevuld met een bibliotheek aan oorlogsboeken (waaronder het complete werk van Lou de Jong) en 60 MI5-dossiers, allemaal op elkaar gekruist. Een omvang en integratiediepte die voor zover ik kan overzien in Nederland niet eerder zo zijn samengebracht. En ook nog eens binnen vier weken, zonder budget. Brinksformuleerde het onderscheid in een post op LinkedIn scherp. In haar woorden: "Wat wij destijds bij OVCG deden, was digitaliseren. Wat Aslander doet is informatiseren: de inhoud operationeel maken." Digitaliseren maakt bronnen toegankelijk. Informatiseren maakt ze bevraagbaar. Brinks draagt bij aan de historische duiding van de onderzoeksuitkomsten en helpt in deze fase beoordelen welke verwijzingen naar nog niet-gedigitaliseerde archiefstukken nader onderzoek rechtvaardigen. De technologie wijst de weg, de historicus bepaalt of het de moeite waard is die te volgen.
 
Linked Data, en wat erbovenop kan
Er wordt al jaren gewerkt aan het koppelen van WO2-archieven via Linked Open Data. Het Netwerk Oorlogsbronnen verbindt miljoenen bronnen uit meer dan 250 collecties van archieven, musea en herinneringscentra, met de NIOD WO2-thesaurus als gedeelde concepten-laag. EHRI, de European Holocaust Research Infrastructure, een Europese onderzoeksinfrastructuur gecoördineerd vanuit het NIOD, biedt via haar portal toegang tot ruim 370.000 archiefbeschrijvingen uit 2.000 instellingen wereldwijd, aangevuld met een Linked Open Data knowledge graph. Dat werk is fundamenteel - zonder die infrastructuur was WOZ ook niet mogelijk geweest.
 
Maar Linked Data koppelt, het weegt niet. Het werkt op gestructureerde metadata, niet op de boeken, dossiers, rapporten en handgeschreven brieven. En het zegt niet hoe zeker je kunt zijn van wat je vindt.
Die epistemologische laag, en de bibliotheek die ongestructureerde tekst meeneemt, zijn precies wat WOZ toevoegt aan wat er al bestaat.
 
Vijf talen, één systeem
Oorlogsarchieven zijn één grote Babylonische spraakverwarring. Duits, Engels, Nederlands, Frans, Pools, allemaal dwars door elkaar. Een transportlijst uit Westerbork is in het Nederlands geschreven. Het kampdossier in Arolsen in het Duits. Het MI5-rapport erover is in het Engels. WOZ bevat een crosslinguaal concept-lexicon: 3.337 termen in vijf talen, gegroepeerd in 28 concepten. Het systeem begrijpt dat "Konzentrationslager," "concentration camp" en "concentratiekamp" hetzelfde betekenen. Aangevuld met de NIOD WO2-thesaurus: 17.874 concepten, waaronder 1.274 kampen.
 
Het locatieregister koppelt 26.000 locaties aan 1,7 miljoen observaties. "Auschwitz," "Oświęcim," "KL Auschwitz" en "Auschwitz-Birkenau" zijn voor een computer vier verschillende woorden. Voor WOZ zijn het dezelfde plek.
 
De bibliotheek
Naast de database met records en kruisverwijzingen bouwde ik een bibliotheek: het Mouseion. Daarin staan oorlogsboeken, rapporten en dossiers: ongestructureerde tekst die historici lezen maar die normaal niet systematisch doorzoekbaar is. Die boeken laat ik met dezelfde methode analyseren. Daardoor kan ik naast de records ook de bronnen uit de boekenmet elkaar verbinden, om zo weer nieuwe verbanden en inzichten op te sporen.
 
Ik integreerde ook de inhoud van 60 gedeclassificeerde MI5-dossiers en liet ze als eerste vanuit Nederlands perspectief volledig en integraal doorzoeken. Ze liggen bij The National Archives in Londen, samen 114 volumes en ruim 4,1 miljoen woorden. Dat automatisch doorzoeken en kruisen met de databases die ik al had, leverde al flink wat nieuwe vondsten op - feiten die in de bestaande wetenschappelijke Nederlandse literatuur over de Tweede Wereldoorlog niet of nauwelijks voorkomen, en die momenteel worden geverifieerd door een aantal journalisten en historici. Ik verwacht dat we er nog vele tientallen gaan vinden. Concrete voorbeelden bewaar ik voor een later moment, in samenwerking met de journalisten en historici die het werk verifiëren.
 
Toen MI5 die papieren een paar jaar terug declassificeerde, hield niemand er rekening mee dat iemand ooit de moeite zou nemen om het hele Nederlandse deel te importeren, hoogwaardig te transcriberen én systematisch te kruisen met andere bronnen.
 
Die dossiers zijn gevonden door systematisch te zoeken op namen die al in het systeem zaten. Elke nieuwe bron maakt het zoeken in de volgende bron gerichter. Niet omdat het systeem "leert" in de machine learning-zin van het woord, maar omdat meer observaties meer kruispunten opleveren. Het systeem las de tekst, haalde er namen en organisaties uit, en kruiste die met de 2,1 miljoen observaties uit de registers. Zonder die combinatie van bibliotheek en database zijn het gewoon PDF's. In mijn handen een ongekend krachtig systeem dat niet op kunstmatige intelligentie draait, maar op een lokaal systeem met extreem elegant informatieontwerp. Archivistische intelligentie.
 
Solo-Commons
Wat je als persoon kunt toevoegen aan de maatschappij.
 
Solo-Commons betekent voor mij niet dat anderen het systeem gebruiken, maar dat het systeem in handen van één persoon iets oplevert dat aan iedereen ten goede komt. WOZ wordt geen openbaar product. Het is een werkomgeving. Wat eruit komt, zijn vondsten en inzichten die via journalisten, historici en publicaties hun weg vinden.
 
WOZ is dus niet gebouwd door een organisatie of samenwerkingsverband. Ik bouwde het alleen, in minder dan een maand. Al moet ik er wel bij vermelden dat ik veel denkwerk uit de maanden ervoor acuut kon hergebruiken. Dit kan dus allemaal. De archieven zijn er. De rekenkracht is er. Geld en mensen zijn meestal niet het probleem. Ergens in elke organisatie wringt iets anders: mandaat, tempo, of het ontbreken van een ontwerp dat het goed doet. De vraag is dus niet of het kán, maar of we het samen willen doen.
 
Als je in de archiefwereld werkt en hiermee wilt werken of van wilt leren: sluit aan bij de Pilot Informatie Autonomie. Twee dagen per maand zijn we een volle dag in onze werkplaats in Utrecht, nabij Utrecht Centraal, hiermee bezig. Voor een schijntje bespaar je na een paar keer met gemak tonnen aan onnodig dure software en systemen om je eigen archieven te kunnen lezen. Ik heb laten zien dat het werkt, in korte tijd en op enorme schaal.
 
We zijn nog maar net begonnen en het wordt per week leuker en boeiender.
 
 


About Martijn Aslander

Technologie-filosoof | Auteur | Spreker | Verbinder | Oprichter van vele initiatieven

Momenteel vrolijk druk met Digitale Fitheid 

De leukste dingen die ik momenteel aan het doen ben: https://linktr.ee/martijnaslander en https://linktr.ee/digitalefitheid