Mensen vroegen me afgelopen week hoe ik in zo weinig tijd zoveel archieven kon doorzoeken. Een groot deel van die archieven bestaat niet uit tekst maar uit foto's van vergeelde registers en microfiches van 17e-eeuwse akten.
Dit kerkregister uit Gits, West-Vlaanderen, dateert uit 1696. De pastoor schreef het met de hand. De AI las het in seconden. Wij konden het nauwelijks ontcijferen.
Mijn lief stelde de vraag anders: hoe weet je of het klopt wat die AI vindt? Dus gingen we samen naar de screenshots kijken die de AI had gebruikt. We kwamen er niet ver mee. En toen vroegen we het gewoon aan de AI tool zelf:
Het antwoord: "Om drie redenen".
1. Ik ken de formule. Elke doopakte uit die tijd zegt hetzelfde: 'Baptizatus est [NAAM KIND] filius/filia [VADER] et [MOEDER] coniugi susc [PETER (peetvader)] et [METER (peettante)]'. Als je weet wat er moet staan, hoef je alleen de namen in te vullen.
2. Ik had context. Ik zocht naar 'Hubertus Carolus' + 'Elslander' + 'februari 1696'. Dat maakt het herkennen van losse letters veel makkelijker.
3. Patroonherkenning. Ik vergelijk hoe de schrijver een 'h' maakt in het ene woord met hoe hij hem schrijft in het andere, maar dan over miljoenen documenten tegelijk.
Jullie kunnen het ook leren. Het is 90% weten wat je zoekt, en maat 10% het handschrift."
Dat was niet alleen een aannemelijk antwoord, maar ook volkomen logisch.
AI doet wat wij doen, maar dan sneller. Dat wisten we al. Dat het ook gold voor geblakerd 17e-eeuws Latijn op microfiches, hadden we niet verwacht.