Rijksarchief in België

Ons collectief geheugen !

FR | NL | DE | EN
Menu

Transkribus: historische documenten herkennen, transcriberen en doorzoeken met de kracht van AI

Texte petit  Texte normal  Texte grand
02/12/2022 - Onderzoek - Evenementen - Algemeen Rijksarchief

Op 16 november organiseerden onderzoekers Klaas Van Gelder en Gert Gielis in het Algemeen Rijksarchief een interne workshop over de HTR-software van Transkribus. HTR staat voor handwritten text recognition, de automatische herkenning van handgeschreven teksten met behulp van artificial intelligence en machine learning. Die technologie maakt de laatste jaren furore in de internationale archiefwereld. Transkribus biedt vele mogelijkheden en er zit nog meer in de pijplijn. Heel wat projecten hebben er al mooie resultaten mee geboekt. Daar wilden we bij het Rijksarchief graag meer over weten.

Twee onderzoekers van buitenlandse archiefinstellingen kwamen getuigen over de succesvolle werking van Transkribus in hun projecten (Alle Amsterdamse Akten van Stadsarchief Amsterdam en Making a Modern Archive van het Nationaal Archief Finland). Vervolgens kregen de deelnemers van Annemieke Romein (Huygens ING Amsterdam) een uitgebreide presentatie van het Transkribus-platform. Naast tekstherkenning (zowel HTR als OCR) biedt dit platform ook de mogelijkheid om documenten snel te scannen, te transcriberen, lay-out te analyseren, tekstherkenningsmodellen te trainen en woordcategorieën te taggen. Dat kan je zowel individueel doen als in team. Na voldoende training met hoogkwalitatieve transcripties is de software in staat om documenten om te zetten in doorzoekbare tekst.

Is Transkribus een wondermiddel? Zeker niet. Transkribus heeft nog niet op alle complexe uitdagingen van archiefdocumenten een oplossing, al worden er grote stappen voorwaarts gezet. Contact met de documenten uit het archief blijft noodzakelijk voor controle, (materiële) context en interpretatie. Wel kan Transkribus voor de archivaris een prima hulpmiddel vormen bij de ontsluiting van archiefbestanden en voor onderzoekers bij het verzamelen van gegevens. Transkribus kan daarbij een enorme tijdswinst opleveren.

Binnen de projecten PARDONS en ACCESS wordt daarom al gewerkt met Transkribus. Vrijwilligers helpen om de transcripties te maken die nodig zijn voor de training van een model dat zal helpen bij de ontsluiting van gratiebrieven en vonnisboeken.

De workshop was in ieder geval stimulerend. We onderzoeken verder hoe Transkribus ons binnen het Rijksarchief van dienst kan zijn. Wordt vervolgd in 2023!

  

www.belspo.be www.belgium.be e-Procurement