Alde Fryske hânskriften út it ferline automatysk oerset nei digitale tekst

In part fan de Tresoar-argiven fan Fryske notarissen út it ferline moat aanst maklik troch te sykjen wêze. Dat moat barre mei in automatyske hânskriftlêzer, ûnderdiel fan it lanlike projekt 'De ijsberg zichtbaar maken.' It moat it begjin wêze fan in revolúsje yn argyfûndersyk, sa hopet ek Tresoar.
Direkteur Bert Looper fan Tresoar © Omrop Fryslân
It giet om in inisjatyf fan it Nationaal Archief en it Noord-Hollands Archief: 19e-iuwske notarisakten en 17e- en 18e-iuwske VOC-argiven binne omset yn tekst dy't de kompjûter lêze kin. Der binne al 1,5 miljoen automatyske transkripsjes makke, 90.000 binne trochsykber.

"Fantastysk"

Regionale histoaryske sintra wurkje mei troch notarisargiven oan te bieden, sa ek Tresoar. Dêr wurket Aly de Boer oan it duorsum tagonklik meitsjen fan fysike en digitale argiven. Sy is tige wiis mei it nije platfoarm. "It is fantastysk, hjirmei kinne wy echt in folgjende stap sette. Ditsoarte nije ûntwikkelingen geane hiel fluch. It smyt foar minsken thús in protte nije yngongen op."
Tresoar is frege is om mei te dwaan. "Om't it om in pilot giet, sieten der wol betingsten oan fêst. Sa lei de limyt foarearst op 60.000 scans. Want as alle argiven al har notariële akten oanleverje soene, dan soe dat fierstente folle wêze."
In notatiële akte fan It Amelân dy't aanst op zoekintranscripties.nl te finen is © Tresoar
Foarearst giet it foar Fryslân dus allinne om notariskantoaren fan Akkrum, It Amelân, Eanjum, Sint-Anne, Stynsgea, Balk en Beetstersweach. Op dit stuit binne dy noch net beskikber op de webside, mar dat komme se wol. Yn de takomst ferwiist Tresoar dêr ek op de eigen webside nei ta.

Rike blik op it ferline

Yn de notariële argiven sit in soad ynformaasje: it giet om testaminten, keapakten, skuldbekentenissen, houliksbetingsten en boelbeskriuwingen. Al dy ynformaasje smyt in rike blik op it Fryske ferline op.

Topke fan de iisberch

Argyfûndersyk kostet faak in soad tiid. Argiven binne wol beskreaun, mar dêrmei is noch mar it topke fan de iisberch sichtber. It grutste part sit noch ûnder wetter. Faak binne der al wol boarnen scand, mar noch net op wurden troch te sykjen. De nije technyk smyt dêrom kânsen op foar histoarysk ûndersyk: in syktocht dy't oars moannen duorre, is no mei ien druk op de knop te dwaan.
De stúdzjeseal fan Tresoar yn Ljouwert © Omrop Fryslân, Sian Wierda

Oare hânskriften

De regionale histoaryske sintra hawwe fan it Ryk jild krigen foar it digitalisearjen. "Sa binne earder de notariële akten scand," seit De Boer. "Dit is in soarte ferfolch. Mar no't it draait, binne wy wol yn petear mei oare sintra oer hoe't wy no fierder wolle. Der wurdt neitocht oer in folgjend projekt mei âldere hânskriften, mar dêr moat earst mear wissichheid oer wêze wat it finansierjen oanbelanget."

Friezen by de VOC

Der binne mei zoekintranscripties.nl ek Friezen yn argiven bûten de provinsje werom te finen. Sa komt Andries Kallenberg fan Ljouwert yn 1735 foar yn it VOC-argyf yn Den Haag: 'gewesen mattroos ten dienste van de E. Comp. En laast bescheijden op het schip Wickenburg'. Dit VOC-skip wie noch net lang werom út Batavia.

Hoe wurket it?

Boarnen wurde mei help fan it kompjûtermodel Transkribus automatysk oerskreaun. Keunstmjittige yntelliginsje makket de âlde akten lêsber.
De technyk fan Handwritten Text Recognition hat baat by grutte oantallen tekst. Want it kompjûtermodel moat traind wurde, leit Aly de Boer út: "Frijwilligers kinne flaters korrizjearje." Sa leart de kompjûter hieltyd better âlde hânskriften te lêzen.
In Ljouwerter yn it VOC-argryf © Nationaal Archief
Der sitte noch wol flaters yn de transkripsjes, benammen as it om de âldste hânskriften giet. Mar dochs binne de systemen al sa'n 95 persint akkuraat.

Tiidswinst

Kilometers argyf mei de hân trochspitte is in bealch fol wurk. Mar as dy kilometers op wurden trochsykber wurde, is ûndersyk hiel wat makliker.
Mei it projekt wurde ek automatysk persoansnammen, plaknammen en tiidstippen útljochte. En dêr moat it net by bliuwe, seit De Boer. "Wy hoopje dat wy yn de takomst ferwize kinne nei literatuer, bygelyks mei sitaten en wetjouwingsboeken."