Nieuw handboek laat zien wat we allemaal kunnen met digital humanities

Datum
26 maart 2021

Geesteswetenschappers gebruiken steeds vaker digitale technieken om grote hoeveelheden tekst te onderzoeken. Toch zijn er nog weinig praktische handboeken voor studenten. Daarom schreven Folgert Karsdorp (Meertens Instituut) en zijn collega’s het boek Humanities Data Analysis.  

door Mathilde Jansen

Zelf studeerde Folgert Karsdorp Nederlands en Taalkunde in Leiden. Daarna deed hij promotieonderzoek aan de Radboud Universiteit waarbij hij een computermodel ontwikkelde om de hervertellingen van verhalen te simuleren. Daar kwam heel wat programmeren bij kijken: een vaardigheid die hij zichzelf aanleerde. Karsdorp promoveerde in 2016 cum laude op een van de eerste Nederlandse proefschriften op het gebied van de Digital Humanities.

In de afgelopen jaren heeft dit type onderzoek veel terrein gewonnen. Toch moeten studenten nog steeds veel zelf uitvinden, weet Karsdorp. Mondjesmaat worden nu wel vakken aangeboden waarin studenten binnen de geesteswetenschap worden ingevoerd in de digitale technieken. Er is ook een handjevol introductieboeken, maar boeken die meer de diepte ingaan ontbraken tot nu toe. Karsdorp, Kestemont en Riddell duiken met hun boek Humanities Data Analysis wel de diepte in om te laten zien wat er allemaal mogelijk is.

Net een stapje verder

“Je moet wel al wat programmeertaal kennen, voordat je eraan begint”, zegt Karsdorp. Gelukkig begint het boek met een quizje waarmee je kunt uitvogelen of je tot de doelgroep behoort. “Maar het is ook weer niet heel moeilijk”, voegt hij snel toe. Studenten en onderzoekers die naar dit boek grijpen moeten net een beetje verder durven gaan dan de basisbeginselen. “We willen onze lezers vooral verleiden om niet op het basisniveau te blijven hangen, want je kunt zoveel meer met deze technieken. Aan de hand van verschillende casestudy’s laten we zien wat er allemaal mogelijk is.”

Het handboek is heel praktisch van aard. Het eerste deel is een algemene exploratie van het vakgebied en gaat in op het nut van data-analyse voor geesteswetenschappelijk onderzoek. Daarbij wordt het Nederlandse begrip ‘geesteswetenschappen’ iets opgerekt, omdat het boek ook bedoeld is voor de Amerikaanse markt. Verwante disciplines uit de sociale wetenschappen, zoals antropologie, vallen daar onder de humanities. De programmeertaal die de auteurs in dit boek gebruiken is Python. “Omdat het een van de meest gebruikte programmeertalen is voor dit soort analyses en bovendien de meest toegankelijke.”

Kookboeken en Shakespeare

De digitale technieken die in deel 1 centraal staan worden allemaal geïllustreerd aan de hand van bestaande tekstcorpora. Zo is er een hoofdstuk over een collectie Amerikaanse kookboeken. “Het gaat om een collectie van zo’n 200 kookboeken met daarin zo’n 50 duizend recepten. Hoe kun je zo’n grote hoeveelheid data, ook nog verspreid over de tijd, analyseren? Dat laten we zien.” In een ander hoofdstuk draait het om teksten van Shakespeare. “Hierbij maken we inzichtelijk hoe je teksten kunt annoteren, of hoe je netwerkanalyses kunt maken. Het gaat dan om de relaties tussen al die personages uit de toneelstukken van Shakespeare: daar zijn veel onderzoekers in geïnteresseerd.”

Een andere manier waarop je teksten kunt benaderen is als zogenaamde vectoren, legt Karsdorp uit. Dan zet je teksten om in rijtjes van getallen waarmee je vervolgens afstanden tussen teksten kunt berekenen. In het boek leggen Karsdorp en zijn collega’s dit uit aan de hand een corpus van Franse dramateksten. “Je wilt bijvoorbeeld tragedies van komedies kunnen onderscheiden. Met deze methodes kun je de computer leren om automatisch dit soort labels toe te kennen aan teksten.”

Oefenen met kettingbrieven

In deel 2 gaan de auteurs nog meer de diepte in aan de hand van een aantal casestudy’s. Elk hoofdstuk bevat ook oefeningen. Zo kunnen studenten aan de slag met een corpus van kettingbrieven. De data zijn allemaal te downloaden op een speciaal daarvoor ingerichte website. “We hebben al gehoord dat mensen de oefeningen leuk vinden”, zegt Karsdorp enthousiast. Zijn Antwerpse collega-auteur Mike Kestemont heeft ze namelijk al uitgetest onder studenten. Ook op een paar universiteiten in Nederland en Duitsland is het boek sinds kort in gebruik.

Verwacht Karsdorp dat een vak als digital humanities straks gemeengoed wordt voor alle studenten binnen de geesteswetenschappen? “Nee dat denk ik niet. Er is veel onderzoek waarvoor het helemaal niet nodig is. Je moet echt goed nadenken of het een bijdrage levert aan het beantwoorden van je onderzoeksvraag. Pas als je onderzoek gaat doen met grote hoeveelheden data is het gebruik van programmeertaal onvermijdelijk. Maar je moet het ook leuk vinden om je erin te verdiepen.”

Bestelinformatie

Folgert Karsdorp, Mike Kestemont, Allen Riddell: Humanities Data Analysis, Case Studies with Python, Princeton University Press, 2021

Foto's: 1. Folgert Karsdorp met zijn proefschrift (2016, door Femke Niehof); 2. Cover Humanities Data Analysis.

Dit artikel is verschenen in de digitale nieuwsbrief van het Meertens Instituut. Ook abonnee worden? Klik hier.