Juni 2018: Miljoenen teksten digitaal doorzoekbaar met Nederlab

Op 1 juli wordt Nederlab opgeleverd: met miljoenen Nederlandse teksten biedt het onderzoekers een schat aan informatie over de Nederlandse taal en cultuur. In 2012 kreeg Nederlab 3,2 miljoen euro toegekend voor de ontwikkeling van een zoekmachine met miljoenen pagina’s Nederlandstalige tekst. Nu, 6 jaar later, geeft Nederlab met zo’n 25 collecties aan teksten, lopend van de 13e tot 21e eeuw, een flinke impuls aan diachroon geesteswetenschappelijk onderzoek. Van krantenteksten tot dagboeken: in Nederlab vind je allerlei soorten teksten. Het oudst zijn de dertiende-eeuwse teksten uit het Corpus Gijsseling. Taalkundige Nicoline van der Sijs: "Nu kun je een ontwikkeling volgen over een periode van eeuwen. Dat kon voorheen niet omdat alle corpora met Nederlandse teksten versnipperd waren." 

Hennie Brugman is IT-ontwikkelaar aan het Meertens Instituut en coördinator van Nederlab. Hij vertelt hoe de zoekmachine is opgebouwd: “Bij de oplevering bevat Nederlab dertig miljard woorden." Lees verder in E-Data.