Jaarverslag 2010 Meertens Instituut

Technische ontwikkeling



De afdeling Technische Ontwikkeling bouwt databases, ontwikkelt webapplicaties en zorgt voor de technische ontwikkeling en het beheer van de website(s). Steeds meer onderzoeksresultaten en collecties van het instituut komen terecht in databases die worden ontsloten via de website voor onderzoek en voor een breder publiek.

In 2010 lag de nadruk voor de groep Technische ontwikkeling op het versterken van de positie in het veld van de eHumanities en de opbouw van een sterk expertisecentrum in dit veld. Hierbij stonden de vraagstukken van digitale data archivering, aansluiting bij e-infrastructuurprojecten en beschikbaar stellen van de resultaten hiervan aan de onderzoekers centraal. Medio 2010 is een nieuw technisch hoofd aangetrokken om mede invulling te geven aan de gestelde ambities van het Meertens Instituut. In oktober is het project bureau van Catch+ gehuisvest bij het instituut waarmee een verdere synergie tussen het instituut en de lopende projecten onderling is gerealiseerd.

Binnen de e-infrastructuurprojecten levert het Meertens Instituut een belangrijke bijdrage aan het CLARIN-NL project waarbij wordt deelgenomen aan de drie centrale infrastructurele projecten (Infrastructuur Implementatie Plan, Search & Develop en TTNWW, zie hieronder). Het Meertens Instituut fungeert in de rol van projectleider in twee hiervan; Search & Develop en TTNWW, waarbij de laatste een samenwerkingsverband tussen Nederland en Vlaanderen omvat. Daarnaast zijn dit jaar technologische ontwikkelingen op infrastructureel gebied vertaald in concrete toepassingen voor het Meertens Instituut waarbij de zoekfuncties van MAND, SAND en DiDDD gecombineerd zijn tot een overkoepelende interface in het MIMORE project. Verdere projectaanvragen in CLARIN-NL verband hebben geleid tot honorering van de projecten INPOLDER, C-DSD en COAVA, waarmee in 2011 verder invulling gegeven zal worden aan het beschikbaar maken van functionaliteit die is toegespitst op gebruik door de wetenschapper en aansluiting vindt bij de ontwikkelingen op infrastructureel gebied.

In het kader van het Alfalab project is in samenwerking met andere KNAW instituten als Huygens, DANS, Fryske Akademy en Virtual Knowledge Studio verder ontwikkeld aan het gezamenlijk beschikbaar stellen van digitale instrumenten voor de geesteswetenschappelijke gemeenschap. Hierbij zijn de benodigde tools voor de GeoLab omgeving ontwikkeld welke in de loop van 2011 beschikbaar gemaakt zullen worden aan de wetenschappelijke gemeenschap. Ook hierbij zijn de synergie-effecten met projecten als CLARIN-NL merkbaar geweest.

Naast de verdere uitbouw van de strategische positie van de groep Technische Ontwikkeling is als vanouds veel aandacht uitgegaan naar de ondersteuning van de diverse onderzoeksprojecten. Er is veel aandacht besteed aan de technische realisatie van het EDISYN project, er is een nieuwe versie van de Voornamenbank gelanceerd, welke wederom grote aantallen bezoekers (20.753.368 hits vanaf juni) heeft gegenereerd, en de nieuwe databank Beschermheiligen zag het eerste levenslicht. Aan een bredere zichtbaarheid van het Meertens Instituut bij het algemeen publiek hebben ook de lancering van  Meldpunt Taal en de nieuwe digitale nieuwsbrief van het Meertens Instituut een bijdrage geleverd.

Ter ondersteuning van het interne organisatieproces is een nieuw tijdsregistratiesysteem ontwikkeld dat eind 2010 in productie is genomen. Er is een migratie traject uitgevoerd waarbij alle interne Filemaker Pro databestanden naar de laatste versie zijn gemigreerd. Het migratie traject van de automatiseringstaken naar de I&A dat vorig jaar is ingezet is in 2010 definitief afgerond.

Uitgelichte projecten

CLARIN (2009-2014)

CLARIN-NL heeft tot doelstelling een researchinfrastructuur te ontwerpen, bouwen, valideren en exploiteren die nodig is om een duurzame en persistente eScience werkomgeving te bieden aan wetenschappers in de Geesteswetenschappen die gebruik willen maken van taalkundige data, bronnen en technologie. Het CLARIN-NL project is een groot Nederlands project dat een centrale rol wil spelen in de pan-Europese CLARIN-infrastructuur.
Resultaten in 2010: College gegeven voor LOT winterschool (20-1-2010), presentatie gegeven voor workshop European Demonstrator (26-1-2010), OAI-PMH server geïmplementeerd, geëxperimenteerd met SimpeSAMLPHP (single sign on), geëxperimenteerd met EPIC PID server.
Medewerkers: J.P. Kunst (ontwikkelaar), M. Brouwer (ontwikkelaar), M Kemps-Snijders (coördinator/ontwikkelaar).

Onder CLARIN vallen de volgende projecten:

Infrastructuur Implementatie Plan (2010-2012)

Dit project heeft een sterke samenhang met de ontwikkelingen op het Europese CLARIN-niveau en heeft als doelstelling de grote fragmentatie aan infrastructurele onderwerpen samen te brengen en de mogelijkheid te bieden experts binnen de CLARIN-centers te trainen en op te leiden. Internet: http://www.clarin.nl/node/76#infra. Project in samenwerking met: Instituut Nederlandse Lexicologie, Max Planck Instituut voor Psycholinguistiek en DANS (Data Archiving and Networked Services).
Resultaten in 2010: CLARIN deliverables: D3-1,  about the status and requirepents of EPIC (European Persistent Identification Consortium) & D6-1 Specification of wrapper and Service Bus construction.
Medewerkers: J. P. Kunst (ontwikkelaar), M. Brouwer (ontwikkelaar), M. Kemps-Snijders (coördinator/ontwikkelaar).

Search & Develop (2010-2012)

Een generieke zoekoplossing zal worden ontwikkeld waarmee het voor de wetenschappers mogelijk wordt om documenten verspreid over meerdere instituten te doorzoeken op basis van de combinatie van metadata en inhoudelijke kenmerken. De algemene zoekpatronen zullen worden vertaald naar de specifieke zoekoplossingen van de deelnemende instituten. Er wordt gebruik gemaakt van ISOcat en RELcat. Internet: http://www.clarin.nl/node/76#S_D. Project in samenwerking met: DANS (Data Archiving and Networked Services), Max Planck Instituut voor Psycholinguistiek en het Instituut voor Nederlandse Lexicologie.
Resultaten in 2010: CLARIN deliverables: D3.2 Specification document search protocol, query language and result specification. Mapping onto institutional search interfaces && D4.1 Design document Search & Develop architecture and user interface.
Medewerkers: M. Brouwer (ontwikkelaar), M. Kemps-Snijders (coördinator/ontwikkelaar), J. P. Kunst (ontwikkelaar).
 

TST Tools voor het Nederlands als Webservices in een Workflow (TTNWW) (2010-2012)

Doel van het project is om allerlei bestaande componenten die ontwikkeld zijn in onder andere CGN en STEVIN in te passen in een workflowsysteem voor web services dat (o.a. met grote Nederlandse inbreng, bijv. Max Planck Instituut) ontwikkeld wordt in CLARIN-verband, en dit geheel te laten draaien op servers van erkende CLARIN-centra. Het doel is faciliteiten aan te bieden voor onderzoekers uit de geestes- en sociale wetenschappen met geen of weinig technische bagage. Deze faciliteiten moeten hen 1) in staat stellen hun onderzoeksvragen beter of makkelijker aan te pakken en 2) mogelijkheden bieden voor het formuleren van nieuwe typen onderzoeksvragen, i.e. onderzoeksvragen die voor CLARIN niet gesteld konden worden of niet doelmatig te beantwoorden waren. Een belangrijk doel met het project is de in Nederland en Vlaanderen gangbare de facto standaarden voor dataformaten, interfaces tussen tools, en protocollen te promoten binnen CLARIN, ze te toetsen aan binnen CLARIN voorgestelde standaarden, en de binnen CLARIN gangbare standaarden te toetsen aan de de facto standaarden die in Nederland en Vlaanderen ontwikkeld zijn in o.a. CGN en STEVIN. Daarmee beogen we een grote invloed uit te oefenen op het definiëren van het concept CLARIN-compatibel, dat momenteel in ontwikkeling is, en de rol van Nederland en Vlaanderen binnen CLARIN te consolideren en verder uit te bouwen. Internet: http://www.clarin.nl/node/76#TTNWW. Project in samenwerking met: Universiteit Groningen, Universiteit Utrecht, Universiteit van Tilburg, Instituut voor Nederlandse Lexicologie, Radboud Universiteit en Universiteit van Twente.
Resultaten in 2010: CLARIN deliverables: T9-2 workflow engine selection & T9-3 user interface Integration of first web services with Taverna.
Medewerkers: M. Kemps-Snijders (coördinator/ontwikkelaar).

MIMORE: Microcomparative Morphosyntactic Research Tool (2010-2010)

Integratie van de databases DynaSAND (syntactische variatie), GTR (morfologische variatie) en DiDDD (variatie in de zelfstandignaamwoordgroep). Internet: http://www.meertens.knaw.nl/mimore/ Project in samenwerking met de Universiteit Utrecht.
Resultaten in 2010: curatie SAND, DIDDD en GTRP. Beta-versie Demonstrator Tool MIMORE (common search engine), één publicatie en drie lezingen.
Medewerkers: S. Barbiers (projectleider), M. Brouwer (software-ontwikkelaar), J. P. Kunst (software-ontwikkelaar), F. de Vriend (assistent).

Overige projecten

Alfalab (2008-2011)

Alfalab is een inititatief van de KNAW waarin vijf wetenschappelijke instituten samenwerken. Het doel is de samenwerking en het gebruik van digitale methoden in geesteswetenschappelijk onderzoek te bevorderen. Alfalab verspreidt hierover kennis over digitale instrumenten en data. Alfalab bouwt digitale instrumenten voor de geesteswetenschappelijke gemeenschap en doet onderzoek naar de inzet van digitale instrumenten in de geesteswetenschappen en hoe deze instrumenten (virtuele) samenwerkingsverbanden kunnen ondersteunen en stimuleren. Internet: http://alfalablog.huygensinstituut.nl. Project in samenwerking met DANS, Fryske Akademy, Huygens Instituut en de Virtual Knowledge Studio.
Resultaten in 2010: D. Zeldenrust heeft meegeschreven aan een peer reviewed artikel voor de Computational Turn workshop (Swansea, 2010). Daarnaast heeft hij presentaties gegeven over Alfalab en de GISpilot op de Eerste Alfalab Microtoponiemen Expertmeeting (Amsterdam) en de ICTDelta2010 conferentie (Rotterdam). De Microtoponiemen Expertmeeting is ook georganiseerd door D. Zeldenrust. D. Zeldenrust heeft een posterpresentatie gegeven op de Supporting Digital Humanities conference (Wenen). R. Zeeman heeft de tools verder vorm gegeven en de eerste versie van de Microtoponiemen GISpilot zal in 2011 beschikbaar worden gemaakt.
Medewerkers: R. Zeeman (Ontwikkelaar ICT), D. Zeldenrust (coördinator externe samenwerking).

CATCHPlus (2010-2012)

Het belangrijkste doel van CATCHPlus is het verzilveren van onderzoeksresultaten tot bruikbare tools en diensten voor de hele Nederlandse erfgoedsector. Deze software leidt tot betere ontsluiting en grotere toegankelijkheid van collecties van erfgoedinstellingen. Door de unieke samenwerking tussen grote erfgoedinstellingen, universiteiten en bedrijfsleven die in CATCHPlus plaatsvindt, ontstaat een nieuw knooppunt tussen ICT en erfgoed. De producten uit CATCHPlus bevorderen de samenwerking en samenhang in de informatie-infrastructuur van de erfgoedsector. Internet: http://www.catchplus.nl. Project in samenwerking met: o.a. Nationaal Archief, KB, Meertens Instituut, Beeld en Geluid, Gemeentearchief Rotterdam, Rijksmuseum, Naturalis, Gemeentearchief Den Haag, Rijksdienst Cultureel Erfgoed.
Resultaten in 2010: de continuïteit van het CATCHPlus project heeft in 2010 zwaar onder druk gestaan vanwege de onzekerheid op toekenning van de PRIMA-subsidie. Deze subsidie werd uiteindelijk pas in november 2010 toegezegd. Daar waar de Centrale Diensten (Vocabulairebank, Persistent Identifiers, Workspaces, User Profile en Annotation en Recommendation repositories) wel door konden ontwikkelen liepen veel deelprojecten bij de erfgoed instellingen vertraging op. Er zijn in 2010 vooral veel samenwerkingen tot stand gekomen met sofware leveranciers en andere partners. Ook is sterk ingezet op de disseminatie van de kennis en deelresultaten via diverse kanalen. In november is het projectbureau verhuisd van Beeld en Geluid naar het Meertens Instituut waar inhoudelijk een goede aansluiting met Clarin-NL en e-humanities is gevonden. Alle deelprojecten zijn weer voortvarend opgepakt en de vooruitzichten op goede resultaten zijn zeer positief.
Medewerkers: P. Alkhoven (Projectmanager), H. Brugman (Technisch coördinator), D. Zeldenrust (coördinator externe samenwerking).

Tijdsregistratie (1999-2010)

De tijdsregistratie is een op het Meertens Instituut ontworpen geautomatiseerd aanwezigheidsregistratiesysteem waar medewerkers dagelijks op inloggen, en hun gewerkte uren, opgenomen vakantie- en ADV-tijd bijhouden. Het systeem voorziet onder meer in een automatische berekening van het vakantie- en ADV-urentegoed per medewerker, een persoonlijk week- en jaaroverzicht van gewerkte en nog te werken uren, en een aanwezigheidsbord voor medewerkers dat vanaf elke werkplek in het instituut is te raadplegen. De applicatie vergt regelmatig technisch onderhoud en administratieve bewaking van gegevens en mutaties. Resultaten in 2010: er is een nieuw tijdsregistratiesysteem ontwikkeld dat eind 2010 in productie is genomen.
Medewerkers: M. van der Peet (ontwikkelaar), B.L. van den Berg (coördinator), M. Lucassen (uitvoerder).  


Afbeelding: Populariteit van 'Piet' als eerste naam voor mannen tussen 1880 en 2009, Nederlandse Voornamenbank.