30 november 2007
Een nieuwe zoekmachine: specifiek zoeken in selecties van teksten
De Digitale Bibliotheek voor de Nederlandse Letteren presenteert:
demoversie van zoekmachine die selecteert en sorteert
De zoekmogelijkheden in de dbnl worden uitgebreid met een module die het specifiek zoeken in teksten mogelijk maakt. En dat niet alleen, de groep teksten die doorzocht wordt, kan
volgens diverse criteria worden ingeperkt: eigenschappen van auteurs als sekse,
geboorteplaats of -provincie, en eigenschappen van titels als datering en (sub)genre. Het
specifiek zoeken in bijvoorbeeld alle beschikbare proza van vrouwelijke auteurs uit de periode
1780-1800 is daardoor heel eenvoudig geworden.
Wat nu gepresenteerd wordt is een demoversie; er zal de komende maanden verder worden
gewerkt aan de uitbreiding en verfijning van de zoekmachine. In een korte handleiding bij de zoekmachine worden de mogelijkheden en beperkingen nader toegelicht. Uiteraard zijn
we ook benieuwd naar ervaringen van gebruikers; opvallende zaken en wensen kunnen
worden aangemeld via redactie@dbnl.org.
Een van de bijzondere vermogens van de zoekmachine is de optie om zoekresultaten
chronologisch te sorteren. In het nieuwste nummer van Onze Taal dat vandaag verschijnt,
staat een artikel ‘Hoe onze woorden snel ouder worden’ waarin wordt ingegaan op de diensten
die deze zoekmachine kan verlenen aan het onderzoek naar de ouderdom van woorden. In
haar Chronologisch woordenboek uit 2001 had Nicoline van der Sijs al op dergelijke
mogelijkheden gewezen. Dit lijvige boek bevatte ook een lijst van ruim 18 000 woorden,
waarvan, volgens inzichten van dat moment een op het jaar nauwkeurige datering werd
gegeven. In Onze Taal wordt beschreven hoe met behulp van de nieuwe dbnl-zoekmachine de
datering van veel woorden nog verder in de tijd verschoven kan worden.
Wat nu wordt geboden is niet meer dan de mogelijkheid tot een snelle steekproef op een
doorsnee van enkele procenten van de totale Nederlandstalige literatuur. Zij het wel een
steekproef die spectaculaire resultaten kan opleveren; gezien een aantal willekeurig gekozen
woorden waarvan de leeftijd met minstens twintig jaar is toegenomen in vergelijking met het
Chronologisch woordenboek: dolblij (1890 i.p.v. 1916), achillespees (1866 i.p.v. 1908),
revue (voor theatervoorstelling, 1838 i.p.v. 1898), klier (voor vervelende man, 1904 i.p.v.
1966, en nog wel gebruikt voor een vrouw (in Pijpelijntjes van Jacob Israël de Haan)!
Gebruikmakend van de dateringen in het Chronologisch woordenboek zijn er vele prachtige
ontdekkingen te doen, ook in de oudere teksten: overeenkomstig (1691 i.p.v. 1793/6),
borstbeeld (1698 i.p.v. 1740), bedankje (1726 i.p.v. 1839), of zenuwachtig (1715 i.p.v.
1839). Sommige woorden blijken eeuwen ouder te zijn dan uit het Chronologisch
woordenboek kan worden afgeleid. Een woord als sanctie staat op 1910, maar gaat minstens
terug op 1784, superioriteit (1909-10) op 1767. Behoudens wordt gedateerd op 1860, maar is
al in 1561 te vinden bij Eduard de Dene; ban in de betekenis van betovering staat op 1898,
maar wordt in 1557 al gebruikt door Ambrosius Zeebout.
De volledige tekst van het Chronologisch woordenboek van Nicoline van der Sijs zal
binnenkort ook beschikbaar komen op deze site.
|