Skiplinks

  • Tekst
  • Verantwoording en downloads
  • Doorverwijzing en noten
Logo DBNL Ga naar de homepage
Logo DBNL

Hoofdmenu

  • Literatuur & taal
    • Auteurs
    • Beschikbare titels
    • Literatuur
    • Taalkunde
    • Collectie Limburg
    • Collectie Friesland
    • Collectie Suriname
    • Collectie Zuid-Afrika
  • Selecties
    • Collectie jeugdliteratuur
    • Basisbibliotheek
    • Tijdschriften/jaarboeken
    • Naslagwerken
    • Collectie e-books
    • Collectie publiek domein
    • Calendarium
    • Atlas
  • Periode
    • Middeleeuwen
    • Periode 1550-1700
    • Achttiende eeuw
    • Negentiende eeuw
    • Twintigste eeuw
    • Eenentwintigste eeuw
Colloquium Neerlandicum 15 (2003) (2003)

Informatie terzijde

Titelpagina van Colloquium Neerlandicum 15 (2003)
Afbeelding van Colloquium Neerlandicum 15 (2003)Toon afbeelding van titelpagina van Colloquium Neerlandicum 15 (2003)

  • Verantwoording
  • Inhoudsopgave



Genre

sec - letterkunde
sec - taalkunde

Subgenre

tijdschrift / jaarboek
lezing / voordracht


In samenwerking met:

(opent in nieuw venster)

© zie Auteursrecht en gebruiksvoorwaarden.

Colloquium Neerlandicum 15 (2003)

(2003)– [tijdschrift] Handelingen Colloquium Neerlandicum–rechtenstatus Auteursrechtelijk beschermd

Neerlandistiek de grenzen voorbij. Handelingen Vijftiende Colloquium Neerlandicum


Vorige Volgende
[pagina 431]
[p. 431]

De wording van het Algemeen Nederlands Woordenboek
Fons Moerdijk

Het Algemeen Nederlands Woordenboek (ANW) is een project van het Instituut voor Nederlandse Lexicologie (INL). Het officiële beginjaar ervan is 1999, maar we konden er feitelijk pas volop aan beginnen, nadat we in 2001 drie delen Aanvullingen op het Woordenboek der Nederlandsche Taal (WNT) hadden voltooid. Met die ‘we’ bedoel ik de elf oud-medewerkers van het WNT die nu het redactieteam van het ANW vormen: vijf redacteuren, vijf bureauredacteuren en een hoofdredacteur. Het project moet afgerond zijn op 31 december 2018.

Bij het maken van een woordenboek kunnen we grofweg drie fasen onderscheiden: de voorbereiding, het schrijven en het publiceren. Het ANW bevindt zich in de eerste fase, die van de voorbereiding. Het is de fase waarin de vorming van het concept en de materiaalverzameling centraal staan. Ik moet u dus iets gaan vertellen over een woordenboek dat er nog niet is en voel me dan ook als een architect die aan zijn gehoor de pracht van zijn gebouw duidelijk moet maken aan de hand van een maquette van alleen de fundamenten. Toch hoop ik u aan de hand van de belangrijkste kenmerken een voldoende duidelijk beeld te kunnen geven van wat er komen gaat.

Algemeen en eigentijds Nederlands

In de titel is als eerste belangrijk kenmerk het object van het woordenboek aangegeven: Algemeen Nederlands. Met ‘algemeen’ willen we uitdrukken dat we ons richten op het Standaardnederlands. We zullen specifieke vaktermen, specifieke woorden uit groepstalen en dialectwoorden buiten beschouwing laten. Uitsluiting van dialectwoorden betekent overigens niet, dat we ons in het geheel niet om regionale variatie bekommeren. We zullen namelijk wel volop aandacht besteden aan het gebruik van het bovengewestelijke Nederlands in België. Het hoofdaccent ligt op het geschreven Nederlands.

[pagina 432]
[p. 432]

Het ‘Nederlands’ uit de titel laat zich in tijd nader specificeren tot ‘eigentijds Nederlands’. De taalperiode die het ANW bestrijkt loopt van 1970 tot 2019. Het eindjaartal 2019 is vanzelfsprekend bepaald door het afsluitingsjaar van het project. Het beginjaartal 1970 hangt samen met de terminus post quem non van het WNT. Met de drie delen Aanvullingen kwam de eindgrens daarvan te liggen op 1976. Door de keuze van 1970 ontstaat er tussen WNT en ANW een overlapping, die het voor het ANW mogelijk maakt ook nog van recent WNT-materiaal gebruik te maken.

Omvang

Een vraag waarop menigeen altijd graag een antwoord wil, is: hoeveel trefwoorden staan er in het woordenboek? Die interesse is begrijpelijk. Bij het grote publiek leeft de gedachte ‘hoe meer hoe beter’. Uitgevers spelen daar gretig op in door bij herdrukken van hun woordenboek nadrukkelijk te pronken met hun alsmaar fors toegenomen aantallen trefwoorden. Nu hangt het er maar vanaf hóé je telt en wát je telt. Ik kan daar in dit verband niet verder op ingaan, maar moet volstaan met de opmerking dat we er verstandig aan doen mededelingen over aantallen trefwoorden niet al te absoluut op te vatten en zeker niet als graadmeter voor kwaliteit te nemen. Bovendien lijkt die getalsfixatie me meer een relict uit het tijdperk dat het papieren woordenboek nog alleenzaligmakend was. In het elektronische tijdperk vervalt het probleem van het ruimtegebrek. Dat biedt de mogelijkheid om woorden die vroeger buiten de boot moesten vallen, nu op zijn minst te vermelden. Getalsmatige vergelijkingen tussen beide woordenboekvormen gaan daardoor mank. Maar ik kan me voorstellen dat men toch enig idee wil hebben van wat op dit gebied van het ANW, dat een elektronisch woordenboek wordt, te verwachten valt. Op grond van de lijst van woordvormen uit het proefcorpus houd ik het op de volgende raming: ongeveer 80.000 hoofdwoorden die een volle bewerking zullen ondergaan en ongeveer 250.000 kleinere woorden waarvoor slechts enkele gegevens worden geboden of die uitsluitend worden genoemd, voomamelijk als lid van de woordfamilie van een trefwoord.

[pagina 433]
[p. 433]

Bestemming

Een volgende voor de hand liggende vraag is: voor wie is het ANW bestemd? Van het doel van een woordenboek hangt immers zijn inhoud af, die op zijn beurt bepalend is voor het concept en de bouwstoffen ervan. Voor het ANW denken we aan de volgende gebruikersgroepen: niet-professionele, volwassen taalgebruikers en taalliefhebbers enerzijds, professionele taalonderzoekers, taalbeschouwers en natuurlijke-taalverwerkers anderzijds. Natuurlijk hebben die verschillende gebruikersgroepen uiteenlopende interesses en verschillende redenen om een woordenboek te raadplegen. Een papieren woordenboek kan ze onmogelijk allemaal bedienen. Voor een elektronisch woordenboek ligt dat anders. Dat kan zo worden ingericht dat ieder naar zijn gading de informatie kan krijgen die hij wenst. Het ANW zal als elektronisch woordenboek daarom zulke verschillende gebruikersgroepen van dienst kunnen zijn. Onder hen vormen de taalkundigen en lexicografen wel de belangrijkste doelgroep. Zoals het WNT als wetenschappelijk woordenboek een moederwoordenboek voor de handwoordenboeken uit het verleden was en leidde tot verbetering daarvan, zouden we daarnaast graag zien dat het ANW als een product van de moderne wetenschappelijke lexicografie die rol vervult voor de toekomstige handwoordenboeken van het eigentijdse Nederlands.

Corpusgebaseerd

Het ANW wordt een corpusgebaseerd woordenboek. ‘Corpus’ moet hier in de moderne zin verstaan worden als een verzameling elektronische teksten die zó zijn geselecteerd dat ze een zekere weerspiegeling vormen van de taalwerkelijkheid die men wil vastleggen. Het uiteindelijke ANW-corpus zal samengesteld worden uit diverse corpora. Voor de periode tot ongeveer 2000 kunnen we een beroep doen op al bestaande en gedeeltelijk ook voor een breed publiek op internet beschikbare, taalkundig verrijkte INL-corpora. Dat zijn (‘miljoen’ staat verkort voor ‘miljoen afzonderlijke woordvormen/tokens’):

•5 miljoen corpus
•27 miljoen corpus
•38 miljoen corpus
[pagina 434]
[p. 434]
•50 miljoen corpus
•Parole corpus (20 miljoen).

Naast deze corpora beschikt het INL nog over ander materiaal van voor 2000, waar het ANW gebruik van kan maken: ‘losse’ digitale bestanden, teksten in papieren vorm, en het al eerder genoemde WNT-Aanvullingen-materiaal voor de periode 1970-1976.

Voor de periode vanaf 2000 onderscheiden we als eigen ANW-corpora:

•Domeinencorpus Nederland (2000-2005)
•Domeinencorpus België (2000-2005)
•Corpus van Literaire Teksten (2000-2005)
•Neologismencorpus (2000-2019).

Uit de toegevoegde dateringen (2000-2005) kan men opmaken dat de domeinencorpora en het literaire corpus eind 2004 afgesloten worden en dat alleen het neologismencorpus (met 2000-2019) doorloopt tot het einde van het project.

Het domeinencorpus Nederland en het domeinencorpus België ontlenen hun naam aan de bijzondere methode waarmee ze worden opgebouwd. Uitgangspunt vormen de domeinen van de webindex NL-menu. Met behulp daarvan zoeken de bureauredacteuren binnen die domeinen (1817!) naar teksten die voor het woordenboek geschikt zijn. Ook Google wordt voor de constructie van deze corpora benut. Deze methode garandeert ons in ieder geval een zeer grote inhoudelijke diversiteit. Veel onderwerpen uit de samenleving die in de traditionele materiaalverzamelingen buiten beeld gebleven zouden zijn, worden ermee bereikt en dus ook de woorden die daar kenmerkend mee verbonden zijn. De totale omvang van het domeinencorpus Nederland zal eind 2004 ongeveer dertig miljoen tokens bedragen, die van het domeinencorpus België is geraamd op tien miljoen tokens.

Het Corpus van Literaire Teksten zal essays, romans, verhalen en toneel bevatten, onder te verdelen in oorspronkelijk en vertaald werk en in Noord en Zuid. De teksten worden door de eigen medewerkers gedownload of gescand. Dit corpus zal uitkomen op ongeveer vijftien miljoen tokens.

Het Neologismencorpus wordt als volgt gerealiseerd. We hebben een selectie gemaakt van een twintigtal dag- en weekbladen op internet. Deze

[pagina 435]
[p. 435]

worden dagelijks door ANW-medewerkers op neologismen (in ruimste zin: ook nieuwe betekenissen, verbindingen e.d.) doorgekeken. Aangetroffen neologismen worden met zeer ruime contexten gekopieerd en in eigen bestanden opgeslagen. Daarnaast blijft de oude verzamelmogelijkheid bestaan: papieren notities of krantenknipsels. Op die manier aangeleverd materiaal (ook van buiten het INL) wordt eveneens gedigitaliseerd. Bij afsluiting van de andere corpora, eind 2004, zal het een omvang hebben van zes miljoen tokens. De uiteindelijke omvang is begroot op circa vijftien miljoen tokens.

Als we de periode 2000 t/m 2002 als maat nemen, dan verzamelen we gemiddeld ongeveer 5.000 neologismen per jaar. Het zou zeer veel tijd kosten die allemaal te bewerken. Bovendien zijn het voor het merendeel eendagsvliegen. Veel van die tijd zou dus ook nog eens verloren tijd zijn. We hebben daarom besloten alleen de als ‘duurzaam’ ingeschatte neologismen te bewerken. Wel houden we van alle verzamelde neologismen lijsten bij, met vermelding van het jaar of de jaren waarin ze door ons zijn opgetekend. Het is onze bedoeling die lijsten op internet voor iedereen toegankelijk te maken nog voor de start van de publicatie van het feitelijke woordenboek zelf.

Onze eigen corpora staan bij de bewerking centraal. De INL-corpora en de losse digitale INL-bestanden zullen voornamelijk aanvullende diensten bewijzen. Die eigen corpora hebben samen een omvang van zeventig miljoen tokens. Met dat aanvullende, andere INL-materiaal zal de eindomvang van het ANW-corpus naar onze inschatting uitkomen op ongeveer honderd miljoen tokens.

We leggen niet zelf een subcorpus voor de gesproken taal aan. Wel zullen we gebruikmaken van het Corpus Gesproken Nederlands om woorden op het spoor te komen die uitsluitend of op bepaalde specifieke wijze in het gesproken taalgebruik voorkomen.

Momenteel is de afdeling automatisering van het INL bezig een proefcorpus van zeventien miljoen tokens voor ons gereed te maken. De verwachting is dat we dit op korte termijn taalkundig verrijkt en voorzien van tal van functionaliteiten die voor de redactionele bewerking van belang zijn, tot onze beschikking krijgen. Dan zal het de grondslag vormen voor onze eerste proefartikelen, waarmee we nog voor het einde van dit jaar willen beginnen.

[pagina 436]
[p. 436]

Elektronisch woordenboek

Met mijn eerdere vermelding van het ANW als een elektronisch woordenboek heb ik al een ander wezenlijk kenmerk genoemd, maar een verdere specificatie is gewenst. Elektronische woordenboeken kun je naar hun bestemming verdelen in elektronische woordenboeken voor mensen en elektronische woordenboeken voor computers. Uit mijn bespreking van de bestemming bleek al: het ANW zal er zijn voor de mensen. Gebruikelijk is verder een hoofdonderscheiding in off line en on line woordenboeken. Off line woordenboeken zijn woordenboeken op lokale opslagmiddelen als een diskette of cd-rom. On line woordenboeken zijn woordenboeken die zijn opgeslagen op servers die via internet toegankelijk zijn (cf. Petelenz 2001, 43; De Schryver 2003, 146-151). Het ANW valt onder die laatste categorie. Het ANW wordt dus een on line woordenboek voor menselijk gebruik.

Bijna alle elektronische woordenboeken zijn gedigitaliseerde versies van eerdere papieren woordenboeken. Inhoudelijk is daarbij doorgaans niets of nauwelijks iets veranderd. Wat deze producten een bijzonder aantrekkelijke meerwaarde geeft, is de software waarmee op verschillende manieren en vanuit verschillende invalshoeken allerlei soorten gegevens kunnen worden opgevraagd (Petelenz 2001, 62). Het alfabet is niet langer de enige toegangsweg tot de informatie die in een woordenboek besloten ligt.

Die nieuwe fonctionaliteiten die we danken aan de ontwikkeling van de woordenboeksoftware, brachten echter meer en scherper dan ooit tevoren ook de lacunes, inconsistenties, tegenstrijdigheden en vergissingen uit de oorspronkelijke gedrukte versies aan het licht. Ook inlioudelijk vraagt het elektronische tijdperk om verbetering en vernieuwing.

Aan het ANW ligt geen papieren versie ten grondslag. We beginnen met een schone lei. Onze opzet is ook niet om artikelen te schrijven zoals we dat voor een papieren woordenboek gewend zijn, maar om ons al bij de conceptvorming van meet af aan rekenschap te geven van de mogelijkheden, eisen en problemen die aan het maken van een nieuw elektronisch woordenboek verbonden zijn.

[pagina 437]
[p. 437]

Inhoud

In vergelijking met andere woordenboeken kenmerkt het ANW zich inhoudelijk, doordat het tal van nieuwe informatiecategorieën zal bevatten. Voorts zullen we de al bestaande informatiecategorieën met meer diepgang en systematischer behandelen. Een grotere interne consistentie bereiken we door voor de inhoud van de artikelen een vaste datastructuur te ontwerpen. Om duidelijk te maken dat het hier niet om een paar loze reclamekreten gaat, wil ik bij deze punten wat uitvoeriger stilstaan. Voor mijn toelichting neem ik een voorbeeld als uitgangspunt dat ons wellicht naar de late middag doet verlangen: het woord bier. In de jongste druk van het handwoordenboek van Koenen staat het volgende artikel:

bier (o) (soorten) -en alcoholische drank, uit hop en gerst gebrouwen: een ~tje drinken.

Naar de verschillen in de aard van de gegevens die hier worden aangeboden, valt het artikel in vijf segmenten, of ‘velden’, te verdelen. Als we die segmenten voorzien van een beginlabel <> en een eindlabel </> en met die labeling hun aard markeren, dan krijgen we het volgende beeld:

<trefwoord>bier</trefwoord><geslacht> (o)</geslacht><meervoud<-en</meervoud<<definitie> alcoholische drank, uit hop en gerst gebrouwen </definitie>:<voorbeeld> een ~tje drinken</voorbeeld>.

Buiten het trefwoord zelf, waarover immers de informatie gegeven wordt, zijn die afzonderlijke velden te beschouwen en te benoemen als ‘informatiecategorieën’. Deze staan op één lijn, er zijn geen verschillende niveaus van overkoepeling en onderverdeling. Het artikel heeft een ‘platte’ structuur.

Er zijn echter ook enige ‘verborgen categorieën’. Met het trefwoord is namelijk impliciet ook de juiste spelling aangegeven. De ‘o’ achter het trefwoord staat voor ‘onzijdig’ en maakt kenbaar wat het woordgeslacht is (het is een ‘het-woord’). Dit is echter alleen van toepassing bij substantieven, zodat impliciet via ‘substantief’ ook de categorie ‘woordsoort’ aanwezig is. Op vergelijkbare wijze is ‘substantief’ ook overkoepelend besloten in de categorie ‘meervoud’. We krijgen nu een structuur met zes informatiecategorieën en bovendien een structuur die niet meer plat, maar

[pagina 438]
[p. 438]

hïerarchisch is (drie niveaus bij ‘woordsoort’; substantief is gecursiveerd omdat het geen informatiecategorie maar een waarde bij ‘woordsoort’ is):

trefwoord
spelling (impliciet in trefwoord)
woordsoort (impliciet via substantief)
substantief (impliciet in geslacht en meervoud)
geslacht
meervoud
definitie
voorbeeld.

In deze eenvoudige structuur kan men gemakkelijk het informatieaanbod van het gemiddelde handwoordenboek herkennen.

Het aantal informatiecategorieën in het ANW ligt ruim boven de honderd. In een eerste ontwerp komen we uit op honderdveertig. Ze zijn ondergebracht in een hiërarchische structuur. Die kent zoveel verschillende niveaus, dat ik u hier slechts fragmentarisch een idee ervan kan geven aan de hand van de twee hoogste niveaus. Op het hoogste niveau wordt die structuur gevormd door de rubrieken a) trefwoord, b) spelling en uitspraak, c) grammatica, d) betekenis en gebruik, e) etymologie. Ieder van die topelementen is verder onderverdeeld:

trefwoord
[homoniemennummer]
trefwoordtype
spelling en uitspraak
spellingsvariant
afbreking
schrijfwijze
aantal lettergrepen
afkorting
grafisch symbool
beklemtoning
uitspraakwijze
fonetisch
IPA-notatie
grammatica
[pagina 439]
[p. 439]
woordsoort
woordvormingstype
betekenis en gebruik
betekenisnummer
definitie
semagram
voorbeelden
verbindingen
spreekwoorden en zegswijzen
contextanten
woordfamilie
betekenisrelaties
etymologie
datering
aard van de herkomst
etymologisch commentaar.

Ik heb in dit schema niet de rubrieken verwerkt die geen vaste stractuurplaats hebben, zoals bijvoorbeeld ‘pragmatiek’ (met categorieën als taalgebied, stijl, vakgebied, sociale groep, houding en frequentie), ‘multimedia’ (afbeelding, geluid, video) en ‘commentaar’.

In de gedeeltelijke structuurweergave zijn de vetgedrukte categorieën nieuw. Veel van deze categorieën hebben op hun beurt verscheidene onderverdelingen. Exemplarisch wil ik er twee behandelen: woordvormingstype en semagram. Het element woordvormingstype heeft in ons ontwerp de volgende opzet:

ongeleed
afleiding
grondwoord
affix
samenstelling
linkerlid
rechterlid
type
tussenklank
betekenisbetrekking tussen linkerlid en rechterlid
[pagina 440]
[p. 440]
samenstellende afleiding,
samenkoppeling
blend/samensmelting/reductiesamenstelling
verkorting
keervorming (back formation)
eponiem
letterwoord
lettergreepwoord
overige.

Woordvormingstype is een categorie waarvoor direct een waarde wordt opgegeven. In dit geval is er sprake van een eindige set van vaste waarden (aangegeven met cursief): ongeleed woord, afleiding, samenstelling, samenstellende afleiding, samenkoppeling, blend, verkorting, keervorming, eponiem, letterwoord, lettergreepwoord, overige. Een aantal van hen wordt weer verder onderverdeeld. In het schema geven we daar voorbeelden van bij afleiding en bij samenstelling.

Bij afleiding zijn velden ingeruimd waar het karakter van het grond- woord en het affix wordt gepresenteerd. Voor ‘grondwoord’ is er opnieuw een gesloten verzameling waarden (12): substantief, adjectief, werkwoord, werkwoordsstam, werkwoordsstam + substantief, samengesteld substantief, samengesteld substantief + ig, onovergankelijk werkwoord, overgankelijk werkwoord, bijwoord, eigennaam, wortel. Onder ‘affix’ komt te staan met welk voorvoegsel, achtervoegsel, gecombineerd voor- en achtervoegsel, of infix een woord is afgeleid, of er wordt vermeld dat het gaat om een afleiding zonder affix (nul-afleiding, conversie).

Bij ‘samenstelling’ worden gesloten sets van waarden aangehouden voor type, tussenklank en betekenisbetrekking tussen linker- en rechterlid. Dat zijn er voor ‘type’ liefst veertig. Voor de betekenisbetrekkingen zijn we bezig met een inventarisatie die naar verwachting ook tot enige tientallen waarden zal leiden.

Met deze nieuwe categorieën op het gebied van de woordvorming spelen we voornamelijk in op mogelijke vragen en behoeften van taalkundigen.

Nieuwkomer bij ‘betekenis en gebruik’ is het semagram. Een semagram is een frame, een structuur met slots en fillers waarin kennis van een bepaald concept wordt gepresenteerd. Het semagram voor bier zou er als volgt uit kunnen zien:

[pagina 441]
[p. 441]
<categorie>drank</categorie>
<kenmerk_samenstelling>alcoholhoudend, alcoholisch</kenmerk_samenstelling>
<kenmerk_bereiding>in een brouwerij; brouwen; koken, gisten</kenmerk_bereiding>
<kenmerk_grondstof>gerst, mout, wort, hop, water</kenmerk_grondstof>
<kenmerk_kleur>goudkleurig, geel, blond, amberkleurig, bruin, wit, licht, donker; schuimkraag wit</kenmerk_kleur>
<kenmerk_smaak>bitter, bitterzoet, zoetzuur, zoet, verfrissend, fris</kenmerk_smaak>
<kenmerk_gebruik> verpakt en vervoerd in flesjes, blikjes, kratten, vaten; getapt uit vaten, fusten; gedronken uit glazen, pullen, flesjes, potten</kenmerk_gebruik>
<bovencategorie>vloeistof, product, consumptieartikel</bovencategorie>
<oppercategorie>stof</oppercategorie>.

De slots (de labels tussen de punthaken) zijn de abstracte elementen die de eigenschappen en relaties aangeven die relevant zijn voor woorden uit de semantische klasse waartoe het trefwoord behoort. De fillers zijn de bij die labels ingevulde concrete gegevens die voor het trefwoord in kwestie gelden. Die structuren zijn niet uit de lucht komen vallen. Op basis van analyses van definities voor een selectie van ongelede substantieven, werkwoorden en adjectieven onderscheiden we semantische klassen. Daar ontwerpen we ‘typesjablonen’ voor, die vervolgens bij de bewerking worden ingevuld. In die technische zin kan men het semagram ook beschouwen als een ‘ingevuld typesjabloon’ Het structuurmodel bij bier is dus een structuurmodel dat bij alle drankbenamingen terugkeert. Voor nadere details moet ik verwijzen naar mijn oratie (Moerdijk 2002). Het semagram zal in het ANW naast de definitie deel uitmaken van de betekenisbeschrijving (vanzelf-sprekend met aangepaste lay-out).

Om een aantal redenen kan het semagram een rol van betekenis (in dubbele zin dus) gaan spelen:

[pagina 442]
[p. 442]
•het expliciteert kennisgegevens die in de definitie alleen impliciet besloten liggen;
•het kan op een coherente, gestructureerde wijze veel meer gegevens bevatten dan de definitie;
•het zorgt voor veel meer en genuanceerdere zoek- en opvraagmogelijkheden van inhoud naar vorm;
•het vormt met andere semagrammen een grote verscheidenheid aan lexicale en conceptuele relaties;
•elementen ervan spelen onder meer ook een rol bij collocaties, polysemie, betrekkingen tussen de leden van samenstellingen van het trefwoord.

Het semagram is een vernieuwing die niet alleen voor professionele, maar ook voor ‘gewone’ taalgebruikers interessant is. De laatste kunnen er bijvoorbeeld baat bij hebben als ze niet meer op een woord kunnen komen, waarvan ze nog wel bepaalde betekeniselementen in hun hoofd hebben.

Op basis van ons concept van de microstructuur zal in overleg en samenwerking met onze automatiseringsdeskundigen een XML-structuur ontworpen worden. Ten slotte merk ik op, nu mogelijk ten overvloede, dat je in het geval van het ANW bij ‘woordenboek’ moet denken aan een lexicografische database, niet aan een gedrukt boek of een cd-rom daarvan. Eventueel kunnen van die database allerlei andere lexicografische producten worden afgeleid, zowel in papieren als in elektronische vorm, maar dat is op dit moment niet aan de orde.

Publicatie

In 2005 moeten we volgens de planning met de echte bewerking beginnen. We willen dan zo spoedig mogelijk het ANW op internet gaan zetten. Een van de voordelen van het on line woordenboek is immers dat je niet met publiceren hoeft te wachten tot je je van A tot en met Z door de woordenschat heen hebt geworsteld. Die publicatie van volledig bewerkte artikelen zal overigens niet alfabetisch plaatsvinden, maar in klassen van woorden die naar hun betekenis bijeenhoren. Zo zullen ze ook bewerkt worden, onder meer om een zo groot mogelijke uniformiteit in behandeling en redactioneel taalgebruik te bereiken. Andere voordelen van het on line

[pagina 443]
[p. 443]

publiceren zijn de mogelijkheid tot directe interactie met gebruikers en tot directe aanvulling en verbetering.

Besluit

Nogal wat mensen hebben mij de afgelopen paar jaren gevraagd: Gaan jullie een eigentijds woordenboek maken? Waar is dat nou voor nodig? We hebben toch Van Dale al? Zelfs in eigen kring heerste aanvankelijk enige bezorgdheid over de zinvolheid van ons bestaan. Amper tot hoofdredacteur benoemd, kreeg ik van het bestuur van het INL het verzoek om nu eens in een nota duidelijk uit te leggen, waarin het ANW zou gaan verschillen van de Grote Van Dale. Als het goed is, heb ik in ieder geval van u zo'n vraag naar de verschillen met Van Dale niet meer te duchten.

 

Ik heb u iets van de fundamenten kunnen laten zien van een bouwwerk dat nog geheel moet worden opgetrokken. Ik hoop dat ik uw interesse voor dat gebouw heb gewekt. Dat de vlag op het dak gaat, zal ik niet meer meemakeu, zeker niet beroepsmatig. Mijn leven is dan al yeranderd van ANW in AOW.

Bibliografie

Moerdijk, Fons: Het woord als doelwit. Amsterdam, 2002.
Petelenz, Krysztof: Standardisierung der Lexikoneintäge für ein neues großes Deutsch-Polnisches und Polnisch-Deutsches Wörterbuch. Hildesheim, Georg Olms Verlag, Germanistische Linguistik, 2001.
Scharyver, Gilles-Maurice De: ‘Lexicographer's dreams in the electronic dictionary age’. International Journal of Lexicography 16, 143-199 (2003).


Vorige Volgende

Footer navigatie

Logo DBNL Logo DBNL

Over DBNL

  • Wat is DBNL?
  • Over ons
  • Selectie- en editieverantwoording

Voor gebruikers

  • Gebruiksvoorwaarden/Terms of Use
  • Informatie voor rechthebbenden
  • Disclaimer
  • Privacy
  • Toegankelijkheid

Contact

  • Contactformulier
  • Veelgestelde vragen
  • Vacatures
Logo DBNL

Partners

Ga naar kb.nl logo KB
Ga naar taalunie.org logo TaalUnie
Ga naar vlaamse-erfgoedbibliotheken.be logo Vlaamse Erfgoedbibliotheken

Over het gehele werk

datums

  • 26 augustus 2003

  • 27 augustus 2003

  • 28 augustus 2003

  • 29 augustus 2003

  • 30 augustus 2003

  • 25 augustus 2003

  • 24 augustus 2003


Over dit hoofdstuk/artikel

taalkunde

  • Woorden (lexicografie)