Skiplinks

  • Tekst
  • Verantwoording en downloads
  • Doorverwijzing en noten
Logo DBNL Ga naar de homepage
Logo DBNL

Hoofdmenu

  • Literatuur & taal
    • Auteurs
    • Beschikbare titels
    • Literatuur
    • Taalkunde
    • Collectie Limburg
    • Collectie Friesland
    • Collectie Suriname
    • Collectie Zuid-Afrika
  • Selecties
    • Collectie jeugdliteratuur
    • Basisbibliotheek
    • Tijdschriften/jaarboeken
    • Naslagwerken
    • Collectie e-books
    • Collectie publiek domein
    • Calendarium
    • Atlas
  • Periode
    • Middeleeuwen
    • Periode 1550-1700
    • Achttiende eeuw
    • Negentiende eeuw
    • Twintigste eeuw
    • Eenentwintigste eeuw
Spektator. Jaargang 20 (1991)

Informatie terzijde

Titelpagina van Spektator. Jaargang 20
Afbeelding van Spektator. Jaargang 20Toon afbeelding van titelpagina van Spektator. Jaargang 20

  • Verantwoording
  • Inhoudsopgave



Genre

sec - letterkunde
sec - taalkunde

Subgenre

tijdschrift / jaarboek


© zie Auteursrecht en gebruiksvoorwaarden.

Spektator. Jaargang 20

(1991)– [tijdschrift] Spektator. Tijdschrift voor Neerlandistiek–rechtenstatus Auteursrechtelijk beschermd

Vorige Volgende
[pagina 347]
[p. 347]

Semantiek in het woordenboek - Heranalyse van woordenboekdefinitiesGa naar voetnoot*

Helmut Schnelle en Peter Hellwig

1 Inleiding

We zullen aannemen dat de semantische informatie voor NTV-woordenboeken (= woordenboeken voor natuurlijke-taalverwerkende systemen) alleen ontwikkeld kan worden door middel van een procedure van heranalyse van verklaringen in bestaande woordenboeken. Het ontwikkelen van geheel nieuwe woordenboeken zonder verwijzing naar bestaande woordenboeken is een bijna onmogelijke taak als een volledig woordenboek van zo'n 100000 lezingen of meer samengesteld moet worden. We zullen twee soorten heranalyse-procedures bespreken. In de eerste levert de heranalyse de verklaringen in woordenboekingangen op uitgedrukt als relaties van logisch gevolg (entailment) tussen zinsschemata. Als resultaat hiervan is de inferentie-machine dezelfde als gewoonlijk wordt aangenomen in kennissystemen, in termen van formele logika. We zullen dit de logisch gevolgbenadering (entailment approach) noemen. In de tweede soort procedure leidt heranalyse tot kenmerkstrukturen die uitgedrukt worden door middel van een basisverzameling van primitieve semantische kenmerken (features) en waarden. We zullen dit de kenmerk-benadering (feature approach) noemen. Van beide benaderingen zullen varianten gepresenteerd worden en vergeleken worden met een konkreet woordenboekartikel.

2 Semantiek in het woordenboek als gevolgtrekkingsrelatie

2.1 Principes

Er zijn twee varianten binnen de logisch gevolg-benadering, waarvan de eerste in Bochum ontwikkeld wordt en de tweede sinds 1977 ontwikkeld is in Heidelberg. In de eerste methode worden woordenboekverklaringen handmatig geheranalyseerd in een formaat dat de toepassing van de mechanismen van een inferentiemachine toestaat. In de tweede methode worden de verklaringen of definities door een automatische ontleder geanalyseerd, die een formaat oplevert waarop de inferentiemachine toegepast kan worden. We zullen de twee benaderingen apart toelichten.

2.1.1 De Bochum-benadering

In onze verklaring van de eerste methode zullen we naar het Engelse Cobuild-woordenboek van Collins verwijzen, aangezien definities in dit woordenboek zelf weergegeven zijn als volledige zinnen in natuurlijke taal.

[pagina 348]
[p. 348]

Omdat het definitiegedeelte in deze zinnen compact is (met een ingewikkelder syntaxis dan die van gewone enkelvoudige zinnen in standaard woordvolgorde) is er een gestruktureerde heranalyse nodig om eenvoudige logische calculi - en de daarmee samenhangende inferentiemachine - toe te kunnen passen.

 

Het lijkt erop dat de volgende aannamen gemaakt kunnen worden:

1. De semantische specifikatie uit een woordenboek wordt zelf weergegeven door een zin van de taal;

2. Deze zin heeft de logische vorm p ➝ q;

3. p is een enkelvoudige zin die slechts één betekenisdragend woord bevat, de andere woorden zijn voornaamwoorden (p is dus vergelijkbaar met een open zin uit de predikatenlogika);

4. q is een complexe zin, die andere betekenisdragende woorden en voornaamwoorden bevat, waarvan sommige anaforisch terugverwijzen naar de pronomina in p (q is ook vergelijkbaar met een open zin, waarvan sommige variabelen gebonden zijn door variabelen in p);

5. Voor de meeste ingangen in het woordenboek is het mogelijk om een heranalyse van q te geven (q') die een konjunktie is van zinnen: q' = q1 en q2...en qn, waarbij q ➝ q' en q1, q2...qn zinnen van dezelfde vorm zijn als p, d.w.z. zinnen die slechts één betekenisdragend woord bevatten;

6. In toepassing van de wetten van de logische calculus geldt het volgende: p ➝ q1, p ➝ q2...p ➝ qn;

7. In een volledig woordenboek zouden q1 en q2...en qn gelijk moeten zijn aan het antecedent p in een andere ingang van het woordenboek - met uitzondering van een naar verhouding kleine klasse woorden, die ongedefinieerd zijn in het woordenboek;

8. Als gevolg van enkele logische eigenschappen (de eigenschap van transitiviteit van ➝, de eigenschap dat q1 of q2 ➝ p equivalent is aan {q1 ➝ p, q2 ➝ p}, en dat p ➝ q1 en q2 equivalent zijn aan {p ➝ q1, p ➝ q2}) is de struktuur van het woordenboek die van een tralie (lattice) over de enkelvoudige zinnen geïnterpreteerd als betekenis- representaties;

9. De verzameling (geheranalyseerde) geïmpliceerde parafrasen van een enkelvoudige zin van de vorm aangeduid in 3. - d.w.z. de eerder genoemde parafrastische verzameling - kan eenvoudig vastgesteld worden door een zoekprocedure door de tralie.

Een basisingrediënt van een begrijpsysteem kan op deze manier opgeleverd worden door de voorgestelde heranalyse van de betekenisverklaringen van een woordenboek. Het woordenboekformaat dat voor de meest geavanceerde woordenboeken aangenomen is hoeft niet veranderd te worden. Het is alleen nodig dat de principes konsistenter en strikter toegepast worden dan gewoonlijk het geval is. Deze striktheid kan bereikt worden door middel van gereedschap dat het ontwikkelen van woordenboeken ondersteunt en het formaat strikt kontroleert.

Een vergelijking met beschrijvingen van kennisbanken in termen van logische calculi maakt duidelijk dat volgens de heranalyse het woordenboek (op de beschreven wijze geheranalyseerd) een logische kennisbank is, waarbij de verklaringen, als implikationele uitdrukkingen, door de logische inferentie-

[pagina 349]
[p. 349]

machine gebruikt moeten worden als een verzameling axioma's. Als gevolg van de voorgestelde heranalyse genereert de inferentiemachine indirekte implikatie, hyponymieketens enz. vanaf de axioma's. De minder specifieke woorden in de taal worden geïmpliceerd door de specifiekere woorden.

Aangezien de minst specifieke woorden korresponderen met semantische kenmerken in andere analyses zijn deze semantische kenmerken in principe direkt aanwezig in de taal en hoeven zij niet kunstmatig geïntroduceerd te worden bij het maken van een semantische metataal.

2.1.2. Illustratie van de Bochum-benadering.

Ter illustratie gebruiken we een voorbeeld gegeven door N. Calzolari en A. Zampolli uit Pisa (1989) omdat dit de gelegenheid geeft om onze analyse te vergelijken met die welke door het Pisa-team toegepast is. De auteurs geven het lemma:

CHIODO - ATTREZZO IN METALLO DEGLI ALPINISTI
wat zou korresponderen met de volgende, uitgebreide(re) Nederlandse representatie/verklaring:
als iets een piton (rots/klimhaak) is dan is het een metalen gereedschap voor alpinisten.

In onze benadering zou deze beschrijving geheranalyseerd worden als:

 

als iets. 1 een piton is
dan is iets. 1 een gereedschap
en iets. 1 is gemaakt-van iets. 2
en iets. 2 is (een) metaal
en iets. 1 wordt gebruikt-door iemand. 3
en iemand. 3 is een alpinist

 

Het essentiële aspekt van deze heranalyse is dat de in de definities gebruikte enkelvoudige zinnen elders in het woordenboek als een lexikale trefwoordzin terugkomen. Elk van de verdere onderdelen van de analyse kan van een dergelijke trefwoord-zin afgeleid worden. Na het opzoeken hiervan kunnen de geïmpliceerde zinnen op hun beurt zinnen impliceren. Voor alpinist kunnen we vinden dat het een persoon is die bergen beklimt, in het bijzonder de Alpen. We zullen dus af kunnen leiden dat een piton gebruikt wordt door personen die bergen beklimmen, en op zijn beurt zal klimmen omhoog bewegen impliceren etc.. De kennisbank van enkelvoudige lexikale zinnen levert op die wijze een netwerk van onderling verbonden betekenissen op.

 

Als de analyse aan de hand van een bestaand woordenboek gemaakt zou worden, zou die uiteraard explicieter zijn. De heranalyse die LDOCE (Longman's Dictionary of Contemporary English) voor piton op zou leveren ziet er - compact weergegeven - als volgt uit:

[pagina 350]
[p. 350]
sth. 1 is a piton ➝
sth. 1 is a rod,
sth. 1 is short (for a rod),
sth. 1 is pointed,
sth. 1 is made from sth. 2,
sth. 2 is metal,
sth. 3 can be done with sth. 1,
sth. 3 = sth1 is hammered into sth. 4,
sth. 4 is a rock
sth. 2 has sth. 5 as a part,
sth. 5 is a hole,
sth. 5 is at one end of sth. 1
sth. 5 serves for sth. 6,
sth. 6 = so. 7 passes sth. 8 through sth. 5,
sth. 8 is a rope,
sth. 1 is used as sth. 9 in sth. 10,
sth. 9 is a hold,
sth. 10 = so. 11 climbs sth. 12,
sth. 12 is a mountain

 

Het moge duidelijk zijn dat het bovenstaande gebaseerd is op de volgende definitie ‘a short pointed metal rod that can be hammered into rock, having a hole at one end to pass a rope through, used as a hold in mountain climbing’ en dat gecursiveerde elementen op hun beurt weer aanleiding kunnen geven tot verdere (expliciteerbare) implikaties.

2.1.3 De Heidelberg-benadering

De Heidelberg-benadering van semantiek in het woordenboek is zelfs nog ambitieuzer. Deze integreert de automatische syntaktische analyse van definities en verklaringen die handmatig werd uitgevoerd in de vorige methode met de implementatie van de inferentiemachine. De methode is in de jaren zeventig ontwikkeld in het kader van deduktieve vraagbeantwoording (zie Hellwig 1977a, 1977b, 1978a, 1978b, 1980). De algemene filosofie is de volgende: het is duidelijk dat natuurlijke talen veel rijker zijn dan enige kunsttaal die op dit moment ontwikkeld is. Taalkundig gezien zijn pogingen om de logische calculus uit te breiden zodat deze dezelfde semantische verschijnselen dekt als natuurlijke taal, onbevredigend. Het lijkt waarschijnlijk dat elk syntaktisch kenmerk van natuurlijke taal tenminste een gering effekt op de betekenis van uitingen heeft. Om een representatietaal te ontwikkelen die alle semantische verschillen kan uitdrukken zou men dus de syntaxis van de betreffende natuurlijke talen precies moeten kunnen rekonstrueren.

 

Dit is de richting waarvoor gekozen is in het Heidelbergse PLAIN-systeem (Programma's voor Taal Analyse en Inferentie). De representatietaal (DRL) die ontwikkeld is om de syntaktische strukturen van natuurlijke taal te rekonstrueren bestaan uit getypeerde dependentie-bomen. De grammatikale expressies van de natuurlijke taal in kwestie zijn gedefinieerd door een Dependentie Unifikatie Grammatika (DUG) die in DRL geschreven is.

 

De semantiek van de invoertaal wordt berekend door inferentieregels af te leiden van syntaktische patronen. Dit is natuurlijk een zeer oud idee dat ook

[pagina 351]
[p. 351]

de basis vormt voor de klassieke syllogismen. Het meest bekende voorbeeld is:

 

Alle mensen zijn sterfelijk.
Socrates is een mens.
Socrates is sterfelijk

 

De relatie tussen deze drie zinnen kan louter taalkundig behandeld worden. Zij volgt uit de betekenis van ‘alle’ in de eerste en ‘is’ in de tweede zin en de toegepaste syntaktische strukturen. Terwijl de elementen ‘mens/mensen’, ‘zijn/is sterfelijk’ en ‘Socrates’ vervangen kunnen worden door ander materiaal van hetzelfde syntaktische type zonder de geldigheid van het afleidingsschema te schenden.

 

Er is echter niet alleen een semantische relatie tussen de twee premissen en de konklusie, namelijk logisch gevolg, maar er is ook nog een semantische relatie tussen de eerste premisse en de andere twee zinnen. De eerste premisse is - zoals Stephen Toulmin het noemt - de machtiging of toestemming om de konklusie van de tweede premisse af te leiden. Dit is het geval omdat de eerste premisse een algemene uitspraak is. Algemene uitspraken moeten in de gegevensbank aanwezig zijn, zodat afleidingen uit de kennisbank mogelijk worden. Vanuit dit inzicht is het afleiden van formele inferentieregels een kleine stap.

 

In de Heidelberg-benadering is het driedelige schema van het klassieke syllogisme verdeeld in twee transformatieregels van verschillende typen. Ten eerste een metaregel opgesteld door de taalkundige voor de overgang van een algemene regel naar een inferentieregel en vervolgens deze inferentieregel zelf, die de overgang van de tweede premisse naar de konklusie in een konkreet geval kontroleert. De metaregels behoren tot het syntaktische niveau van de taalbeschrijving. De deduktieve component vertrouwt op de rolmarkeringen in de dependentiebomen om de strukturen waarop de regel van toepassing is te identificeren. Dit is tegelijkertijd de manier waarop de rollen in het systeem uitgelegd worden: elke rol is impliciet gedefinieerd door de verzameling metaregels waarop dezelfde markeringen verschijnen. Door in natuurlijke taal geformuleerde algemene regels die toestanden beschrijven in te voeren, bereikt het systeem zijn konkrete deduktieve mogelijkheid.

 

Als Carnap's idee van betekenispostulaten opgenomen wordt, kan de referentiële betekenis van woorden met hetzelfde mechanisme gegeven worden. De essentie van Carnap's voorstel is de formulering van betekenis in dezelfde taal als waarop deze betrekking heeft. In het geval van natuurlijke taal zijn zowel betekenisverklaringen in het dagelijkse leven als semantische definities in een woordenboek syntaktisch op dezelfde manier gevormd als andere algemene uitdrukkingen en kunnen deze dus door dezelfde metaregels in inferentieregels omgezet worden. Zodoende is dat wat

[pagina 352]
[p. 352]

PLAIN nodig heeft in het semantische deel van het woordenboek, gewoon zorgvuldig uitgewerkte definities in natuurlijke taal.

2.1.4 Illustratie van de Heidelberg-benadering

Het PLAIN-systeem dat in Heidelberg ontwikkeld is omvat een volledig geïmplementeerde ontleder en een transformationele komponent die gebruikt kan worden om de heranalyse van de semantische beschrijvingen in gewone woordenboeken te ondersteunen. De ontleder levert getypeerde dependentiestrukturen op die getransformeerd kunnen worden in vrijwel elk formaat door middel van recursief toegepaste substitutieregels. Het is echter zo dat de toepassing van de parser op woordenboekdefinities het bestaan van komplete beschrijvingen van lexemen op het syntaktische niveau vooronderstelt.

 

Om de mogelijkheden te illustreren herhalen we het eerder gegeven voorbeeld:

 

CHIODO - ATTREZZO IN METALLO DEGLI ALPINISTI

 

De ingang wordt als volgt geanalyseerd:

(PREDIKAAT:-  
  (ONDERWERP: chiodo)  
  (PREDIKATIEF: attrezzo  
  (ATTRIBUUT: in
  (: metallo))
  (POSSESSIEF: degli
  (: alpinisti)))

De volgende transformatieregels zijn van toepassing:

 

(Het antecedent in elke regel is de conditie op toepassing; het postcedent is een vervangingspatroon. De geïndexeerde variabelen in de regels dekken een term (#), een boom ($) of een patroon van bomen (-).)

(1) Introduktie van implikatie  
 
  (:⇒ (PREDIKAAT:-  
  (ONDERWERP:$1)
  (PREDIKATIEF:$2))
  (:als-dan  
  (PREDIKAAT: zijn
  (ONDERWERP: iets)
  (PREDIKATIEF:$1))
  (PREDIKAAT: zijn
  (ONDERWERP: iets)
  (PREDIKATIEF:$2))))
 
(2) Isolatie van substantie-attribuut  
 
  (:⇒ (PREDIKAAT: zijn  
  (ONDERWERP: iets)
  (PREDIKATIEF: #1

[pagina 353]
[p. 353]

  (ATTRIBUUT: in  
  (:$1))  
  (-1)))  
  (:en  
  (PREDIKAAT: zijn  
  (ONDERWERP: iets)  
  (PREDIKATIEF: #1  
  (-1)))  
  (PREDIKAAT: gemaakt-van  
  (ONDERWERP: iets)  
  (PREDIKATIEF:$1))))  
 
(3) Isolatie van possessief casus  
 
  (:⇒ (PREDIKAAT: zijn  
  (ONDERWERP: iets)  
  (PREDIKATIEF: #1  
  (POSSESSIEF: degli
  (:$1))
  (-1)))  
  (:en  
  (PREDIKAAT: zijn  
  (ONDERWERP: iets)
  (PREDIKATIEF: #1
  (-1)))
  (PREDIKAAT: behoort-tot  
  (ONDERWERP: iets)
  (PREDICATIEF:$1))))
 
(4) Deletie van geneste konjunkties:  
 
  (:⇒ (:en  
  (:en  
  (-1))  
  (-2))  
  (:en  
  (-1)  
  (-2))))  
 
Na recursieve toepassing van alle regels:  
 
  (: als-dan  
  (PREDIKAAT: zijn  
  (ONDERWERP: iets)  
  (PREDIKATIEF: chiodo))  
  (:en  
  (PREDIKAAT: zijn  
  (ONDERWERP: iets)
  (PREDICATIVE: attrezzo))
  (PREDIKAAT: behoort-tot  
  (ONDERWERP: iets)
  (PREDIKATIEF: alpinisti)))
  (PREDIKAAT: gemaakt-van  
  (ONDERWERP: iets)
  (PREDIKATIEF: metallo))))

Dit resultaat komt dicht bij de door de Bochum-groep voorgestelde struktuur, en kan tevens aangepast worden aan het Pisa formaat (cf. infra).

[pagina 354]
[p. 354]

2.2 Praktische konsekwenties

Bij implikationeel geanalyseerde woordenboeken start men van de definities van bestaande woordenboeken en analyseert men ze op de eerder gespecificeerde wijze. Het moge duidelijk zijn dat deze analyse het beste on line gebeurt. On line-werk zou ondersteund moeten worden door geschikte formattering, waarbij verschillende niveaus voor de resultaten van de analyse onderscheiden worden. Het ondersteunende programma zou tevens snelle toegang tot de ingangen die korresponderen met de elementen uit de analyse moeten verschaffen, en ze op aparte vensters tonen, tegelijk met het trefwoord waaraan de lexikograaf werkt. Er zou ook een inzichtelijke grafische weergave moeten geboden worden van de implikationele omgeving van de lezing waaraan zij of hij aan het werken is, alsmede van de ‘top’-woorden die aan het hoofd staan van de implikatieketen van de lezing.

 

Het systeem zou eveneens moeten kontroleren of de door de lexikograaf voorgestelde ingangen

-voldoende gestruktureerd;
-kompleet (in de zin dat alle woorden die in de verklaring voorkomen voorkomen als een lezing);
-en konsistent zijn (in de zin van afwezigheid van tegenspraak).

3 De kenmerk-benadering van semantiek in het woordenboek

3.1 De Pisa-benadering

Een prominent voorbeeld van de kenmerk-benadering wordt momenteel in Pisa ontwikkeld binnen de kontekst van het ACQUILEX-projekt Ga naar eind1. Ter vergelijking met de methode die hierboven in de kontekst van de gevolgtrekkingsrelatie besproken werd, nemen we weer hetzelfde voorbeeld op en bespreken we het thans aan de hand van de Pisa-benadering. Bij deze laatste wordt het woordenboek beschouwd als ‘klassifikatie-instrument’, i.e. een empirisch middel om concepten te instantiëren. Deze benadering onderscheidt twee verschillende types van semantische strukturen:

1 - (Betekenis-)relationele:
  (a) hyp(er)onymie-relaties tussen woorden(= woordbetekenissen)
  (b) relaties tussen een woord en de woorden gebruikt in de onderscheidingen (de differentiae specificae) in zijn definitie.
 
2 - (Kenmerk-)analytische
  (a) representaties in termen van concepten en attributen (voorzover deze concepten elementen van een conceptueel systeem zijn staan ze uiteraard ook onderling in een algemeen conceptueel verband)

Strukturen van het eerste type kunnen meestal gerepresenteerd worden door grafen met ISA-verbindingen. De huidige stand van zaken in het onderzoek wordt bepaald door de aanname dat (1b) het beste vastgesteld wordt op

[pagina 355]
[p. 355]

basis van representaties van het type (2a). Op die manier zijn verschillende conceptuele schemata (conceptframes) ontwikkeld, één voor elke basiskategorie van woorden (of typen of soorten objekten) die voorkomen in het woordenboek. Een schema is een lijst concepten die gezien worden als kenmerken (of slots, in de terminologie van frames). De waarden (of vullers) van deze kenmerken verschaffen de afzonderlijke specifikaties waardoor een bepaalde betekenis met de betekenis van andere woorden van dezelfde kategorie of soort kontrasteert. Er bestaat bijvoorbeeld een soort SUBSTANTIEGa naar eind2. Het volgende kenmerk-schema kan hieraan toegekend worden:

 

Funktie:: Gebruikt-voor:.., Gebruikt-in:.., Gebruikt-als:.., Gebruikt-door:...
Eigenschap:: Aard:.., Struktuur:.., Oorsprong:.., Toestand:.., Geur:.., Kleur:.., Vorm:..,
Uiterlijk:.., Zonder:.., Lijkend-op:..,
Samenstelling:: Samengesteld-uit:.., Voornamelijk:.., Veel:.., Onderdeel-van:..
Bron:: Afgeleid-uit:.., Gemaakt-door:.., Gemaakt-met-behulp-van:..
Plaats::
Oorzaak-van::
Typisch-voorbeeld::
Naam::

 

Ook de Pisa-benadering kan geïllustreerd worden met de analyse van de entry voor ‘piton’ (de equivalent voor het Italiaanse ‘chiodo’). Het schema voor objekten van dit type (INSTRUMENT) bevat ook enkele van de kenmerken die al voor substanties werden genoemd. De waarden daarvan zouden dan ingevuld zijn. Het lemma

 

CHIODO - ATTREZZO IN METALLO DEGLI ALPINISTI

 

zou geheranalyseerd worden door de volgende features van het schema in te vullen:

Naam: CHIODO
Funktie: Gebruikt-als: ATTREZZO
  Gebruikt-door: ALPINISTI
Eigenschap: Substantie: METALLO

Als we dit resultaat vergelijken met de heranalyse die met de Bochum-methode bereikt wordt, dan merken we dat sommige kenmerken, zoals ‘Gebruikt-door’, direkt (als een woord) in de analyse volgens de Bochum-methode voorkomen. Andere features, zoals ‘Substantie’ zouden afgeleid kunnen worden uit de definitie van ‘metallo’. In het algemeen kunnen we stellen dat beide benaderingen vergelijkbare resultaten opleveren.

3.2 Andere systemen die een heranalyse in termen van kenmerk-strukturen geven (alleen grammatikaal-semantische kenmerken)

Enkele andere machine-woordenboeken leveren semantische kenmerken. Van deze zijn met name de systemen die door enkele groepen uit het Eurotra-projekt ontwikkeld zijn interessant en relatief goed uitgewerkt. Anderzijds zijn sommige analyses van semantische kenmerken voor automatisch vertalen tamelijk oppervlakkig en bevatten ze vnl. kenmerken van syntak-

[pagina 356]
[p. 356]

tisch-semantische aard. Typische kenmerken zijn aldus ‘LEVEND’, ‘MENSELIJK’, ‘ABSTRACT’, of casus-kenmerken in representaties van thematische rollen, zoals ‘AGENS’, ‘DOEL’, ‘THEMA’, ‘PLAATS’ enz. Kenmerken van dit type worden typisch gebruikt voor syntaktische disambiguering van zinnen, het bepalen van anaforische relaties enz. Hun rol moet dus niet gezien worden als een bijdrage aan de semantische analyse van het begrijpproces. Wat in de huidige kontekst relevant is, is dat hun formaat niet verschilt van het formaat van een semantisch kenmerk-systeem dat in een breder perspektief ontwikkeld zou kunnen worden.

4 Een diskussiekader voor notationele semantische standaarden

Gebaseerd op algemeen-semantische overwegingen m.b.t. de betekenis van uitdrukkingen kunnen enkele gevolgen voor de representatie en het coderen van woordbetekenissen opgesteld worden. Het coderen van woordbetekenisinformatie moet gegeven worden in termen van een semantische codeer-‘taal’ of schema. Dit systeem voor semantische representaties noemen we het semantische notatie-schema. De expressiemogelijkheden m.b.v. het notatieschema moeten zowel representaties omvatten voor enkelvoudige betekenisdragende uitdrukkingen als notaties voor het samenstellen van complexe betekenisdragende uitdrukkingen uit de elementaire delen.

 

Dit semantische notatie-schema nu wordt gebruikt om representaties van de verklaringen van woordbetekenissen uit het woordenboek op te zetten. We zullen aannemen dat een semantische verklaring de vorm aanneemt van een paar p, q waar p het trefwoord of een zin of woordgroep rond een trefwoord representeert (b.v. de zin ‘iemand geeft iets aan iemand’ of de woordgroep ‘iets aan iemand geven’ voor het trefwoord ‘geven’) en q de verklaring of de semantische eigenschap voor p.

 

We kunnen dan vier soorten semantische notatie-schema's onderscheiden voor representaties van q:

 

1.q wordt weergegeven door een kombinatie van woorden, nl. een concatenatie van woorden uit de taal zelf, eventueel met nummers om de lezingen van de gebruikte woorden te onderscheiden. Dit is typisch het geval in monolinguale woordenboeken, zoals LDOCE en COBUILD, waar de semantische informatie wordt weergegeven door definities en verklaringen uit de taal zelf.
2.De betekenis wordt weergegeven door middel van woorden uit een andere (doel)taal, eventueel geïndexeerd om lezingen te onderscheiden en de samenstelling is concatenatie. Dit is het geval in het bilinguale woordenboek.
3.De symbolen in het semantische notatieschema zijn kenmerken, rollen, labels, indikatoren, semantische eenheden enz. die verwijzen naar semantische termen. Hun samenstelling leidt ofwel tot
[pagina 357]
[p. 357]
(a)sequentiële reeksen ervan of
(b)tot patronen, zoals kenmerkstrukturen in matrix-vorm, kenmerkgrafen enz. of verzamelingen ervan. Kenmerkstrukturen worden gebruikt in woordenboeken die de betekenis weergeven in termen van kenmerken (features), soorten, typen enz. In het geval van een ingewikkelder samenstellingsstruktuur is een formele definitie van de mogelijke vormen noodzakelijk.
4.Een alternatief voor de definitie van kenmerkstrukturen is het gebruik maken van representaties in een logische calculus. Het voordeel hiervan is dat de struktuur van de uitdrukkingen goed gedefinieerd is en hun representatie helder en inzichtelijk is.

 

Als men er aan vasthoudt dat voor het woordenboek de uitdrukkingen van de semantische metataal (nu in de vorm van formeel-logische uitdrukkingen) alleen aan losse woorden toegekend worden, zullen er expressies in de calculus nodig zijn die, in de meeste gevallen, termen voor klassen of eigenschappen zijn, omdat in de gewone interpretatie van logische expressies beschrijvende termen met woorden combineren. Een geschikt middel om eigenschapstermen of klasse-termen te vormen is in dit geval de eigenschapsof klasse-abstraktie over sententiële vormen, zoals gebruikelijk in calculi met lambda-abstraktie (zie bv. Bierwisch 1983).

 

Het moge duidelijk zijn dat voor een heranalyse van bestaande woordenboekdefinities standaarden nodig zijn: van bovengenoemde notatie-schema's voldoet de eerste in de lexikografische praktijk, mits er afspraken zijn m.b.t. de inhoud van metatalige semantische expressies als ‘impliceert’, ‘is een hyponiem’ e.d.

Voor de semantiek in NTV-systemen lijken kenmerkstructuren, die ook voor andere niveaus van linguïstische descriptie worden gebruikt, het aangewezen notatie-schema.

[pagina 358]
[p. 358]

Substance

FUNCTION:
 
  USED-FOR:
  USED-IN:
  USED-AS:
  USED-BY:
 
PROPERTY:
 
  NATURE:
  STRUCTURE:
  ORIGIN:
  STATE:
 
  TASTE:
  SMELL:
  COLOUR:
  SHAPE:
  ASPECT:
 
  LACKING:
 
  SIMILAR-TO:
 
CONSTITUENCY:
 
  CONSTITUTED-BY:
  MAIN:
  MUCH:
 
  CONSTITUENT-OF:
  MAIN:
 
SOURCE:
 
  DERIVED-FROM:
  PRODUCED-BY:
  PRODUCED-BY-MEANS-OF
 
LOCATION:
 
CAUSE-OF:
 
TYPIC-EXAMPLE:
 
NAME:  
 
Fig.: Example of the template for SUBSTANCE Nouns.

[pagina 359]
[p. 359]

Bibliografie

Bierwisch, Manfred, 1983. Konzeptuelle Repräsentation lexikalischer Einheiten. In: Ruzicka, Rudolf en Wolfgang Motsch (eds.): Untersuchungen zur Semantik (Studia Grammatica Bd. 22), pp. 60-100.
Hellwig, Peter, 1977. Dependenzanalyse und Bedeutungspostulate - eine Alternative zur generativen Transformationsgrammatik. In: Linguistische Berichte 51, pp. 32-51.
Hellwig, Peter, 1977. Ein Computermodell für das Folgern in natürlicher Sprache. In: Peter Eisenberg (ed.): Semantik und künstliche Intelligenz. Beiträge zur automatischen Sprachbearbeitung II. Berlin: de Gruyter pp. 59-85.
Hellwig, Peter, 1978. Logisch-funktionale Sätze natürlicher Sprache im Rahmen eines automatischen Deduktions-Systems. In: Proceedings of the 12th International Congress of Linguists. Insbruck. (Insbrucker Beiträge zur Sprachwissenschaft) pp. 589-591.
Hellwig, Peter, 1978. Formal-disambiguierte Repräsentation. Vorüberlegungen zur maschinellen Bedeutungsanalyse auf der Grundlage der Valenzindee. Stuttgart: Hochschul-Verlag.
Hellwig, Peter, 1980. PLAIN - A Program System for Dependency Analysis and for Simulating Natural Language Inference. In: Leonard Bolc (ed.) Representation and Processing of Natural Language. Wien: Hanser; London: Macmillan pp. 271-376.
Jackendoff, Ray, 1990. Semantic Structures. Cambridge, Mass. MIT Press.
Boguraev, Brian en Ted Briscoe (ed.), 1989. Computational Lexicography for Natural Language Processing. London: Longman.
Calzolari, Nicoletta en Antonio Zampolli, 1989. Lexical Databases and Textual Corpora: a trend of convergence between Computational Linguistics and Literary and Linguistic Computing. In: Proceedings of the ALLC/ACH Conference in Toronto, Oxford University Press.
Pustejovsky, James (ed.), 1990. Semantics in the lexicon. Dordrecht: Kluwer, 1990.
voetnoot*
Vertaling: Pim van der Eijk (Eurotra NL, Utrecht)

eind1
Acquilex is een Esprit BRA-projekt dat tot doel heeft semantische informatie uit verschillende machineleesbare woordenboeken samen te brengen in één gemeenschappelijke lexikale kennisbank.
eind2
Dit voorbeeld is ontleend aan N. Calzolari ‘Representation of semantic information in Acquilex’ (Eurotra-7 document 9/6 chapter 3). Ter verduidelijking wordt dit voorbeeld hier voluit gegeven.


Vorige Volgende

Footer navigatie

Logo DBNL Logo DBNL

Over DBNL

  • Wat is DBNL?
  • Over ons
  • Selectie- en editieverantwoording

Voor gebruikers

  • Gebruiksvoorwaarden/Terms of Use
  • Informatie voor rechthebbenden
  • Disclaimer
  • Privacy
  • Toegankelijkheid

Contact

  • Contactformulier
  • Veelgestelde vragen
  • Vacatures
Logo DBNL

Partners

Ga naar kb.nl logo KB
Ga naar taalunie.org logo TaalUnie
Ga naar vlaamse-erfgoedbibliotheken.be logo Vlaamse Erfgoedbibliotheken

Over dit hoofdstuk/artikel

auteurs

  • Helmut Schnelle

  • Peter Hellwig


vertalers

  • Pim van der Eijk


taalkunde

  • Woorden (lexicografie)

  • Betekenis (semantiek)