Skiplinks

  • Tekst
  • Verantwoording en downloads
  • Doorverwijzing en noten
Logo DBNL Ga naar de homepage
Logo DBNL

Hoofdmenu

  • Literatuur & taal
    • Auteurs
    • Beschikbare titels
    • Literatuur
    • Taalkunde
    • Collectie Limburg
    • Collectie Friesland
    • Collectie Suriname
    • Collectie Zuid-Afrika
  • Selecties
    • Collectie jeugdliteratuur
    • Basisbibliotheek
    • Tijdschriften/jaarboeken
    • Naslagwerken
    • Collectie e-books
    • Collectie publiek domein
    • Calendarium
    • Atlas
  • Periode
    • Middeleeuwen
    • Periode 1550-1700
    • Achttiende eeuw
    • Negentiende eeuw
    • Twintigste eeuw
    • Eenentwintigste eeuw
Riskante gewoonten en zorg voor eigen welzijn (1963)

Informatie terzijde

Titelpagina van Riskante gewoonten en zorg voor eigen welzijn
Afbeelding van Riskante gewoonten en zorg voor eigen welzijnToon afbeelding van titelpagina van Riskante gewoonten en zorg voor eigen welzijn

  • Verantwoording
  • Inhoudsopgave

Downloads

PDF van tekst (2.97 MB)

XML (1.60 MB)

tekstbestand






Genre

non-fictie

Subgenre

non-fictie/sociologie


© zie Auteursrecht en gebruiksvoorwaarden.

Riskante gewoonten en zorg voor eigen welzijn

(1963)–I. Gadourek–rechtenstatus Auteursrechtelijk beschermd

Vorige Volgende
[pagina 385]
[p. 385]

2.8 Verdere analyse

Met het opstellen van de basismatrijs van correlaties waren de voorbereidende bezigheden beëindigd en kon men tot een verdere analyse der gegevens overgaan. Zoals in de meeste ecologische studies, stond bij ons onderzoek naar de spreiding van gewoonten en houdingen bij de Nederlandse bevolking de vraag naar de wetenschappelijke verklaring van de variabiliteit van de bestudeerde eigenschappen in het centrum der belangstelling. De meest voor de hand liggende ‘verklaring’ werd gezocht in het ‘samengaan’ van twee of meerdere verschijnselen; de spreiding van een eigenschap (b.v. de intensieve rookgewoonten) valt samen met de spreiding van een ander kenmerk (b.v. de subcategorieën van ‘geslacht’, d.w.z. ‘mannen’ en ‘vrouwen’) of een gehele reeks van kenmerken.

Allerlei alternatieve statistische methoden boden zich aan voor een eventuele toepassing. Zoals in de voorafgaande paragraaf vermeld, deed de angst voor de mogelijke interveniërende (d.w.z. de statistische relatie verstorende) invloeden ons naar de techniek zoeken die de maximale informatie zou benutten, die althans met alle bij onze analyse betrokken variabelen rekening zou houden. De factoranalyse leek in dit verband de aangewezen werkwijze te zijn.

De keuze van een adequaat factoranalytisch procédé werd ons vergemakkelijkt door het feit dat op verzoek van prof. Dr. B.J. Kouwer door de medewerkers van het Mathematisch Instituut te Groningen een programma voor de elektronische bewerking van factoranalyse (voor de zebra) was opgesteld waarvan we gebruik konden maken bij de bewerking van onze gegevens. Professor Kouwer verkoos voor de programmering H.F. Kaisers Varimax-methodeGa naar voetnoot1. Zoals reeds de naam aanduidt, is deze gebaseerd op het principe dat een correlatiematrijs tot een minimaal aantal dimensies wordt gereduceerd die de maximale variantie van de variabelen ‘verklaren’. Daar het zo verkregen model, bestaande uit een beperkt aantal dimensies, optimale eigenschappen heeft, is de oplossing uniek (d.w.z. zijn er geen alternatieve oplossingen bij de toepassing van deze methode mogelijk) en bezit daardoor een hogere objectieve waarde dan de meeste andere methoden van factoranalyse en van de rotatie waarbij zowel het aantal als ook de aard en de ligging der dimensies subjectief worden bepaald. Het principe van het zoeken naar de maximale variantie wordt ook bij de rotatie van de factoren toegepast: hierdoor

[pagina 386]
[p. 386]

verkrijgt men factoren die gemakkelijker te interpreteren zijn daar de verschillen tussen de hoge en lage ladingen tot de hoogste waarden zijn opgevoerd.

In Tabel 2.8.1 zijn de resultaten van de factoranalyse neergelegd. Al heeft men hier machinaal een groot aantal factoren geëxtraheerd (10 in totaal), men dient te bedenken dat de residuwaarden afnemen met elke

Tabel 2.8.1 Factoranalyse van de 34 variabelen uit de basis correlatie matrix
Table 2.8.1 Factor analysis of the 34 variables of the Basic Correlation Matrix

Factoren
Factors
Varia-
bele
Variable
I II III IV V VI VII VIII IX X
1 +440 -634 +046 -313 +051 +182 -087 -040 -007 -009
2 +274 -051 -401 +434 -248 +168 +293 +233 +024 +153
3 -048 +355 +520 +042 -018 +499 -038 -049 +116 +153
4 -049 +182 +606 -118 +018 -183 +263 -098 +044 +070
5 +335 -357 +283 -299 +012 +188 +195 +042 +019 +180
6 +441 +282 +087 -198 -062 +016 +207 +203 +125 +107
7 +166 +259 +302 -267 +189 -025 +131 -190 -011 -385
8 +186 +225 -075 +280 -084 +691 -061 -085 +078 +157
9 -239 -076 +448 +534 +030 +072 +071 +124 +025 +054
10 +037 -222 +397 +456 +201 -253 +094 +185 -071 -060
11 +161 +157 +369 +155 -055 +179 +099 +069 -050 -076
12 -492 -439 +056 +242 +368 +085 +096 +159 -028 +003
13 -417 +682 -032 +165 +010 -100 +059 +078 -080 +072
14 +227 +025 -196 +197 +139 -225 -255 -048 +610 +004
15 +116 -099 +146 +111 +149 -222 -100 -120 +495 +309
16 -326 +350 +110 -156 +046 -195 +125 +270 -081 +303
17 +451 -121 +049 +379 -266 +028 -161 -005 +104 -137
18 -291 +272 -032 -074 -021 +114 -348 -056 -003 +067
19 +425 -029 +390 +008 -147 +007 +120 +035 +037 +073
20 -069 -197 +217 +418 +094 -229 +047 -132 -130 -207
21 +262 +258 -222 -045 +440 -097 +215 -090 -023 +120
22 +404 +066 +039 +142 +475 -059 -190 -133 -192 +297
23 +050 +238 -164 +029 -360 -307 -029 +074 +036 +188
24 +498 +154 -081 +015 +479 -119 -005 +004 -078 +195
25 +354 +317 +008 +012 +251 +044 -183 +331 -030 -381
26 +310 +164 -133 -044 +265 +139 -149 +492 -056 -244
27 +191 -009 -021 +135 +083 +039 -219 -154 -524 +240
28 +062 +005 -333 +188 +018 +072 +184 -289 -172 +083
29 +007 +201 -062 +030 +071 +065 +358 =483 +067 -259
30 -043 +235 -304 +292 +120 +115 +207 -105 +130 -197
31 -591 -320 -184 -041 +322 +182 +044 +066 +038 +038
32 -415 -051 -072 -197 +395 +262 +215 +131 +258 +083
33 -312 -016 +099 -082 -277 -019 -190 +075 -039 +015
34 -242 +153 +253 +034 +194 +099 -548 -217 +058 -056

[pagina 387]
[p. 387]

nieuwe factor en dat de eerst geëxtraheerde factoren voor de interpretatie belangrijker zijn dan de later geëxtraheerde factoren.

De som van de waarden langs de hoofddiagonaal daalde van 34 bij de eerste factor tot 30,790 bij de tweede factor, 28,401 bij de derde factor, 26,220 bij de vierde tot 17,569 bij de tiende factor.

Tabel 2.8.2 Varimax-rotatie van de negen factoren
Table 2.8.2 Results of the rotation of nine factors according to Varimax procedure

I II III IV V VI VII VIII IX Σv2
1 -13 -838 -43 -107 +69 -82 +33 +111 -31 0,742
2 +157 +40 -553 +52 +47 +161 +536 -83 -21 0,658
3 -22 +75 +296 -2 -65 +730 -188 +33 -13 0,667
4 +79 +61 +669 +218 -65 +126 +48 -53 +30 0,531
5 -24 -587 +252 -41 +23 +117 +219 +89 -70 0,485
6 +265 -17 +231 -237 +238 +187 +349 +156 +74 0,423
7 +68 -28 +497 -102 +242 +112 -55 -99 -16 0,347
8 +36 -15 -346 -164 +91 +700 -47 -143 -42 0,671
9 -111 +117 +19 +638 -176 +328 -8 +50 +34 0,576
10 +9 -46 +75 +722 +97 -4 +93 +138 +51 0,569
11 +156 -6 +168 +180 +44 +400 +73 +58 -86 0,263
12 -653 -45 -131 +453 -112 -79 -25 +48 -48 0,675
13 -29 +809 +110 -8 -0 +109 -73 -37 -81 0,693
14 +112 +8 -212 -19 +196 -73 -63 +14 +730 0,639
15 +28 -120 +97 +161 +64 -34 -66 -31 +580 0,397
16 -123 +464 +313 -25 -53 -86 +76 +208 -109 0,400
17 +462 -231 -302 +195 +15 +199 +60 +27 +178 0,472
18 -61 +274 -28 -194 -115 +89 -398 +77 -12 0,303
19 +343 -279 +245 +133 +52 +232 +188 +79 +34 0,372
20 +41 -14 -12 +570 -3 -88 -69 -153 -7 0,363
21 -5 +114 +76 -117 +592 -88 +128 -180 +36 0,444
22 +117 -136 -18 +167 +625 -3 -238 -11 -27 0,509
23 +380 +288 -62 -115 -137 -175 +126 +38 +84 0,318
24 +109 -77 +37 +8 +708 -56 +21 +32 +51 0,528
25 +139 +110 -20 -79 +473 +170 -0 +380 +25 0,436
26 -19 +34 -159 -141 +438 +121 +109 +483 -46 0,500
27 +212 -94 -159 +129 +247 -35 -280 -50 -414 0,410
28 +19 +31 -261 -23 +142 -47 +69 -426 -156 0,303
29 -24 +86 +154 -86 +118 +105 +67 -592 +32 0,420
30 -111 +290 -237 -23 +181 +141 +140 -307 +114 0,333
31 -741 +20 -148 +52 -162 -138 -96 -21 -45 0,631
32 -717 +76 +104 -133 +5 +80 +79 +13 +111 0,574
33 +9 +109 +25 -26 -404 -37 -164 +155 -73 0,234
34 -79 +92 +81 +55 -16 +164 -687 +74 +128 0,545
                  ΣΣv2=16,431
                     
Σf2 2,258 2,429 1,945 1,898 2,250 1,714 1,460 1,266 1,209  
                  ΣΣf2=16,429
                     
%: 6,64+ 7,14+ 5,72+ 5,58+ 6,62+ 5,04+ 4,29+ 3,72+ 3,56=48,32

[pagina 388]
[p. 388]
In Tabel 2.8.2 vinden we dan de resultaten van het roteren van de factoren volgens Kaisers Varimax-techniek. Zoals in de tabel van factoren, duiden de getallen in de eerste kolom de variabelen aan in dezelfde volgorde als in de Basis Correlatie Matrix. De sommen in de laatste kolom en in de laatste regel geven de ‘verklaarde’ variantie aan. Het percentage van de verklaarde variantie wordt verkregen indien we deze verklaarde variantie delen door de som van ‘communalities’; voor de 34 factoren bedraagt deze 34. De verklaarde variantie is dan

illustratie

Met andere woorden, wij zijn erin geslaagd factoren te vinden die met bijna de helft van de geconstateerde variabiliteit van de onderzochte kenmerken in verband kunnen worden gebracht.

Beperken we echter onze analyse, om de redenen zojuist vermeld, tot b.v. de eerste vier factoren, dan verkrijgen we een veel lager percentage, nl.

6,6% + 7,1% + 5,7% + 5,6% = 25,0%.
Waarschijnlijk is het aan de heterogeniteit van de gekozen variabelen te wijten dat er zo weinig eenheid kon worden gevonden in ons onderzoekmateriaal.

Richten we onze aandacht in plaats van op de factoren op de onderzochte variabelen, dan bemerken we dat b.v. het geslacht, de intensiteit van roken, het kerkgenootschap, het inkomstenniveau, de leeftijd, de burgerlijke staat, de houding t.o.v. het roken, en de woonplaats betrekkelijk hoge ladingen vertonen, terwijl de frequentie van contacten met de dokter, met de communicatiemedia, de intensiteit van koffiegebruik, de normbeleving, de verandering in het drinkpatroon en nog andere tot de weinig ‘verklaarde’ of ‘verklarende’ variabelen behoren in onze matrijs van 34.

Beschouwen we de ladingen van de afzonderlijke factoren, dan bemerken we dat de factoranalyse van het onderzoeksmateriaal zeker niet geheel zinloos is geweest. Factor I vertoont de volgende hogere ladingen:

Factor I

31 Woonstreek: Noord-Zuid -.741 23 normbeleving .380
32 Kerk-
genootschap B
-.717 19 Snoep-
gewoonten
.343
12 Kerk-
genootschap A
-.653 6 Grootte van woonplaats .265
17 Houding t.o.v. drinken .462 27 Optimisme .212

[pagina 389]
[p. 389]

Het valt niet moeilijk in deze factor de verdeling van ons land in de twee voornaamste geografische en culturele onderdelen te herkennen. De eerste drie ladingen behoeven nauwelijks commentaar, behalve het feit dat kerkgenootschap B (Katholiek-Protestant continuüm) een hogere lading heeft dan A (het veronderstelde ‘kerkelijkheid-onkerkelijkheid’ of ‘kerkelijk gezag’ continuüm). Zowel ‘normbeleving’ als ‘houding t.o.v. het drinken’ kan in zinvol verband met de wereldbeschouwing worden gebracht. De snoepgewoonten schijnen daarentegen bij het rooms-katholieke volksdeel in het Zuiden niet met dezelfde regelmaat voor te komen als in het nietkatholieke Noorden. De veel lagere lading van variabele 6 (grootte van de gemeente waarin men woont) schijnt op de geografische omstandigheden te berusten, nl. hogere agglomeratie van de bevolking ten noorden van de rivieren in de grote steden met meer dan 100.000 inwoners. Het verband tussen de wereldbeschouwing en de optimistische mentaliteit is reeds in vroegere studies gesignaleerdGa naar voetnoot1.

Niet slechts de variabelen met de opvallend hoge, immers ook de variabelen met opvallend lage ladingen laten een zinvolle interpretatie toe. Zoals verwacht, vertonen het geslacht, de inkomsten, de aard van het werk (buiten- of binnenwerk), het aantal werkuren of de frequentie van bezoek aan de dokter bijzonder lage ladingen; geen van de bovenvermelde variabelen werd immers verondersteld met de sociaal-culturele verdeling van ons land in de twee belangrijkste subgroepen te correleren. Niet verwacht, maar desondanks zinvol, is het ontbreken van een verband tussen Factor I en onze variabele 10, die de intensiteit van cultuuraanvaarding (de mate van het geïnvolveerd-zijn-in) tracht te meten. De betrekkelijke onafhankelijkheid van deze schaal van de beide variabelen ‘Kerkgenootschap’ en ‘Verdeling Zuid-Noord’ rechtvaardigt o.i. de constructie hiervan. Eveneens opvallend is de lage lading van alle variabelen betrokken op het roken en de vermoede gevolgen van het roken. Terwijl de houding t.o.v. het drinken een betrekkelijk hoge lading kent, ontbreekt het verband tussen het roken en Factor I bijna geheel.

Gaan we thans van Factor I naar de tweede factor van onze tabel, dan kan ook deze betrekkelijk gemakkelijk worden geïdentificeerd. Hoge ladingen vertoonden de volgende variabelen:

Factor II

1 Geslacht: man-vrouw -.838 30 Drinkpatroon-
verandering
.290
13 Intensiteit roken .809 23 Normbeleving .288
5 Aard van het werk -.553 19 Snoep-
gewoonten
-.279
16 Intensiteit drink-
gewoonten
.464 18 Koffiegebruik .274

[pagina 390]
[p. 390]

Indien we beseffen dat de correlatie tussen het roken en het geslacht tot de hoogste behoorde op onze basismatrijs, en dat de vrouwen (huisvrouwen) voornamelijk de binnenwerkers zijn, dan zal het ons niet moeilijk vallen deze Factor II te zien als het sociale equivalent van het man-zijn in onze samenleving. Vandaar dat zowel het roken als het drinken positief is geladen hiermee, terwijl het snoepen negatieve en het koffiedrinken positieve ladingen vertonen. Dat mannen er een meer individualistisch normenstelsel op na houden, terwijl de vrouwen vooral het overtreden van seksuele delicten afkeuren, hebben wij door middel van de analyse der correlaties kunnen vaststellen. Eveneens in overeenstemming met onze hypothesen kon het verband met drinkpatroonverandering worden geinterpreteerd: in de puberteitsjaren gaan vooral de jonge mannen zich weleens aan drank te buiten teneinde hun volwassen rol te accentueren; na eigen huwelijkssluiting valt er een vermindering van alcoholgebruik waar te nemen. Bij vrouwen hebben we deze cyclus niet kunnen constateren.

Moeilijker dan de beide eerste factoren was Factor III te interpreteren. De hoogste ladingen zijn hier als volgt verdeeld:

Factor III

4 Opleiding: lagere - hogere .669
2 Leeftijd: lagere - hogere -.553
7 Migratie-index: laag - hoog .497
8 Gezinsbinding: laag - hoog -.346
16 Intensiteit drinkgewoonten .313
17 Houding t.o.v. het drinken -.302
3 Inkomsten .296
28 Inkomstenverandering -.261
19 Snoepgewoonten .245
6 Grootte van de woonplaats .231

Het gaat hier om de groepering van jongere ongehuwde mensen met meer opleiding, die (mogelijk als gevolg hiervan) verhuisden, zodat ze thans overwegend in grote steden wonen; hiermee gaat samen zowel meer alcoholgebruik als een meer tolerante houding t.o.v. het drinken en - dit in tegenstelling tot het door correlatie-analyse gesignaleerde negatief verband - tevens het snoepen. Wij menen dat we hier met een algemeen emancipatieverschijnsel te maken hebben, met de tweede generatie (of beter: generatie jongeren) die, zonder nog tot eigen gezinsvorming over te gaan, door opleiding en migratie naar de stedelijke samenleving zich van de generatie ouders losrukte.

Factor IV geeft eveneens nog een zinvol resultaat te zien; onze werkwijze volgend, verkrijgen we hier:

[pagina 391]
[p. 391]

Factor IV

10 Intensiteit cultuuraanvaarding: laag - hoog .722
9 Sociale participatie: laag - hoog .638
20 Sociale instelling: asociaal - behulpzaam .570
12 Kerkgenootschap A: laag gezag - hoog gezag .453
6 Gemeentegrootte: klein - groot -.237
4 Opleiding: laag - hoger .218

Bij de constructie van onze schalen hebben we niet durven hopen dat deze schalen zelfs door de factoranalyse naar voren zouden worden gebracht. Met de ‘cultuuraanvaardingschaal’ bleek dit wel het geval. We menen in deze Factor IV de mate van maatschappelijke binding te zien; zowel kerkgenootschap (gerangschikt naar de mate van het collectieve gezag!) en opleiding waren reeds door vroegere onderzoekingen in verband gebracht met participatie. De samenhangen tussen de cultuuraanvaarding en het participatiecomplex, evenals die met de sociale instelling t.o.v. de medemensen, is echter aanwinst, die theoretische verklaring vereist. De oudere theorie omtrent het verlies van sociale bindingen in de steden komt in de hogere lading met variabele 6 om de hoek kijken.

Aangemoedigd door de zinvolle interpretatie van de ladingen van de voortgezette factoranalyse hebben wij ook nog aan andere factoren aandacht geschonken:

Factor V

24 Persoonlijkheidsevenwicht: geen klachten - klachten .708
22 Bezorgdheid: geen zorgen - vele zorgen .625
21 Tevredenheid: tevreden - ontevreden .592
25 Traumatische ervaringen: geen - veel .473
26 Jeugdherinneringen: prettig - onprettig .438
33 Frequentie doktersbezoek: vaak - nooit -.404

We treffen een opvallende consistentie aan in de richting der ladingen en tevens in de semantische aard van de betrokken variabelen. Want dit zijn de subjectieve variabelen die we bij ons onderzoek hebben ingelast teneinde het zich wel-bevinden der mensen te kunnen meten. We aarzelen dan ook niet om deze Factor V aan te duiden als: de mate van psychisch evenwicht of ‘tevredenheid’. De hoge ladingen van beide ‘jeugdvariabelen’ zijn interessant: zowel de psychiatrie als ook de ontwikkelingspsychologie en de sociale psychologie leggen, zoals bekend, de nadruk op de invloed van de jeugdjaren op de persoonlijkheidsvorming. Alweer zijn ook de ontbrekende ladingen niet zonder betekenis: het valt b.v. op dat nauwelijks één der objectieve factoren met de ‘batterij’ in verband kan worden gebracht. Tabel 2.8.2 geeft nog de volgende twee ladingen weer:

7 Migratie-index: o - meerdere keren .242
6 Grootte van de woonplaats: klein - groot .238

[pagina 392]
[p. 392]

Deze ladingen suggereren dat er inderdaad minder ‘tevredenheid’ bestaat bij migranten en dat de subjectieve klachten ook in de grote steden frequenter voorkomen.

We kunnen kort zijn met de bespreking van de overige factoren. Factor VI bundelt samen: inkomsten, gezinsbinding, contact met massacommunicatiemiddelen en sociale participatie. Er is enige aanleiding om in deze factor de ‘maatschappelijke status’ te zien: gehuwden hebben immers hogere inkomsten dan ongehuwden (kinderbijslag) en kunnen zich makkelijker een radio, een krant of weekbladen permitteren dan ongehuwden en mensen met lagere inkomsten. Uit vorige onderzoekingen weten we dat participatie aan het verenigingsleven met hogere sociale status gepaard gaat (A Dutch Community, blz. 421).

Factor VII bindt op nog zinvolle wijze te zamen de hogere leeftijd met korte werkuren en het wonen in de kleine gemeenten. Wellicht gaat het hier om ‘gepensioneerden’ of ‘bejaarden’. Opvallend is het lage koffiegebruik (door hartziekten?), aangeduid door de hoge lading van variabele 18.

In de hieropvolgende Factor VIII zijn op nog steeds zinvolle wijze de drie ‘veranderingsvariabelen’ gekoppeld: inkomstenvermeerdering gaat met meer roken en drinken gepaard.

In de laatste geroteerde Factor IX treedt tenslotte de gezochte houding ten opzichte van het roken naar voren; deze is hier gekoppeld aan de aanvaarding van de kennis dat de rookgewoonten van invloed zijn op het ontstaan van longkanker. Het valt op dat de variabele optimismepessimisme in de verwachte richting geladen blijkt te zijn: optimisten aanvaarden immers de kennis niet en staan ook minder afwijzend tegenover het roken dan pessimisten.

 

We behoeven niet ontevreden te zijn over de methodologische evaluatie van de toepassing van factoranalyse op onze gegevens. Zelfs de factoren die geëxtraheerd werden uit de zeer geringe residuwaarden van de correlatiematrix bleken nog semantisch zinvol te zijn en in overeenstemming met de verwachtingen.

Er zijn echter ook bezwaren tegen een zo brede en heterogene opzet van factoranalyse naar voren te brengen. Zoals reeds vermeld, is de ‘verklaarde’ variantie niet al te hoog. Dit bevestigt het vermoeden dat de deelonderzoekingen, afzonderlijk gericht nu eens op de rookgewoonten, dan weer op de drinkgewoonten en andere afhankelijke variabelen wellicht meer licht zullen werpen op de causale samenhangen.

Een tweede bezwaar treft juist de synthetische denkwijze die bij de factoranalyse wordt toegepast. Het is prettig om te weten, dat formele sociale participatie, kerkgenootschap en cultuuraanvaarding een com-

[pagina 393]
[p. 393]

plexe factor vormen. Onze belangstelling gaat echter vaak naar deze variabelen afzonderlijk: hoe verklaren we de variatie in participatie en cultuuraanvaarding afzonderlijk?

Dergelijke vragen kunnen deels worden beantwoord indien we een meer homogene reeks variabelen dan de totale matrix in een nieuw factoranalytisch schema opnemen. Als voorbeeld kunnen dienen de subjectieve variabelen, die pas in de vijfde kolom (factor V) van onze Tabel 2.8.2 aanzienlijk hoge ladingen vertonen.

Ter vergelijking met de tot dusver gevolgde methode stellen we een nieuwe matrijs van correlaties op, dit keer echter gebaseerd op de afzonderlijke vragen en bewerkt niet door middel van het ‘produktmoment’ maar met behulp van de tetrachorische correlatie.

Het voordeel hiervan is dat deze coëfficiënt dank zij de schattingstabellen makkelijk kan worden vastgesteldGa naar voetnoot1. Teneinde de geschatte waarden te verkrijgen, werden de variabelen in tweedelingen samengetrokken (gedichotomiseerd); daar de tetrachorische correlatie slechts op de niet al te scheve verdelingen mag worden toegepast, trachtten wij bij het dichotomiseren de meest gelijke, nog zinvolle verdeling in twee subcategorieën te verkrijgen. De volgende variabelen werden bij de analyse betrokken:

Vraag no. Specificatie Subcategorieën Variabele no.
12 Werksatisfactie ‘ja’ - de rest 1
16 Angst werkloosheid ‘neen’ - de rest 2
17 Tevredenheid loopbaan ‘tevreden’ - de rest 3
21 Toekomstkansen ‘wel kansen’ - de rest 4
23 Gezondheidssatisfactie ‘tevreden’ - de rest 5
33 Tevredenheid huisvesting ‘tevreden’ - de rest 6
109t/m115 ‘Spanningssymptomen’ geen - de rest 7
116 Zorgen over de dood ‘neen’ - de rest 8
129 Geschokt vertrouwen ‘neen’ - de rest 9
135 Traumatische ervaringen geen - de rest 10
134 Jeugdherinneringen prettig - de rest 11
136-9 Eenzaamheid, doelloosheid geen - de rest 12

De vragennummers corresponderen met de nummering op de vragenlijst in de Bijlage. De specificatie is uiterst beknopt gehouden; men raadplege de oorspronkelijke vragen om de betekenis van de variabelen te vatten.

Teneinde de subcategorieën aan te duiden, hebben we ons van de antwoorden op de oorspronkelijke vragen bediend; indien op de vragen 109

[pagina 394]
[p. 394]

t/m 115 geen positief antwoord werd gegeven, werd de desbetreffende persoon onder de categorie ‘geen’ gerangschikt; alle andere personen zijn voor de schatting van de correlatie onder de categorie ‘de rest’ opgenomen. Op dezelfde wijze is ook de complexe variabele 12 opgebouwd op de positieve antwoorden op de vragen naar eenzaamheid, verveling of doelloosheid van het leven.

Oorspronkelijk hadden we nog de houding t.o.v. de toekomst bij deze analyse willen betrekken (de optimisme-pessimismevariabele no.27 van de Basis Matrix); deze bleek echter bijzonder laag met de overige 12 grootheden te correleren (gemiddelde coëfficiënt was .07) zodat we besloten haar te elimineren. Zoals de Tabel 2.8.3 weergeeft, vertoonden de overige variabelen veel hogere statistische samenhangen:

Tabel 2.8.3 Intercorrelaties van de twaalf subjectieve variabelen
Table 2.8.3 Correlation matrix of 12 subjective variables

1 2 3 4 5 6
Werk-
satisfactie
Work-
satis-
faction
1 1.00 .35 .64 .16 .37 .27
Angst werk-
loosheid
Fear of unemploy-
ment
2   1.00 .20 .14 .17 .13
Tevreden-
heid loopbaan
Satis-
faction with one's own career
3     1.00 .03 .28 .21
Toekomst-
kansen
Percep-
tion of chances
4       1.00 .18 -.10
Tevreden-
heid gezond-
heid
Satis-
faction with one's health
5         1.00 .18
Tevreden-
heid huis-
vesting
Satis-
faction with the housing conditions
6           1.00
Spannings-
symptomen
Symptoms of inner tensions
7            
Zorrgen over de dood
Worries about death
8            
Geschokt vertrouwen
Broken confidence
9            
Trauma-
tische ervaringen
Traumatic experiences
10            
Jeugd-
herinne-
ringen
Evaluation of one's own youth
11            
Eenzaam-
heid enz.
Loneliness, lack of purpose, etc.
12            

Tabel 2.8.3 Intercorrelaties van de twaalf subjectieve variabelen
Table 2.8.3 Correlation matrix of 12 subjective variables

7 8 9 10 11 12 Som
Werk-
satisfactie
Work-
satis-
faction
1 .23 .00 .20 .13 .31 .40 4.06
Angst werk-
loosheid
Fear of unemploy-
ment
2 .11 .00 .06 .09 .22 .17 2.64
Tevreden-
heid loopbaan
Satis-
faction with one's own career
3 .13 .03 .18 .13 .17 .33 3.33
Toekomst-
kansen
Percep-
tion of chances
4 -.02 .11 -.01 -.03 .12 .05 1.95
Tevreden-
heid gezond-
heid
Satis-
faction with one's health
5 .39 .03 .23 .23 .24 .23 3.53
Tevreden-
heid huis-
vesting
Satis-
faction with the housing conditions
6 .11 .03 .14 .14 .17 .06 2.54
Spannings-
symp-
tomen
Symptoms of inner tensions
7 1.00 .34 .33 .30 .30 .32 3.58
Zorrgen over de dood
Worries about death
8   1.00 .08 .22 .18 .24 2.26
Geschokt ver-
trouwen
Broken con-
fidence
9     1.00 .21 .27 .19 2.90
Trauma-
tische erva-
ringen
Traumatic expe-
riences
10       1.00 .47 .18 3.13
Jeugd-
herinne-
ringen
Eva-
luation of one's own youth
11         1.00 .31 3.76
Eenzaam-
heid enz.
Lone-
liness, lack of purpose, etc.
12           1.00 3.48

De cursief gedrukte coëfficiënten zijn naar schatting als significant te beschouwen bij het waarschijnlijkheidsniveau van P < .02Ga naar voetnoot1. De coëfficiën-

[pagina 395]
[p. 395]

ten geven iets hogere waarden aan, daar zij op schattingen berusten. Zij werden echter niet gebruikt om rechtstreeks de causale hypothesen te toetsen, maar slechts als een basis voor verdere ontleding.

Volgens het Varimax-procédé werden door de medewerkers van het Mathematisch Instituut van de R.U. te Groningen alweer de factoren geëxtraheerd en geroteerd. In de volgende twee tabellen zijn de resultaten hiervan samengevat:

Tabel 2.8.4 Factor analyse van de twaalf variabelen betrokken op het zich wel-bevinden der mensen
Table 2.8.4. Factor analysis of twelve subjective variables

Variabele Factor I' Factor II' Factor III'
1 +.713 -.510 +.046
2 +.409 -.348 +.265
3 +.589 -.492 -.166
4 +.148 -.082 +.829
5 +.601 -.077 +.087
6 +.365 -.193 -.482
7 +.602 +.428 -.046
8 +.301 +.573 +.237
9 +.479 +.443 -.254
10 +.509 +.200 -.153
11 +.634 +.251 +.057
12 +.605 +.023 +.129

Vanwege de beperkte doelstelling bij de factoranalyse van de subjective variabelen, besloten we de vierde factor niet meer op te nemen. De rotatie van de verkregen drie factoren liet het volgende zien. (Zie tabel 2.8.5).

 

Waarschijnlijk dank zij de meer homogene aard der variabelen is de ‘verklarende’ waarde van de drie geïdentificeerde factoren hoger dan bij onze analyse van de 34 variabelen uit de Basis Correlatie Matrix. Tegenover 6 à 7% van de ‘verklaarde’ variantie per factor in Tabel 2.8.2, staat 19,8% en 19,4% voor de eerste twee factoren van de analyse der tetrachorische correlatiecoëfficiënten. De ladingen zijn nog hoger en het valt ons dan ook niet moeilijk deze zinvol te interpreteren.

Teneinde onnodig overschrijven te voorkomen, hebben we in Tabel 2.8.5 de hogere ladingen cursief laten zetten. We bemerken dat de Factoren I' en II' in sterke mate complementair zijn: variabelen hoog geladen met Factor I' zijn over het algemeen laag geladen met Factor II' en andersom. Met betrekking tot Factor I' zijn het vooral de satisfactievragen, die hoge ladingen vertonen; hiervan prevaleert alweer de satisfactie met werk of werksituatie over de tevredenheid met andere situaties: huisvesting, gezondheid. Angst dat men werkloos zal worden, is, volgens

[pagina 396]
[p. 396]

Tabel 2.8.5 Rotatie van de drie factoren volgens het varimax-procédé
Table 2.8.5 Varimax rotation of the three factors of table 2.8.4

Variabele:
Variable:
Factor I' Factor II' Factor III'
1. Werksatisfactie
Worksatisfaction
0.864 0.128 -0.086
2. Angst werkloosheid
Fear of unemployment
0.570 0.033 0.180
3. Tevredenheid loopbaan
Satisfaction with one's own career
0.731 0.054 -0.280
4. Toekomstkansen
Perception of chances
0.288 0.044 0.795
5. Tevredenheid gezondheid
Satisfaction with one's own health
0.494 0.362 0.012
6. Tevredenheid huisvesting
Satisfaction with the housing conditions
0.319 0.114 -0.537
7. Spannings-
symptomen
Symptoms of inner tensions
0.128 0.726 -0.066
8. Zorgen over de dood
Worries about death
-0.143 0.621 0.262
9. Geschokt vertrouwen
Broken confidence
0.165 0.476 -0.282
10. Traumatische ervaringen
Traumatic experiences
0.035 0.672 -0.160
11. Jeugd-
herinneringen
Evaluation of one's own youth
0.288 0.621 0.013
12. Eenzaamheid enz.
Loneliness, lack of purpose, etc.
0.434 0.436 0.064
         
Percentage van de totale variantie
Percentage of total variance
19,8% + 19,4% + 10,2% = 49,4%

onze vroegere studie, met de werksatisfactie causaal geliërd zodat de hoge lading (.570) ons niet behoeft te verbazen (zie A Dutch Community, blz. 445). Een andere variabele met een nog betrekkelijk hoge lading (.434) werd verkregen door het samenvoegen van informatie verkregen door middel van drie vragen. Daar één dezer vragen luidde: ‘Verveelt U zich nogal vaak?’, ligt het verband met satisfactie, die voornamelijk door de werkomstandigheden bepaald is, voor de hand.

De tweede factor bindt op een consistente wijze de variabelen te zamen die gebaseerd zijn op het vermelden van negatieve, d.w.z. onprettige en ongewenste, gemoedstoestanden (zoals innerlijke spanningen, angst voor de dood, het zich-ziek-gevoelen) met een aantal variabelen die wellicht in de richting van een verklaring wijzen: onprettige herinneringen aan de jeugd, het beleven van een sterfgeval, echtscheiding of dronkenschap van ouders in de jeugd, het verlies van vertrouwen in mensen die men zelf waardeerde. Indien we Factor I' zien als de algemene satisfactiefactor, dan kan deze Factor II' worden beschouwd als gebaseerd op het ‘zich psychisch wel-bevinden’ in de engere zin. (Men bedenke echter dat sle vragen niet in de situatie van het klinische interview zijn gesteld, doch dechts naast tientallen andere, ‘oppervlakkige’ vragen.)

[pagina 397]
[p. 397]

Een variabele die bijzondere aandacht verdient is no. 12, de complexe variabele gebaseerd op eenzaamheid, doelloosheid van het leven en verveling. Het zijn waarschijnlijk de eerste twee componenten die een hoge lading met Factor I' tot stand brengen. Het ‘zich eenzaam voelen’ en het ‘piekeren’ of het ‘vaak angsten hebben’ kunnen met elkaar in zinvol verband worden gebracht.

Wat Factor III' betreft, hier vinden wij slechts twee variabelen met enigszins hogere ladingen: 4 (toekomstkansen) en 6 (ontevredenheid met huisvesting). Er zijn inderdaad onder onze bevolking vrij veel mensen die ontevreden zijn met hun behuizing, terwijl zij de toekomst met vertrouwen tegemoet treden: de jonggehuwden met de zich uitbreidende gezinnen en hieruit voortvloeiende hoge dichtheid van behuizing (groot aantal mensen per woonvertrek). We vragen ons af of Factor III' niet deze categorie van jongere mensen en de jonggehuwden aanduidt, die door hun jeugd meer toekomstkansen zien.

We menen uit de factoranalyse van de overwegend subjectieve variabelen wellicht de bescheiden conclusie te mogen trekken dat het verantwoord is de satisfactievragen en de vragen met betrekking tot eigen psychische toestand als afzonderlijke variabelen aan de grote matrix toe te voegen (variabelen 21 en 24 in de Basis Correlatie Matrix). Daar de twee factoren naast de subjectieve echter ook enkele meer ‘objectieve’ variabelen omvatten (traumatische ervaringen, geschokt vertrouwen) en daar één der variabelen (no. 12) met beide factoren geladen was, is er aan de hand van de desbetreffende vragen slechts een cumulatieve index opgebouwd, die in de Basis Matrix is opgenomen, zoals op blz. 380 reeds is vermeld.

 

Vergelijken we de resultaten van beide analysen, dan bemerken we een zekere tegenstelling. De bewerking van de subjectieve variabelen heeft o.i. duidelijk de satisfactievragen gescheiden van de vragen die op de Basis Matrix zijn opgenomen onder een algemene term van ‘persoonlijkheidsevenwicht’. Nu laat Factor V van Tabel 2.8.2 ons zien, dat beide zijn geladen in dezelfde richting. Dit suggereert dat de twee variabelen die als afzonderlijke factoren naar voren traden bij het factoranalyseren van subjectieve variabelen, in breder context van 32 variabelen geplaatst een gemeenschappelijke basis blijken te bezitten, d.w.z. in zekere mate dezelfde variabiliteit vertonen ten opzichte van de overige variabelen. De verschillen tussen de beide componenten van de subjectieve variabelen (‘satisfactie’ en ‘persoonlijkheidsevenwicht’) zijn waarschijnlijk kleiner dan de verschillen in de variabiliteit tussen de ‘subjectieve’ en de ‘objectieve’ variabelen (gewoonten, sociologische basisvariabelen). We geven aan deze interpretatie de voorkeur boven de alternatieve conclusie, dat de ladingen van Factor V vanwege de lage residuwaarden van de matrix

[pagina 398]
[p. 398]

toevallig of misleidend zijn. We bemerken immers dat naast de verschillen, beide factoranalysen ook overeenstemming vertonen: de beide ‘jeugdvariabelen’ zijn met de subjectieve kenmerken in verband gebracht zowel door de bewerking van de grote, als van de kleinere matrix.

 

Toch namen we er geen genoegen mee onze bewerking tot de factoranalyse te beperken. Zoals uit het bovenvermelde voorbeeld van subjectieve variabelen moge blijken, geeft de factoranalyse ons weliswaar een goed inzicht in de interne structuur van een geheel complex van kenmerken en eigenschappen, doch betrekkelijk weinig informatie wordt daarentegen gewonnen omtrent de afzonderlijke oorzaken van de variabelen. Daar de meeste van onze variabelen begripsmatig onafhankelijk zijn van elkaar, gaat onze belangstelling uit naar deze variabelen afzonderlijk. Want, om nog even te blijven bij het aangehaalde voorbeeld, we bemerken dat ondanks de betrekkelijk hoge lading door een gemeenschappelijke factor (V) elk van de twee variabelen, ‘satisfactie’ en ‘persoonlijkheidsevenwicht’, is gekenmerkt door een andere patroon van statistische samenhangen. Vergelijken we de regels 21 en 24 in Tabel 2.7.5, dan treffen we vaak verschillende waarden aan in de desbetreffende kolommen. ‘Persoonlijkheidsevenwicht’ blijkt te correleren met geslacht, leeftijd, aard van het werk, het wel of niet aanvaarden van kennis over de oorzaak van de longkanker, snoepgewoonten, optimisme, woonstreek, d.w.z. alle variabelen die geen samenhang met de satisfactie vertonen. Deze laatste, op haar beurt, correleert met de intensiteit van koffiegebruik en de verandering in het rook- en drinkpatroon, die geenszins met de satisfactie zijn gecorreleerd. Wat is de betekenis van deze afzonderlijke reeksen van correlaties? Is het verantwoord om deze te gebruiken bij de poging om de spreiding van beide verschijnselen causaal te verklaren?

In de voorafgaande sectie hebben we gesteld dat het wellicht mogelijk is de correlatiecoëfficiënt causaal te interpreteren indien door middel van het invoeren van een testfactor systematisch de echte verbanden van de schijnverbanden worden gescheiden. Dit is ook de interpretatie die we geven aan de onlangs gevoerde discussie omtrent de toepassing van de significantietoetsen bij het sociaal onderzoek, die door Hanan C. Selvin is uitgeloktGa naar voetnoot1. McGinnis meent dat de niet-experimentele onderzoekopzet wel degelijk tot het toetsen van causale hypothesen kan worden aange-

[pagina 399]
[p. 399]

wend, indien een groter aantal factoren onder controle wordt gebracht. In de termen van onze onderzoekopzet geformuleerd: we zullen slechts dan een correlatiecoëfficiënt causaal gaan interpreteren, indien we een redelijke zekerheid hebben dat alle mogelijk relevante factoren als testfactoren onder controle werden gebracht.

Een absolute zekerheid kan men hieromtrent in een empirisch onderzoek waarschijnlijk nimmer verkrijgen: we kunnen nooit zeker zijn dat een of ander relevante vraag niet werd gesteld, of bij het proces van samentrekken der variabelen in een analytisch schema buiten beschouwing is gelaten. Wel kunnen we, gegeven een bepaalde onderzoekopzet, streven naar de maximale controle van de onderzochte variabelen. Een middel hiertoe vonden we in de combinatie van de partiële analyse van de ‘clusters’ der inter-gecorreleerde samenhangen en de identificatie van deze clusters volgens het procédé door ons vroeger gebruikt (zie A Dutch Community, Deel II). Het is nl. mogelijk alle series van drie variabelen te vinden die op de Basis Matrix significant onderling zijn gecorreleerd. Elke van deze series kan dan door middel van drie partiële correlaties nader worden geanalyseerd. Symbolisch uitgedrukt, we zoeken een serie van variabelen A - B - C op dergelijke wijze samengesteld, dat zowel rAB als rAC en rBC gelijk of groter is dan een corresponderend aan een bepaald niveau van waarschijnlijkheid, dus:

rAB ≥ P rAC ≥ P rBC ≥ P.
Hierna berekenen we partiële correlaties, telkens een der factoren ‘vasthoudend’, d.w.z. telkens zoekend naar het verband in de homogene subgroepen van deze derde factor, dus:
rAB.C en rAC.B en rBC.A.
Zakt de waarde van één der partiële correlaties onder de waarde van het statistische significantieniveau, dan beschouwen we het verband als zijnde van onechte, niet-causale aard; het valt immers te verklaren met behulp van de derde, constant gehouden variabele.

Zoals vermeld, hebben we voor de ad hoc analyse van onze Basis Correlatie Matrix het significantieniveau van P = .05 als uitgangspunt gekozen; volgens de schatting hebben alle correlatiecoëfficiënten van .065 en groter dit niveau behaald. Om echter ons criterium ietwat scherper te stellen, hebben we de waarde van r = .075 als grenswaarde gebruikt: alle coëfficiënten die deze of hogere waarden bekleedden, zouden bij de systematische analyse worden betrokken.

Indien we de Basis Correlatie Matrix raadplegen, bemerken we dat er niet minder dan 426 series van drie significant onderling gecorreleerde variabelen te vinden zijn. Aangezien elk van deze series door middel van

[pagina 400]
[p. 400]

drie partiële correlaties ontleed zou worden, zouden we naast de moeizame arbeid besteed aan de identificatie van de series ook 1275 × de formule voor de partiële correlatie moeten gaan toepassen.

Zoals reeds vermeld, was het een gelukkige omstandigheid dat we bij de bewerking van ons materiaal op de steun konden rekenen van de medewerkers van het Mathematisch Instituut te Groningen en hun outillage. Het is de heer H.J. Burema, assistent van prof. Dr. Ir. A.I. van de Vooren, gelukt, om beide bewerkingen, de identificatie van reeksen (‘clusters’) van gecorreleerde variabelen en hun ontleding door middel van partiële correlatie, in een programma te verenigen voor de elektronische rekenmachine, de zebra. Toen het programma was opgesteld, kon het rekenwerk dat zonder de elektronische rekenapparatuur zeker enkele maanden in beslag zou nemen, binnen een half uur nauwkeurig worden uitgevoerd.

In de hieropvolgende Tabel 2.8.6 vatten we de resultaten van beide bewerkingen samen. In de eerste drie kolommen zijn alle series weergegeven van drie intergecorreleerde variabelen uit de Basis Matrix. Zij zijn gerangschikt in stijgende volgorde zodat ze gemakkelijk kunnen worden geïdentificeerd. De hierop volgende kolommen geven de partiële correlaties weer op die wijze, dat rA.BC de correlatiecoëfficiënt aangeeft tussen B en C indien A wordt ‘vastgehouden’, d.w.z. in de subcategorieën van A; dat rB.AC aangeeft de waarde voor de correlatie tussen A en C bij gelijktijdige controle over de invloed van B, en dat rC.AB tenslotte aangeeft de verandering in de waarde van rAB onder de invloed van C.

Teneinde de betekenis van onze analyse thans te illustreren, richten we onze aandacht op deze Tabel 2.8.6. In de voorafgaande sectie hebben we het geval van onecht verband tussen de intensiteit van het roken en de aard van het werk (het werk buitens- en binnenshuis) geanalyseerd. Beschouwen we de series, beginnende met de variabelen 1 en 5, dan zien we dat ‘geslacht’ aansprakelijk is voor een gehele reeks van schijnverbanden: niet slechts de correlatie tussen het roken en werken buitenshuis, maar ook de samenhangen tussen de aard van het werk en het drinken (variabele 16), de houding t.o.v. het drinken (no. 17), intensiteit van koffiegebruik (no. 18), normbeleving (no. 23) en persoonlijkheidsevenwicht (no. 24) verdwijnen in de afzonderlijk beschouwde groeperingen van mannen en vrouwen. De verbanden met variabelen 19 (snoepgewoonten) en 30 (drinkpatroonverandering) vertonen dezelfde dalende tendens, blijven echter boven het significantieniveau gehandhaafd. Dit laat de interpretatie toe dat de aard van het werk van invloed is op de snoepgewoonten (dat de landarbeiders en landbouwers minder snoepen dan mensen werkend binnenshuis) en op de drinkgewoontenverandering (dat de buitenshuiswerkenden de tendens vertonen het drinken te minderen.

[pagina 401]
[p. 401]

Tabel 2.8.6 Drieledige reeksen van intercorrelaties systematisch geëxtraheerd uit de basis matrix en hun desbetreffende partiële correlaties
Table 2.8.6 Series of three inter-correlated variables systematically extracted from the Basic Correlation Matrix and their corresponding partials

No. A B C rA.BC rB.AC rC.AB
1 1 3 4 +.280 -.085 -.082
2 1 3 9 +.178 -.145 -.082
3 1 3 13 +.101 -.669 -.014
4 1 3 16 +.061 -.266 -.090
5 1 3 18 +.101 -.126 -.097
6 1 3 19 +.140 +.178 -.133
7 1 3 34 +.196 -.087 -.137
8 1 4 5 +.189 +.444 -.183
9 1 4 9 +.122 -.150 -.093
10 1 4 13 +.024 -.671 -.068
11 1 4 16 +.092 -.263 -.084
12 1 4 19 +.117 +.175 -.131
13 1 4 30 -.108 -.204 -.132
14 1 4 33 +.077 -.089 -.105
15 1 5 13 -.020 -.633 +.316
16 1 5 16 +.012 -.254 +.413
17 1 5 17 +.035 +.103 +.418
18 1 5 18 -.061 -.099 +.415
19 1 5 19 +.128 +.095 +.406
20 1 5 23 -.031 -.097 +.419
21 1 5 24 +.050 +.083 +.418
22 1 5 30 -.091 -.138 +.406
23 1 5 34 -.093 -.058 +.416
24 1 9 13 -.018 -.670 -.133
25 1 9 19 +.128 +.181 -.182
26 1 9 24 -.121 +.095 -.150
27 1 9 34 +.096 -.091 -.153
28 1 13 16 +.174 -.093 -.645
29 1 13 17 -.089 +.036 -.668
30 1 13 18 +.247 +.066 -.668
31 1 13 19 -.088 +.062 -.665
32 1 13 23 +.031 -.069 -.670
33 1 13 29 +.011 -.068 -.672
34 1 13 30 +.020 -.130 -.666
35 1 13 33 +.014 -.064 -.672
35a 1 13 34 +.058 +.060 -.675
36 1 16 17 -.225 +.065 -.251
37 1 16 18 +.056 -.117 -.264
38 1 17 18 -.120 -.122 +.112
39 1 17 19 +.157 +.143 +.104
40 1 17 22 +.098 +.107 +.117
41 1 18 19 -.133 +.144 -.115
42 1 18 33 +.072 -.088 -.130

[pagina 402]
[p. 402]

No. A B C rA.BC rB.AC rC.AB
43 1 18 34 +.097 -.093 -.127
44 1 19 24 +.069 +.103 +.154
45 1 19 30 -.066 -.180 +.147
46 1 19 33 -.091 -.083 +.153
47 1 22 24 +.398 +.073 +.081
48 1 22 33 -.144 -.081 +.107
49 1 24 33 -.162 -.080 +.100
50 1 29 30 +.075 -.184 -.085
51 2 3 4 +.276 -.165 -.053
52 2 3 6 +.088 +.084 -.111
53 2 3 7 +.137 -.198 -.074
54 2 3 8 +.374 +.303 -.205
55 2 3 14 -.109 +.073 -.095
56 2 3 16 +.080 -.089 -.096
57 2 3 18 +.104 -.105 -.092
58 2 3 28 -.102 +.173 -.084
59 2 3 34 +.183 -.303 -.042
60 2 4 6 +.123 +.097 -.197
61 2 4 7 +.161 -.181 -.152
62 2 4 8 -.122 +.225 -.153
63 2 4 14 -.106 +.063 -.179
64 2 4 16 +.103 -.077 -.178
65 2 4 26 -.060 +.088 -.181
66 2 4 28 -.073 +.167 -.172
67 2 4 30 -.057 +.138 -.177
68 2 4 31 -.110 -.100 -.196
69 2 6 7 +.129 -.221 +.101
70 2 6 14 +.072 +.079 +.069
71 2 6 24 +.172 +.068 +.062
72 2 6 26 +.101 +.094 +.065
73 2 6 31 -.325 -.059 +.052
74 2 6 34 -.078 -.311 +.047
75 2 7 24 +.104 +.100 -.219
76 2 7 31 -.160 -.113 -.225
77 2 8 16 -.076 -.076 +.242
78 2 8 17 +.064 +.217 +.229
79 2 8 26 +.062 +.083 +.243
80 2 8 28 +.039 +.168 +.239
81 2 8 30 +.072 +.129 +.237
82 2 14 17 +.142 +.229 +.048
83 2 14 24 +.134 +.069 +.074
84 2 16 17 -.235 +.223 -.040
85 2 16 18 +.081 -.108 -.087
86 2 16 32 +.115 -.093 -.085
87 2 17 18 -.112 -.087 +.227
88 2 17 31 -.289 -.009 +.226
89 2 17 32 -.226 -.049 +.222
90 2 18 34 +.078 -.307 -.086

[pagina 403]
[p. 403]

No. A B C rA.BC rB.AC rC.AB
91 2 23 31 -.143 -.061 +.126
92 2 23 32 -.098 -.090 +.126
93 2 24 26 +.210 +.086 +.060
94 2 24 31 -.182 -.066 +.066
95 2 26 31 -.073 -.073 +.095
96 2 28 30 +.083 +.134 +.170
97 2 31 32 +.366 -.080 -.045
98 2 32 34 +.057 -.310 -.081
99 3 4 6 +.087 +.051 +.283
100 3 4 7 +.158 +.105 +.267
101 3 4 8 -.288 +.403 +.369
102 3 4 9 +.088 +.161 +.270
103 3 4 11 +.082 +.167 +.270
104 3 4 13 +.054 +.128 +.279
105 3 4 14 -.090 -.087 +.279
106 3 4 16 +.098 +.057 +.282
107 3 4 19 +.065 +.096 +.281
108 3 4 28 -.074 -.093 +.280
109 3 6 7 +.099 +.148 +.063
110 3 6 9 -.189 +.210 +.116
111 3 6 11 +.086 +.191 +.061
112 3 6 12 -.265 -.058 +.061
113 3 6 14 +.088 -.124 +.089
114 3 6 19 +.189 +.106 +.057
115 3 6 34 -.117 +.215 +.102
116 3 7 12 -.116 -.059 +.147
117 3 7 19 +.093 +.104 +.144
118 3 8 12 -.094 -.042 +.328
119 3 8 16 -.135 +.129 +.346
120 3 8 28 +.131 -.156 +.348
121 3 9 11 +.111 +.174 +.170
122 3 9 12 +.315 -.142 +.226
123 3 9 13 +.070 +.133 +.181
124 3 9 19 +.077 +.102 +.184
125 3 9 28 -.053 -.107 +.186
126 3 9 34 +.074 +.189 +.175
127 3 11 12 -.084 -.059 +.191
128 3 11 19 +.093 +.099 +.186
129 3 12 19 -.148 +.109 -.060
130 3 13 16 +.299 +.046 +.128
131 3 13 18 +.260 +.078 +.123
132 3 13 19 -.194 +.149 +.173
133 3 16 18 +.082 +.108 +.079
134 3 18 19 -.168 +.139 +.136
135 3 18 34 +.089 +.196 +.095
136 4 5 6 +.144 +.089 +.107
137 4 5 7 +.058 +.186 +.109
138 4 5 13 -.314 +.138 +.158

[pagina 404]
[p. 404]

No. A B C rA.BC rB.AC rC.AB
139 4 5 16 -.121 +.134 +.136
140 4 5 19 +.173 +.076 +.107
141 4 5 30 -.153 -.066 +.110
142 4 5 34 -.136 +.066 +.130
143 4 6 7 +.092 +.184 +.087
144 4 6 9 -.187 +.159 +.133
145 4 6 11 +.087 +.125 +.094
146 4 6 14 +.092 -.128 +.116
147 4 6 19 +.188 +.077 +.089
148 4 6 26 +.117 -.090 +.115
149 4 6 31 -.322 -.062 +.080
150 4 6 33 -.122 +.100 +.117
151 4 6 34 -.104 +.060 +.111
152 4 7 19 +.094 +.077 +.185
153 4 7 31 -.124 -.068 +.184
154 4 8 10 -.080 +.125 -.151
155 4 8 16 -.079 +.105 -.153
156 4 8 26 +.073 -.065 -.157
157 4 8 28 +.067 -.093 -.156
158 4 8 30 +.095 -.068 -.155
159 4 8 33 -.072 +.074 -.157
160 4 9 10 +.268 +.105 +.104
161 4 9 11 +.129 +.116 +.121
162 4 9 13 +.085 +.082 +.130
163 4 9 19 +.086 +.084 +.130
164 4 9 26 -.105 -.063 +.130
165 4 9 28 -.061 -.096 +.131
166 4 9 34 +.105 +.034 +.134
167 4 10 11 +.090 +.121 +.127
168 4 10 15 +.075 +.097 +.131
169 4 10 19 +.112 +.080 +.129
170 4 11 19 +.103 +.082 +.124
171 4 11 31 -.165 -.071 +.120
172 4 13 15 -.121 +.120 +.107
173 4 13 16 +.300 +.095 +.061
174 4 13 19 -.184 +.114 +.113
175 4 13 30 +.153 -.099 +.108
176 4 13 33 +.068 +.080 +.088
177 4 14 15 +.191 +.132 -.141
178 4 14 33 -.088 +.076 -.112
179 4 19 30 -.088 -.076 +.089
180 4 19 31 -.306 -.067 +.071
181 4 19 33 -.114 +.098 +.106
182 4 26 31 -.088 -.100 -.086
183 4 28 30 +.100 -.073 -.097
184 4 31 33 +.105 +.097 -.102
185 5 6 7 +.099 +.064 +.148
186 5 6 19 +.173 +.158 +.124

[pagina 405]
[p. 405]

No. A B C rA.BC rB.AC rC.AB
187 5 6 24 +.165 +.068 +.141
188 5 6 34 -.080 -.116 +.144
189 5 7 19 +.097 +.176 +.061
190 5 7 24 +.077 +.088 +.073
191 5 13 16 +.291 -.014 -.282
192 5 13 17 -.133 +.043 -.290
193 5 13 18 +.252 -.034 -.281
194 5 13 19 -.126 +.140 -.276
195 5 13 23 +.084 -.050 -.293
196 5 13 30 +.101 -.126 -.282
197 5 16 17 -.243 +.062 -.087
198 5 16 18 +.080 -.104 -.096
199 5 17 18 -.128 -.103 +.072
200 5 17 19 +.163 +.171 +.056
201 5 18 19 -.134 +.169 -.088
202 5 18 34 -.097 -.118 -.100
203 5 19 24 +.070 +.080 +.176
204 5 19 30 -.067 -.148 +.171
205 6 7 12 -.101 -.259 +.080
206 6 7 19 +.091 +.186 +.091
207 6 7 21 +.069 +.088 +.103
208 6 7 24 +.066 +.169 +.097
209 6 7 25 +.188 +.142 +.080
210 6 7 31 -.110 -.319 +.069
211 6 9 11 +.165 +.128 -.187
212 6 9 12 +.261 -.233 -.099
213 6 9 19 +.136 +.217 -.194
214 6 9 20 +.174 -.111 -.147
215 6 9 21 -.100 +.078 -.161
216 6 9 24 -.110 +.157 -.149
217 6 9 26 -.098 +.091 -.160
218 6 9 34 +.096 -.081 -.161
219 6 11 12 -.073 -.262 +.077
220 6 11 19 +.097 +.187 +.080
221 6 11 25 +.074 +.152 +.087
222 6 11 31 -.151 -.318 +.046
223 6 12 19 -.109 +.162 -.246
224 6 12 20 +.112 -.106 -.254
225 6 12 21 -.102 +.066 -.260
226 6 12 24 -.110 +.143 -.249
227 6 12 25 -.108 +.127 -.252
228 6 12 26 -.094 +.079 -.259
229 6 12 31 +.407 -.240 -.141
230 6 14 21 +.073 +.090 +.071
231 6 14 22 +.120 +.097 +.065
232 6 14 24 +.129 +.168 +.055
233 6 14 25 +.090 +.153 +.063
234 6 14 33 -.089 -.105 +.068

[pagina 406]
[p. 406]

No. A B C rA.BC rB.AC rC.AB
235 6 19 24 +.053 +.164 +.184
236 6 19 25 +.060 +.146 +.185
237 6 19 31 -.267 -.287 +.104
238 6 19 33 -.085 -.094 +.186
239 6 20 26 -.066 +.098 -.133
240 6 21 22 +.198 +.089 +.076
241 6 21 24 +.297 +.156 +.044
242 6 21 25 +.116 +.150 +.077
243 6 21 26 +.136 +.096 +.082
244 6 21 33 -.202 -.094 +.075
245 6 22 24 +.396 +.147 +.038
246 6 22 25 +.131 +.147 +.085
247 6 22 26 +.097 +.098 +.096
248 6 22 31 -.112 -.319 +.064
249 6 22 33 -.144 -.097 +.090
250 6 24 25 +.198 +.126 +.147
251 6 24 26 +.201 +.073 +.158
252 6 24 31 -.139 -.306 +.124
253 6 24 33 -.155 -.084 +.161
254 6 25 26 +.294 +.063 +.134
255 6 25 31 -.138 -.309 +.108
256 6 25 33 -.067 -.100 +.152
257 6 26 31 -.047 -.323 +.087
258 6 31 33 +.063 -.086 -.322
259 7 12 19 -.144 +.092 -.111
260 7 12 21 -.115 +.064 -.117
261 7 12 24 -.143 +.066 -.115
262 7 12 25 -.124 +.187 -.100
263 7 12 31 +.449 -.092 -.071
264 7 19 24 +.078 +0.75 +.104
265 7 19 25 +.069 +.194 +.094
266 7 19 31 -.301 -.111 +.071
267 7 21 24 +.303 +.063 +.056
268 7 21 25 +.116 +.194 +.055
269 7 21 29 +.093 +.093 +.070
270 7 24 25 +.209 +.189 +.041
271 7 24 31 -.178 -.126 +.060
272 7 25 31 -.158 -.106 +.182
273 8 10 12 +.261 -.091 -.074
274 8 10 17 +.110 +.131 -.114
275 8 10 22 +.151 +.114 -.116
276 8 12 17 -.123 +.106 -.099
277 8 12 26 -.110 +.072 -.105
278 8 16 17 -.241 +.099 -.070
279 8 17 22 +.101 +.086 +.110
280 8 22 26 +.100 +.075 +.090
281 8 22 33 -.147 -.071 +.086
282 8 28 30 +.100 +.099 +.072

[pagina 407]
[p. 407]

No. A B C rA.BC rB.AC rC.AB
283 9 10 11 +.070 +.120 +.271
284 9 10 12 +.203 +.235 +.221
285 9 10 19 +.101 +.066 +.273
286 9 10 20 +.209 +.133 +.246
287 9 11 12 -.147 +.312 +.182
288 9 11 19 +.101 +.083 +.135
289 9 12 19 -.194 +.152 +.314
290 9 12 20 +.093 +.160 +.273
291 9 12 21 -.095 -.082 +.283
292 9 12 24 -.118 -.098 +.278
293 9 12 26 -.090 -.083 +.283
294 9 13 19 -.184 +.117 +.116
295 9 19 24 +.101 -.147 +.111
296 9 20 26 -.059 -.101 +.187
297 9 21 24 +.297 -.108 -.076
298 9 21 26 +.134 -.099 -.099
299 9 24 26 +.204 -.087 -.116
300 10 11 12 -.131 +.282 +.139
301 10 11 17 +.077 +.089 +.099
302 10 11 19 +.102 +.113 +.094
303 10 12 17 -.168 +.140 +.286
304 10 12 19 -.198 +.174 +.294
305 10 12 20 +.082 +.223 +.243
306 10 12 32 +.383 -.215 +.325
307 10 17 18 -.127 -.100 +.083
308 10 17 19 +.165 +.109 +.077
309 10 17 22 +.100 +.131 +.083
310 10 17 32 -.235 -.083 +.074
311 10 18 19 -.140 +.109 -.095
312 10 19 32 -.138 -.087 +.110
313 10 22 32 -.086 -.091 +.131
314 11 12 17 -.128 +.075 -.086
315 11 12 19 -.147 +.101 -.081
316 11 12 25 -.139 +.076 -.085
317 11 12 31 +.451 -.148 -.019
318 11 17 19 +.167 +.101 +.069
319 11 17 25 +.109 +.080 +.078
320 11 17 31 -.289 -.157 +.037
321 11 19 25 +.080 +.080 +.107
322 11 19 31 -.299 -.148 +.064
323 11 25 31 -.169 -.162 +.059
324 12 17 19 +.157 -.136 -.111
325 12 17 25 +.098 -.132 -.120
326 12 17 31 -.269 +.443 +.003
327 12 17 32 -.212 +.319 -.058
328 12 19 24 +.064 -.141 -.145
329 12 19 25 +.068 -.134 -.145
330 12 19 31 -.274 +.437 -.015

[pagina 408]
[p. 408]

No. A B C rA.BC rB.AC rC.AB
331 12 19 32 -.103 +.323 -.113
332 12 20 26 -.064 -.109 +.136
333 12 21 24 +.295 -.121 -.082
334 12 21 25 +.113 -.132 -.107
335 12 21 26 +.132 -.103 -.109
336 12 23 31 -.071 +.443 -.145
337 12 23 32 -.048 +.325 -.170
338 12 24 25 +.203 -.117 -.124
339 12 24 26 +.202 -.089 -.130
340 12 24 31 -.134 +.443 -.076
341 12 25 26 +.294 -.079 -.116
342 12 25 31 -.130 +.445 -.072
343 12 26 31 -.029 +.454 -.093
344 12 31 32 +.258 +.204 +.381
345 13 16 17 -.216 -.081 +.282
346 13 16 18 +.008 +.259 +.296
347 13 16 32 +.101 +.057 +.300
348 13 17 18 -.099 +.258 -.121
349 13 17 19 +.153 -.150 -.126
350 13 17 32 -.233 +.057 -.134
351 13 18 19 -.111 -.138 +.253
352 13 18 33 +.066 +.055 +.268
353 13 19 30 -.072 +.130 -.162
354 13 19 32 -.136 +.068 -.162
355 13 19 33 -.094 +.059 -.166
356 13 23 32 -.122 +.105 +.115
357 13 29 30 +.083 +.138 +.064
358 14 15 24 +.077 +.125 +.164
359 14 17 22 +.094 +.111 +.145
360 14 17 25 +.102 +.084 +.147
361 14 21 22 +.198 +.113 +.055
362 14 21 24 +.301 +.122 +.039
363 14 21 25 +.122 +.092 +.068
364 14 21 33 -.205 -.082 +.061
365 14 22 24 +.395 +.098 +.078
366 14 22 25 +.135 +.084 +.114
367 14 22 33 -.144 -.079 +.114
368 14 24 25 +.210 +.073 +.121
369 14 24 33 -.160 -.075 +.126
370 14 25 33 -.075 -.089 +.094
371 16 17 18 -.117 +.059 -.241
372 16 17 32 -.221 +.067 -.228
373 17 18 19 -.131 +.158 -.112
374 17 19 25 +.070 +.102 +.166
375 17 19 31 -.276 -.261 +.090
376 17 19 32 -.111 -.223 +.145
377 17 22 25 +.135 +.101 +.097
378 17 22 31 -.112 -.288 +.074

[pagina 409]
[p. 409]

No. A B C rA.BC rB.AC rC.AB
379 17 22 32 -.074 -.235 +.091
380 17 25 31 -.154 -.285 +.066
381 17 31 32 +.322 -.149 -.232
382 18 19 33 -.094 +.069 -.144
383 18 21 33 -.206 +.070 -.059
384 19 24 25 +.215 +.072 +.068
385 19 24 27 +.099 +.073 +.078
386 19 24 31 -.169 -.302 +.030
387 19 24 33 -.163 -.092 +.069
388 19 25 27 +.070 +.075 +.083
389 19 25 31 -.162 -.302 +.035
390 19 25 33 -.075 -.098 +.081
391 19 27 32 -.101 -.141 +.065
392 19 31 32 +.345 -.038 -.280
393 19 31 33 +.067 -.079 -.305
394 21 22 24 +.368 +.251 +.093
395 21 22 25 +.123 +.102 +.191
396 21 22 26 +.080 +.126 +.194
397 21 22 33 -.116 -.185 +.180
398 21 24 25 +.192 +.066 +.289
399 21 24 26 +.182 +.084 +.286
400 21 24 33 -.114 -.169 +.282
401 21 25 26 +.293 +.112 +.090
402 21 25 33 -.059 -.203 +.114
403 21 29 30 +.084 +.087 +.092
404 22 24 25 +.179 +.063 +.387
405 22 24 26 +.190 +.022 +.394
406 22 24 27 +.039 +.143 +.396
407 22 24 31 -.144 -.071 +.390
408 22 24 33 -.120 -.094 +.390
409 22 25 26 +.295 +.066 +.120
410 22 25 27 +.053 +.164 +.135
411 22 25 31 -.164 -.117 +.124
412 22 25 33 -.063 -.144 +.135
413 22 26 31 -.066 -.133 +.097
414 22 27 32 -.097 -.081 +.164
415 22 31 32 +.362 -.051 -.112
416 22 31 33 +.076 -.143 -.127
417 23 31 32 +.361 -.059 -.120
418 24 25 26 +.271 +.160 +.167
419 24 25 27 +.055 +.090 +.215
420 24 25 31 -.146 -.153 +.194
421 24 25 33 -.048 -.157 +.210
422 24 26 31 -.041 -.174 +.205
423 24 31 33 +.066 -.157 -.174
424 25 26 31 -.026 -.165 +.297
425 25 31 33 +.082 -.068 -.174

[pagina 410]
[p. 410]

Niet alle afnemende partiële correlaties kunnen rechtstreeks causaal worden geïnterpreteerd. Simon wijst erop dat de correlatie slechts op causaliteit betrokken mag worden, indien men van bepaalde vooronderstellingen uitgaatGa naar voetnoot1. Een dezer formuleert Simon als ‘uncorrelated bias’: alle andere (d.w.z. bij onze analyse niet betrokken) variabelen die van invloed zijn op de afhankelijke variabele X correleren niet met de verklarende variabele Y. Een andere vooronderstelling die het mogelijk maakt van de correlatie tot de causale verklaring over te gaan, betrof het tijdaspect van de variabelen: we kunnen slechts causaal interpreteren indien we weten dat sommige variabelen aan andere voorafgaan, dat b.v. X telkens volgt op Y en niet andersom. Het is niet moeilijk om met behulp van onze resultaten aan te tonen dat zonder deze veronderstelling de partiële correlatie-analyse tot zinloze resultaten leidt.

Om het eerste het beste voorbeeld te nemen: in de derde regel van onze Tabel 2.8.6 treffen we de volgende serie van variabelen: 1-3-13, d.w.z. ongeveer dat vrouwen lagere inkomsten hebben en tevens minder roken dan mannen en dat personen die minder roken tevens lagere inkomsten hebben. We bemerken in de laatste kolom, dat de correlatie tussen 1 en 3, die volgens de Basis Matrix gelijk was aan r = - .111, gereduceerd wordt tot - .014. Passen we de causale interpretatie toe, dan zouden we moeten zeggen dat het verband tussen het geslacht en het inkomstenniveau verdwijnt in de subcategorieën van rookgewoonten, dat het dus een schijnverband is dat geheel door de causale werking van roken kan worden ‘verklaard’. Dit is vanzelfsprekend een absurde veronderstelling; aan de hand van informaties verzameld uit andere bronnen dan onze enquête, weten we dat vrouwen lagere inkomsten hebben dan mannen. Duidelijk speelt hier de verwaarlozing van tijdaspecten een rol. Correcter geredeneerd zou men moeten stellen: het geslacht van de mens is een biologische eigenschap hem reeds bij de geboorte gegeven, die in de tijdreeks zeker al zijn gewoonten voorafgaat. Het is daarom zinloos om de nul naderende partiële correlatie (‘the vanishing correlation’ in termen van Simon) zo te interpreteren alsof de gewoonten (‘rookgewoonten’ in casu) een oorzaak zouden zijn van een verband tussen een genetische eigenschap (geslacht) en een verworven kenmerk (inkomstenniveau). Een interpretatie die beter het feitelijke gebeuren zou vatten, is o.i. de volgende: over het algemeen is het geslacht van invloed op de kans of men een roker of niet-roker wordt, alsmede op de kans of men over veel eigen middelen (inkomsten) zal beschikken. Dit in die mate dat we een heel gering verschil aantreffen tussen de inkomsten van rokende (d.w.z. tevens overwegend werkende) mannen en vrouwen in onze steek-

[pagina 411]
[p. 411]
proef. Abstraherend van de tijdaspecten zouden we wel degelijk het volgende schema van Simon kunnen toepassen:
(I)

illustratie

d.w.z. roken is de factor die verantwoordelijk is voor het schijnverband tussen 1 en 3. Nemen we in plaats van de correlaties de veronderstelde temporele relaties in beschouwing, dan verkrijgen we
(II)

illustratie

of zelfs 1 → 3 → 13. (III)

 

Uit de incongruentie van de beide schemata (I) en (II) moeten we de conclusie trekken dat hier de ‘schijnverbandinterpretatie’ niet van toepassing is.

Wat de eerste veronderstelling betreft, kunnen we evenmin stellen dat in alle of in de meeste reeksen de voorwaarde van ‘uncorrelated bias’ vervuld is. Ten eerste is er altijd de mogelijkheid van beïnvloeding van ‘buitenaf’, d.w.z. de in onze Basis Correlatie Matrix niet opgenomen variabelen kunnen met een of twee leden van een drieledige reeks zijn gecorreleerd en op hun beurt de correlaties ‘verklaren’. Deze onzekerheid wordt verminderd indien, zoals in ons eigen onderzoek, met een groot aantal variabelen gewerkt wordt.

Ten tweede kan een reeks van drie variabelen ook van andere reeksen of variabelen in onze Basis Matrix afhankelijk zijn. In dat geval kan meestal de relatie van de reeks tot een andere reeks met behulp van de partiële correlaties van Tabel 2.8.6 worden geanalyseerd. Slechts een enkel voorbeeld (alweer lukraak gekozen) ter illustratie. Reeks 176 van Tabel 2.8.6 suggereert dat de lagere frequentie waarmee de rokers de arts plegen te raadplegen in feite aan de hogere schoolopleiding kan worden toegeschreven: de rokers gaan minder naar de arts (worden minder ziek?) slechts voor zover zij ook meer schoolopleiding hebben genoten dan de niet-rokers.

Dit zou op zich zelf een aannemelijke verklaring kunnen zijn, ware het niet dat we zowel uit de Basis Matrix (Tabel 2.7.5) als uit de reeksen no.'s 10 en 14 de ‘correlated bias’ van een factor, nl. het geslacht, kunnen leren kennen. Mannen hebben èn meer schoolopleiding èn sterkere rookgewoonten dan vrouwen; vrouwen dan, op hun beurt, raadplegen frequenter de arts dan de mannen. De reeks (‘cluster’) no. 10 laat duidelijk

[pagina 412]
[p. 412]

zien dat het roken niet door de opleiding maar door het geslacht wordt beïnvloed. De reeks no. 14 laat zien dat opleiding inderdaad van invloed kan zijn op artsbezoek onafhankelijk van het geslacht, al is de coëfficiënt gezakt tot de waarde r4-33.1 = .077.

Dank zij ons inzicht in de ‘correlated bias’, kunnen we in dit geval een uitspraak doen over de causale werking. Wel dienen we te beseffen dat we niet de gelijktijdige werking van vier variabelen hebben onderzocht; in statistische termen uitgedrukt: er kan nog vertekening ontstaan door de werking van opleiding en geslacht gezamenlijk, door de interactie van de derde of vierde (en wellicht nog hogere) orde.

Dit brengt ons dan tot het voorbehoud dat we wensen te maken t.o.v. de partiële correlaties die vermeld staan in Tabel 2.8.6. Niet slechts reeksen van drie, maar ook reeksen van meerdere gecorreleerde factoren zijn te vinden op de Basis Correlatie Matrix. Een aantal drieledige ‘clusters’ kan worden samengetrokken in een meerdelige reeks. Nemen we, b.v. de eerste serie van variabelen 1-3-4 in beschouwing, dan zien we dat de series 1-3-9, 1-4-9, 1-9-13, 1-9-19, 1-13-19, 3-4-9, 3-4-13, 3-4-19, 3-9-13, 3-9-19, 4-9-13, 4-9-19, 9-13-19 samen te trekken zijn in een complexe reeks van gecorreleerde variabelen:

1-3-4-9-13-19.
Het bestaan van een reeks van een dergelijke omvang is niet zonder invloed op onze causale analyse. Indien we veronderstellen, dat van de variabelen 13 en 19 de eerste voorafgaat aan de tweede, d.w.z. dat volgens onze hypothese intensieve rookgewoonten oorzaak zijn van weinig intensieve snoepgewoonten, dan kan deze hypothese, strikt genomen, slechts dan als getoetst worden beschouwd, indien het verband tussen 13 en 19 blijft bestaan ook als alle andere variabelen gelijktijdig onder controle worden gehouden. In symbolische termen uitgedrukt:
Ho: r13-19.1,3,4,9 = 0
d.w.z. indien de partiële correlatie-coëfficiënt waarbij de variabelen 1, 3, 4 en 9 onder controle worden gehouden de kritieke waarde overschrijdt in de gewenste richting, kunnen we (binnen de perken van onze onderzoekopzet en van de Basis Matrix en verondersteld dat het roken aan de ontwikkeling der snoepgewoonten voorafgaat) de hypothese als bevestigd beschouwen.

De berekening van een partiële correlatie van de vierde orde is geen gemakkelijke taak; hiervoor moeten drie partiële correlaties van de derde orde worden berekend, elk hiervan gebaseerd op drie correlaties van de

[pagina 413]
[p. 413]
tweede orde. Slechts deze correlaties van de tweede orde kunnen met behulp van de door de zebra berekende coëfficiënten gemakkelijker worden gevonden, omdat we de getallen in de algemene formule rechtstreeks kunnen invullen. Daar de coëfficiënten meestal zeer laag zijn, kon in meerdere gevallen de noemer praktisch verwaarloosd worden. Bij het invullen in de formule

illustratie

verkrijgen we bij benadering

illustratie

Teneinde de significantie van de verkregen partiële correlatiecoëfficiënt te berekenen, passen we de methode van variantie-analyse toe; hiervoor geldt dan datGa naar voetnoot1

illustratie

waarbij N is de omvang van de steekproef, k het aantal onafhankelijke variabelen dat men bij de analyse betrekt, variabelen j, m, n tot en met t. Daar de steekproef het aantal variabelen ver te boven gaat, blijft het significantieniveau van de partiële correlatie niet veel verschillen van het niveau berekend voor de enkelvoudige (‘produkt-moment’)correlatie. Bij invullen verkrijgen we nl.

illustratie

De F waarde van 10,04 komt overeen met een waarschijnlijkheid van P < .01 (de waarde P < .001 vereist een F = 10,83; is dus net niet bereikt). We kunnen de nul-hypothese verwerpen en de causale samenhang opstellen tussen de rook- en snoepgewoonten.

Door middel van partiële correlatie van hogere orde dan drie was het mogelijk ook andere meerledige reeksen van gecorreleerde variabelen te ontleden. Daar het werk bijzonder tijdrovend is en wij het Mathematisch Instituut niet al te zwaar wensten te belasten, is dit echter niet systematisch gebeurd maar slechts voor die verbanden die we bijzonder relevant

[pagina 414]
[p. 414]

achtten en waar het vermoeden bestond dat we er met het opsplitsen in drie partiëlen niet kwamen. Men bedenke immers dat elke reeks van vier gecorreleerde variabelen opgesplitst kan worden in vier reeksen van drie partiële correlaties. Dit is dan wel systematisch, d.w.z. voor elke zichtbare reeks van tenminste drie variabelen geschied. Zonder de partiële correlaties van de orde hoger dan drie hebben we een hoge mate van zekerheid dat het verband tussen b.v. A en B niet door X of Y of Z kan worden ‘weggeredeneerd’. Hogere partiëlen hebben we slechts nodig om na te gaan of X en Y en Z in combinatie (dus beter: XYZ) niet een dergelijke verstorende invloed op het verband tussen A en B uitoefenen.

In het aangehaalde voorbeeld van het verband tussen het roken en het snoepen bleek dit duidelijk niet het geval te zijn geweest. De oorspronkelijke enkelvoudige r-coëfficiënt is weliswaar van -.173 tot ongeveer -.100 gereduceerd, doch men vergete niet dat reeds door de invloed van het geslacht alleen de coëfficiënt tot de waarde van -.88 daalt. (Zie Tabel 2.8.6). Ten opzichte van de partiële correlatie van de eerste orde valt dus bij een partiële van de vierde orde een verhoging van het verband te constateren. Dit behoeft ons dan ook niet te verbazen; raadplegen we de tabel van de drieledige partiëlen, dan bemerken we immers dat, met uitzondering van het geslacht, elk van de drie overige onafhankelijke variabelen het verband tussen het roken en het snoepen verhoogt, indien ze wordt ‘vastgehouden’; inkomsten: van -.173 tot -.194; opleiding: van -.173 tot -.184; sociale participatie: eveneens van -.173 tot -.184. Tegenover de verzwakkende invloed van één variabele staan de versterkende invloeden van drie andere onafhankelijke grootheden. Het resultaat is dan overeenkomstig de verwachting.

De onzekerheid omtrent de grootte van de interactie doet ons hier de lijst van enkele andere meerledige reeksen van intergecorreleerde variabelen opnemen, die uit de Basis Correlatie Matrix en de tabel bevattende de drieledige reeksen is samengesteld.

 

Voor elke reeks in Tabel 2.8.7 kan een partiële correlatie van de tweede, zo nodig ook van de derde of de vierde orde worden berekend. We krijgen dan inzicht in de oorzakelijke verbanden, niet van een geheel complex van variabelen zoals dit bij de factoranalyse het geval is, doch van de afzonderlijke variabelen. Het systematisch invoeren van allerlei ‘controles’ in de vorm van de testvariabelen maakt het ons mogelijk die verbanden uit onze analyse te verwijderen, die causaal bezien slechts schijnverbanden zijn.

Hier kan echter een kritische vraag gesteld worden: de analyse helpt ons die verbanden uit de Correlatie Matrix te verwijderen, die te danken zijn aan het toevallig samengaan van bepaalde structurele kenmerken;

[pagina 415]
[p. 415]

Tabel 2.8.7 Enkele meerdelige reeksen van statistische samenhangen uit de basis correlatie matrix
Table 2.8.7 Some longer correlation-series as identified in the Basic Correlation Matrix

1 - 3 - 4 - 9 - 13 - 19 4 - 11 - 19 - 31
1 - 3 - 16 - 18 6 - 9 - 11 - 12 - 19
1 - 3 - 18 - 19 7 - 24 - 25 - 31
1 - 3 - 9 - 34 8 - 10 - 12 - 17
1 - 5 - 13 - 16 - 17 - 18 9 - 12 - 19 - 24
1 - 19 - 24 - 33 9 - 21 - 24 - 25 - 26
2 - 3 - 4 - 6 - 7 10 - 11 - 17 - 18 - 19
2 - 3 - 6 - 34 10 - 12 - 17 - 19 - 25 - 31
2 - 4 - 8 - 16 - 17 11 - 12 - 17 - 25 - 31
2 - 4 - 8 - 28 - 30 12 - 17 - 31 - 32
2 - 17 - 23 - 31 - 32 12 - 19 - 24 - 25 - 31
2 - 24 - 26 - 31 12 - 21 - 24 - 25
3 - 4 - 5 - 7 14 - 17 - 22 - 25
3 - 6 - 9 - 34 14 - 21 - 22 - 24 - 31
3 - 6 - 7 - 12 - 19 14 - 24 - 25 - 33
3 - 9 - 11 - 12 - 19 17 - 22 - 25 - 31
4 - 5 - 6 - 34 22 - 24 - 25 - 31
4 - 9 - 10 - 11 - 19 22 - 31 - 32 - 33
  24 - 25 - 26 - 31
   
Opmerking: De getallen duiden de 34 variabelen aan zoals gespecificeerd op blz. 401 t/m 409 en weergegeven in de matrix van Tabel 2.7.5.

hoe staat het echter met die verbanden die op de Basis Correlatie Matrix niet zichtbaar zijn, dus niet voorkomen, daar zij door deze structurele verbanden ‘vertroebeld’ worden? Op deze vraag moet de door ons omschreven methode van het systematisch invoeren van testvariabelen het antwoord schuldig blijven. Wel is het o.i. mogelijk intuïtief te werk te gaan, of aan de hand van de reeds bekende vertroebelende invloeden van bepaalde variabelen (b.v. de samenhang tussen het geslacht en de aard van het werk) door middel van partiële correlaties een oorspronkelijk niet-significant verband op te voeren zodat het de significantie grens is gepasseerd. Nog een andere mogelijkheid is het gebruikmaken van de informatie, die de factor-analyse der gegevens ons verschaft. Als voorbeeld willen de volgende twee mogelijke samenhangen bespreken: tussen de gezinsbinding (variabele 8) en het contact met de communicatiemedia (variabele 11); en tussen het optimisme (variabele 27) en de houding t.o.v. het roken (variabele 14).

Het eerste verband werd ons gesuggereerd door de ladingen met Factor VI in de geroteerde matrix van 34 variabelen; we treffen hier de ladingen .700 (voor variabele 8) en .400 (voor variabele 11) aan. De correlatie tussen beide variabelen op de basismatrix is echter niet significant, nl..055.

[pagina 416]
[p. 416]
Berekenen we de partiële correlatie voor het verband tussen 8 en 11 in de subcategorieën van 4 (opleiding), dan verkrijgen we:

illustratie

Voegen we aan de controlevariabele nog een kenmerk toe (nl. variabele 30) dan verkrijgen we r8-11.4,30 = .082. Beide partiële correlatiecoëfficiënten zijn als statistisch significant te beschouwen, al is hun waarde uitermate klein.

Ons tweede voorbeeld werd ons door Factor X in Tabel 2.8.2 ingegeven. Hier verschijnt ‘de houding tegenover het roken’ als de variabele met de hoogste lading; naast de tweede variabele betrokken op de rookgewoonten (het aanvaarden van de berichtgeving over de longkanker) treedt de pessimisme-optimismevraag naar voren, als een variabele met een nog behoorlijke lading (.414). Op de basismatrix vinden we in de snijcel tussen kolom 27 (optimisme-pessimisme) en regel 14 (houding t.o.v. het roken) de waarde van r = -.056 aan, die duidt op afwezigheid van enig verband. Bij het invoeren van variabelen 22 en 24 als testvariabelen stijgt de coëfficiënt tot significante waarden:

r14-27.22 = -.083; r14-27.24 = -.0725.
Al is de verklarende waarde van deze lage coëfficiënten klein, ze illustreren goed het bestaan van verbanden die op een Basis Correlatie Matrix door structurele samenhangen tussen de variabelen zijn gecamoufleerd. In vele opzichten kunnen de factoranalyse en de correlatie-analyse elkaar aanvullen. Een statistisch geschoolde lezer zal zeker reeds een analogie hebben bemerkt tussen de factoranalyse en de analyse van de langere ‘clusters’ met behulp van de partiëlen. Deze ‘clusters’, die in Tabel 2.8.7 zijn weergegeven, zijn vanzelfsprekend niet direct vertaalbaar in de termen van de geïdentificeerde algemene factoren. Reeds het aantal biedt een moeilijkheid, want tegenover 10 factoren staan niet minder dan 37 geïdentificeerde ‘clusters’.

Wel kunnen we echter het verband tussen de beide methoden enigszins zichtbaar maken, indien we de ‘verklaarde’ variantie, die door middel van de factoranalyse werd verkregen, vergelijken met de variantie, die we ‘verklaren’ met behulp van de correlatie-analyse. Laten we als voorbeeld nemen onze belangrijkste variabele, de intensiteit van de rookgewoonten (var. 13). Kolom 13 in de Basis Matrix geeft niet minder dan 16 variabelen aan die significant correleren met rookgewoonten. Indien we de partiële correlaties uit Tabel 2.8.6 gebruiken om schijnverbanden te ver-

[pagina 417]
[p. 417]

wijderen, dan houden we echter slechts ongeveer een achttal over, te weten:

1 correlatie met geslacht -.674
3 met inkomsten .149 (laagste partiële .128)
16 met drinken .308 (laagste partiële .174)
18 met koffiegebruik .273
19 met snoepgewoonten -.173 (laagste partiële -.088)
34 met aantal werkuren .106
17 met houding t.o.v. drinken -.152
15 met aanvaarding kennis over longkanker -.110

Hiervan komen variabelen 1, 3, 16 en 18 als voornaamste onafhankelijke variabelen in aanmerking (19 is bijna gehalveerd onder de invloed van geslacht). Berekenen we voor deze variabelen de multipele correlatie, dan verkrijgen we tevens het percentage van de nog niet verklaarde variantie volgens de formule 1 - R2. Op Herbert M. Blalock Jr. steunend,Ga naar voetnoot1 redeneerden we als volgt:

illustratie

Dit houdt in het moeizaam berekenen van de partiële correlaties, waarvan de laatste van de derde orde. Bij het invullen van de desbetreffende waarde verkregen we:
1 - R2 = .546 × .99 × .99 × .969 = .52.
Duidelijk blijkt hier dat het percentage van de nog te verklaren variantie zeer langzaam daalt bij het invoegen van nieuwe variabelen, immers van omstreeks 55% bij ‘geslacht’ tot 54% na invoeren van ‘inkomsten’ en ‘koffiegebruik’, tot 52% tenslotte indien men de variantie hieraan toevoegde die door de zuivere werking van de drinkgewoontenvariabele kon worden verklaard.

Door deze vier onafhankelijke variabelen zijn we erin geslaagd slechts omstreeks de helft van de variabiliteit in de rookgewoonten te verklaren, waarbij de factor ‘geslacht’ het leeuwendeel voor zijn rekening nam.

Uit de tabel van de geroteerde factoren kan eveneens de verklaarde variantie per variabele worden afgelezen. Daartoe tellen we de kwadraten van de afzonderlijke ladingen per variabele op. Voor variabele 13 is dit .0292+.8092+.1102+.0082+.0002+.1092+.0732+.0372+0.812=.693 (teneinde de schrijfwijze te vergemakkelijken hebben we de ladingen de positieve richting toegekend; door het kwadrateren verdwijnt immers toch het minteken).

[pagina 418]
[p. 418]

Het percentage van de nog te verklaren variantie is bij de factoranalyse veel lager, nl. 1 - .693 = .307. Het verschil van omstreeks 20% is o.i. te danken aan het feit dat de tweede factor (welke waarschijnlijk de variabiliteit in onze bevolking tot uitdrukking brengt die met de opsplitsing van onze samenleving in mannen- en vrouwengroepen samengaat) reeds 65,5 % van de verklaarde variantie voor zijn rekening neemt. Door in plaats van de totale variantie, de variantie op partiële correlaties gebaseerd te nemen, krijgen we een zuiver beeld van causale invloeden; we verminderen echter de totale variantie, want met de ‘doorwerking’ van causale invloeden in de variabelen wordt geen rekening gehouden (variabele ‘aard van het werk’ b.v. wordt bij de analyse via partiële correlaties buiten beschouwing gelaten, terwijl zij bij de ladingen van factoranalyse wel is verdisconteerd).

Men bedenke ook dat die variabelen die onder een bepaalde grenswaarde zijn gebleven, niet werden opgenomen in de reeks van de multipele correlatie; hierdoor, en door het feit dat de reeks vanwege de moeizame berekeningen slechts tot vier leden bleef beperkt, ging waarschijnlijk ook een deel, hoewel o.i. niet doorslaggevend, van de variantie verloren. Beide bewerkingen tonen echter het geslacht als één der belangrijkste factoren aan; volgens beide berekeningen dragen alle overige factoren slechts minder dan 5 % bij tot de verklaring van de totale variabiliteit. Al behoeft dit kleine percentage onze causale analyse niet belemmeren, het is goed voor de algehele predictie van de rookgewoonten met deze verhouding rekening te houden.

 

Het formele (en tevens technische) deel van onze analyse kan hiermee worden afgesloten. De bovenomschreven twee werkwijzen maken het mogelijk naar behoefte de analytische en/of de meer synthetische denkwijze toe te passen door onze aandacht nu eens op de partiële correlaties van de afzonderlijke variabelen, dan weer op de algemene factoren te richten. De multipele correlatie kan als een brug tussen beide technieken worden gezien.

Na deze analyse konden wij dan ook rechtstreeks tot ons uitgangspunt, de interpretatie van onderzochte kenmerken en eigenschappen, terugkeren. Hiervoor was het nodig de afhankelijke van de onafhankelijke variabelen te scheiden (hetgeen rechtstreeks reeds van onze theorievorming afhankelijk was) en tevens de veronderstellingen te maken over de temporele volgorde van de bij het onderzoek betrokken variabelen. De resultaten van deze inhoudelijke analyse zijn neergelegd in Deel I van dit rapport bij het schrijven waarvan gebruik is gemaakt van de hier besproken en behandelde tabellen.

voetnoot1
H.F. Kaiser, The Varimax Method of Factor Analysis, University of California, Microfilm van een dissertatie. Zie ook H.F. Kaiser, ‘The varimax criterion for analytical rotation in factor analysis’, Psychometrika, 23, (1958) blz. 187-200.

voetnoot1
A Dutch Community, blz. 446 en de literatuur daar aangehaald, zie ook 1.5, blz. 201.

voetnoot1
Wij maakten een dankbaar gebruik van ‘A table for the rapid determination of the tetrachoric correlation coefficient’ van M.D. Davidoff en H.W. Goheen, in Psychometrika, Vol. 18, blz. 118 en Vol. 19, blz. 163-164 (1953 en 1954).

voetnoot1
Bij de schatting is dankbaar gebruik gemaakt van tabellen van S.P. Hayes, ‘Tables of the standard error of tetrachoric correlation coefficient’, Psychometrika, 1943, 8, 193-203. Vóór de significantieschatting is de correctie van Jenkins toegepast, die echter in de matrix die de basis vormde voor de factoranalyse (Tabel 2.8.3), niet is aangebracht. Vooral de hogere waarden van rtet zijn door middel van correctie gereduceerd: r1-3 = .55 (in plaats van .64 op Tabel 2.8.3), r1-5 = .31 (in plaats van .357) enz. Zie hiervoor: W.L. Jenkins, ‘An improved method for tetrachoric r’ in Psychometrika, Vol. 20, no. 3, September, 1955, blz. 253-258.

voetnoot1
Hanan C. Selvin, ‘A critique of tests of significance in survey research’, American Sociological Review, 22, 1957, pp. 515-527; Robert McGinnis, ‘Randomization and inference in sociological research’, American Sociological Review, 23, 1958, 408-414 en de brieven aan de ‘editors’ door David Gold en J.M. Beshers. In Nederland: Ronald Freedman, ‘Some observations on sampling tests’, in Sociologische Gids, V, 1958, 114-118; en M.J. Brouwer en R.J. Mokken, ‘Over de bruikbaarheid van statistische toetsen in het sociaal wetenschappelijk onderzoek’, Sociologische Gids, VI, (1959), blz. 81-88.

voetnoot1
Herbert A. Simon, Models of Man, New York, 1957, p. 42 ff.
voetnoot1
Wij ontlenen de formules voor de partiële correlatie en de significantie hiervan aan Hubert M. Blalock Jr., Social Statistics, McGraw Hill, New York, 1960, blz. 335 en 356. Blalocks boek laat de statistische methode doelmatig aansluiten bij de recente sociologische meettheorie (‘scaling’) en geeft tevens een richtlijn voor de causale interpretatie van statistische toetsingen.

voetnoot1
Op. cit., blz. 350.

Vorige Volgende

Footer navigatie

Logo DBNL Logo DBNL

Over DBNL

  • Wat is DBNL?
  • Over ons
  • Selectie- en editieverantwoording

Voor gebruikers

  • Gebruiksvoorwaarden/Terms of Use
  • Informatie voor rechthebbenden
  • Disclaimer
  • Privacy
  • Toegankelijkheid

Contact

  • Contactformulier
  • Veelgestelde vragen
  • Vacatures
Logo DBNL

Partners

Ga naar kb.nl logo KB
Ga naar taalunie.org logo TaalUnie
Ga naar vlaamse-erfgoedbibliotheken.be logo Vlaamse Erfgoedbibliotheken