Skiplinks

  • Tekst
  • Verantwoording en downloads
  • Doorverwijzing en noten
Logo DBNL Ga naar de homepage
Logo DBNL

Hoofdmenu

  • Literatuur & taal
    • Auteurs
    • Beschikbare titels
    • Literatuur
    • Taalkunde
    • Collectie Limburg
    • Collectie Friesland
    • Collectie Suriname
    • Collectie Zuid-Afrika
  • Selecties
    • Collectie jeugdliteratuur
    • Basisbibliotheek
    • Tijdschriften/jaarboeken
    • Naslagwerken
    • Collectie e-books
    • Collectie publiek domein
    • Calendarium
    • Atlas
  • Periode
    • Middeleeuwen
    • Periode 1550-1700
    • Achttiende eeuw
    • Negentiende eeuw
    • Twintigste eeuw
    • Eenentwintigste eeuw
Idolen van de psycholoog (1964)

Informatie terzijde

Titelpagina van Idolen van de psycholoog
Afbeelding van Idolen van de psycholoogToon afbeelding van titelpagina van Idolen van de psycholoog

  • Verantwoording
  • Inhoudsopgave

Downloads

PDF van tekst (2.63 MB)

XML (1.17 MB)

tekstbestand






Genre

non-fictie

Subgenre

non-fictie/psychologie


© zie Auteursrecht en gebruiksvoorwaarden.

Idolen van de psycholoog

(1964)–J. Linschoten–rechtenstatus Auteursrechtelijk beschermd

Vorige Volgende
[pagina 120]
[p. 120]
‘L'homme de laboratoire est parfois porté à considérer le laboratoire et l'homme de laboratoire comme des facteurs constants dont il n'y a pas lieu de tenir compte.’ (Lagache; 212, 50).
‘It is in the social sciences that the coupling between the observed phenomenon and the observer is hardest to minimize.’ (Wiener; 394, 190).
[pagina 121]
[p. 121]

Hoofdstuk 3 de psycholoog als instrument

I. Inleiding

Het is snel gezegd, dat de psycholoog die een pp. onderzoekt, deze situatie moet opvatten als een waarin de ene black box de andere test. Heeft zo'n uitspraak zin? Wordt in het model niet juist geïmpliceerd dat een black box objekt van manipulatie door een subjekt is? Dat is inderdaad geïmpliceerd. In de onderzoeksrelatie schrijven we de onderzoeker andere eigenschappen toe dan de onderzochte. Maar dat toeschrijven geschiedt in funktie van het onderzoek. Rechter en verdachte, arts en patient, heerser en onderdaan, hebben verschillende eigenschappen, maar niet absoluut. De figuren zijn funktioneel onderscheiden. De rollen zijn verwisselbaar. De rechter kan verdachte worden, de arts patient, de heerser onderdaan. De eigenschappen van rechter, arts, heerser, worden hun toegeschreven volgens bepaalde spelregels. Zo kan de onderzoeker zich als black box denken: als een objekt waarvan een welomschreven aktie op pp. uitgaat, en dat de reaktie van pp. registreert. Een dergelijke beschrijving achteraf is echter niet genoeg. Het zal noodzakelijk zijn, psychologische proefsituaties naar vermogen zo op te bouwen, dat zij ook in feite maximaal aan het black box model voor de onderzoeker voldoen. Dan vermindert het gevaar dat hij, ondanks de bedoeling uitsluitend als manipulator te fungeren, in feite de gemanipuleerde zou kunnen zijn.

Dat is wat von Osten, Gelb en Goldstein overkwam. Zij dachten slechts hun ppn. te manipuleren, en vermoedden niet, dat zij via de pp. zichzelf antwoord gaven. De reakties waren resonnanties, geen responsies. De onderlinge onafhankelijkheid van manipulator en objekt was te gering. In andere woorden: hun koppeling te sterk. De twee black boxes verloren hun relatieve autonomie, en werden één dubbele box. In de proeven werd de integratie van het totale systeem vergroot tot er proprioceptie van de kommando's plaats vond. Spraakgebruik verbiedt om te zeggen dat in zo'n geval onderzoeker en onderzochte één enkel organisme vormen. Het zou ook daarom onjuist zijn, omdat niet al hun verrichtingen werden gekoppeld. Hun ademhaling, spijsvertering, dagdromen, motorische gewoonten, enz., bleven onafhankelijk van de ander gereguleerd. Maar dit zijn met het oog op de experimentele vraagstelling irrelevante verrichtingen. Wat de rele-

[pagina 122]
[p. 122]

vante verrichtingen betreft, ageren onderzoeker en objekt bij tijden als een dubbelorganisme met een enkel centraal zenuwstelsel. Het loont de moeite, het probleem van de interdependentie van onderzoeker en objekt eens in zulke termen door te denken.

Vruchtbaarder lijkt ons nog een analytische beschouwing die van dergelijke organismische analogieën geheel afziet, zonder het probleem te verwaarlozen dat er in besloten ligt. De interdependentie kan beter worden omschreven en onderzocht, wanneer we onderzoeker en objekt ‘oplossen’ in een op verschillende wijzen organizeerbare verzameling van variabelen. Alvorens dat in de tweede helft van dit hoofdstuk te doen, beschouwen we de psycholoog in de eerste helft nog als een eenheid; als een instrument in de strikte zin van het woord. Als- een black box waarvan we wel de gebruiksaanwijzing kennen, maar niet de strukturele en funktionele feilen.

Het materiaal voor deze beschouwing is eklektisch vergaard; er wordt geen representativiteit voor de omvangrijke litteratuur gepretendeerd. Daarmee is niet gezegd dat de besproken problemen geen, of geen echte problemen zouden zijn. Het gaat ons meer om de indikatie en de formulering van de problemen, dan om het konstrueren van een oplossing die in alle opzichten bevredigt.

2. Dertig procent neurotici

De neurose is een sociose, leert Van den Berg; ‘... de moderne mens is uitgenodigd zijn psychische gezondheid in relatieve gestoordheid te genieten’ (359 18). Deze uitnodiging wordt hem aangereikt door onze samenleving, die krachtens een neurotizerende struktuur neurosen oproept. De auteur heeft een aantal facetten van deze struktuur even boeiend als indringend beschreven. Is zijn standpunt juist? Met het stellen van de vraag is het standpunt niet verworpen. Men kan het evenmin verwerpen als onderschrijven. Het woord ‘neurose’ is voornamelijk door zijn vaagheid en veelzinnigheid in trek (om van het suffixanalogon ‘sociose’ maar te zwijgen). Toch zullen we even aannemen dat het iets omlijnbaars betekent. Wat zijn dan de konsekwenties van het sociosegezichtspunt?

De neurose wordt uitgelokt door de samenleving. Verander die samenleving, en er worden minder, of meer, of andere neurosen uitgelokt. Maar dat is een gemeenplaats! Iedere ziekte, ieder gedrag, iedere verrichting zonder uitzondering is, voor een zeker deel, door de omgeving uitgelokt. Ook eenvoudige verkoudheid is een sociose in zo verre, dat een samenleving zonder verkoudheidsvirus geen verkoudheid uitlokt. Maar sommige mensen zijn gevoeliger voor dat virus dan andere. Wat in het sociose-

[pagina 123]
[p. 123]

standpunt naar voren komt, is het oude probleem van endogeen versus exogeen, genotype tegenover fenotype, aanleg of milieu, natuur en kultuur. Men kan in al deze gevallen het een niet zonder het ander definiëren, men

Tabel 4 Naar Hirschmann (159, 77). N is het aantal onderzochte rapporten per periode.

periode N neurotici
1919-'24 447 30,0%
1935-'39 1410 31,6%
1945-'49 719 27,7%
kan de termen niet scheiden doch slechts onderscheiden, en nimmer de een volledig afhankelijk van de ander maken. Maar we moeten grenzen trekken, willen we oorzaken beschrijven. De sociogeneseteorie zoekt dan (in tegenstelling tot een aanlegsteorie) de oorzaak van neurosen overwegend in de samenleving. Hirschmann spitst het standpunt als volgt toe:

‘Wenn, wie behauptet wird, Umweltfaktoren allein eine dominierende Rolle beim Zustandekommen von Neurosen spielen sollen, so wäre zu erwarten, dass in Zeiten materieller Notlage und Unsicherkeit, des Kampfes um die Beschaffung primitivster Lebensnotwendigheiten, des Verlustes der Existenzgrundlage, des Flüchtlingselends, der Um- und Abwertung bisher gültiger ideeller Normen die innere Sicherkeit der Bevölkerung so stark erschüttert wird, dass hierdurch ein lawinenartiges Emporschnellen abnormer Erlebnisreaktionen zur Beobachtung gelangen müsste’ (159, 76 v.).

Ter toetsing van de hypotese analyzeerde Hirschmann een omvangrijk materiaal uit de Tübinger Nervenklinik. Het bestond uit psychiatrische rapporten over aanvragers van invaliditeitspensioen. Daar dit alleen wordt toegekend in geval van organische stoornissen, moeten de funktionele, c.q. neurotische stoornissen worden uitgezeefd. Het onderzoek betrof in hoofdzaak inwoners van Württemberg. Er werden drie perioden gekozen, waarin de Duitse samenleving naar struktuur en ideologie aanmerkelijk verschilde, nl. 1919-1924, 1935-1939, en 1945-1949. Uitgezocht werden de naar de huidige maatstaven als neurotisch te beoordelen gevallen (159, 77).

Nu de resultaten. Tabel 4 laat zien dat het percentage neurotici rond de 30% ligt ondanks de wel zeer verschillende tijdsomstandigheden. Hirschmann vermeldt verder dat zijn kollega Hutlein op 260 gevallen (chemische industrie) 87 neurotici vond: 33,4%. Ook deelt hij mee dat het percentage oorlogsneurotici na de eerste en de tweede wereldoorlog bij praktisch gelijk aantal onderzochten ook praktisch gelijk uitviel: resp. 30,5 en 30,4%.

[pagina 124]
[p. 124]

Het aandeel van mannen en vrouwen bleef in de drie perioden van het Tübinger materiaal gelijk; mannen werden tussen 20 en 25%, vrouwen in minder dan 10% van het aantal bestudeerde gevallen als neurotisch beoordeeld. Ook in dit opzicht is er dus konstantie, en geen veranderlijkheid.

Ook in detaillering bleef het beeld konstant. Na traumata van schedel en wervelkolom, en na reuma, treden meer neurotische stoornissen op dan na andere lichamelijke beschadigingen.

Volgens Hirschmann wijzen deze gegevens op een gelijk blijvende ‘Neurosenbereitschaft’ bij wisselende samenleving. Vrij vertaald: hoe de maatschappij er ook uitziet, er zijn 30% neurotici (onder de besproken groep van mensen). De konklusie dat van sociose geen sprake kan zijn, lijkt vrijwel zeker. De gegevens van Hirschmann verhinderen Mitscherlich echter niet, te beweren dat het in deze gevallen met zekerheid om ‘Sozialkrankheiten’ gaat (256, 205) - hetgeen de lezer (zonder enig cijfer) op gezag heeft aan te nemen.

Kunnen wij een konklusie trekken? Neen. Want Hirschmann heeft er niet aan gedacht, de diagnosen ook op de stellers van die diagnosen te betrekken. Teoretisch is het niet uitgesloten dat de konstantie van het neurosenpercentage betekent dat, ongeacht de samenstelling van het patiëntenmateriaal, eenvoudig 30% als neurotisch beoordeeld wordt. Wij laten het sociosedebat voor wat het is, en richten ons op de vraag naar de diagnostische gewoonten van de psycholoog. Is ons instrument goed geprogrammeerd?

3. Vier psychologen

Bij de vraag naar de diagnostische gewoonten van de psycholoog gaat het om de onderlinge overeenkomst tussen verschillende psychologen. Een wetenschappelijke beantwoording van die vraag heeft alleen zin wanneer men psychologen onderzoeken kan die in opleiding en ervaring niet te ver uiteen lopen. Men kan eigenlijk alleen in dat geval verwachtingen omtrent hun overeenstemming koesteren. Een dergelijke groep van psychologen werd inderdaad aan een onderzoek onderworpen.

Goldfarb deed proeven met vier psychologen, allen met de graad van Ph.D. in de psychologie, staflid van de VA (Veteran Administration) Mental Hygiene Clinic in Baltimore. Alle vier volgden zij hetzelfde VA Clinical Psychology Training Program, waren zij gewend diagnostisch te evalueren, hadden zij 2 tot 5 jaar in de genoemde kliniek gewerkt, en gebruikten zij het Diagnostic and Statistical Manual for Mental Disorders van de American Psychiatric Association (125).

[pagina 125]
[p. 125]

De onderlinge vergelijkbaarheid van dit viertal moet dus redelijk goed geacht worden. Goldfarb deed twee proeven met hen. De eerste laten we buiten beschouwing, omdat niet alle vier daarbij hetzelfde materiaal onder

Tabel 5 Naar Goldfarb (125, 393). Diagnoseverdeling over identiek materiaal bij vier psychologen (A-D). De nulhypotese (gelijke verdelingen) wordt verworpen met χ2 = 43,65; p <.001

kategorie A B C D tot. %
a psychofysiol. 13 2 16 3 34 8,5
b psychoneurot. 26 30 6 31 93 23,25
c psychotisch 16 15 14 19 64 16,0
d ‘personality’ 40 47 59 38 184 46,0
e hersenletsel 5 6 5 9 25 6,25
totaal- 100 100 100 100 400 100
ogen kregen. Bij de tweede proef, waar we nu verder over zullen spreken, was dat wel het geval.

De vier psychologen kregen ieder afzonderlijk dezelfde 100 klinische rapporten voorgelegd. Dit materiaal was van henzelf afkomstig. Elk van hen had 25 van deze 100 rapporten gemaakt. Uit alle rapporten werden die gegevens weggelaten, die identifikatie mogelijk maakten. Er werd ook geen kontakt toegestaan met de patiënten waarop de rapporten betrekking hadden. De psychologen kregen de opdracht in alle 100 gevallen uitsluitend op basis van het rapport een van vijf diagnosen te stellen. Welke dat waren, is te vinden in tabel 5. De tabel laat verder zien hoeveel gevallen elk van de vier psychologen (A-D) in ieder van de vijf diagnostische kategorieën a-e onderbracht.

De tabel wettigt de konklusie dat de verdeling van de diagnostische evaluatie over de psychologen een signifikant verschillende is. Individuele psychologen hebben verschillende voorkeur voor de (gestandaardizeerde) diagnosen in hun toepassing op dezelfde mensen. Letten we nog eens bijzonder op de extreme verschillen, door voor elk van de vijf diagnostische kategorieën het verschil tussen het hoogste en het laagste percentage te berekenen, dan vinden we voor (a) 14%, (b) 25%, (c) 5%, (d) 21%, en (e) 4%. Voor het individu maakt het dus wel wat uit, door welke psycholoog zijn diagnose wordt gesteld.

Het valt dan te verwachten, dat de eenstemmigheid van het viertal niet verbluffend groot zal zijn wanneer rekening wordt gehouden met de

[pagina 126]
[p. 126]

individuele gevallen. In tabel 5 werden de diagnoseverdelingen bekeken. Het zou best kunnen zijn, dat de 13 gevallen die A onder diagnose a heeft gebracht, bij B onder diagnose b, bij C onder diagnose c zijn gevallen.

Tabel 6 Naar Goldfarb (125, 394, Overeenstemming in diagnosen over de individuele 100 gevallen, verwerkt it tabel 5.

1 = 2 = 3 = 4 32 unanimiteit
1 = 2 = 3 ≠ 4 40 drie eens
1 = 2 ≠ 3 = 4 15 in paren eens
1 = 2 ≠ 3 ≠ 4 12 twee eens
1 ≠ 2 ≠ 3 ≠ 4 1 kwatranimiteit

Tabel 7 Paarsgewijze overeenstemming in gestelde diagnose bij vier psychologen over 100 gevallen.

B C D
A 60 63 62
B   58 58
C     53

Hierover staan gegevens ter beschikking. De mate van overeenstemming per geval wordt weergegeven in tabel 6. We lezen er uit af dat over 32 patiënten alle vier psychologen dezelfde diagnose stelden, over 40 patiënten drie van de vier het eens waren, enz. Afgewogen tegen de onderstelling dat psychologen met zo overeenkomende antecedenten, habitus en milieu als dit viertal eigenlijk steeds unanimiteit zouden moeten vertonen, is de mate van unanimiteit wel bedroevend.

We bekijken de vereenstemming nog op een andere manier, namelijk paarsgewijs. De gegevens zijn te vinden in tabel 7. We lezen er uit af dat A en B aan 60 van de 100 patiënten dezelfde diagnose toekenden, A en C aan 63, enz. Gemiddeld stellen de vier psychologen paarsgewijs rond 59% gelijke diagnosen.

Zijn de psychologen het meer met zichzelf eens dan met hun kollega's? Van de 100 rapporten had ieder er 25 aan het proefmateriaal bijgedragen. Zij hadden daar oorspronkelijk, vóór de proef, al een diagnose op ge-

[pagina 127]
[p. 127]

baseerd. Stellen zij nu tijdens de proef van Goldfarb over hun eigen rapporten weer dezelfde diagnose als eerst? Goldfarb ging dit na. Het aantal gevallen waarin zij dezelfde diagnose stelden (maximaal 25 per psycholoog)

Tabel 8 Overeenstemming van psychologen met zichzelf bij herhaalde diagnosestelling over eigen materiaal.

psy I II I+II %
A 16 16 32 64
B 16 15 31 62
C 13 15 28 56
D 17 14 31 62
M 15,5 15 30,5 61
is vermeld in kolom I van tabel 8. In kolom II zijn de uitkomsten weergegeven van een tweede dergelijke proef met 25 andere gevallen. Ieder stelde met een tussentijd van twee weken tweemaal een diagnose op basis testgegevens, door hemzelf verzameld. De uitkomsten kunnen bij die van kolom I worden opgeteld. De gemiddelde overeenstemming van de psycholoog met zichzelf ligt rond de 60%. Dat is vrijwel hetzelfde percentage als we vonden voor de overeenstemming met een kollega. Intra- en interpersoonlijke overeenstemming zijn van dezelfde orde. Bij herevaluatie maakt het dus statistisch niets uit of dit door dezelfde, of door een andere psycholoog wordt gedaan.

Aanknopend bij het vermoeden, uitgesproken n.a.v. de konstantie van de 30% neurotici bij Hirschmann, mogen we vaststellen dat de relativering van de diagnosestelling op de steller van de diagnose in ieder geval tot interessante gezichtspunten leidt. Uiteraard kunnen we met behulp van Goldfarb's gegevens noch bevestigen noch ontkennen dat die konstantie aan diagnostische gewoonten moet worden toegeschreven. Met die mogelijkheid moeten we wel rekening houden.

Kort samengevat: (1) De manier waarop verschillende psychologen hun gevallen over diagnostische kategorieën verdelen, is een signifikant verschillende. (2) Paarsgewijze overeenstemming in diagnose treedt op in 59% der gevallen. (3) Bij herhaling van de diagnosestelling stelt eenzelfde psycholoog in 60% van de gevallen dezelfde diagnose als de eerste keer. Het zijn niet onverdeeld verheugende gegevens. Een precizie-instrument schijnt de psycholoog niet te zijn.

[pagina 128]
[p. 128]

4. Terapeutisch intermezzo (i): beoordeling van en voor terapie

Eysenck deelt mee dat van neurotische patiënten die met een psychoanalytische of eklektische psychoterapie worden behandeld, ongeveer tweederde geneest. Van neurotici die door de huisarts worden behandeld, of simpelweg goed worden verzorgd, genezen er twee van de drie (88, 198). In deze simplistische vorm, zo waarschuwt hij zelf, is een beoordeling van het nut van psychoterapie onbillijk - al wil Eysenck de feiten toch niet weerspreken. Barendregt spreekt iets positiever over de resultaten van psychoterapie, maar ook niet jubelend (12, 157 vv.).

We bezien een onderzoekje over de toedeling van patiënten aan twee verschillende vormen van terapie (Garetz e.a.; 114). Zevenentwintig blanke oudstrijders die zich bij een mental hygiene clinic meldden voor behandeling, werden als volgt verdeeld. Dertien van hen (groep 1) werden op grond van klinische beoordeling hetzij chemoterapeutisch, hetzij psychoterapeutisch behandeld, en wel volgens het beste gezamenlijke oordeel van psychiater, psycholoog, sociaal werker, en psychoterapeut. De veertien overigen (groep 2) werden volgens een tabel van toevalsgetallen aan een van beide vormen van terapie toegedeeld. De twee behandelende psychiaters kozen hun eigen chemoterapeutika; zij zagen de hiermee behandelde patiënten twee maal per maand gedurende 15 minuten. De psychoterapiepatiënten zagen zij wekelijks gedurende 30 tot 50 minuten. Na drie maanden behandeling beoordeelden zij alle gevallen op verbetering. Vooruitgang vertoonden er 10 van groep 1, en 11 van groep 2. Het verschil is niet signifikant. Klinisch verantwoorde terapie en toevallig gekozen terapie schijnen dezelfde resultaten op te leveren.

Het mag niet worden ontkend dat er tegen dit onderzoek wel bezwaren zijn in te brengen. De groepen zijn niet erg groot. De psychoterapeuten zijn waarschijnlijk niet van vooroordeel vrij geweest. De gesprekken van 15 minuten, tweemaal per maand met de chemo-patiënten gehouden, kunnen als psychoterapie gewerkt hebben. Maar ons vertrouwen in de klinische beoordeling door een team van deskundigen is toch niet bepaald groter geworden. Wat doen die deskundigen eigenlijk?

5. Diagnose, beoordelen, sorteren

In het voorgaande is bij herhaling sprake geweest van ‘het stellen van een diagnose’. Van Dale omschrijft ‘diagnose’ als het onderkennen ener ziekte of kwetsuur uit de verschijnselen; oneigenlijk ook van andere toestanden die met

[pagina 129]
[p. 129]

een ziekte vergeleken worden. Een psychologische diagnose heeft dus betrekking op psychische toestanden, syndromen, persoonlijkheidsbeelden, karakters, enz. Over de precieze definitie kan lang worden gedelibereerd. Gemakkelijk, haast vanzelfsprekend wordt daarbij geïmpliceerd dat diagnosestelling betrekking heeft op een konkrete persoon Albert of Berend. De psycholoog probeert hem in zijn individualiteit te ‘schieten’, ‘door te krijgen’, beschrijvend te klassificeren of begrijpend te verstaan. In een diagnose wordt een beeld van een persoon ontworpen in kategorieën die men psychologisch relevant acht. De diagnose, betrokken op een persoon, dient als grondslag voor een behandelingsvoorschrift of een voorspelling van gedrag.

Het is de vraag of het begrip ‘diagnose’ met deze konnotaties bruikbaar is; of men niet veeleer zou moeten denken in de richting van een tweede definitie, door Van Dale als biologische betekenis gegeven: Beschrijving van de hoofdkenmerken van een soort, een geslacht, enz. De diagnose is dan niet op de persoon gericht, maar op een verzameling van personen, een klasse; beoogt niet een inzicht in een individuele struktuur, maar een klassifikatie.

Van diagnostizeren als inzicht verwervende aktiviteit is geen adekwaat model te maken. Het kan niet machinaal, omdat het in enige vorm de geest, en diens funkties als begrijpen, invoelen, intuïtie, enz. impliceert. Als de psychologie bezig is de geest af te zweren, dan liever radikaal. Dan moet het spook van de ‘klinische blik’ en het ‘sympatisch invoelen’ worden uitgebannen; even goed als de romantische kreatie van ‘een beeld ... van deze mens in zijn wereld’ (Beets; 17, 16).

Zulke spoken worden naar mijn mening juist opgeroepen, wanneer men met Dijkhuis van ‘beoordelen’ gaat spreken. Dat is ‘een waarderen volgens normen’, die moeten worden gevonden op grond van kwalitatieve analyse van het kriteriumgedrag waaraan de oordelen gevalideerd worden. Kwalitatieve analyse leidt er volgens Dijkhuis toe, dat strukturering als objekt van beoordeling moet gelden. Strukterering is ‘de wijze waarop degene die een gedragsopgave volbrengt aan de beantwoording van die opgave vorm en structuur geeft’. (77, 47). Het heeft geen zin, wetenschappelijke aktiviteit te baseren op een dergelijke vicieuze cirkel. Ik beschouw deze benadering reeds op terminologische gronden als onbruikbaar. Dat nu daargelaten. Hier wordt weer een individualizerende evaluatie aangeprezen. Dijkhuis stelt weliswaar dat het beoordelen niet op personen betrekking heeft, maar op strukturen, in feite wordt nog sterker dan in het begrip ‘diagnose’ de aandacht gevestigd op de individuele en unieke vorm, op het kwalitatief onherhaalbare. Immers: ‘Structurering is niet alleen een selectieve keuze uit mogelijke oplossingen, maar vooral een integratievorm met een eigen kwaliteit: het is een eigen verwerking’ (77, 47). Dit uniek eigene van de pp.

[pagina 130]
[p. 130]

wordt door de psycholoog volgens kwalitatieve normen beoordeeld. ‘Steeds blijft de persoonlijke interpretatie van de norm en de waardering hiervan in het gedrag door de beoordelaar een grote rol spelen’ (77, 148). In een meer recente publikatie draagt Dijkhuis dit over op het woord ‘diagnose’: ‘Wat veelal diagnose, of zoals de psycholoog zegt: persoonsbeeld, genoemd wordt, is in werkelijkheid de neerslag van een proces, waarbij niet alleen de cliënt maar evenzeer de psycholoog zelf is betrokken. Deze betrokkenheid van de psycholoog betekent niet alleen dat hij zijn oordelen subjectief selecteert en daarbij eigen concepten toepast, doch nog meer dat het materiaal dat hij verkregen heeft afhankelijk is van de relatie die hij met de cliënt heeft opgebouwd’ (78, 7 v.). Hiermee wordt een probleem aangesneden waar we uitvoerig op zullen ingaan (p. 161 vv.). We kunnen ons er niet bij neer leggen, zoals Dijkhuis doet. Dan immers, zou de subjektieve interpretatie in de psychologie steeds een grote rol blijven spelen, en kon men er licht toe komen, het gebrek aan unanimiteit tussen de vier psychologen van Goldfarb te accepteren als rechtmatige tol aan deze subjektiviteit. Naar mijn gevoelen blijft dat gebrek een inacceptabel gebrek. Als het instrument dat psycholoog heet met zo'n gebrek behept is, dienen we betere instrumenten te ontwerpen. Daartoe is het nuttig, de term ‘instrument’ serieus op te vatten. De psycholoog wordt o.a. gebruikt om mensen te sorteren. De psycholoog fungeert in dit opzicht als sorteermachine.

Het model is ontleend aan Pearson's beschrijving van de geest als ‘sorting-machine’ (268, 106 v.). Diagnostizeren is een koele en nuchtere beschrijvingstechniek: klassifikatie op grond van formele, 1iefst kwantitatieve, kenmerken. Het is niet gericht op het individu, maar op een klasse. Diagnostizeren onderstelt verscheidene, onderling verschillende, klassen, en is de differentiële toeordening van exemplaren aan klassen; een statistische aktiviteit waarbij formele objekten worden gedistribueerd over de verschillende cellen in een verdeelapparaat. Niemand verwacht dat een sorteermachine feilloos werkt. Iedere statistische aktiviteit impliceert een zeker foutenpercentage; of liever, de sorteermachine werkt volgens waarschijnlijkheidsbeginselen. De inventarizatie van kenmerken zal zelden volledig zijn; verschillende klassen kunnen bepaalde kenmerken gemeen hebben: de indeling van een objekt in een klasse is een waarschijnlijkheidsoordeel.

6. Goldfarb's psychologen als sorteermachines

Wij zullen dan de diagnostische prestatie van de psycholoog volgens waarschijnlijkheidsbeginselen beschouwen. De eerder beschreven proef van

[pagina 131]
[p. 131]

Goldfarb (p. 124 vv.) biedt hiervoor geschikt materiaal. We bekijken de vier psychologen als een bijzonder soort van black box, namelijk als sorteermachines. De implikaties van het model zijn voor de gegeven proef de volgende.

(a)Dezelfde 100 objekten (rapporten) zijn door alle vier gesorteerd, d.i. verdeeld over vijf (diagnostische) klassen a-eGa naar voetnoot*.
(b)Wij weten niet of dit goed of slecht is gebeurd, alleen dat het is gebeurd.
(c)Ondersteld wordt, dat door de vier machines op overeenkomstige wijze wordt gesorteerd; d.i. zij hebben een vergelijkbare interne struktuur en zijn op vergelijkbare wijze geprogrammeerd (idealiter zijn ze onderling verwisselbaar). Wat kan op basis van Goldfarb's gegevens over deze onderstelling worden gezegd?

(1) Elk van de vier machines A-D heeft een individueel sorteerprogramma. We nemen voorlopig aan dat dit programma onafhankelijk van de attributen van het gesorteerde materiaal fungeert. Het is dus een eigenschap van A dat hij, ongeacht de aard van het materiaal, 13% in klasse a sorteert, 26% in b, 16% in c, enz. (tabel 5). Dit is het probleem waarmee we ons gekonfronteerd zagen bij de beschouwingen van Hirschmann (p. 124). Zelfs als wij A 100 neurotici (wat dat dan ook zijn) toevoeren, of 100 normalen, wijst hij er daarvan 16 toe aan klasse c: psychotici. We beschouwen de machine dus als een statistische verdeler, waarin ieder objekt dezelfde kansen heeft, in één van de vijf cellen terecht te komen, de cellen zelf echter een vast percentage opeisen. Soortgelijke aannamen maken we voor B, C, en D.

 

(2) Zulke statistische verdelers kunnen volgens verschillende distributietechnieken worden gebouwd. We beschouwen eerst de volgende: De kans op sortering in een van de klassen is voor alle klassen dezelfde (pi = 0,2). Worden de verdelingen van de machines afzonderlijk, en van alle machines gezamenlijk (gegevens van tabel 5) tegen deze hypotese getoetst, dan resulteren de uitkomsten van tabel 9 kolom I. Voor elk der machines afzonderlijk, en voor hun gezamenlijke prestatie, moet de hypotese worden verworpen. De machines zijn geen gelijkverdelers.

 

(3) Een tweede distributietechniek is die van de normaalverdeler. Bij vijf

[pagina 132]
[p. 132]

klassen ondergaat het objekt vier opeenvolgende subsorteringen met een kans van 0,5. Zijn kans om in een van de vijf eindklassen terecht te komen is pi = (4/i).(1/2)4. Om deze hypotese te toetsen geven we de vijf katego-

Tabel 9 De gegevens uit tabel 5 worden in kolom I getoetst tegen de nulhypotese pi = 0,2; in kolom II tegen pi = (4/i).(1/2)4.

I II
χ2 p χ2 p
A 36,30 <<.001 10,99 <.05
B 68,70 <<.001 10,31 <.05
C 99,70 <<.001 47,07 <<.001
D 42,80 <<.001 5,79 >.20
tot. 204,77 <<.001 4,32 >.30
rieën a-e van tabel 5 resp. de klassenummers i = 0, 1, 3, 2, 4. Voor elke machine, en voor de machines gezamenlijk geven we eenzelfde klasse dus dezelfde plaats in de reeks van eindklassen. Worden de verdelingen tegen de hypotese getoetst, dan resulteren de uitkomsten van tabel 9 kolom II. De hypotese moet voor A, B, en C worden verworpen. Nu hebben we geëist dat alle machines op overeenkomstige wijze sorteren. Wij nemen daarom op grond van deze uitkomst aan dat zij geen van alle normaalverdelers zijn.

 

(4) Maar is die eis van overeenkomstige sorteertechniek wel te handhaven? Iedere machine wijst aan de vijf klassen verschillende aantallen objekten toe. Hierdoor is een rangorde der klassen per machine gegeven. Volgens tabel 5 sorteert A de meeste objekten in klasse d, vervolgens in b, in c, in a, en in e. We plaatsen ze volgens deze voorkeur van A daarom onder de rangnummers 1-5. We doen hetzelfde voor de andere machines. Het resultaat geeft tabel 10.

 

We kunnen nu voor elk paar machines de overeenstemming in voorkeur bepalen door hun rangorden te vergelijken. Een metode daartoe is de bepaling van het aantal inversies. Nemen we de rangorde van A als maatstaf (hoofdpermutatie 12345), dan kunnen we die van B schrijven als 12354; in de (A)B permutatie treffen we 1 inversie aan (5 gaat vooraf aan 4). In de (A)C permutatie 14325 vinden we 3 inversies (4 voor 3, 4 voor 2,

[pagina 133]
[p. 133]

3 komt voor 2). In tabel 11 worden voor alle paren de inversies bepaald, waarbij steeds de rangorde van het eerste lid als hoofdpermutatie geldt.

Om de betekenis van het aantal inversies te bepalen, gaan we uit van de

Tabel 10 Voorkeur van de vier sorteermachines voor de vijf diagnostische klassen a-d.

rangnummer
1 2 3 4 5
A d b c a e
B d b c e a
C d a c b e
D d b c e a

Tabel 11 De kans dat de permutatie Y van de hoofdpermutatie (X) het gegeven of een kleiner aantal inversies omvat, wanneer Y onafhankelijk van (X) en toevallig tot stand komt.

paar perm. inv. kans = p
(A)B 12354 1 5/120   .042
(A)C 14325 3 29/120   .242
(A)D 12354 1 5/120   .042
(B)C 14352 4 49/120   .408
(B)D 12345 0 1/120   .008
(C)D 15324 4 49/120   .408
onderstelling dat de rangorde van het tweede lid geheel onafhankelijk van die van het eerste lid, als een toevalspermutatie, tot stand zou zijn gekomen. Hoe groot is dan de kans dat de permutatie het gevonden aantal inversies omvat?

Bij 5 elementen zijn er 5! = 120 permutaties. De cijfers 1-5 kunnen op 120 verschillende wijzen worden gerangschikt. Dat in de permutatie (A)B geen enkele inversie optreedt (inv = 0), kan alleen voor het geval B = A. De kans hierop p(inv.-0) = 1/120. Dat B 1 inversie vertoont, is op vier wijzen mogelijk: 12354, 12435, 13245, 21345; elk daarvan heeft een kans van 1/120. Bij toevalspermutatie wordt de kans dat het aantal inversies (A)B gelijk is aan of kleiner dan 1: P(inv ≤ 1) = 5/120. Twee inversies laten zich op negen wijzen verwerkelijken, en dus p(inv ≤ 2) = 14/120. De

[pagina 134]
[p. 134]

kansen op de gevonden aantallen inversies vindt men in tabel 11. Is deze kans gelijk aan of kleiner dan.05, dan verwerpen we de nulhypotese, en nemen aan dat de overeenstemming in rangorde niet op toeval berust. We zien dan dat A, B, en D betrouwbaar overeenstemmen in hun relatieve voorkeur voor de kategorieën, terwijl C's voorkeur ten opzichte daarvan als kansfluktuatie beschouwd kan worden. Het is dus niet te gewaagd, altans voor A, B, en D een zeker gemeenschappelijk sorteerprogramma te veronderstellen. Of dit programma adekwaat is aan de verdeling van eigenschappen in het gesorteerde materiaal zelf, is een geheel andere vraag.

In ieder geval begint het er op te lijken dat psychologen met overeenkomstige antecedenten volgens dezelfde tendentie sorteren. Het is een verheugende konklusie. Het mag dan waar zijn dat het met betrekking tot het individu iets uitmaakt, door welke psycholoog zijn diagnose wordt gesteld, met betrekking tot de psychologen kan een redelijke overeenstemming in programmering niet worden uitgesloten. Nuchter beschouwd mogen we echter niet meer zeggen dan: kan niet worden uitgesloten.

 

(5) Laten we een stap verder gaan. We zagen (tabel 6) dat in 32% der gevallen de vier psychologen unaniem dezelfde diagnose stelden. Gezien vanuit het ideaal van volmaakt inzicht, en vanzelfsprekende unanimiteit, leek het niet zo'n uitmuntende prestatie. Bezien we de zaak naar zijn waarschijnlijkheid.

Hoe groot is de kans dat een en hetzelfde objekt, achtereenvolgens in de vier machines gebracht, door alle vier toevallig in een en dezelfde klasse wordt gesorteerd?

Werpt men een dobbelsteen, dan is de kans op zes ogen p(6) = 1/6. Werpt men twee stenen A en B, dan is de kans op twee zessen pab(6) = pa(6). pb(6) = 1/36. Wil men weten welke kans er is om überhaupt met beide stenen hetzelfde aantal ogen te gooien, dan moet men de kansen optellen: pab(1) + pab(2) + ... + pab(6) = 6 × 1/36 = 1/6.

Deze redenering is ook van toepassing op de sorteermachines, met dien verstande, dat de vijf klassen ongelijke kansen op toewijzing hebben, zowel inter- als intramachinaal. Om het model nog eens te verduidelijken: vier blinden sorteren knikkers van verschillende kleuren in vijf potjes; ieder van hen bevoordeelt op zijn eigen manier zijn vijf potjes verschillend; geen van hen kan op kleur sorteren. De kans op sortering van eenzelfde objekt in klasse a door alle sorteerders is P(a) = pa(a). pb(a). pc(a). pd(a). Hierbij moet worden opgeteld de kans dat het objekt door allen in klasse b wordt gesorteerd: P(b) = pa(b). pb(b). pc(b). pd(b). Evenzo voor P(c), P(d), en P(e). De som van al deze kansen P(i) is de totale kans dat de vier machines een objekt in dezelfde klasse sorteren (kans op unanimiteit in

[pagina 135]
[p. 135]
diagnosestelling door Goldfarb's vier psychologen). Met behulp van tabel 5 kunnen we deze totale kans berekenen:

illustratie

Aangenomen dat de vier psychologen, ongeacht welk materiaal aan kliënten aan hen wordt toegevoerd, steeds hun diagnosepercentages van tabel 5 zullen handhaven, mogen we dan verwachten dat in 4,4% der gevallen alle vier dezelfde diagnose zullen stellen. In feite vonden wij unanimiteit in 32% der gevallen, dat is 7,3 maal zoveel. Toeval? Voor de verwachting 4,4 tegen 95,6, en de observatie 32 tegen 68 is χ2 = 181. De kans dat deze afwijking op toeval berust, is duizelingwekkend gering!

Wij namen aan dat de machines weliswaar vergelijkbare verdelingen opleveren, maar dat het zaak van toeval (of willekeur) is, in welke klasse een objekt in hun statistische verdelers terecht komt. Klaarblijkelijk is dat geen zaak van het toeval. De vier machines sorteren m.a.w. wel degelijk op kenmerken van bet materiaal dat ze krijgen toegevoerd. De blinden zijn niet blind, de kleur van de knikkers speelt een rol.

 

(6) We willen dan volledigheidshalve ook onder dezelfde (zojuist verworpen) aanname de kans op paarsgewijze overeenstemmende sortering vergelijken met de feitelijk gekonstateerde paarsgewijze overeenstemming.

De kans op paarsgewijze overeenstemmende sortering

illustratie

is voor ieder paar berekend op grond van de percentages in tabel 5. De uitkomsten zijn gegeven in tabel 12. Voor alle paren is de geobserveerde overeenstemming tweemaal de verwachte. Gemiddeld is ̅o = .59, terwijl ̅e = .295. Na terugrekening op 100 gevallen vinden we χ2 = 41,84 of (bij df = 1) een betrouwbaarheidsdrempel p<<.001. De onderlinge overeenstemming moet worden toegeschreven aan het feit dat op kenmerken van het materiaal wordt gesorteerd.

 

(7) Op dezelfde wijze laat zich de kans op herhaling van identieke sortering door dezelfde machine berekenen als

illustratie

De hiervoor benodigde gegevens verschaft tabel 5. In tabel 13 worden de uitkomsten vergeleken met de gesummeerde geobserveerde gevallen van overeenstemming (tabel 8). Het betreft hier de in totaal vijftig eigen gevallen waarin de psychologen ieder tweemaal een diagnose stelden. Voor alle vier moet de nulhypotese verworpen worden. Het kan niet aan
[pagina 136]
[p. 136]

toeval worden toegeschreven dat de psychologen bij herhaling zo vaak dezelfde diagnose stellen als zij de eerste keer deden. Toch valt het in verhouding slechte resultaat van C op (zie de waarden van χ2). Wat is hier aan de hand?

Tabel 12 Geobserveerde overeenstemming per paar (tab. 7) en de overeenstemming die op grond van kans is te verwachten.

paar Po Pe
AB .60 .30
AC .63 .30
AD .62 .27
BC .58 .32
BD .58 .31
CD .53 .28
M .59 .295

Tabel 13 Betrouwbaarheid van het verschil tussen verwachte en geobserveerde overeenstemming met zichzelf.

Pe fo I+II fe I+II χ2 p
AA .27 32 13,5 34,73 <<.001
BB .34 31 17,0 17,47 <.001
CC .40 28 20,0 5,33 <.05
DD .29 31 14,5 26,45 <<.001

 

(8) Kijken we nog eens naar het overzicht van de individuele sorteerprogramma's (tabel 5). Daar blijkt C in 59% der gevallen in klasse d te sorteren. De kans dat hij hetzelfde objekt een tweede keer weer in klasse d sorteert, is pW(d) = 0,3481. Die kans op zichzelf is dus hoger dan de totale overeenstemmingskans van elk der andere machines (tabel 13). C heeft de gewoonte dat hij 59 van de 100 personen in de klasse ‘personality problems’ deponeert. Dat is misschien niet gek bedacht, bar efficiënt kan het niet zijn. Zijn stabiliteit (herhalingskans van dezelfde diagnosen) zou nog belangrijk toenemen wanneer hij alle personen in een en dezelfde klasse deponeerde. Zijn stabiliteitskoëfficiënt zou dan het maximum van 1 bereiken, terwijl zijn validiteitspercentage toch nog altijd niet minder zou zijn dan het gemiddelde van A, B, en D.

[pagina 137]
[p. 137]

Blijven wij even staan bij de termen validiteit en stabiliteit. Validiteit is een maat voor de sterkte van het verband tussen sortering en kriterium. Wij kunnen daarover strikt genomen niets zeggen, omdat gegevens over

Tabel 14 Validiteit en stabiliteit van de vier sorteerprogramma's.

A B C D
validiteit + + - +
stabiliteit .64 .62 .56 .62
stab. fraktie .51 .43 .27 .47
de juistheid van de gestelde diagnosen ontbreken. Echter: het kriterium voor de juistheid van een diagnose is niets anders dan maximale overeenstemming van de sorteermachines, waarvan wij nu hebben vastgesteld, dat zij inderdaad op materiaalkenmerken sorteren. Nu we niet beschikken over gedifferentieerde gegevens betreffende de mate waarin de individuele machines de individuele ppn. in dezelfde klassen sorteren als het algemene programma voorschrijft, kunnen wij de validiteit van hun sortering slechts kwalitatief als goed of slecht kenmerken. A, B, en D zijn dan goed, C is slecht (tabel 14).

 

Stabiliteit is bij tests een maat voor de overeenkomst in rangorde der onderzochte ppn. bij test - hertest. In onze samenhang is de stabiliteit van de machines de konstantie van het sorteringsprogramma (de diagnoseverdeling) van de ene run op de andere (met hetzelfde materiaal). Hiervoor hebben wij gegevens. De stabiliteit ligt voor alle machines rond de 60% (tabel 8). Wij zagen echter juist, dat het voor C geen grote moeite is, om stabiel te zijn. Een betere maat voor de stabiliteit dan het percentage identieke diagnosen ligt in de formule

Po-Pe/1-Pe.
We noemen dit de stabiliteitsfraktie: we trekken van de geobserveerde overeenstemming de kansmatig te verwachten overeenstemming af. Het overschot delen we door 1-pe, d.i. het verschil tussen ideale overeenstemming en kansmatige. Het is duidelijk dat de zo verkregen fraktie kan variëren tussen 0 en 1 (Po > pe). Nu komt volgens tabel 14 C er inderdaad slechter af dan de andere machines.

Onder ekwivalentie verstaan we bij tests de betrouwbaarheid, gemeten als overeenstemming in rangorde der onderzochte ppn. bij verschillende

[pagina 138]
[p. 138]

tests. In onze samenhang dus de overeenstemming in sortering door verschillende machines. We zagen reeds (tabel 12) dat deze paarsgewijze overeenstemming gemiddeld 59% was. De gemiddelde ekwivalentiefraktie

Tabel 15.

ekwival. po-pe/1-pe
po pe
AB .60 .30 .43
AC .63 .30 .47
AD .62 .27 .48
BC .58 .32 .38
BD .58 .31 .39
CD .53 .28 .35

Tabel 16 Betrouwbaarheid van de sorteermachines.

A B C D
A .51 .43 .47 .48
B   .43 .38 .39
C     .27 .35
D       .47
is .42. Gedifferentieerde gegevens zijn opgenomen in tabel 15.

Herschikken we de gegevens betreffende stabiliteit (tabel 14) en ekwivalentie (tabel 15), dan kunnen we tabel 16 samenstellen. Met behulp van stabiliteits- en ekwivalentiefraktie worden de machines met elkaar en met zichzelf vergeleken. C is en blijft de minst betrouwbare.

 

(9) Of over het geheel genomen de betrouwbaarheid van de vier machines hoog of laag moet worden geacht, is niet uit te maken. Er staat immers geen vergelijkingsmateriaal ter beschikking. Er is echter betrouwbaarheid, d.i. stabiliteit en ekwivalentie, en zij zijn per machine van dezelfde orde. Een geval waarin de stabiliteitsfraktie = 1,0 bij een ekwivalentie van 0, is niet ondenkbaar. Er is onder Goldfarb's materiaal geen geval dat in die richting wijst, integendeel. Wat wil het zeggen? Geheel afgezien van de validiteit

[pagina 139]
[p. 139]

van het sorteerprogramma, zijn de vier machines onderling verwisselbaar. Deze vier psychologen moeten niet beschouwd worden als individuele zielespeurders die ieder volgens eigen begaafdheid werken, subjektief selekteren en daarbij eigen koncepten toepassen (78, 8); zij zijn in serie vervaardigde instrumenten waarvan er één een fout vertoont. Het zijn geen precizie-instrumenten, maar ze zijn tenminste van redelijk konstante kwaliteit. Het wordt mogelijk, een fabrieksgarantie te overwegen. Het lijkt zinvol, de produktie te standaardizeren, en speurwerk te doen naar mogelijkheden van prestatieverbetering.

Maar het zou onverstandig zijn, te vroeg te juichen.

7. Uitgesproken vooroordeel

Bij wijze van kontrast met het voorgaande laten wij ons de psycholoog weer eens als mens schetsen - al is het om de inadekwatie van die tekening vast te stellen. Wij volgen Beets in zijn inaugurele rede (17, 13 vv.).

De psycholoog, zegt Beets, is niet gericht op een bepaald aspekt dat zich bij de mens kan voordoen, maar ‘op al het menselijke van deze ene mens. Alles wat hij tegenkomt binnen de ontmoeting met deze ene mens draagt ertoe bij dat hij zich een beeld kan vormen van deze mens in zijn wereld... Hij bevindt zich in een situatie waarin hij niet een geïsoleerd verschijnsel moet bekijken, maar al datgene wat verschijnt in samenhang tot al het andere’.

Beets (en elke andere psycholoog in wiens naam hier gesproken wordt) realizeert zich de enormiteit van een dergelijke uitspraak niet. Onderstel dat Sokrates, die in het hermeneutisch evalueren niet geheel onervaren was, op deze wijze zou hebben getracht zijn leerling Plato te psychodiagnostizeren. Al datgene wat verschijnt in samenhang met al het andere... In hoeveel tijd zou men daar mee klaar komen? Er is, helaas, een zowel formeel juist als materieel waar syllogisme: Alle mensen zijn sterfelijk; Sokrates is een mens; derhalve is Sokrates sterfelijk.

Het moet dus bescheidener. Niet alles met alles in samenhang brengen. Niet eens alle klinische gegevens met alle testgegevens. Ook Beets ziet dat in. Hoe lost hij het probleem dan op, wat met wat in verband te brengen? Dit is het antwoord: ‘Zijn situatie-analyse, zijn fenomenologische analyse zal hem aan bepaalde tests en aan de resultaten die deze opleverden, in het ene geval meer, in het andere minder waarde doen toekennen’ (17, 14). Waartoe dienen tests? Werden ze niet ontwikkeld om de psycholoog vrijer te maken van persoonlijke preferenties bij het sorteren van mensen? Om algemener, gereduceerder, abstrakter over mensen te kunnen oordelen? Neen, zegt

[pagina 140]
[p. 140]

Beets. ‘Door methodisch te onderzoeken, langs fenomenologische en meer natuurwetenschappelijke wegen ontdekken we verschijnselen, feiten, samenhangen, krijgen we inzicht en gaan we deze mens begrijpen, voor zover dat binnen ons vermogen ligt. Deze mens gaat als individu voor ons leven. Wanneer we ons over onze gegevens buigen en trachten al dit onsamenhangende te overzien, kunnen we methodisch te werk gaan. Maar tegelijkertijd gaan we ook juist niet methodisch te werk. Het zich een beeld vormen van een mens is in wezen altijd een scheppende werkzaamheid, die we in dit verband antropologische werkzaamheid zouden moeten noemen’ (17, 15).

Ik vrees dat dit beeld een idool is, de antropologische werkzaamheid idolatrie. Op de psychodiagnostische procedure van Beets is geen kontrole mogelijk. Ik citeer nogmaals. ‘De psycholoog ... wordt geacht in een korte tijd een groot aantal verschijnselen, met behulp van een aantal instrumenten, die verschillend gehanteerd moeten worden, te ordenen en te overzien. Het geheel der indrukken en verschijnselen, waaronder óók de testresultaten, die allen betrekking hebben op één mens, komt binnen zijn gezichtsveld. Hij moet zich dus vooral richten op onderlinge samenhang, op tegenstrijdigheden, op de wijze waarop verschijnselen elkaar aanvullen of tegenspreken, op de wijze waarop het ene het andere voorbereidt of onderdrukt. Hij probeert zoveel mogelijk indrukken en gegevens zinvol te omvatten’ (17, 13).

De vraag is: hoe? Hoe konstateert en verifieert hij samenhang en tegenstrijdigheid, afhankelijkheid en independentie? Wat betekent hier ‘zinvol’, wanneer het niet is: naar eigen smaak? Hoe denkt hij te ontkomen aan de beperktheid in verwerkingskapaciteit die voor alle mensen, en zelfs voor Sokrates, geldt? Er is maar één antwoord op dit hoe: door spelregels, door discipline, door wantrouwen van het eigen inzicht. Gewoonten van de sensus communis konditionneren ons voor de tuin der idolen, die bij nuchtere beschouwing een labyrint blijkt te zijn. Men vindt er de weg uit, door als Ariadne een draad te leggen, en van de daarmee vastgelegde weg niet af te wijken: een onderzoek volgens de regels, dus metodisch, afhandelen. Dat houdt in: afzien van persoonlijke gezichtspunten en het aanvaarden van een wetenschappelijk standaardgezichtspunt; afzien van de ‘volle rijkdom’, de ‘totale mens’, en het aanvaarden van redukta. Niet aan testresultaten nu eens meer, dan weer minder waarde toekennen; zij dienen om het willekeurig en variabel toekennen van waarde te verminderen.

De experimenteel psycholoog heeft het volgens Beets maar makkelijk! Hij ‘richt zich op bepaalde verschijnselen, die hij wil onderzoeken. Hij gebruikt een instrumentarium waarmee hij beter kan onderscheiden. Hij isoleert verschijnselen, concentreert zich daarop en daarmee ontgaan hem andere verschijnselen, maar dat wil hij ook. Zijn instelling, zijn vraag-

[pagina 141]
[p. 141]

stelling en de onderzoeksmethoden die hij kiest, zijn van natuurwetenschappelijke aard. Tellen, meten, berekenen is mogelijk en noodzakelijk omdat hij isoleerbare verschijnselen onderzoekt’ (17, 13). Neen! Omdat hij verschijnselen isoleert! Daarom onderscheidt zijn instrumentarium beter. Niet omdat de bepaalde verschijnselen geïsoleerd en wel in de natuur gereed liggen.

‘Rien n'est donné. Tout est construit’, roept Bachelard uit (10, 14). Als de psychodiagnostikus een instrumentarium wil hebben dat onderscheidt, dan zal hij verschijnselen moeten reduceren en isoleren. De experimenteel psycholoog zal hem gaarne behulpzaam zijn - zo nodig.

Zijn er stemmen die van verschraling spreken? De natuurkunde van Aristoteles was voller en rijker dan die van Newton - maar leidde niet tot TV (en is dat geen verrijking?). De kleurteorie van Goethe was humaner en inzichtelijker dan die van Newton (maar leidt zeker niet tot kleuren-TV). De natuurwetenschappen tellen, meten en berekenen; niet omdat de verschijnselen van Adam af zo gegeven waren, maar omdat ze zo zijn geformalizeerd. Omdat ze naar vermogen zijn ontdaan van hun ‘volle menselijkheid’ en daarom onpartijdig kunnen worden bekeken.

Wat is het verlies? ‘Ah! Sans doute nous savons bien tout ce que nous allons perdre! D'un seul coup, c'est tout un univers qui est décoloré, c'est tout notre repas qui est désodorisé, tout notre élan psychique naturel qui est rompu, retourné, méconnu, découragé. Nous avions tant besoin d'être tout entiers dans notre vision du monde! Mais c'est précisément ce besoin qu'il faut vaincre’ (10, 241). Dus geen verlies. Want buiten (en zelfs hier binnen) blijft de kleur; eten blijft smaken, en het natuurlijk psychisch élan wordt zelfs verrijkt door winst in een nieuwe dimensie: science is power, het vermogen, de macht, kennis toe te passen, en in de kleurige wereld der verschijnselen nieuwe en onvermoede effekten teweeg te brengen. Men heeft Newton toegebeten dat het niet aanging, de sterren van God's hemel te plukken; maar in de formulering van de wetten van zwaartekracht begon de vlucht van Gagarin en Glenn. Inderdaad: reculer pour mieux sauter. Een stap terug, de wereld iets minder uitdrukking van vervulde menselijkheid, de mens iets bescheidener over zichzelf, de psycholoog beschouwd als sorteermachine, zijn diagnostisch gedrag probabilistisch bezien. Het wachten is op de Newton van de psychologie.

De formulering die Beets aan de aktiviteit van de psycholoog geeft, is een uitgesproken vooroordeel: een variant op het mensbeeld van de sensus communis. In de wetenschap is dit een idool.

Wij keren terug tot het nuchterder model waarin de psycholoog als instrument wordt beschouwd.

[pagina 142]
[p. 142]

8. Beperkte kapaciteit

Het instrumentmodel stelt ons ook in staat, de beperkingen van de machine

Tabel 17 Naar Jones (184, 399). g.v.: gedeeltelijke vokabulaire. h.v.: gehele vokabulaire. v+b: gehele vokabulaire en begripstest.

g.v h.v v+b
klinici      
ekwiv. .955 .926 .862
valid. .686 .611 .711
       
studenten      
ekwiv. .834 .867 .762
valid. .446 .430 .485
beter te begrijpen - en te aanvaarden. Tabel 17 is ontleend aan een onderzoek van Jones (184). Drie psychologen (Ph.D. in klinische psychologie, 9-14 jaar ervaring) selekteerden twaalf schizofrenen op patologische zwaarte van het geval; elk van de drie stelde een rangorde op, die vervolgens in de groep van drie definitief werd vastgesteld (ekwivalenties in groepsrangordening van de 12 patiënten: ρ12 = .916; ρ13 = .948; ρ23 = .832; alle drie signifikant op 0,01 niveau). Deze orde gold verder als kriterium, met dien verstande, dat de patiënten met rangnummers 1, 3, 5, 7, 8, 10, 12 (N = 7) als goed diskrimineerbaar materiaal de grondslag vormden voor het verder onderzoek. Van alle zeven werden de WaisGa naar voetnoot* subtests ‘vokabulaire’ en ‘begrip’ afgenomen. Deze gegevens werden aan 96 personen ter hand gesteld met de vraag, de rangorde van patologische zwaarte vast te stellen met behulp van (groep 1): de halve vokabulaire, (groep 2): hele vokabulaire, (groep 3): hele vokabulaire en begripstest. Ieder van deze drie groepen van elk 32 personen bestond uit twee subgroepen: (a) 16 psychologen (Ph.D. en tenminste 4 jaar ervaring), en (b) 16 ‘undergraduate’ studenten aan Northwestern University. Het verschil tussen (a) en (b) moet dus wel groot worden geacht. De opgave daarentegen is vrij eenvoudig. Alle ppn. weten dat het schizofrenen betreft, en zij behoeven niets anders te doen dan rangordenen.

In tabel 17 vinden we de gemiddelde rangordekorrelatie-koëfficiënten voor de 6 subgroepen op het punt van ekwivalentie (onderlinge overeen-

[pagina 143]
[p. 143]

stemming) en validiteit (korrelatie met het kriterium). De validiteit var de psychologen is groter dan die van de studenten. De ekwivalentie ook, zij het in mindere mate. Op de gegeven verhoudingen is heel wat kommentaar te geven. Er is één opvallend punt, waar het nu om gaat. In de woorden van Jones: de toename van de hoeveelheid testmateriaal resulteert in signifikante afname van de ekwivalentie. Hoe meer materiaal (en het betreft maar twee subtests!), hoe minder eenstemmigheid.

Wat de validiteit betreft, vinden we voor beide groepen een verslechtering bij toename van vokabulairegegevens; een verbetering boven de oorspronkelijke validiteit uit, wanneer een nieuw type gegeven wordt toegevoegd. Dat toevoeging van nieuwe heterogene gegevens reeds betrekkelijk snel tot verslechtering van klinische prediktie (antwoorden op mmpi-vragen) gaat leiden, werd aangetoond door Barendregt (12, 5 vv.). Uit de onderzoekingen van Jones en Barendregt mag men (met enige voorzichtigheid) konkluderen dat de klinische prediktie relatief snel slechter wordt bij toenemend aantal gegevens.

Waarom zou dit zo zijn? Een interpretatie ligt voor de hand. De beste manier van benaderen is, het voorstel van Beets serieus op te vatten. De psycholoog moet alles met alles in verband brengen. We noemen dit ‘duiding in kontext’ of hermeneusis. Wat betekent dit metodisch?

Een onderzoek levert een aantal gegevens n. Bij een vokabulaire de definitie van het eerste woord, het tweede, enz. Bij een begripstest het antwoord op de eerste vraag, de tweede, enz. Volgens het voorstel van Beets moet gegeven (1) in relatie met gegeven (2), ... (n) worden gezien; (2) met (3), ... (n), enz. totdat alle n gegevens in alle onderlinge samenhangen (tweetallen, drietallen, enz.) zijn beschouwd. Wij zijn er dan zeker van dat wij met alle gegevens in de kontext der andere gegevens rekening hebben gehouden. Hoe ziet die rekening er uit?

Een relatie tussen twee of meer gegevens kan worden voorgesteld als de kombinatie van twee of meer elementen. Onder de grootte C van een kontext is te verstaan de som van alle kombinaties van alle elementen van die kontext in tweetallen, drietallen, ... k-tallen. Bij n elementen zijn er

illustratie

verschillende kombinaties van k elementen. Laten wij k toenemen van o tot n, dan wordt de som van alle mogelijke kombinaties

illustratie

Buiten beschouwing kunnen worden gelaten k = 0 en k = 1. De formule wordt dan

illustratie

[pagina 144]
[p. 144]

Levert dit bij n = 3 op C = 4, bij n = 10 hebben we al C = 210-11 = 1013 kombinaties. Het is geen onbillijke stelling, dat duiding-in-kontext met toename van het aantal gegevens een steeds onwaarschijnlijker taak wordt, en zelfs zeer snel onmogelijk. Geen psycholoog heeft de kapaciteit tot verwerking van informatie, die voor hermeneusis nodig is.

Eysenck kwam tot een soortgelijke konklusie als Jones en Barendregt: hoe groter de beschikbare hoeveelheid informatie aan testgegevens, hoe minder akkuraat de uiteindelijke prediktie (88, 149 v.). Zijn kommentaar sluit goed aan op onze overwegingen. ‘Het menselijk brein is geen bijzonder efficiënte machine voor het integreren van een groot aantal verschillende feiten. Het kan in dit opzicht niet konkurreren met de rekenmachine en de formules van de statistikus. Het wordt te gemakkelijk op een dwaalspoor gebracht door betrekkelijk onbelangrijke kwesties; het wordt te gemakkelijk beïnvloed door feiten die op zichzelf interessant mogen zijn, maar irrelevant voor de prediktie die gemaakt moet worden’ (88, 150).

Wij mogen de psycholoog als sorteermachine opvatten, hij is bepaald niet te vergelijken met een grote computer. Het heeft ook geen zin, een analyse van zijn prestaties op dat model te baseren. Het ligt juist daarom voor de hand, bij de interpretatieve arbeid het elektronisch brein in te gaan schakelen. Men kan het met Holtzman eens zijn, dat het gebruik van machines voor het verzamelen van anamnestische en test-gegevens niet erg ekonomisch lijkt; ook, dat de machine juist bij de verwerking van gegevens een geweldige besparing kan opleveren, en vergroting van de akkuratesse. Maar waar houdt ‘verwerking’ op, en gaat deze in ‘evaluatie’ over? Holtzman stelt dat de computer de psycholoog bij het evalueren niet vervangen kan (163). Hij blijft aan de voorzichtige kant. Voorlopig, zegt hij, beschikken wij in ieder geval niet over de programma's die daar voor nodig zijn (die van de psycholoog blijken anders ook niet te best te zijn). Dan is er dus geen principiële, maar een technische en tijdelijke onvervangbaarheid.

In het voorgaande ligt een duidelijke waarschuwing: voorkom evaluaties, interpretaties, en hermeneusis in de psychodiagnostiek. Deze opgaven kunnen door de menselijke psycholoog niet naar behoren worden vervuld. Naar wetenschappelijk behoren, wel te verstaan. Met onze kapaciteit tot verwerking van informatie moet de psycholoog maar niet teveel informatie op zijn vork nemen. De psychodiagnostiek is de psycholoog te machtig.

9. Een slecht voorbeeld

De pretentie dat een wetenschappelijk verantwoorde psychodiagnostiek

[pagina 145]
[p. 145]

met behulp van menselijke diagnostici mogelijk zou zijn, moet met grote skepsis worden beschouwd. Een omslag naar een andere opvatting, die een intuïtieve, op persoonlijke ervaring en inzicht berustende aanpak verdedigt, heeft misschien bepaalde voordelen, maar ontzegt zich iedere wetenschappelijke pretentie, en daarmee iedere aanspraak op algemeengeldigheid.

Toename van gegevens, geringer ekwivalentie. De psychologen kunnen het niet meer aan, beschouwen niet de gehele kontext, maar selekteren naar persoonlijke gezichtspunten. ‘Ik vind de vokabulaire belangrijk’, zegt A. ‘Haalt niet bij de inzichttest’, meent B. Het veld is open voor beoordeling - naar smaak. Die smaak betekent willekeur. Men kan het - met Beets - op een nette manier zeggen: ‘Zijn situatie-analyse, zijn fenomenologische analyse zal hem aan bepaalde tests en aan de resultaten die deze opleverden, in het ene geval meer, in het andere minder waarde doen toekennen’ (17, 14). Het blijft willekeur. Het is maar één stap naar een antropologische beeldvorming waarin niet alleen de evaluatie van testgegevens, maar ook het afnemen van de test zelf naar behoefte wordt gemodifieerd, zoals door Van der Zeyde werd gedaan.

Een kind wordt op intelligentie getest met de Stanford-Binet. Men berekent een I.Q. van 100. Men vindt dat op grond van zijn indruk van het betreffende kind wel laag. Men heeft gekonstateerd dat het tijdens het afnemen van de test slaperige reakties vertoonde. Mag men dan zeggen: ‘Die vlucht in de slaap veroorzaakte gedeeltelijk ... het lage intelligentiequotiënt’ (363, 178)? Of: ‘het prestatie-niveau is gedrukt ... door gebrek aan moed om aan te pakken wat hem moeilijk lijkt’ (363, 182)? Men mag uiteraard zeggen wat men wil. Maar waarom, wanneer men toch gaat zeggen wat men wenst, beroep gedaan op een I.Q., op een test? Wanneer men bovendien bij bepaalde vragen van de instruktie afwijkt omdat men uit pedagogische overwegingen wenst ‘de kinderen daarmee niet zo rauw op het lijf te vallen als de auteurs voorschrijven’ (363, 178)? Wie zijn het toch, die zo'n blind vertrouwen in tests hebben? Zij die menen dat de bedoeling om te testen voldoende is om wetenschappelijk geldige resultaten te verkrijgen. Zij die een termometer gebruiken nadat zij een ongedefinieerde proportie van het kwik hebben laten afvloeien. Zij, die een Rorschachprotokol bij het opnemen onderbreken wanneer een kind krokodillen ziet, op grond van de ‘diagnostische’ (1) overweging: ‘voorkomen moest worden dat het kind, nu de “krokodillen” zich weer opdrongen, het zou opgeven, en niets bruikbaars meer zou produceren’ (363, 184 v.); ‘bruikbaar’ betekent hier blijkbaar niet wat het kind uit eigen beweging duidt, maar wat de onderzoeker verlangt dat het duidt. Men verbiedt krokodillen wanneer die niet bij dat verlangen passen.

De stelling dat de psychodiagnostiek de psycholoog te machtig is, houdt

[pagina 146]
[p. 146]

geen verwijt in aan het adres van de psychologen. Zij is een uitvloeisel enerzijds van onze beperkte kapaciteit, anderzijds van de hoge graad van komplexiteit van menselijk gedrag. Intuïtieve metoden geven hier geen uitkomst die beter is dan de statistische en operationele aanpak. De laatste heeft het voordeel, wetenschappelijk georiënteerd te zijn, en de psycholoog te kunnen stimuleren tot het ontwikkelen van geautomatizeerde diagnostische procedures.

10. Terapeutisch intermezzo (2): toeval en deskundigheid

‘Tussen diagnose en therapie’ luidde de titel van Poslavsky's openbare les (281). Er is geen ‘tussen’. Operationeel zijn diagnose en prediktie, of diagnose en terapie, eenduidig gekoppelde termen. Het heeft praktisch geen zin dat de skala van diagnosen gedifferentieerder is dan de skala van terapieën, of omgekeerd. Diagnose is terapie-indikatie. Wat kunnen we vanuit dit gezichtspunt zeggen over het onderzoek van 27 veteranen dat hierboven ter sprake kwam (p. 128 vv.)?

(1) Welke kans bestaat er op een identieke diagnose tussen diagnostisch team (dt) en toevalstabel (tt)? Er zijn twee diagnosen beschikbaar: geschikt voor psychoterapie (= ongeschikt voor chemoterapie), en: geschikt voor chemoterapie (= ongeschikt voor psychoterapie); symbolen: ps en ch.

Voor tt geldt de toedelingstendentie pps = pch = 0,5. Zelfs al zou zij deze bezitten, de tt-metode maakt geen aanspraak op validiteit. De dt-metode doet dat wel. We mogen niet aannemen, dat de kenmerken ps en ch gelijk over de veteranenbevolking zijn verdeeld; we stellen dus voor dt: Pps = x, en dus Pch = 1 - x. We kunnen dan op eenvoudige wijze (tabel 18) de kans berekenen dat eenzelfde patiënt door dt en tt op dezelfde wijze wordt gesorteerd. Die kans is 0,5 en blijft 0,5, ongeacht de grootte van x. Nu werden de patiënten in feite niet tweemaal gesorteerd. Maar de twee groepen werden wel toevallig (en naar we aannemen, dus met dezelfde x-proporties) over dt en tt verdeeld. De redenering die tot tabel 18 leidde blijft dan van kracht, maar de konklusie luidt iets anders: de kans dat twee overeenkomende patiënten door dt en tt gelijkelijk worden gesorteerd, is 0,5. Of ook: de kans dat zij dezelfde terapie krijgen, is 0,5.

(2) Voor tt gold: pps = pch = 0,5. Nemen we aan dat de werkelijke proportie van patiënten die psychoterapie nodig hebben Pps̅ = y. Zij die deze terapie niet nodig hebben, maar dan dus wel chemoterapie, komen voor in de proportie Pch̅ = 1 - y. Volgens dezelfde berekening als in tabel 18 stellen we vast, dat ongeacht de grootte van y, de helft der patiënten volgens de tt-methode juist wordt behandeld.

[pagina 147]
[p. 147]

(3) Na drie maanden waren 11 van 14 tt-patiënten, 10 van 13 dt-patiënten, vooruitgegaan, χ2 = 0,01 P >.80. Het verschil is niet signifikant. Het succes van dt- en tt-metode is even groot. Geschiedde de toewijzing van

Tabel 18.

tt dt pe
pps .5 x .5x
pch .5 1-x .5-.5x
Σ 1,0 1,0 .5
patiënten door het dt-team van deskundigen wel op andere wijze dan door een toevalstabel? Aangezien dezelfde resultaten worden bereikt, kan men de toevalsmetode wel handhaven.

(4) Volgens kans (zie 2) wordt de helft van de tt-patiënten juist behandeld. Hieruit volgt een succes-verwachting van 7 tegen 7. Voor de nulhypotese dat de geobserveerde verbetering (11 tegen 3) hiervan niet afwijkt, is χ2 = 4,57; p < .05. De verbetering is niet aan kans toe te schrijven. Waaraan wel? Twee hypotesen doen zich voor: (a) Verbetering moet worden verklaard uit terapie, ongeacht de aard daarvan (alle terapie is psychoterapie); (b) verbetering berust niet op terapie, maar treedt spontaan op. De twee hypotesen hebben een gemeenschappelijke factor, nl. de tijd die voor verbetering nodig is: de tijd heelt alle wonden.

De zaak is hiermee niet afgedaan. Maar klaarblijkelijk is er wel iets tussen diagnose en terapie, nl. verregaande onkunde inzake struktuur en efficiëntie van terapeutische behandeling. Onderzoekingen als de juist behandelde kunnen daar verandering in brengen. Afgezien van alle bezwaren die men er tegen kan opperen, heeft een dergelijk onderzoek één kwaliteit die menigmaal bij de beoordeling van terapeutische effekten vergeten wordt: er was behalve de door deskundigen samengestelde proefgroep (dt), een kontrolegroep (tt). Was de laatste er niet geweest, dan hadden we met betrekking tot dt kunnen uitroepen: 10 van de 13 patiënten, of 77%, vertonen na drie maanden terapie verbetering! De deskundigen staan toch voor niets! Het belang van teamwork is weer overtuigend aangetoond! Wat die konklusies waard geweest waren, weten we inmiddels.

We hebben erkend dat het besproken onderzoek van Garetz c.s. een wat smalle basis is voor een generalizerend oordeel over de efficiëntie van psychoterapie. Toch
[pagina 148]
[p. 148]
is dit kleine onderzoek exemplarisch. Nog kort geleden merkte Eysenck op: ‘research in psychotherapy has for long been the despair of experimentally minded psychologists’ (89a, 1135). In de betreffende bespreking van een drietal recente boeken blijkt hem dat de simpele vraag ‘does it work?’ nog steeds niet bevestigend kan worden beantwoord. ‘De resultaten zijn nog weinig bemoedigend’, stellen Dijkhuis en Isarin vast (79,53). We kunnen verder gaan dan dat. Anno 1964 staat van het kostbare gezelschapsspel dat ‘psychoterapie’ heet, wetenschappelijk gesproken, niet vast of het enig nut bezit. Dit is met welwillendheid zo geformuleerd. De onderzoekingen die ter beschikking staan wijzen er eerder op dat aan psychoterapie geen efficiëntie kan worden toegeschreven.
Dijkhuis en Isarin geven een samenvattend overzicht van het wetenschappelijk onderzoek van psychoterapie. In zeer veel gevallen waar men effekten meende aan te tonen, ontbreken kontrolegroepen. Spontane verbeteringen (zonder terapie) of bij zeer oppervlakkige ‘behandeling’ door huisartsen, bereiken hetzelfde percentage als intensieve psychoterapieën. Voor uitvoerige verwijzingen naar de litteratuur zie men het verslag van Dijkhuis en Isarin. Onze konklusie hier is, dat de gepretendeerde successen geen verdere diskussie waard zijn.

II. Terugblik: psychologie zonder psycholoog

Onze eerste beschouwing van Goldfarb's resultaten leidde niet tot verheugende konklusies. Wij gingen uit van een ideaaltype, van de psycholoog die zijn tests met kundigheid hanteert, syndromen doorschouwt, menselijke gedrags- en belevingsstrukturen juist weet te beoordelen. Maar dat ideaal is gevormd binnen de sensus communis naar analogie van de goede mensenkenner, de wijze raadsman of zelfs leidsman, Langeveld's psychopompos (214, 26). Hoe gemakkelijk ontstaat het idool, dat men bij het sorteren van mensen anders te werk moet gaan dan bij het sorteren van erwten.

Voor de slechte verstaanders: mensen zijn geen erwten. Dat is ook niet gesuggereerd. Sorteren is indelen volgens soort. ‘Soort’ staat voor een verzameling van personen of zaken die zich door gemeenschappelijke kenmerken onderscheiden, en een kenmerk is een waarneembare gesteldheid in enig opzicht waaraan een zaak of een persoon zich doet kennen als behorend tot een bepaalde soort. Uiteraard zal de sorteeraktiviteit het materiaal moeten ontzien; men gaat met Chinees porcelein anders om dan met knikkers, en met mensen nog weer anders. Waarheden als koeien. Maar het sorteren gebeurt volgens dezelfde principes.

Daarom laten psychologen zich beschrijven als sorteermachines. Zij vertonen er kenmerken van. We hebben voor het viertal van Goldfarb vastgesteld dat zij volgens een programma zijn afgesteld. Hun onderlinge

[pagina 149]
[p. 149]

overeenstemming is niet door toeval bepaald, maar door ekwivalente programmering. Zij vertonen een zekere stabiliteit, en hun sorteringen bezitten een zekere intrinsieke validiteit. Zij verdelen mensen volgens waarneembare gesteldheden.

Zo gezien komt de psycholoog er beter af dan wanneer wij hem vanuit het zieleschouwende idool waarderen. De menselijke aktiviteit wordt door het machinemodel niet ontluisterd; ook niet verheven. Maar wel zakelijk meer adekwaat te beoordelen. Goldfarb konkludeerde dat zijn onderzoek als algemene uitkomst suggereert dat de diagnosestelling in hoge mate afhankelijk is van de diagnosesteller. Hernieuwde beschouwing in instrumentele en statistische termen voert tot een gunstiger oordeel over de psycholoog als sorteermachine.

Wij houden ons buiten de kontroverse tussen statistische en klinische prediktie, en voorkomen zo ook een moeizaam doorwerken van de reeds omvangrijke litteratuur op dit gebied. Onder ons gezichtspunt vloeien die twee gezichtspunten samen. Beide zijn onder het machinemodel samen te vatten. Trankell zegt bijvoorbeeld in een pleidooi voor een plaats van klinische prediktie naast de statistische, dat de klinische evaluatie ‘depends on the skill of the psychologists who do the work. The selection of examiners is therefore a problem of the same importance as the selection of tests in a mechanical prediction system. Not only the selection, but also the training of the examiners is a laborious task’ (349, 174). Vrij vertaald: klinische evaluatie is een funktie van validiteit en betrouwbaarheid van de sorteermachine. De keuze van een machine is daarom van hetzelfde gewicht als de keuze van een test, terwijl de programmering van de machine een moeizame taak is. De test is een voorzetstuk van de sorteermachine, een hulpinstrument voor de statistische verdeler.

De gegevens over de beperktheid in kapaciteit leiden tot de eis dat we de verwerking van gegevens zoveel mogelijk aan echte machines zullen overlaten. We hebben dan wel een ‘psychologie zonder psycholoog’ (Langeveld; 214, 13), maar met betere instrumenten. De psycholoog zelf zal, als wetenschappelijk onderzoeker, zijn taak beter kunnen vervullen. Dit geldt evenzeer voor de zuivere, als voor de toegepaste psychologie. In het voorgaande hebben we voornamelijk over problemen gesproken, die in de toegepaste psychologie tevoorschijn kwamen. Daarin lag geen kritiek op het feit dat psychologie wordt toegepast. De kritiek richtte zich op het tekortschieten in wetenschappelijke striktheid bij die toepassing. Zulke tekorten worden in de beoefening van de zuivere psychologie even goed aangetroffen.

De uitoefening van toegepaste en zuivere psychologie vallen onder dezelfde wetenschappelijke spelregels. In beide gevallen vloeien daaruit

[pagina 150]
[p. 150]

veel meer problemen voort dan alleen die, waar we onze aandacht op hebben gericht. Het model van de psycholoog als sorteermachine met beperkte kapaciteit dekt bij lange na niet al zijn funkties. Hij stelt ook hypotesen op, ontwerpt experimentele situaties ter toetsing daarvan, registreert de uitkomsten, en interpreteert ze. Hoe neutraal en objektief wordt daarbij te werk gegaan? De onafhankelijkheidsstelling vraagt opnieuw onze aandacht.

12. Vijf vraagstellingen

Er zijn redenen om te vragen of de formele verhouding van onderzoeker en objekt in diverse onderzoekssituaties wel steeds dezelfde is.

Een psycholoog onderzoekt zijn pp. De verhoudingen zijn duidelijk. Er zijn twee gescheiden en onderscheiden mensen, waarvan de een de ander onder variabele omstandigheden observeert. Twee systemen in tijdelijk kontakt, maar met een duidelijke afgrenzing t.o.v. elkaar. Op deze onderstelling rustte ook ons voorstel, de situatie te beschouwen als een koppeling van twee black boxes.

Bij meer gedifferentieerde beschouwing blijkt dit model niet in alle opzichten te voldoen omdat het berust op de fenomenaal voorgegeven zelfstandigheid en begrensdheid van organismen. Bij de beschrijving en analyse van de verhouding tussen onderzoeker en objekt kunnen wij deze natuurlijke grenzen niet altijd aanhouden. Er wordt een eenheid van situatie door gesuggereerd die de veelheid van formele verhoudingen gemakkelijk over het hoofd doet zien.

Eenzelfde beschrijving van een wetenschappelijke situatie kan op zeer verschillende verhoudingen betrekking hebben. Een experimentator onderzoekt zijn objekt. Aan een fiktief voorbeeld illustreren we de veelzinnigheid.

Eduard stelt flesjes Oostindische inkt bloot aan Röntgenstralen, en houdt ze daarna voor een soort Geigerteller. Wat doet Eduard, en wat voor soort konklusies trekt hij?

(1) Hij wil weten hoeveel van de geabsorbeerde elektronen O na een zeker tijdsverloop weer heeft prijs gegeven.

(2) Hij wil weten of verschillende emissiesterkten op de schaal van zijn instrument goed tot uitdrukking komen. Hij is dus bezig met een ijking van zijn instrument.

(3) Hij wil weten welke fouten hijzelf bij het aflezen van zijn geijkte schaal maakt.

(4) Hij wil de emissiekarakteristiek weten van Talens' Oostindische inkt.

(5) Om een alleen hem bekende reden wenst Eduard 0,1 liter Talens'

[pagina 151]
[p. 151]

Oostindische inkt zoveel elektronen uit X-stralen van 0,1234 Å te laten absorberen, dat er een gemiddelde emissie van k elektronen per tijdseenheid uit resulteert.



illustratie
afb. 8.


In alle vijf gevallen stelt Eduard flesjes Oostindische inkt bloot, etc. De ene beschrijving geldt voor vijf zeer verschillende vragen, die elk een ander type antwoord opleveren (afb. 8). De belangstellende buurman, die vraagt wat er uit komt, krijgt een van de volgende vijf antwoorden:

[pagina 152]
[p. 152]
(1)een e-kromme;
(2)de schaal is lineair;
(3)de grootte van de fout is F = k.u + c;
(4)nemen we de grootte van λ in de standaardkromme (1) als eenheid, dan is de waarde voor Talens = 1/2;
(5)na de eerste moest ik nog twee standaarddoses straling toevoegen om het gewenste effekt te krijgen.

Als buurman goed heeft opgelet, heeft hij opgemerkt dat de uitvoering van de proef steeds net iets anders was; dat Eduard in geval (2) en (3) extra meetinstrumenten heeft gebruikt, enz. De funktie van Eduard en van zijn objekt, van de experimentele ingreep en van de registratie van de uitkomsten, was iedere keer een andere. Wanneer Eduard bij het interpreteren van zijn resultaten die funkties niet goed uit elkaar houdt, produceert hij onzin in plaats van kennis.

Wat voor de toeschouwer als een en dezelfde gedragsreeks met kleine varianten verschijnt, als een relatie tussen steeds dezelfde twee fenomenaal zelfstandige objekten, moet analytisch worden beschreven als vijf verschillende koppelingsvormen, waarbij de grenzen van de gekoppelde systemen voortdurend wisselen. Dat het gefingeerde voorbeeld stralingsverschijnselen betrof, doet niets ter zake. De geschiedenis van Eduard is vertaalbaar in termen van psychologisch, of chemisch, of astronomisch, of sociologisch onderzoek. Of in wat voor soort onderzoek men maar wil, zolang het wetenschappelijk onderzoek is.

13. De onafhankelijkheidsstelling

Wanneer de psycholoog een pp. test, is zijn test een derde element in een verhouding die reeds twee elementen omvatte. Of niet? Volgens De Vries gebruikt de psycholoog de test ‘zonder meer als een verlengstuk van zijn waarnemingsmogelijkheden’ (69, 210); als een protese dus. Gewapend met zijn testbril kan de psycholoog zijn pp. gedetailleerder zien. Deze gedachtegang is te simplistisch. Ik citeer Lenzen.

‘Wanneer iemand een schrijftafel met de vinger aanraakt, is er een afscheiding tussen die twee. Een waarnemer kan echter door mechanische hulpmiddelen worden uitgebreid. Bohr heeft het volgende voorbeeld genoemd: wanneer iemand een lange stok stevig met de hand vastgrijpt en er een lichaam mee aanraakt, is het aangeraakte lichaam het objekt van observatie, de stok is een apparaat dat beschouwd kan worden als deel van de waarnemer ... Wanneer een natuurkundige naar een wijzer op een schaal kijkt, hangt de status daarvan af van het doel van de observatie.

[pagina 153]
[p. 153]

Gebruikt hij het instrument om een elektrische stroom te meten, dan is de wijzer een uitbreiding van de waarnemer; het objekt is de elektrische stroom. Wanneer de natuurkundige zijn instrument kalibreert, is de wijzer deel van het observatie-objekt; het licht waarin de wijzer wordt gezien is dan een instrument dat tot de waarnemer behoort’ (152, 110).

De verhoudingen zijn dus niet zonder meer duidelijk. En al waren zij het wel, dan mochten we bij het beeld van De Vries niet vergeten, dat een bril wel de visus kan korrigeren, maar niet de persoonlijke visie.

De psycholoog interviewt zijn kliënt en maakt van dat gesprek een verslag. Wat verslaat hij? Zelfs zogenaamde woordelijke verslagen worden volgens Kahn en Cannell (189) afgeronder en logischer dan het gesprek was. Al de halve zinnen die voor een gewoon gesprek zo kenmerkend zijn, verdwijnen. Het verlies wordt bij interviews met open vragen zelfs geschat op 50% (234). Rijksen en Van Bergen konstateerden bij interviews (psychologiestudenten) de neiging, vooral antwoorden van ondervraagden die zich neutraal uitlaten, te vertekenen (308). Er wordt dus in de zogenaamde objektieve verslaggeving reeds geïnterpreteerd. De ondervrager schrijft zijn eigen opvattingen aan zijn pp. toe. Hij lijft dus iets wat van hemzelf afkomstig is, bij pp. in.

Dit kan ook gebeuren wanneer men een bril opzet. Nicolaas Hartsoeker zag bij zijn onderzoekingen met de mikroskoop duidelijk een homunculus, een kompleet minuskuul mensje, in het spermatozoön liggen (Daumas; 59, 1197). Hoeveel sterker zal zo'n effekt kunnen zijn wanneer men geen werkelijke bril opzet, maar een test ‘als een verlengstuk van zijn waarnemingsmogelijkheden’ gebruikt. Het effekt werd ons gedemonstreerd door Van der Zeyde. Zij gebruikt een test, een protese, om te zien wat zij wil. In feite is in deze houding de onafhankelijkheidsstelling geïmpliceerd. Onderzoeker en objekt zijn onafhankelijke, zelfstandige grootheden. We hebben bij herhaling opgemerkt dat de onafhankelijkheid slechts voor de geformalizeerde observator geldt, en deze valt niet samen met de onderzoeker als persoon.

Het is naïef, te menen dat onderzoeker en objekt formeel gescheiden systemen moeten zijn omdat ze in onze beleving als gescheiden systemen fungeren. Teoretisch gaat de aktiviteit van de onderzoeker niet verder dan het kreëren van kondities waaronder de onderzochte ‘spontaan’ moet reageren. Praktisch kan dat ‘spontane’ gedrag wel gedetermineerd zijn door regelrechte, zij het onbedoelde, beïnvloeding door de experimentator. Hij registreert dan niet de gedragingen van een onafhankelijk, zelfregulerend objekt, maar van een afhankelijk, door hem gereguleerd objekt. In het extreme geval registreert hij eigen gedrag - zij het in vervreemding. Zo ging het von Osten en Gelb.

[pagina 154]
[p. 154]

Het heeft dus zin, de verhouding van onderzoeker en objekt niet langer te beschouwen in termen van hun vastomlijnde, fenomenale zelfstandigheid. Het is een idolum tribus om er aan vast te houden dat onder alle omstandigheden de dingen zo bestudeerd moeten worden als wij ze zien. De fenomenale zelfstandigheid van persoon of zaak is slechts uitgangspunt; voor het onderzoek van hun onderlinge relaties lossen wij ze zo nodig begripsmatig op in verzamelingen van variabelen, die op verschillende wijzen tot aggregaten kunnen worden samengesteld. Alleen op deze wijze kunnen draagkracht en betekenis van de onafhankelijkheidsstelling worden onderzocht.

14. Koppeling van systemen

Een meetinstrument beïnvloedt het gemeten verschijnsel. Dat is dikwijls een trivialiteit. Wanneer een termometer alleen de warmte van een stof kan aangeven door enige warmte aan die stof te onttrekken (of toe te voegen), dan meet hij niettemin warmte, zij het ook een iets andere dan de oorspronkelijk aanwezige. Bedenkelijker zou het zijn, wanneer de te meten warmte door het inbrengen van de termometer ontstond. Dat is wat in het geval von Osten plaats vond. De intelligentie van Slimme Hans was een funktie van de onderzoeksmetode. In de termen van Lenzen: het paard vormde een uitbreiding van de observator. De termometer mat uitsluitend zijn eigen warmte. Strikt genomen doen alle termometers dat. Maar de eigen temperatuur die zij aangeven is dan toch een funktie van de temperatuur in de gemeten stof. De toestand van systeem A indiceert de toestand van systeem B, die onafhankelijk van A tot stand is gekomen. Een von Osten-termometer indiceert uitsluitend de eigen temperatuur.

We moeten iets meer precizeren. We mogen niet vergeten, dat de temperatuur, gemeten in een pannetje water, wel door toedoen van de experinentator opgewekt kan zijn. De experimentator (E) oefent door een ingreep (x) dwang uit op zijn objekt (O), waarvan het resultaat (r) door een meetinstrument (m) wordt geregistreerd. We hebben daarmee de vijf variabelen (elk voor zich weer verzamelingen van variabelen) die ook in het verhaal over Eduard voorkwamen: (Eduard) (exponeert aan X-stralen) (Oostindische inkt) (registreert reaktie) (met meetinstrument), of kortweg: E, x, O, r, m. Daar E het meetinstrument afleest, hebben we een gesloten gedragskring E x O r m E. We onderscheiden hierin vijf in elkaar grijpende of overlappende fasen:

(a) stimulusfase E x O:E prikkelt O;
(b) reaktiefase x O r:O reageert op prikkeling;

[pagina 155]
[p. 155]

(c) metingsfase O r m:de reaktie bereikt het meetinstrument;
(d) waarnemingsfase r m E:E leest het instrument af;
(e) terugkoppelingsfase m E x:E regelt x bij.
De terminologie is op de verhouding tussen experimentator en objekt afgestemd. Voegt men tussen x en O nog een tweede meetinstrument n toe, dan is er volledige symmetrie, en worden E en O verwisselbaar. Deze mogelijkheid is op het ogenblik niet relevant.

Wij hebben twee systeemkernen E en O. Zij zijn per definitie relatief zelfstandig, d.i. ieder bezit een eigen interne gedragsregulatie, maar ook de eigenschap, op regulatieve invloeden vanuit andere systemen te kunnen reageren. In de wetenschap onderzoeken wij vormen en maten van aktiviteit van O, die al dan niet, en in grotere of kleinere mate, afhankelijk zijn van het ingrijpen van E. We onderzoeken dus het gedrag van O. Om beïnvloeding door E vast te kunnen stellen, moeten we E en O in verbinding brengen bij behoud van hun relatieve zelfstandigheid. Wij doen dit met behulp van de elementen x, r, en m, die zodanig aan de systeemkernen worden toegeordend, dat we van twee systemen kunnen spreken. De verbinding heet koppeling. Onder koppelingsvorm verstaan we de wijze waarop x, r, en m over de gekoppelde systemen zijn verdeeld (bij behoud van hun plaats in de gedragskring).

De funktie van deze variabelen is een andere in andere koppelingsvormen. Behoort m tot E, dan is het een receptor of zintuig; hoort m bij O, dan moeten we het beschouwen als effektor. De ingreep x is een handeling wanneer hij bij E behoort; een toegevoegde konditie (stimulus) wanneer hij bij O behoort. Behoort de reaktie r tot O, dan is het de door O gereguleerde uitwerking van x; maar r kan ook tot E behoren, namelijk als inwerking van O op E.

We onderscheiden in overeenstemming met de vijf fasen van de gedragskring, vijf koppelingsvormen die, hoewel zij steeds dezelfde gedragskring betreffen, vijf verschillende verhoudingen van E en O opleveren, en daarmee vijf verschillende wetenschappelijke situaties, die ook verschillend worden benoemd.

(1) Koppelingsvorm mEx-Or (afb. 9-1). Meetinstrument en ingreep behoren tot E. Het objekt van observatie omvat O en zijn reaktie. Voorbeeld: hoe gedraagt een stof zich bij verhitting? E voert warmte toe, leest het gevolg af, en varieert x n.a.v.m. De onafhankelijk variabele is x, de afhankelijke is r. Ander voorbeeld: hoe verandert de reproduktie van cijferreeksen met het tempo van voorzeggen? Deze koppelingsvorm wordt gekenmerkt door de terugkoppelingsfase. Wij noemen deze situatie

[pagina 156]
[p. 156]
(2) De koppelingsvorm Ex-Orm (afb. 9-2). De ingreep x behoort totde experimentator, reaktie en meetinstrument tot het objekt. Vb.: het vastleggen van een temperatuurschaal. De warmtetoevoer x wordt op een

illustratie
afb. 9 De vijf koppelingsvormen.


aantal waarden ingesteld, de resulterende m-waarden worden vastgelegd. Onafhankelijk is x, afhankelijk m(r). Ander vb.: het normeren van scores bij het nazeggen van cijferreeksen. E geeft verschillende tempi, en legt de resulterende m(r)-waarden vast. O is in dit geval een verzameling van ppn. De koppelingsvorm wordt gekenmerkt door de metingsfase. Wij noemen deze situatie kalibratie of normering.

(3) De koppelingsvorm rmE-xO (afb. 9-3). Reaktie en meetinstrument behoren tot de experimentator, de ingreep tot het objekt. Vb.: hoe nauwkeurig verwerk ik op mijn meetinstrument de reaktie die tot mij doordringt? Men kan denken aan de problematiek van waarnemingsfouten bij het

[pagina 157]
[p. 157]

aflezen van schalen (persoonlijke vergelijking!), of aan het oefenen van scoring. Onafhankelijk is x, afhankelijk is m(r). De koppelingsvorm is gekenmerkt door de waarnemingsfase. We noemen deze situatie zelfkalibratie of zelfnormering. In sommige gevallen wordt de situatie beter gekarakterizeerd door te spreken van interpretatie.

(4) De koppelingsvorm mE-xOr (afb. 9-4). Het meetinstrument behoort tot de experimentator, ingreep en reaktie tot het objekt. Vb.: hoe reageert een stof op een gegeven warmtetoevoer? Hoe reageert pp. op deze cijferreekstest? Wat is de resulterende temperatuur, c.q. score? Onafhankelijk is x (r), afhankelijk is m. De koppelingsvorm wordt gekenmerkt door de reaktiefase. Wij noemen deze situatie meting of test.

(5) De koppelingsvorm ExO-rm (afb. 9-5). Ingreep en objekt behoren tot E, reaktie en meetinstrument vormen een kwasi-objekt. Vb.: water verhitten tot 80o C. We laten het pannetje net zo lang op het gas staan, tot de termometer de verlangde temperatuur aangeeft. We laten de pp. zo vaak repeteren, tot hij de gewenste score haalt. Of de psycholoog schat de score van pp. (maar rekent die aan pp. toe). Of de psycholoog zegt voor hoe het moet, en noteert dat pp. de goede oplossing gaf. Psycholoog verbiedt krokodillen, en noteert dat pp. geen krokodillenduidingen gaf. Men zet gesprekken voort tot pp. voldoende verbaal is gekonditionneerd (terapie). In al deze gevallen registreert het kwasi-objekt rm de aktiviteit van E. Wij hebben hier geen onderzoekssituatie meer, maar een toepassingssituatie: op grond van zijn kennis van de eigenschappen van O (zijn reakties op bepaalde ingrepen), wordt O door E gedwongen, een bepaalde waarde op de m-schaal te bereiken. O is in het systeem van E opgenomen. De systeemverdeling voldoet niet langer aan de eis van relatieve zelfstandigheid van de twee systemen ten opzichte van elkaar (met betrekking tot de reaktie waar het om gaat). Science verschijnt als power. Deze situatie is geen wetenschappelijke onderzoekssituatie, maar gaat er soms wel voor door. In zo verre zullen wij hier spreken van spurieuzeGa naar voetnoot* koppeling.

Spurieuze koppeling levert hoogstens negatieve kennis omtrent O op, en dan nog niet eens konditionele. Wij vinden bijvoorbeeld, dat een bepaalde manier van voorzeggen niet werkt, maar weten nog niet waarom. Konditionele kennis wordt verworven wanneer systeem E weliswaar door x de reaktiviteit van O inperkt, maar deze toch onvolledig determineert,

[pagina 158]
[p. 158]

zodat r aan O kan worden toegeschreven; en wel niet uitsluitend aan het arsenaal van O's reaktiemogelijkheden, want dat kan in het geval van spurieuze koppeling ook. De reaktie moet aan O kunnen worden toegeschreven als reaktie onder O's eigen interne gedragsregulatie.

Nu moeten wij de koppelingsvormen (1) tot en met (4) niet als eens en voor al gedefinieerde, absoluut onderscheiden situaties zien; zoals gezegd, gaat het om een aanloop, die ons in het volgende Van nut kan zijn. Van direkt belang is het onderscheid met de spurieuze koppeling (5). Want ofschoon de gedragskring hier materieel dezelfde kan zijn als in de overige situaties, is de validiteit van in (5) verworven wetenschappelijke ‘waarheden’ nihil.

Toch kan ook het onderscheid tussen de andere koppelingsvormen bijdragen tot inzicht in ettelijke fouten van opzet en interpretatie van experimenten. De experimentator moet zich strikt houden aan zijn opzet, en de daarin besloten systeemkoppeling, om van zijn konklusies enigszins zeker te kunnen zijn. Hier doet zich herhaaldelijk iets voor, dat we faseverschuivingzullen noemen: uit een wetenschappelijke situatie met een bepaalde koppelingsvorm worden konklusies getrokken, alsof de koppelingsvorm een andere was.

15. Faseverschuiving bij Wertheimer

In een klassiek geworden artikel bespreekt Wertheimer het φ-fenomeen, beter bekend als stroboskopische beweging. Dit artikel geeft een fraaie demonstratie van een faseverschuiving. Wertheimer bedoelt verslag te doen van meting (mE-xOr), maar verschuift naar interpretatie (rmE-xO).

De stand van zaken bij stroboskopische beweging, zegt hij, is deze: 'Gegeven zijn successief twee objekten als prikkels; er vindt gewaarwording plaats; eerst wordt a gezien, daarna b; daartussen werd ‘de beweging van a naar b’ gezien; zonder dat de overeenkomstige beweging resp. de in tijd en ruimte kontinu opeenvolgende stadia tussen a en b werkelijk als prikkels geëxponeerd werden.

‘Het psychisch gebeuren zij - zonder enig vooroordeel - als a φ b gekarakterizeerd...; φ duidt aan wat buiten de waarnemingen van a en b gegeven is, wat tussen a en b, in de tussenruimte tussen a en b geschiedt; wat aan a en b wordt toegevoegd’ (387, 25 v.).

Kort geformuleerd beschrijft Wertheimer hier een zelfnormering of interpretatie alsof het een meting betrof. Waarom? Zijn ‘zonder vooroordeel’ gegeven deskriptie is er een vanuit het gezichtspunt van de experimentator die weet wat er gebeurt. De onderzoeker kreëert als konditie de

[pagina 159]
[p. 159]

successieve expositie van de prikkels a en b (een horizontale en een vertikale). Pp. neemt waar, en geeft zijn reaktie verbale vorm: ‘Draaiing van een lijn uit vertikale naar horizontale positie’ (387, 24). Pp. heeft niet eerst a gezien, dan b, en daartussen φ; hij zag een lijn die zich draaide, en zegt dat. In de koppelingsvorm ‘meting’ zou de zaak hiermee af zijn: mE-xOr. De reaktie behoort tot pp. Wertheimer neemt nu vervolgens r als deel in zijn eigen systeem op, en herformuleert: pp. ziet iets wat er (bij mijn weten) niet was, hij ziet dus tussen a en b iets dat we φ zullen noemen. Wanneer Wertheimer later over ‘zuivere φ’ gaat spreken, ontleent hij dit begrip aan een faseverschuiving, niet aan zijn ppn. De beschrijving van het φ-fenomeen stamt uit de situatie (3): rmE-xO, en niet, zoals Wertheimer meent, uit (4): mE-xOr. Er heeft faseverschuiving plaats gevonden. De beschrijving van het φ-fenomeen door Wertheimer geeft geen valide kennis.

16. Faseverschuiving bij Rorschach-onderzoek

Interessant zijn faseverschuivingen in de psychodiagnostiek. Ik kies als voorbeeld voornamelijk de Rorschachtest, omdat daarover veel is gepubliceerd dat voor beschouwing in termen van faseverschuiving bruikbaar is. Een litteratuuroverzicht van 105 artikelen geeft Masling (246). Een gedeelte daarvan betreft dezelfde problematiek bij andere projektieve tests.

Een reeks van platen wordt pp. ter duiding voorgelegd. De bedoeling is, zijn reakties op standaardmateriaal en standaardprocedure uit te lokken. Ondersteld wordt dat in de duidingen innerlijke determinanten van het gedrag tot uitdrukking komen. Zowel door Rorschach zelf als door latere onderzoekers is de test statistisch gekalibreerd of genormeerd, d.i. de scoring m = f (r) is vastgelegd. Of dit ondubbelzinnig is gebeurd, valt te betwijfelen, maar dat gaat ons nu niet aan. Essentieel is de testsituatie bij de Ro een metingssituatie. De testserie fungeert als konditie waaronder O reageert, de reaktie is de uitwerking van die konditie; het meetinstrument behoort tot de psycholoog. Bezien we een aantal mogelijke faseverschuivingen.

(a) De mogelijkheid (4) → (3): mE-xOr → rmE-xO; meting gaat over in interpretatie, zoals in het geval van Wertheimer (afb. 10). Het meest voor de hand liggende voorbeeld hiervan is het geval waarin de psycholoog afwijkend van de handleiding gaat scoren.

Er is een bepaald scoringsvoorschrift gegeven, maar het ‘lijkt hem toch beter’ om in dit geval een andere scoring te gebruiken, bijvoorbeeld op grond van zijn ‘ervaring met dit soort gevallen’. De waarde van die ‘ervaring’ dient echter door hernieuwde kalibratie te worden geverifieerd.

[pagina 160]
[p. 160]
Anders is dit afwijkende scoren niet meer dan willekeur. De opvatting van Van der Zeyde is hiervan een illustratie (p. 145). Hetzelfde type verschuiving kan zich ook voordoen zonder dat de psycholoog het helpen kan.

illustratie
afb. 10 mE-xOr→rmE-xO. Faseverschuiving waarbij meting overgaat in interpretatie


Masling deed hierover een onderzoek (245). Hij gebruikte als proefleiders in een zinnen-aanvultest acht ‘graduate students’ (in feite de ppn. van zijn experiment). Zij interpreteerden de geestelijke gezondheidstoestand van aantrekkelijke vrouwelijke ppn. die zich (door Masling daartoe geïnstrueerd) ‘warm’ of ‘koud’ gedroegen. De duiding van de testzinnen op geestelijke gezondheid bleek een positieve funktie te zijn van de ‘warmte’. De pl. meent te meten, maar is in feite aan het interpreteren. Het behoeft geen verder betoog dat deze verschuiving wetenschappelijk gezien een bedenkelijke zaak is. Een ander voorbeeld zagen we in de halo-effekten bij het beoordelen van de prestaties van goede en slechte leerlingen (p. 112). Wanneer de psycholoog als meetinstrument fungeert, moet hij 1. zijn afgestemd op het te meten verschijnsel en niets anders, en 2. goed gekalibreerd zijn.
(b) De mogelijkheid (4) → (1): mE-xOr → mEx-Or; meting gaat over in experiment (afb. 11). Van deze verschuiving kan men moeilijk aannemen dat hij onopzettelijk plaats vindt. Bij een experiment, waarin x als handeling van de experimentator fungeert, en opzettelijk wordt gevarieerd, is immers de gereguleerde willekeur van E voorwaarde. Daarom komt de verschuiving, strikt genomen, alleen opzettelijk tot stand. Door deze faseverschuiving zou de testsituatie overgaan in een nieuw onderzoek inzake Ro. Toch is het van belang, dit geval even onder het oog te zien.
Als min of meer humoristisch voorbeeld een onderzoek van Sarbin (312). Een vrouwelijke pp. werd driemaal de Ro afgenomen, (a) nadat haar onder hypnose was gesuggereerd dat zij Madame Curie was, (b) idem voor Mae West, en (c) in normale waaktoestand. Als Madame Curie had de helft van haar antwoorden betrekking op wetenschap, als Mae West tweederde op kleding; in de kontrole-Ro produceerde zij
[pagina 161]
[p. 161]
slechts twee antwoorden die zij ook onder hypnose gegeven had. Dit is een valide type experiment, maar uiteraard geen test.
Als tweede voorbeeld een onderzoek van Wickes (393). Gebruikt werden 30 Ro-type

illustratie
afb. 11 mE-xOr→mEx-Or. meting gaat over in experiment.


inktvlekken van eigen fabrikaat, twee pl.'s, 36 ‘undergraduate’ ppn., verdeeld over drie groepen en kondities: (1) Aanbieding van plaat 1-15 vond plaats op normale wijze; bij 16-30 zei pl. bij het eerste bewegingsantwoord ‘fine’, bij het tweede ‘good’, bij het derde ‘all right’, en begon dan weer met ‘fine’; (2) als (1), maar nu i.p.v. de woorden resp. driemaal knikken, glimlachen, en voorover leunen; (3) kontrolegroep zonder bekrachtiging. Wat de resultaten betreft, voor groep (1) is de toename in bewegingsantwoorden over de tweede 15 platen vergeleken met de eerste 15 signifikant (p<.025), voor groep (2) ook (p<.005), groep (3) vertoont geen verschil. Een onderzoek van Gross (135), waarin bekrachtiging van mens-antwoorden plaats vond door ‘good’ of hoofdknik (kontrolegroep: geen bekrachtiging), leverde eenzelfde resultaat op.
Het gaat hier om experimenten die de mogelijkheid van snelle selektieve konditionnering bewijzen. Reeds binnen de tijd van aanbieding van 30 Ro-platen kan iemand tot ‘goede pp.’, tot een gehoorzame Hans opgeleid worden. In dit licht bezien verdient het instemmend of gepretendeerd neutraal hm-hm gemompel van terapeuten aandachtige overweging.
In de juist beschreven vorm gaat het om experimenten, waarbij pp. de indruk heeft, simpelweg getest te worden, terwijl de onderzoeker intussen, door variatie van de kondities, meting laat overgaan in experiment. En wel in een experiment, dat met het oog op de Ro-testsituatie als spurieuze koppeling moet worden beschreven. Wij beschouwen dit als een derde type faseverschuiving. Want ook wanneer de psychodiagnostikus niet de bedoeling heeft te experimenteren, loopt hij gevaar dat dit soort effekten optreedt.

(c) De mogelijkheid (4) → (5): mE-xOr → ExO-rm; meting gaat over in spurieuze koppeling (afb. 12). Volledig zal dit zelden het geval zijn. Alleen wanneer de psycholoog voorzegt, of op andere wijze pp.'s reaktie volledig

[pagina 162]
[p. 162]
determineert, kan dit gebeuren. De zaak ligt dan zo evident, dat van een kunstfout nauwelijks kan worden gesproken. Een partiële verschuiving naar spurieuze koppeling treedt echter herhaaldelijk op. Men moet zich dit

illustratie
afb. 12 mE-xOr→ExO-rm. Meting gaat over in spurieuze koppeling.


zo denken, dat O's reaktie niet alleen van de konditie x afhankelijk is, maar bovendien van één of meer eigenschappen van E, die niet als konditie bedoeld zijn. Zijn zij echter toch werkzaam, dan vormt rm voor een zeker deel een pseudo-objekt, waarin onbedoelde invloeden van E worden gemeten en ten onrechte aan O toegeschreven. Hierover bestaat een reeks van experimentele onderzoekingen, te veel om op te sommen. Masling geeft een overzicht (246), waaruit blijkt dat (a) lichamelijke eigenschappen van pl. zoals sexe, grootte, huidskleur, (b) aanwezigheid of afwezigheid van pl. in de testsituatie, (c) persoonlijkheids- of gedragskenmerken van pl. zoals aggressiviteit, ‘hostility’, gedeprimeerdheid, ‘intrapunitivity’, gevoelswarmte, mannelijkheid, ‘anxiety’ (bonte verzameling!), invloed kunnen hebben op een omvangrijke verzameling variabelen in de Ro-reakties van ppn. In een recent onderzoek van Meyer en Partipilo (250) over 375 protokollen en 25 pl.'s bleken nog weer eens 10 van de 19 onderzochte antwoordkategorieën door pl. beïnvloed te worden.

Deze gegevens zijn uiteraard relevant voor testsituaties in het algemeen. Welk percentage testprotokollen wordt door selektieve konditionnering beïnvloed? Er is geen antwoord op die vraag; die situatie is bedroevender dan het antwoord kan zijn! Nog miserabeler is de opvatting van Schafer, die de gesignaleerde verschijnselen niet bedenkelijk vindt. ‘Men moet zich er niet tegen verzetten. De relatie moet, evenals in de psychoanalytische techniek, als onvermijdelijk worden beschouwd, als een potentieel betekenisvolle invloed op de produkties van de patiënt, en als een mogelijke goudmijn van materiaal voor interpretatie’ (317, 6). Als dit geen grenzeloze naïeveteit is, is het simpele domheid. Met wetenschap heeft het niets te maken. Wat in de naam van Pallas Athene kan het ons schelen of de inter-

[pagina 163]
[p. 163]

pretaties van meneer Schafer de interpretaties van meneer Schafer bevestigen?

De door Frank uitgewerkte analogie tussen projektierest en Röntgenopname (101) lijkt dus niet goed houdbaar. Er is iets voor Masling's kommentaar te zeggen, dat dit Röntgenapparaat bij nadere beschouwing spiegelwerking vertoont (246, 81). Hoe nuttig zelfkonfrontatie voor de psycholoog mag zijn, het was niet zijn bedoeling, in testprotokollen zichzelf terug te vinden.

Wordt de faseverschuiving mE-xOr → mEx-Or met open ogen uitgevoerd, dan kan relevante en valide kennis worden verworven. Geschiedt ze blind, dan wordt ze gereduceerd op mE-xOr → ExO-rm, en wordt door de spurieuze koppeling psychodiagnostiek gedegradeerd tot kwasiwetenschappelijke vooroordeelsbevestiging.

In zijn werk over het interview citeert Hyman een uitspraak van Bogardus die het interview een cirkulaire reaktie noemt (173, 34): Iedere reaktie fungeert als stimulus voor een nieuwe reaktie; de ondervrager en de ondervraagde prikkelen elkaar steeds op nieuwe wijze terwijl het interview voortschrijdt. Intussen bestaat de niet geringe kans, dat de een de ander konditionneert. Zo zegt Skinner van zijn proeven met ratten: ‘The organism whose behavior is most extensively modified and most completely controlled in research of the sort I have described is the experimenter himself’ (331, 232). Dit houdt het risiko van spurieuze koppeling in. Het afnemen van psychologische tests heeft alleen zin wanneer het in de koppelingsvorm mE-xOr, dus als meting, gebeurt. Klaarblijkelijk is dit een bedreigde situatie. De psycholoog is een instrument met een onuitroeibare bias. Hij is een geboren von Osten, en dikwijls nog een getrainde Sokrates ook. De verbale konditionnering is een effekt, dat zich in het experiment fraai laat demonstreren. Krasner heeft in 1958 de litteratuur samengevat. Hij citeert 34 onderzoekingen waarin verbale konditionnering in testsituaties positief wordt aangetoond, en nog eens 12 onderzoekingen zonder positief resultaat (206). Tabel 19 laat zien wat een grote variatie van verbale en perceptuele reakties door tekenen van instemming, en zelfs door mechanische middelen, pp. kan worden afgedwongen. Men kan hem bijna laten zeggen wat men wil, ook als men niet weet dat men het wil. Wie het gevoel had dat Gelb en Goldstein een slechte beurt maakten, kan gerust zijn. Nog beter is het, wanneer hij ongerust wordt.

Er bestaat blijkbaar geen zuivere diagnostische situatie zolang wij mensen als meetinstrumenten gebruiken. Zelfs als de individuele psycholoog zijn gedrag zou standaardizeren, en zijn persoonlijke invloed op het testresultaat zou kunnen onderkennen en elimineren, blijft het probleem van de interindividuele variatie bestaan. Een oplossing zal moeten worden gezocht in

[pagina 164]
[p. 164]

de ontwikkeling van automatische testprocedures. Er zijn nu didaktische machines in gebruik. Waarom geen testmachines ontwikkeld? De menselijke proefleider is, door zijn menselijkheid, als wetenschappelijk instru-

Tabel 19 Overzicht van de resultaten van proeven met verbale konditionnering. Naar Krasner (206, 160). (nb): resulteert in afname. De positieve resultaten zijn alle signifikant.

auteur(s) bekrachtiging dmv bekrachtigd gedrag
konditionnering bevestigd
Ball ‘mmm-hmm’ ‘dier’
Greenspoon ‘mmm-hmm’ meervoudsvorm substantieven
Mandler & Kaplan ‘mmm-hmm’ meervoudsvorm substantieven
B. Sarason ‘mmm-hmm’ werkwoorden
I. Sarason ‘mmm-hmm’ ‘verbale aktiviteit’-werkwoorden
Mock ‘mmm-hmm’, hoofdknik ‘moeder’
Krasner ‘mmm-hmm’, hoofdknik, glimlach ‘moeder’
Salzinger & Pisoni ‘mmm-hmm’, ‘uh-ha’, of ‘I see’ affektuitspraken
Wilson & Verplanck ‘mmm-hmm’, ‘goed’, of schrijven meervoudsvorm substantieven, bijwoorden, reisa-werkwoorden
Binder et al. ‘goed’ ‘vijandige’ werkwoorden
Cohen et al. ‘goed’ ‘ik’, ‘wij’
Cushing ‘goed’ persoon op plaatjes ‘aardig vinden’
Grossberg ‘goed’ ‘ik’, ‘wij’
Ekman ‘goed’ anti doodstraf uitspraken
Hartman ‘goed’ ‘ik’, ‘wij’
Hildum & Brown ‘goed’ ‘attitudes’
Klein ‘goed’ ‘ik’, ‘wij’
Nuthmann ‘goed’ ‘aanvaarding van zichzelf’
Toffel ‘goed’ ‘ik’, ‘wij’
Tatz ‘goed’ een paar cijfers
Fahmy ‘een goede’ mensantwoorden
Spivak & Papajohn ‘right’ autokinetisch effekt
Wickes ‘fine’, ‘good’, of ‘all right’ bewegingsantwoorden
Wickes hoofdknik, glimlach, of voorover leunen bewegingsantwoorden
Ekman hoofdknik, glimlach, en voorover leunen bewegingsantwoorden
Greenspoon licht meervoudsvorm substantieven
Sidowski licht meervoudsvorm substantieven
Greenspoon zoemer meervoudsvorm substantieven
McNair toon van een bel mate van verbalizering
Verplanck parafrase, instemming, glimlach opinies
Kanfer ‘that's accurate’, etc. autokinetisch effekt
Hartman hoofd schudden (nb) ‘ik’, ‘wij’
Mock hoofd schudden, ‘huh-uh’ (nb) ‘moeder’
Greenspoon ‘huh-uh’ (nb) meervoudsvorm substantieven
     
kanditionnering niet bevestigd
Daily ‘mmm-hmm’ ‘ik’, ‘wij’
Hildum & Brown ‘mmm-hmm’ ‘attitudes’
Cushlng ‘goed’ persoon op plaatjes ‘niet aardig vinden’
Daily ‘goed’ ‘ik’, ‘wij’
Marion ‘goed’ ‘ik’, ‘wij’
Hartman hoofdknik ‘ik’, ‘wij’
Fahmy herhaling van antwoord mensantwoorden
Fahmy ‘give another one, please’ mensantwoorden
Ball licht ‘dier’
Nuthmann licht ‘aanvaarding van zichzelf’
Taffel licht ‘ik’, ‘wij’
Ball zoemer ‘dier’
ment onbetrouwbaar. Is dit een aantasting van de menselijke waardigheid? Geen psycholoog voelt zich gedegradeerd wanneer hij een stopwatch gebruikt om tijd te meten. Door zulke instrumenten wordt de menselijke

[pagina 165]
[p. 165]

beperktheid iets minder, wetenschap iets beter te verwerkelijken. Alleen al uit respekt voor het gekompliceerde wezen ‘mens’ dient men hem te onderzoeken met middelen die hem waardig zijn. De menselijke proefleider isdat niet. De hele zaak is daarmee gezegd, dat de proefleider als verzameling van variabelen, nu eenmaal niet als een konstante faktor kan worden beschouwd.

17. Tussen Skylla en Charybdis

Er is een publikatie die bepaalde uitkomsten van verbale konditionneringsproeven in twijfel trekt. Azrin, Holz, Urlich, en Goldiamond (9) lieten 16 ‘graduate’ studenten als proefleiders optreden in een konversatie-experiment. Er waren twee kondities: (1) Pl. stemt gedurende 10 minuten in met opinies van pp., zegt gedurende 10 minuten niets, en stemt tenslotte weer 10 minuten in; (2) 10 minuten niets zeggen, 10 minuten instemmen, 10 minuten niets zeggen. ‘Niets zeggen’ werd rigoreus geïnterpreteerd als: op geen enkele wijze aktief aan het gesprek deelnemen. Iedere minuut werd het aantal door pp. spontaan geuite opinies of uitspraken genoteerd. Het zwijgen werd beschouwd als extinktie van opinie-uitingen, tegenover instemming als bekrachtiging. De begrippen ‘bekrachtiging’ en ‘extinktie’ waren de als pl. fungerende studenten bekend, evenals hun teoretische betekenis. Wat de uitkomsten betreft, één pl. kon de proef niet tot het eind toe volhouden, van de andere 15 rapporteerden er 14 dat hun ppn. meer opinies ten beste gaven gedurende de bekrachtigingsperiode dan tijdens extinktie.
Waarom kon die ene pl. de proef niet beëindigen? Na zes keer proberen rapporteerde hij, niet in staat te zijn, een konversatie aan te houden zonder daaraan aktief deel te nemen. Na bespreking van zijn probleem in de klas deelden nog 8 andere pl.'s mee dat zij dergelijke moeilijkheden hadden gehad, die zij tot nog toe niet hadden gemeld. Zulke moeilijkheden waren: (1) pp. liep tijdens extinktie weg; (2) pl. was gedwongen aktief deel te nemen door knikken, glimlachen, of het stellen van vragen; (3) pp. bemerkte dat zijn uitspraken werden vastgelegd; (4) pl. maakte fouten in tijdsindeling; (5) pl. raakte zo geïnteresseerd in de door pp. geuite opinies dat hij vergat, ze te noteren. Een bandopname, door een pl. gemaakt, en vervolgens door vijf waarnemers geanalyseerd, leidde tot volkomen verschillende interpretaties van het aantal geuite opinies.
De proefopstelling is blijkbaar geen bijzonder geslaagde. Toch werden bij een herhaling, waarbij extinktie bestond uit tegenspreken in plaats van zwijgen, goede resultaten verkregen: extinktie leidt tot een geringer aantal opinies en uitspraken dan bekrachtiging.
Analyse van alle uitkomsten scheen er op te wijzen dat een pl. betere uitkomsten verkrijgt naarmate hij beter op de hoogte is van de konditionneringsteorie, speciaal ten aanzien van het begrip extinktie. ‘Beter’ betekent dan: meer in overeenstemming met de door de tcorie voorspelde resultaten. Nu is het prettig. wanneer een teorie bepaalde
[pagina 166]
[p. 166]
resultaten goed blijkt te voorspellen; dit dient echter ook zo te zijn wanneer de pl. in kwestie de teorie niet kent. De proef werd nu nogmaals gedaan met een derde groep van studenten als pl. De opzet was weer dezelfde als in de vorige gevallen, met dien

illustratie
afb. 13 Naar azrin e.a. (9, 28).


verstande, dat de proef van te voren in een ander teoretisch licht werd besproken. Instemmen met pp. werd geïnterpreteerd als katarsis: het vrijmaken van emoties, waarop een toestand van ontspanning volgt, die tot relatief weinig sterke opinies leidt. Tegenspreken zou daarentegen leiden tot vergroting van emotionele spanning, waaruit weer toename van affektief geladen uitingen zou resulteren. De extinktie- en de katarsisteorie voorspellen dus voor elk van de drie fasen tegengestelde resultaten. Niet alleen voldeden de uitkomsten van de derde groep aan de teoretische verwachtingen van de pl.'s, het verschil tussen de uitkomsten van de tweede en de derde groep (afb. 13) is voor wat de tweede fase betreft, statistisch signifikant (p <.001). Daarmee is aangetoond, dat de uitkomsten een funktie zijn van de teoretische verwachtingen van de proefleider.
Maar ook bij de derde proef schuilt er een addertje onder het gras. Wijs geworden door de eerder vermelde ervaringen met de eerste proef, lieten de auteurs de pl.'s informeel uithoren door een van de deelnemers, die als assistent aan een psychologisch laboratorium verbonden was. Van 19 ondervraagden gaven er 12 toe, dat zij de ‘proefuitkomsten’ geheel of gedeeltelijk hadden vervalst! Van de andere zeven bekenden er vijf, in ernstige mate van de voorgeschreven procedure te zijn afgeweken.
De proef werd tenslotte nog eenmaal herhaald met vier ervaren onderzoekers als pl. (Ph.D. of M.A. in de psychologie). In een totaal van 12 pogingen bleek geen van hen in staat, het experiment te voltooien. De redenen waren dezelfde die n.a.v. de eerste proef werden opgesomd.
Met elkaar geven de vier proefnemingen een bedroevend beeld. Zolang geen grotere objektiviteit in de procedure tot stand komt, zo besluiten de auteurs hun artikel, kon het wel eens ziin dat de uitkomsten van verbale konditionncringsproeven eerder de
[pagina 167]
[p. 167]
verwachtingen en teorieën van de onderzoeker reflekteren dan het gedrag van de pp. (9, 30).
Overzien we nog eens de grootste moeilijkheden die zich bij het experiment voordeden.
(1) Vervalsing van de resultaten. Met deze mogelijkheid moet teoretisch altijd rekening worden gehouden. Het betreft geen wetenschappelijk, maar een moreel probleem. Wij zullen er over zwijgen.
(2) Het scoringsprobleem is een reëel wetenschappelijk probleem. Het zal zich altijd voordoen waar geen meting in strikte zin plaats vindt, maar evaluerende schatting van uitkomsten. Hierbij dreigt de faseverschuiving waarbij meting overgaat in interpretatie. Zoals we hebben gezien, prijzen sommigen de evaluatie als metode aan. Denken we aan halo-effekten, en aan het fenomeen van rechtvaardiging achteraf (p. 190 vv.), dan is makkelijk in te zien dat ook de meest eerlijke beoordelaar bij het evalueren de wetenschappelijke objektiviteit op voorhand heeft prijs gegeven. Scoring dient plaats te vinden op basis van geformalizeerde kenmerken die een ondubbelzinnig ja/neen, wel/niet, enz. mogelijk maken.
Volgens de opvatting van Polanyi sluit men evaluerende oordelen ook bij strenge metingsprocedures in de exakt wetenschappelijke zin nooit uit. Hij geeft het volgende voorbeeld.
Op de foto van een finish ziet men een paard met de neus een fraktie van een inch voorliggen op een ander, maar de neus van dat andere paard ligt voor tengevolge van een lange en dikke, naar voren uitstekende draad speeksel. In zo'n situatie werd niet door de regels voorzien, zodat een officiële beslissing moest worden genomen. Dit voorbeeld zou een illustratie zijn van de uiteindelijke vaagheid van zelfs de meest objektieve observatiemetoden (277, 20 n). Maar Polanyi overdrijft. Niemand zegt dat men alle eventualiteiten kan voorzien, en dat ad hoc beslissingen nooit nodig zijn. Hoe die beslissing in het beschreven geval uitvalt, is irrelevant, als hij maar ondubbelzinnig is, en door anderen wordt gevolgd. Tenslotte is de kwalifikatie ‘20 graden’ ook uitermate vaag, wanneer er niet bij wordt gezegd of het Celsius of Fahrenheit (of noorderbreedte) is.
(3) Dat proefuitkomsten ‘zich richten’ naar de teoretische verwachtingen van de onderzoeker is (voor zo ver er geen sprake is van vervalsing) gedeeltelijk te herleiden tot scoringsproblemen. Dan is het niet zozeer de uitkomst zelf, als wel zijn interpretatie, die tot het effekt aanleiding geeft. Voor een ander gedeelte is er sprake van regelrechte beïnvloeding van het gedrag van pp. (gewild of ongewild), zoals bij de eerder besproken gevallen van verbale konditionnering. Wij gaan hierop nog nader in (p. 172 vv.).
(4) >Er is vervolgens het probleem van de affektieve betrokkenheid van pl. bij het gedrag van pp. Een maatschappelijk werkster (psychiatrisch geschoold) maakte na een gesprek met een sociaal minder acceptabele man eens de opmerking: ‘Ik kon hem wel door de koffiemolen halen’. Hoe begrijpelijk zulke reakties ook mogen zijn, zij predisponeren niet tot een objektief verslag van 's mans gedrag en uitingen. Zo vernamen we ook dat ettelijke proefleiders in de eerste proef het niet konden laten, stelling te
[pagina 168]
[p. 168]
nemen in het gesprek. Men kan wel de instruktie geven dat het niet mag, maar daarmee heeft men geen garantie dat het niet gebeurt; ook niet t.a.v. hen die menen zich aan de instruktie te hebben gehouden. Dit effekt is inherent aan de menselijke proefleider. Nu kan men het standpunt innemen dat van deze nood een deugd gemaakt moet worden, zoals in de ‘begrijpende’, geesteswetenschappelijke psychologie. Maar dan laat men de wetenschappelijkheid varen.
Alweer is de moraal, dat de onderzoeker zich tegen de eigen menselijkheid dient te wapenen, door een objektieve proefopzet, objektieve scoring (meting), door de eigen rol te formalizeren, en door, waar mogelijk, geheel uit de proef terug te treden (automatizering van de procedure, inklusief instruktie en registratie van de uitkomsten).
(5) In hoe verre deze problemen inderdaad, zoals de auteurs suggereren, de validiteit van andere onderzoekingen over verbale konditionnering verminderen, is zo in het algemeen niet uit te maken. Maar zoals zij het probleem stellen, bevinden wij ons tussen de Skylla en de Charybdis: berusten de uitkomsten niet op onbedoelde konditionnering van pp., dan op het vooroordeel van pl. Het is alle twee even bedenkelijk.

18. De proefleider als variabele

Terwijl schrijver dezes dit onderwerp op kollege behandelde, hield Van de Loo er zijn inaugurele rede over (356). De twee gezichtspunten ontstonden onafhankelijk van elkaar, en vertonen weinig verwantschap. Aan de hand van de litteratuur die ten dele hier boven ter sprake kwam, bespreekt Van de Loo vijf varianten van het tema. Ik volsta er mee, ze te noemen. (1) De aan- of afwezigheid van de proefleider in de testsituatie. (2) Het geslacht van de onderzoeker. (3) Verbale konditionnering. (4) Statusverschillen en bepaalde houdingen van de onderzoeker. (5) De persoonlijkheid of eigengeaardheid van de proefleider.

Van de Loo konkludeert ‘dat de persoon van de proefleider een invloedhebbende variabele is in de situatie van het klinisch psychologisch onderzoek’. Hoe moeten wij deze konklusie teoretisch funderen in een wetenschappelijk denkmodel, vraagt hij zich af. Nu behoort een konklusie te worden gefundeerd op feiten. Maar er is ruimte voor interpretatie op basis van een denkmodel. Van de Loo zoekt dat model in een interpersonale kommunikatieteorie, om vervolgens mee te delen: ‘Het valt buiten de opzet van ons betoog een interpersonale communicatietheorie uiteen te zetten. Voorts ligt het niet in onze competentie de wezenlijke, existentiële grondslagen van een dergelijke theorie open te leggen; dat behoort tot de taak van de wijsgerige anthropoloog’ (356, 13).

Dat is een bedroevende en merkwaardige uitspraak. Bedroevend, omdat het niet aangaat dat de psycholoog aan dep wijsgeer prijsgeeft wat tot zijn

[pagina 169]
[p. 169]

eigen taak behoort. En merkwaardig, omdat Van de Loo er niet voor terugdeinst zonder teorie praktische konsekwenties uit te werken, en zelfs teoretische gezichtspunten naar voren te brengen. Zoals de uitspraak dat de test ‘krachtens de vóór alles intersubjectieve contactsituatie van het klinisch psychologisch onderzoek... primair medium van communicatie, pas daarna meetinstrument’ is. ‘Vandaar dat de test zich ontvankelijk toont voor beïnvloeding door de proefleider’ (356, 14). Daarmee is het gezichtspunt van test én proefleider, als instrumenten beschouwd, naar het tweede plan verschoven. De nadruk wordt gelegd op de kontaktsituatie, d.w.z. op een aspekt van het psychologisch onderzoek, waarvan de kenmerken vager zijn dan die van de test zelf. Gebreken van het meer specifieke verklaren uit de volheid van het vage, is een werkwijze die niet veel uitzicht biedt. Van de Loo kiest voor de vage menselijkheid. Hij stelt de vraag, of de proefleider moet worden uitgeschakeld alleen, om hem ontkennend te kunnen beantwoorden. Goede gronden voor die ontkenning worden niet aangevoerd. Wel gronden. Zoals: de besproken bevindingen behoeven zich niet in ieder geval voor te doen (weten we wanneer wel, wanneer niet?); onaangeroerd is de kapitale vraag, of de beïnvloeding zo ver gaat, dat een radikaal vals beeld van de onderzochte ontstaat (is gewone onnauwkeurigheid niet problematisch?); evenmin is uitgemaakt of niet nog andere buitenexperimentele variabelen van belang zijn (dus: bekende foutenbronnen behoeft men niet te elimineren als er mogelijkerwijs nog onbekende foutenbronnen zijn?); het zwaartepunt ligt niet in de proefleider, maar in de instruktie (moet de instruktie dan niet naar vermogen worden gestandaardizeerd?); doorslaggevend is de zin die de onderzochte aan de proefleider geeft (dit is 1. nog nergens aangetoond, en 2. een argument te meer om de proefleider te elimineren). Op basis van al deze argumenten trekt Van de Loo de konklusie die er niet uit volgt, nl. dat het er om moet gaan, de proefleider ‘juist beter in te schakelen’ (356, 16). Uit de besproken onderzoekingen volgt immers (I) dat de proefleider in de situatie van het klinisch psychologisch onderzoek onmisbaar is. Deze gevolgtrekking is verbluffend.

Vragen wij, hoe Van de Loo zich voorstelt, de psycholoog beter in te schakelen, dan krijgen wij het volgende antwoord. De psycholoog moet bijvoorbeeld zijn eigen ‘stimulus-value’ leren kennen. Hij staat verder voor de opgave ‘het bedoelde interactieproces attent te volgen, subtiel te hanteren, voorzichtig te ontcijferen, getrouw te memoriseren en de testresultaten mede als neerslag van dit interactieproces te accepteren’ (356, 17). Dit programma is uitstekend, maar niet uitvoerbaar. Als we aannemen dat de psycholoog ook nog een testprotokol moet maken, dan zijn er, vóór de uiteindelijke interpretatie van de testresultaten aan de orde komt, vijf taken.

(1)Die van de protokollist: Antwoorden opschrijven tijden opnemen en
[pagina 170]
[p. 170]
vastleggen, stand van de platen (Ro) en lokatie van de duidingen opmerken en noteren.
(2)Die van de interaktie-observator: De uitgeoefende verbale konditionnering opsporen. De invloed van eigen aanwezigheid, geslacht, huidskleur, houding, status, en persoonlijkheid naspeuren. Dit alles attent volgen.
(3)De taak als interpretator van de interaktie. Voorzichtig ontcijferen welke onder (2) genoemde invloeden het protokol beïnvloeden, en in welke mate.
(4)De taak als manipulator van de interaktie. Op basis van (3) zal de psycholoog zijn verbale bekrachtiging, geslacht, huidskleur, houding, status, en persoonlijkheid moeten variëren tot hun invloed minimaal is.
(5)De taak van de metaprotokollist. Wat er onder de gezichtspunten (2), (3), en (4) gebeurt, moet getrouw worden gememorizeerd, en uiteraard op enig tijdstip aan papier worden toevertrouwd.

Van de Loo's propositie komt dus hierop neer, dat de psycholoog, in plaats van één taak die zijn volle kapaciteit opeist, er vijf vervult die stuk voor stuk zijn volle kapaciteit (of iets meer) opeisen; en dat hij ze alle vijf tegelijkertijd vervult, in een situatie die slechts op de eerste taak min of meer is afgestemd. Er staat in dat verband een zin die met volledige instemming moet worden aangehaald: ‘Hij zou wezenlijk in zijn taak tekort schieten indien hij de consequenties van deze realiteit niet op zich nam’ (356, 17). Wat zijn nu eigenlijk die konsekwenties?

Van de Loo is van mening dat geen elektronisch brein het ooit beter zal doen dan de psycholoog. Dat is een triest vooruitzicht voor de psychodiagnostiek, want met de vervijfvoudiging van onze verwerkingskapaciteit zal het niet vlot gaan. Laten we trouwens wel bedenken, dat de vier toegevoegde taken in het geval van de diagnostiekmachine overbodig zijn. Dan is immers de variabiliteit van de proefleider opgeheven, zijn kapaciteit vergroot, zijn bias geneutralizeerd, zijn aanwezigheid, geslacht, huidskleur, houding, status, en persoonlijkheid gestandaardizeerd. Kortom, de proefleider zou geen variabele meer zijn, maar een konstante.

19. Bias in onderzoeksuitkomsten

Nu moet de indruk vermeden worden alsof alleen praktizerende psychologen zich aan faseverschuivingen schuldig zouden maken. Het gaat trouwens niet om schuld, tenminste niet wanneer faseverschuiving onbedoeld optreedt; wel, wanneer men eenmaal hier op gewezen, er geen rekening mee houdt.

Dus geen kontroverse tussen toegepaste en experimentele psychologie in

[pagina 171]
[p. 171]

dit opzicht, al vonden Levy en Orr dat zij de uitkomsten van Rorschachvaliditeitsonderzoekingen konden voorspellen uit het feit dat de onderzoeker in akademisch, resp. praktisch milieu werkt (219).

Tabel 20 Naar Levy en Orr (219, 82).

univ. praxis
uitkomst konstr. krit. konstr. krit. tot.
gunstig 51 12 14 19 96
ongunstig 22 23 14 13 72
totaal 73 35 28 32 168

Levy en Orr deden het volgende. Alle artikelen over Ro-validiteit, verschenen gedurende de jaren 1951 tot en met 1955 in de Journal of Abnormal and Social Psychology, de Journal of Clinical Psychology, Journal of Consulting Psychology, en Journal of Projective Techniques werden gesorteerd op drie variabelen: (1) gedaan in universitair of praktisch milieu, (2) betrokken op konstrukt-validiteit of kriterium-validiteit, (3) uitkomst ten gunste of ten ongunste van de in het artikel gestelde hypotese. Wij nemen de resultaten voor de 168 beschouwde artikelen over in tabel 20. Aan de gegevens,werd een viertal hypotesen door Levy en Orr getoetst.

(1)Het akademisch milieu is meer geïnteresseerd in konstrukt- dan in kriterium-validiteit; de interesse gaat dus meer uit naar de teoretische, dan naar de praktische betekenis van het diagnostisch instrument. In het praktisch milieu zal dit omgekeerd liggen. De hypotese wordt met χ2 = 7,04; p < .01 bevestigd. Dit feit is niet zeer verwonderlijk.
(2)Universitaire studies zullen een grotere proportie gunstige resultaten vertonen t.a.v. konstrukt-validiteit dan t.a.v. kriterium-validiteit. Voor praktische studies wordt het tegendeel voorspeld. Akademisch: χ2 = 12,32; p <.001 Praxis: χ2 = 0,53; n.s. De hypotese wordt dus voor de akademici bevestigd, voor de praktici niet. Hier valt dan de invloed van akademisch vooroordeel te overwegen. Ofwel akademici publiceren ongunstig uitvallende konstrukt-, gunstig uitvallende kriteriumonderzoekingen in mindere mate, ofwel zij vinden zulke uitkomsten niet. Het is allebei even bedenkelijk.
(3)De proportie gunstig uitvallende konstrukt-validiteitsonderzoekingen is in universitair milieu groter dan in de praxis; voor gunstig uitvallende kriteriumonderzoekingen wordt het tegendeel voorspeld. Konstrukt: χ2 = 3,48; p < .05. Kriterium χ2 = 4,24; p < .05. De hypotese wordt
[pagina 172]
[p. 172]
bevestigd, waaruit volgt dat eventueel vooroordeel niet alleen in akademisch milieu behoeft te worden gezocht.
(4)De drie onderzochte variabelen hangen onderling samen. χ2 = 7,71; p < .01.

Er schijnt dus, zeggen de auteurs, inderdaad een sociale psychologie van het speurwerk te bestaan. De uitkomsten suggereren in hoge mate de wenselijkheid, bij het beschouwen van Ro-validiteitsonderzoekingen na te gaan, uit wat voor milieu zij stammen.

Weer blijken psychologische wetten ook van toepassing op de psychologen. Zij zijn in hun onderzoek niet vooroordeelsvrij. Waarom hebben wij het ooit verwacht? De psycholoog is een systeem van variabelen met bias.

Men mag misschien niet zo ver gaan als Russell in een ironische bui. Het viel hem op dat Amerikaanse proefdieren opgewonden heen en weer rennen met een ongelooflijke tentoonspreiding van gejacht en ‘pep’, om het verlangde resultaat toevallig te bereiken; terwijl Duitse proefdieren oplossingen met stilzitten en denken uit hun diepste innerlijk tevoorschijn brengen (305, 30). Overdrijft hij, wanneer hij nationale stereotypen in proefdieren meent terug te vinden? Dat ratten soms de verwachtingspatronen van hun onderzoekers volgen, staat inmiddels wel vast.

20. Rosenthal's onderzoekingen met ratten

Gruenberg heeft een uitspraak opgetekend die Pavlov in 1929 deed op het 13e internationale fysiologenkongres in Boston. Hij had vastgesteld, zei Pavlov, dat de schijnbare vergroting van leerkapaciteit gedurende opeenvolgende muizengeneraties in feite moest worden toegeschreven aan toenemende onderwijsbekwaamheden van de onderzoeker. Daarmee viel een erfelijkheidshypotese uit, evenals trouwens de wetenschappelijke carrière van de betreffende assistent. Er is niets nieuws onder de zon. Terecht verwijst Rosenthal (298) naar de befaamde historische parallel: het ontslag dat Maskelyne aan Kinnebrook verleende (p. 41). De les schijnt nog niet geleerd. Daarom is het verheugend, dat Rosenthal ‘experimenter bias’ in zijn leeropdracht aan de Universiteit van North Dakota heeft staan. Inderdaad, het maken van fouten diskwalificeert wetenschappelijk onderzoek niet zonder meer, terwijl het aantonen van dwaling een gevorderd stadium van een wetenschap kenmerkt (Hyman; 173, 4). Heel de recente kritische litteratuur, gewijd aan dwalingen en foutenbronnen, aan de beperkte validiteit van psychologische konstrukties, mag in zo verre worden opgevat als een positief teken. Temeer, omdat deze litteratuur niet volstaat met de konstaterine ‘dat het toch maar niets is met de psychologie’. maar fouten-

[pagina 173]
[p. 173]

bronnen experimenteel naspeurt. Rosenthal's werk is daarvan een uitmuntend voorbeeld. Wij volgen zijn ervaringen met ratten.

Twaalf studenten in de psychologie met enige ervaring in het experimenteren namen als proefleiders deel aan een onderzoek, dat volgens de instruktie diende ter vergroting van hun experimentele ervaring. Het is gebleken, werd hun verteld, dat voortgezette inteelt van ratten die het in doolhofproeven goed doen, in volgende generaties ratten oplevert die het aanmerkelijk beter doen dan normale ratten. Hetzelfde zou, mutatis mutandis, voor slecht lerende ratten gelden. Iedere pl. kreeg vijf ‘intelligente’, of vijf ‘domme’ ratten ter beschikking. Gebruikt werden in feite volmaakt naïeve, onderling maximaal homogene albinoratten. De resultaten later zien dat op drie van de vijf proefdagen, en voor het experiment als geheel de doolhofprestaties van vermeend intelligente ratten signifikant beter zijn dan die van vermeend domme ratten (Rosenthal e.a.; 299).

In een tweede onderzoek (Rosenthal e.a.; 301) onderzochten 39 pl.s, verdeeld over 14 groepen, per groep één rat. Alle ratten waren vrouwtjes van 80 dagen uit eenzelfde kolonie. Van de pl.-teams werden er 8 in de mening gebracht dat hun rat intelligent, de overige 6 dat de hunne dom was. Ieder team voerde zeven standaardexperimenten uit op het gebied van konditionnering in ruime zin. Weliswaar zijn van de zeven proeven afzonderlijk er slechts twee signifikant ten gunste van de bias-verwachting (p ≤ .02), voor het zevental proeven als geheel is p = .015.

Het effekt staat vast. Pavlov had gelijk. Maar hoe komt het effekt tot stand? Wanneer Rosenthal en Fode een parapsychologische verklaring van Ammons en Ammons (3) niet geheel willen uitsluiten (299, 12), gaat dat wel wat ver. Een probleem verklaren met behulp van een mysterie kan altijd nog. Aanvaardbaarder is daarom Rosenthal en Lawson's verwijzing (301 16) naar Bernstein (23, 165), die konstateerde dat ratten betere leerprestaties leveren wanneer zij vaker in de handen worden genomen en geliefkoosd terwijl zij, wanneer men hiermee stopt, meer fouten gaan maken dan ratten die nooit geaaid werden. Rosenthal's proefleiders waren van mening dat zin de ‘intelligente’ ratten inderdaad meer hadden geliefkoosd.

Maar nu moeten twee mogelijkheden worden overwogen, al kunnen wij geen keuze maken.

(1)Is Bernstein's konklusie vrij van experimenter-bias? In hoe verre speelt bijvoorbeeld zowel in zijn onderzoek als in dat van Rosenthal scoringswelwillendheid een rol? Zoals wij hebben gezien (p. 167), is dit een faktor waarmee terdege rekening moet worden gehouden.
(2)Aangenomen dat Bernstein's konklusie zuiver is, is het dan niet mogelijk dat de mening van Rosenthal's proefleiders die zeggen ‘intelligente’ ratten meer te liefkozen, door Rosenthal is gesuggereerd?
[pagina 174]
[p. 174]

Een eventueel empirisch antwoord op deze vragen is van minder belang dan het probleem dat er in besloten ligt: In Rosenthal's algemene proefopzet ontstaat een extra mogelijkheid tot spurieuze koppeling of faseverschuiving.

2I. De algemene opzet van Rosenthal's onderzoekingen

De algemene opzet van Rosenthal's onderzoekingen is de volgende. Een superexperimentator (S) manipuleert subexperimentatoren (E) zodanig, dat daardoor in de resultaten die E van zijn ppn. (O) verkrijgt, de invloed vaststelbaar is die S op E heeft uitgeoefend, zonder dat E dit kan vermoeden. Strikt genomen is in dit type proeven de subexperimentator zelf pp. We hebben hier een experimentele situatie met drie systemen, gekarakterizeerd door S, E, en O als systeemkernen; en met twee systeemkoppelingen (afb. 14):

(1)mE-xOr, meting door E,
(2)mSx-Er, experiment door S.

Wordt de ingreep van S op E (xs) als konditie aan E toegeschreven, dan bevindt S zich eveneens in metingsfase. Het is bepaald niet ondenkbaar dat S nu re (= me) in zijn eigen systeem opneemt, en dus i.p.v. meet, interpreteert; het is evenmin onmogelijk dat faseverschuiving naar SxE-rems optreedt, zodat S zijn eigen bias meet. Het is niet moeilijk, ettelijke andere reële mogelijkheden van faseverschuiving in dit drievoudig systeem te bedenken. Dus, het experimenteel onderzoek van bias vergroot de kansen op faseverschuiving, en kompliceert de analyse in hoge mate.

Deze konstatering tast de betekenis van Rosenthal's onderzoeksmetode niet aan. Wel is er op gewezen dat een ondubbelzinnige demonstratie van aard en omvang van bias-effekten hier een ongemeen zorgvuldige proefopzet en variatie noodzakelijk maakt. Men vergete bovendien niet, dat een kommentator als schrijver dezes, zichzelf nog als vierde systeem aan het gekompliceerde geheel toevoegt. Waarschijnlijk treden in dergelijke hiërarchisch geordende systeemkoppelingen wel iteratieve tendenties op die de feitelijke komplikaties verminderen t.o.v. de teoretisch mogelijke. Maar zonder uitvoerig onderzoek valt hier weinig te zeggen.

Rosenthal zelf heeft reeds enige vereiste variaties aangebracht. We vergelijken in grote trekken twee van zijn experimenten, ditmaal met mensen in de rol van O.

(1) Een aantal foto's van menselijke gezichten werd uit een tijdschrift geknipt. Zij werden zo uitgezocht, dat ze als neutraal worden beoordeeld op een waarderingsschaal die differentieert tussen ‘succesvol’ en ‘mislukt’

[pagina 175]
[p. 175]
in sociaal opzicht. De van + 10 tot - 10 lopende schaal wordt dan gebruikt in een biasexperiment. Aan een groep E's wordt verteld dat hun ppn. de foto's waarschijnlijk met een gemiddelde van + 5 zullen waarderen; bij

illustratie
afb. 14 Dubbele systeemkoppeling in de de proeven van Rosenthal.


Tabel 21 Naar Rosenthal (302, 19). De gegevens zijn per konditie gemiddeld over vier E's. Kolom I geeft gemiddelde waarden voor de eerste twee, kolom II voor de volgende vier O's weer.

konditie M 1-2 M 3-6
hoog +2,77 +0,80
neutraal +0,30 +0,58
laag -3,42 +0,18
de andere groep E's wordt een verwachting van - 5 gekweekt. Alle E's geven hun O's identieke instrukties. In drie van dergelijke onderzoeken waren in totaal 30 E's en 375 O's betrokken. In alle drie werd gevonden dat de laagste gemiddelde waardering, verkregen door E's met hoge verwachtingen, hoger was dan de hoogste gemiddelde waardering, verkregen door E's met lage verwachtingen. De drie signifikantieniveaux waren .004, .001, en .004 (Rosenthal; 298).

(2) In een ander experiment met dezelfde foto's waren er 12 E's met ieder 6 O's. Er waren drie kondities. Bij vier E's waren de eerste twee O's medeplichtigen van S (geïnstrueerd, hoge waarderingen te geven); bij vier E's waren de medeplichtige eerste twee O's geïnstrueerd lage waarderingen te geven; de andere vier E's werkten met naïeve O's. Onder alle kondities waren de volgende vier O's bij iedere E geheel onbeïnvloed. De gegevens in tabel 21 wijzen onmiskenbaar in de richting van beïnvloeding van deze naïeve O's door E's verwachting; een verwachting die E baseert op de verrichtingen van zijn eerste twee ppn., die door S geïnstrueerde reakties produceerden (Rosenthal e.a.; 302, 6 vv.).

[pagina 176]
[p. 176]

In beide experimenten treedt hetzelfde effekt op, echter onder formeel verschillende kondities. In (I) wordt door xs E zodanig gemanipuleerd, dat een spurieuze koppeling Ex0O ontstaat. In (2) wordt E gemanipuleerd via xs-ro, waarna vervolgens Ex0O ontstaat (vgl. afb. 14). Dezelfde faseverschuiving, maar anders tot stand gebracht. Tezamen leiden zij tot de konklusie dat E's verwachting, gekreëerd door S of door O, tot de faseverschuiving mE-xOr → ExO-rm kan leiden, waarbij meting overgaat in spurieuze koppeling.

Het verschijnsel blijkt niet zeldzaam te zijn. Rosenthal en medewerkers deden in totaal reeds 14 onderzoekingen waarvan er tien het fenomeen aantonen (zwakste betrouwbaarheid p = .07, pmd = .01). Hierbij waren in totaal 200 E's betrokken, 1000 menselijke O's, en 80 ratten (Rosenthal; 298, 3). Een gegeneralizeerde verklaring van de wijze waarop het effekt ontstaat werd nog niet bereikt. Wel werd vastgesteld, dat hier verbale konditionnering geen rol speelt (Rosenthal e.a.; 300). Aan de experimentele manipuleerbaarheid van spurieuze koppeling bestaat geen twijfel meer. Het is een vruchtbaar gezichtspunt om het psychoterapeutisch proces onder te bezien.

22. Terapie naar snyder: een spurieus allegaartje

Psychodiagnostiek is enerzijds een sorteerprocedure waarbij mensen worden ingedeeld in succes-waarschijnlijkheidsklassen met betrekking tot door hen uit te oefenen funkties; anderzijds is psychodiagnostiek sortering van kliënten over terapieklassen en -vormen. Hierbij kan de diagnostiek niet onafhankelijk van de terapie worden beschouwd. Terapie beoogt reorganizatie van het gedrag door het oplossen van konfliktsituaties met behulp van wetenschappelijke metoden. Door de praktische oriëntatie van de terapeut kan het laatste deel van die omschrijving wel eens minder gewicht krijgen dan zou moeten. Soms wordt zelfs van wetenschappelijkheid geheel afgezien onder het motief dat de hulp aan mensen in nood het enig normerende moment is. De diagnostiek kan de wetenschappelijke pretentie dan ook opgeven.

Maar ook dan blijft de algemeen psycholoog geïnteresseerd in de vraag: wat gebeurt er in de terapeutische situatie?

Sinds Freud's dagen is in de beschouwingen over terapie de ‘overdracht’ als een centraal moment gesteld. Minder direktieve terapeuten van nu spreken liever van ‘relatie’ of ‘interaktie’. Welke terminologie men ook kiest, het tema van de systeemkoppeling tussen terapeut en kliënt is onvermijdelijk. Het onderwerp van zijn laatste boek wordt door Snyder om-

[pagina 177]
[p. 177]

schreven als de analyse van deze relatie (333, 1; vgl. 13). Zijn eigen terapie omschrijft hij als een ‘ego-building relationship therapy based on the principles of learning theory. Our approach to the client and warmth toward him are patterned after Roger's client-centered therapy; the theory of personality which we apply to understanding the client comes from both psychoanalysis and the large body of experimentation in learning and conditioning’ (333, 10). Snyder karakterizeert deze benadering als eklektisch (333, 43); een allegaartje lijkt me een betere term. Toelichting is billijk.

We lezen in een beschrijving van een illustratief geval de volgende passage. ‘Het was, natuurlijk, hoogst betekenisvol dat de kliënt de koude rillingen beschreef die hij in de aanwezigheid van autoriteitsfiguren had. Dit onthulde de emotionele sleutel tot het geval: “autoriteitskonflikt, ergo waarschijnlijk strijd met de vader, ergo mogelijke oedipale en kastratiekonflikten, ergo waarschijnlijk passief homosexuele Symptomatologie”. Latere ontwikkelingen bevestigden deze schets zeker, en we betwijfelen ten zeerste dat dit was op grond van het vooroordeel van de terapeut aan het eind van het eerste interview’ (333, 53).

Allegaartje. Want waar is nu de aangekondigde ‘learning theory’? We hebben uit haar ‘body of experimentation’ het fenomeen van de verbale konditionnering tevoorschijn zien komen. Wanneer kliënten zijn diagnostische voorgevoelens bevestigen, laat Snyder dit fenomeen gemakshalve buiten beschouwing. Rogers (niet de non-direktieve) toonde in een kwasiterapeutische situatie aan dat negatieve zelfbeoordelingen door ‘mm-hm’ en hoofdknik kunnen worden gekonditionneerd, en wel zonder dat de kliënt het merkt (294). Snyder's visie hierop ontbreekt.

De leerteorie komt tevoorschijn, zeker. Wanneer zich een sterke relatie tussen kliënt en terapeut heeft ontwikkeld, beweegt dit de kliënt ertoe, door stimulus-generalizatie en/of verlaging van weerstandsdrempels, vele ideeën te aanvaarden die hij zou verwerpen wanneer een ander ze hem opdrong. De goede terapeut is dus ten dele gekarakterizeerd door het vermogen, een sterke relatie op te bouwen, en deze te gebruiken om zijn kliënt te helpen (333, 203). Hoe stelt men dit vast? Hoe kan men, om met Fosmire te spreken, de mate beoordelen waarin het terapeutisch gedrag van de kliënt door de terapeut beïnvloed wordt? Hoe stelt men de mogelijke invloed van Snyder-de-onderzoeker op Snyder-het-instrument vast (95)? Het antwoord is eenvoudig. Men stelt dit alles niet vast. Men doet uitspraken, en biedt die de geïmponeerde lezer aan.

Wanneer is de overdrachtsrelatie sterk? Snyder geeft een opsomming van kenmerken:

(1)Een gevoelen van welbehagen in de aanwezigheid van terapeut, of vertrouwen in hem.
[pagina 178]
[p. 178]
(2)Adoratie (adoring devotion) voor terapeut.
(3)Gevoelens van afhankelijkheid t.a.v. terapeut.
(4)Waardering van terapeut als welwillend ouder of kameraad.
(5)Huilen gedurende de zittingen.
(6)Sterke sexuele attraktie door de terapeut.
(7)De wens dat terapeut kliënt als volmaakt ziet.
(8)Verzoening na een debat met terapeut.
(9)Het sturen van geschenken of brieven.
(10)Spijt over het beëindigen van de terapie (333, 180 vv.).

Overdracht is een verlies van relatieve zelfstandigheid van het systeem van O. Terapeut manipuleert kliënt door hem als deel in het eigen systeem op te nemen, hem in spurieuze koppeling te konditionneren door emotionele bekrachtiging en extinktie. Terapeut noemt het alleen anders.

Hoeveel krachtiger is Eysenck's opvatting dat terapie neerkomt op konditionnering tout court, en in die vorm als een expliciet middel wetenschappelijk verantwoord kan worden gehanteerd. In dat verband kan de vriendelijke warmte van Snyder en Rogers een positief hulpmiddel zijn. Ferguson en Buss toonden aan dat verbale konditionnering op het gebruik van vijandige werkwoorden signifikant beter gaat wanneer de pl. geduldig, kalm en beleefd is, dan wanneer hij aggressief optreedt (92). Voor het overige kunnen we Snyder vergeten.

23. Naar een zakelijke psychoterapie

Technisch en zakelijk kompetent zal de psycholoog moeten zijn, wil hij het middel terapie efficiënt hanteren. Ik kan niet nalaten, Kanfer's kommentariërend overzicht van leerprocessen in de psychoterapie aan te halen. ‘Deze benaderingen vertegenwoordigen de hoop dat sommige operaties van traditionele verbale terapieën, en andere overredings- en kommunikatietechnieken, zo oud als de menselijke kultuur zelf, de ingrediënten zullen bevatten die wezenlijk noodzakelijk zijn voor effektieve verandering van iemand's gedrag, zelfs als deze operaties nu verborgen zijn achter ritueel, magie, of esoterische psychologische verzinsels’ (191, 681).

Die ingrediënten klaar en helder te bepalen is de taak van de psycholoog die zijn wetenschappelijke status serieus neemt. Door psychiatrische bespiegelingen behoeft hij zich niet van de wijs te laten brengen. De psychiater is immers in psychologische aangelegenheden - helaas - volkomen inkompetent. Ook psychoterapie is wetenschappelijk beschouwd, een nuchtere zaak. Wie troost nodig heeft voor de schijnbare deshumanizering van de mens in reduktieve modellen, mag bedenken dat mensen in nood het best

[pagina 179]
[p. 179]

zijn gediend met efficiënte werktuigen; beter dan met kostbare woorden zonder kontroleerbare uitwerking.

Om tot die efficiëntie te komen is onderzoek nodig. Een aantal richtlijnen daarvoor is uit het voorgaande af te leiden.

(1) Een duidelijke scheiding tussen wetenschappelijke metoden en affektieve intuïties is noodzakelijk. Omdat de psycholoog een mens is onder mensen en in de beeldenwereld van de sensus communis leeft, heeft hij de strikte spelregels van hypotese en toetsing nodig, van reduktie en formalizering, om als mens over de mens nog iets anders te zeggen dan de sensus communis al heeft voorgezegd.

(2) Laat men de fiktie opgeven dat in behandelingswijzen als de psychoanalytische en de non-direktieve onderscheiden kan worden tussen een diagnostische en een terapeutische fase. Men probeert, zo luidt de pretentie, te verkennen wat uit de patiënt zelf voortkomt, wat hij denkt, voelt, beleeft; en op basis daarvan gaat men de behandeling richten. Maar wat uit de patiënt voortkomt, wordt door de terapeut geselekteerd, gefiltreerd, gekonditionneerd totdat de kliënt in een zekere mate van overeenstemming met de verwachtingen van de terapeut spreekt. Dan is de ‘weerstand’ overwonnen, zegt men; de overdracht begonnen. Spurieuze koppeling. De terapeut bevestigt in zijn ‘diagnostiek’ eigen vooroordelen. Ligt dit niet logisch besloten in de stelling dat overdracht of ‘relatie’ voor het vruchtbaar terapeutisch kontakt noodzakelijk is? Wat zegt men daarmee anders dan dat de produkties van de kliënt gebonden zijn aan deze relatie? Onderzoek is dan een fiktie. Werkelijk onderzoek bewijst, dat toename in de gemiddelde frekwentie van emotioneel positieve of negatieve aanvullingen van onvolledige zinnen door verbale bekrachtiging van de gewenste reaktie kan worden opgeroepen. Onbewezen, maar aanvaardbaar, is het vermoeden, in hetzelfde onderzoek uitgesproken, ‘that a patient that is judged as improved on the basis of his verbalizations during therapy i; actually only reflecting the reinforcing biases of the therapist’ (Haas; 138, 319). De ‘klinische observaties’ die psychoanalytische teorieën bevestigen, hebben geen groter gewicht dan de zich dagelijks voordoende ‘bewijzen’ van de astrologie (Popper; 279, 37 v.).

(3) Wanneer bepaalde affektieve patronen in het gedrag van de terapeut gunstig zijn voor de konditionnering van de kliënt, dienen deze beheerst en afgemeten, d.i. als technisch hulpmiddel, te worden gehanteerd. Men kan menen dat de affektiviteit dan onecht is; het gaat er echter om, of de techniek werkt. Bovendien staat nog te bezien wat ‘echte’ affektiviteit eigenlijk wel is. Wanneer de echtste emoties op het toneel worden geproduceerd, dan kan ook de psycholoog dramatisch worden getraind.

(4) Daarmee is gezegd dat de terapeutische situatie moet worden vrij-

[pagina 180]
[p. 180]

gemaakt van spurieuze koppeling - wil men wetenschappelijk te werk gaan. De eis van sommige terapeutische doktrines dat een gevoelsrelatie als het centrale terapeutische fenomeen wordt gekultiveerd, stempelt ze eo ipso tot onwetenschappelijke ondernemingen. Nu behoeft men zich niet volgens wetenschapsregels te gedragen om als mens te leven; men moet zich wel aan die regels houden om wetenschap te bedrijven. Het zou zuiverder zijn, wanneer de overdrachtsterapeuten de pretentie van wetenschappelijkheid lieten varen en hun aktiviteit als kunst herkenden.

(5) Kanfer merkt op dat bekrachtigingen door een terapeut inkonsistent zijn; bovendien, dat hij goed op zijn dubbelrol als instrument en als observator moet letten (191, 687, 695). Dit is ons eerste tema geweest, en het is het belangrijkste. In een terapie is de psycholoog niet meer werkzaam als sorteermachine, maar als konditionneermachine. Hij bevindt zich in terugkoppelingsfase. Op grond van de via zijn meetinstrument inkomende feedback reguleert hij zijn ingreep zodanig dat de konditionele waarschijnlijkheid van sommige reakties van de kliënt toeneemt, die van andere afneemt. Dit met enige nauwkeurigheid te doen, is geen geringe opgave. Weliswaar beschikt de machine, eenmaal getraind, over een zekere gedifferentieerde informatie, maar zelfs als hij goed is geprogrammeerd blijven zijn reaktietijden, kapaciteiten van informatieopname, verwerking en uitvoer, van dezelfde orde als die van zijn kliënt. Het valt hem al zwaar, een slag voor te blijven; laat staan, een tendentie over een langere tijd te extrapoleren. Onze kritische beschouwing mag dan ook niet als ridikulizering worden opgevat. Want in laatste instantie zijn de problemen waarom het hier gaat schaalproblemen: de psycholoog heeft te maken met verschijnselen in een tijds-, ruimte-, en kapaciteitsschaal, die ook zijn eigen schaal is. Hij is niet alleen, zoals Wiener zegt, gekonfronteerd met relatief korte statistische runs (394, 191), hij is er zelf een, zij het met een formidabel informatiegehalte. Zijn in- en uitvoerorganen staan in geen verhouding tot zijn, misschien wat trage, maar tamelijk gedifferentieerde interne informatieverwerking. Alleen, het is niet genoeg; psycholoog en kliënt zijn verschijnselen van dezelfde orde van komplexiteit.

Het is daarom niet verwonderlijk dat het gemakkelijker is, de aktiviteit van de psycholoog te kritizeren dan deze te verbeteren. Het is ook niet verwonderlijk wanneer er wordt aangestuurd op de ontwikkeling van echte diagnostische machines. Terapiemachines liggen wat verder in het verschiet. Er is - mirabile dictu - geen twijfel aan dat zulke machines beter in staat zullen zijn met onze volle menselijkheid rekening te houden dan wijzelf.

[pagina 181]
[p. 181]

24. De psycholoog als instrument

Krijgen we nu de situatie die in het volgende grapje besloten ligt? Een psychoanalytisch terapeut die jarenlang, achter het hoofdeind van de bankaan de blik onttrokken, vrije associaties van zijn kliënten heeft aangehoord, krijgt tijdens zo'n zitting een onweerstaanbare dorst. Hij zet zijn bandapparaat aan en sluipt weg. Als hij het café om de hoek binnenstapt ziet hij daar de kliënt bij een biertje zitten. ‘Wat nu?’ vraagt hij verbaasd. ‘De mijne praat tegen de jouwe’, zegt de kliënt.

Ieder wetenschappelijk onderzoek, toegepast of zuiver, is en blijft een menselijke aktiviteit, waarin op het een of andere ogenblik de onderzoeker als gewoon mens heel zijn objektiverend gedoe terugvertaalt in een konklusie. Ergens sluipen de denkgewoonten en vooroordelen van de sensus communis wel weer binnen. In het onderzoek tracht hij echter zo onpartijdig, objektief en geformalizeerd mogelijk tewerk te gaan. Dit houdt in dat hij, waar mogelijk, het werk door machines, echte machines, zal laten verrichten. Het houdt ook in dat hij, zover mogelijk, zijn eigen rol in machinetermen zal formuleren en beoordelen. Alleen onder die voorwaarden kan het ideaal worden benaderd, dat in de onafhankelijkheidsstelling besloten ligt.

Dat in dit hoofdstuk misschien meer vragen zijn opgeroepen dan beantwoord, is geen bezwaar. Tenslotte gaat het er in dit boek om, het probleem te stellen. Het is daarbij naar voren gekomen dat formalizering van de rol van de onderzoeker in de psychologie haast nog dringender is dan in andere wetenschappen.

Juist in de sociale wetenschappen is de koppeling tussen de observator en het geobserveerde verschijnsel zo moeilijk te minizeren, zei Wiener (394, 190). Hij bedoelde het fenomeen dat ons in de geschiedenis van slimme Hans en zijn menselijke ekwivalenten bijna onoplosbaar scheen. Onze beschouwingen in dit hoofdstuk, de formalizering van de wetenschappelijke situatie in vijf varianten, het inzicht in de gevaren van faseverschuiving en spurieuze koppeling, geven tenminste de mogelijkheid, de schade te lokaüzeren en te verminderen, gangbare dwalingen op het spoor te komen.

Zo is het een dwaling dat de psychologie door exakte metoden van onderzoek en instrumentatie al aan de eisen van objektieve wetenschap voldoet; ook de feilen van het basisinstrument mogen niet over het hoofd worden gezien. Dat basisinstrument heeft geen konstante, maar variërende eigenschappen; het oefent ook ongewild en onbemerkt, invloeden op het objekt uit, die ongewenst zijn. Niet slechts de experimentele ingreep, maar nog een aantal andere aan de persoon van de expermentator gebonden variabelen oefent invloed uit, of kan invloed uitoefenen.

[pagina 182]
[p. 182]

Een grotere dwaling is het, uit de beperktheid van dit instrument tot de wenselijkheid, of zelfs de noodzaak, van een begrijpende metode te konkluderen. Daarbij voelen velen zich misschien beter. Het is te overwegen of dat niet komt omdat zo'n ‘metode’ in minder mate dwingt tot het opgeven van vooroordelen. Immers, een begrijpende psychologie blijft zich bewegen binnen het kader van de gemeenschappelijke bevangenheid door de sensus communis. Dit heeft het voordeel dat men zich in verstaanbare taal tot de kliënt kan richten, en dat de kliënt de wijsheid van de psycholoog zal bewonderen wanneer deze de vooroordelen van de kliënt bevestigt;anderzijds is de psycholoog bevredigd omdat hij zijn kennis heeft kunnen aanwenden tot heil van de medemens. Maar was het kennis? En is er hulp uit voortgekomen?

Kuyer heeft gevonden dat 17 van 25 plausibele hypotesen, ontleend aan de ‘ervaring’ van de psycholoog, die in de praktijk dikwijls zonder meer als vanzelfsprekende waarheden worden gehanteerd, geen verklarende waarde bezitten (210). Met dergelijke ‘wetenschap’ kan men niemand helpen.

Heil brengen, helpen, genezen, wordt vooral door jongere studenten herhaaldelijk als motivering gegeven voor hun keuze van de psychologie als studievak. Men kan er moeilijk bezwaar tegen maken. Het is wenselijk dat psychologische kennis wordt toegepast en gebruikt. Maar dan nuchter en zakelijk, als kennis. Die kennis moet eerst worden verworven, dikwijls tegen de tendenties van de sensus communis in. Daarbij is het nuttig, te ontdekken hoe feilbaar de psycholoog is. Analyse van die feilbaarheid in termen van de modellen die in dit hoofdstuk werden gebruikt zal o.a. kunnen leiden tot efficiënter, en dus heilzamer, gebruik van de psycholoog als instrument.

voetnoot*
Hoewel ik het Manual van de apa niet ken, ga ik er gemakshalve van uit dat de indelingskriteria voor de vijf diagnostische kategorieën een ondubbelzinnige sortering mogelijk maken.

voetnoot*
Wechsler Adult Intelligence Scale.

voetnoot*
De Engelse term spurious (in de psychologie vnl. in spurious correlation) wordt in de regel onvertaald gelaten. Daar hij teruggaat op Latijn spurius: onecht, is er geen reden om niet, naar Nederlandse gewoonte, de verfranste vorm spurieus te gebruiken. Dit sluit goed aan bij de Anglo-Amerikaanse terminologie, en heeft het voordeel (weliswaar spurieus, maar) beschaafd Nederlands te zijn.


Vorige Volgende

Footer navigatie

Logo DBNL Logo DBNL

Over DBNL

  • Wat is DBNL?
  • Over ons
  • Selectie- en editieverantwoording

Voor gebruikers

  • Gebruiksvoorwaarden/Terms of Use
  • Informatie voor rechthebbenden
  • Disclaimer
  • Privacy
  • Toegankelijkheid

Contact

  • Contactformulier
  • Veelgestelde vragen
  • Vacatures
Logo DBNL

Partners

Ga naar kb.nl logo KB
Ga naar taalunie.org logo TaalUnie
Ga naar vlaamse-erfgoedbibliotheken.be logo Vlaamse Erfgoedbibliotheken