Een dikke twee jaar geleden vond in het Utrechtse winkelcentrum Overkapel een enorme gasexplosie plaats, waarbij verschillende mensen gewond raakten, waaronder een 12-jarig meisje ernstig. De explosie was het gevolg van een gaslek, dat weer werd veroorzaakt door een grondboring. Deze grondboring werd uitgevoerd in de veronderstelling dat er zich op de bewuste plek geen ondergrondse gasleidingen bevonden. Om te meten of dat laatste al dan niet het geval, gebruikten de uitvoerders, werknemers van IJB Geotechniek, een wichelroede (bron: AD/ UN 3 maart 2009). Een wichelroede, dat is toch een instrument waarvan de effectiviteit op geen enkele manier wetenschappelijk bewezen is? Inderdaad, voor het opsporen van ondergrondse waterleidingen of begraven objecten is herhaaldelijk en consistent aangetoond dat wichelen geen enkel positief effect heeft. Wel zijn er nog wat nader te verklaren positieve effecten van wichelen bij het opsporen van ondergrondse waterbronnen in droge gebieden (voor meer informatie, zie D. Deming in Ground Water, 2002, nr. 40). Tegen deze achtergrond hebben de uitvoerders van de grondboring op enig moment de beslissing genomen om de wichelroede-techniek toe te passen voor het opsporen van gasleidingen, met alle gevolgen van dien.
Menselijk beslissen is een complex proces. Beslissingen zijn gebaseerd op informatie; de informatie moet beschikbaar zijn; en de beslisser moet voldoende accurate informatie mee laten wegen in de beslissing alvorens tot actie over te gaan. Een voor de hand liggende bron van relevante informatie bestaat uit het effect dat een actie in een eerdere, vergelijkbare situatie heeft gehad. In het geval van wichelen zou je kunnen kijken naar de tests met waterleidingen, of besluiten dat er specifiek ten aanzien van gasleidingen helemaal niets bekend is. Dan nog zitten we met een techniek waarvan de veilige toepasbaarheid volstrekt onbewezen is. Dat moet dan ook nog afgezet worden tegen de mogelijke gevolgen van een verkeerde beslissing. Laten we hopen dat in dit geval de mensheid stevig lering trekt uit de uiteindelijke catastrofale knal die het gevolg was van de beslissing om geen andere opsporingsmethode te gebruiken dan wichelen.
Leren doe je van fouten, van negatieve feedback, maar ook van intern (in de hersenen) gedetecteerde conflicten, bijvoorbeeld tussen twee onverenigbare actie-mogelijkheden, zoals naar links en naar rechts sturen. De bedoeling is dat we bij een volgende keer dat een vergelijkbare situatie zich voordoet, ruimer van te voren weten of we naar links of naar rechts willen sturen, of sterker de voorkeur geven aan de actie waarmee we de negatieve feedback kunnen vermijden. Over dit soort leerprocessen is de laatste tien jaar een grote hoeveelheid neurofysiologische en neuro-chemische gegevens beschikbaar gekomen. Er zijn inmiddels een aantal fraaie theoretische modellen over hoe verschillende hersengebieden naar elkaar signaleren dat er een probleem is, een intern conflict, of een zelf-detecteerde fout in het gedrag, of een negatieve consequentie van een eigen actie. Hoewel deze modellen adequaat de beschikbare evidentie integreren, hebben ze ook speculatieve componenten nodig om het verhaal rond te krijgen.
Dat ziet er dan als volgt uit. We vereenvoudigen de hersenen tot een schil (cortex) en kern (subcortex). In de schil onderscheiden we de laterale frontale cortex, de mediale frontale cortex (met daarin de haast fameuze anterieure cingulate cortex), en de stukken cortex die informatie uit de zintuigen krijgen dan wel de motoriek aansturen. In de kern onderscheiden we het ventrale (onderste) en het dorsale (bovenste) striatum, grofweg corresponderend met de basale ganglia. Neem een situatie waarin een mens of dier een taak verricht wat meestentijds leidt tot een positief feedback-signaal (‘goed gedaan’), of gewoonweg een beloning verwacht die ook meestentijds gewoon ontvangen wordt. Dat leidt tot een min of meer continue invoer van de neurotransmitter dopamine in het ventrale striatum. De dopamine-binding zorgt dat het relatief rustig blijft in de gebieden waarin het ventrale striatum verder mee verbonden is, zoals het dorsale striatum en de mediale frontale cortex. Als er echter plots een negatief feedback-signaal klinkt (‘fout’), of de immer verwachte beloning blijft een keer uit, dan stokt de dopamine invoer in het ventrale striatum onmiddellijk en kortstondig. Deze dopamine-dip treedt op binnen een fractie van een seconde nadat de informatie dat er een probleem beschikbaar is gekomen (in de buitenwereld). Het gevolg van de dip is dat de met het ventrale striatum verbonden neuronen in het dorsale striatum en de mediale frontale cortex, eveneens kortstondig, over-actief worden. Deze over-activatie is overigens afhankelijk van signalering via weer andere neurotransmitters, zoals glutamaat. Er wordt en is zelfs zeer genadrukkelijk geclaimd dat de mediaal-frontale over-activatie direct meetbaar is met elektroden op de schedel, als de zogenaamde ‘error-‘ of ‘conflict-‘ of ‘feedback-related negativity’. De laatste twee stappen in de leer-cirkel betreffen het signaal dat vervolgens van mediale naar laterale frontale cortex wordt gezonden (‘hee, dat ging niet goed, doe er eens wat aan voor de volgende keer’). Bij mijn weten is dit signaal nog nooit echt zichtbaar gemaakt in mens of dier. Overdadige evidentie bestaat er wel voor de laatste schakel: signalen uit de laterale frontale cortex naar de sensorische en de motorische cortex, die er voor zorgen dat we in de directe toekomst gevoeliger zijn voor bepaalde informatie dan voor andere, of meer geneigd zijn tot de ene (want waarschijnlijk beloonde) actie dan tot de andere. Dat alles dus met het doel om bij een volgende gelegenheid de neiging tot een actie die minder negatieve gevolgen heeft groter te maken.
De implicatie is dat als er weinig dopamine is voor de signalering naar het ventrale striatum, dat een plotselinge dip in die dopamine-toevoer ook weinig effect heeft, en er een relatief klein ‘leer-signaal’ zal optreden. Als er relatief weinig dopamine beschikbaar is, zal er dus slecht geleerd worden van fouten, of van negatieve consequenties in het algemeen. Tevens zijn de signalen het leer-circuit afhankelijk van andere neurotransmitters, zoals glutamaat. De latere schakels, zoals het aanpassen van de gevoeligheid voor bepaalde informatie of de neiging om bepaalde acties te initiëren, hebben hun eigen neurotransmitters, en zijn bovendien beïnvloedbaar door meer of minder toevallig fluctuaties in de aandacht, of afleidende gebeurtenissen. Kortom, er is een ingewikkeld samenspel van factoren dat bepaalt wanneer we beslissen om sommige acties wel en andere niet uit te voeren, met alle mogelijke gevolgen van dien.
Leon Kenemans
zondag 22 maart 2009
Abonneren op:
Reacties posten (Atom)
Geen opmerkingen:
Een reactie posten