Wermink, Blokland, Nieuwbeerta en Tollenaar duiken

Waarom precies geen placebo-straffen?

In 2009 publiceerde het Tijdschrift voor Criminologie (TvC) het artikel “Recidive na werkstraffen en na gevangenisstraffen”. (Link naar een pdf-versie )

Professor Nieuwbeerta
Afbeelding dankbaar geleend van de Universiteit Leiden

De auteurs claimden te hebben aange­toond dat daders na een werkstraf minder recidiveren dan na een gevangenisstraf. Begin 2011 was de studie onderwerp van debat in de Tweede Kamer. Mevrouw Helder van de PVV werd in het parlement en in de sociale media keihard aangevallen omdat ze de claims verwierp.

We bestudeerden het betreffende artikel in detail en concludeerden dat het rammelde. We besloten serieus werk te gaan maken van deze uiting van beroerd wetenschappelijk niveau. Niet alleen betreft het hier maatschappelijk beslist relevant onderzoek: de claims worden op grote schaal klakkeloos overgenomen in media en politiek.

Het werd een heel karwei. We zijn ook nog niet klaar, maar er zit wel schot in. Een deel van onze kritiek is gepubliceerd in het TvC.

Communicatie met het tijdschrift

We schreven eerst een uitgebreide (circa 7000 woorden), wetenschappelijk geformuleerde kritiek, die we in maart 2012 aan het TvC aanboden. We vroegen het artikel van Wermink cs in te trekken.

Eind mei 2012 liet het TvC weten het artikel van de wetenschappers niet in te trekken en ons artikel niet te laten peer-reviewen; wel nodigde men ons uit een discussiestuk te schrijven.

We vroegen of het tijdschrift dan een link kon opnemen naar ons volledige artikel dat we online zouden plaatsen. Aanvankelijk ging de redactie daarmee akkoord. In juli stuurden we ons discussiestuk, waarbij we ons netjes hielden aan het maximum van 2500 woorden, we startten KeizersEnKleren.nl en plaatsten daarop als eerste bijdrage het complete artikel.

In oktober antwoordde TvC. De redactie verzocht ons de scherpste kritiek te verzachten of weg te laten. Dat deden we en begin december kregen we te horen dat deze aangepaste versie geplaatst zou worden: eind januari 2013 zouden wij de geredigeerde tekst ontvangen. Intussen had men laten weten dat er toch geen linkje zou komen naar de uitgebreidere kritiek…

Begin februari vroegen we waar de tekst bleef en 21 februari ontvingen we dan de keurig geredigeerde tekst met het verzoek: “Graag uiterlijk morgen een reactie”. We voldeden aan dit verzoek.

Op 28 maart ontdekten we dat onze bijdrage verschenen was in het tijdschrift en voorzien was van een nawoord van de auteurs onder de merkwaardige titel: “De betere stuurlui roeien (ook) met de riemen die ze hebben“.

Veel woorden

Het eerste wat opviel was dat het ‘weerwoord’ ruim 4000 woorden telde. De bovengrens in aantal woorden gold blijkbaar niet voor Wermink cs. De omvang viel extra op omdat de eerste ongeveer 1000 woorden een algemene beschouwing vormden over empirisch onderzoek die niet direct betrekking had op het oorspronkelijke onderzoek en al helemaal niet op onze kritiek.

We willen geen ruzie krijgen over copyright en nemen daarom het stuk van Wermink cs hier niet op. In plaats daarvan geven we hier op een speciale manier onze eigen bijdrage weer en sluiten af met enkele korte kanttekeningen bij het stuk van Wermink cs.

De gebruikte achtergrondskleuren betekenen:

ORANJE: Dit deel is eenvoudigweg genegeerd in de reactie van de auteurs.
GEEL: Op deze onderdelen van onze kritiek is wel ingegaan maar de reactie snijdt geen hout.

 

Recidive, werkstraf en gevangenisstraf: een kritische bespreking

In het derde nummer van 2009 publiceerde het Tijdschrift voor Criminologie het artikel ‘Recidive na werkstraffen en na gevangenisstraffen’ van Wermink, Blokland, Nieuwbeerta en Tollenaar.

In deze bijdrage plaatsen we kanttekeningen bij de gehanteerde operationele definitie van recidive, de bijzondere interpretatie van de rechtsgang en, vooral, bij de gebruikte statistiek.

Uit de samenvatting van het artikel citeren wij:

Het doel van dit artikel is het vergelijken van de recidive van werkgestrafte met de recidive van gevangenisgestrafte volwassen daders in Nederland. We maken gebruik van longitudinale, justitiële gegevens (…) Om rekening te houden met mogelijke selectie-effecten wordt gebruikgemaakt van “propensity score matching” en “matching by variable.

Het succes of falen van werkstraffen als alternatief voor gevangenisstraf raakt onmiddellijk aan een groot verschil van mening in de politiek; kort door de bocht geformuleerd: moeten misdadigers worden gestraft of geholpen? Het onderzoek kreeg dan ook veel belangstelling in de media.

Recidivegedrag versus strafrechtelijke recidive

Over de vraag wat onder recidive moet worden verstaan, bestaat in de literatuur eensgezindheid: er is sprake van recidive wanneer iemand die een misdaad of overtreding gepleegd heeft, dat later opnieuw doet. Het meten van recidive is echter niet eenvoudig. In de onderhavige studie baseerde men zich, net als in vele andere studies, op gegevens afkomstig van justitie, op de strafrechtelijke recidive dus. Over de frequentie van recidivegedrag dat niet gerechtelijk beoordeeld wordt, het dark number, zijn per definitie geen exacte gegevens beschikbaar. Op basis van gegevens over aangiftes en slachtoffers staat echter vast dat slechts een fractie van het aantal criminele daden uiteindelijk voor de rechter komt.

De auteurs brengen op de eerste bladzijde hun onderzoek expliciet in verband met de doelstelling ‘recidive’ – zonder nadere specificatie – te verminderen: ‘De vraag die we in dit artikel trachten te beantwoorden, is in hoeverre werkstraffen, gelet op de recidive in de navolgende periode, een goed alternatief zijn voor gevangenisstraffen.’ Het bestaan van een dark number is dus niet mee in overweging genomen door de onderzoekers.
Impliciet veronderstellen de onderzoekers blijkbaar dat de kans om wel of niet gesnapt, aangeklaagd en veroordeeld te worden, berust op toeval. Dat lijkt ons geen legitieme veronderstelling.

Ook om een andere reden lijkt ons het buiten beschouwing laten van het deel van de criminaliteit dat niet voor de rechter komt, ondermijnend voor de relevantie van het onderzoek:

door de beperking tot de strafrechtelijke recidive in het algemeen en van first offenders in het bijzonder blijft de afschrikwekkende werking van straf voor de generale preventie buiten beeld.

De rechtsgang gewraakt

De onderzoekers stellen terecht vast dat er eigenlijk experimenten zouden moeten worden uitgevoerd met random toewijzing van taakstraf of gevangenisstraf. Nu was het in hun woorden cruciaal ‘om voor selectieprocessen te controleren’.

De auteurs staan in algemene zin uitgebreid stil bij deze noodzaak, maar besteden geen woord aan de voorwaarden en beperkingen van de gekozen methodes voor die ‘controle’.

In de studie was sprake van groepen die al waren gevormd door rechters. Die hadden actief een selectie nagestreefd die zeer rechtstreeks en zeer negatief van invloed is op de betrouwbaarheid en relevantie van de resultaten. De rechters deden hun best om taakstraffen en gevangenisstraffen te geven aan díé verdachten bij wie die soort straf het beste paste.

Die inspanningen van de rechters zijn door de onderzoekers dus van tafel geveegd. En niet alleen die van de rechters trouwens: ook die van het Openbaar Ministerie en tot op zekere hoogte zelfs van de verdediging. Die dragen immers actief bij aan deze selectie, die vernietigend is voor de betrouwbaarheid en relevantie van dit onderzoek. Men stelle zich voor een opdracht te krijgen om te evalueren of rechters de juiste soort straf – taakstraf of detentie – toewijzen: daarin zou de score recidive vanzelfsprekend meetellen als belangrijke aanwijzing voor succes of falen van de rechters.

De gebruikte statistische methodiek

De door de onderzoekers gebruikte propensity score matching wordt toegepast om observationele gegevens zodanig te bewerken en groeperen dat ze behandeld kunnen worden alsof ze het resultaat zijn van een gecontroleerd experiment.

De methode heeft met name opgang gemaakt in de context van onderzoek naar het gebruik van medicijnen. Dit onderzoek richtte zich op crimineel gedrag door mensen die voor de eerste keer veroordeeld waren voor een misdrijf. De groep die gevangenisstraf kreeg, is door de onderzoekers bestempeld tot controlegroep: alsof dit geen ‘behandeling’ is die effect zou kunnen hebben op de neiging tot criminaliteit nadien en de taakstraf wel.

In de criminologie, en zelfs in het bekritiseerde artikel, wordt melding gemaakt van het verschijnsel dat mensen in de gevangenis leren om ‘betere’ criminelen te worden. Zeker tegen die achtergrond is de voorstelling alsof gevangenisstraf zou staan voor een ‘niet-behandelde’ groep nogal vreemd. Mede hierdoor verdwijnt de vraag waarom de rechter voor de ene of de andere straf koos, per definitie en volledig uit het zicht. Kregen veroordeelden een taakstraf vanwege positieve verwachtingen over het opvoedende effect daarvan, vanwege negatieve verwachtingen met betrekking tot gevangenisstraf, vanwege de wens te vergelden of op basis van de overweging dat de maatschappij in ieder geval enige tijd beschermd zou zijn tegen het gedrag van de veroordeelde?

Het zou kunnen dat taakstraffen in het geheel geen effect hebben op de kans om recidive tegen te gaan, terwijl detentie die kans juist vergroot. In een ouder artikel van drie van de vier betrokken auteurs was dat nota bene een hoofdconclusie: ‘detentie heeft een criminogeen effect’ (Nieuwbeerta e.a., 2007).

Zes stappen

Bij de gehanteerde methodiek was sprake van zes afzonderlijke stappen:

  1. keuze van variabelen;
  2. vaststellen van een model op basis van logistische regressie;
  3. berekening van een propensity: het toekennen van een ‘kans’ dat deze persoon veroordeeld zou worden tot een taakstraf dan wel een gevangenisstraf;
  4. het een-op-een matchen van tweetallen veroordeelden: mensen met ongeveer gelijke ‘kans’ op een taakstraf, van wie de een een taakstraf kreeg, terwijl ‘zijn match’ daadwerkelijk de gevangenis in ging;
  5. het buiten beschouwing laten van een deel van de gegevens;
  6. vergelijking van twee groepen – een die was geselecteerd uit de taakgestraften en een uit de gevangenisgestraften – en interpretatie van de gevonden verschillen.

Stappen 1 en 2 zijn op een onvolledige wijze weergegeven in een tabel. De waarden voor de parameters die aangeven hoe in het vastgestelde model die onderlinge verhouding in voorspellende kracht doorwerkt, zijn namelijk niet weergegeven. Ernstiger is dat ook elke aanduiding ontbreekt van de gevonden fit van het verkregen model. De significantie van de regressiecoëfficiënten voor elke variabele apart is wel weergegeven. Voor de statistiekleek klinkt dat misschien als iets dat ook relevantie en betrouwbaarheid onderbouwt, maar in werkelijkheid zegt die significantie niets zonder theoretische onderbouwing.

Omdat er geen informatie verschaft wordt over het wel of niet ‘passen’ van het model, zijn er slechts twee regels in het artikel die de keuze van de variabelen onderbouwen. Een daarvan verwijst naar het gezag van Nagin e.a. (2009),[i] de andere naar een stuk van Monahan (2006). Het stuk van Monahan waarnaar verwezen wordt, gaat eenvoudigweg niet over wat de auteurs erover beweren.

Incomplete matching

Er is sprake van twee manieren van matchen: nearest neighbour matching en maximaal verschil in propensity score. Wanneer eenduidig was gekozen voor de eerste manier had men aan ieder individu uit de kleinste groep een individu kunnen koppelen uit de grotere groep. In plaats daarvan is gekozen voor een mengsel van beide methodes: ‘Een persoon uit de controlegroep werd gekoppeld aan een individu uit de experimentele groep, wanneer het verschil in de geschatte kans op werkstraf voor beide personen niet meer bedroeg dan 0,05.’ Dit resulteert in het schrappen van personen aan beide uiteinden van de gematchte groep.

Voor 39 procent van de mensen in de controlegroep kon – vanwege dat maximum – geen match gevonden worden. Niet zo vreemd: sommige vergrijpen zullen zelden of nooit tot een taakstraf leiden, andere bijna altijd.

De aard van het delict is een zeer voor de hand liggende voorspeller. De groep van 39 procent is echter niet op basis van deze variabele geschrapt, maar op basis van de geconstrueerde propensity score, waar het delicttype slechts een bouwsteen van vormt.

Hiermee raken we aan een ander problematisch aspect van de opzet van de analyse: de bijna 73 procent van de werkgestrafte en 39 procent van de gevangenisgestrafte daders die buiten de vergelijking zijn gehouden omdat ze niet ‘passen’ vanwege het te grote verschil in propensity score, zijn wel meegewogen bij de opstelling van het model voor diezelfde propensity score.

De eigenlijke toetsing

De gehanteerde wijze van presenteren van de significantie in de gevonden cijfermatige resultaten is niet toegelicht; er wordt slechts uitgebreid aangegeven hoe ‘significant’ de gevonden verschillen zijn.

Het artikel van Rosenbaum en Rubin, waar de auteurs uitgebreid naar verwijzen, vermeldde in de titel reeds dat het ging over sampling methods.

Bij Wermink e.a. was echter geen sprake van sampling: data van de complete populaties van veroordeelden waren beschikbaar.

Wanneer in zekere zin de complete populatie onderzocht is, is het hanteren van een statistische significantietoets vreemd en onnodig. In plaats van over het statistische begrip kunnen we het dan immers hebben over huis-tuin-en-keukensignificantie: ‘van betekenis’. In de statistiek spreken we met name over significantie om aan te geven in welke mate resultaten, gevonden op basis van steekproeven, van betekenis geacht mogen worden voor de hele populatie. Of resultaten met betrekking tot gehele populaties ‘van betekenis’ zijn, stel je niet statistisch vast.

Men had op basis van direct beschikbare gegevens gewoon een uitspraak kunnen doen over het aantal vergrijpen dat volgens de auteurs mogelijk niet gepleegd is, dankzij het feit dat van de 11.308 in 1997 veroordeelden een selectie van 2.123 niet de ‘zwaarst mogelijke justitiële reactie op [de] ernstigste delicten’ kreeg opgelegd (deze bijzondere wijze van omschrijven van gevangenisstraf ontlenen we aan het eerdergenoemde artikel van drie van de vier betrokken auteurs, van 2007). Dan verandert de claim ‘50% minder veroordelingen over een periode van acht jaar’ in ‘het voorkómen van ruim één delict per dag’.

Los van de ondeugdelijke onderbouwing van de claim, is hier sprake van een impact die niet echt ‘van betekenis’ is in vergelijking met het werkelijke aantal gepleegde delicten dat in miljoenen per jaar wordt uitgedrukt.

Correlatie versus causaliteit

De onderzoekers claimen een correlatie te hebben aangetoond tussen de soort straf na een eerste veroordeling en het aantal malen dat dezelfde persoon later opnieuw opgepakt en veroordeeld werd. Correlatie toont geen causaliteit aan. Data kunnen correleren omdat er een causale factor is voor beide. Het is niet moeilijk om daar kandidaten voor aan te wijzen. Te denken valt aan: intelligentie, vooral sociale intelligentie, en aan de mate waarin iemand ‘onverbeterlijk’ is.

Iemand die zelfs voor de rechter niet in staat is om zich wat in te houden in zijn uitlatingen en daarom eerder tot gevangenisstraf dan tot taakstraf zal worden veroordeeld, zal ook lager scoren op het vermogen om te voorkomen dat hij voor nieuwe vergrijpen aangehouden, in staat van beschuldiging gesteld en veroordeeld wordt.

Veroordeelden die in staat zijn om de rechter de indruk te geven dat ze hun leven kunnen en willen verbeteren, en daarom een taakstraf krijgen opgelegd, zullen om twee redenen minder veroordeeld worden voor nieuwe vergrijpen. Ofwel omdat de indruk klopte en men geen nieuwe vergrijpen pleegde, ofwel omdat de doortraptheid die hen hielp om de rechter om de tuin te leiden, ook in hun voordeel werkt voor wat betreft de kans om aangehouden, in staat van beschuldiging gesteld en veroordeeld te worden voor nieuwe vergrijpen.

Wetenschap versus beleidsadvies

Omdat de conclusie van het artikel begint met een opmerking over de theorie lijkt het erop dat de invalshoek op de eerste plaats academisch was en niet gericht op beleidsevaluatie of -advies. Wat op dit terrein bereikt is, is zowel mager als onduidelijk. De conclusie is slechts dat de onderzoeksresultaten ‘vraagtekens [zetten] bij de theorie van afschrikking’.

Maar was dat wel hetgeen getoetst werd? We stellen vast dat er op zijn best sprake was van een stelsel van hypothesen.

Was er dan sprake van beleidsevaluatie of beleidsadvies? Daarover concluderen de onderzoekers:

Ook voor beleidsmakers zijn onze resultaten relevant (…) uit onze studie [blijkt] dat daders na een werkstraf minder recidiveren dan na een gevangenisstraf, wat een extra kostenbesparing oplevert in termen van het voorkomen van delictschade.

Omdat de resultaten ‘ook’ voor beleidsmakers relevant worden genoemd, wordt andermaal gesuggereerd dat de invalshoek toch vooral een academische was. Maar dan nog: over welke beleidsmakers gaat het hier? Worden hier niet eigenlijk de rechters bedoeld, die aangespoord worden om over de gehele linie vaker te kiezen voor taakstraffen? Dat zou wel aansluiten bij het feit dat de allereerste regel van het artikel over de rechters gaat en even verderop de ‘centrale vraag’ geformuleerd wordt als:

In hoeverre [zijn] werkstraffen een goed alternatief voor gevangenisstraffen in relatie tot de recidive van de gestraften na afloop van hun straf?

Gezien het feit dat reeds in 1997 beduidend meer taakstraffen dan gevangenisstraffen opgelegd werden en het aandeel taakstraffen daarna nog verder is gegroeid, een opmerkelijke invalshoek. De rechters schijnen er immers juist volledig van doordrongen te zijn dat werkstraffen een goed alternatief vormen. De rechters krijgen vanuit dit onderzoek niet de allerkleinste aanwijzing over wannéér taakstraf dan wel gevangenisstraf op te leggen: ze moeten gewoon (nog) vaker kiezen voor taakstraffen.

En wat hebben beleidsmakers aan dit onderzoek?

Beleidsmakers kunnen op basis van dit onderzoek met geen mogelijkheid bepalen of de – geclaimde – mindere recidive iets positiefs zegt over taakstraffen of iets negatiefs over gevangenisstraffen. Andere vormen van straf, zoals huisarrest bijvoorbeeld, blijven buiten beschouwing. Die straf heeft het voordeel van de afschrikwekkende werking, maar niet het nadeel van de gevangenisstraf als criminele leerschool.

Bij onderzoek op dit gebied moet niet uitsluitend gekeken worden naar het directe effect van de straf op de gedetineerden: er zal ook gekeken moeten worden naar een scala van andere invloeden. Een mogelijkheid is dat bajesklanten zo moeilijk re-integreren dat dit hen tot extra criminaliteit aanzet (vanwege het stempel en daaraan verbonden achterstelling, verliezen van werk en vriendin, de opgedane ‘opleiding’ tot ‘betere’ crimineel, het op peil willen houden van de gescoorde stoerheidspunten). Ook de mogelijkheid dat de reclassering faalt of dat van de omstandigheden in de gevangenis nauwelijks of geen afschrikwekkende werking uitgaat, moet als mogelijke verklaringsgrond worden meegenomen.

Literatuur

Monahan, J. (2006). Structured violence risk assessment. In: R. Simon & K. Tardiff (eds.). American psychiatric publishing textbook on violence assessment and management. Washington, DC: American Psychiatric Publishing.

Nagin, D.S., Cullen, F.T. & Jonson, C.L. (2009). Imprisonment and reoffending. Crime and Justice, 115-200.

Nieuwbeerta, P., Nagin, D.S. & Blokland, A.J. (2007). Het meten van effecten van gevangenisstraf op crimineel gedrag in een niet-experimentele studie. Mens & Maatschappij, 82, 272-299.

Rosenbaum, P. & Rubin, D. (1983). The central role for the propensity score in observational studies of causal effects. Biometrika, 70, 41-55.

Wermink, H., Blokland, A., Nieuwbeerta, P. & Tollenaar, N. (2009). Recidive na werkstraffen en na gevangenisstraffen: een gematchte vergelijking. Tijdschrift voor Criminologie, 51(3), 211-227.

 Kanttekeningen

Door het kleurgebruik is bijna in een oogopslag te zien dat de auteurs niet zo goed zijn ingegaan op onze kritiek. Het is echter nog erger dan het lijkt. De niet gekleurde gedeelten zijn vooral de neutrale, beschrijvende passages.

Zowel ons complete artikel als het, op aandringen van de redactie, ingekorte en afgezwakte discussiestuk beginnen we met de opmerking dat we schrijven over drie belangrijke fouten die betrekking hadden op … (zie hierboven). Het eerste wat Wermink cs te berde brengen over ons stuk is de bewering dat de kritiek zich

(…) concentreert [zich] rond (sic) vier aspecten: (1) de indirecte wijze waarop het criminele gedrag, en daarmee het effect van werkstraffen, is gemeten, (2) het ontbreken van een onbehandelde controlegroep, (3) het ontbreken van random toewijzing en (4) de generaliseerbaarheid van onze conclusies.

(1) is eenvoudigweg onwaar.

(2) komt wel in ons stuk voor, maar betreft een punt van kritiek dat op zichzelf genomen niet zo belangrijk was: het vormde nauwelijks meer dan een onderstreping van onze belangrijkere punten van kritiek. Juist dit onderdeel, waar we ons beslist niet ‘op concentreerden’, heeft in het ‘weerwoord’ veel aandacht gekregen.

(3) is een volkomen verdraaiing van wat wij schrijven.

(3) en (4) samen zijn in de plaats gekomen van ons punt 3: de ‘gebruikte statistiek’. Om elk misverstand uit te sluiten hadden we er nog bij vermeld ‘vooral’.

Juist onze zwaarstwegende punten van kritiek zijn het meest volledig genegeerd. We lichten drie van de meest kritische punten eruit en wijzen op twee extra pikante zaken.

In het uitgebreide stuk hadden we onderstaande uitspraak opgenomen over de zogenaamde Propensity Score Matching, afkomstig van Thomas Love, een man met een grote staat van dienst in de statistiek:

But if our propensity model misses an important reason why subjects are selected to treatment or control, we’ll be in trouble.

De auteurs gebruiken heel veel woorden om niet over deze valkuil te hoeven spreken.

Het sluit direct aan op de valse verwijzing naar het stuk van Monahan. In het discussiestuk hadden we op aandringen van de redactie dit kritiekpunt afgezwakt. Onze oorspronkelijke, kritischer formulering sloten we als volgt af:

De zin “Van deze kenmerken is ook bekend dat zij van belang zijn voor rechters, wanneer zij beslissingen nemen ten aanzien van het berechten van daders (Monahan, 2006).” wordt dus beslist niet door Monahan, 2006 ondersteund. Onze hoop dat zich hier slechts een ongelukkige verschrijving had voorgedaan, dat bijvoorbeeld naar een andere tekst van Monahan verwezen had moeten worden, werd de grond ingeboord na de vaststelling dat in REC-EN elke verwijzing naar Monahan ontbreekt. Voor deze ‘verschrijving’ lag zo’n verbetering kennelijk niet binnen handbereik.

Het weerwoord dat wel gegeven wordt op het negeren van de waarschuwing van Love bevat een pikante verwijzing naar “een Engelstalig artikel dat over deze studie verscheen“. Pikant om twee redenen. Dat artikel bevat grotendeels de zelfde inhoud als het gewraakte stuk en is het geschreven door de vier auteurs en één nieuwe auteur: D. Nagin. Dit is dezelfde persoon naar wie verwezen wordt als gezaghebbende bron voor de keuze van die parameters, naast de valselijk geciteerde Monahan. Nog pikanter: in dat Engelstalige artikel komt geen enkele verwijzing voor naar dit Nederlandse!

Het tweede buitengewoon pikante aspect is de reactie op onze kritiek dat de “inspanningen van de rechters door de onderzoekers dus van tafel [zijn] geveegd“. De auteurs formuleren het indirect, maar in feite komt hun reactie neer op een nog nadrukkelijker denigreren van de rol van de rechters. Opmerkelijk: ook in een ander stuk van Wermink en andere auteurs, dat hier op de webstek staat als tweede non-peer review, zit dat thema. Daar werd het zo verwoord:

Bovendien menen wij dat rechters ook zelf niet exact weten hoe ze tot een bepaalde straf komen. Binnen de zeer ruime discretionaire bevoegdheid die de rechter (vooralsnog) hebben kunnen tal van juridische maar ook psychologische factoren een rol spelen waarvan de beslisser zich niet bewust is.

Het derde en laatste kritische punt is het meest beschamende voor Nieuwbeerta cs. Het gaat om het fenomeen ‘placebo-straffen’. Citaat uit het weerwoord:

De ideale manier om het effect van werkstraf vast te stellen zou, net als bij een nieuw medicijn, een volledig gerandomiseerd experiment zijn. Verschillende aspecten van de strafrechtspraktijk echter, compliceren de opzet en uitvoering van een dergelijk experiment. Wij noemen er hier drie.

Ten eerste geldt binnen het strafrecht de eis dat de straf een adequate reactie moet zijn op het door de verdachte begane strafbare feit. Dit beginsel staat op gespannen voet met het toevallig toewijzen van een bepaalde straf. In de strafrechtspraktijk zullen rechters steeds proberen de ‘meest passende’ straf op te leggen, waardoor structurele verschillen kunnen ontstaan tussen dadergroepen die verschillende straffen krijgen opgelegd.

Ten tweede verzet de aard van het strafrecht zich tegen het ongemoeid laten van verdachten die naar het oordeel van de rechter straf verdienen: van een ‘placebo’-straf kan binnen het strafrecht daarom geen sprake zijn.

Tot slot ontkomt onderzoek naar de effecten van straf niet aan een probleem dat inherent is aan de hele criminologische wetenschap: het ontbreekt bij het bepalen van het effect van straf op het criminele gedrag van de gestrafte doorgaans aan mogelijkheden dit criminele gedrag op een directe manier te meten.

Wat er staat lijkt op het eerste gezicht niet onzinnig. Dat er niets klopt van het verhaal blijkt pas wanneer je tot je door laat dringen wat er ontbreekt: de vaststelling namelijk dat een placebo-straf logisch gezien absoluut onmogelijk is. Men kan geen straf opleggen die eigenlijk geen straf is maar op de veroordeelde alleen overkomt als straf.

We verwijzen hier met opzet niet naar ‘Wermink cs’ maar naar ‘Nieuwbeerta cs’. Achtergrond daarvan is de oratie van professor Nieuwbeerta. Frans Groenendijk schreef daarover we afgelopen december al hier op Keizers en Kleren een stuk met de substitel: “straf die stiekem geen straf is”. In zijn oratie formuleerde de professor het zo:

We zullen daarbij in gecontroleerde experimenten bij controlegroepen van veroordeelden een deel van de straf achterwege laten. In de medische wetenschap zijn dergelijke gerandomiseerde experimenten met placebo’s standard practice.

Nieuwbeerta impliceerde hier dus dat toedienen van een lagere dosering van een medicijn te vergelijken is met het geven van een placebo. In het bekritiseerde artikel wordt een placebo-straf indirect gedefinieerd als “het ongemoeid laten“, hetgeen neerkomt op helemaal géén behandeling.

Conclusie

Onze conclusie is erg hard. Op het oorspronkelijke onderzoek was heel wat aan te merken. Elk wetenschappelijk onderzoek, zeker elk sociaal-wetenschappelijk onderzoek, kent echter beperkingen. Het onderwerp is niet alleen van groot maatschappelijk belang maar ook beslist moeilijk te onderzoeken. De auteurs wijzen echter alle kritiek af: niet alleen door een zwakke argumentatie maar ook door eenvoudigweg op de belangrijkste punten van kritiek niet in te gaan. Daartegenover staat de opname van allerlei heel algemene overwegingen die geen betrekking heeft op onze kritiek, zelfs niet op het bekritiseerde artikel van henzelf.

De inhoud van dit weerwoord is daarom in onze ogen vele malen verontrustender dan het oorspronkelijke artikel. Het toont een tekort aan integriteit en competentie. We laten ons niet uit over de vraag wat van die twee erger is. De combinatie is echter funest. Funest voor het politieke debat over bestrijding van de criminaliteit en funest voor het aanzien van de wetenschap.

[i] NB In de literatuurlijst van het artikel van Wermink e.a. bevat de verwijzing naar het artikel van D.Nagin, naast een foutief jaartal, nog een typefout: ze schrijven in de titel ‘on’ in plaats van ‘and’.

Frans Groenendijk, André van Delft

2 reacties op “Wermink, Blokland, Nieuwbeerta en Tollenaar duiken

  1. Ik laat studenten een lange publicatie bekritiseren van Nieuwbeerta en Wermink en hun kornuiten en wel bij het vak ‘beleidsevaluatie’ van de sociologiemaster in Groningen. Aandacht gaat uit naar de zwakte van dit (en ander) werk. Veel statistisch gegoochel dat maar heel beperkt zinvol is, weinig toevoeging aan wetenschappelijke kennis, geen enkele mogelijkheid de conclusies op nieuwe overtreders op een andere tijd en op een andere plaats toe te passen. De studenten moeten dit lezen als voorbeeld van hoe het niet moet. Heel leerzaam.
    Mag ik jullie tekst in mijn college gebruiken?

Laat een reactie achter bij Frans Groenendijk Reactie annuleren

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

De volgende HTML-tags en -attributen zijn toegestaan: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>