Verschillen in straftoemeting en uiterlijk: een non-peer review

Leugens, verdomde leugens, statistiek en criminologie

Dit is de tweede non-peer review op deze webstek.

Parlementslid Jeroen Recourt

Ik bespreek het artikel Verschillen in straftoemeting in soortgelijke zaken door Wermink, De Keijser en Schuyt, werkzaam aan de afdeling Criminologie,  faculteit Rechtsgeleerdheid Universiteit Leiden. Het werd gepubliceerd in aflevering 2012-11 van het Nederlands Juristenblad (NJB).
Voordat het werd gepubliceerd was NJB-11 gepeerreviewd. Na bestudering van het artikel en van de opzet van de observatielijst, heb ik niet alleen kritische kanttekeningen bij het artikel zelf, maar ook vraagtekens bij hoe de NJB-peers hun taak hebben opgevat. Voelen ze zich wel medeverantwoordelijk voor het bewaken van de goede naam van de wetenschap?

Inleiding

Het artikel rapporteert over onderzoek, gebaseerd op waarnemingen door studenten van de afdeling waar de auteurs aan verbonden zijn. De studenten kregen observatielijsten mee die ze invulden bij in totaal 541 zittingen van de politierechter. Van de verzamelde data zijn uiteindelijk gegevens van 333 daarvan meegegaan in een statistische analyse. De resultaten daarvan zijn samengevat in een tabel 2, waarvan de laatste rij vermeldt: “Pseudo R2 (Nagelkerke): 72,1%”. ‘Nagelkerke’ staat voor een berekende waarde die een indicatie geeft van de mate waarin een verklarend model past (fit) bij gevonden data. Deze maat is erop ontworpen om waarden aan te geven tussen 0 en 1 en wordt dan ook zelden genoteerd als een percentage.

Mediaberichten over dit artikel (NJB-11) vormden aanleiding voor Tweede Kamerleden van PvdA, VVD en GroenLinks om vragen te stellen aan de minister van justitie. De Volkskrant rapporteerde over de vragen van de PvdA-ers:

De partij wil onder meer weten wat de minister eraan gaat doen als het inderdaad zo is dat rechters het uiterlijk van verdachten en de taal die ze spreken meewegen in hun oordeel [i].

In nummer 17 publiceerde het NJB twee kritische reacties: een van de directeur en een onderzoeker van het Wetenschappelijk Onderzoek- en Documentatiecentrum van het ministerie van Veiligheid en Justitie (WODC) (17-W) en een van twee senior rechters (17-R). Het nummer bevatte ook een weerwoord van de auteurs (17-A). De inhoud van deze stukken heb ik meegenomen in deze bespreking.

Wanneer je door het jargon heenkijkt komt NJB-11 over als opiniebijdrage voor een gemiddelde Nederlandse krant. De auteurs schreven echter geen ‘brief aan de krant': met succes zochten ze de publiciteit in hun hoedanigheid als wetenschappers, via een blad dat een status te verliezen heeft. De webstek van de Universiteit Leiden berichtte over de publicatie op een wijze die men van een op sensatie beluste krant zou verwachten. Kop: Verdachten met ‘buitenlands uiterlijk’ krijgen zwaardere straffen [ii]. De aanhalingstekens blijken een heel speciale betekenis te hebben, zo zal verderop nog blijken.

In de rest van dit stuk ga ik eerst in op het taalgebruik dat hier en daar te suggestief is voor een wetenschappelijk artikel. Daarna volgen een zevental paragrafen over de manier waarop de data verworven en -statistisch- verwerkt zijn en over de aard van de studie. Dan wordt kort stilgestaan bij een alternatieve verklaring voor de gepresenteerde bevindingen en volgen enige opmerkingen over de theorie die is aangewezen als ‘onderliggend': de focal concerns (FC) theorie. Er blijken twee theorieën te bestaan met deze naam. De overeenkomsten en verschillen tussen deze beide, werpen een bijzonder licht op het vigerende paradigma van de Leidse criminologie. Aansluitend volgen natuurlijk enige conclusies.

Suggestief taalgebruik

In de lead is sprake van “de odds om achter de tralies te verdwijnen” voor “daders met een buitenlands uiterlijk die ook nog eens de Nederlandse taal niet machtig zijn”. Deze odds zijn “maar liefst twintig keer hoger”. De associatie is onmiddellijk dat hier sprake is van mensen die ergens slachtoffer van zijn, terwijl het hier toch echt uitsluitend om mensen gaat die veroordeeld zijn voor een misdrijf of overtreding: daders dus [iii].

In de inleiding vinden we verder:

In eerder straftoemetingsonderzoek (…) ontbreekt een realistisch beeld van wat zich op de zitting afspeelt.

De suggestie is ontegenzeggelijk dat in het onderhavige onderzoek wél aandacht geweest is voor die werkelijkheid. Bij het bespreken van de observatielijst zal duidelijk worden dat er nogal wat licht zit tussen datgene wat daar is of had kunnen worden waargenomen en hetgeen er gerapporteerd is.

Het blijft niet bij deze impliciete  suggestie. Expliciet wordt gesteld dat “Na de invoering van die instrumenten”, -daarmee doelen de auteurs op de jaren 70 en 80 van de vorige eeuw- “is onderzoek naar verschil in straftoemeting in Nederland, op enkele uitzonderingen na, van de empirische radar verdwenen”. Daarmee negeren ze bijvoorbeeld het Research Memorandum nummer 3 uit 2011 van De Rechtspraak: Recidiverisico en straftoemeting door de Leidse wetenschappers Van Wijngaarden, Moerings en Van Wilsem. Pikant detail: NJB-11-auteur Jan de Keijser zat in de begeleidingscommissie van dit grondige en degelijke onderzoek.

De resultatensectie begint met deze alinea:

Tabel 1 laat zien dat een typische dader die een gevangenisstraf krijgt opgelegd [komma ontbreekt in origineel] in voorlopige hechtenis heeft gezeten, een strafblad heeft, in de leeftijdscategorie 31 tot 40 jaar valt, is veroordeeld voor gekwalificeerde diefstal [iv] en een zitting heeft gehad die in Amsterdam plaatsvond.

Deze bewering is onjuist.

Tabel 1 laat dat niet zien: daarvoor zijn de weergegeven data onvoldoende uitgesplitst. Maar ook in andere zin is deze alinea opmerkelijk. Waarom begint men over een ‘typische dader’ en meer in het bijzonder een typische dader die gevangenisstraf kreeg? Was het onderzoek erop gericht om die in beeld te krijgen dan? Hoe verhoudt zich dit tot de hypothese die men via het onderzoek wilde toetsen? Wat was eigenlijk de hypothese?

Deze is niet heel duidelijk geformuleerd. We vinden wel diverse verwijzingen naar de FC theorie die wordt aangeduid als “een gezaghebbende sociaalwetenschappelijke benadering”. Die theorie veronderstelt volgens de auteurs dat:

…de rechter bij het bepalen van de straf onder andere rekening houdt met de geschatte gevaarlijkheid van de dader, waardoor kenmerken van de persoon van de verdachte ook een rol spelen bij de straftoemeting.

Dit concept ‘geschatte gevaarlijkheid’ komt als zodanig vrijwel niet meer terug in het artikel en een toetsbare hypothese leiden de auteurs er niet uit af, in ieder geval niet rechtstreeks. Het hierboven genoemde Recidiverisico en straftoemeting geeft in het voorwoord een cruciale aanwijzing over hoe in de praktijk wordt omgegaan met dat concept en welke wijze de delictgeschiedenis bij de afwegingen van de rechter meespeelt:

De reden voor deze zwaardere straf lijkt echter niet het recidiverisico te zijn, maar het feit dat eerder opgelegde sancties niet bleken te werken.

De hypothese is min of meer af te leiden door de paragrafen Straftoemeting en De persoon van de verdachte te combineren. ‘Straftoemeting':

De strafsoort die de politierechter oplegt aan de verdachte staat centraal in dit onderzoek. Meer specifiek is onderzocht of een onvoorwaardelijke gevangenisstraf dan wel een andere straf is opgelegd (Wel = onvoorwaardelijke gevangenisstraf; Niet = geldboete, taakstraf, voorwaardelijke gevangenisstraf, schuldigverklaring zonder straf).

De andere paragraaf zoomt in op eigenschappen van de verdachten die in kaart gebracht waren via de vragenlijsten, beter gezegd: op een zeer beperkte selectie daaruit. De formulering “meer specifiek” is tegelijkertijd vaag, cruciaal en onjuist: men heeft eenvoudigweg alle andere straffen dan onvoorwaardelijke gevangenisstraf op een hoop gegooid en uitsluítend de gecreëerde tweedeling onderzocht. Een tweedeling die ook vereist is om het gehanteerde statistische hulpmiddel, logistische regressie analyse, te mogen toepassen [v].

Op impliciete wijze en verspreid over het artikel, laten de auteurs doorschemeren waarom ze de diverse soorten straf in deze twee categorieën hebben (her)verdeeld. Aan het slot van de paragraaf Resultaten vinden we dit:

De groep die echter nog zwaarder wordt gestraft, is de groep… .

Het lijkt erop dat de typische dader was opgevoerd ten behoeve van een meer afgetekend contrast met een andere groep.

Bij eerste lezing valt het niet onmiddellijk op, maar onderstaande passage uit de inleiding versterkt dat vermoeden:

Wanneer de rechter de samenleving wil beschermen tegen recidive zouden zij deze daders mogelijk eerder veroordelen tot een onvoorwaardelijke gevangenisstraf, zodat zij in ieder geval tijdelijk geen delicten in de samenleving kunnen plegen.

Het heeft er veel van weg dat de auteurs van mening zijn dat de intentie om de maatschappij te beschermen tegen misdaden door de dezelfde crimineel door hem op te sluiten, geen juist motief zou zijn voor gevangenisstraf [vi].

Bij een andere zin uit de inleiding ligt die afkeer van gevangenisstraf er nog wat dikker bovenop:

De gevangenisstraf is de zwaarste straf die in Nederland opgelegd kan worden en heeft grote gevolgen, zowel bedoelde als onbedoelde.

De auteurs denken bij die onbedoelde gevolgen niet alleen aan het fenomeen dat een verblijf in de gevangenis het effect kan hebben van een leerschool voor misdaad. Dit blijkt uit het volgende citaat:

(…) zoals een grotere kans om te scheiden en verminderde kansen op de arbeidsmarkt. Deze relaties kunnen vervolgens leiden tot een langdurige criminele carriere.

Het lijkt de moeite waard nog eens onder de loep te nemen hoe men in het onderzoek waar in dit verband naar verwezen wordt, correlatie en causaliteit uit elkaar gehouden heeft, maar hier wil ik de aandacht vestigen op iets anders. De onderzoekers voeren hier zowel de niet bedoelde als de wel bedoelde gevolgen op om hun visie op gevangenisstraf te illustreren. Het tart iedere vorm van logisch denken om daarbij deze totaal verschillende soorten gevolgen op een hoop te gooien.

Het type delict en het type van de variabelen

Het is bovendien de vraag of die tweedeling van zwaar tegenover niet of minder zwaar, wel door iedereen zo ervaren wordt. Met iedereen doel ik hier zowel op de veroordeelden als op de rechters. Die twijfel dringt zich op wanneer we wat aandachtiger kijken naar de meest opvallende van de gepresenteerde bevindingen.

De auteurs besteden er geen aandacht aan maar veel mensen zal in de gepresenteerde data namelijk iets anders opvallen dan de schijnbare samenhang tussen types straf en uiterlijke kenmerken van de daders: de bijzondere, nogal onverwachte relatie tussen type delict en type straf. De onderzoekers hanteren ook in dit verband slechts de tweedeling ‘gevangenisgestraften’ tegenover ‘andersgestraften’. Tabel 1 van het artikel is niet gesorteerd op het percentage gevangenisgestraften [vii]. Wanneer we dat wel doen, ziet de tabel er zo uit (tussen haakjes staat het aantal veroordeelden):

Type delict (aantal veroordelingen)

%gevangenis

gekwalificeerde diefstal (18)

72,2

diefstal (70)

42,9

overig vermogensdelict (23)

34,8

bedreiging (15)

26,7

opium (23)

21,7

zwaar geweldsdelict (19)

21,1

licht geweldsdelict (49)

12,2

overige delicten (148)

7,4

Zelfs gewone, niet-gekwalificeerde, diefstal werd dus beduidend vaker met verblijf in de gevangenis bestraft dan lichte geweldsdelicten en zelfs vaker dan zware.

Bedreiging correspondeert met een hoger percentage gevangenisgestraften dan geweld! Opmerkelijk.

Al te scherpe conclusies mogen op basis van deze data niet getrokken worden -de lage score voor zware geweldsdelicten heeft bijvoorbeeld ook te maken met het feit dat de zwaarste delicten uit die categorie niet voor de politierechter komen- maar het is duidelijk dat de bewering over ‘de zwaarste straf’ niet zo voor de hand ligt als de auteurs suggereren. Blijkbaar spelen (ook) heel andere factoren een rol bij de keuze van de rechters voor de ene of de andere soort straf. Een van die verklaringen werd door de auteurs zelf geopperd maar lijkt verder niet bestudeerd; ik kom daarop terug. Een andere mogelijke verklaring zou kunnen samenhangen met een ander hiaat: in het artikel wordt nergens de lengte van de opgelegde gevangenisstraf of de hoogte van de geldboete en dergelijke  vermeld. De observatielijst kende voor de vastlegging van dit soort gegevens slechts de vraag 7:7 “Welke straf legt de rechter op (voorwaardelijk/onvoorwaardelijk)? (schrijf letterlijk mee)”. Die vraag deugde niet.

Per saldo is zo voorwaardelijke gevangenisstraf, hoe lang ook, als lichtere straf beschouwd dan onvoorwaardelijke, hoe kort ook. (Zie ook voetnoot 3).

17-W benoemt dit hiaat op iets andere wijze: “..onderzoekers controleren bijvoorbeeld niet voldoende voor de ernst van de zaak …” Daarop reageren de auteurs in 17-A met: “..de auteurs van het WODC doen geen suggestie voor een betere wijze om de ernst van de zaak te bepalen” en ze wijzen erop dat het gehanteerde onderscheid naar type delict op basis van de daaraan gekoppelde maximale gevangenisstraf op zich ook een maat vormt voor ernst van het delict. Dat maximum komt echter op geen enkele manier aan de orde in NJB-11.

Deze manier van omgaan met de data, en meer in het bijzonder met het ‘downgraden’ van het type data, past in een patroon. Met betrekking tot de delictgeschiedenis wijst 17-W erop dat hier een dichotome score is gemaakt van het wel of niet hebben van een strafblad. Dit staat tegenover de mogelijkheid een ordinale of zelfs een ratio schaal te hanteren, gebaseerd op bijvoorbeeld aantal delicten, aantal veroordelingen of totale gevangenisstraf. Het dichotomiseren van de afhankelijke variabele, de toegemeten straf, werd hierboven al genoemd. Zelfs van de leeftijd is een soort nominale schaal gemaakt: in plaats van de leeftijd te noteren is vastgelegd of de veroordeelden tussen 18-30 jaar, 31-40, 41-50 of ouder waren.

De ondoorzichtigheid der odds ratio’s

De bevindingen zijn in wezen gegoten in de vorm van odds ratio’s [viii]. Odds ratio’s zijn eigenlijk verhoudingen, ratio’s, van verhoudingen tussen het aantal keren voorkomen van verschillende uitkomsten: odds [ix]. Deze manier van resultaten presenteren schreeuwt er als het ware om, om verkeerd begrepen of geïnterpreteerd te worden [x].

17-W wees er, net als het NRC-stuk uit de voetnoot, op dat aan die schreeuw gehoor was gegeven: in de media en het kielzog daarvan in de Tweede Kamer werd een en ander inderdaad verkeerd begrepen. In 17-A geeft men toe dat “.. de omvang van de door ons geconstateerde effecten dus overdreven [wordt] voorgesteld”. Ze verschuilen zich vervolgens achter de logistische regressie analyse die nu eenmaal odds en geen kansen uitspuugt. Dat type analyse stond voor hen blijkbaar niet ter discussie. In de paragraaf over de kwaliteit van de statistische verwerking zet ik hier wel vraagtekens bij.

De wikipedia pagina vat de problematiek rond de odds-ratio’s als volgt samen:

This may reflect the simple process of uncomprehending authors choosing the most impressive-looking and publishable figure. But its use may in some cases be deliberately deceptive.

Die laatste waarschuwing ontlenen de wiki-auteurs o.a. aan Huw Talfryn Oakley Davies en Iain Kinloch Crombie die opmerken:

If the odds ratio is interpreted as a relative risk it will always overstate any effect size: the odds ratio is smaller than the relative risk for odds ratio’s of less than one, and bigger than the relative risk for odds ratio’s of greater than one.

Even belangrijk is de alinea even verderop:

Odds ratio’s are a common measure of the size of an effect and may be reported in case-control studies, cohort studies, or clinical trials. Increasingly, they are also used to report the findings from systematic reviews and meta-analyses.

Zeker in die tweede context, waarin men geen voorspellingen of experimenten doet, is het -wanneer het gaat om meer dan twee mogelijke waarden van een onafhankelijke variabele- van belang welke odds je als basis neemt om andere odds mee te vergelijken.

Men heeft de veroordeelden verdeeld over drie groepen: mensen die een ‘Nederlands uiterlijk’ hebben en Nederlands spreken, mensen met een ‘buitenlands uiterlijk’ die Nederlands spreken en de groep die er ‘buitenlands uitziet’ en geen Nederlands spreekt. De eerste groep heeft men hier als de referentiegroep aangewezen: een begrijpelijke keuze.

Voor de variabele ‘type delict’ is de keuze van de referentiewaarde echter niet zo voor de hand liggend. Blijkens tabel 2 is ervoor gekozen om (eenvoudige) diefstal als referentietype te hanteren. Een motivatie voor deze keuze staat niet in het artikel. De ‘typische dader’ die gevangenisstraf kreeg, was schuldig aan ‘gekwalificeerde diefstal’. Rechtszaken in verband met ‘overige delicten’ kwamen het meeste voor. Dat waren dus zeker ook kandidaten om als referentiewaarde te kiezen.

Het grootste verschil in de Exp(B)-waarden, de odds ratio’s zeg maar, voor deze variabele ‘type delict’ is met deze keuze die tussen ‘diefstal’ en ‘gekwalificeerde diefstal': die factor is ruim 16, en daarmee bijna even hoog als die tussen Nederlands sprekende en Nederlands uitziende veroordeelden in vergelijking met niet Nederlands sprekenden die er ook niet Nederlands uitzagen (ruim 20). Wanneer men echter ‘overige delicten’ of ‘licht geweldsdelict’ als referentiewaarde had gehanteerd dan had de waarde voor ‘gekwalificeerde diefstal’ beduidend hoger gelegen dan de 20 die voor krantenkoppen en kamervragen zorgde [xi].

De aard van de studie

Deze keuze en vooral het niet toelichten daarvan, wakkerde mijn wantrouwen aan en spoorde me aan om te proberen de aard van deze studie te doorgronden en meer in het bijzonder om te kijken naar de manier waarop de statistiek hier is ingezet.

Wie door het verhullende taalgebruik heenkijkt en zelf verhullend taalgebruik vermijdt, kan niet anders concluderen dan dat in het onderhavige onderzoek niet geprobeerd is om iets te doorgronden: er wordt een poging ondernomen om aan te tonen dat politierechters ‘discrimineren tegen buitenlanders’. De senior rechters van 17-R sluiten hun aanhef niet voor niets af met: “Dat was even schrikken. Discrimineren wij?” [xii].

De conclusies beginnen als volgt:

De hoofdbevindingen van het onderzoek lieten zien dat daders met een Nederlands uiterlijk die ook de Nederlandse taal spraken tijdens de zitting de minste kans hadden op een (sic) gevangenisstraf.

Op de volgende bladzijde maar nog in dezelfde paragraaf treffen we dit:

Dat mannen en daders met een buitenlands uiterlijk die niet de Nederlandse taal spreken tijdens de strafzitting een substantieel verhoogde kans hebben op een onvoorwaardelijke gevangenisstraf zou op gespannen voet kunnen staan met het doel van consistentie in straftoemeting in Nederland.

De tweede passage is correcter -daar wordt namelijk het verschil tussen mannen en vrouwen ook genoemd- maar de strekking daarvan heeft het niet gehaald in de publiciteit.

Er zit een bijzonder soort symmetrie in de gegevens met betrekking tot vrouwen in vergelijking met de personen met ‘buitenlands uiterlijk’. De groepen ‘vrouwen’ en ‘niet Nederlands sprekenden met buitenlands uiterlijk’ zijn in aantal zelfs exact gelijk -45 van de 365- maar dat toeval vestigt alleen op een grappige manier de aandacht op de bedoelde symmetrie. Grofweg zijn onder de veroordeelden de vrouwen met een factor 7 ondervertegenwoordigd en de mensen ‘met buitenlands uiterlijk’ met ongeveer dezelfde factor oververtegenwoordigd ten opzichte van de ‘autochtone mannen’. Wanneer de odds voor onvoorwaardelijke gevangenisstraf voor deze beide groepen vergeleken wordt met ‘autochtone mannen’ is er bij beiden ongeveer een factor 5 verschil: wederom spiegelbeeldig.

De opmerking van de auteurs dat de gevonden verschillen “op gespannen voet kunnen staan met het doel van consistentie in straftoemeting” gaat er volledig aan voorbij dat de complete populaties waartoe die drie groepen toe behoren zich ook niet consistent gedragen voor wat betreft criminaliteit. De groepen ‘mannen’, ‘vrouwen’, en ‘buitenlanders’ die veroordeeld werden, vormden geen random steekproeven uit die drie populaties: ze werden verdacht en zijn veroordeeld en de groepen zijn verschillend van grootte en alleen daardoor al verschillend van aard. Er bestaan verschillen tussen de complete groepen die tot uitdrukking komen in de onder- en oververtegenwoordiging van verdachten en veroordeelden. Wanneer diezelfde of ermee samenhangende verschillen ook leiden tot een andere straftoemeting kun je die niet, louter op basis van de aantallen, als inconsistent bestempelen [xiii].

De auteurs opperen zelf de mogelijkheid dat mensen: “…als gevaarlijker ingeschat kunnen worden dan daders met een buitenlands uiterlijk die Nederlands spreken, bijvoorbeeld door een verwachte mindere binding met de samenleving.” Wat is daar mis aan? Beseffen ze werkelijk niet dat criminaliteit een uitdrukking vormt van mindere binding met de samenleving?

Een -niet volledig- hypothetisch voorbeeld helpt om de onjuistheid van de manier waarop hier het concept ‘consistentie in straftoemeting’ wordt gehanteerd, goed door te laten dringen. Veronderstel dat nog twee andere subgroepen onderscheiden waren onder de verdachten: nonnen van boven de 65 jaar en uit het buitenland ingevlogen huurmoordenaars [xiv]. De leden van de ene groep pleegt vrijwel nooit misdaden van enige betekenis en de andere doet vrijwel niets anders. Zou het ook maar enigszins verontrustend of inconsistent zijn indien de ene veroordeelde non een voorwaardelijke straf kreeg en alle huurmoordenaars gevangenisstraf?

Wat zich daadwerkelijk afspeelde op de zittingen en de kwaliteit van de verzamelde data

Niettegenstaande hun beweringen over “realistisch beeld van rechtszittingen” baseren de auteurs zich, afgezien van een enkel detail, louter op aantallen, op numerieke waarden, die ook zonder directe observaties hadden kunnen worden vastgesteld. Evengoed reppen ze zowel in de inleiding als aan het slot van het artikel van de speciale bijdrage die ze hebben geleverd door zich te verdiepen in “wat zich afspeelt op de zitting”. Dit is daarmee een van de beschamendste aspecten van NJB-11.

In de observatielijst zijn negen vragen opgenomen onder het kopje ‘persoonskenmerken verdachte’, elf onder ‘motivering rechter’ en 32 onder ‘houding verdachte’. Van die 32 zijn er slechts twee die terugkomen in het artikel. Goed beschouwd komen er in het artikel slechts twee items voor die direct verband houden met de aanwezigheid van observanten ter zitting: het uiterlijk van de veroordeelden -zie de paragraaf hierna- en het betuigen van spijt. Die laatste blijkt nu juist het aspect te zijn dat geen invloed heeft op het wel of niet krijgen van straf in de categorie onvoorwaardelijke gevangenisstraf. En dat niet alleen: terwijl 15 tot 20 vragen uit de observatielijst direct of indirect betrekking hadden op dit aspect van spijt, meldt voetnoot 29 over dit item: “Observanten hebben op basis van eigen interpretatie aangegeven in hoeverre de verdachte spijt betuigd heeft.” Oeps.

Er zijn 541 zittingen bijgewoond. In de paragraaf Gegevens worden 4 groepen zittingen genoemd die om uiteenlopende redenen zijn weggelaten uit de analyse. Deze groepen omvatten respectievelijk 90, 7, 3 en 76 zaken.

De grootste van deze groepen omvat verschillende subgroepen. Er lijkt inderdaad veel voor te zeggen om aangehouden zaken buiten beschouwing te laten maar waarom zaken waarin de verdachte werd vrijgesproken geen betekenis hebben voor de onderzoeksvraag wordt niet toegelicht, terwijl het beslist niet voor de hand ligt.

De groep van 76 betreft de zittingen waarop de veroordeelde niet verscheen. Het eenvoudigweg weglaten van deze groep uit de studie komt over als een gemiste kans: het gaat hier immers om de groep waarbij er in het geheel geen interactie is geweest tussen verdachte en rechter, bij uitstek interessant als referentiegroep voor het beoordelen van (het effect van) die interactie. Het weglaten is gemotiveerd met de vaststelling dat in die zaken geen sprake was van wel of niet spijt betuigen. Een vreemde motivatie tegen de achtergrond van de geconstateerde niet-significante correlatie daarvan met de onderzochte afhankelijke variabele. Waarom zijn na deze vaststelling deze 76 niet alsnog toegevoegd?

De 365 zaken die nu overbleven heten overigens 68% van 541 te zijn terwijl normale afronding hier toch echt 67% zou opleveren.

Het genoemde aantal van 365 zaken komt ook voor in tabel 1. De logistische regressie analyse is blijkens het onderschrift van tabel 2 dan weer gebaseerd op 333 van deze veroordelingen. Waarom die 32 zijn afgevallen is niet apart toegelicht. Uit tabel 1 kan wel worden opgemaakt dat op verschillende variabelen in respectievelijk 4, 13, 2, 16 en 6 gevallen de waarden niet gescoord zijn, samen dus 41. Er waren blijkbaar veroordeelden van wie meer dan één variabele niet genoteerd was. Die 13 omvatten de in voetnoot 25 genoemde 10 veroordeelden waarvan de observanten niet hadden kunnen bepalen, of vergeten waren in te vullen, of deze een Nederlands of buitenlands uiterlijk had, naast 3 van wie men zelfs niet heeft kunnen vaststellen of ze Nederlands spraken of niet. Voetnoot 26 vermeldt dan nog “Van de overige verdachten die niet Nederlands spreken [van de 43 die geen beroep deden op het zwijgrecht], is niet bekend of er een tolk aanwezig was of welke taal ze dan wel spraken”.

17-W wijst op het grote belang van ‘ongemeten factoren’ zoals het wel of niet hebben van een vaste woon- of verblijfplaats, het wel of niet hebben van (vast) werk en een gezin. De observatielijsten bevatten hierover wel vragen. In 17-A wordt toegegeven dat de opmerking “hout snijdt”, maar in plaats van in te gaan op het mislopen van de dataverzameling dienaangaande, laat men dit volgen door uiteenlopende maren. Met betrekking tot werk wordt melding gemaakt van een “separate analyse”. Voor 40 veroordeelden waren hier geen gegevens over. Er staat ook netjes in dat die betreffende 40 buiten deze separate analyse gebleven zijn. Het vreemde is dat de auteurs vermelden dat er zodoende nog 298 daders overbleven. In de gerapporteerde analyse ging het over 333 daders. 333 – 40 is echter geen 298.

Buitenlands uiterlijk versus allochtoon

Voor de manier waarop is omgegaan met het item dat wel het artikel haalde, is “oeps” echt te zwak uitgedrukt. Het gaat hier om een onacceptabele verdraaiing.

Het hele artikel en alle publiciteit die ermee is gegenereerd, beginnend met de webstek van de eigen universiteit en culminerend in vragen aan de minister, staat bol van verwijzingen naar het ‘buitenlandse uiterlijk’ van de veroordeelden, al gebruikte men op die webstek dan ook aanhalingstekens. De observatielijst bevatte echter, in ieder geval in de versie die door een van de auteurs aan mij is toegestuurd, helemaal geen vragen over het uiterlijk.

Wel werd in vraag 5 naar het geboorteland van de veroordeelde gevraagd en luidde vraag 6 als volgt:

Afkomst:

  • Autochtoon
  • Allochtoon, namelijk: Europees / Niet-Europees / onbekend
  • Weet niet

Op zijn minst zijn de observerende studenten hier met veel onduidelijkheid opgezadeld. Iemand kan lelieblank zijn en vier in Nederland geboren grootouders hebben maar formeel toch allochtoon zijn omdat vader of moeder geboren werd toen de grootouders in het buitenland vertoefden. Omgekeerd heten ook mensen autochtoon van wie alle vier de grootouders in het buitenland geboren zijn maar beide ouders hier, hoe fanatiek de veroordeelden ook afwijzend staan tegenover de samenleving waarin ze zich crimineel gedragen. Het is de vraag hoe studenten zijn omgegaan met perfect geïntegreerde mensen van wie een van de ouders Nederlander was en de ander een al even perfect geïntegreerde immigrant uit Vietnam of Chili of met mensen van wie de overgrootouders al hier woonden maar die nog steeds een heel donkere huidskleur hebben en met een accent spreken.

Willens en wetens hebben de auteurs dit manco niet genoemd in het artikel. Sterker nog, in de Conclusie en discussie treffen we dit aan:

Bij vervolgonderzoek zou daarom ook onderscheid gemaakt kunnen worden naar welke taal de verdachte spreekt tijdens de rechtszitting. Dit laatste geldt overigens ook voor het uiterlijk van de dader. Voor vervolgonderzoek zou het aan te bevelen zijn om meer onderscheid te maken tussen verschillende etniciteiten en tevens gebruik te maken van kenmerken zoals het geboorteland van de dader en het geboorteland van de ouders van de dader.

Mislukte dataverzameling

Hoezo in vervolgonderzoek? Welke taal de verdachte sprak was al een vraag in de observatielijst en wat men hier schrijft over het geboorteland is een indirecte omschrijving van de tweedeling allochtoon-autochtoon; zowel ‘geboorteland’ als ‘autochtoon/allochtoon’ kwamen ook al voor in de observatielijst. Datgene wat men reeds gericht probeerde boven tafel te krijgen, wordt hier nu opgevoerd als aanbeveling voor vervolgonderzoek.

Het is nogal kras dat men op deze plaats vervolgens wel begint over etniciteit en zinsbegoochelend dat niet gerept wordt van bijvoorbeeld de religie van de veroordeelden of welke factor dan ook die mogelijk iets zou zeggen over de ‘afstand’ van de verdachten tot het niet-criminele deel van de Nederlandse samenleving.

Voor toekomstig onderzoek is het tevens belangrijk om invloeden van rechterkenmerken op straftoemeting te onderzoeken.

Ook hiervoor geldt: de observatielijst telde al drie vragen over demografische kenmerken van de rechter. Deze vragen stonden onder het kopje ‘motivering rechter’. Wat onder die noemer aan informatie verzameld is over “wat zich afspeelde tijdens de zitting”, komt op geen enkele wijze terug in het artikel.

In 17-R klinkt cynisme door in de opmerking. Weten jullie wel hoe een rechter tot een keuze van strafsoort komt vragen ze.

..het lijkt erop dat op de door de studenten ingevulde vragenlijsten de vraag ontbrak of de verdachte een bekend adres in Nederland had.

Omdat het bij mensen zonder adres vaak gaat om mensen met weinig of geen inkomen zijn andere straffen dan gevangenisstraf voor hen zo ongeveer uitgesloten.

Die vraag ontbrak echter niet, in de lijst was dit vraag 3.8. De onderzoekers vermelden dit echter niet in 17-A maar verlaten de wetenschappelijke arena. Ze voeren “.. jarenlange praktijkervaring die een van ons opdeed als rechter plaatsvervanger” op. En dan komt het:

Bovendien menen wij dat rechters ook zelf niet exact weten hoe ze tot een bepaalde straf komen. Binnen de zeer ruime discretionaire bevoegdheid die de rechter (vooralsnog)  kunnen tal van juridische maar ook psychologische factoren een rol spelen waarvan de beslisser zich niet bewust is.

Het is al met al moeilijk de indruk kwijt te raken dat de dataverzameling middels “gestructureerde en gestandaardiseerde observatielijsten” een volslagen fiasco is geweest. Dat is op zich jammer, maar het is onacceptabel dat dit feit onder de mat wordt geveegd.

De kwaliteit van de statistische verwerking: correlatie en causaliteit

Hierboven uitte ik al mijn bedenkingen bij het gebruik van logistische regressie omdat van de onafhankelijke variabele, de opgelegde straf, op gekunstelde wijze een dichotomie is gemaakt. Dit is vooral bedenkelijk vanwege de combinatie met de vaststelling met betrekking tot de aard van de studie.

Waarom is hier überhaupt regressieanalyse toegepast?

Kort geformuleerd gaat het bij regressie (analyse) om het schatten van de parameters van een model. Het gaat met andere woorden niet om het toetsen van een hypothese over een verband tussen twee variabelen, wat hier goed beschouwd aan de orde was. Er zijn verschillende redenen om een model te willen bouwen. Of je zoekt naar een ‘formule’ die een zo nauwkeurig mogelijke voorspelling kan opleveren voor een bepaald resultaat -in de medische context bijvoorbeeld wel of niet overleven- of je pleegt een verkenning, probeert te doorgronden wat er werkelijk gebeurt, je zoekt naar de factoren die in combinatie leiden tot een bepaalde waarde van de afhankelijke variabele. Daarbij zoek je een zo volledig mogelijk verklaring van de uitkomst op basis van de oorzakelijke factoren: niet alleen naar correlatie maar ook naar causaliteit dus. Daarom is het ook gebruikelijk om bij deze analyses te beginnen met een groot aantal mogelijke verklarende factoren om vervolgens via ‘achterwaartse eliminatie’ factoren te schrappen om zo tot een beter model te komen.

Niets wijst erop dat de auteurs op deze wijze bezig zijn geweest met het zoeken naar een model. En ernstiger nog: de obligate vermelding van de Nagelkerke score en de weinig verhelderende opmerkingen in noot 27 en 31 kunnen niet de indruk wegnemen dat er weinig werk is gemaakt van het checken van de goodness-of-fit van het model.

Het woord ‘model’ komt in het artikel alleen voor in die twee voetnoten. In nummer 31 wordt terloops verwezen naar de hoogste waarde in de resultatentabel: de odds voor gevangenisstraf voor mensen die in voorlopige hechtenis hebben gezeten. Deze zijn maar liefst 65 keer zo hoog als voor mensen die die ervaring misten. De auteurs merken daarover op:

De resultaten van tabel 2 veranderen niet van richting en (sic) significantie wanneer voorlopige hechtenis niet wordt opgenomen in het model.

Het verrassende, verontrustende zelfs, is dat de auteurs hierover geen verbazing tonen: noch over die opvallend hoge waarde noch over het geringe effect van weglaten uit of opnemen in het model van deze variabele. Men doet geen poging dit te verklaren in termen die verwijzen naar de werkelijkheid van straftoemeting.

De auteurs laden hierdoor de verdenking op zich niet echt nieuwsgierig te zijn, en ja: dat is de ernstigste verdenking die over wetenschappers kan worden uitgesproken.

Vanwege het tijdsverloop -de straftoemeting komt immers na het scoren van alle gegevens- is er geen gevaar voor het omdraaien van de richting van een causaal verband. Het gevaar van andere vormen van verwarring van correlatie met causaliteit is echter volop aanwezig. Daarbij moet allereerst gedacht worden aan de mogelijkheid dat factoren een rol spelen die een (causaal) verband hebben zowel met een of meer van de ‘onafhankelijke’ variabelen als met de afhankelijke variabele.

Voor deze rol kunnen interessante kandidaten aangetroffen worden in de observatielijst. Bijvoorbeeld: “Heeft de verdachte een vaste dagbesteding”, “Komt tijdens de zitting ter sprake met wie de verdachte woont?”, naast tal van vragen uit onderdeel 4, Houding verdachte.

Wie oververtegenwoordiging van bepaalde groepen in de criminaliteit onder de loep neemt, doet er goed aan rekening te houden met de mogelijkheid dat niet het meest in het oog springende verschil, de huidskleur bijvoorbeeld, de verklarende factor is maar bijvoorbeeld de sociaaleconomische positie, de (sociaal emotionele) intelligentie, de opvoedingscultuur of het relatief vaak voorkomen van bepaalde psychische aandoeningen binnen de betreffende groep.

Het ontbreken hiervan in deze studie valt des te meer op omdat daar in het algemeen in de maatschappelijke discussie en in de sociale wetenschap juist vrij veel aandacht voor is. In voetnoot 13 verwijzen de auteurs zelf naar het artikel An integration of theories to explain judicial discretion van mevrouw Albonetti [xv]. Zelfs in de samenvatting van dat stuk wordt al verwezen naar drie andere artikelen die “… found a direct effect of socio-economic status on sentence severity” en naar weer andere artikelen die dat tegenspreken.

Andere verklaring voor de gevonden resultaten

Van een heel andere orde is het problematische aspect van de alternatieve verklaring voor het gevonden resultaat met betrekking tot de veroordeelden die geen Nederlands spreken. Het opvallende hieraan is dat het door de auteurs zelf nadrukkelijk naar voren wordt gebracht zowel in het stuk over theorie als in het concluderende gedeelte. In de eerste van die twee zijn ze daarover het duidelijkst:

Bij het bepalen van een straf bij daders die de Nederlandse taal niet beheersen, kunnen daarnaast praktische bezwaren een rol spelen. Indien verdachten de Nederlandse taal niet beheersen, zal een rechter wellicht geen taakstraf willen opleggen vanwege de problemen die bij de tenuitvoerlegging daarvan kunnen ontstaan door het niet beheersen van het Nederlands. Bij de tenuitvoerlegging van taakstraffen is namelijk niet voorzien in tolken. Bij het grotendeels wegvallen van deze strafoptie zou de rechter eerder geneigd kunnen zijn om een gevangenisstraf op te leggen.

Een verstandige, nuchtere kanttekening. Duidelijkheid wilden de onderzoekers hierover wellicht krijgen door middel van de vragen in de observatielijst onder het kopje Motivering rechter. In het stukje conclusie en discussie lezen we echter:

Indien de taakstraf die anders opgelegd zou worden, relatief gezien kort is, zou het echter ook mogelijk zijn om in een dergelijk geval eerder een geldboete op te leggen. Het is dus onduidelijk hoe dit de kans op een onvoorwaardelijke gevangenisstraf precies beïnvloedt.

Er is ten opzichte van de inleiding hier alleen een extra overweging toegevoegd, niets van een onderzoeksresultaat. Het wordt eentonig. Opnieuw rijst de vraag: wat ging er mis met de dataverzameling en waarom vinden we over die mislukking vrijwel niets terug in het artikel?

Waarom is over die praktische overwegingen niet met rechters gesproken of gebruik gemaakt van de motivatie in de vonnissen?

Twee focal concerns theorieën

Een oppervlakkige oriëntatie op de Focal Concerns theorie verschaft al een leerzaam resultaat. De indirecte verwijzingen in de voetnoten gaan naar de moderne varianten. Zoals de eerder genoemde van Albonetti. Een blik op de titels van de publicaties van haar hand leidt tot een vermoeden over haar insteek: Mothering from the Inside: Parenting in a Womans (sic) Prison, The Symbolic Punishment of White-Collar Offenders, A Utopian Prison: Contradiction in Terms?, Pretrial detention and guilty pleas: if they cannot afford bail they must be guilty.

Bladeren door wat artikelen waarin deze theorie een belangrijke plaats inneemt, geeft een verontrustend beeld van het wereldbeeld van deze onderzoekers. Enkele regels uit het artikel Attributions and Institutional Processing: How Focal Concerns Guide Decision-Making in the Juvenile Court van Alexes Harris ter illustratie. Het onderwerp is het hanteren van volwassenenrecht voor criminele jeugdigen. Onder het kopje Re-Criminalization and Juvenile Justice tref je dit:

That is, centered in discourse and actions that prioritize community safety and punishment of dangerous offenders, a portion of juvenile justice work now focuses on the identification and management of such youth rather than treatment and rehabilitation. (…) The legislation assumes that ‘‘violent’’youth are no longer amenable to rehabilitation and are the target of transfers.

Let op de aanhalingstekens om ‘gewelddadig’. Verderop lezen we in de paragraaf Focal Concerns and Causal Attributions:

The author [Harris doelt op Albonetti] suggests that those individuals perceived as having a stable and consistent predisposition for criminal activity—labeled as dangerous—will receive more severe sentences than those not viewed as such.

In de citaten van Harris klinkt onmiskenbaar de verontwaardiging door over de prioriteit bij de veiligheid van (potentiële) slachtoffers van misdaad: het zijn blijkbaar alleen de jonge misdadigers die onderwerp behoren te zijn van behandeling en rehabilitatie.

Het is duidelijk: deze FC theorie heeft betrekking op wat Wermink cs aanduiden als geschatte gevaarlijkheid. Centraal aandachtspunt lijkt te zijn dat daders bij de bepaling van de strafmaat er de dupe van zijn dat ze -door de rechters- geacht worden te behoren tot een groep die een hoger percentage criminelen kent: ze worden geassocieerd, en onheus, met het gedrag van anderen.

Het centrale punt van de oorspronkelijke FC theorie van Walter B. Miller was heel anders. De strekking daarvan was eigenlijk dat opvallend hoge delinquentie binnen bepaalde groepen juist niet opgevat moest worden als gedragsuitingen van individuen maar als uitdrukking van een andere (sub)cultuur.

In Millers verhaal Lower-class Culture as a Generating Milieu of Gang Delinquency (link naar pdf-bestand) lezen we in de eerste voetnoot reeds dit:

The complex issues involved in deriving a definition of “delinquency” cannot be discussed here. The term “delinquent” is used in this paper to characterize behavior or acts committed by individuals within specified age limits which if known to official authorities could result in legal action. The concept of a “delinquent” individual has little or no utility in the approach used here; rather, specified types of acts which may be committed rarely or frequently by few or many individuals are characterized as “delinquent.”

Let ook hier vooral op de aanhalingstekens. Het is alsof je iets van een Franse filosoof leest.

De beide FC theorieën vormen in zekere zin elkaars spiegelbeeld. In de nieuwe theorie is de insteek dat de individuele daders ten onrechte beschouwd worden als representant van een meer criminele subgroep. In de oude theorie was de insteek dat de individuele daders te weinig worden beschouwd als product van een subcultuur die gedrag bevordert dat door ‘de burgermaatschappij’ alleen maar wordt opgevat als crimineel.

De insteek van beide theorieën kent echter tegelijkertijd een grote overeenkomst: besteed niet teveel aandacht aan individuele verantwoordelijkheid van daders, beschouw daders als slachtoffers.

Conclusie

Ik ben blij dat Wermink cs met hun artikel zo via een omweg de aandacht vestigen op het feit dat eind jaren vijftig van de vorige eeuw al gewerkt werd op basis van dit paradigma; in de VS nog wel.

We mogen hen daar eigenlijk wel dankbaar voor zijn.

Mijn pleidooi voor nonpeer reviewing zie ik intussen pijnlijk ondersteund: niet alleen de peer-reviewers van het NJB maar ook de kritiek in 17-W, vanuit het WODC bleek te mild.

Tenzij we ervan uit moeten gaan dat ze erg tongue-in-cheek formuleerden. In het begin van hun stuk “..pleiten [ze] voor een grondige en degelijke replicatie van het onderzoek.” En aan het einde van het stuk herhalen ze dit nog eens in iets andere vorm. Misschien geldt hetzelfde voor de oproep van de rechters: “…laat de uitkomsten niet alleen lezen aan externe reviewers maar ook aan rechters”.

De subtitel van NJB-11 luidde: Een kwantitatief onderzoek naar de rol van specifieke kenmerken van de dader. Daar zit een goede kant aan: in tegenstelling tot de suggestie in het artikel zelf, dat in dit onderzoek op nuttige wijze gebruik zou zijn gemaakt van informatie over wat zich ‘kwalitatief’ op de zittingen afspeelde, zit erin besloten dat het gewoon om wat cijfers ging. Een zorgvuldiger subtitel had veel ellende kunnen voorkomen. Bijvoorbeeld: Een kwantitatief onderzoek naar het verband tussen drie daderkenmerken met het wel of niet opleggen van straf in de vorm van detentie, waarbij ‘drie’ verwees naar onderscheid man-vrouw, wel of niet er buitenlands uitzien/ buitenlands spreken en wel of niet spijt betuigen.

Een persbericht van het Landelijk Overleg Minderheden sprak openlijk over discriminatie door de rechters.

In de publiciteit en in de politiek heeft het verschil in percentage gevangenisgestraften tussen mannen en vrouwen, dat volgens het onderzoek even groot bleek als dat tussen ‘allochtonen’ en ‘autochtonen’, geen aandacht gekregen. Dat valt als zodanig de onderzoekers niet aan te rekenen. Anderzijds is het nogal vreemd dat helemaal niet gewezen is op die symmetrie. De kans op misinterpretatie, zoals die op nogal pijnlijke wijze tot uitdrukking kwam in de vragen [xvi] van de Tweede Kamerleden Recourt (PvdA), Van der Steur (VVD) en Dibi (GL), was echter vast wel kleiner geweest met die alternatieve, minder pretentieuze, subtitel.

Literatuur

Harris, A, 2009. “Attributions and Institutional Processing: How Focal Concerns Guide Decision-Making in the Juvenile Court” Race soc probl 2009 December. (URL van het artikel in pdf-formaat: https://faculty.washington.edu/yharris/Attributions.pdf)

Lambrecht, P, Verslype, P, 2009. Universiteit Gent. “Het adequate gebruik van Multivariabele Logistische Regressie Analyse in de Intensieve Zorg literatuur anno 2006″. Scriptie in het kader van de opleiding tot arts. (URL van het stuk in pdf-formaat: http://lib.ugent.be/fulltxt/RUG01/001/391/866/RUG01-001391866_2010_0001_AC.pdf)

Wermink, H, De Keijser, J, Schuyt, P, 2012. “Verschillen in straftoemeting in soortgelijke zaken” Nederlands Juristenblad (NJB) 2012-11:726-733.

“Verschillen in straftoemeting in soortgelijke zaken” Nederlands Juristenblad (NJB) 2012-17:1188-1192. Reacties prof.dr.F.L.De Leeuw en dr.G.M.Weyters, WODC, rechters mr.M.M.Van der Naf en mr.J.J.Bade en weerwoord Wermink, De Keijser en Schuyt.

Wermink, H., Blokland, A., Nieuwbeerta, P., Tollenaar, N. 2009. “Recidive na werkstraffen en gevangenisstraffen”. Tijdschrift voor Criminologie 51:211-227.

Noten


[i] Mijn nadruk. Alle nadruk in citaten is steeds van mij. FG.

[ii] Opvallend is ook dat het stukje spreekt van ‘de Leidse criminologen’, kennelijk op basis van hun aanstelling. Wermink is socioloog, De Keijser politicoloog en Schuyt studeerde Nederlands recht en Nederlandse Taal- en Letterkunde.

[iii] In het stuk wordt geen onderscheid gemaakt tussen misdrijven en overtredingen.

[iv] Bij gekwalificeerde diefstal, omschreven in artikel 311 Wetboek van Strafrecht is sprake van verzwarende omstandigheden.  Die zijn van heel uiteenlopende aard: ‘s nachts, met meerdere personen, na inbraak, met terroristisch oggmerk en nog enkele.

[v] Voor een afhankelijke variabele met meer dan twee mogelijke uitkomsten had men kunnen kiezen voor multinomiale logistische regressie. Men had zelfs een ordinale logistische regressie kunnen overwegen.

[vi] Deze merkwaardige opvatting sluit overigens aan bij die van Nieuwbeerta cs van het eerste artikel dat hier gepeerreviewd werd. Zie met name de passage onder ‘Wantrouwige vlieg”.

[vii]  Het is onduidelijk of deze gegevens hier überhaupt gesorteerd zijn.

[viii] In het kader van logistische regressie analyse verlopen de berekeningen via de natuurlijke logaritme ervan, maar bij de presentatie zijn de gevonden waarden via de e-macht weer geïnverteerd en de bevindingen worden ook als verhoudingen van verhoudingen beschreven.

[ix] Rekenvoorbeeld van wikipedia : Nemen we aan dat we onderzoek doen naar de relatie tussen geslacht en hoofdpijn. We vragen aan 100 mannen en aan 100 vrouwen of ze de afgelopen maand hoofdpijn hebben gehad. Van de 100 vrouwen hebben er 90 hoofdpijn gehad, van de 100 mannen waren dit er 20. De odds ratio is dan (90/10)/(20/80) = 36. De OR is (veel) hoger dan 1. Dit geeft aan, dat vrouwen, in dit voorbeeld, een hoger risico hebben op hoofdpijn dan mannen. Men zou zelfs kunnen gaan denken aan 36 keer zo veel.

[x] Het artikel van Wermink cs was ook onderwerp van een bespreking door de NRC-ombudsman. Daarin werd uitsluitend aandacht besteed aan dit aspect van Straftoemeting. De bespreking eindigt jolig: “Moet de krant dan lastige wetenschappelijke termen gebruiken? Nee, als het maar helder en consequent wordt uitgelegd. Bij twijfel: raadpleeg de wetenschapsredactie. Of statistici, natuurlijk. Dan neemt de kans dat het goed gaat toe.”

[xi] Link leidt naar Volkskrant-artikel getiteld Onderzoek: met buitenlands uiterlijk eerder de cel in: “De PvdA-fractie in de Tweede Kamer wil van minister Ivo Opstelten (Veiligheid en Justitie) opheldering. De partij wil onder meer weten wat de minister eraan gaat doen als het inderdaad zo is dat rechters het uiterlijk van verdachten en de taal die ze spreken meewegen in hun oordeel.”

[xii] In het NJB reageerden J.J. Bade en M.M. van der Nat: “Wij zien jullie wel: de studenten die achter in de zittingszaal aandachtig kijken, luisteren en vragenlijsten invullen. Maar wat jullie precies aan het doen zijn, dat blijft vaak onbekend. Behalve dan wanneer jullie onderzoeksresultaten het nieuws halen. En dat gebeurde op 14 maart 2012 in onder meer het Algemeen Dagblad en NRC Handelsblad: ‘Onderzoek: met buitenlands uiterlijk eerder de cel in’ en ‘Verdachte met buitenlands uiterlijk krijgt eerder celstraf’.”

[xiii] De fout die de auteurs gemaakt hebben is vergelijkbaar met die van de onderzoekers in de zaak tegen Stevens cs en het College van Bestuur van de UU. Zie elders op deze webstek.

[xiv] Om niet ter zake doende kritiek voor te zijn: zaken tegen ingevlogen huurmoordenaars komen niet voor de politierechter. Het gaat hier om een illustratie bij de gedachtegang.

[xv] Social Problems 1991-38, p. 247-266.

1 reactie op “Verschillen in straftoemeting en uiterlijk: een non-peer review

  1. Frans Groenendijk heeft hier een fraai voorbeeld bij de hand van quasi wetenschap. Het NJB is een blad voor juristen en niet voor sociologen. Ik denk dat de redactie niet zo goed bewerktuigd is om de kwaliteit van niet-juridische verhalen te toetsen. De gedachte dat rechters discrimineren is op zich zelf al absurd. Dat had ze horen te waarschuwen. Rechters doen zo hun best om niet te discrimineren dat je er van uit mag gaan dat de niet westerse allochtonen er in de rechtspraak beter afkomen dan ze verdienen. In elk geval deugt de bewijsvoering voor die onwaarschijnlijke stelling van geen kanten, zoals Frans nauwkeurig aantoont. Als jurist voel ik hier plaatsvervangende schaamte. De redactie van het NJB moet nodig eens wakker geschud.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

De volgende HTML-tags en -attributen zijn toegestaan: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>