von Wolfgang Meins

Der von Familienministerin Lisa Paus beauftragte Nationale Diskriminierungs- und Rassismusmonitor hat gravierende methodische Schwächen. Es entsteht der Eindruck, dass ein bestimmtes Ergebnis erzielt werden sollte.

Im Folgenden geht es wieder einmal um das Deutsche Zentrum für Integrations- und Migrationsforschung (DeZIM). Genauer: um die Anfang November letzten Jahres veröffentlichte Ausgabe des Nationalen Diskriminierungs- und Rassismusmonitors (NaDiRa) für das Jahr 2022. Dieser Monitor soll fortan jährlich erscheinen, um anklagend den jeweiligen Stand von Rassismus und Diskriminierung in der hiesigen Gesellschaft zu dokumentieren. Das aktuelle Werk mit dem Titel „Rassismus und seine Symptome“ umfasst stolze 259 großformatige Seiten.

Der Rezensent muss sich folglich auf das Wesentliche konzentrieren, nämlich: zunächst den formidablen Fehlstart, dann gravierende methodische Schwächen, die auch noch – der nächste Punkt – aktiv beschwiegen werden. Zu guter Letzt geht es um ein sogenanntes „Feldexperiment“, dessen Ergebnisse leider nicht ganz das halten, was die Autoren sich versprochen hatten. Wegen der erwähnten methodischen Schwächen und dem unehrlichen Umgang damit werden die beiden eigentlichen Themenschwerpunkte, nämlich „Allgemeine Rassismus- und Diskriminierungserfahrungen in Deutschland“ und „Rassismus und Gesundheit“, nur kurz gestreift.

Ein formidabler Fehlstart

Eigentlich sollte der Monitor auf einer gemeinsamen Pressekonferenz mit der für die Finanzierung des DeZIM zuständigen Ministerin Lisa Paus (oben im Foto) im November 2023 vorgestellt werden. Aber es kam anders. Denn bekanntlich überfielen Terrorkommandos der Hamas am 7. Oktober Israel. Da erschien es der Ministerin plötzlich nicht mehr opportun, ein Werk vorzustellen, in dem es um Rassismus und Diskriminierung in Deutschland geht, der muslimische Antisemitismus dabei aber mit keinem Wort erwähnt wird. Wie es auf der Bundespressekonferenz vom 8. November hieß, werde das DeZIM angesichts der „aktuellen politischen Entwicklungen und einer damit einhergehenden erweiterten Datenlage zusätzlich einen stärkeren Fokus auf das Thema Antisemitismus legen.“

Damit dürfte man beim DeZIM- und NaDiRa nicht gerechnet haben. Denn für Antisemitismus, und gar noch den muslimischen, fühlt man sich eigentlich nicht zuständig. Entsprechend gibt es weder auf der DeZIM-Homepage noch auf der vom NaDiRa auch nur irgendeinen Hinweis auf die ausgefallene beziehungsweise verschobene Präsentation, den Grund dafür und wie es nun weitergehen soll (zuletzt aufgerufen am 31. Januar 2024). Im Übrigen blieb dort auch die Suche nach dem muslimischen Antisemitismus ohne einen auch nur halbwegs stimmigen Treffer. Vielleicht muss auch erst neues Fachpersonal eingestellt werden, weil die vorhandenen 42 NaDiRa-„Mitarbeitenden“ mit den aus ihrer Sicht wirklich relevanten Themen schon restlos ausgelastet sind?

Gravierende methodische Schwächen

Der Monitor bietet – abgesehen von den zahlreichen Abbildungen – überwiegend schwer verdauliche Kost. Wesentlich liegt das im Forschungsgegenstand Rassismus und Diskriminierung selbst begründet. Denn hier kommen die Autoren nicht umhin, um tausend Ecken begründen zu müssen, wieso rassistische Diskriminierung grundsätzlich und ohne Ausnahme nur in eine Richtung erfolgen und nie, wirklich nie, irgendetwas zu tun haben kann mit so etwas Menschlichem wie Fehlverhalten, Anpassungsproblemen oder auch schlicht Überforderung des sich diskriminiert Fühlenden – von möglicherweise auch bloß berechnendem Kalkül gar nicht zu sprechen.

Erschwerend kommt hinzu, einen Rassismus ohne biologisch begründete Rassen konstruieren zu müssen. Aber das gilt nun einmal als unumstößliches Dogma, wenngleich immer mal wieder infrage gestellt. Die von den Autoren hier gepflegte ideologische Spielart von Wissenschaft macht ihnen die Arbeit manchmal aber auch leichter: Finden sich nämlich irgendwelche Unterschiede in der Selbstbeurteilung zwischen der sich als „deutsch ohne Migrationshintergrund (MH)“ identifizierenden Gruppe und den sich anders identifizierenden Gruppen, nämlich „muslimisch“, „asiatisch“, „Schwarz“, „deutsch mit MH“, ist die Ursache dafür, na klar, immer Rassismus oder rassistische Diskriminierung.

Wie etwas verhuscht mitgeteilt wird, waren für die Ziehung der Stichprobe die Meinungsforscher vom infas Institut zuständig. Der Datenerhebung zugrunde lag demnach eine Zufallsziehung (18 bis 70 Jahre) aus Einwohnermelderegistern. Für die Gezogenen galt es, einen Fragebogen auszufüllen, der auch online in den hier erforderlichen Sprachen verfügbar war. Die Grundgesamtheit der Panelbefragung des NaDiRa bildeten Personen mit und ohne Migrationshintergrund, die in Deutschland wohnhaft sind. Die Ziehung der Stichprobe sei disproportional angelegt worden, um Gemeinden mit einem höheren Anteil der Migrantengruppen stärker zu berücksichtigen. So weit, so gut. Die niedrige Rücklaufquote von 28,5 Prozent (= 21.418) wird leider ebenso wenig thematisiert wie der Verbleib von fast 6.000 weiteren Personen auf dem Weg zur endgültigen Stichprobe. Aber Schwund gibt es eben immer.

Gewichtung als Allheilmittel?

Wie bei solchen Untersuchungen häufig der Fall, kann der Anspruch auf Repräsentativität von der gezogenen Stichprobe nicht eingelöst werden. Aber zum Glück haben Statistiker zur Lösung der dadurch entstehenden Probleme die sog. Gewichtung entwickelt. Damit kann es dann gelingen, Datenverzerrungen, also signifikante Abweichungen der gezogenen Stichprobe bei zum Beispiel Geschlecht, Altersgruppen oder Bildungsstand, im Nachhinein zu korrigieren. So verhielt es sich auch im vorliegenden Fall. Allerdings äußern sich die NaDiRaler dazu nur sehr schmallippig, indem auf eine Publikation (Ruland et al. 2023) aus dem infas Institut verwiesen wird, in der Genaueres enthalten sei. Wer allerdings danach sucht, wird enttäuscht. Denn diese Publikation existiert entweder gar nicht oder es handelt sich um ein internes und damit nicht zitierfähiges Arbeitspapier von infas. Ob das bloß schlechter Stil ist oder hier gravierende Unzulänglichkeiten der Stichprobe gezielt vertuscht werden sollen, muss folglich offen bleiben.

Gewichtung ist kein Allheilmittel und kommt vor allem dann an seine Grenzen, wenn eine eigentlich sehr große Teilstichprobe – zum Beispiel „deutsch ohne MH“ mit niedriger Bildung – den Fragebogen nur äußerst selten bearbeitet hat. Nach der Gewichtung kämen dann zum Beispiel auf einen tatsächlichen Fragebogenausfüller zwölf oder mehr fiktive, „gewichtete“. Und genau das ist hier auch passiert: In der Teilstichprobe „deutsch ohne MH“ weisen von den ca. 5.500 Personen (18 bis 70 Jahre) nur 5,1 Prozent eine „niedrige“ Bildung auf. Diese Gruppe mit Haupt- oder Realschulabschluss müsste aber – ihrer tatsächlichen Häufigkeit entsprechend – deutlich größer sein, schätzungsweise bei mindestens 60 Prozent liegen. Ähnliches gilt – die Autoren schweigen sich darüber vielsagend aus – in wohl noch deutlich stärkerem Maße auch für die anderen Stichproben. So hätten zum Beispiel gut 78 Prozent der Schwarzen mindestens Abitur. Wie stark dieser Wert von den tatsächlichen Verhältnissen in Deutschland genau abweicht, erfährt der Leser aber nicht.

Laxer Umgang mit wissenschaftlichen Standards

Der Rezensent kann sich angesichts dieser Unzulänglichkeiten des Eindruckes nicht erwehren, dass wir es hier mit einer vernünftigerweise eigentlich gar nicht oder nur sehr eingeschränkt auszuwertenden Stichprobe zu tun haben. Darauf, dass auch der Erwerbsstatus der einzelnen Teilstichproben – obwohl mit erhoben, wie ausdrücklich erwähnt wird – nicht mitgeteilt wird, möge sich jeder seinen eigenen Reim machen. Aber es gibt noch ein weiteres Problem, das auch durch im Nachhinein angewandte statistische Prozeduren nicht auflösbar ist: Wenn bei einer Befragung zu solch politisch aufgeladenen Themen nur etwa jeder Vierte der Ausgewählten zur Mitarbeit bereit ist, stellt sich die Frage, ob darunter nicht überproportional viele sind, denen das Thema Rassismus und Diskriminierung nicht nur besonders am Herzen liegt, sondern deren Meinung dazu auch noch in ein und dieselbe Richtung tendiert. So könnte die Erwartung bestehen, von der Opferrolle in Folge eines besonders hohen Diskriminierungslevels der eigenen Migrantengruppe vielleicht profitieren zu können. Die DeZIM-Forscher in ihrem festen Glauben an das Gute und Erhabene im Migranten treibt diese Frage natürlich nicht um.

Wie lax hier mit wissenschaftlichen Standards umgegangen wird, zeigt sich auch daran, dass – ungeachtet des Umfangs von 259 Seiten – nicht mal ein kleines Absätzchen dem Thema der statistischen Auswertung gewidmet ist. Welche Variablen sollen wie in die Analysen einbezogen werden, welche nicht – und was sind die Gründe dafür? Welche gegebenenfalls näher zu beschreibenden statistischen Verfahren kommen zum Einsatz, und sind die Voraussetzungen für ihre Anwendung hier tatsächlich erfüllt? Kurzum, angesichts der Summe an gravierenden Mängeln in diesem Forschungs- und Propagandaprojekt kann der Rezensent nur zu dem Schluss kommen, die NaDiRa-Ergebnisse schlicht zu ignorieren – abgesehen von dem im Anschluss gewürdigten Projekt.

Ein „Feldexperiment“

Ersparen wollen wir uns hier eine sogenannte „Community-basierte partizipative Studie“, bei der die drei Autorinnen 14 einschlägige, von Rassismus betroffene Aktivisten, offenbar aus ihrem weiteren Bekanntenkreis, interviewt haben – so ein bisschen die aktuelle Version von „Opa erzählt vom Krieg“. Aber gewürdigt werden soll hier noch – in aller Kürze – ein „bundesweites Feldexperiment“ zum Thema: „Namensbasierte Diskriminierung beim Zugang zur Gesundheitsversorgung.“

Dazu äußern sich die Forscher folgendermaßen: „

Für das Experiment wurden (…) knapp 6.800 zufällig ausgewählte Praxen von niedergelassenen Ärzt*innen (Allgemeinmedizin, Dermatologie, Pädiatrie und Radiologie) und Psychotherapeut*innen um einen Termin für eine fiktive Person oder deren Kinder gebeten. Jede Praxis wurde nur einmal kontaktiert. Die Kontaktaufnahme erfolgte überwiegend per E-Mail (…) Für die Anfragen wurden fiktive Personen entworfen, deren Namen systematisch variiert wurden. Es wurden Namen ausgewählt, die eine türkische und nigerianische (für nichtdeutsch) oder eine deutsche Herkunft suggerieren (…).“

Was waren die wesentlichen Ergebnisse?

„Fast die Hälfte der versandten 6.789 Terminanfragen wurde positiv beantwortet (47%), die Praxen haben also die Bereitschaft gezeigt, einen Termin für die fiktiven Patent*innen zu finden. Dabei erhielten Patient*innen mit in Deutschland weit verbreiteten Namen deutlich häufiger eine positive Antwort auf ihre Terminanfragen (51%) als Patient*innen mit Namen, die in der Türkei (45%) oder Nigeria (44%) häufig auftreten.“ Also: klarer Fall von „namenbasierter Diskriminierung“. Aber es gibt auch positive Ergebnisse: „Bei Terminanfragen bei pädiatrischen Praxen lassen sich kaum Gruppenunterschiede finden. Wenn fiktive Personen für ihre Kinder um einen Termin bitten, scheint der Name irrelevant zu sein.“

Wie lautet die Schlussfolgerung?

Zunächst einmal würde ich Unterschiede von 6 oder 7 Prozent hier nicht als „deutlich“ bezeichnen. Zudem arbeiten die allermeisten Praxen am Limit, haben also kaum Kapazität für neue Patienten und besonders wenig für solche, die wahrscheinlich auch noch mehr Zeit kosten, allein schon wegen möglicher sprachlicher Probleme. Dennoch sind die Praxen – so sie überhaupt noch neue Patienten annehmen – ganz überwiegend bereit, auch neue nigerianische oder türkische Patienten zu behandeln. Kinderarztpraxen erleben aufgrund der demographischen Entwicklungen jetzt bereits das, was der Erwachsenenmedizin teils noch bevorsteht und haben sich angepasst. Zudem sind – da berufe ich mich auf einen befreundeten, langjährig niedergelassenen Pädiater – migrantische Mütter nicht selten leichter zu händeln als überbesorgte und -behütende deutsche.

Abschließend noch eine Frage an den äußerst großzügigen NaDiRa-Financier Frau Paus: Ist Ihnen eigentlich klar, dass die DeZIM-Truppe Sie, man muss es leider so deutlich sagen, Frau Ministerin, über den Tisch gezogen hat, und zwar so was von? Nie im Leben brauchen die für ihren NaDiRa 42 Mann! Glauben Sie einem alten wissenschaftlichen Fahrensmann: Hier reichen ein fähiger Leiter samt Sekretärin, zwei tüchtige, aufstiegsorientierte wissenschaftliche Mitarbeiter, vielleicht noch unterstützt von einigen Doktoranden sowie ein Computer- und Statistik-Fuzzi mit zwei studentischen Hilfskräften. Das wär’s auch schon.“

Prof. Dr. med. Dipl.-Psych. Wolfgang Meins ist Neuropsychologe, Arzt für Psychiatrie und Neurologie, Geriater und apl. Professor für Psychiatrie. In den letzten Jahren überwiegend tätig als gerichtlicher Sachverständiger im sozial- und zivilrechtlichen Bereich. Prof. Meins ist Mitautor des Buches „Die hysterische Republik“

Der Beitrag erschien zuerst auf achgut.com