Diversität erforschen - Visualisierung der Afrozensus Umfrage in R
Zusammenfassung
Der Afrozensus ist die größte Umfrage unter Menschen afrikanischer Abstammung in Deutschland. Um die Extraktion von Erkenntnissen aus den Daten zu erleichtern, entwickelte ein CorrelAid-Team ein R-Paket mit einfach zu bedienenden Funktionen zur explorativen Analyse und Visualisierung der Daten. Das Paket erlaubt es Wissenschaftler:innen - unabhängig vom Grad der vorhandenen R-Kenntnisse - die Daten schnell zu durchforsten und bereits vordefinierte Datenvisualisierungen zu erstellen. Wir hoffen, in der Zukunft die Nutzung des Pakets für alle Organisationen, die sich für Inklusion und Toleranz einsetzen, zu ermöglichen.
Die Challenge
Citizens for Europe
Citizens For Europe (CFE) ist eine zivilgesellschaftliche, überparteiliche Organisation und ein gemeinnütziges Sozialunternehmen, das 2009 in Berlin gegründet wurde. Mit ihren Projekten und Dienstleistungen strebt CFE nach einer inklusiveren und partizipativen Gesellschaft, sowohl lokal als auch europaweit.
Die Abteilung Advocacy for Inclusion von CfE konzentriert sich auf die Veränderung von Strukturen, Prozessen und Policies zur Bekämpfung von Diskriminierung und zur Förderung von Vielfalt und Inklusion. Um dies zu erreichen, haben CfE-Wissenschaftler:innen ein intersektionales Erhebungsinstrument entwickelt, das das gesamte Spektrum des deutschen Gleichbehandlungsgesetzes abbildet. Es zielt darauf ab, detaillierte Daten zu Vielfalt und Diskriminierung in privaten und öffentlichen Organisationen sowie in gesellschaftlichen Bereichen zu erheben.
Mit diesem Instrument will CfE u.a. Organisationen, Unternehmen und die öffentliche Verwaltung dabei unterstützen, inklusiver zu arbeiten und letztlich das gesamte Spektrum der Vielfalt in unserer Gesellschaft abzubilden. Die Forschung von CFE ermöglicht es Entscheidungsträger:innen, die Vielfalt ihres Personals sowie das Auftreten von Rassismus, das in ihren Organisationen endemisch ist, zu verstehen. CFE bietet auch Werkzeuge, um Diskriminierung zu bekämpfen. Auf diese Weise ermöglicht das Datenerhebungsinstrument den ersten Schritt für einen grundlegenden Wandel hin zu vielfältigeren Strukturen und Menschen.
Gemeinsam mit EOTO e.V., einer der führenden Black Empowerment Organisationen in Deutschland, hat Citizens for Europe das Instrument erweitert, um es mit der Schwarzen Bevölkerung Deutschlands im Rahmen des Afrozensus - dem bisher größten Projekt von CfE - anzuwenden. Ziel des Afrozensus ist es, ein möglichst umfassendes Bild davon zu erhalten, welche Erfahrungen Menschen afrikanischer Abstammung in Deutschland machen, wie sie ihr Leben in Deutschland bewerten und was sie von Politik und Gesellschaft erwarten. Die Ergebnisse der Befragung sollen den relevanten Communities und politischen Entscheidungsträger:innen zur Verfügung gestellt werden.
Um die Daten des Afrozensus zu analysieren und zu visualisieren, unterstützte CorrelAid die Erstellung eines Workflows in der statistischen Programmiersprache R, der es den Nutzer:innen ermöglicht, Datensätze und Fragetypen des Afrobarometers auf unterschiedliche Art und Weise zu analysieren. Da viele Mitarbeiter:innen der Organisation noch nicht in der Anwendung von R geschult waren, war die Benutzerfreundlichkeit besonders wichtig. Ziel des Projekts war es daher, ein einfach zu bedienendes, gut dokumentiertes R-Paket zu entwickeln, das die einzelnen Analyseschritte erleichtert. Auf diese Weise soll die Datenexploration beschleunigt und standardisiert werden, während gleichzeitig Analysen reproduzierbar und dokumentiert werden.
- Paket = Sammlung vordefinierter Funktionen in R
Die Datengrundlage
Die CorrelAid-Volunteers arbeiteten mit einem synthetischen Datensatz, der die tatsächlichen Afrozensus-Daten mit ihren über 6000 Antworten und 700 Spalten widerspiegelte. Die Variablen repräsentierten verschiedene Arten von Umfragefragen: Single-Choice-, Multiple-Choice-, Matrix-, numerische und offene Antwortfragen, die Themen wie die acht Dimensionen des deutschen Gleichbehandlungsgesetzes, Diskriminierungserfahrungen in verschiedenen Lebensbereichen, ehrenamtliches Engagement und Aktivismus abdecken.
Der Ansatz
Das CorrelAid-Team hat ein R-Paket entwickelt, das verschiedene ggplot2-Visualisierungsfunktionen enthält, die speziell auf die Afrozensus-Daten zugeschnitten sind. Mit dem Paket müssen Forscher:innen nur einige wenige Eingabeparameter angeben, z.B. welche Frage analysiert werden soll. Das Paket erstellt dann vordefinierte Visualisierungen, wobei die Art der Visualisierung automatisch an die Art der Frage angepasst wird, z.B. ein Histogramm für numerische Fragen oder ein Balkendiagramm für Single-Choice-Fragen. Die Visualisierungen können einzeln oder mehrere auf einmal automatisiert erstellt werden. Die Visualisierungen berücksichtigen das Design des Afrozensus-Abschlussberichts und können daher auch für den diesen verwendet werden.
Für den Bericht hat das CorrelAid-Team ein erstes beispielhaftes R Markdown erstellt, das die Funktionen des Pakets ausnutzt, um die Visualisierungen automatisch für mehrere Umfragevariablen zu erstellen und das gesamte notwendige Material für die Datenexploration vorzubereiten. Das erstellte R-Paket wurde vom Team sowohl manuell als auch mit automatisierten Unit-Tests getestet.
Die Übergabe des Pakets erfolgte in einem Meeting, bei dem das CorrelAid-Team die Afrozensus-Wissenschaftler:innen mit Informationen zur Nutzung des Pakets und seiner Funktionalität unterstützte.
Für den Bericht erstellte das CorrelAid-Team einen ersten beispielhaften R Markdown, der die Funktionen des Pakets ausnutzt, um die Visualisierungen automatisch für mehrere Umfragevariablen zu erstellen und das gesamte notwendige Material für die Datenexploration vorzubereiten. Das erstellte R-Paket wurde vom Team manuell getestet und enthält auch automatisierte Unit-Tests.
Die Übergabe des Pakets erfolgte in einem Handover Workshop, bei dem das CorrelAid-Team die Afrozensus-Wissenschaftler:innen in die Nutzung des Pakets und seiner Funktionalitäten einführte.
Die Wirkung
Das Package ermöglicht es den Wissenschaftler:innen, sich auf das Wesentliche zu konzentrieren - die Suche nach Erkenntnissen und Mustern in den Daten sowie die Identifizierung derjenigen Aspekte, die das Leben in Deutschland für Menschen afrikanischer Herkunft herausfordernder machen, und wie diese Aspekte miteinander interagieren. Diese Suche wird durch Datenvisualisierungen vereinfacht.
Die vom CorrelAid-Team zur Verfügung gestellte Lösung erfordert nur minimale technische Kenntnisse, erlaubt aber dennoch Anpassungen der Visualisierungen nach Bedarf. Dank dieses Fokus auf Benutzerfreundlichkeit ist die interaktive Datenexploration und -visualisierung nun auch für Wissenschaftler:innen mit geringeren technischen Kenntnissen möglich. Und Wissenschaftler:innen mit einem eher technisch orientierten Skillset können die Datenexploration noch schneller iterieren.
Neben der Möglichkeit der interaktiven Datenexploration hat das Paket auch mehr automatisierte Ansätze ermöglicht. Über 200 Berichte zu einzelnen Variablen im Afrozensus wurden mithilfe des Pakets automatisch erstellt.
Dank des internen Data-Science-Teams von Citizens for Europe wird das Paket auch in Zukunft aktiv gepflegt und weiterentwickelt - über den zeitlichen Rahmen des CorrelAid-Projekts hinaus.