Was macht Facebook eigentlich genau mit der Demokratie? Wie verbreitet sich Desinformation und was nützt wirklich im Kampf gegen Hate Speech? Der Social-Media-Konzern hat sich bisher eher zurückgehalten, wenn es darum ging, Antworten auf diese Fragen zu finden. Das hat sich jetzt geändert. Facebook stellt ein Exabyte Daten zur Verfügung, mit Informationen zu circa 38 Millionen URLs – also Webadressen – die von Nutzer*innen zwischen Januar 2017 und Juli 2019 öffentlich mindestens hundertmal geteilt wurden. Das geschieht zusammen mit dem Projekt “Social Science One”, über das die Daten an Wissenschaftler*innen weitergegeben werden.

Laut Angaben von “Social Science One” handelt es sich dabei um einen der größten Datensätze überhaupt, der bisher in diesem Bereich ausgewertet werden konnte. Das Projekt hat dafür etwa ein Exabyte an Daten verarbeitet. Das entspricht einer Trillion Bytes oder einer Milliarde Gigabytes. Zu den einzelnen URLs gehören auch Informationen zur Glaubwürdigkeit der Links und zur Verbreitung.

Der Datensatz ist eine riesige Chance für die Wissenschaft. Bisher war es für Forscher*innen schwer, Daten direkt von Facebook zu bekommen und vor allem die Ergebnisse von Forschungen zu veröffentlichen. In diesem Datenpaket befinden sich auch Informationen, die bisher noch nie öffentlich gemacht wurden Dabei gibt es viele offene Fragen im Bereich Desinformation und Fake News. Weiterhin ist unklar, welche Folgen Manipulationsversuche wirklich haben und wie sich Desinformation im digitalen Zeitalter auf Wahlen und die Demokratie im Ganzen auswirkt.

“Social Science One” wird von Gary King und Nathaniel Persily geleitet, die beiden sind Professoren in Harvard beziehungsweise Stanford und berichten in einem ausführlichen Blog-Post über die Entstehungsgeschichte der Zusammenarbeit mit Facebook. Gründer Mark Zuckerberg hatte das Vorhaben bereits seit längerem angekündigt, praktisch dauerte es aber 20 Monate, bis die Daten tatsächlich freigegeben wurden. Das hat tatsächlich viel mit der europäischen Datenschutzgrundverordnung (DSGVO) zu tun, die seit Mai 2018 in Kraft getreten ist. Die großangekündigte Datenoffensive kam für die Anwält*innen des Konzerns offenbar doch etwas zu überraschend.

Facebook muss sichergehen, dass die weitergegebenen Daten der Verordnung entsprechen. Es dürfen also keine Rückschlüsse auf die tatsächlichen Absender*innen der Nachricht möglich sein. Wie das genau zu schaffen sein soll, darüber gehen offenbar auch die Meinungen bei Facebook auseinander. Einige juristische Stimmen innerhalb des Konzerns gehen so weit, dass eine Analyse der Daten mit Blick auf die Gesetzeslage eigentlich unmöglich ist. Die Wissenschaftler gehen dagegen von Vorgaben des europäischen Datenschutzbeauftragten aus, der offenere Regeln, gerade mit Blick auf wissenschaftliche Analyse und Forschung, anmahnt.

Gleichzeitig wirft der Blogpost ein Schlaglicht auf die Arbeitsweise der großen Internetkonzerne: „Es stellte sich heraus, dass die juristische, technische und wissenschaftliche Infrastruktur von Facebook nicht darauf vorbereitet war, die Daten so zur Verfügung zu stellen, wie wir es mit dem Konzern zusammen angekündigt hatten“, schreiben King und Persily in ihrem Beitrag.

Zwischenzeitlich haben sich Social Science One und Facebook auf eine Verfahrensweise geeinigt, die sicherstellt, dass die Daten der Nutzer*innen geschützt bleiben. Dazu wurde Software entwickelt, die bei der Auswertung der Riesenmenge an Daten helfen soll. Leider heißt das auch, dass einzelne Datensätze nicht einzelnen – anonymisierten – Nutzer*innen zugeordnet werden können. King und Persily gehen davon aus, dass das zu weniger exakten Forschungsergebnissen führen könnte. Dabei soll aber die Software des Projekts helfen. Forscher*innen, die sich mit dem Datensatz beschäftigen wollen, erhalten den Zugang direkt über Social Science One. Die Ergebnisse der Forschung bleiben frei, das heißt Facebook hat keinerlei Rechte oder kann Forscher*innen in ihren Bemühungen einschränken.