Rückblick: 1. Sitzung der AG Forschungsdaten

Foto: Boris Jacob

Vereinfachte Darstellung des Data Curation Continuum von Treloar (2012)*

Ende Januar trafen sich etwa 20 Forschungsdateninteressierte zur 1. Sitzung der AG Forschungsdaten – einer universitätsöffentlichen Arbeitsgruppe für den Austausch zu offener Wissenschaft und Digitalisierung der Forschung. Diskutiert wurden die Themen Daten publizieren und Data Sharing (Link zur Veranstaltungsankündigung), eingeleitet von Impulsvorträgen aus der Wissenschaft.

Prof. Dr. Katrin Böhme (Professur für Inklusionspädagogik, Humanwissenschaftlichen Fakultät) sprach über Forschung im schulischen Kontext. Dies ist wegen der Studienteilnehmenden ein sehr sensibler Bereich, Studienvorhaben sind dementsprechend regulatorisch eingeschränkt und die Nach- bzw. Aufbereitung der Daten zur Veröffentlichung ist sehr aufwändig. Gleichzeitig besteht ein steigendes Interesse an Forschungsergebnissen, weshalb daran gearbeitet wird Daten besser nachnutzbar zu machen. Das Forschungsdatenzentrum (FDZ) am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) ist eine Infrastruktureinrichtung für diese Zwecke, es hält Daten aus den PISA-Studien, aber auch von vielen kleineren Studien vor, die einen Großteil der Studien im Bereich der Schulforschung ausmachen.

Daniela Mertzen (Department Linguistik /, Humanwissenschaftliche Fakultät) forscht im SFB 1287 Limits of Variability in Language und berichtete über den Nutzen, den Prä-Registrierungen von Forschungsvorhaben bieten. Dabei werden bspw. Informationen zur Methode und Entscheidungen zur Datenauswahl vorab festgelegt und veröffentlicht, um den Forschungsprozess planvoller durchzuführen und Bias zu reduzieren. Einige wissenschaftliche Journals haben das bereits in ihren Publikationsworkflow integriert, inkl. Review-Prozess. Eine andere Möglichkeit bietet das verlagsunabhängige Open Science Framework des Center for Open Science.

Dr. Christian Kappel (Institut für Biochemie und Biologie, Mathematisch-Naturwissenschaftliche Fakultät) arbeitet in der Pflanzengenetik mit der Methode der DNA-Sequenzierung. Die Digitalisierung hat hier in den letzten 10 bis 15 Jahren zu einer starken Quantifizierung der Forschung geführt. Die gewonnenen Daten werden in Fachdatenbanken publiziert, wie dem National Center for Biotechnology Information (NCBI) der U.S. National Library of Medicine. Dort können sie von anderen Forschenden heruntergeladen und als Grundlage der eigenen Forschung verwendet werden, das Nachnutzungspotential in diesem Bereich ist riesig.

In der anschließenden Diskussion ging es unter anderem um Fragen rund um die Publikation von großen Datenmengen und der Finanzierung der Aufbereitung von Daten für die Publikation bei Forschungsdatenzentren. Es wurde auch dafür plädiert Software/Skripte zu veröffentlichen, wobei deren Nachnutzung problematisch ist, wenn man ihre Funktionsweise nicht kennt. In dieser ersten Sitzung der AG kamen Kolleginnen und Kollegen aus Wissenschaft und Zentraleinrichtungen zusammen und führten angeregte Diskussionen mit Impulsen und Ideen für den weiteren Diskussionsprozess. Dieser wird im April 2020 in der zweiten Sitzung der Arbeitsgruppe Forschungsdaten fortgesetzt.

*http://www.treloar.net/research/diagrams/data_curation_continuum.pdf

Foto: Boris Jacob

Vereinfachte Darstellung des Data Curation Continuum von Treloar (2012)*