Worum geht es in der Studie?
Mit dem digitalen Wandel in Wissenschaft und Forschung geht auch ein enormer Zuwachs an Forschungsdaten einher. Große Datenmengen und diverse Datentypen in Verbindung mit steigender Rechnerleistung haben zur Folge, dass datenintensive Forschung immer relevanter wird – ebenso wie das Thema Forschungsdaten an den Universitäten.
Verstärkt wurde diese Entwicklung auch durch politische Initiativen auf nationaler und internationaler Ebene: Wissenschaftliche Vereinigungen, Fördergeber*innen und Verlage verlangen vermehrt, die den Forschungsergebnissen zugrundeliegenden Daten langfristig zu speichern und zugänglich zu machen. Auch die in verschiedenen Disziplinen erhobene Forderung nach Reproduzierbarkeit der Forschungsergebnisse führt dazu, dass dem Management von Forschungsdaten wachsende Bedeutung zukommt.
Für die Forschenden bedeutet das aber mitunter einen erheblichen Aufwand bei der Planung und Durchführung ihrer Projekte. Forschungsunterstützende Services sollen Wissenschafter*innen dabei unterstützen. Damit diese entwickelt werden können, ist eine gute Kenntnis der Forschungsdatenlandschaft an der betreffenden Institution unabdingbar: Welche Datenarten werden dort erhoben, verwendet, produziert und verbreitet?
Dazu haben wir an der WU eine Fallstudie durchgeführt, mit der wir zwei Ziele verfolgten: Erstes Ziel war, einen möglichst detaillierten Überblick über die Forschungsdatenlandschaft an der WU zu erhalten. Dazu haben wir eine quantitative Dokumentenanalyse des Forschungsoutputs eines Jahres an der WU durchgeführt.
Das zweite Ziel war, einen Einblick in die Forschungsdatenpraktiken der an der WU vertretenen Fachgebiete zu gewinnen, um das zuvor aus der Dokumentenanalyse gewonnene Bild der Forschungsdatenlandschaft zu ergänzen. Im Rahmen semi-strukturierter Interviews haben wir Forschende aus allen an der WU vertretenen Departments zu ihren Erfahrungen, Bedürfnissen und den diesbezüglichen Trends befragt.
Was ist für Sie der spannendste Aspekt der Studie? Gab es überraschende Ergebnisse?
Aus methodischer Sicht war die spannende Frage, wo und wie man am besten die Forschungsdaten bzw. Informationen über diese findet und analysiert – also geeignete Quellen der Erhebung. Da die Daten oder Verweise darauf in der Regel in den dazugehörigen Publikationen zu finden sind, erschien es uns als geeignetste Lösung, diese als Datenquelle heranzuziehen. Für die Dokumentenanalyse verwendeten wir Zeitschriftenartikel, die im WU-eigenen Forschungsinformationssystem FIDES nachgewiesen waren. Allerdings lagen in dieser Datenbank nur die Zitate zu den knapp 600 auszuwertenden Artikeln vor, sodass wir die dazugehörigen digitalen Volltexte erst beschaffen mussten.
Was die Ergebnisse betrifft, kam der hohe Anteil an quantitativen Forschungsdaten angesichts der an der WU vertretenen Fachgebiete nicht unerwartet. Überraschend war aber, dass wir Forschungsdaten aus praktisch allen Wissenschaftsdisziplinen identifizieren konnten – auch Daten, die man an der wirtschafts- und sozialwissenschaftlich ausgerichteten WU nicht unbedingt erwarten würde, wie z.B. medizinische Forschungsdaten, oder Daten naturwissenschaftlicher Provenienz. Man könnte also fast sagen: Es gibt nichts, was es nicht gibt. Interessant war auch zu sehen, dass manchmal Daten aus verschiedenen Disziplinen, etwa quantitative makroökonomische Daten mit qualitativen Daten aus soziologischen Arbeiten verknüpft wurden. Ein Beispiel für eine fächerübergreifende Wiederverwendung von Forschungsdaten ist die Nutzung von Satellitenbilddaten als Benchmark-Datensatz zum Testen eines mathematischen Algorithmus.
Die semi-strukturierten Interviews mit den Forschenden gewährten uns nicht nur wichtige Einblicke in die unterschiedlichen Forschungskulturen, sondern zeigten auch ein sehr heterogenes Bild hinsichtlich des Datenmanagements im Rahmen des Forschungsprozesses. In den mit quantitativen Methoden forschenden Bereichen wurde zudem die steigende Bedeutung großer Datenmengen (Stichwort „Big Data“) betont. Auch der wachsende Fokus auf das Internet und soziale Medien als Datenquellen wurden hier genannt.
Warum haben Sie sich entschieden, die Daten frei zugänglich zu machen?
Als wir die Studie durchgeführt haben, lagen in der wissenschaftlichen Literatur zum Thema Forschungsdatenmanagement wenig vergleichbare Arbeiten vor. Daher war uns wichtig, nicht nur die Publikation selbst frei zugänglich zu machen, sondern auch die zugrundeliegenden quantitativen Daten. In verschiedenen Fachgebieten und Forschungscommunities ist das Bereitstellen von Forschungsdaten bereits jahrelang Teil der Forschungskultur. Es ist Teil unseres Forschungsverständnisses, hier einen Beitrag zu leisten, um einerseits den Erkenntnisgewinn und den Austausch von Forschungsergebnissen in den Bibliotheks- und Informationswissenschaften voranzutreiben, und andererseits nachprüfbare und replizierbare Wissenschaft zu ermöglichen.
- Mag. Thomas Seyffertitz ist seit 2013 Fachreferent für Wirtschaftswissenschaften an der Universitätsbibliothek der Wirtschaftsuniversität Wien. Seine Arbeitsschwerpunkte liegen in den Bereichen Forschungsdatenmanagement sowie Bestandsmanagement zu den Themen Finanzierung, Mathematik und Statistik.