565 Neuigkeiten im AUSSDA Dataverse

30.06.2020

Lange haben wir darauf hingearbeitet, jetzt ist es so weit: Wir haben NESSTAR, das erste Datenarchiv von AUSSDA, in den wohlverdienten Ruhestand geschickt. 565 Datensätze haben nun in unserem AUSSDA Dataverse ihr neues Zuhause gefunden.

Der NESSTAR Server wurde von unserem Partnerarchiv in CESSDA ERIC, dem Norwegian Centre for Research Data (NSD), entwickelt. In zahlreichen Archiven gibt es nach wie vor NESSTAR-Instanzen, die für ihre integrierten Analysetools geschätzt werden. In Österreich läuft mit einigen Jahren Unterbrechung seit 16 Jahren ein sozialwissenschaftliches NESSTAR-Repositorium: zuerst am Wiener Institut für Sozialwissenschaftliche Dokumentation und Methodik (WISDOM) und später, um die ehemaligen WISDOM-Daten schnell in AUSSDA auffindbar zu machen.

Wir haben sie oft als Altbestände bezeichnet, doch es sind viele spannende Datensätze dabei, etwa Umfragedaten der Sozialwissenschaftlichen Studiengesellschaft (SWS) von 1974 bis 2008 und der Mikrozensus der Statistik Austria der Jahre 1970 bis 2003. Während ein Großteil der Daten von der SWS in unserem AUSSDA Dataverse verfügbar ist, sind vom Mikrozensus derzeit nur Dokumentationen online. Die dazugehörigen Daten können per E-Mail angefordert werden und sollen in Zukunft nach und nach direkt über Dataverse zugänglich sein. Alle weiteren neu hinzu gekommenen Studien im Public AUSSDA Dataverse sind ebenfalls verfügbar, erfordern aber eine Freigabe durch unser Team.

Von NESSTAR zu Dataverse

Die anspruchsvolle Aufgabe, die Daten aus NESSTAR in Dataverse zu migrieren, haben im AUSSDA Team verschiedene Kolleg*innen übernommen. Zum einen galt es, die Metadaten an die geänderten Standards der Metadatendokumentation anzupassen. Zum anderen mussten die hochgeladenen Dateien in Archivformate konvertiert und zuletzt die Zugangsbedingungen in Dataverse geändert werden.

Da es sich um eine große Anzahl an Metadateneinträgen (565) und eine große Menge an Dateien (1­654) gehandelt hat, wurde die Migration nach Dataverse mit dem von AUSSDA entwickelten Tool pyDataverse umgesetzt. Dazu haben wir die Metadaten manuell aus dem NESSTAR Server extrahiert und nach den aktuellen CESSDA ERIC Metadatenstandards bearbeitetet. Die neu aufbereiteten Metadaten wurden als CSV-Dateien mit Hilfe von pyDataverse über die Dataverse API importiert. Im nächsten Schritt wurden die zugehörigen Dokumentations- und Datendateien hochgeladen sowie Lizenzbedingungen und Zugangsberechtigungen vergeben. Der letzte Schritt war das automatische Publizieren der 565 Einträge mittels pyDataverse.

Ein kleiner Abschied

Das AUSSDA Team sieht diesem Abschied ein wenig wehmütig ins Auge. Bei uns wird die Webseite “finddata.aussda.at“, auf der das AUSSDA-NESSTAR zu finden war, in Zukunft auf unser Dataverse verlinken. Entdecken Sie selbst die „neuen“ Daten in unserem AUSSDA Dataverse unter data.aussda.at. Bei Fragen oder Anmerkungen sind wir wie immer unter info@aussda.at für Sie erreichbar.

 

 

565 Datensätze wurden publiziert (Bild: AUSSDA)