Unser Kerngeschäft: Datenchecks

06.03.2018

Unsere tägliche Arbeit besteht aus für Sie (noch) mysteriösen Arbeitsschritten und tollen Protokollen. Nach diesem Beitrag werden Sie Lust bekommen, Ihre Daten zu archivieren – versprochen!

In diesem Beitrag wird die Frage beantwortet, was passiert, nachdem Daten bei AUSSDA ankommen (das haben Sie sich doch immer schon gefragt – nicht wahr?). Die Antwort ist: viel! Doch um welchen Archivierungsschritt geht es jetzt genau?

  • Ingest – erster Kontakt, Beratungen, Unterzeichnung des Vertrages zur Archivierung, Datenübergabe an AUSSDA
  • Processing – für Sie (noch) mysteriöse AUSSDA Arbeitsschritte, die unter anderem mit dem Vergleichen von Datensatz, Codebuch und Dokumentation zu tun haben
  • Controll & Publish – Feedback zu Änderungen durch die Datenlieferantin/den Datenlieferanten, letzte Kontrolle, Veröffentlichung des Datensatzes im AUSSDA Dataverse

Sie haben richtig geraten: heute geht es um Punkt 2. Was in dieser Aufzählung als „Processing“ zusammengefasst wird, umfasst eine Reihe von Arbeitsschritten, die unsere Data Processing Specialists vornehmen, um Datensätze nachhaltig und benutzerfreundlich aufzubereiten. Denn Daten, die keine Dokumentation haben oder unverständlich sind, können nicht weiter genutzt werden.  

Speicherung

Nach Erhalt von Daten und Dokumentation, speichert Ihre Kontaktperson von AUSSDA die Dateien ab. Da wir zur Zeit nur quantitative Datensätze archivieren, speichern wir die Datensätze zur weiteren Bearbeitung als STATA-Dateien ab.  

Erste Checks

Daraufhin folgen die ersten Kontrollen. Liegen alle benötigten Dateien in für uns bearbeitbaren Formaten vor (zum Beispiel Daten in SPSS, STATA, csv, tab)? Wurden direkt personenbezogene Daten im Datensatz entfernt (wie Namen oder Sozialversicherungsnummern von Befragten)? Werden diese und weitere Fragen zufriedenstellend beantwortet, geht es weiter zum nächsten Punkt.  

Vergleichen, vergleichen, vergleichen

Das ist der Arbeitsschritt, in dem sich zwei Computerbildschirme richtig auszahlen. Die Data Processing Specialists bei AUSSDA öffnen Datensatz und Dokumentation (Codebuch, Methodenbericht, Fragebogen) sowie die Metadateneinträge. Besonderes Augenmerk liegt dabei auf:

  • Metadatenchecks: sind alle verpflichtenden Felder korrekt ausgefüllt? Können weitere Felder ausgefüllt werden?
  • Datenchecks: Stimmen die Zahl der Fälle und Variablen in allen Dateien überein? Sind value labels in allen Dateien gleich? Sind Filterfragen richtig geleitet worden? Sind alle labels vollständig? Sind missing values konsistent benannt?
  • Anonymisierungschecks: Je nach Lizenzierung prüfen wir, ob Veränderungen an den Daten notwendig werden, um die Anonymität Ihrer Respondentinnen und Respondenten zu gewährleisten. Wie sind etwa die Variablen Alter, Wohnort und Bildung kodiert?
  • Plausibilitätschecks: Finden wir einen 12-jährigen Pensionisten in Ihrem Datensatz melden wir uns bei Ihnen!

Während wir all das und noch mehr testen, führen wir ein ausführliches Protokoll.  

Protokoll

In diesem Dokument versuchen wir, möglichst nachvollziehbar Unstimmigkeiten darzulegen. Im optimalen Fall finden wir wenig, doch im langen Prozess der Erstellung von Labels, des Kodierens und Formatierens schleichen sich einfach manchmal Fehler ein. Im Moment unterteilen wir daher in verschiedene Kategorien von „Unstimmigkeiten“ (es wäre übertrieben, von Fehlern zu sprechen):

  • Unterschiede in Daten und Dokumentation
  • Anmerkungen zu Variablen und Labels
  • Anmerkungen zu Values und Labels
  • Anonymisierungsbedarf
  • Rechtschreib-/Grammatikfehler

Gerade in der letzten Kategorie sind einfach zu behebende Fehler, die oberen vier können uns beim Erstellen und Sie nach Erhalt des Protokolls vor größere Herausforderungen stellen.  

Interne Nachvollziehbarkeit

Bei allen Schritten ist uns die Verantwortlichkeit wichtig. Sie vertrauen uns mit Ihren Daten und wir gehen sorgsam damit um. In unserer internen Dokumentation ist nachvollziehbar, wer welchen Arbeitsschritt vorgenommen hat, damit keiner unserer Schritte übersprungen wird.  

 

Ich bedanke mich bei allen, die bis zum Ende gelesen haben. Wenn Sie Lust bekommen haben, dieses Protokoll mal zu sehen und bereit sind, Ihre Daten in unser Archiv zu entlassen, kontaktieren Sie uns! Wir sind telefonisch (+43 4277 15323) und per Mail erreichbar und freuen uns auf Sie und Ihren Datensatz.

Hände die eine Computertastatur bedienen. Davor ein Folder auf dem "AUSSDA Data Checks" steht
Data Processing Specialist bei der Arbeit (Foto: Lena Raffetseder)