Öffnet eine externe Seite Link zur Startseite

Bundesamt für Naturschutz

Datenmanagement

Für eine effektive Nachnutzung von Daten und Informationen zur Biodiversität und die sie beeinflussenden Umweltfaktoren ist es notwendig, dass diese in guter Qualität erhoben, gut dokumentiert, dauerhaft gesichert, auffindbar und zugänglich sind. Ein guter Umgang mit Daten bezieht sich somit auf deren gesamten Lebenszyklus.

Die im Biodiversitätsmonitoring und in der Biodiversitätsforschung gewonnenen Daten sind die wissenschaftliche Grundlage für belastbare Aussagen bezüglich des Zustandes und der Veränderung der Biodiversität. Aus ihnen können statistisch belastbare Trends abgeleitet und geeignete Maßnahmen zum Biodiversitätsschutz erarbeitet werden. Damit die langfristige Nachnutzbarkeit solcher Daten gewährleistet ist, spielt die sorgfältige Dokumentation sämtlicher Schritte des Datenmanagements (zum Beispiel Erhebungsmethodik, Variablen- und Probenbeschreibung, Metadatenerfassung) eine entscheidende Rolle. Ein gutes Datenmanagement erleichtert auch die Nutzung regional beziehungsweise national erhobener Daten im nationalen und internationalen Kontext. Darüber hinaus lassen sich durch die Verschneidung von Daten über verschiedene Datenquellen hinweg gegebenenfalls Aussagen für große Bezugsräume und über lange Zeiträume treffen. Eine ausreichend detaillierte Dokumentation der Daten und der Methodik der Erhebung ist hierfür jedoch eine zentrale Voraussetzung.

Was ist Forschungsdatenmanagement?

Forschungsdatenmanagement umfasst den standardisierten Umgang mit erhobenen Datensätzen entlang des gesamten sogenannten Datenlebenszyklus - begonnen mit der Planung der Datenerhebung, über die Entstehung, Beschreibung, Transformation und Speicherung der Daten, bis hin zu deren Langzeitarchivierung und gegebenenfalls Veröffentlichung. Ziel des Forschungsdatenmanagements ist es, wertvolle Forschungsdaten in einer Form zu bewahren, die eine dauerhafte, personenunabhängige Nachnutzbarkeit und Überprüfbarkeit gewährleistet. Obwohl es auf den ersten Blick so scheint, als könne ein stringentes Datenmanagement an jedem Punkt des Datenlebenszyklus starten, hat sich gezeigt, dass die Erstellung eines Datenmanagement-Plans (DMP) bereits bei der Planung eines Monitoring- oder Forschungsprojektes extrem wichtig ist.

Datenlebenszyklus: Konzipieren, Daten erheben, Qualität prüfen, Daten beschreiben, Daten teilen, Daten archivieren, Daten finden, Daten verknüpfen, Analysieren/prozessieren, Ergebnisse veröffentlichen
Datenlebenszyklus: Konzipieren, Daten erheben, Qualität prüfen, Daten beschreiben, Daten teilen, Daten archivieren, Daten finden, Daten verknüpfen, Analysieren/prozessieren, Ergebnisse veröffentlichen

Der Datenmanagement-Plan

Ein Datenmanagement-Plan, der schon früh in der Planungsphase eines Vorhabens erstellt und im Verlauf des Vorhabens kontinuierlich angepasst wird, kann eine große Hilfe sein, um von vorn herein einen strukturierten Umgang mit Daten zu gewährleisten. Potenziell auftretende Schwierigkeiten können früh identifiziert und behoben werden. Geldgeber für Forschungs- und Monitoringvorhaben verlangen zunehmend eine detaillierte Beschreibung zum Umgang mit Daten als obligatorischen Bestandteil des Antragsverfahrens.

Ein DMP enthält alle Informationen, die im Verlauf des Vorhabens für das Verständnis und den Umgang mit den Daten relevant sind.

Wichtige Bestandteile eines DMP sind:

  • Allgemeine Informationen zum Vorhaben (zum Beispiel Art des Vorhabens, Verantwortlichkeiten, welche Datenrichtlinien müssen beachtet werden)
  • Datenerhebung/Speicherung: Datentyp, Dateiformat (zum Beispiel „.csv“, „.tiff“), Volumen (Datenmenge, Anzahl Dateien), methodische Standards, technische Standards
  • Dokumentation/Metadaten (zum Beispiel Ordner- und Dateistruktur, Benennung der Variablen, Beschreibung der Variablen und deren Erhebung, Metadatenstandards)
  • Ethische und Rechtliche Aspekte (zum Beispiel Angaben zu personenbezogenen Daten, Urheberrechts- und Lizenzbestimmungen)
  • Datenaustausch (zum Beispiel schriftliche Nutzungsvereinbarungen mit projektinternen und externen Datennutzenden)
  • Archivierung (wie und wo werden die Daten langzeitarchiviert)

Die FAIR-Data-Prinzipien

Wichtige Aspekte, die beim Datenmanagement zu beachten sind, werden in den FAIR-Data-Prinzipien abgebildet. Diese Prinzipien bieten einen übergeordneten Rahmen und eine Orientierungshilfe zu den Kriterien, die gut gehaltene Daten erfüllen sollten. Sie besagen, dass Daten jeder Zeit auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable, das heißt von verschiedensten Softwareprogrammen lesbar) und wiederverwendbar (Reusable) sein sollten. Diese Prinzipien sind in der Fachwelt allgemein anerkannt, haben inzwischen Einzug in diverse Richtlinien von Förderorganisationen (zum Beispiel EU Horizon 2020, Deutsche Forschungsgemeinschaft) sowie in die Datenrichtlinien vieler Wissenschaftsinstitutionen gefunden.

Leitlinien zur Sicherung guter wissenschaftlicher Praxis

Den Umgang mit Forschungsdaten hat die Deutsche Forschungsgemeinschaft (DFG) inzwischen als wichtigen Aspekt in ihre allgemein anerkannten Leitlinien zur Sicherung guter wissenschaftlicher Praxis aufgenommen. Für die Förderung von Forschungsprojekten durch die DFG spielt dieser Leitfaden eine maßgebliche Rolle.

Weiterführende Informationen

Diese Liste befindet sich im Aufbau und wird kontinuierlich erweitert.

Allgemeine Informationen und Guidelines

Datenmanagement-Plan

Literatur zum Datenmanagement mit Monitoringbezug

Metadaten Standards und Datenannotation

Hilfe und Unterstützung

Zurück nach oben