Datenmanagement
Die im Biodiversitätsmonitoring und in der Biodiversitätsforschung gewonnenen Daten sind die wissenschaftliche Grundlage für belastbare Aussagen bezüglich des Zustandes und der Veränderung der Biodiversität. Aus ihnen können statistisch belastbare Trends abgeleitet und geeignete Maßnahmen zum Biodiversitätsschutz erarbeitet werden. Damit die langfristige Nachnutzbarkeit solcher Daten gewährleistet ist, spielt die sorgfältige Dokumentation sämtlicher Schritte des Datenmanagements (zum Beispiel Erhebungsmethodik, Variablen- und Probenbeschreibung, Metadatenerfassung) eine entscheidende Rolle. Ein gutes Datenmanagement erleichtert auch die Nutzung regional beziehungsweise national erhobener Daten im nationalen und internationalen Kontext. Darüber hinaus lassen sich durch die Verschneidung von Daten über verschiedene Datenquellen hinweg gegebenenfalls Aussagen für große Bezugsräume und über lange Zeiträume treffen. Eine ausreichend detaillierte Dokumentation der Daten und der Methodik der Erhebung ist hierfür jedoch eine zentrale Voraussetzung.
Was ist Forschungsdatenmanagement?
Forschungsdatenmanagement umfasst den standardisierten Umgang mit erhobenen Datensätzen entlang des gesamten sogenannten Datenlebenszyklus - begonnen mit der Planung der Datenerhebung, über die Entstehung, Beschreibung, Transformation und Speicherung der Daten, bis hin zu deren Langzeitarchivierung und gegebenenfalls Veröffentlichung. Ziel des Forschungsdatenmanagements ist es, wertvolle Forschungsdaten in einer Form zu bewahren, die eine dauerhafte, personenunabhängige Nachnutzbarkeit und Überprüfbarkeit gewährleistet. Obwohl es auf den ersten Blick so scheint, als könne ein stringentes Datenmanagement an jedem Punkt des Datenlebenszyklus starten, hat sich gezeigt, dass die Erstellung eines Datenmanagement-Plans (DMP) bereits bei der Planung eines Monitoring- oder Forschungsprojektes extrem wichtig ist.
Datenmanagement-Planung und Datendokumentation
Eine frühzeitige Planung und Dokumentation des Umgangs mit Daten trägt maßgeblich zu einer nachhaltigen und transparenten Datenhaltung bei. Die Bandbreite an Dokumentationsarten ist vielfältig. Hier einige zentrale Beispiele:
- sogenannte Data-Curation-Profiles: dokumentieren die „Geschichte“ eines einzelnen Datensatzes
- Datenmanagementpläne: werden meist für ein gesamtes Vorhaben erstellt und enthalten alle Informationen, die im Verlauf des Vorhabens für das Verständnis und den Umgang mit den Daten relevant sind; werden im Forschungskontext zunehmend von Geldgebern eingefordert
- Data Policy: regeln den Umgang mit allen Aspekten des Datenmanagements für eine gesamte Institution oder ein großes Verbundvorhaben mit vielen unterschiedlichen Partnern
- Im behördlichen Kontext werden einzelne Aspekte des Umgangs mit Daten eher über Verfahrensanweisungen geregelt oder ergeben sich implizit durch den gesetzlichen Auftrag
- Welche Art von Dokumentation für ein bestimmtes Vorhaben sinnvoll ist, oder ob gar eine Kombination der genannten Ansätze notwendig ist, hängt immer von der Frage- bzw. Zielstellung ab. Deshalb ist es ratsam, sich bereits in einem frühen Stadium der Planung auch über solche Aspekte Gedanken zu machen und ein geeignetes Vorgehen festzulegen.
Die FAIR-Data-Prinzipien
Wichtige Aspekte, die beim Datenmanagement zu beachten sind, werden in den FAIR-Data-Prinzipien abgebildet. Diese Prinzipien bieten einen übergeordneten Rahmen und eine Orientierungshilfe zu den Kriterien, die gut gehaltene Daten erfüllen sollten. Sie besagen, dass Daten jeder Zeit auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable, das heißt von verschiedensten Softwareprogrammen lesbar) und wiederverwendbar (Reusable) sein sollten. Diese Prinzipien sind in der Fachwelt allgemein anerkannt, haben inzwischen Einzug in diverse Richtlinien von Förderorganisationen (zum Beispiel EU Horizon 2020, Deutsche Forschungsgemeinschaft) sowie in die Datenrichtlinien vieler Wissenschaftsinstitutionen gefunden.
Daten beitragen und publizieren
Daten zur Biodiversität können auf unterschiedlichen Wegen bereitgestellt und veröffentlicht werden – von strukturierten Datensätzen bis hin zu einzelnen Beobachtungsmeldungen. Repositorien unterstützen dabei, die Daten strukturiert online zu speichern, dauerhaft zugänglich zu machen und weiterzuverwenden.
Beobachtungsmeldungen beitragen
Neben der Veröffentlichung zusammenhängender Datensätze sind auch einzelne Beobachtungsmeldungen für Forschung, Naturschutzplanung und Biodiversitätsmonitoring ausgesprochen wertvoll. Plattformen wie ornitho.de, Observation.org, iNaturalist oder andere fachspezifische Meldeportale - etwa die des Rote-Liste-Zentrums oder die App Flora Incognita ermöglichen es, Beobachtungen einfach zu melden und zu teilen. Viele dieser Daten fließen in wissenschaftliche Auswertungen, die Rote-Liste-Bewertungen und die Artdatenbanken einiger Bundesländer ein. So tragen sie unmittelbar dazu bei, Biodiversität besser zu verstehen.
Praktische Hinweise
Einen besonders wichtigen Beitrag leisten Beobachtungen, wenn sie regelmäßig gemeldet und gut dokumentiert werden. Angaben zu Zeitpunkt, Fundort, Fotos und ggf. Anzahl, sowie kurze Habitatinformationen erhöhen die Qualität und Nachnutzbarkeit einer Beobachtungsmeldung erheblich. Jede dieser Informationen hilft Fachpersonen, Ihre Funde sicher einzuordnen und wissenschaftlich auszuwerten.
Melden Sie einzelne Beobachtungen möglichst nur in einem Portal, um Doppelmeldungen und damit verbundene Auswertungsprobleme zu vermeiden.
Portale, die Mechanismen zur Qualitätssicherung durch Expertinnen und Experten vorsehen, unterstützen die fachliche Nachvollziehbarkeit Ihrer Daten.
Bei der Wahl eines Portals kann es hilfreich sein, auf eine Datenhaltung in Deutschland oder der EU zu achten. Dort gelten die Anforderungen der Datenschutz-Grundverordnung (DSGVO), zudem sind solche Angebote häufig eng mit bestehenden Fachstrukturen verknüpft.
Den größten Nutzen entfalten Beobachtungsdaten, wenn ihre Weitergabe an wissenschaftliche Datenbanken erlaubt wird – beispielsweise an Fachportale, Behörden oder internationale Infrastrukturen wie Global Biodiversity Information Facility (GBIF). Dadurch können Beobachtungen in zahlreichen Forschungs- und Anwendungskontexten weiterverwendet werden.
Auch die gewählte Lizenz beeinflusst die Nachnutzbarkeit von Beobachtungsdaten. Während offene Lizenzen eine breite Weiterverwendung ermöglichen, können einschränkende Zusätze wie „NC“ („nicht kommerziell“) bestimmte Nutzungen unbeabsichtigt erschweren oder ausschließen, etwa in Druckwerken, Bildungsmaterialien oder anderen Veröffentlichungen. Eine bewusste Abwägung der Lizenzwahl ist daher sinnvoll.
Leitlinien zur Sicherung guter wissenschaftlicher Praxis
Den Umgang mit Forschungsdaten hat die Deutsche Forschungsgemeinschaft (DFG) inzwischen als wichtigen Aspekt in ihre allgemein anerkannten Leitlinien zur Sicherung guter wissenschaftlicher Praxis aufgenommen. Für die Förderung von Forschungsprojekten durch die DFG spielen diese Leitlinien eine maßgebliche Rolle.