Data Stewardship in grossen Forschungsinfrastrukturen? Finden Sie heraus, wie das im BedrettoLab funktioniert

Rebecca Hochreutener und Dr. Marian Hertrich (BedrettoLab für Geowissenschaften und Geoenergien, D-ERDW) im vierten Interview der Reihe zu Modellen von Data Stewardship an der ETH Zürich.

Rebecca Hochreutener arbeitet seit August 2021 als Programmadministratorin im BedrettoLab. In ihrer Funktion ist sie für den reibungslosen Ablauf aller Forschungsprojekte im BedrettoLab verantwortlich. Dies beinhaltet sowohl administrative Aspekte als auch das Datenmanagement. Sie ist Data Steward* im Open-Research-Data (ORD)​-Projekt mit der ETH-Bibliothek.

Dr. Marian Hertrich arbeitet seit 2018 als Leiter des BedrettoLabs an der ETH Zürich. In dieser Funktion ist er für die Durchführung der verschiedenen wissenschaftlichen Experimente verantwortlich. Wissenschaftlich beschäftigt sich Marian insbesondere mit den elastischen Eigenschaften von Gesteinen und deren Veränderung während Stimulationsexperimenten.

Das Interview führte Dr. Julian Dederke (ETH-Bibliothek), der ein swissuniversities-​Projekt zur Etablierung von Data-​Stewardship an der ETH Zürich koordiniert. Die Förderung von Data-​Stewardship ist ein Ziel sowohl der externe Seite Nationalen Strategie zu offenen Forschungsdaten als auch der externe Seite ORD-​Strategie des ETH-​Bereichs.

Rebecca und Marian, ihr arbeitet zurzeit als Administratorin und Laborleiter. Was sind eure Aufgaben?

Marian: Als Laborleiter bin ich für die Koordination und operative Umsetzung der verschiedenen Projekte im BedrettoLab verantwortlich. Das sind Forschungsprojekte aber auch Infrastruktur-Erweiterungen. Zum Beispiel ist die Datenübertragung vom Labor zur ETH eine Herausforderung, da wir sehr grosse Datenmengen generieren – bis zu 1 Terabyte pro Tag während der grossen Experimentierphasen.

Rebecca: Neben meiner Verantwortlichkeit für die gesamte Administration des BedrettoLabs bin ich ausserdem mit der administrativen Abwicklung aller Forschungs- und Infrastrukturprojekte betraut. Im Rahmen des Data-Stewardship-Projekts bin ich Data Steward für das BedrettoLab. Dabei bin ich vor allem die Ansprechperson für Datenmanagement und unterstütze zusammen mit Marian die korrekte Speicherung der Forschungsdaten.

Welche Herausforderungen seht ihr bei euren Aufgaben bezüglich Datenmanagement?

Marian: Die grosse Vielfalt der Daten im BedrettoLab und die Menge sind eine grosse Herausforderung. Zudem generieren wir viele Daten, für die es noch keine internationalen Standards gibt. Im Idealfall würden wir uns gerne an der Schaffung dieser Standards beteiligen, was sehr aufwendig sein kann.

Rebecca: Die Entwicklung von Datenmanagementpläne mit vielen internationalen Kooperationen ist nicht selbstverständlich. Die Zusammenarbeit erfordert auch den Austausch von Daten, was komplexer sein kann als gedacht, wenn es sich um Terabytes von Daten handelt. Die beste Lösung wäre es, alle Daten aussagekräftig annotiert und dokumentiert zu veröffentlichen und der wissenschaftlichen Gemeinschaft zur Verfügung zu stellen.

Im Zusammenhang mit deiner Rolle als Data Steward bist du auch im Data Stewardship Network in einer Pilotgruppe von Data Stewards an der ETH Zürich aktiv. Welche Austauschmöglichkeiten haben sich hier bisher für dich ergeben?

Rebecca: Das Data Stewardship Network ermöglicht einen guten Austausch mit anderen Data Stewards, die eine andere Perspektive haben, da sie zum Teil in sehr unterschiedlichen Abteilungen und Forschungsgruppen arbeiten. Der Austausch dieser unterschiedlichen Erfahrungen ist sehr nützlich und hilfreich.  

Welche Potenziale seht ihr darin, Data Stewardship in Forschungsgruppen und Labs zu verankern?

Rebecca: Data Stewardship in verschiedenen Forschungsgruppen zu integrieren, ist aus unserer Sicht ein guter bottom-up Ansatz, der sich mit der Zeit etablieren wird. Die Finanzierung dieser Data Stewards sehe ich noch eher kritisch, da die Fördermöglichkeiten meines Wissens derzeit sehr gering sind.

Welches sind aktuelle Herausforderungen, die den Forschenden am BedrettoLab in Bezug auf das Forschungsdatenmanagement immer wieder begegnen? Was sind hier eure Erfahrungen?

Marian und Rebecca: Die grossen Datenmengen und die Vielfalt der Daten sind immer wieder eine Herausforderung, damit diese sowohl intern als auch von externen Partnern genutzt werden können. Es erfordert viel Fleissarbeit, die Daten zu organisieren und zu annotieren, damit diese ordnungsgemäss und nach FAIR-Prinzipien gespeichert und archiviert werden können. Mangelnde Ressourcen unterstützen diese Umsetzung nicht.

Wie geht ihr vor, um das Datenmanagement im BedrettoLab zu verbessern?

Marian und Rebecca: Wir arbeiten täglich an Lösungen, um das Datenmanagement im Bedretto-Lab zu verbessern. Dabei konzentrieren wir uns hauptsächlich auf die folgenden Aspekte:

  1. die Daten zu organisieren und zu annotieren, was viel Fleissarbeit und Zusammenarbeit mit den Forschenden erfordert,
  2. das Datenmanagementkonzept zu verbessern und zu implementieren und,
  3. ein übergeordnetes Datenmanagementkonzept zu entwerfen, welches national und international umgesetzt werden kann.

Um Punkte eins und zwei umzusetzen, haben wir eine Stelle als Data Manager für das BedrettoLab ausgeschrieben. Diese Stelle ist hier zu finden.

Für Punkt drei haben wir den Projektantrag DAMOCLES (Data Management Concept for Underground Laboratories) im Rahmen des Open Research Data-Programms von swissuniversities geschrieben. Das Projekt wurde bewilligt und hat am 01. Januar 2024 begonnen.

Um was geht es bei DAMOCLES? Was und wie möchtet ihr es erreichen?

Ziel von DAMOCLES ist es, ein Datenmanagementkonzept zu entwickeln, das auf die Bedürfnisse und Anforderungen von Untertagelabors zugeschnitten ist.

Tatsächlich werden einzelne Datensätze heute meist nach akzeptablen Datenmanagement-Standards archiviert.

  • Wie können Datensätze für integrierte Experimente beschrieben und mit aussagekräftigen Metadaten versehen werden? 
  • Wie können Daten einfach zwischen verschiedenen Partnern und/oder Untergrundlabors ausgetauscht werden? 
  • Wie können Daten für jede und jeden ohne «graue» Vorkenntnisse verständlich/lesbar und analysierbar gemacht werden? 
  • Und, schliesslich: Welche Lösungen gibt es für das Streaming und Speichern sehr grosser Datenmengen?

Um diese Fragen zu beantworten, werden wir die Anforderungen der Nutzendengemeinschaft analysieren und eine umfassende Bestandsaufnahme der Sensoren, Daten, Formate und Zugangsbedingungen erfassen. Hardware- und Softwareanforderungen für Speicherung, Datenbanken und Webdienste dieser Grösse sind relevante Nachforschungen, um ein Datenmanagementkonzept zu entwickeln, welches den Anforderungen der Untergrundlabore entspricht.

ORD-​Projekt von swissuniversities zum Thema Data ​Stewardship

Im Rahmen der externe Seite nationalen ORD-Strategie ermutigt swissuniversities alle Forschungsinstitutionen in der Schweiz, Data Stewardship zu fördern und entsprechende Anreize zu schaffen. An der ETH Zürich wird dieses Ziel unter anderem mit einem von 2023 bis 2024 laufenden Projekt verfolgt, das von der ETH-​Bibliothek koordiniert wird. Alle Informationen zum Thema Data Stewardship finden Sie auf unserer Website.

JavaScript wurde auf Ihrem Browser deaktiviert