Interview: Data Stewardship auf Departementsebene – Einblicke aus dem D-HEST

Das Gespräch zwischen PD Dr. Jochen Klumpp (IT Services Gruppe (ISG), D-HEST) und Dr. Julian Dederke (ETH-Bibliothek) ist das dritte in einer Reihe von Interviews, welche die Arbeit von aktiven Data Stewards (m/w/d) im Data Stewardship Network näher beleuchten und verschiedene Modelle von Data Stewardship an der ETH Zürich aufzeigen.

Interview: Data Stewardship auf Departements-ebene – Einblicke aus dem D-HEST

Jochen Klumpp arbeitet seit 2005 an der ETH, zunächst als Postdoc und später als Oberassistent in der Forschungsgruppe für Lebensmittelmikrobiologie. Seit Juli 2015 ist er hauptberuflich stellvertretender IT-Supportgruppen-Leiter am D-HEST. Jochen hat einen Hintergrund in Biologie und IT und ist ausserdem Privatdozent für Lebensmittelmikrobiologie an der ETH. Seit 2023 ist er Teil einer Pilotgruppe von Data Stewards im swissuniversities-Projekt zu Data Stewardship.

Das Interview führte Dr. Julian Dederke (ETH-Bibliothek), der ein swissuniversities-Projekt zur Etablierung von Data Stewardship an der ETH Zürich koordiniert. Die Förderung von Data Stewardship ist ein Ziel sowohl der externe Seite Nationalen Strategie zu offenen Forschungsdaten als auch der externe Seite Open-Research-Data-Strategie des ETH-Bereichs.

Jochen, Du arbeitest derzeit als stellvertretender ISG-Leiter am D-HEST sowie in der Forschungsgruppe für Lebensmittelmikrobiologie. Was sind Deine Aufgaben?

Die ISG-HEST stellt IT-Dienstleistungen und IT-Support für aktuell siebzig Forschungsgruppen und Einheiten im D-HEST, aber auch teilweise im D-USYS zu Verfügung. Wir sind also mit sehr heterogenen und sich ständig wandelnden Anforderungen an die forschungsnahe IT konfrontiert. Wir können keine homogene IT-Umgebung etablieren, wie beispielsweise in einer Verwaltung, sondern müssen sehr stark auf die Wünsche und Bedürfnisse der Forschenden eingehen. Dazu gehört insbesondere auch der Umgang mit den Forschungsdaten, denn das ist das Wichtigste, was eine Universität «produziert».

Meine duale Rolle in der mikrobiologischen Forschung und in der Informatik erlaubt mir einen guten Einblick in beide Welten. Ich bin verantwortlich für die Beratung der Forschenden in D-HEST und D-USYS im Hinblick auf alle Aspekte der Datenhaltung und -verarbeitung, aber auch für die Pflege der Geschäftsbeziehungen zu den Professorinnen und Professoren der beiden Departemente. Wir versuchen sehr nahe am Puls der Forschung zu sein, um die Wünsche unserer Kundinnen und Kunden besser zu verstehen und brauchbare Lösungen zu bieten.

Meine eigene Lehrtätigkeit erlaubt mir ausserdem tiefe Einblicke in den Lehrbetrieb und zu sehen, welche Herausforderungen sich beim Vermitteln von guter Forschungspraxis an die Studierenden ergeben. Hier sehe ich viel Handlungsbedarf, um den Studierenden schon früh die Grundlagen von Datenmanagement und die FAIR-Prinzipien näherzubringen.

Mit welchen Fragen und Problemen wenden sich Forschende am häufigsten an Dich?

Eigentlich mit so ziemlich allen Fragen rund um die Akquisition, Pflege, Archivierung und Publikation von Forschungsdaten. Vor Kurzem bekam ich wieder eine Anfrage einer Forschungsgruppe, die Daten samt selbstgeschriebenem Analysetool der Öffentlichkeit zur Verfügung stellen will, dabei aber auf technische und organisatorische Hürden trifft.

Sehr häufig sind auch Fragen im Zusammenhang mit der Speicherung und Bearbeitung von biomedizinischen und klinischen Daten. «Darf man das?», höre ich dabei sehr oft. Die Forschenden sind auch immer wieder damit konfrontiert, dass sie mit externen Projektpartnern Daten teilen müssen, bzw. externen Personen Zugriff auf Analysesysteme der ETH geben müssen, um effektiv zu kollaborieren.

Letztlich sind viele Fragen, die bei mir landen, auch technischer Natur. «Wie bekomme ich Daten von System X auf System Y?» ¬– «Wie kann ich grosse Datenmengen verschicken oder empfangen?». Und generell alles, was sich unter dem Stichwort «Data Lifecycle Management» zusammenfassen lässt.

Im Zusammenhang mit Deiner Rolle am D-HEST bist Du auch im Data Stewardship Network in einer Pilotgruppe von Data Stewards an der ETH Zürich aktiv. Welche Überschneidungen ergeben sich hier zu Deinen anderen Aufgaben?

Viele Aufgaben, die ich bisher an der ISG wahrnehme, sind bereits im Bereich Datenmanagement angesiedelt. Dazu gehören beispielsweise Beratung und Umsetzung von Lösungen für Labormanagement-Systeme, elektronische Versuchsdokumentation, Datenspeicherung, -erhaltung und -sicherheit, aber auch das grosse Thema des Umgangs mit klinischen Daten in der Forschung. Viele Gruppen arbeiten mit historisch gewachsenen Strukturen und sehen sich aufgrund neuer Regularien oder veränderter Anforderungen mit Herausforderungen beim Umgang mit ihren Forschungsdaten konfrontiert. Die ISG-HEST will dabei die erste Anlaufstelle für die Forschenden sein. Wir beraten und vermitteln gegebenenfalls weiter bzw. etablieren selbst Lösungen.

Im Data Stewardship Network habe ich sehr schnell erfahren, dass ganz viele Gruppen an der ETH mit ähnlichen Herausforderungen konfrontiert sind und teils sehr kreative und effiziente Lösungen entwickelt haben. Nicht immer lässt sich das 1:1 zwischen Forschungsbereichen übertragen, aber es gibt doch viele Synergien, die man nutzen kann, um Daten besser öffentlich zugänglich zu machen.

Welche Vorteile siehst Du darin, Aufgaben im Bereich Data Stewardship auf Departementsebene zu bearbeiten?

Der Vorteil ist ganz klar die Unabhängigkeit und der Blick für das grosse Ganze. Ich muss keine Insellösungen für meine eigenen Daten suchen, sondern kann frei von persönlichen Vorlieben beraten. Da wir viele Forschungsgruppen in D-HEST und D-USYS beraten, sowie gut mit der IT in anderen Departementen und den Informatikdiensten vernetzt sind, können wir effiziente, übergreifende Beratung und Lösungen bieten. Insbesondere im Bereich Datenmanagement ist es wichtig, bestehende Lösungen zu kennen, damit die einzelnen Forschungsgruppen nicht ständig das Rad neu erfinden müssen.

ORD-Projekt von swissuniversities zum Thema Data Stewardship

Im Rahmen der externe Seite nationalen ORD-Strategie ermutigt swissuniversities alle Forschungsinstitutionen in der Schweiz, Data Stewardship zu fördern und entsprechende Anreize zu schaffen. An der ETH Zürich wird dieses Ziel unter anderem mit einem von 2023 bis 2024 laufenden Projekt verfolgt, das von der ETH-Bibliothek koordiniert wird. Alle Informationen zum Thema Data Stewardship finden Sie auf unserer Website.

Welches sind aktuelle Herausforderungen, die den Forschenden in Bezug auf das Forschungsdatenmanagement immer wieder begegnen? Was sind hier Deine Erfahrungen?

Dabei ist zuerst einmal das gestiegene Datenvolumen zu nennen. Hoch-Durchsatzmethoden und mehr automatisierte Datenerfassung führen auch zu massiv mehr Daten, die es zu managen gilt, insbesondere in der Biologie, aber auch in der Medizin, Chemie oder Physik.

Andererseits sind die Forschenden mit einem zunehmenden Druck konfrontiert, Daten zu publizierten Ergebnissen zu veröffentlichen und frei zugänglich zu machen und insbesondere auch die Rohdaten aufbereitet zur Verfügung zu stellen. Das geht natürlich nur mit einem guten Datenmanagement, insbesondere, wenn Projekte über viele Jahre laufen. Dem gegenüber stehen aber verschärfte Anforderungen an die Datensicherheit, insbesondere in der (bio)medizinischen Forschung.

Hast Du eine allgemeine Empfehlung, wo ETH-Forschende oder auch Forschungsgruppen anknüpfen sollten, um das Forschungsdatenmanagement zu optimieren?

Früher mussten sich viele Forschende nur dann strukturiert Gedanken um das Datenmanagement machen, wenn z. B. für einen SNF-Antrag ein Datenmanagementplan (DMP) gefordert war. Heute ist das anders. Viele Forschende machen sich intensiv Gedanken über ihre Daten. Und genau da knüpft auch meine Empfehlung an: Man sollte sich ganz klar (und am besten auf Ebene der ganzen Forschungsgruppe) mit einem formalisierten Datenmanagementplan beschäftigen. Dieser kann sehr umfassend sein, wie z. B. hier vorgeschlagen, oder auch nur die wichtigsten Vorgehensweisen und Verantwortlichkeiten regeln. Aber der Umgang mit den Forschungsdaten sollte auf jeden Fall geregelt sein. Es muss definiert werden, wer Zugang auf welche Daten hat, wer Rechte vergibt, wer verantwortlich für die Datenhaltung ist, etc. Auch der Ein- und Austritt von Mitarbeitenden muss klar geregelt sein in Hinblick auf die Datenhaltung. Und nicht zuletzt sollte auch festgelegt werden wo, wie und wann Daten veröffentlicht werden sollen. Ich kann auch allen Gruppen nur raten, auf ein Labormanagementsystem und elektronische Laborbücher zu setzen. Dies macht die Organisation und Nachvollziehbarkeit von Forschung um ein Vielfaches einfacher und letztlich profitiert die Forschungsgruppe selbst am meisten davon.

Gemeinsam voran – Stark durch Vernetzung

#FokusMensch – Lassen Sie sich von Menschen inspirieren und lernen Sie Neues.

JavaScript wurde auf Ihrem Browser deaktiviert