Interview: Eine Vision für Open Science and Data Stewardship an der ETH Zürich
Das Gespräch zwischen Professorin Elizabeth Tilley, Lars Schöbitz (D-MAVT, Global Health Engineering) und Dr. Julian Dederke (ETH-Bibliothek) ist das erste in einer Reihe von Interviews, welche die Arbeit einer im Data Stewardship Network aktiven Pilotgruppe von Data Stewards näher beleuchten.
Open Science und Open Research Data (ORD) sind zwei Begriffe, die in der schweizerischen und europäischen Forschungslandschaft derzeit sehr präsent sind. Auch externe Seite swissuniversities und der externe Seite ETH-Bereich treiben diese Themen mit eigenen Programmen zur Förderung offener Forschungsdaten voran. Doch wie können Open-Science-Ansätze in den Arbeitsalltag und in das Team einer Forschungsgruppe integriert werden? Professorin Elizabeth Tilley (D-MAVT, Global Health Engineering) und Lars Schöbitz, Open-Science-Spezialist der Forschungsgruppe, gewähren im Gespräch praktische Einblicke in diesen Themenbereich.
Interview zur Integration des Open-Science-Ansatzes in das Arbeits- und Teamumfeld an der ETH Zürich
Professorin Elizabeth Tilley ist ausserordentliche Professorin für Global Health Engineering im Fachbereich Maschinenbau und Verfahrenstechnik. Die Arbeit ihrer Forschungsgruppe beschäftigt sich mit der Suche nach technischen (und gleichzeitig sozial verträglichen) Lösungen für die komplexen Herausforderungen marginalisierter Menschen des globalen Südens, und verfolgt dabei Open-Science-Prinzipien. Unter anderem hat Professorin Elizabeth Tilley einen Open-Science-Spezialisten in ihre Forschungsgruppe aufgenommen. Ab März 2023 leitet ihre Forschungsgruppe ausserdem ein «Explore-Projekt» im Rahmen des externe Seite Programms Offene Forschungsdaten (ORD) des ETH-Bereichs.
Das Interview führte Dr. Julian Dederke, der im Team für Forschungsdatenmanagement der ETH-Bibliothek arbeitet und ein swissuniversities-Projekt zur Etablierung von Data-Stewardship an der ETH Zürich koordiniert. Die Förderung von Data-Stewardship ist ein Ziel sowohl der externe Seite Nationalen Strategie zu offenen Forschungsdaten als auch der ORD-Strategie des ETH-Bereichs. Die Einführung von Open-Science-Expert:innen wird in diesem Zusammenhang als ein wichtiger Schritt betrachtet.
Elizabeth, was ist dein Hauptforschungsgebiet?
Meine Forschung befasst sich mit den gesundheitlichen Auswirkungen von Ungleichheit und den komplexen sozialen und politischen Hindernissen bei der Bereitstellung grundlegender Dienstleistungen. Warum gibt es beispielsweise immer noch eine halbe Milliarde Menschen, die im Freien ihre Notdurft verrichtet, wo doch der Bau von Toiletten und die Behandlung von Abwässern nicht nur relativ einfach, sondern auch äusserst wirksam zur Vorbeugung von Krankheiten ist? Ich bin fasziniert von Problemen, die oberflächlich betrachtet einfach erscheinen mögen, deren Lösung sich aber als sehr schwierig herausstellt, weil sie tief in soziale Normen und politische Strukturen eingebettet sind.
Elizabeth, wie ist deine Gruppe derzeit zusammengesetzt? Wer sind die Mitglieder deiner Forschungsgruppe?
Wir sind ein kleines, aber wachsendes Team mit Forschenden sehr unterschiedlicher Fachgebiete: Senior Scientist Marc Kalina ist Humangeograph, seine Arbeit konzentriert sich auf die Urbanisierung in afrikanischen Städten; PostdocJurgita Slekiene ist Psychologin, sie untersucht Verhaltensänderungen mit dem Schwerpunkt auf der vermittelnden Rolle der psychischen Gesundheit; Saloni Vijay ist Doktorandin mit einem umwelttechnischen Hintergrund und interessiert sich für die gesundheitlichen Auswirkungen von Müllverbrennung; Lin Boynton ist Biogeochemikerin und untersucht das Plastikrecycling; und dann ist da natürlich noch Lars Schöbitz, unser Spezialist für Open Science.
Die Beschäftigung von Open-Science-Spezialist:innen ist in ETH-Forschungsgruppen keineswegs die Regel. Was hat dich, Elizabeth, dazu bewogen, unabhängig von den aktuellen Förderprogrammen zu offenen Forschungsdaten einen Open-Science-Spezialisten in deine Forschungsgruppe zu holen?
Ich bin zur ETH gekommen, nachdem ich fünf Jahre lang als Senior Lecturer an der Universität von Malawi gearbeitet hatte, wo ich viele Studierende unterrichtet und betreut habe, und das ohne Lehrassistenz oder Verwaltungsassistenz. Ich habe es hinbekommen, mich und mein Team zu organisieren, aber ich hatte immer das Gefühl, dass es noch einen besseren Weg geben müsste, die Dinge zu erledigen. Wenn man an einem Ort arbeitet, wo es täglich Stromausfälle gibt, lernt man, der Technik zu misstrauen: Ich habe Dokumente an mehreren Orten gespeichert, von fast allem Kopien gemacht, und ich hatte mehrere parallele Sicherungssysteme. Es funktionierte irgendwie, aber es war chaotisch. Bei meiner Rückkehr in die Schweiz wusste ich, dass ich die Möglichkeit hatte, mit klaren Arbeitsabläufen und effizienten Werkzeugen neu anzufangen, aber ich hatte keine Ahnung, wie ich das konkret umsetzen sollte. Glücklicherweise fand ich heraus, dass Lars genau wusste, was meine Gruppe brauchte. Da er viel auf dem afrikanischen Kontinent gearbeitet hatte, wusste er, woher ich kam – organisatorisch, aber auch ganz buchstäblich.
Dein Forschungsgebiet konzentriert sich auf besonders ausgebeutete Länder. Wie stehen deine Partnerinstitutionen zu Open Science, Elizabeth?
Dazu möchte ich zunächst noch einmal betonen, welche Auswirkungen Closed Science auf meine Studierenden sowie Kolleg:innenhatte. Erstens war der Zugang zu wissenschaftlicher Literatur immer schwierig: Der Zugang zu den ETH-Bibliotheken ist hier so nahtlos, sodass es den Benutzer:innen vielleicht gar nicht richtig bewusst ist, zu wie vielen kostenpflichtigen Abonnementsdiensten wir hier Zugang haben. Zweitens brauchten wir viel Zeit, um selbst auf die einfachsten Informationen zugreifen zu können. Datensätze mussten von Ämtern gemailt werden, PDFs von Berichten, die irgendwo in Regalen standen, mussten fotokopiert werden. Drittens gab es unglaublich viele Wiederholungen und verschwendete Mittel: Es kam uns so vor, als ob Forschende (sowohl lokale als auch internationale) immer die gleichen Arten von Daten sammelten, diese dann aber entweder in einer Arbeit auf Papier (lokal) veröffentlichten oder mit den Daten quasi verschwanden, sodass jemand anderes gezwungen war, die gleiche Arbeit zu wiederholen.
Wie wirkt sich die Anwendung von Open-Science-Grundsätzen auf die Arbeit deiner Mitarbeitenden aus, Elizabeth?
Wenn ich darüber nachdenke, wie Open Science die akademische Welt und die Forschung in Malawi und ähnlichen Ländern verändern könnte, bin ich wirklich begeistert! Der Zugang zu offen verfügbaren Daten würde nicht nur Zeit und Geld sparen, sondern auch die erstaunliche Arbeit hervorheben, die so lange unerkannt geblieben ist, weil sie einfach nie in einer wissenschaftlichen Zeitschrift veröffentlicht wurde.
Lars, als Open-Science-Spezialist in der Forschungsgruppe für Global Health Engineering, welches sind deine Hauptaufgaben, und wie sieht ein typischer Tag in der Forschungsgruppe aus?
«Wir arbeiten nach dem Prinzip «open by default». Das bedeutet, dass wir Forschung und Code offen entwickeln, Daten und Code mit permissiven Lizenzen veröffentlichen und unsere Analysen reproduzierbar machen. »Lars Schöbitz
Meine Hauptaufgabe besteht in der Schaffung und Förderung einer Open-Science-Kultur innerhalb der «Global Health Engineering»-Gruppe. An einem typischen Tag erhalte ich verschiedene Einwände zum Thema und versuche dann, noch überzeugender zu argumentieren. Am Ende erhalte ich meist positives Feedback von jemandem, der/die begonnen hat, das unglaubliche Potenzial der offenen Arbeit zu verstehen.
ORD-Projekt «openwashdata» des ETH-Bereichs
Die Gruppe Global Health Engineering hat sich erfolgreich um ein Forschungsprojekt im Rahmen des externe Seite Programms Offene Forschungsdaten (ORD) des ETH-Bereichs beworben. Das Projekt mit dem Titel «openwashdata» läuft von März 2023 bis August 2024 und zielt darauf ab, eine internationale Gemeinschaft aufzubauen, die offene Praktiken für Daten im Bereich Wasser, Sanitärversorgung und Hygiene (WASH) etablieren soll (Projektwebsite: externe Seite https://openwashdata.org)
Warum hast du dich für diesen Karriereweg entschieden, Lars? Was hat dein Interesse an Open Science geweckt?
Es hat sich bei mir einfach so ergeben. Ich hatte schon immer eine Affinität zu Computern und dann Professor:innen, die mir ganz selbstverständlich beigebracht haben, wie man Daten richtig verwaltet, ohne es Forschungsdatenmanagement zu nennen. Ich wusste, wie man mit Tabellenkalkulationen arbeitet, aber in meinem ersten Job habe ich die Grenzen von Softwaretools, die auf Tabellenkalkulationen basieren, für meine Datenanalyse erkannt. Als mir die Programmiersprache R vorgestellt wurde, war ich von der freundlichen Gemeinschaft und dem Konzept der Reproduzierbarkeit von Datenanalysen sofort begeistert. Das war die Initialzündung: Wenn andere meine Ergebnisse überprüfen und darauf aufbauen können, weil ich die Rohdaten und den Code veröffentliche, der diese Ergebnisse hervorgebracht hat, warum sollte ich das dann nicht auch umsetzen? Überraschenderweise (für mich) sahen das damals nicht alle so, und so dauerte es weitere fünf Jahre, bis ich die Gelegenheit bekam, es in Liz’ Gruppe auszuprobieren.
Was braucht es, um diese Aufgaben zu erfüllen, und was hast du dabei gelernt, Lars?
Man muss hartnäckig sein. Ich kenne nur wenige Forschende mit gesunden Arbeitszeiten, und wenn man sie bittet, etwas zu tun, das auf ihrem Lebenslauf keinen hohen Stellenwert hat, stösst man verständlicherweise auf Widerstand. Es hilft, einfühlsam zu sein. Ich versuche, die Menschen dort abzuholen, wo sie sind, und die Dinge von dort aus anzugehen. Alles, was ich über effektives Unterrichten gelernt habe, stammt von Greg Wilson und seinem fabelhaften Buch «externe Seite Teaching Tech Together». Und alles, was ich über das Unterrichten von Datenwissenschaft gelernt habe, stammt von Mine Çetinkaya-Rundel und ihren Bemühungen, externe Seite offenes Bildungsmaterial für Data-Science bereitzustellen.
Julian, die ETH-Bibliothek koordiniert ein Pilotprogramm zur Einführung von Data-Stewardship an der ETH Zürich. Mit Geldern von swissuniversities wird ein kleiner Teil der Arbeit von sechs Data-Stewards* finanziert. Was sind deine Ziele, und wie sind diese mit der Rolle des Open-Science-Spezialisten verbunden?
Im Rahmen der nationalen ORD-Strategie ermutigt swissuniversities die Hochschulen, Data-Stewardship und ORD-Spezialist:innen zu fördern und Anreize zu schaffen. Um solche Profile zu fördern, brauchen wir Vorbilder. Während unserer Diskussion über Data-Stewardship an der ETH Zürich haben wir schnell festgestellt, dass es diese Vorbilder bereits gibt: In vielen Forschungsgruppen der ETH gibt es schon Mitarbeitende, die sich um ein adäquates Forschungsdatenmanagement, reproduzierbare Datenanalysen oder die Entwicklung von Codeskripten kümmern. Mit diesem Projekt können wir solche Profile unterstützen und andere Forschungsgruppen auf die wichtige Arbeit dieser Fachpersonen und Unterstützer:innen aufmerksam machen. Wir sehen, dass Data-Stewardship an der ETH Zürich viele Formen annehmen kann und es tatsächlich auch tut. Die Anstellung einer im Bereich Open Science spezialisierten Person als integraler Bestandteil einer Forschungsgruppe ist eine dieser Möglichkeiten. Es kommt ausserdem auch den Anforderungen vieler Finanzierungsprogramme und den ETH-Richtlinien für die offene Verfügbarkeit von Forschungsdaten entgegen.
Über die Förderung von solchen Vorbildern hinaus zielt das Projekt darauf ab, das Data Stewardship Network (DSN) an der ETH Zürich zu etablieren, ORD-Praktiken mit den Richtlinien der ETH Zürich in Einklang zu bringen und Know-how und Schulungen zu RDM- und ORD-bezogenen Themen weiter auszubauen.
Die neuen Richtlinien für das Forschungsdatenmanagement an der ETH Zürich verlangen von den Forschenden ausdrücklich, dass sie die einer Publikation zugrunde liegenden Forschungsdaten und den Programmiercode standardmässig gleichzeitig mit den zugehörigen Ergebnissen veröffentlichen. Welche Schwierigkeiten gibt es für die Forschenden an der ETH, dies in der Praxis umzusetzen, Julian?
Es sind die Vielfalt der Forschungsgruppen, die Community-Standards in den verschiedenen Disziplinen und die unterschiedlichen Arten von Forschungsdaten, die einheitliche Lösungen erschweren. Während es in einigen Projekten relativ einfach ist, Daten und Code ohne Einschränkungen öffentlich zur Verfügung zu stellen, kann das in anderen Projekten aufgrund rechtlicher oder ethischer Einschränkungen schwieriger sein, beispielsweise mit vertraulichen Daten, die einer Publikation zugrunde liegen. Dann können aber unter Umständen die Metadaten für diese Forschungsdaten bereitgestellt werden. Ein weiteres Beispiel: In einigen Disziplinen ist es üblich, den Replikationscode von Simulationsmodellen zu veröffentlichen und nicht die Terabytes an Daten, die mit diesen Modellen erzeugt werden. Die RDM-Richtlinien der ETH Zürich tragen dieser Vielfalt Rechnung, indem sie sich auf Community-Standards in Form von Best Practices innerhalb einer wissenschaftlichen Gemeinschaft beziehen. Diese Vielfalt spiegelt sich auch in den unterschiedlichen Aufgaben der Data-Stewards innerhalb ihrer jeweiligen Teams wider.
Elizabeth, was hat dich dazu bewogen, Lars einen Teil seiner Zeit für Projekte einzuräumen, die über die Arbeit deiner Forschungsgruppe hinausgehen?
Ich bezahle Lars nicht, das tun die Schweizer Steuerzahlenden. Ich finde es wichtig, dass sie – und alle anderen Steuerzahlenden – sehen, was die Institutionen, die sie unterstützen, hervorbringen. Ob das nun die ETH oder ein Wasserwerk in Malawi ist, die Daten sollten für alle zugänglich sein. Wir versuchen, die Kultur im Umgang mit Daten zu verändern, und die derzeitigen Initiativen bieten eine Gelegenheit, dies in grossem Umfang zu tun.
Welche Vorteile bringt es mit sich, einen Open-Science-Spezialisten in der Forschungsgruppe zu haben, Elizabeth?
Jemanden wie Lars in unserer Gruppe zu haben, bedeutet, dass unsere Doktorierenden und die Studierenden, wenn sie unsere Kurse besuchen, eine Denk- und Handlungsweise kennenlernen, wie sie das vielleicht nirgendwo anders tun. Wir sehen unsere Studierenden als Botschafter:innen des Wandels: Ob sie nun in einem Gruppenprojekt in einem Kurs sind oder an einer Universität in Ghana arbeiten, sie haben das Potenzial, andere zu beeinflussen, ähnliche Prinzipien zu übernehmen.
Heisst das, du wünscht dir mehr Open-Science-Spezialist:innen und Datenverantwortliche an der ETH Zürich, Elizabeth?
«Das wäre mein Traum! So wie es an der ETH Lehrspezial:istinnen für jedes Departement gibt, stelle ich mir vor, dass es eines Tages an der ganzen ETH Datenverantwortliche gibt, die den Forschenden helfen, Daten besser zugänglich zu machen. Sie könnten die nächste Generation von Forschenden dabei unterstützen, sich diese guten Praktiken gleich zu Beginn ihrer Karrieren anzueignen. »Elizabeth Tilley
An alle drei (Elizabeth, Julian und Lars): Was sind die wichtigsten Entwicklungen, die ihr in den nächsten Jahren in Bezug auf Open Science erwartet?
Julian: Ich glaube, dass wir in Zukunft immer mehr Datensätze, Codeskripte oder andere Arten von offenem Output sehen werden, die als eigenständige Forschungsergebnisse zitierfähig und anerkannt sind. Generell wird das Thema Open Science in den kommenden Jahren oder sogar Jahrzehnten sicherlich allgegenwärtig sein.
Elizabeth: Ich erwarte, dass das akademische Verlagswesen der Datenveröffentlichung mehr Bedeutung beimessen wird; derzeit ist sie meist optional und wird dann auch oft schlecht umgesetzt. Ich kann mir gut vorstellen, dass die grossen Verlage diesen Trend erkennen und anfangen werden, Richtlinien zu erstellen, um die Veröffentlichung von Datensätzen zu unterstützen und durchzusetzen. Allerdings hoffe ich, dass Forschungsprodukte auch jenseits von Publikationen die gleiche Aufmerksamkeit erhalten wie Manuskripte und dass wir diese «Einheitswährung» von Publikationen hinter uns lassen können.
Lars: Der Stellenwert der Research Software Engineers wird sich verändern. Es werden sich Qualifikationsprogramme speziell für diesen Aufgabenbereich entwickeln. Aber erst wenn die Universitäten anfangen, echte Perspektiven für eine Karriere im Bereich Research Software Engineering zu schaffen, werden wir eine breitere Übernahme der Open-Science-Prinzipien erleben.
An alle drei (Elizabeth, Julian und Lars): Wo liegen aus eurer Sicht die Grenzen, wenn es um Offenheit in der Forschung geht?
Julian: Die Kombination aus neuen Möglichkeiten für verknüpfte, offene Daten und künstlicher Intelligenz, sowie autoritäre Tendenzen in der Geopolitik werden höchstwahrscheinlich auch dazu führen, dass die globale, offene Verfügbarkeit bestimmter Forschungsdaten in Frage gestellt wird. Jede grössere gesellschaftliche Entwicklung – und Offenheit in der Forschung ist eine davon – hat unbeabsichtigte Folgen. Mit einigen dieser Folgen werden wir uns in Zukunft sicherlich auseinandersetzen und darüber diskutieren müssen.
Elizabeth: Die grösste Hürde ist der notwendige Bewusstseinswandel: weg von der Einstellung «das gehört mir» hin zu «das wurde von mir geschaffen, damit es von allen genutzt werden kann». Abgesehen davon sind Zugang zu Strom und Internet für viele Menschen auf der Welt immer noch nicht selbstverständlich, aber ich habe die Hoffnung, dass unsere Freundinnen und Freunde in der Elektrotechnik daran arbeiten.
Lars: Unsere eigene Vorstellungskraft, und die ist hoffentlich grenzenlos. Ich glaube, dass die Offenheit, sei es in der Forschung, auf Regierungsebene oder in der Industrie, eine wichtige Rolle bei der Bewältigung einiger wesentlicher Probleme unserer Zeit spielt.
ORD-Projekt von swissuniversities zum Thema Data-Stewardship
Im Rahmen der externe Seite nationalen ORD-Strategie ermutigt swissuniversities alle Forschungsinstitutionen in der Schweiz, Data-Stewardship sowie ORD-Spezialistinnen und -Spezialisten zu fördern und entsprechende Anreize zu schaffen. An der ETH Zürich wird dieses Ziel mit einem von 2023 bis 2024 laufenden Projekt verfolgt, das von der ETH-Bibliothek koordiniert wird. Alle Informationen zum Thema Data Stewardship finden Sie auf unserer Website.