Skip to content
Snippets Groups Projects
Commit 73ea2702 authored by Michael Kohlhase's avatar Michael Kohlhase
Browse files

Update workingpaper/data-steward-custodian.md

parent d171e5e1
No related branches found
No related tags found
No related merge requests found
# Konzept zur Sicherstellung der langfristigen Verfügbarkeit von Forschungsdaten an der FAU
# Leitlinie zur Sicherstellung der langfristigen Verfügbarkeit von Forschungsdaten an der FAU
**Entwurf zur Diskussion** *Stand 29.11.2021*
**Entwurf zur Diskussion** *Stand 18. 11. 2021*
> Michael Kohlhase, Laura Albers, Klaus Meyer-Wegener, Marcus Walther
#### Präambel
Diese Leitlinie ergänzt und präzisiert die Forschungsdatenpolicy der FAU. Sie wurde am XXX durch die Mitglieder der FAU Competence Unit for Research Data and Information (CDI) beschlossen.
Diese Leitlinien werden im regelmäßigen Turnus durch die CDI evaluiert, an aktuelle Erfordernisse angepasst, durch die Mitglieder der CDI beschlossen und auf der [CDI-Webseite](https://gitlab.rrze.fau.de/cdi/admin/policies-working-paper) publiziert.
## 0. Begriffsklärungen
1. Ein **(Forschungs)-Datensatz** ist eine unveränderbare, zitierbare Sammlung von Daten und zugehörigen Metadaten zu einem fest umrissenen (Forschungs)-Thema. Datensätze sollen den FAIR- Prinzipien (Findable, Accessible, Interoperable, and Reusable) soweit als möglich gerecht werden. Soweit für den Datenschutz geboten, können Datensätze verschlüsselt gespeichert und archiviert werden.
1. Ein **(Forschungs)-Datensatz** ist eine unveränderbare, zitierbare Sammlung von Daten und zugehörigen Metadaten zu einem fest umrissenen (Forschungs)-Thema. Datensätze sollen den FAIR-Prinzipien (Findable, Accessible, Interoperable, and Reusable) soweit als möglich gerecht werden. Soweit für den Datenschutz geboten, können Datensätze verschlüsselt gespeichert und archiviert werden.
2. Ein **(Forschungs)-Datenfeed** ist ein Forschungsdatensatz, der sich über die Zeit verändert, normalerweise mit dem fortschreitenden Forschungsstand weiterentwickelt. Zu jedem Zeitpunkt (jedoch nicht rückwirkend) kann ein **Snapshot** genommen werden, dieser ist dann ein Forschungsdatensatz (siehe oben). Ein Datenfeed ist FAIR, wenn seine Snapshots das sind.
4. In diesem Dokument werden die englischen Begriffe (Steward/Custodian) für Rollen im Forschungsdatenmanagement verwendet, da diese international verwendet werden.
......@@ -18,12 +23,15 @@
## 1. Einleitung
Die FAU ist den Mittelgebern und der guten wissenschaftliche Praxis gegenüber verpflichtet, Forschungsdaten (FD) langfristig zu bewahren und zugänglich zu machen. Forschungsdaten an der FAU entstehen in Abschlussarbeiten, Projekten und Professuren/Lehrstühlen.
Allerdings haben haben alle diese eine begrenzte Laufzeit: Doktoranden promovieren, Lehrstuhlinhaber gehen in den Ruhestand oder werden an andere Universitäten berufen, etc. Dadurch drohen Forschungsdatensätze zu verwaisen, unbrauchbar zu werden oder sogar ganz verlorenzugehen.
Um die dadurch entstehenden Probleme zu lösen, schlägt die CDI die folgenden Maßnahmen vor und bietet (zusammen mit dem RRZE im Rahmen der FAUDataCloud) administrative und technische Unterstützung:
* Forschungsdatensätze und -Feeds werden schon bei ihrer Genese mit umfassenden, maschinenverarbeitbaren Metadaten versehen. Diese enthalten (zwingend):
Um die dadurch entstehenden Probleme zu lösen werden folgenden Massnahmen ergriffen:
1. Forschungsdatensätze und -Feeds sollen schon bei ihrer Genese mit umfassenden, maschinenverarbeitbaren Metadaten versehen werden. Diese enthalten (zwingend):
* Informationen zum Datensteward (der Person/Organisationseinheit, die die Rechte an den Daten hält und für sie verantwortlich ist),
* Informationen zur Lizensierung der Daten (wer hat wann, wo und unter welchen Bedingungen Zugang/Nutzungsrechte an den Daten),
* ein **Datentestament**, das regelt, was mit den Daten geschehen soll, wenn der ursprüngliche Datensteward die FAU verlässt.
* Die Organisationseinheiten (OE) der FAU etablieren ein hierarchisches System von institutionellen Forschungsdaten-Custodians, die in Datentestamenten als Daten-Verantwortliche im Erbfall genannt werden können.
2. Die Organisationseinheiten (OE) der FAU etablieren ein hierarchisches System von institutionellen Forschungsdaten-Custodians, die in Datentestamenten als Daten-Verantwortliche im Erbfall genannt werden können.
3. Die CDI bietet administrative und technische Unterstützung im Rahmen der FDM-Grundversorgung.
Dieses System wird im Folgenden beschrieben.
......@@ -31,8 +39,10 @@ Dieses System wird im Folgenden beschrieben.
### 2.1 Fallstudien
Um die Probleme zu verstehen, betrachten wir einige typische Fälle.
1. Eine Professorin geht in den Ruhestand, sie hinterlässt *3n+k* Datensätze, die unterschiedlich stark FAU-intern und extern genutzt werden. Einige müssen (DFG/DOI-Richtlinien) noch mindestens 8 Jahre lang bereitgestellt werden. **Problem**: Wann kann welcher Datensatz gelöscht werden?
2. Ein Doktorand erstellt einen Datensatz im Rahmen s5einer Doktorarbeit. Dieser enthält personenbezogene Daten und ist daher verschlüsselt gespeichert. **Problem**: Wer kann noch darauf zugreifen, wenn der Doktorand die FAU verlässt?
1. Eine Professorin geht in den Ruhestand, sie hinterlässt *3n+k* Datensätze, die unterschiedlich stark FAU-intern und extern genutzt werden. Einige müssen (nach den DFG/DOI-Richtlinien) noch mindestens 8 Jahre lang bereitgestellt werden.
**Problem**: Wann kann welcher Datensatz gelöscht werden?
2. Ein Doktorand erstellt einen Datensatz im Rahmen seiner Doktorarbeit. Dieser enthält personenbezogene Daten und ist daher verschlüsselt gespeichert.
**Problem**: Wer kann noch darauf zugreifen, wenn der Doktorand die FAU verlässt?
3. Eine Doktorandin arbeitet an einem Datenfeed (z.B. ein WissKI über Gläser in Museen) und will in ihrer Doktorarbeit den Stand zum Abgabezeitpunkt fixieren, dokumentieren und referenzieren.
4. In einem Seminar, das von einer Lehrbeauftragten gegeben wird, befassen sich zehn Studierende jeweils mit eigenen Datensätzen (bspw. in WissKI), d.h. sie bauen eine Struktur auf und/oder pflegen Daten ein. **Problem**: Wer entscheidet über den Erhalt oder Löschzeitpunkt dieser Ergebnisse? Wie verhindert man einander widersprechende Testamente?
......@@ -50,9 +60,10 @@ Alle FAU-OE (insbesondere die FAU als ganzes, die Fakultäten, Departments und L
Die ersten beiden sind die natürlichen Daten-Stewards:
1. Projekt -- Projektleiter (insbesondere ist jede Promovierende die Leiterin ihres Dissertationsprojekts);
2. Lehrstuhl/Professur -- Im Default die Inhaber:in, sonst benennen;
2. Lehrstuhl/Professur -- Im Default die Inhaber:in, sonst eine von ihr benannte Person;
Die institutionellen OEs bestellen Daten-Custodians:
Die institutionellen Ebenen bestellen Daten-Custodians:
3. Department -- Benennt eine Person;
4. Fakultät -- Benennt eine Person;
5. FAU -- Die CDI benennt eine Person.
......@@ -64,7 +75,7 @@ In der Regel soll die Steward/Custodianship eines Datenpools beim Auflösen eine
### 3.1 Aufgaben der Stewards/Custodians/OEs
Die Aufgaben der Daten-Stewards/Custodians sind auf allen Hierarchiestufen die gleichen:
1. Turnusmäßige Entscheidung über Archivierung, Veröffentlichung, Löschung oder Transfer der Datensätze der OE;
2. Finanzierung für Reputationsdaten;
2. Sicherstellung der Finanzierung für Reputationsdaten;
3. Autorisierung des Zugriffs externer Parteien gemäß der jeweiligen Lizenzen. Gegebenenfalls Vertraulichkeitsvereinbarungen (NDAs) gemäß CDI-Templates organisieren und/oder Entschlüsselung durchführen.
### 3.2 Implementation
......@@ -73,13 +84,13 @@ Die CDI etabliert (automatisierte) **Erbfall-Prozeduren**, die beim Ausscheiden
* Die Daten-Custodians der OEs werden (wahrscheinlich im IDM) modelliert.
* Hat beim Verwaisen eines Datensatzes der designierte Erbe die FAU schon verlassen, fällt sie an die (eindeutige) hierarchisch nächsthöhere OE.
* Die Nutzung der Datensätze muss einem Monitoring unterliegen, damit Entscheidungen über Löschung oder Erhalt von Reputationsdaten eine empirische Basis haben.
* Schlüssel müssen schon beim Anlegen eines Datensatzes hinterlegt werden, damit diese (besonders Pflichtdaten) in unerwarteten Erbfällen nicht unzugänglich werden. Es gibt mehrere Möglichkeiten dies zu organisieren:
* Schlüssel müssen schon beim Anlegen eines Datensatzes hinterlegt werden, damit diese (besonders bei Pflichtdaten) in unerwarteten Erbfällen nicht unzugänglich werden. Es gibt mehrere Möglichkeiten dies zu organisieren:
* ein zentraler Schlüssel-Obmann oder
* ein zentrales System, in dem die Datencustodians der OE die Schlüssel ablegen.
* Die CDI organisiert Beispiel-NDAs für Datensätze, um die Daten-Custodians zu unterstützen.
### 3.3 Finanzierung
Pflichtdatensätze aus der Grundversorgung werden über das CDI-Budget finanziert. Für Datensätze der Projektversorgung (projektspezifische Datenvolumina, die über die Grundversorgung hinausgehen) müssen gesonderte Regelungen/Finanzierungen gefunden werden.
Pflichtdatensätze in der FDM-Grundversorgung werden über das CDI-Budget finanziert. Für Datensätze der Projektversorgung (projektspezifische Datenvolumina, die über die Grundversorgung hinausgehen) müssen gesonderte Regelungen/Finanzierungen gefunden werden.
### 3.4. Konsequenzen für die Datentestamente
Ein Datentestament muss
......@@ -103,4 +114,4 @@ Die folgenden Maßnahmen werden durch das FAU Research Data Steward/Custodianshi
## 5. Offene Fragen
1. Reputationsdaten müssen finanziert werden. Lehrstuhlinhaber, die in den Ruhestand könnten (wenn das möglich ist) interessiert sein, mit ihre Restmitteln die Erhaltung ihrer Daten zu unterstützen (Datenvermächtnis).
1. Reputationsdaten müssen finanziert werden. Lehrstuhlinhaber, die in den Ruhestand könnten (wenn das möglich ist) interessiert sein, mit ihre Restmitteln die Erhaltung ihrer Daten zu unterstützen (**Datenvermächtnis**).
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment