Am 16.09.2014 fand im Zentrum für Kunst und Medientechnologie (ZKM) in Karlsruhe der 1. Workshop im Rahmen des DFG-Projekts RADAR - Research Data Repositorium - statt. Nachfolgend finden Sie eine Zusammenfassung der vorgestellten Themen und der Fragen aus den Diskussionsrunden. Wir möchten uns an dieser Stelle nochmals bei allen Teilnehmern und Vortragenden für die erfolgreiche Workshop-Gestaltung und die zahlreichen Anmerkungen und Vorschläge bedanken.

Workshop & Vortragsinhalte:

Zu Beginn wurde das RADAR-Projekt einem bunten Workshop-Teilnehmerkreis mit VertreterInnen aus den Natur, Geistes- und Informationswissenschaften als auch aus wissenschaftlichen Verlagen vorgestellt.

Die Vorträge hierzu umfassten
- eine allgemeine Projektübersicht mit den Eckdaten & dem weiteren Zeitplan des DFG-Projekts,
- die geplanten Workflows zum zweistufigen RADAR-Angebotsmodell,
- die Präsentation des Datenmanagementssystems,
- die erste Version des deskriptiven Metadatenprofils sowie
- die Entwürfe zu möglichen Workflows im RADAR-Publikationsservice für Institutionen und Verlage.

Die Nachmittagssession des 1. RADAR-Workshops war sechs externen Expertenvorträgen gewidmet, welche die Herausforderungen eines nachhaltigen Datenmanagements aus unterschiedlichen Sichtweisen beleuchteten. Die Fachvorträge umfassten dabei sowohl die Datenmanagement-Perspektiven aus den in den Natur- u. Informationswissenschaften angesiedelten Forschungsbereichen (das Projekt LSDMA[1], das 'SEEK for Science Tool' der HITS gGmbH[2], die Anforderungen aus der Materialwissenschaft und Werkstofftechnik der DGM e.V.[3]) als auch Sichtweisen aus den Geisteswissenschaften (Georg-Eckert-Institut[4]) und von wissenschaftlichen Verlagen (Georg Thieme Verlag[5]). Eine Übersicht zu den Vorträgen mit entsprechenden Downloadlinks finden Sie hier.

In den sich an die Vorträge anschließenden Workshop-Diskussionen wurde deutlich, dass RADAR einen zunehmenden Bekanntheitsgrad in der Forschungsdatencommunity genießt und deutschlandweit als bisher einziges Projekt einen disziplin- und institutsübergreifenden Ansatz bei der Etablierung einer nachhaltigen Dateninfrastruktur für Forschungsdaten verfolgt. Hierzu kam in der Diskussionsrunde die Idee auf, RADAR als nationales, generisches End-Point-Repositorium zu etablieren, welches im Idealfall den forschenden Institutionen/WissenschaftlerInnen von Forschungsförderern empfohlen wird. Dies soll vor allem dann der Fall sein, wenn kein fachspezifisches Datenarchiv in dem betreffenden Fachbereich existiert bzw. eine Archivierung/Veröffentlichung der Daten innerhalb einer generischen Infrastruktur als sinnvoll angesehen wird.

Zusammenfassend konnten die folgenden Eckpunkte, die den langfristigen Erfolg des RADAR-Projekts sichern sollen, erarbeitet werden:

i) Das angebotene Service- und Geschäftsmodell soll möglichst breit aufgestellt sein, so dass RADAR als Dienstleister wahrgenommen wird und sich möglichst viele Disziplinen in der angebotenen Servicestruktur wiederfinden können.

ii) Eine solide & zuverlässige technische Infrastruktur soll bereitgestellt werden.

iii) Es muss Überzeugsarbeit zusammen mit WissenschaftlerInnen geleistet werden, um „Data-Managment-Policies“ in den Forschungsalltag zu integrieren - diese „Wege in die Köpfe“ werden als die mit schwierigste Aufgabe angesehen. Hierbei soll vor allem der Mehrwert einer Datenpublikation für den Forschenden deutlich werden (z.B. die Verbesserung der wissenschaftlichen Reputation durch eine erhöhte wissenschaftliche Nachnutzbarkeit & Zitierbarkeit von Daten, einschließlich einer besseren Sichtbarkeit durch die Verknüpfung von wissenschaftlichen Aufsätzen mit Datenpublikationen z.B. über die DOI-Vergabe).

iv) Eine gute Vernetzung mit der Bekanntmachung und Etablierung von RADAR als eine nachhaltige Dateninfrastruktur (belegt beispielsweise durch eine entsprechende Zertifizierung) in den wissenschaftlichen Communities.

 

Übersicht zu den Diskussionsrunden:

Nachfolgend finden Sie eine Zusammenfassung der Fragen zu den Kernthemen Datenarchivierung, Datenpublikation, Metadatenschema, Systemarchitektur und Ausblick.

1. Datenarchivierung:

Für welche Forschungsdaten ist der RADAR-Service geeignet?

Grundsätzlich bietet RADAR einen Archivierungs- und Publikationsservice für alle Typen von digitalen Daten an. Im Kontext von RADAR werden unter ‚digitalen wissenschaftlichen Forschungsdaten’ sowohl Rohdaten, Primärdaten (=intermediäre Arbeitsdaten), als auch Ergebnisdaten (=Sekundärdaten) verstanden, die im Rahmen wissenschaftlicher Studien aus Beobachtungen, Experimenten, numerischen Rechnungen, Arbeitsmethoden und Protokollen und bei der Auswertung der vorangegangenen Arbeitsschritte anfallen und digital erfasst werden können.

Wer ist auf lange Sicht für die Daten verantwortlich? Ist dies immer der Datengeber? Darf ein Datengeber Daten, die ggf. persönliche/geheime Informationen beinhalten, überhaupt bei RADAR als Datenarchiv speichern, auch wenn Daten und die dazugehörigen Metadaten nicht öffentlich zugänglich sind? Inwiefern muss sich dazu der Datengeber vorher bei den betroffenen Personen bzw. zuständigen Institutionen/Unternehmen/Behörden absichern? Wird RADAR hierfür in der Zukunft Hilfestellungen anbieten?

Für die Inhalte der Forschungsdaten ist in erster Linie der Datengeber verantwortlich. Dies gilt sowohl für die enthaltenen wissenschaftlichen Erkenntnisse (Beachtung der guten wissenschaftlichen Praxis) als auch für alle weiteren Informationen (Beachtung des Personenschutzes/der Datenschutzrechte).
Als Forschungsdatenarchiv und Dienstleister wird RADAR durch Bitstream Preservation die gesicherte Speicherung der Daten sicherstellen. Dabei wird nicht empfohlen, den RADAR-Service für personenbezogene Daten zu nutzen, da hierfür in den betreffenden Fachbereichen bereits disziplinspezifische Lösungen entwickelt werden bzw. wurden. Für diese Fälle wird es bei RADAR entsprechende Richtlinien und Hinweise geben (z.B. im Rahmen der geplanten AGB und FAQ).
Um potentielle RADAR-Kunden bereits im Rahmen der Projektplanung auf die Sensibilität im Hinblick auf die Speicherung personenbezogener Daten aufmerksam zu machen wird es zusätzliche Hilfestellungen z.B.  in den RADAR-Autorenrichtlinien geben. Dort wird beispielsweise die im Vorfeld eines jeden Forschungsprojekts die Erstellung eines Datenmanagementplans empfohlen, in dem bereits zu Projektbeginn die Frage, ob personenbezogene Daten überhaupt erfasst werden (sollen) thematisiert und innerhalb/zwischen der/den forschenden Einrichtung(en) geklärt werden soll. Damit soll bereits zu Beginn des Forschungsdatenzyklus das Bewusstsein geschärft werden, dass eventuell sensible personenbezogene Daten anfallen können und zeitnah eine Strategie entwickelt werden, wie ggf. innerhalb des Projekts damit umzugehen ist (z.B. die Anonymisierung der Daten vor einer Speicherung in einem Repositorium).

2. Umfang des geplanten Services im Bereich Datenpublikation:

Für welche Daten könnten z.B. Universitätsbibliotheken die geplanten RADAR-Services nutzen?

Universitätsbibliotheken könnten RADAR z.B. nutzen, um die Datengrundlagen zu Dissertationen zu archivieren und wenn gewünscht ganz oder teilweise zu publizieren; im Fall der Publikation könnten dann auf den Landing Pages (Universitätsbibliothek & RADAR) Verlinkungen erfolgen, welche die wissenschaftliche Nachnutzbarkeit & Zitierbarkeit der Dissertation und der zugrundeliegenden Daten erhöht.

Wird RADAR einen Service für Zugriffsbeschränkungen von Forschungsdaten anbieten? Welche Funktionen wird dieser Service umfassen?

Für Forschungsdaten die zeitverzögert publiziert werden sollen wird es im Rahmen des Publikationsservices die Möglichkeit zur Einrichtung eines zeitlichen Embargos geben. Der Embargo-Zeitraum kann durch den Datengeber optional verlängert werden; in diesem Fall sind die Metadaten bereits von Anfang an durchsuchbar, allerdings ist ein Datendownload erst nach Ablauf des Embargodatums möglich.

3. Generisches Metadatenschema:

Wie wird sichergestellt, dass das von RADAR angebotene Metadatenschema komplex genug ist, um den Ansprüchen möglichst vieler und höchst unterschiedlicher Fachdisziplinen zu genügen? Gibt es z.B. eine Möglichkeit, zusätzlich zum angebotenen RADAR-Metadatenschema weitere ggf.  fachspezifische Metadaten anzugeben?

Die im Workshop vorgestellte, erste Version des RADAR-Metadatenschemas basiert auf den Ergebnissen mehrerer Analysen aus den Bereichen aktuell etablierter, generischer Metadatenschemata und disziplinspezifischen Anforderungen aus der angewandten Forschung. WissenschaftlerInnen wird durch eine Kombination von Freitextfeldern und kontrollierten Listen eine möglichst präzise, aber auch flexible Beschreibung der Datenpakete ermöglicht. Die Nutzbarkeit und Anwenderfreundlichkeit des RADAR-Metadatenschemas soll zudem durch konkrete Beispiele für die jeweiligen Fachdisziplinen erleichtert werden. Dazu ist geplant, diese Beispiele mit Start des Testsystems in 2015 gemeinsam mit den Fachdisziplinen zu erarbeiten und zu veröffentlichen. Zusätzlich können fachspezifische Metadaten als Teil des Datenpakets (z.B. in Form einer eigenständigen Datendatei) hinterlegt werden.

4. Geplante Systemarchitektur:

Wird es neben einer Online-Benutzeroberfläche weitere Möglichkeiten z.B. in Form einer anpassbaren Schnittstelle geben, um große Datenmengen bei RADAR zu archivieren/zu publizieren? Auf welcher Ebene bzw. Ingest-Stufe werden Checksums gebildet?

Die Einrichtung eines solchen Services zur individuell anpassbaren bzw. automatisierten Daten- und Metadatenübertragung an RADAR ist bereits ein fester Bestandteil der geplanten Systemarchitektur. Die genaue Struktur dieses Services wird allerdings von der Umsetzung der endgültigen technischen Implementierung abhängen. Zudem ist geplant, dass zur Fehlerkontrolle bereits lokal vor, als auch nach der Übertragung der Daten von der Management- und Speicherschicht Checksums gebildet werden.

5. Ausblick:

Wie kann man sich am Besten über die neusten Entwicklungen im RADAR-Projekt informieren und wie sieht die weitere Planung hierzu aus?

RADAR bietet hierfür folgende Möglichkeiten an:

a) Aktuelle Entwicklungen können über den RADAR-Onlineauftritt im Bereich News verfolgt werden.

b) Zur Vorbereitung des 2. RADAR-Workshops wird eine Einladung die Teilnehmerliste des 1. RADAR Workshops erfolgen.

c) Im Jahr 2015 wird eine RADAR-Testplattform verfügbar sein - diese kann nach vorheriger Rücksprache von interessierten Communities genutzt & evaluiert werden.

 

Als  Projektteam arbeiten wir mit Nachdruck daran, die im Workshop erarbeiteten inhaltlichen und technischen Anforderungen an RADAR & die zugehörigen Diskussionspunkte bei der weiteren Entwicklung der RADAR-Dienstleistungen und des Testsystems zu berücksichtigen. Dazu werden wir im Sommer 2015 den 2. RADAR-Workshop veranstalten, auf dem dann das RADAR-Testsystem präsentiert werden wird. Wir freuen uns schon darauf und hoffen, Sie und weitere Interessenten dort ebenfalls begrüßen zu dürfen. Eine entsprechende Ankündigung wird auf der Homepage und per E-Mail an die Verteilerliste des Workshops erfolgen. Bis dahin stehen wir Ihnen für Fragen & Anregungen selbstverständlich gerne weiterhin zur Verfügung: info@radar-projekt.org

Ihr RADAR-Team



[1] Large-Scale Data Management & Analysis: http://www.helmholtz-lsdma.de

[2] HITS gGmbH - Heidelberger Institut für theoretische Studien, SEEK Tool: http://www.seek4science.org

[3] Deutsche Gesellschaft für Materialkunde e.V. (DGM): www.dgm.de

[4] Georg-Eckert-Institut Leibniz-Institut für internationale Schulbuchforschung: http://www.gei.de/home.html

[5] Georg Thieme Verlag KG: https://www.thieme.de/de/index.htm