Digitale Formate für Forschungsdaten

Blog 25. Januar 2024

Im Zeitalter von „Big Data“ ist die Diskussion über eine transparente Wissenschaftskommunikation und strukturierte Visualisierung von Daten essentiell. Im Bereich der Wissenschaften geht es zum einen um das Sammeln, Aufbereiten und die Bereitstellung der Forschungsdaten nach den FAIR Prinzipien. Zum anderen ist die Extraktion von neuem Wissen aus den vorhandenen Daten ein wachsendes Feld auch „Data Science“ genannt.

Im Nachstehenden möchte ich diese Themen aus der Sicht einer Kommunikationsdesignerin differenziert betrachten. Seit einigen Jahren arbeite ich mit wissenschaftlichen Institutionen wie der Humboldt-Universität zu Berlin und dem Deutschen Archäologischen Institut, an Projekten zur Verbesserung der visuellen Kommunikation von Forschungsdaten. Mit Kommunikation ist hier die Analyse, Strukturierung und Gestaltung von Formaten und Systemen gemeint, welche Daten zur Verfügung stellen oder sie verarbeiten. Immer mit dem Ziel möglichst viele Nutzer für die Forschungsdaten zu erreichen.

Warum Daten zur Verfügung stellen?

Wissenschaftler*innen sind darauf angewiesen ihre Arbeit zu publizieren. Vor allem um innerhalb der Community als Urheber wahrgenommen zu werden und fachliche Diskussionen und Kooperationen anzuregen. Letztendlich entwickelt sich Wissenschaft evolutiv, Wissen erzeugt neues Wissen, es wird zitiert und weiterentwickelt. Inzwischen wird in vielen Wissenschaften digital gearbeitet und die weltweite Vernetzung von Daten spielt eine große Rolle. Heute geht man davon aus, dass auch die Einzelteile einer Publikation, also Texte, Bilder, Zahlen/Statistiken, Referenzen, 3D Animationen, etc. als selbständige Publikation zur Verfügung gestellt werden. All diese Einzelteile bestehen aus unterschiedlichen Datenformaten. Man könnte sagen, auch Daten können publiziert werden. Sie unterliegen natürlich einem Regelwerk, Urheberschutz und Standards wie jede traditionelle Publikation auch. Aus einzelnen Daten oder Datengruppen können zahlreiche neue wissenschaftliche Erkenntnisse gezogen werden. Je besser wir vergangenes Wissen verstehen, desto bewusster können wir zukünftige Entscheidungen treffen.

Für wen?

Die wissenschaftliche Community ist groß, hier muss deutlich unterschieden werden, wer die Daten in welcher Weise benutzt. Um Daten für den User in höchster Qualität (Nutzbarkeit) zur Verfügung zu stellen, ist der gesamte Datenlebenszyklus zu betrachten. Ich unterscheide in drei Gruppen: Daten Sammler*in (Provider), Daten Verwalter*in (Supplier) und Daten Nutzer*in (User). Im Enddefekt nutzen sie alle Daten aber auf unterschiedliche Art und ein Provider kann gleichzeitig auch ein Supplier oder User sein.

Um Forschungsdaten zu veröffentlichen ist es im Interesse des Providers dass die Daten gut aufgehoben sind, von Usern gefunden und richtig zitiert werden. Dafür sollten beim erheben der Daten alle Metadaten und Informationen zu den Forschungsdaten festgehalten werden.

Ein Supplier verwaltet Forschungsdaten indem er Strukturen und Systeme entwickelt, die diese Daten archivieren und publizieren, auch Repositorien genannt. Es gibt unterschiedliche Repositorien für verschiedene Fachgebiete. Je differenzierter die Metadaten, desto vielfältiger kann hier mit den Daten gearbeitet werden. Informationen über technischen Parameter, geographische Koordinaten, Bildtitel und Beschreibung, Kategorien und Suchbegriffe, Autor bzw. Urheber, Lizenzgeber, DOIs, etc. machen die Daten vielfältig nutzbar aber vor allem langfristig identifizierbar.

Die Gruppe der User sind am schwierigsten zu definieren. Sie arbeiten mit Daten auf nicht vorhersehbare Weise. Das sieht man zum Beispiel am Suchverhalten von Usern. Daten werden entweder ganz gezielt gesucht oder per Zufall über Umwege gefunden. Hierbei spielt die Verschlagwortung und Vernetzung der Forschungsdaten eine große Rolle. Um also die höchste Nutzbarkeit der Daten zu gewährleisten, sollten diese so informativ und transparent wie möglich zur Verfügung stehen.

Wie Forschungsdaten einbinden?

Nichts ist schlimmer als dass es viele interessante Forschungsdaten gibt, aber keiner weiß davon. Dafür werden immer mehr gezielt wissenschaftliche Formate oder Systeme entwickelt, die sich thematisch an Zielgruppen richten und selbst so interaktiv sind, dass User konkret mit den Daten arbeiten können. Daten sind verlinkt mit ihren Repositorien und zusätzlich vernetzt mit zum Beispiel Geoservern, 3D Animationen, Autoren oder weiteren online Publikationen. Um diese neuen Publikationsformate einer großen Zielgruppe zur Verfügung zu stellen, sind sie online in den üblichen Browsern aufrufbar.

Wissenschaft visuell kommunizieren

Sich all diese Schritte zu verdeutlichen, dient dazu visuelle Strategien für die Kommunikation zu entwickeln oder zu optimieren. Eine enge Zusammenarbeit von Wissenschaft, IT und Design hat sich für die Entwicklung neuer Formate bewährt. Die inhaltliche und technische Struktur der Einzelbausteine ist auch für dessen Visualisierung bedeutend. Angefangen bei der Visualisierung von Metadaten über Webportale und Suchoberflächen oder dem Corporate Design von neuen Publikationsformaten. Die visuelle Kommunikation beeinflusst die Nutzung dieser Formate enorm. Besonders wenn es um neue Formate geht und Nutzer erst gewonnen werden müssen. Neben der reinen Informationsvermittlung geht es auch darum, die Vielfalt der Forschungsdaten zu zeigen, aufmerksam zu machen, anzuregen und aufzuklären.

Projekte dazu >> Archäologischer Anzeiger und >> Edition Topoi