Das Data Element Hub (DEHub) ist ein zentraler Einstiegspunkt für menschliche Nutzer und Maschinen zur Speicherung, Verwaltung und Abfrage von Datenelementspezifikationen. Im DEHub ist eine Datenelementspezifikation ein Satz von Metadatenattributen, die die Struktur und Bedeutung eines Datenelements beschreiben, hauptsächlich gemäß ISO 11179 Ed. 3 Teil 3. Diese Metadaten helfen im Allgemeinen den Kunden, syntaktische und semantische Interoperabilität zwischen Datenquellen unterschiedlicher Struktur und Formalisierung zu erreichen. DEHub ist ein Metadatenrepository oder -register (MDR). DEHub als MDR hält jedoch speziell Metadaten über Datenelemente vor. Diese Feststellung ist wichtig, um die Ziele von DEHub und seine Eigenschaften als spezialisierte MDR-Implementierung zu verstehen.
DEHub ist eine Teilimplementierung von ISO 11179-3 und ISO 21526 und konzentriert sich auf Anwendungsfälle im Gesundheitswesen und in der medizinischen Forschung. Das DEHub ist als zentrale Komponente gedacht, die flexibel für unterschiedliche Anwendungsszenarien eingesetzt werden kann, aber dennoch die Anforderungen an eine strukturierte und qualitätsgesicherte Sammlung von Metadaten erfüllt. Die Implementierung ist eine RESTful-Webanwendung mit strikter Trennung von Frontend und Backend, was sowohl die Integration in bestehende IT-Infrastrukturen als auch die Erweiterung um zusätzliche Funktionalitäten erleichtert. Darüber hinaus können Stakeholder (z.B. Kliniker, Forscher, Domänenexperten, Datenmanager, Datenwissenschaftler, …) spezifische Benutzeroberflächen gestaltet werden. DEHub basiert auf verschiedenen Erfahrungen und bisherigen Implementierungen im Rahmen von medizinischen Verbundprojekten.
Im DEHub können Benutzer Datenelementspezifikationen entsprechend ihren Bedürfnissen im Kontext eines bestimmten Anwendungsfalls erstellen. Darüber hinaus können sie diese Datenelementspezifikationen über ihren gesamten Lebenszyklus hinweg verwalten. Dazu gehört auch die Definition von Beziehungen zwischen Datenelementspezifikationen, was Datenmodellierungsaufgaben unterstützt. DEHub unterstützt den gesamten Management Workflow mit einem geeigneten Tooling. Da an der Verwaltung von Datenelementspezifikationen in der Regel mehrere Akteure mit unterschiedlichem Fachwissen beteiligt sind, fällt insbesondere die Zusammenarbeit zwischen ihnen in den Funktionsumfang von DEHub. Dazu gehört auch die Durchsetzung von Governance- und Qualitätssicherungsprozessen.
Die im DEHub gespeicherten Metadaten tragen dazu bei, dass die Datenelementspezifikationen und damit die jeweiligen Datensammlungen auch für Dritte langfristig zugänglich sind. Dem Gedanken von Open Metadata folgend, fördert DEHub die Zusammenarbeit durch Transparenz und Sichtbarkeit von Datensammlungen, indem es die gemeinsame Nutzung von Metadaten ermöglicht, ohne die Daten selbst offenzulegen und somit die Datenhoheit zu wahren. Darüber hinaus könnten bereits vorhandene Spezifikationen für Datenelemente von anderen wiederverwendet werden, anstatt dass diese immer wieder dieselbe Darstellung für Informationen angeben müssen. Sie können es auch Dritten ermöglichen, eine Datensammlung richtig zu interpretieren, indem sie herkunftsrelevante Informationen sowohl für Metadaten als auch für Instanzdaten dokumentieren, was schließlich die Reproduzierbarkeit der Forschung erleichtert. Schließlich ist dies ein wichtiger Schritt hin zu FAIRen Daten.
Die im DEHub gespeicherten Datenelementspezifikationen decken eine Vielzahl unterschiedlicher Anwendungsfälle ab, wobei die folgende Liste als beispielhaft zu verstehen ist. Betrachtet man den Prozess der Datenerhebung selbst, so ist es oft notwendig, ein (elektronisches) Datenerfassungsinstrument zu entwerfen, z.B. ein papierbasiertes oder elektronisches Formular. Solche Formulare enthalten im Wesentlichen Datenelemente, die ausgefüllt und die Eingaben validiert werden müssen. Die für die Validierung der Eingabe erforderlichen Informationen, z. B. ob eine Zahl erwartet wird oder ein Element aus einer Liste auszuwählen ist, können von einer Datenelementspezifikation abweichen. Später kann jemand, der bestimmte Daten benötigt, die Datenelementspezifikationen verwenden, um eine qualifizierte Anfrage zu formulieren und die gewünschten Daten anzufordern. Wenn die gesammelten Daten mit anderen geteilt werden sollen, ist der Satz von Datenelementspezifikationen das sogenannte Datenwörterbuch, das hilft, die Daten richtig zu verstehen und zu interpretieren. Schließlich können Datenelemente die Gestaltung von ETL-Prozessen unterstützen, einem wichtigen Schritt bei der Integration von Daten aus verschiedenen Quellen.
Der Quellcode ist unter der AGPLv3-Lizenz veröffentlicht und öffentlich zugänglich. Die Entwicklung wird von der Gemeinschaft vorangetrieben und steht jedem offen, der Interesse an diesem Bereich hat.