Die Kunst der Verschlüsselung
– Sprache, Qualität, Struktur –
Möglichkeiten
medizinischer Terminologie
Daniel Diekmann und André Sander

Die Autoren

Dr. Daniel Diekmann

studierte Humanmedizin an der Charité Berlin und promovierte 2014. Er ist Geschäftsführer der ID GmbH & Co. KGaA sowie Vorsitzender des Verwaltungsrates der ID Suisse AG und der HCG Holding.

Der inhaltliche Schwerpunkt der wissenschaftlichen und wirtschaftlichen Auseinandersetzung Herrn Diekmanns liegen in den Bereichen Codierung, Nomenklaturen, Abrechnung. Zudem hat er zahlreiche Projekte zur Gesundheitskarte, Applikationen für Medikationssicherheit basierend auf klinischen Terminologien sowie internationale Projekte im Umfeld von Krankenhausinformationssystemen und zu Abrechnungssystemen basierend auf klinischen Terminologien umgesetzt.

Dr. André Sander

promovierte an der Charité im Bereich Medizinwissenschaften und beschäftigt sich seit mehr als 25 Jahren mit medizinischen Terminologien und Ontologien. Bei ID Information und Dokumentation ist er als CTO verantwortlich für moderne Softwarearchitekturen, die qualitativ höchsten Standards entsprechen. Seit 2017 ist er zudem Prokurist und Mitglied der Geschäftsführung. Der inhaltliche Schwerpunkt in der wissenschaftlichen und wirtschaftlichen Auseinandersetzung Herrn Sanders liegen in den Bereichen: medizinische Terminologien und Ontologien, semantische Analysen medizinischer Freitexte, Natural Language Processing, Arzneimittel- und Therapiesicherheit, internationale Standards im Gesundheitswesen und skalierbare Terminologieserver.

Die ersten Schritte einer neuen Disziplin

  • Vollautomatische Abbildung und Verarbeitung von Freitexten
  • Terminologie und Ontologie gestützte Analysen
  • Wissen aus nichtcodierten Daten
  • Sektorübergreifende semantische Interoperabilität
  • FHIR basierter Terminologieserver

Dass die Digitalisierung der Gesellschaft auch das Leben der Menschen verändert steht fest. Wie diese Veränderung jedoch erfolgt und mit welchem Grad an Sicherheit, Souveränität und persönlicher Gestaltung diese erfolgt, liegt in den Händen derjenigen, die wissen wie Daten interpretiert werden können. In jeder Klinik und an jedem einzelnen Bett entstehen täglich eine schier unvorstellbare Menge an Daten. Vitalparameter, Diagnosen und Details zur Medikamentengabe sind nur wenige Beispiele für Daten, die regelmäßig, teilweise sogar hochfrequent, erfasst werden. Mit den richtigen Methoden können diese Patientendaten wertvolle Einblicke liefern. Wie schlägt eine Therapie an? Werden sich Komplikationen abzeichnen? Welche Arzneimittel bieten Chancen für eine bessere Prognose?


Viele dieser Fragen können wir heute gut beantworten. Das war aber nicht immer so selbstverständlich, denn sehr lange fehlte es im Gesundheitswesen an geeigneten Werkzeugen für das strukturierte Erfassen und das inhaltliche Auswerten von Patientendaten.


ID beschäftigt sich bereits seit den 80er-Jahren des vergangenen Jahrhunderts damit, wie zunächst die Prozessdaten in den Kliniken aufbereitet und ausgewertet werden konnten. Das leitende Motiv des jungen Berliner Unternehmens, heutzutage ein klassisches Start-up, war es Diagnosen und Prozeduren zu dokumentieren und automatisch in zahlreichen relevanten Klassifikationen abzubilden. Heute implementieren die Berliner mit ihren Produkten ganze medizinische Prozesse und unterstützen das Lesen, Verschlüsseln und Interpretieren von allen in der klinischen Routine anfallenden Daten.


Grundlage aller ID-Entwicklungen ist die Nomenklatur von Friedrich Wingert. Der Mathematiker und Mediziner hatte den Anspruch, den gesamten medizinischen Sprachraum zu ordnen, zu strukturieren und für den klinischen Alltag verfügbar zu machen. Bei der Wingert-Nomenklatur [Wingert 1984] handelt es sich um eine Terminologie und Ontologie, die analog zu SNOMED CT Begriffe enthält, die mit semantischen Relationen verknüpft bzw. beschrieben sind. Die Wurzeln reichen bis in die 1980er-Jahre zurück, als Prof. Wingert eine frühe Version von SNOMED ins Deutsche übertragen und weiterentwickelt hat. Gleichzeitig entwickelte er differenzierte computer-linguistische Algorithmen für die effiziente Indexierung medizinischer Freitexte. Dies bildete die wesentliche Grundlage für eine Entwicklung hin zu den heute verfügbaren Algorithmen, Ontologien und Terminologien.

Neue Erwartungen

Steigende Ansprüche an semantische Standards lassen deutlich erahnen, dass an dieser Stelle kein Ende der Entwicklung zu sehen ist. In der Onkologie werden beispielsweise immer höchst individuelle und genauere Auswertungen erwartet. Ein herausragendes Beispiel dafür ist etwa das Innovationsfondsprojekt iKNOW, in dem professionell mit anderen existierenden Quellen, genetische Informationen und Stammbäum zusammengeführt werden Die qualitativen Anforderungen steigen dabei gleichzeitig mit den quantitativen, denn das Volumen der bei jedem Behandlungsfall erhobenen Daten wächst nicht linear, sondern exponenziell [Sieland 2020]. Im Sinne möglichst zielgenauer Therapien werden Tumore in der Onkologie heute typischerweise sequenziert. Dabei entstehen äußerst umfangreiche Datenreihen, die für eine reibungslose Auswertung entsprechend semantisch aufbereitet werden müssen.


Letztlich dient eine verbesserte und vollständigere Dokumentation, die auf diesem Weg forciert wird, allen Beteiligten, insbesondere aber dem Patienten-Outcome. Auch wenn das Codieren z. B. durch das Ausfüllen von Formularen oft zunächst bürokratisch wirkt, sind die Mühen alles andere als umsonst. In einem seit mehr als fünf Jahren laufenden Projekt zur integrierten Versorgung von Herzinsuffizienz-Patienten zeigt sich, dass sowohl die Mortalität als auch die Wahrscheinlichkeit einer Krankenhauseinweisung und somit auch die damit verbundenen Kosten signifikant reduziert werden konnten. Dazu leistet eine spezielle App zur Datenerfassung, die in eine SAP-Rahmenumgebung eingebunden ist, einen wichtigen Beitrag.


Die Bedeutung einer leistungsfähigen Codierung hat uns nicht zuletzt die COVID-19-Pandemie vor Augen geführt. Auch in diesem Kontext ist eine differenzierte Betrachtung einzelner Patienten wie auch einzelner Kohorten elementar. Dafür wurden erneut Daten aus unterschiedlichen Quellen strukturiert und zusammengefügt. Auch in der frühen Phase der Pandemie wurden algorithmische Ansätze benutzt, um zu prüfen, welche Therapieansätze funktionieren und welche nicht.


Diese Beispiele belegen, dass steigende Ansprüche an semantische Standards zu konkreten Verbesserungen für Patienten führen. In der Routineversorgung zeichnen sich darüber hinaus drei Trends ab, in denen hochwertige Codierungsstandards eine Schlüsselrolle einnehmen.

Anwendungsbereiche für semantische Standards

Clinical Decision Support

Dass Patientendaten einen Beitrag zu einer besseren Versorgung leisten können, ist längst zur Binsenweisheit geworden. Allerdings klafft hier noch viel zu oft eine Lücke zwischen Theorie und klinischem Alltag. Damit klinische Daten einen größeren Beitrag zur Heilung von Patienten leisten können, müssen fragmentierte und unstrukturierte Informationen zunächst geordnet werden. Nur wenn dem behandelnden Arzt Informationen in strukturierter Form zur Verfügung, können diese effektiv zu besseren Entscheidungen führen. Die vorherrschende, abrechnungsfokussierte Codierung ist dafür nicht ausreichend geeignet. Stattdessen sind spezielle Systeme zur klinischen Entscheidungsunterstützung, sogenannte Clinical Decision Support Systems (CDSS) gefragt. Heute basieren CDSS auf Terminologie-Server, die Wissen aus umfangreichen Ontologien zur Verfügung stellen.


Moderne CDSS können somit beispielsweise unterschiedliche Informationsquellen für Diagnosen, Medikamente und Laborwerte miteinander verknüpfen, um in einem individuellen Fall Medikationsrisiken abzuschätzen. Solche intelligenten Softwaremodule haben das Potenzial, die Arzneimittelsicherheit und darüber hinaus die Behandlungsqualität erheblich zu verbessern. Möglich ist das, indem bereits vorliegende Informationen anhand semantischer Standards strukturiert und mit Datenbanken abgeglichen werden.

Routinedaten für die Forschung

Medizinische Daten wurden im Krankenhaus bis vor kurzem stark aus medikolegaler Sicht und im Sinne einer nicht zu Ende gedachten, weil disjunkten, externen Qualitätssicherung und Abrechnung betrachtet. Nur vereinzelt wurden Daten – ob strukturiert oder unstrukturiert – als wertvolle Grundlage für klinisches Handeln im Alltag wahrgenommen. Klinische Forschungsdaten werden zwar in hoher Qualität erhoben, allerdings geschieht dies in der Regel nach wie vor separat vom klinischen Alltag. Die Folge sind redundante Dokumentationen, die oftmals in nicht interoperablen Formaten archiviert werden. Ob diese Unterlagen nach erfolgter Abrechnung jemals wieder genutzt werden (können), ist weder klar noch klar geregelt. In den letzten Jahren haben sich unter anderem aus diesem Grund die Universitätskliniken in der Medizininformatikinitiative (MII) zusammengeschlossen.


Innerhalb der MII und mithilfe zusätzlicher Praxispartnern wurden Konsortien gebildet, die Konzepte für thematische Schwerpunkte wie die Arzneimittelsicherheit, seltene Erkrankungen und Sepsis entwickeln. Damit ist eine Diskussion um die hier zu verwendenden Standards verbunden, die Ansätze wie FHIR oder die darauf aufbauenden MIOs deutschlandweit vorangebracht hat. Außerdem hat sich die MII schon vor dem bundesweiten Rollout intensiv mit SNOMED CT und anderen Terminologien auseinandergesetzt (SNOMED International 2020. Online unter http://www.snomed.org/). Die Verknüpfung von Routine- und Forschungsdaten wird hierbei ambitioniert vorangetrieben und mit nicht unerheblichen finanziellen Mitteln gefördert.

Abb. 1 Wissenschaftliche und klinische Nutzung von Routinedaten am Beispiel von DaWiMed

Freitextanalyse

Arztbriefe, Befunde, OP-Berichte und ähnliche medizinische Freitexte enthalten enorm viele wertvolle Datenpunkte. Eine IT-basierte semantische Analyse dieser Schriftstücke in der klinischen Routine ist nach wie vor eine komplexe Aufgabe. Immerhin erreichen moderne Tools inzwischen Erkennungsquoten von deutlich über 90 %. Die Weiterentwicklung der Analysewerkzeuge wird allerdings durch strenge Datenschutzauflagen erschwert, insbesondere in Deutschland. Aufgrund ihres hohen Nutzens wird die Freitextanalyse dennoch einen wichtigen Baustein darstellen. Verstärkt wird der Nutzen entsprechender Software durch eine Kombination mit Spracherkennungslösungen. Neben geschriebenen können damit auch gesprochene Texte in Echtzeit systematisiert und strukturiert werden.


Werkzeuge wie diese können eingebettet in bestehende Strukturen erhebliche Mehrwerte für den klinischen Alltag, die Forschung und die Abrechnung bieten. Die Qualität der medizinischen Dokumentation profitiert davon in hohem Maße, was schließlich auch die Abrechnungssicherheit begünstigt.

Abb. 2 Belegstellenanalyse in ID clinical context coding

Krankenhäuser müssen sich grundlegend neu aufstellen

Bis vor wenigen Jahren war nicht nur die Krankenhaus- und Gesundheits-IT, sondern auch die medizinisch angewandte Computerlinguistik ein Nischenfach im Klinikbetrieb. Das hat sich inzwischen radikal gewandelt. Diskussionen um semantische Interoperabilität, internationale Standards oder Digitalisierungsstrategien sind mittlerweile Teil des klinischen Alltags. Allen Beteiligten ist bewusst, dass das Krankenhaus der Zukunft Prozesse digital abbilden muss, um weiterhin knappe Personal- und Finanzressourcen bestmöglich einzusetzen. IT-Systeme, die medizinische Inhalte tatsächlich verstehen, nutzen und verarbeiten, werden unabdingbar. Ob intelligente Apps, Dokumentationsanwendungen, Decision Support oder Machine-Learning-basierte-Lösungen – auf vielen Wegen und in allen Bereichen wird die semantische Interoperabilität stark an Bedeutung gewinnen. Zu erwarten ist außerdem, dass der Gesetzgeber, der Konkurrenzdruck und die Patienten mittelfristig selbst bessere Standards einfordern oder erzwingen werden. Allerdings muss das Thema nicht als reine Bringschuld betrachtet werden, denn hohe semantische Standards sind im eigenen Interesse jedes Krankenhauses. Dafür spricht nicht zuletzt der finanzielle Return on Investment (ROI) besser strukturierter und messbarer Prozesse. Die Debatten um Value-Based Healthcare (VBH) und Patient-Reported Outcome Measures (PROMs) verschaffen diesem Thema zusätzliche Relevanz.


Die digitale Transformation des kompletten Klinikbetriebes mit intelligenter Verknüpfung von Gesundheitsdaten und medizinischen Fachdaten durch lernende Computersysteme ist die strategische Vision für moderne Kliniken. Krankenhäuser, die sich auf den Weg zum sogenannten Smart Hospital begeben, wissen, dass die Umstellung zu einer datengetriebenen Organisation eine umfassende Neuausrichtung bedeutet. Kliniken müssen dafür ihre aktuellen IT-Konzepte und klinischen Prozesse an gewandelte und neue Herausforderungen anpassen. Neben der Akzeptanz einer neuen datenfokussierten Denkweise ist ein entsprechendes Konzept für reibungslose Datenflüsse notwendig.


Unumgänglich sind in diesem Zusammenhang auch erhebliche finanzielle Summen, die in zusätzliche und bessere IT-Strukturen investiert werden können. Möglich wird das nicht zuletzt durch das Krankenhauszukunftsgesetz (KHZG), das Krankenhäuser jeder Größe und Finanzausstattung in die Lage versetzt, Investitionen in digitale Prozesse zu stemmen.
Es gilt, eine Dateninfrastruktur zu schaffen, die Ärzten und Pflegenden einen deutlichen Zugewinn an Vollständigkeit, Komfort, Sicherheit und Performance bieten kann. Die Health-IT-Lösungen der Zukunft werden überwiegend Medizinprodukte sein. Das Wohlergehen der Patienten und die Effizienz der Behandlung werden mehr und mehr von der Wirksamkeit und Qualität dieser Systeme abhängen. Ohne semantische Standards wird das nicht realisierbar sein.

Ein Standard, eine Lösung?

Jedes Gesundheitssystem verwendet eine Vielzahl von offiziellen Standards und noch mehr proprietären Lösungen für die Dokumentation, Warenwirtschaft oder Abrechnung. Sowohl im ambulanten als auch im stationären Sektor kommen nach wie vor etliche Formate zum Einsatz, die nicht miteinander kompatibel sind. Zu unterschiedlich sind die individuellen Ansprüche ihrer Nutzer und daher auch die jeweiligen Spezifikationen. Daran wird auch eine funktionierende Telematikinfrastruktur wenig ändern.


Wie schwierig es ist, diesen unbefriedigenden Status quo zu überwinden zeigen die langwierigen Diskussionen um Projekte wie den einheitlichen Medikationsplan. Dabei spielen nicht nur die reinen Austauschformate eine Rolle, sondern auch semantische Interoperabilität mittels geeigneter Codierungen. Obwohl ein breiter Konsens zur Notwendigkeit besteht, bleibt das Definieren dieser einheitlichen Codierungen eine anspruchsvolle und herausfordernde Aufgabe. Das gilt insbesondere wegen der unterschiedlichen Ausgangsgrundlagen und praktischen Bedürfnisse der jeweiligen Nutzgruppen. Dabei wird so viel Geschick gefragt, dass sich wohl mit Fug und Recht behaupten lässt: Die Verschlüsselung ist eine Kunst!


Auch in Zukunft wird es deshalb nicht einen einzigen Standard geben, der allen Anforderungen gleichermaßen gerecht wird. Dennoch ist es lohnend, dass Standards wie Terminologien, Klassifikationen oder Ontologien weiterentwickelt werden, um Datensilos zu überwinden und bessere Auswertungen zu ermöglichen. Dabei werden verstärkt Terminologie-Server Anwendung finden, ebenso wie datenschutzkonforme Machine-Learning-Konzepte. Das Potenzial der Verschlüsselung ist also bei weitem noch nicht ausgeschöpft und die spannendsten Themen liegen noch vor uns. So würden das sicher auch die frühen Meister der Codierung sehen [Sander 2020].

Literatur

Sieland M (2020) So macht 5G die Medizin fit. Online unter: https://dub-magazin.de/digitalisierung/so-macht-5g-die-medizin-fit/ (zuletzt abgerufen am 05.08.2021)


Sander A (2020) SNOMED CT – Erlösung oder Herausforderung? Edition – Fachzeitschrift für Terminologie 2/2020, S. 13–21


Wingert F (1984) SNOMED – Systematisierte Nomenklatur der Medizin: Band 1: Numerischer Index. Springer-Verlag Berlin, Heidelberg, New York, Tokyo