ein nicht-monotones regelbasiertes system zur maschinellen ... · auslassungen (fraktur von humerus...
TRANSCRIPT
H.R. Straub / 4. April 2011 Nicht-monotones System
Ein nicht-monotones regelbasiertes System
zur maschinellen Diagnosekodierung
und sein Weg zum
kommerziellen Produkt
Hans Rudolf Straub Semfinder AG
H.R. Straub / 4. April 2011 Nicht-monotones System
1980 Medizinisches Staatsexamen in Bern ab 1986 Arbeit als Medizininformatiker ab 1989 Automatisierte Diagnosekodierung 1999 Firmengründung Semfinder AG Kreuzlingen, Schweiz Produkt: Semantische Kodiersoftware 2011 350 Krankenhäuser in DE / CH
www.semfinder.com
Hans Rudolf Straub / Semfinder AG
H.R. Straub / 4. April 2011 Nicht-monotones System
Diagnosekodierung
- Herausforderungen - Kodierung über semantische Modellierung
Komplexe Begriffsmodellierung
- Komposite Repräsentation - Architektur der Binnenstruktur
Kontrollierbarer Interpretationsprozess
- Non-Monotonie - Chronologiekontrolle
Der Weg zum kommerziellen Produkt
H.R. Straub / 4. April 2011 Nicht-monotones System
Realität
Text
KODE I49.3
Diagnose-Kodierung 1982 / 1989
?
H.R. Straub / 4. April 2011 Nicht-monotones System
Risswunde ... Messerstich ... Bisswunde ... Tiefer Riss ... Klaffende Verletzung ... Platzwunde ... Schnittwunde ... Stichwunde ... Offene Verletzung ...
... frisch ... schwer ... rechts ...
... ausgedehnt ... zerfranst
... ausgeschlossen ...
... Folge einer ...
S81.0 Offene Wunde des Knies
... Knie
... parapatellar
... Fossa poplitea
... neben der Kniescheibe
1. Problem: Kombinatorische Explosion
H.R. Straub / 4. April 2011 Nicht-monotones System
50 Formulierungen für offene Wunde × 10 Formulierungen für Knie × 10 x 20 × 20 Ausschmückungen = 2'000'000 Formulierungen für S81.0 × 13'000 Kodes = 26 Mrd. Formulierungen
Aufzählung möglich? Wartung möglich?
1. Problem: Kombinatorische Explosion
H.R. Straub / 4. April 2011 Nicht-monotones System
Infekte Neoplasien Kreislauf Atmung Geburt Symptome Unfälle ... ... ... ...
In der Realität überschneiden sich die hierarchischen Kategorien Streptokokken-Pneumonie
2. Problem: Komplexität
Kapitel der ICD-10
H.R. Straub / 4. April 2011 Nicht-monotones System
Überschneidungen (iatrogene Staphylokokken-Pneumonie)
Mehrdeutigkeiten (Kopf, Blase)
Negation (nicht insulinpflichtiger Diabetes ohne Kompl.)
Nicht-Information (Diabetes, n.n.b.)
Implikationen (Radius Knochen, Unterarm)
Auslassungen (Fraktur von Humerus und Radius)
Mehrfachdiagnosen mit gegenseitigem Einfluss:
Kreuz-Stern, komplexe Inklusiva und Exklusiva
Heterogene Eingaben grippaler Infekt, Grippe
Verstümmelte Eingaben Blinddarm
2. Problem: Komplexität
H.R. Straub / 4. April 2011 Nicht-monotones System
Die voll automatisierte Diagnosekodierung stellt Ansprüche: Sehr komplexe Ontologie Heterogene und z.T. verstümmelte Eingaben
Keine falschen Kodes toleriert
keine falsch positiven Resultate toleriert (im Gegensatz zu Data-Mining) Reproduzierbarkeit Qualitätskontrolle Wartbarkeit (moving Target ICD)
2. Problem: Komplexität
H.R. Straub / 4. April 2011 Nicht-monotones System
Komplexität: Modell und Realität
Embedding des Modells in die Realität
Aussage
a Klassische Logik
Konsistentes Modell
Aussage
b
H.R. Straub / 4. April 2011 Nicht-monotones System
Komplexität: Modell und Realität
Embedding des Modells in die Realität
Aussage
a Klassische Logik
Konsistentes Modell
Aussage
b
Ist das Modell vollständig?
Ist das Embedding in die Realität korrekt?
H.R. Straub / 4. April 2011 Nicht-monotones System
Nominalphrase Myokardinfarkt
Kode I21.9
1 Vorschlag Interpretation
interne komposite
Repräsentation
Semantik
Kodierung über semantische Modellierung
H.R. Straub / 4. April 2011 Nicht-monotones System
Freitext-Eingabe: "offene Extensionsfraktur des distalen linken Radius"
Repräsentation der einzelnen Wörter im Interpreter
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
Erster Schritt "Fraktur" wird zur Diagnose = Semantisierung
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
Zweiter Schritt Attribute aus Input werden erkannt und verknüpft = semantische Verknüpfung
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
Implizite Information "Knochen" (im Inputtext nicht erwähnt) wird durch das System geschlossen
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
2 Moleküle werden verbunden
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
+ Kodierung (Inferenzmaschine)
Aus Wörtern wird Bedeutung
H.R. Straub / 4. April 2011 Nicht-monotones System
Diagnosekodierung
- Herausforderungen - Kodierung über semantische Modellierung
Komplexe Begriffsmodellierung
- Komposite Repräsentation - Architektur der Binnenstruktur
Kontrollierbarer Interpretationsprozess
- Non-Monotonie - Chronologiekontrolle
Der Weg zum kommerziellen Produkt
H.R. Straub / 4. April 2011 Nicht-monotones System
Prinzipien der gewählten Begriffsrepräsentation
Komposite Begriffsdarstellung
Innere Strukturierung entlang semantischer
Achsen
+
H.R. Straub / 4. April 2011 Nicht-monotones System
Warum komposite Begriffsdarstellung?
Aufzählung - Vokabulare, Thesauren, etc.
- viele Einträge, wenig Struktur
Komposite Struktur - wenige Atome, viele "Moleküle"
- Relationen und Binnenstruktur werden mit dargestellt
H.R. Straub / 4. April 2011 Nicht-monotones System
Warum komposite Begriffsdarstellung?
Aufzählung - Vokabulare, Thesauren, etc.
- viele Einträge, wenig Struktur
Komposite Struktur - wenige Atome, viele "Moleküle"
- Relationen und Binnenstruktur werden mit dargestellt
Die komposite Darstellung betrifft konsequent alles:
Daten, Begriffe, Regeln (T-Box und A-Box)
H.R. Straub / 4. April 2011 Nicht-monotones System
Warum komposite Begriffsdarstellung?
Aufzählung - Vokabulare, Thesauren, etc.
- viele Einträge, wenig Struktur
Komposite Struktur - wenige Atome, viele "Moleküle"
- Relationen werden mit dargestellt
Vorteile - relativ wenige Elemente (Atome) ergeben
viele Begriffe (exponentielle Relation) - Atome des einen Begriffs können im anderen wieder verwendet werden - Darstellung auch impliziter Inhalte - Abfrage auch impliziter Inhalte - innere Strukturierung der Begriffe transparent
H.R. Straub / 4. April 2011 Nicht-monotones System
Warum komposite Begriffsdarstellung?
Aufzählung - Vokabulare, Thesauren, etc.
- viele Einträge, wenig Struktur
Komposite Struktur - wenige Atome, viele "Moleküle"
- Relationen werden mit dargestellt
Vorteile - relativ wenige Elemente (Atome) ergeben
viele Begriffe (exponentielle Relation) - Atome des einen Begriffs können im anderen wieder verwendet werden - Darstellung auch impliziter Inhalte - Abfrage auch impliziter Inhalte - innere Strukturierung der Begriffe transparent
Semant. Interop.?
H.R. Straub / 4. April 2011 Nicht-monotones System
Begriffs-Binnenstruktur Architekturen
1. (Mono)-Hierarchisch
2. Multidimensional
3. Multifokal
H.R. Straub / 4. April 2011 Nicht-monotones System
Säugetiere Fische
Wirbeltiere Wirbellose
Tiere
Zeit
Systematik der Zoologie
Elephanten Katzen
Vögel
Das Ideal der Hierarchie
H.R. Straub / 4. April 2011 Nicht-monotones System
Virusinfekt Hyperthyreosebakt. Infekt Diabetes mellitus
Infektion Stoffwechselkrankheit
Krankheit
Granula
rität
Information
1 Baum = 1 Dimension = 1 Freiheitsgrad
H.R. Straub / 4. April 2011 Nicht-monotones System
2 Hierarchies
Organ
Resp. Organ Alimentary Organ
Pathogene
Bacterium
Virus
2 Choices 2 Degrees of freedom
Pathogenes
Organs
Multidimensionale Architektur
2 Bäume = 2 Freiheitsgrade Organ
Atmungsorgan Verdauungsorgan
Erreger
Bakterium
Virus
2 Bäume
Erreger
Organ
H.R. Straub / 4. April 2011 Nicht-monotones System
Gekapselte Achsen multifokale Architektur
Fokus
Pathogenese Organ Lokalisation
Certainty
Pathologie Wurzel-Fokus
z.B. Fraktur
H.R. Straub / 4. April 2011 Nicht-monotones System
Freiheitsgrade des Fokus Fraktur
- Hautbarriere offen / geschlossen - Gelenkbeteiligung intraartikulär / extraartikulär - Position disloziert / nicht disloziert - Fragmentierung unfragmentiert / mehrere Fragmente / Splitter - Stabilität stabil / instabil - Richtung quer / längs - Ursache traumatisch / Tumor / Osteoporose - Nervenbeteiligung ja / nein - Arterienbeteiligung ja / nein - Knochen Radius / Ulna / Humerus / Femur ...
Semantische Achse (Typ) Mögliche Punkte auf der Achse (Werte)
H.R. Straub / 4. April 2011 Nicht-monotones System
2 Fokusse kombiniert
Hautbarriere: offen
Fragmentierung: Mehrfragment
Position: nicht disloziert
Gelenkbeteiligung: extraartikulär
Organ: Radius
Lokalisation: distaler Unterarm
Aktualität: frisch
Gewissheit: radiologisch nachgewiesen
Diagnose Fraktur
H.R. Straub / 4. April 2011 Nicht-monotones System
Zwischengefügter Fokus
Is a Is a
Verkehrsunfall
Diagnose Verletzung Fraktur
offen
Mehrfragment
nicht disloziert
extraartikulär
Radius
distaler Unterarm
frisch
radiologisch nachgewiesen
Alle Generationen bleiben sichtbar OOP
H.R. Straub / 4. April 2011 Nicht-monotones System
Strukturiertes Begriffsmolekül
Diagnose Verletzung
offen
extraartikulär
Mehrfragment
nicht disloziert
Verkehrsunfall
Radius
Fraktur
Knochen
Unterarm
distal
frisch
nachgewiesen radiologisch nachgewiesen
H.R. Straub / 4. April 2011 Nicht-monotones System
Strukturiertes Begriffsmolekül
Diagnose Verletzung
offen
extraartikulär
Mehrfragment
nicht disloziert
Verkehrsunfall
Radius
Fraktur
Knochen
Unterarm
distal
frisch
nachgewiesen radiologisch nachgewiesen
Pseudobaum
H.R. Straub / 4. April 2011 Nicht-monotones System
Strukturiertes Begriffsmolekül
Diagnose Verletzung
offen
extraartikulär
Mehrfragment
nicht disloziert
Verkehrsunfall
Radius
Fraktur
Knochen
Unterarm
distal
frisch
nachgewiesen radiologisch nachgewiesen
Readability
Man & Machine
H.R. Straub / 4. April 2011 Nicht-monotones System
Kodierresultat
Freitexteingabe: "E. coli Zystitis"
H.R. Straub / 4. April 2011 Nicht-monotones System
Diagnosekodierung
- Herausforderungen - Kodierung über semantische Modellierung
Komplexe Begriffsmodellierung
- Komposite Repräsentation - Architektur der Binnenstruktur
Kontrollierbarer Interpretationsprozess
- Non-Monotonie - Chronologiekontrolle
Der Weg zum kommerziellen Produkt
H.R. Straub / 4. April 2011 Nicht-monotones System
.
. . .
.
.
. . . . . .
. . . .
. .
. .
. .
. .
. . . . . . .
. . .
.
.
.
.
. . .
.
. .
. .
. . . .
.
. .
Realität
Selektion der Information wird
vom Ziel bestimmt
Interpretation
Wahrnehmung des
Arztes
Terminologie
Klassifikationen
Auswertungen
Realität Patient
Warum Non-Monotonic Reasoning?
H.R. Straub / 4. April 2011 Nicht-monotones System
Überschneidungen (iatrogene Staphylokokken-Pneumonie)
Mehrdeutigkeiten (Kopf, Blase)
Negation (nicht insulinpflichtiger Diabetes ohne Kompl.)
Nicht-Information (Diabetes, n.n.b.)
Implikationen (Radius Knochen, Unterarm)
Auslassungen (Fraktur von Humerus und Radius)
Mehrfachdiagnosen mit gegenseitigem Einfluss:
Kreuz-Stern, komplexe Inklusiva und Exklusiva
Heterogene Inputs grippaler Infekt, Grippe
Verstümmelte Inputs Blinddarm
2. Problem: Komplexität
H.R. Straub / 4. April 2011 Nicht-monotones System
Regelpool
Match Regel sind formal gleich gebaut wie Datenkonzepte Ihre komposite und binnenstrukturierte Form erlauben eine präzise, schnelle und gut kontrollierbare Wahl der richtigen Regel.
Match
Interpretationsprozess
input
Regel A
Regel B
Input
H.R. Straub / 4. April 2011 Nicht-monotones System
Match
Regel-Kaskade Regeln enthalten IFs für den Match und THENs für die Modifikation des Inputs Der so modifizierte Input sucht die nächste matchende Regel Wenn keine Regel mehr matcht Output
Modifikation
Modifikation
Match
input
interm.
output
Regel A
Regel B
Regelpool
Input
Output
Interpretationsprozess
H.R. Straub / 4. April 2011 Nicht-monotones System
Input
Welche Regel wird ausgeführt? Die Chronologie wird kontrolliert durch den aktuellen Stand des Inputs und durch Trigger, die bei der Ausführung dynamisch im semantischen Kontent entstehen.
Output
input
interm.
output
T
Die Kontrolle des Ablaufs
Regel A
Regel B
Regelpool
Modifikation
Modifikation
Match
Match
T
Interpretationsprozess
H.R. Straub / 4. April 2011 Nicht-monotones System
Input: enthält auch Ziele
Das Resultat wird nicht nur vom Input und dem Regelwerk gesteuert, sondern auch vom (wechselnden) Ziel der Interpretation, das dem Input mitgegeben wird.
input
interm.
output
Die Kontrolle des Ablaufs
Regel A
Regel B
Regelpool
Modifikation
Modifikation
Match
Match
Input
Output
Interpretationsprozess
H.R. Straub / 4. April 2011 Nicht-monotones System
Wartbarkeit Transparenz
Alle Regeln und
Interpretationsschritte
sind für den Wissens- Ingenieur direkt sichtbar.
input
interm.
output
Regel A
Regel B
Regelpool
Modifikation
Modifikation
Match
Match
Input
Output
Interpretationsprozess
H.R. Straub / 4. April 2011 Nicht-monotones System
Diagnosekodierung
- Herausforderungen - Alternativen der Kodierunterstützung
Semantische Modellierung und Interpretation
- Begriffsrepräsentation - komposite Begriffsdarstellung - Architektur der Binnenstruktur
- Interpretationsprozess - Beispiel Radiusfraktur - Non-Monotonie
Weg zum kommerziellen Produkt
H.R. Straub / 4. April 2011 Nicht-monotones System
1989 Vorläufer 1996 Grundidee, erste Arbeiten 1999 Firmengründung 2003 Erster Kunde Zeit: 7-14 Jahre
Softwareentwicklung ca. 10 Mannjahre Wissensbasisentwicklung ca. 20 Mannjahre
Auch erforderlich: - Oberflächen, Benutzerführung - Qualitätskontrolle - Vertrieb - Markt, der die USP erkennt Konstante Weiterentwicklung: Fulltextcoder, Data Repository
Der Weg zum kommerziellen Produkt
H.R. Straub / 4. April 2011 Nicht-monotones System
Kodier- programm
Knowledge Engineering
Wissensbasis Editor
Human Expert
Wissensbasis
Freitexte
Kodes
Aufbau des Kodiersystems
Krankenhaus
H.R. Straub / 4. April 2011 Nicht-monotones System
Knowledge Engineering
Wissensbasis Editor
Human Expert
Qualitätskontrolle
Wissensbasis 2
Kontroll- system
(500'000 Texte)
Datenbank
Wissensbasis
H.R. Straub / 4. April 2011 Nicht-monotones System
farbliche Darstellung, wie gut Textstelle kodierbar:
ICD-10-Kode
ICD-10-Kode + MC-Frage
CHOP-Kode
CHOP-Kode + MC-Frage
nicht kodierbar
Fulltext Coder
H.R. Straub / 4. April 2011 Nicht-monotones System
- Problemlisten - Austrittsdiagnosen - Prozeduren - Verordnungen (Medi u.a.)
Einträge: CDR
ICD-10 / OPS
Begriffs- moleküle
KIS-GUI
Query-Tool
DRG rollend DRG definitiv
Decision Support Alerts
- Outcome - Qualität - EBM CBM
- Online-Queries (NLP)
In einem semantischen Clinical Data Repository erstmals detaillierte Auswertung medizinischer Daten
Semantisches CDR (Clinical Data Repository)
SNOMED-CT
Semant. Interoperabilität
H.R. Straub / 4. April 2011 Nicht-monotones System
Vielen Dank für Ihre Aufmerksamkeit