My PhD Thesis

Home -> Frank
 
OWL Files
BFO
ACGT
RO
IAO
Appendix
Thesis (German)
Anhang 2 (in German):
Standards als Grundlage
Detaileinsichten
Verbesserung der Interoperabilität
Appendix 2 (in English):
Standards as a basis for this work
Detailed Insights
Improvement of interoperability
 

Ontologies: Knowledge Representation

In the meantime I have published my work (PhD thesis) at the University of Regensburg creating an ontology based architecture facilitating semantic interoperability for communication standards (communication standards ontology (CSO)) in healthcare. The title is as follows:

Entwicklung einer ontologiebasierten Architektur zur Sicherung semantischer Interoperabilität zwischen Kommunikationsstandards im Gesundheitswesen

The basic idea is the definition of a top-level ontology for communication standards (CSO) upon which the different communication standards (HL7 v2.x and V3) will be based.
Details will be revealed soon.

Reference

You can access my thesis here:

Zusammenfassung (Deutsch)

Das Paradigma der integrierten Versorgung erfordert eine umfassende Kommunikation und Kooperation zwischen den Leistungserbringern im Gesundheitswesen, was ein gemeinsames Verständnis über die ausgetauschten Informationen voraussetzt. Diese Interoperabilität zwischen den Beteiligten muss auch die unterstützenden Gesundheitsinformationssysteme einbeziehen.

Traditionell erfolgte die Kommunikation zwischen Gesundheitsinformationssystemen auf der Basis des Austausches standardisierter Nachrichten, z.B. nach HL7 v2.x im Bereich der stationären Versorgung. Über die Sektorengrenzen hinweg haben sich historisch verschiedene Kommunikationsstandards entwickelt und etabliert, die zueinander inkompatibel sind. Selbst innerhalb einer Standardisierungsorganisation wie Health Level Seven (HL7) führen auf Methodologien aufbauende Weiterentwicklungen (HL7 V3) zu Inkompatibilitäten mit "Vorversionen", die sich in strukturellen Unterschieden und verschiedenen semantischen Konzepten wie bspw. den genutzten Vokabularien ausdrücken.

Die Übertragung der Informationen von Nachrichten des einen Standards in einen anderen ist gemeinhin die Domäne der sogenannten Kommunikationsserver. Diese benötigten zur Erfüllung dieser Aufgabe eine entsprechende Konfiguration, welche die Anwendung von Wissen über die beteiligten Standards erfordert. Dieses Wissen wird von Experten bereitgestellt, die sich in diesen Standards auskennen.

Eine Form der Wissensrepräsentation sind Ontologien, die Konzepte in Beziehung zueinander setzen. In der Arbeit wurde herausgearbeitet, was eine Ontologie zur Darstellung von Wissen auszeichnet und welche Beziehungen zwischen Konzepten etabliert werden können. Das Generische Komponentenmodell (GCM) stellt dazu das Rahmenwerk, das zur methodischen Aufbereitung der Arbeitsergebnisse genutzt wurde.

Zur Sicherung der semantischen Interoperabilität zwischen Kommunikationsstandards muss sich dieses Wissen prinzipiell aus drei Komponenten zusammensetzen: das sind zum Einen die beiden beteiligten Standards und zum Anderen das Mapping zwischen diesen beiden. Stellvertretend für zwei beliebige Kommunikationsstandards zeigt die Arbeit dies exemplarisch anhand der beiden zueinander inkompatiblen HL7-Standards Version 2.x und 3. Die Meta-Informationen dieser beiden Standards wurden dazu jeweils in Form einer Ontologie aufbereitet, die einer ebenfalls erarbeiteten Referenzontologie CSO (Communication Standards Ontology) auf Basis der Basic Formal Ontologie folgen.

Um beliebige Kommunikationsstandards miteinander kombinieren zu können, darf das Mapping zwischen diesen nicht auf direktem Wege erfolgen. Neben der Ausarbeitung der Grundlage für ein solches Mapping wurde eine geeignete Fachdomänenontologie als Mediator gesucht und mit ACGT (Advancing Clinico Genomic Trials on Cancer) auch gefunden, die in der Mitte agieren kann. Die entwickelte Lösung wurde unter Bezug auf konkurrierende Entwicklungen sowie die eingesetzte Methodik bewertet.

Summary (Englisch)

The paradigm of integrated care requires comprehensive communication and cooperation among providers in health care, where a common understanding of the shared information is a necessary prerequisite. Such interoperability between the actors involved must also include the supporting information systems.

Traditionally, communication between information systems in health care was based on the exchange of standardized messages, e.g. HL7 v2.x for inpatients’ care. For cross-enterprise information exchange incorporating different sectors, a set of different communication standards have been developed and established which are mutually incompatible. Even within a standards development organisation (SDO) like Health Level Seven (HL7), the use of methodologies leads to further developments (HL7 V3) resulting in incompatibilities with previous versions which ends up in structural differences and divergent semantic concepts like the used vocabularies.

Conversion of messages from one standard into another is normally the domain of so-called communication servers. In order to fulfill this task they need a special configuration which requires knowledge about the involved standards. This knowledge is usually provided by experts who are familiar with those standards.

Ontologies are a way of knowledge representation which interrelates concepts. This thesis has investigated, what puts an ontology in favour to express knowledge and what kind of relationships between concepts can be established. The Generic Component Model (GCM) provides the framework for methodological preparation of the work results.

For ensuring semantic interoperability among communication standards, the knowledge used must consist of three components: the participating communication standards and the mapping between them. In the thesis, the procedure of mapping between any communication standards is work exemplified at the two incompatible HL7 standards version 2.x and 3. The metadata for both standards have been extracted in form of an ontology which follows the newly designed reference ontology called CSO (communication standards ontology), based on the basic formal ontology (BFO).

In order to combine any communication standards, a mapping should not be done directly. Beside foundational work for such a mapping, an application ontology as a mediator has been searched and found with ACGT (Advancing Clinico Genomic Trials on Cancer), which can be used as the man in the middle. The solutions developed has been evaluated in relation to competing work as well as the methodology deployed.

Ontology

The ontology is provided in form of files using the web ontology language (OWL).) The latest version of these files can be downloaded here:

FilenameContentsSubdirectorygenerated
ACGT-addendum.owlAddendum for ACGTBFOno
CSO.owlCommon Standards Ontology
(common top level ontology for the different communication standards)
no
CSO-Addendum.owlAddendum to CSO
(file with additional information not directly neccessary for CSO)
no
hl7_v2.6.owlHL7 v2.6HL7_v2.x_OWLno
RIM.owlReference Information ModelHL7v3-MIF2-to-OWL-VByes
R-MIM.owlRefined Message Information Modelyes
CMET.owlCommon Message Element Typesyes
DataType.owlData Typesyes
HL7-V3.owlLoading the different generated filesno
Vocabulary.owlVocabulary (contains only the import statements)no
vocab_codesystem.owlCodesystemeyes
vocab_conceptDomain.owlConcept Domainsyes
vocab_valueSet.owlValue Setsyes
COCT_MT030207V.owlE_Person_informationalyes
PRPA_IN201301UV02.owlInteractions (Examples):
Patient Registry Record Added
yes
PRPA_IN201302UV02.owlPatient Registry Record Revisedyes
PRPA_IN201303UV02.owlPatient Registry Record Nullifiedyes
PRPA_IN402001UV02.owlInpatient Encounter Startedyes
PRPA_MT201301UV02.owlMessage Types (Examples)
Patient Registry Record Added
yes
PRPA_MT201302UV02.owl/Patient Registry Record Revisedyes
PRPA_MT201303UV02.owlPatient Registry Record Nullifiedyes
PRPA_MT402001UV02.owlInpatient Encounter Startedyes
Mapping-Master_v2.6.owlMapping for v2.x - ACGT/BFOMappingno
Mapping-Master_V3.owlMapping for V3 - ACGT/BFOno
HL7-V3-regex-protege.owlRegular Expressions to split non-atomic elementsno
Scores-on-ACGT.owlScore Ontology (based on ACGT) no
Loader.owlLoads all ontologies in one goMappingno

The different files should be placed in the corresponding subdirectory below http://localhost/owl/protege.
Furthermore, the used ontologies should also be placed there. But as mentioned before, they are under development, so that the identity cannot be assured:

FilenameContentsOriginal Sourceused in
this work
ro.owlReference Ontologyhttp://purl.org/dc/elements/1.1/yes
bfo-1.1.owlBasic Formal Ontologyhttp://www.ifomis.org/bfo/1.1yes
acgt-1.0.owlAdvanced Clinico Genomic Trial Ontologyhttp://www.ifomis.org/acgt/1.0yes
protege-dc.owlProtege Dublin Corehttp://protege.stanford.edu/plugins/owl/dc/protege-dc.owlyes
iao.owlInformation Artefact Ontologyhttp://purl.obolibrary.org/obo/iao.owlno

Note: I have adjusted the filenames and the imports so that the files can be loaded using Protege via http://localhost.

Import Structure

The structure for the above mentioned files is as follows:

Simplifying it to a direct import:

Table of Contents

  • A. Motivation
    • 1. Einleitung
      • 1.1. Paradigmenwechsel im Gesundheitswesen
      • 1.2. Kommunikation und Kooperation im Gesundheitswesen
      • 1.3. Integrierte Versorgung und interoperable Systeme
      • 1.4. Motivation zur Kooperation
      • 1.5. Informationszyklus
    • 2. Aufgabenstellung
    • 3. Gliederung der Arbeit
  • B. Grundlagen
    • 4. Hintergrundinformationen
      • 4.1. Anforderungen an interoperable Systeme
      • 4.2. Gegenüberstellung der Standards
      • 4.3. Ablauf der Kommunikation
    • 5. Definitionen
      • 5.1. Modell
      • 5.2. Architektur
      • 5.3. Interoperabilität
      • 5.4. Linguistik
      • 5.5. Ontologie
      • 5.6. Epistemologie (Erkenntnistheorie)
      • 5.7. Wissen
      • 5.8. Wissensrepräsentation
      • 5.9. Wissensbasis
      • 5.10. Konzept
      • 5.11. Beziehungen/Relationen
      • 5.12. Klassifikation
  • C. Methoden
    • 6. Rahmenarchitektur
      • 6.1. RM-ODP –Reference Model Open Distributed Processing
      • 6.2. SAEAF – Service Aware Enterprise Architecture Framework
      • 6.3. Das generische Komponentenmodell
      • 6.4. Einschränkung für diese Arbeit
    • 7. Wissen und Wissensrepräsentation
      • 7.1. Ontologie
      • 7.2. Ontologie- und KR-Sprachen
      8. Ordnungsstrukturen für Wissensrepräsentation
      • 8.1. Beobachtungseinheiten
      • 8.2. Begriffsmengen
      • 8.3. UML-Klassendiagramm der Begriffsmengen
      • 8.4. Einordnung in das GCM
  • D. Ergebnisse
    • 9. Analyse der Kommunikationsstandards
      • 9.1. UML-Modell für HL7 v2.x
      • 9.2. UML-Modell für HL7 V3
      10. Ontologien für Kommunikationsstandards
      • 10.1. Grundlagen der Rrepräsentation medizinischen Wissens
      • 10.2. Ontologie-Struktur
      • 10.3. Diskussion konkurrierender Ansätze für eine Repräsentation von HL7-Kommunikationsstandards
      • 10.4. Die Communication Standards Ontology als Referenz-Ontologie
      • 10.5 Abbildung HL7 V3 -> OWL
      • 10.6. Abbildung HL7 v2.x -> OWL
      • 10.7. Zwischenfazit
      • 10.8. Konsistenzregeln
    • 11. Analyse der Fachdomäne
      • 11.1. Beispiel: Name, Adresse und Telefonnummer
      • 11.2. Beispiel: "Fall"
      • 11.3. Beispiel: Diagnosen
      • 11.4. Beispiel: Scores und Assessments
      • 11.5. Einsatz der BFO (Basic Formal Ontology) und ACGT (Advancing Clinico Genomic Trials on Cancer)
    • 12. Ontologien für die Fachdomäne
      • 12.1. Beispiel Name/Adresse
      • 12.2. Beispiel Fall
      • 12.3. Beispiel Scores
    • 13. Mapping
      • 13.1. Basiskonzepte
      • 13.2. Darstellung in Beschreibungslogik
      • 13.3. Ablauf des Mappings
      • 13.4. Ergänzung zu CSO
    • 14. praktische Umsetzung der Ergebnisse
      • 14.1. Erzeugung der Ontologien
      • 14.2. Repräsentation von Ontologien mittels OWL
    • 15. Bereitstellung der Ergebnisse
      • 15.1. Ontologien
      • 15.2. Ausgelagerte Anhänge
  • E. Diskussion
    • 16. Charakterisierung der entwickelten Lösung
    • 17. Bewertung des Nutzens
      • 17.1. Bewertung der eigenen Arbeit
      • 17.2. Nutzung in der Zukunft
      • 17.3. Übertragung der Ergebniss auf Persistenzstrukturen
    • 18. offene Punkte
      • 18.1. Ausblick auf zukünftige Arbeiten
      • 18.1. Architekturskizze der Anwendung
    • 19. Zusammenfassung und Schlussfolgerungen
  • F. Anhänge
    • 20. Anhang A: Einführung in die Grundlagen
      • 20.1. RDF: Resource Description Framework
      • 20.2. OWL: Web Ontology Language
      • 20.3. OPPL: Ontology Preprocessor Language
    • 21. Anhang B: OWL-Spezifikationen
      • 21.2. Umsetzung von HL7 V3 MIF nach OWL
      • 21.2. Umsetzung der verschiedenen HL7-v2-Strukturen nach OWL
    • 22. Verzeichnisse
      • 22.1. Abkürzungen
      • 22.2. Abbildungen
      • 22.3. Tabellen
      • 22.4. Index
      • 22.5. Literatur

Addendum

To avoid becoming the PhD Thesis too detailed some additional information is extracted and published here: (BTW, this document is in German.)

in German

in English

References

In my work, I am referring to several papers I have presented earlier. They can be found in my bibliography and are not listed again.

 

 

Last Update: April 8, 2011