ontologien - eine einführung formale ontologie & semantic web
Post on 09-Jan-2016
27 Views
Preview:
DESCRIPTION
TRANSCRIPT
Ontologien - Eine EinführungFormale Ontologie & Semantic Web
Frank Loebefrank.loebe@informatik.uni-leipzig.de
Abt. Intelligente SystemeInstitut für InformatikUniversität Leipzig
Vorlesung „Wissensrepräsentation“Prof. G. Brewka
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 2
Übersicht
• Historische Motivation
• Begriffsbestimmung
• Anwendungen
• Einteilungen
• Top-level Ontologien
• Ontologie im / und
Semantic Web
• Forschungsbereiche
Box: neues Thema
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 3
Ontologie: intuitiv
• ähnlich konzeptueller Modellierung bei Software-Entwicklung
• gegeben: eine Domäne oder Aufgabe
• Frage: Worüber (= über welche Entitäten / Dinge / ...)ist dabei zu sprechen?
• Bsp: Domäne Uni-Sommerkurs– Personen, Studenten, Lesende, Professoren, Tafeln, ...– Kurse, Vorlesungen, Übungen, Vorlesungsbesuche, ...– Termine, Hörsäle, ...– Themen, Probleme, Theoreme, ...
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 4
Historische Motivation:Wiederverwendbarkeit von
Wissensbasen
• 1980er: diverse WBS, Austausch nur durch Rekodierung
• Probleme:– verschiedene Repräsentations-
sprachen & Dialekte
– fehlende Kommunikations-standards(für Austausch zw. WBS)
– unterschiedliche Terminologie / Konzeptualisierung / Ontologie
• im Ergebnis: Interesse an– Standardsprachen
– Ontologie
[Neches et al., 1991]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 5
Semantic Web
• ca. 2000-2001: Vision des Semantic Web– Hauptziel:
Anreicherung der Informationen im Internet,um diese besser automatisiert verarbeiten zu können
– Bsp.: Einkauf im Web über Agenten
• Ontologie(n) alsSchlüsseltechnologie
• derzeit: Web 2.0– Ergänzung oder
Gegenspieler desSemantic Web ?
[W3C, 2000]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 6
Begriffsbestimmung
• Drei Leseweisen für „Ontologie“
1.) philosophisch:– Fach Ontologie
2.) informatisch / in KI:– Ontologie als Begriffssystem
3.) Spezialfall von 2.): Ontologie im Semantic Web:– Ontologie als Technologie
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 7
Begriffsbestimmung:Ontologie (I)
• Philosophie:Fach „Ontologie“ (Ontology)– etymologisch: aus dem Griechischen– „ontos“ – Sein– „logos“ – Lehre, Wort– Lehre vom Sein / Seienden– Systeme grundlegender Kategorien– oft reduktionistisch
• Definitionen:– „As a first approximation, ontology is the study of what there is.“
[Hofweber, 2004, SEP]
– „Theorie kategorialer Folgerungen“ [Seibt, 2004]– „... the systematic, formal, axiomatic development of the logic of all forms
and modes of being.” [Cocchiarella, 1991]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 8
Beispiel: Kategorien- system
Substance
material immaterial
Body Spirit
animate inanimate
Living Mineral
sensitive insensitive
Animal Plant
rational irrational
Human Beast [Sowa, 2000]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 9
Begriffsbestimmung: Ontologie (II)
• „eine Ontologie“ in der Informatik (ontology)– Spezifikation / Theorie von Begriffen und deren Zusammenhängen
– Zweck: gemeinsames / geteiltes Verständnis
• Definitionen– „... an explicit specification of a conceptualization.“ [Gruber, 1993]
– „... an ontology defines a set of representational primitives with which to model a domain of knowledge or discourse.“ [Gruber, 2008]
– „An ontology is a logicaltheory accounting for theintended meaning of aformal vocabulary, i.e., itsontological commitment to aparticular conceptualizationof the world.“ [Guarino, 1998]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 10
Tutorialbeispiel:Pizza-Ontologie
(in Protege)
[http://www.co-ode.org/resources/tutorials/protege-owl-tutorial.php]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 11
Abgrenzungen
• Ontologien vs. Wissensbasen– ontologisch:
• Wenn X ein Objekt ist, kann X kein Prozess sein.
– dagegen nicht:• John ist 80 kg schwer.
• Um das Essen auszuwählen, wird zuerst die Karte studiert.
• Ontologische/Terminologische Fakten [Brachman, Levesque, 2004]
– Unterkategorien / Spezialisierung Student is-a Person– Disjunktheit Student und Vorlesung– Überdeckung (Exhaustiveness) Mann, Frau für Person– Typrestriktionen für Relationen nur Personen lehren– inverse Relationen– versch. Relationseigenschaften, z.B. Transitivität, Symmetrie
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 12
Übersicht
Historische Motivation
Begriffsbestimmung
• Anwendungen
• Einteilungen
• Top-level Ontologien
• Ontologie im / und
Semantic Web
• Forschungsbereiche
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 13
Anwendungen (I)
• Medizin & Biologie: Terminologien & Ontologien– ICD: K09.0
• K00-K93 Krankheiten des Verdauungssytems
• K00-K14 Krankheiten der Mundhöhle, der Speicheldrüsen und der Kiefer
• K09.- Zysten der Mundregion, anderenorts nicht klassifiziert
• K09.0 Entwicklungsbedingte odontogene Zysten (u.a. Keratozyste)
– SNOMED, GALEN, FMA, UMLS ...– OBO: Open Biomedical Ontologies
• Gene Ontology, Mouse Anatomy, Celltype Ontology, ...
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 14
Bsp.: UMLS (Auszug)
EntityPhysical Object
OrganismPlant
AlgaFungusVirus...
Substance...
Conceptual EntityIdea or Concept...FindingLanguage...
EventActivity
BehaviorSocial Behavior
...Machine Activity
Phenomenon / ProcessHuman caused P/PNatural P/P
Biologic Funct.Pathologic F.
...Injury or Poisoning
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 15
Anwendungen (II)
• Anwendungszwecke– korrekte Wiederverwendung von Informationen & Softwarekompon.– Fehlererkennung / -vermeidung– Vereinfachung von Datenintegration und Interoperabilität– „semantische“ Verarbeitung, z.B. semantische Suche– Grundlage/Ergänzung für Methoden der Domänenmodellierung
• Anwendungsgebiete– Knowledge Engineering & Representation– *-Integration (Datenintegration, Unternehmensintegration, ...)– Wissensmanagement– Konzeptuelle Modellierung, Datenbankentwurf– Sprachverarbeitung
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 16
Einteilung von Ontologien
• Ontologie:– Spezifikation / Theorie von Begriffen und deren Zusammenhängen
• historisch gewachsen im KI-Bereich– Aufgaben-Ontologie + Domänenontologie = Anwendungsontologie
• „Spezifikation“ nach Formalisierungsgrad
• „Begriffe“ nach Allgemeinheitsgrad
nach Domäne
(Bio-, Medizin-,Business-, ... Ontologien)
• außerdem: linguistische Ontologien z.B. Wordnet
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 17
Ontologie-Arten: nach Formalisierung
• informal– Begriffsliste, (kontrolliertes) Vokabular, Katalog, Glossar– ggf. auch: Text
• Begriffshierarchie– Taxonomie, Nomenklaturen– z.B. ICD, UNSPSC, ...
• semiformal– Thesaurus, semantisches Netz, UML- oder ER-Diagramme– z.B. FMA, MeSH, WordNet, ...
• formal– formalisierte logische Theorie, z.B. in FOL, DL– z.B. SNOMED, GALEN
informal
formal
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 18
Ontologie-Arten: nach Allgemeinheit
• Top-level-Ontologie– Kategorien für die meisten Anwendungsbereiche– Bsp.: Objekt – Prozess – Qualität
• Kern-Ontologie (Top-Domänen-Ontologien)– Kategorien für einen größeren Anwendungsbereich– Bsp.: Mensch – Krankheit – Größe
• Domänen-Ontologie– Kategorien für einen spezifischen Anwendungsbereich– Bsp.: Leukozyt – chronisch lymphatische Leukämie
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 19
Top-level Ontologie(n)
• Ziel: Charakterisierung von Begriffen, auf die die meisten Domänen zurückgreifen allgemeinste Begriffe
• Themen:– Individuen und Kategorien – Raum, Zeit
– Objekte, Prozesse – Situationen, Fakten
– Eigenschaften, Relationen• Mereologie (Teil-Ganzes Beziehung)• Kausalität
– Rollen, Funktionen – Löcher – Granularität
– Repräsentation, Symbole, Information ...
• Systeme: BFO, (tlw. CYC), DOLCE, GFO, SUMO, ...
• Abgrenzung– allgemeinste Begriffe, keine Commonsense-Wissensbasis (z.B. CYC)
– linguistische Ontologien: WordNet
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 20
General Formal Ontology (GFO)
• Darstellungen– informal:
• Report “General Formal Ontology (GFO): A Foundational Ontology Integrating Objects and Processes“ (v 1.0.1:
2007)
• weitere Publikationen
– formal: tlw. Axiomatisierungen• in FOL: ca. 300 Formeln (Axiome, Definitionen, Folgerungen)
• in OWL: 77 Klassen, 67 Relationen
http://www.onto-med.de/ontologies/gfo.owl
• Status– begonnen ca. 1999– ständige Erweiterung & Weiterentwicklung– erste Anwendungen neue Anforderungen
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 21
General Formal Ontology (GFO) Grundeinteilungen
Kategorien und Klassen
Raum und Zeit
Qualitäten und Relationen
Objekte und SituationenEn
tität
en
Prozesse
Ind
ivid
uen
*
...
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 22
GFO Kategorien-Hierarchie (2006)
entity
category concrete entity
immanentuniversal
conceptualstructure
symbolicstructure
persistant property
individual
space-timeentity
occurrent
presential
quality
timeentity
spatialentity
spatialboundary
spaceregion
timeregion
timeboundary
topoid chronoid
materialstructure
configur-ation
relation
process change
materialboundary
materialobject
situation situoid
(relational)role
relator
formalrelator
materialrelator
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 23
GFO Grundrelationen (2006)
has-quality
projection
extension space
instantiation
inherence
at
value-of
location
chron
framing
abstractpart-of
formalrelator
relativizedpart-of
spatialpart-of
constituentpart-of
participation
element-of
occupation
boundaryprojection
temporalpart-of
top
association
onticalconnectedness
boundary-of
left boundary
right boundary
coincidence
congruence
role-offills-role
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 24
Übersicht
Historische Motivation
Begriffsbestimmung
Anwendungen
Einteilungen
Top-level Ontologien
• Ontologie im / und
Semantic Web
• Forschungsbereiche
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 25
Ontologie im / und Semantic Web
• Prinzipien für das Semantic Web– Identifizierbarkeit über URIs– Semantische Typisierung von URIs– Partielle Informationen Open World Assumption– keine globale Konsistenz erwartet / angestrebt
• Ontologie:– RDF:
Ontologien als Graphen– Web Ontology Language
OWL:Ontologien alsBeschreibungslogik-Theorien
[W3C, 2000]
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 26
OWL Ontologien (technologisch)
• OWL– Standard seit 2004 (OWL 1.0)– OWL 1.1 bereits definiert
• mittlerweile recht ausgereifte Systeme zur Unterstützung– Ontologie-Editoren, z.B. Protege– Beweiser für OWL
• Anwendung als Technologie– Datenmodell wird als „Ontologie“ ausgedrückt– Beweiser übernimmt bestimmte Aufgaben, z.B.
• Klassifikation: Inferenz der Taxonomie• Konsistenzprüfung
– Kombination mit Abfrage-Sprachen (wie SPARQL)
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 27
OWL (formal): Beschreibungslogik
• Beschreibungslogiken (DLs):– Repräsentationsformalismen
– für terminologisches Wissen
– gesucht: DLs mit „guten“ Berechenbarkeitseigenschaften, effizient implementierbar
• Modellierungsprimitive– Konzepte (unäre
Prädikate)
– Rollen (binäre Prädikate)
– Konstruktoren / Konstruktionen(ALCUE = S, HOINQRF)
– OWL 1.0 - SHOIN
– OWL 1.1 - SROIQ
Bsp.:
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 28
Ontologie-Forschung
• Problemfeld: Ontologie-Erstellung– Ontological Engineering
• Methodologien zur Ontologie-Erstellung
• Ontologie-Editoren / Verwaltungstools
– Lernen / Verfeinerung von Ontologien
• Problemfeld: Ontologie-Integration– Vergleiche, Abbildungen, kombinierte Verwendung– Suche nach weitgehend automatischen Verfahren
• Problemfeld: Ontologie-Verwaltung– Modularisierung– Versionierung– Evaluation
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 29
Zusammenfassung
• Definitionen– Ontologie vs. Ontologien, Semantic Web Ontologien
• Hintergrund & Zielstellung– semantische Interoperabilität
– Wiederverwendbarkeit unterstützen (z.B. von Software)
• Anwendungsbereiche– vielfältig, viele Systeme derzeit in Biologie & Medizin
• Einteilungen– nach Formalisierungsgrad (weniger relevant für SW)
– nach Allgemeinheit der Inhalte (Top-level ... Domänenontologien)
• Semantic Web Ontologien– werden erfasst in OWL, basieren auf Beschreibungslogik
Vorlesung „Wissensrepräsentation“Universität Leipzig, Abt. Intelligente Systeme 30
Referenzen
• Cocchiarella, Nino 1991„Formal Ontology“, In: Handbook of Metaphysics and Ontology, p.640-647, Philosophia.
• Guarino, Nicola 1998„Formal Ontology and Information Systems“, In: FOIS Proceedings, p.3-15, IOS Press.
• Gruber, Tom 1993„A Translation Approach to Portable Ontology Specifications”,Knowledge Acquisition 5(2):199-220.
• Gruber, Tom 2008„Ontology“, to appear in: Encyclopedia of Database Systems, Springer.
• Herre et al., 2007General Formal Ontology (GFO) – A Foundational Ontology Integrating Objects and Processes, Version 1.0.1 (draft). University of Leipzig.
• Neches et al., 1991„Enabling Technology for Knowledge Sharing”, AI Magazine 12(3):36-56.
• Seibt, Johanna 2004pers. Kommunikation.
• Sowa, John F. 2000„Knowledge Representation“, Brooks/Cole.
• W3C 2000 (Berners-Lee, Tim)„Semantic Web – XML2000“, Slides.
top related