Tekom Jahrestagung 24. ‐ 26. Oktober 2017 1
Warum Künstliche Intelligenz intelligente Terminologien (und
Terminologen) braucht
Prof. Dr. Petra DrewerDr. François Massion
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 3
Künstliche Intelligenz (KI)
Haupteigenschaften von KI: Umfeld verstehen Selbständig Ziele verfolgen Lernen Kommunizieren
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 4
KI übernimmt bereits Routineaufgaben
Assistent im Call‐Center Robot‐Lawyer wertet in den USA richterlicheEntscheidungen aus
Analysetools unterstützen Mediziner bei der Diagnostik
Personalabteilungen erhalten Auswertungen von Lebensläufen
Maschinelle Übersetzungsprogramme …
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 5
Was kommt dann (1/2)?
Der smarte Robo‐Redakteur… … extrahiert Wissen aus Firmen‐ und externen Quellen
… fasst den Inhalt von Dokumenten zusammen … generiert Texte, twittert Informationen
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 6
Was kommt dann (2/2)?
Der smarte Robo‐Übersetzer… … wertet Referenzmaterial aus … sucht nach Informationen / Übersetzungen … bereitet Übersetzungen inhaltlich‐semantisch vor
Der smarte Robo‐Terminologe… … unterstützt die Terminologiearbeit mit Definitionen oder Begriffsrelationen
… erkennt Synonyme und Zusammenhänge
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 7
Die nächste KI‐Revolution
Der Mehrwert von Morgen wird aus der Fähigkeit der KI entstehen, natürliche Sprache zu verstehen.
Natürliche Sprache (gesprochen oder geschrieben) ist die wichtigste Schnittstelle zu/von intelligenten Anwendungen.
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 8
Sprache verstehen: Schritt 1
Sprachelemente identifizieren
https://cloud.google.com/natural‐language/
„I arrived at the bank [?] after crossing the river“
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 9
Statistik reicht nicht
Was bedeutet eigentlich „bank“ ? Laut WordNet gibt es (mindestens) 9 mögliche Bedeutungen
Wie weit hilft Statistik?
1234 Dokumente mit „bank“ = Geldinstitut (24)%567 Dokumente mit „bank“ = Ufer (11)% 89 Dokumente mit „bank“ = Damm (2)% ….
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 10
Sprache verstehen: Schritt 2
Bedeutung mit Hilfe von Wissensquellenerkennen I arrived at the bank 1 after crossing the river 2.
bridge (Brücke)bank 1 (Ufer)
water (Wasser)
river 2 (Fluß)
has_a
is_made_of
connects
WISSENSBASIS
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 11
Wissensquellen
Es gibt unterschiedliche Arten von Wissensquellen, z. B: Wörterbücher und Thesauri Annotierte Texte Sammlungen von NamedEntities (Eigennamen)
Ontologien Terminologiebestände…
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 12
Terminologiedatenbank mehrsprachig begriffsorientiert benennungsautonom mehrstufiges Eintragsmodell
Begriffssysteme Systematik Darstellung der begrifflich‐
systematischen Zusammenhänge
Ergebnisse der Terminologiearbeit
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 13
Beispiel für ein Begriffssystem
Quelle der Abb.: Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg, S. 12
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 14
Beispiel für ein Begriffssystem
Quelle der Abb.: Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg, S. 13
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 15
Arten von Begriffsbeziehungen bzw. ‐systemen
Hierarchische Begriffsbeziehungen
Abstraktionsbeziehung Bestandsbeziehung
Nicht‐hierarchische Begriffsbeziehungen
Sequentielle Begriffsbeziehung Oppositionelle Begriffsbeziehung Pragmatische Begriffsbeziehung
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 16
Sinn und Zweck von Begriffssystemen
Strukturierung und Systematisierung von Fachwissen (Besseres) Verständnis des Fachgebiets Zusammenhänge statt isolierter Begriffsbetrachtungen,
dadurch z.B. klare Abgrenzung von Nachbarbegriffen Vollständigkeitsprüfung Äquivalenzprüfung Zugang zu Terminologiesammlungen …
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 17
Stellen Sie sich vor, Sie erarbeiten den Begriff „Druckumformen“
Umformen
Zugdruck‐umformen
Druck‐umformen
Zug‐umformen
Biege‐umformen
Schub‐umformen
Walzen
Freiformen
Gesenkformen
Eindrücken
Durchdrücken
Umformverfahren nach DIN 8582
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 18
BegriffssystemDIN 2331 (1980:2) und DIN 2330 (2013:11)
Ein Begriffssystem ist eine Menge von Begriffen, zwischen denen Beziehungen bestehen oder hergestellt worden sind und die derart ein zusammenhängendes Ganzes darstellen.
Ein Begriffssystem dient der Ordnung des Wissens bildet die Grundlage für eine Vereinheitlichung und Normung der
Terminologie ermöglicht den Vergleich von Begriffen und Benennungen in
verschiedenen Sprachen
Die Darstellung von Begriffssystemen ist (teilweise) genormt.
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 19
Abstraktionsbeziehung: Fächerdiagramm
1Horizontalachsen‐Windkraftanlage
1.1Widerstandsläufer
1.2Auftriebsläufer
1.2.2Langsamläufer
1.2.1Schnellläufer
1.2.1.3Anlage mit
Dreiblattrotor
1.2.1.2Anlage mit
Zweiblattrotor
1.2.1.1Anlage mit Einblattrotor
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 20
Bestandsbeziehung: Klammerdiagramm
1Windkraftanlage
1‐1Fundament
1‐2Turm
1‐3Turmkopf
1‐3‐1Rotor
1‐3‐2Gondel
1‐3‐3Windnachführung
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 21
Erstellung von Begriffssystemen
Erkennen/Erarbeiten der Begriffsbeziehungen(erfordert umfassendes Produkt‐ bzw. Fachwissen)
Darstellen der Begriffsbeziehungen(Visualisierung je nach vorhandenen Tools und Toolkenntnissen)
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 22
Darstellung von Begriffsbeziehungen mit Terminologiewerkzeugen
Coreon (Coreon GmbH) i‐Term (DANTERM Technologies) LookUp (D.O.G. Dokumentation ohne Grenzen GmbH)
Quickterm (Kaleidoscope Communications Solutions GmbH)
Termweb (Interverbum Technology)
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 24
Ontologien
Ontologien sind maschinenlesbare Repräsentationen von (einem Ausschnitt aus) der Welt
Benutzen: Klassen und Individuen Eigenschaften Relationen Regeln
Formate: RDF, RDFS (Schema), OWL
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 25
Vor‐ und Nachteile von Ontologien
Sie erlauben intelligente Wissensabfragen mit Inferenz (Schlussfolgern):
"Kann Passolo auch XLIFF‐Dateien bearbeiten?“
Inferenz und Antwort
Tripel aus: Subjekt – Prädikat (Rel.) ‐ ObjektTripel: Passolo – Bearbeitet – XML‐DateiTripel: XLIFF‐Datei – IstEin – XML‐DateiInferenz ( Antwort): Passolo – Bearbeitet – XLIFF‐Datei „Ja“
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 26
Vor‐ und Nachteile von Ontologien
Sie sind oft sprachlich schlecht aufbereitet: Klassenname = Benennung Einsprachig Wenige terminologische Informationen
Sie sind dadurch schwer kombinierbar: Klassennamen passen nicht zueinander Granularität unterschiedlich (Größe der Klassen) Nicht für den mehrsprachigen Einsatz geeignet
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 27
Ontologien und Terminologen?
Terminologen können von Ontologien profitieren:
Verbesserung/Anreicherung der terminologischen Daten
Mehrwert/Aufwertung der Terminologiearbeit Weitere Anwendungsmöglichkeiten für terminologische Ergebnisse
Terminologen können Ontologien verbessern: Umgang mit (Teil‐)Synonymen Umgang mit (Teil‐)Äquivalenten Begriffsrelationen und ‐systeme
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 28
Ontologie Gibt Beziehungen zwischen
Begriffen an Strukturiert Wissen Nutzer: Maschinen
Begriffssystem Gibt Beziehungen zwischen
Begriffen an Strukturiert Wissen Nutzer: Menschen
Gegenüberstellung
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 29
Danke für Ihre Aufmerksamkeit!
Wir haben uns über Ihre (menschliche) Intelligenz gefreut…
Tekom Jahrestagung 24. ‐ 26. Oktober 2017 30
Literatur
DIN 2330 (2013): Begriffe und Benennungen – Allgemeine Grundsätze. Berlin: Beuth
DIN 2331 (1980): Begriffssysteme und ihre Darstellung. Berlin: Beuth Drewer, Petra / Massion, François / Pulitano, Donatella (2017): „Was haben
Wissensmodellierung, Wissensstrukturierung, künstliche Intelligenz und Terminologie miteinander zu tun?“ http://dttev.org/terminologie‐und‐künstliche‐intelligenz.html
Drewer, Petra / Schmitz, Klaus‐Dirk (2017): Terminologiemanagement : Grundlagen – Methoden – Werkzeuge. Heidelberg: Springer Vieweg (Kommunikation und Medienmanagement 1)