semantisches web

Hausarbeit

Semantisches WebÜberblick und sprechaktheoretische Begriffskritik

Philosophische FakultätMedienwissenschaft

Eberhard-Karls-Universität Tübingen

Inhaltsverzeichnis

1 Hinführung 1

2 Vom Arpa-Net zum Web 3.0 1

3 Semantisches Web 23.1 Resource Description Framework und Web Ontology Language . . . . . . . 33.2 Erweiterungen des Internets . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3.2.1 Explizite Metadaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 33.2.2 Ontologien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.2.3 Logik im Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43.2.4 Agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3.3 Bestehende Ansätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53.3.1 Reconnaissance-Agents . . . . . . . . . . . . . . . . . . . . . . . . . . 53.3.2 Suchmaschinen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3.4 Das Semantic Web der Zukunft . . . . . . . . . . . . . . . . . . . . . . . . . 6

4 Sprechakttheoretische Begriffskritik 74.1 Austin und Searle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74.2 Grice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

5 Fazit 10

1 HINFÜHRUNG 1

1 Hinführung

Die provokative Formel “Semantik + Web 2.0 = Web 3.0“ kursiert im Internet seit sich derBegriff des Web 2.0 etabliert hat. Doch die Idee des semantischen Webs ist schon so alt wiedas Internet selbst – war sie doch bereits 1980 Teil der Vision, die Tim Berners-Lee vomWorld Wide Web hatte. Jetzt steht das Web 2.0 an der Schwelle zum Semantic Web. MitHochdruck arbeiten Entwickler an den proprietären Technologien, und erste Ansätze fürdas Semantic Web sind bereits zu erkennen und nutzbar.

In dieser Hausarbeit wird zunächst geklärt, wie es zum Semantic Web kam (Siehe 2,Vom Arpa-Net zum Web 3.0). Anschließend wird im Detail geklärt was das SemanticWeb auszeichnet und wie es funktioniert, welche aktuellen Entwicklungen bereits zumsemantischen Web gehören und wie das Semantic Web der Zukunft aussehen könnte (Siehe3, Semantisches Web). Abschließend soll der Begriff des semantischen Webs kritisch mitHilfe der Sprechakttheorie reflektiert werden (Siehe 4, Sprechakttheoretische Begriffskritik),insbesondere in Bezug auf den Begriff der Semantik im Kontext manschinenverarbeitenderIntelligenz.1

2 Vom Arpa-Net zum Web 3.0

Das ARPA-Net, ein Computernetzwerk, das von der Advanced Research Projects Agency1969 aufgebaut wurde, bildete lange Zeit die Basis des Internets. Der ursprüngliche Zweckdes ARPA-Nets bestand darin, online die Rechenzeiten der vorhandenen Computer fürForschungszwecke aufzuteilen. Andere Forschungseinrichtungen bauten nach dem erfolgrei-chen Einsatz des ARPA-Nets ebenfalls interne Computernetzwerke auf, oft mit dem Zieluntereinander Informationen austauschen zu können. So entstanden verschiedene Plattfor-men für Wissenschaftler, Forscher und Militär. 1972 begann ausgehend vom ARPA-Netdie Verbindung dieser verschiedenen Netzwerke zu einem größeren Netzwerk. Parallel hier-zu entwickelte sich das Usenet aus einer Gemeinschaft von UNIX-Usern. Als es 1980 zueiner Verschmelzung beider Netzwerke kam, war das Internet geboren.2 In der weiterenEntwicklung des World Wide Webs spielte Tim Berners-Lee eine Schlüsselrolle, der 1990mit der Entwicklung eines Browser-Systems und der Einführung der URL sowie einemVorläufer von HTML das eigentliche World Wide Web gestaltete, wie es heute genutztwird. Inzwischen hat sich der Begriff Web 2.0 etabliert, der den interaktiven Umgangmit dem Internet, in dem jeder User gleichzeitig auch eine Autorenrolle innehaben kann,bezeichnet. Doch eigentlich hatte Berners-Lee eine andere Vision, als er das World WideWeb entwickelte: Er hatte sich eine Art semantisches Web vorgestellt, das sich durch eineintelligente Informationserschließung auszeichnet.

1 Mit maschinenverarbeitender Intelligenz ist nicht die Entwicklung und Nutzung einer künstlichen Intelli-genz, einer AI, gemeint. Im Kontext des Semantic Web meint maschinenverarbeitende Intelligenz vielmehr,dass das Web auf der Basis von vorhandenen Informationen und einer inkludierten Logik Schlussfolgerungenzieht, selektiert und präsentiert, um so den User bei seiner täglichen Nutzung des Internets zu unterstützen.

2 Vgl. Castells 2008, S. 20.

3 SEMANTISCHES WEB 2

Das Web 3.0, das oft auch gleichgesetzt wird mit dem Semantischen Web, betrachtenviele nun als die nächste Entwicklungsstufe des Webs. Das “Ziel des Semantic Web ist es,neuartige Anwendungen und Dienste zu ermöglichen, in dem Daten von Maschinen bzw. vonSoftware interpretiert und für vorher nicht notwendigerweise vorgesehene Zwecke wieder-und weiterverwendet werden.“3 Diese Art der intelligenten Informationsverarbeitung war esauch, die Berners-Lee zu realisieren anstrebte.

3 Semantisches Web

Wer die Begriffsfolge “Anzahl der Mitarbeiter der Eberhard-Karls-Universität Tübingen2009“ in eine Suchmaschine eingibt, erhält eine Vielzahl an möglichen Resultaten, in Formeiner Auflistung von Websites die das Ergebnis enthalten könnten. Ob Google, Yahoooder Bing, keine der heutigen Suchmaschinen ist in der Lage, eine solche Suchanfrage zuverstehen und eine präzise Antwort darauf auszugeben. Der Grund hierfür liegt daran, dassdas Web für den Menschen als Endbenutzer ausgerichtet ist: “So kann ein menschlicherNutzer die Bedeutung einer Information auf einer Website problemlos erfassen, in andereDarstellungsformen transformieren und zu anderen Informationen in Beziehung setzen,während eine Maschine dies in aller Regel nicht zu leisten imstande ist.“4 Gerade wenn esum implizite Informationen geht, als um Schlüsse, die aus mehreren Informationen gezogenwerden können, sind die kognitiven Fähigkeiten eines menschlichen Endbenutzers vonRelevanz. Faktoren, die eine maschinelle Informationsverarbeitung erschweren, sind unteranderem die Heterogenität der im Web vorliegenden Informationen, sowie die Ambiguitätvieler Begriffe. Informationsverarbeitung im Web setzt momentan also noch voraus, dass einagierender Mensch involviert ist, der Suchen durchführt, Websiten aufruft, Informationenextrahiert und Schlüsse zieht.

Was Berners Lee seit den späten 1980ern verfolgt ist allerdings eigentlich die Entwicklungvon semantischen Technologien, mit deren Hilfe Computer die Inhalte des Webs besserverarbeiten können. Dafür benötigen Inhalte zunächst eine eindeutige ihnen zugewieseneBedeutung, die von Maschinen auffindbar ist. Weiterhin müssen die Beziehungen zu anderenBedeutungen herausgestellt werden, beispielsweise indem hierarchische Klassen gebildetwerden. Damit die Verarbeitung solcher Angaben möglich wird, müssen standardisierteMethoden eingeführt werden, die die Interoperabilität gewährleisten.5 Das World Wide WebConsortium (W3C)6 beschäftigt sich mit der Standardisierung von Internettechnologien,und legte zwei Informations-Spezifikationssprachen für ein semantisches Web fest: RDF

3 Hitzler et al. 2007, S. 1.4 Ebd., S. 10.5 Vgl. ebd., S. 11.6 Das W3C Consortium hat etwa 230 Mitgliederorganisationen, die Software, Hardware, Netzwerke undInformationsstrukturen für das Web entwickeln. Dabei existiert das W3C Consortium “as a place for thosecompanies for which the Web is essential to meet and agree on the common standards that will alloweveryone to go forward.“ (Fensel et. al. 2003, S. XV)


und OWL.

3.1 Resource Description Framework und Web Ontology Language

Um Metadaten zuzufügen und um semantische Klassifizierungen für Maschinen interpretier-bar zu machen wurden das Resource Description Framework (RDF) sowie die Web OntologyLanguage (OWL) entwickelt.Mittels RDF kann bereits Bedeutung ausgedrückt werden: Das RDF-Modell ermöglicht dreiInformationstypen: Ressource, Eigenschaftselement und Objekt, oft wird auch von Subjekt,Prädikat und Objekt gesprochen. Mit Hilfe dieser Informationstypen, die als Metadatenvorliegen, können beispielsweise Webseiten oder Objekte (Musik, Videos, Grafiken) vonComputern erkannt und verarbeitet werden.7

OWL ist eine formale Beschreibungssprache, die es Programmen erlaubt Inhalte zu erkennenund zu verarbeiten. Sie beruht auf RDF, offeriert aber mehr Variablen. OWL spielt insbe-sondere dann eine wichtige Rolle, wenn sogenannte Software-Agents (Siehe 3.2.4, Agents)ins Spiel kommen, da OWL “more vocabulary for describing properties and classes: amongothers, relations between classes (e.g. disjointness), cardinality (e.g. “exactly one“), equality,richer typing of properties, characteristics of properties (e.g. symmetry), and enumeratedclasses“8 zum bestehenden RDF hinzufügt, und somit mehr Verarbeitungsmöglichkeitenbietet.

3.2 Erweiterungen des Internets

Das Semantic Web ist also genau genommen kein “neues“ Internet, sondern eine Erweiterungder Funktionalität des bereits bestehenden Internets. Es geht hierbei auch nicht, wie oftfälschlicherweise angenommen, um die Erschaffung einer künstlichen Intelligenz. Zwarwären Methoden der künstlichen Intelligenz, die die kognitiven Aufgaben des Menschenanwenden würden, ebenfalls eine Möglichkeit – jedoch ist der Forschungsstand im Bereichder maschinenverarbeitenden Intelligenz längst nicht ausreichend für ein funktionierendessemantisches Web. Der Ansatz ist vielmehr der, dass der Webinhalt auf eine Form gebrachtwird, die von Maschinen leichter zu verarbeiten ist. Die Technologien dafür sind größtenteilsbereits entwickelt. Damit Semantic Web funktionieren kann braucht es neben RDF undOWL vier Ergänzungen des bestehenden Internets, die aber eng zusammenhängen: ExpliziteMetadaten, Ontologien, Logik im Web und Agenten.

3.2.1 Explizite Metadaten

Als Metadaten werden Daten bezeichnet, die über andere Daten Auskunft geben, also “dataabout data. Metadata capture part of the meaning of data, thus the term semantic inSemantic Web.“9 Im Quelltext von HTML- oder XML-Seiten sind Metadaten als unsichtbare

7 W3Ca.8 W3Cb.9 Grigoris Antonuoi 2004, S. 9.


Informationen über die Inhalte der Seiten eingebaut, um Suchrobotern das Auffinden derInformationen zu erleichtern. Personennamen, Themengebiete, Ortsangaben oder ein Datumsind typische in Metadaten untergebrachte Informationen, auch “Tags“ genannt. Tags könnenauf vielen Seiten auch von Nutzern vergeben werden und werden dann üblicherweise sichtbarangezeigt.

3.2.2 Ontologien

Tom Gruber definierte eine Ontologie als eine “explicit and formal specification of a concep-tualization.“10 Ontologien stellen also einen Bereich von etwas dar, indem sie spezifizieren.Im Web besteht ein solcher Bereich aus einer Taxonomie und Regeln. Die Taxonomiedefiniert Ausdrücke und die Beziehungen dieser Ausdrücke zueinander, die Regeln helfenbei der Verwertung der Informationen.11

Somit sind Ontologien sehr nützlich, da sie bei der Organisation von Websites helfen unddie Genauigkeit von Suchen im Internet verbessern. Geschrieben werden können Ontologienin XML, RDF, und OWL. Für das Semantic Web gelten insbesondere RDF und OWL alsStandards, da beide – wie bereits angesprochen – Eigenschaften, Klassen und Beziehungenbeschreiben können.

3.2.3 Logik im Web

Logik bietet drei für das Semantic Web essentielle Vorraussetzungen: Eine formale Spracheum Wissen auszudrücken, eine gut verständliche formale Semantik und die Möglichkeitauf Basis von vorhandenem Wissen Schlussfolgerungen zu ziehen. Die Logik, die dem Webhinzugefügt wird, muss dabei leistungsfähig genug sein um komplexe Eigenschaften vonObjekten zu beschreiben.

3.2.4 Agents

Agents sind selbstständig agierende Software, die Aufgaben und persönliche Präferenzeneines Users erhalten, Quellen im Web nach Informationen durchsuchen, mit anderen Agentskommunizieren, Informationen bewerten und vergleichen, eine Wahl treffen und diese Aus-wahl dann dem User präsentieren. Während diesem Prozess machen die Agenten Gebrauchvon den Metadaten (Identifizieren und Extrahieren von Informationen), den Ontologien(Interpretieren der Informationen und Kommunikation mit anderen Agenten) und der Logik(Abfertigen von Informationen und Ziehen Schlussfolgerungen).12

Ein wichtiger Aspekt der Funktionsweise von Agenten ist dabei der Austausch von Si-

10 Gruber 1995, S. 907.11 Exemplarisch: Ein Bereich könnte die Universität sein, der die Ausdrücke Student, Dozent und Professorbeinhaltet, die durch ihre aufsteigende Hierarchie in einer bestimmten Beziehung zueinander stehen. DieRegeln könnten beispielsweise festhalten, dass nur Dozenten und Professoren zu den Mitarbeitern zählen,nicht aber die Studenten.

12 Vgl. Fensel 2003, S. 14ff.


cherheiten, beispielsweise mit Hilfe von digitalen Signaturen. So können Informationen alsvertrauenswürdig eingestuft werden. Das spielt insbesondere dann eine Rolle, wenn es umsensible Daten wie beispielsweise Bankverbindungen geht. Daher müssen Agents skeptischsein, bis sie die Informationen überprüft und verifiziert haben, die sie über das SemanticWeb erhalten haben.

3.3 Bestehende Ansätze

Das Web 2.0 weist bereits einige Ansätze auf, die auf einen Entwicklungsprozess hin zueinem semantischen Web deuten. Insbesondere die sogenannten Reconaissance-Agents undeinige Suchmaschinen nutzen teilweise bereits semantische Technologien.

3.3.1 Reconnaissance-Agents

Reconaissance-Agents sind Web-Agenten, die bereits in der Lage sind Informationen in-telligent zu interpretieren. Beispiele hierfür sind Letizia und Powerscout, zwei Agents dievom MIT entwickelt wurden. Beide Agents beobachten das Verhalten eines Users im Webund schlagen diesem dann dynamisch Websites vor, die die bisherigen Präferenzen idealergänzen. Im Idealfall nennen die Agents also Websites, die dem Userverhalten in Gänzeentsprechen. Das Prinzip ähnelt dem von Amazon (Der Online-Shop Amazon macht demUser Vorschläge für Artikel, aufgrund der bisherigen Käufe und Klicks) oder dem von Pan-dora (Das amerikanische Online-Radio optimiert einen individuell erstellten Radiosendernach den Präferenzen des Users, der die gespielten Lieder bewerten kann).

3.3.2 Suchmaschinen

Das Versprechen einer semantischen Suchmaschine ist, dass sie konkrete Antworten liefertanstatt eine Liste von Webseiten als Suchergebnisse auszugeben. Damit das möglich wirdmuss die immense Menge an Internetinhalten des Web 2.0 zu einer Bibliothek von Inhaltenindiziert werden, und diese entsprechend Ihrer Bedeutung an mögliche Fragen geknüpftwerden.

GoogleDie Suchmaschine von Google hat durch ihre weite Verbreitung bei Usern Zugriff auf vieleAnfragen und Ergebnisse, und kann daher auf einen sehr großen virtuellen “Erfahrungsschatz“zurückgreifen. Das Suchverhalten der User wird ausgewertet und gespeichert, wodurchGoogle der wohl wahrscheinlichste Kandidat für eine gute semantische Suchmaschine ist.Ansätze dafür, dass Google konkrete Antworten ausgibt, sind bereits vorhanden: Gibt manin die Eingabezeile bei Google beispielsweise Wortkombinationen wie “„Wetter Stuttgart“,“Kinoprogramm Tübingen“ oder “„10 Euro in Dollar“ ein, liefert Google über den normalenSuchergebnissen (in Form einer Websiten-Auflistung) eine ganz konkrete Antwort.13

Wolfram Alpha

13 Google.


Die Suchmaschine Wolfram Alpha geht noch einen Schritt weiter. In das Eingabefeld derSuchmaschine kann der User Fragen eingeben, beispielsweise “Who is the inventor of theinternet?“. Die Suchmaschine verweist den User dann nicht auf Websites, sondern gibt einekonkrete Antwort aus. Dabei greift die Suchmaschine nicht auf eine Wissensdatenbank zu,sondern extrahiert die Antwort aus einer Vielzahl von Websites und Datenbanken. Dennochsind die korrekten Antworten vor allem auf den wissenschaftlichen Sektor beschränkt, zumeinen da wissenschaftliche Inhalte im Internet heute schon gut strukturiert und semantischaufbereitet sind, und zum anderen die Fragen auch meistens eindeutig beantwortet werdenkönnen.14

3.4 Das Semantic Web der Zukunft

Eine große Entwicklergemeinde, insbesondere das W3C, forciert die Entwicklung hin zumSemantic Web. Auch die Deutsche Bundesregierung investiert ins Web 3.0, unter anderemmit dem Theseus-Projekt.15

Ob es tatsächlich in den nächsten Jahren eine Umstellung auf ein semantisches Web gibt istaber weiterhin fraglich. Es fehlt die Akzeptanz der User, die eine so intensive Vernetzungvon Daten und Diensten kritisch betrachten. Auch ist momentan noch unklar, wie diebereits vorhandenen Inhalte des Webs optimal semantisch aufbereitet werden können.Der Königswegs wäre eine Software, die bestehende Websites in semantische Websitesumwandelt – die Fehlerquote, die mangelnde Zuverlässigkeit und die hohen Kosten sprechenallerdings dagegen. Eine andere Möglichkeit wäre Nutzerpartizipation, ähnlich wie beider Online-Enzyklopädie Wikipedia soll die Internet-Gemeinde sich am Semantic Webbeteiligen und mit speziellen Editoren vorhandenen Content rückwirkend taggen undsemantisch aufbereiten. Hierzu könnte man Nutzern eine Art semantischer Werkzeugkastenzur Verfügung stellen, so dass sie selbst Inhalte, Regeln und Ordnungen erstellen undbearbeiten sowie multimediale Inhalte intelligent aufbereiten, sammeln und verknüpfenkönnen.

Neben der Entwicklung der Basistechnologien für ein semantisches Web wird ein weitererSchwerpunkt in der Entwicklung von Verknüpfungen zwischen Mobilgeräten, Diensten undGPS liegen, sowie der Weiterentwicklung von Sprach- und Bilderkennungsprogrammen. Einin diesem Kontext oft genanntes Beispiel einer Anwendung, die all diese Tools verwendet,ist das folgende: Ein Mensch fotografiert mit seinem Mobilgerät ein Filmplakat ab, undspricht in das Mikrofon eine Frage wie “Wo läuft dieser Film heute abend?“.r Das Mobilgerätinterpretiert die Audioeingabe, lokalisiert den User per GPS, extrahiert den Filmtitel ausdem Bild, schickt eine Anfrage an die Dienste der umliegenden Kinos, und gibt dem User

14 Wolfram Alpha.15 Das Theseus-Projekt der Bundesregierung ist der Versuch Basistechnologien einer semantischen Websuchewie Indexierungs- und Annotationsverfahren, automatische Metadatengenerierung und kontextbasierendeVideoerkennung zu entwickeln. Gefördert wird das Theseus-Projekt mit 100 Mio. Euro. Eine große Gemeindean Bloggern, Entwicklern und Nutzern steht dieser Investition kritisch gegenüber, und äußern Bedenken,dass Deutschland den Anschluss an diese Technik bereits verpasst habe.

4 SPRECHAKTTHEORETISCHE BEGRIFFSKRITIK 7

eine Liste aus, wann der gewünschte Film in den Kinos der Umgebung gezeigt wird. Hatder User einen persönlichen Agent installiert, könnte dieser zusätzlich abfragen ob Kartenreserviert werden sollen. Bestätigt der User dies, sorgt der Agent für eine Reservierung undveranlasst die Bezahlung. Zusätzlich trägt er den Termin automatisch in den Terminkalenderein, gibt Hilfestellung bei der Anfahrt mit dem Auto oder den öffentlichen Verkehrsmittelnund macht Vorschläge zu weiteren Abendgestaltung vor und nach dem Kinobesuch, diethematisch oder zu Präferenzen des Users passen.16 Teile dieses Szenarios hängen auch engmit der Entwicklung der sogenannten Augmented Reality zusammen.

4 Sprechakttheoretische Begriffskritik

Die Bezeichnung “Semantisches Web“, die auch in dieser Hausarbeit verwendet wurde, hatsich als geläufige Begrifflichkeit für die bisher besprochene Weiterentwicklung des Web 2.0etabliert. Das Wort “Semantik“ entstammt eigentlich dem Bereich der Linguistik und wirdmanchmal auch in der Philosophie oder der Mathematik gebraucht. Mit Hilfe der Semantikwerden wörtliche Bedeutungen von sprachlichen Ausdrücken analysiert und beschrieben.So können semantische Beziehungen und die Beziehung der sprachlichen Ausdrücke zuraußersprachlichen Wirklichkeit herausgestellt werden, die Bedeutung von Sätzen als Summeder Bedeutung ihrer Einzel-Lexeme sowie die zwischen ihnen bestehenden grammatischenRelationen erfasst werden und Phonetik sowie Prosodie beschrieben und analysiert werden.Jede Kommunikation hat dabei einen außersprachlichen Kontext, der die Interpretation derPhrasen beeinflusst. Mit Hilfe der Pragmatik, ebenfalls ein Teilgebiet der Linguistik das andie Semantik anschließt, können durch Regeln zum Gebrauch der Sprache Schlussfolgerungengezogen werden, die diesen außersprachlichen Kontext in der Interpretation berücksichti-gen. Doch auch die Semantik benötigt Kenntnis des außersprachlichen Kontextes, auchÄußerungskontext genannt, um beispielsweise “die Analyse der Bedeutungsverschiebungen,denen die Ausdrucksbedeutung im Kontext unterliegen kann“17, vornehmen zu können.

4.1 Austin und Searle

Eine allgemein anerkannte Theorie der Linguistik, die sich mit den verschiedenen Ebeneneiner Interpretation befasst, ist die sogenannte Sprechakttheorie. Der Grundgedanke derSprechakttheorie ist der, dass mit jeder Äußerung Handlungen auf verschiedenen Ebenenvollzogen werden. Die erste Ebene nennt Austin, der Begründer der Sprechakttheorie, denlokutionären Akt. Die Lokution “besteht darin, in einem gegebenen ÄK (Äußerungskontext,Anm. d. V.) einen Ausdruck, in der Regel einen Satz, mit einer bestimmten Äußerungsbe-deutung zu sagen“. Der propositionale Akt, die zweite Ebene, beinhaltet die Referenzenauf die außersprachliche Welt und die Prädikation, das heißt eine Aussage über die Welt.Als dritte Ebene nennt Austin die Illokution. Searle fasst diese wie folgt zusammen: “The

16 Vgl. Lassila/Adler 2003, S. 12ff.17 Löbner 2003, S. 12.


production of the sentence token under certain conditions is the illocutionary act, and theillocutionary act is the minimal unit of linguistic communication“18. Die Illokution beziehtalso die Intention des Äußernden mit ein.19 Der perlokutive Akt, auf der vierten und letztenEbene schließlich, inkludiert die Frage, welche Botschaft den Adressaten erreicht. Hierspielen indirekte Sprechakte eine wichtige Rolle: “Such cases, in which the utterance hastwo illocutionary forces (...) are indirect speech acts, cases, in which one illocutionary act isperformed indirectly by way of performing another.“20

Grundlage des semantischen Webs sind nicht menschliche sprachliche Äußerungen in einemÄußerungskontext. Anstelle einer kommunikativen Mensch-Mensch-Schnittstelle liegt ei-ne Mensch-Maschine-Kommunikation vor, und im Falle der Kommunikation von Agentsund Datenbanken sogar eine Maschine-Maschine-Kommunikation. Und diese Maschine-Maschine-Kommunikation beschränkt sich im Grunde auf den Austausch von angelegtenInformationen und einer Selektion, beides basierend auf Datenbankabfragen.Betrachtet man diese Art der Kommunikation, die im Semantic Web stattfindet, mit Hilfeder Sprechakttheorie, stellt sich die Frage, ob sich der Begriff “semantisch“ zu Recht eta-bliert hat. Zunächst scheint dies naheliegend, da erklärtes Ziel des semantischen Webs derTransport von Bedeutung ist, und sich die Semantik mit Bedeutung beschäftigt. Allerdingsvermag die Kommunikation zwischen Datenbanken oder Softwareagents nicht dasselbezu leisten wie die Kommunikation zwischen Menschen. In einigen Bereichen weist dieMaschine-Maschine-Kommunikation Defizite auf, doch die Schwierigkeiten auf der perloku-tiven Ebene sind die verhängnisvollsten: Wenn eine Maschine eine Äußerung interpretiertwird sie zumeist die wörtliche Bedeutung einer Aussage als Interpretation vorziehen, dochoft stimmt die grammatische Form einer Äußerung nicht mit der Intention des Äußerndenüberein. Typisch menschliches soziales Verhalten fördert die korrekte Interpretation vonÄußerungen im Äußerungskontext. Searle schreibt dazu: “Meaning is more than a matterof intention, it is also a matter of convention.“21 Auf der ersten Ebene ist beispielsweisedie Frage “Kannst du mir das Salz reichen?“ die Frage nach einer Fähigkeit. Die Intentiondes Äußernden ist aber eine andere, er bittet um das Salz, und möchte nicht wissen, obder andere nur in Lage wäre, es ihm zu reichen. Die Aufforderung ist hier als impliziterSprechakt enthalten.Doch auch bei anderen Sprechakten ist es für Maschinen weit schwieriger als für Menschensie zu unterscheiden. So braucht es zusätzliche persönliche beziehungsweise individuelleDaten um beispielsweise Aussagen von Drohungen zu unterscheiden: “Ich weiß wo duwohnst“ ist grammatikalisch gesehen keine Drohung, erst die implizit enthaltenen zusätz-lichen Aussagen und der Äußerungskontext machen die Aussage als Drohung interpretierbar.

18 Searle 1965, S. 39.19 Searle unterscheidet zwischen dem illokutionären Akt und dem propositionalen Inalt des illokutionärenAktes, wobei er schreibt, dass nicht alle illokutionären Akte auch einen propositionalen Inhalt haben,Beispiele wären “Hurra!“ oder “Aua“.

20 Searle 1975a, S. 60.21 Searle 1965, S. 46.


4.2 Grice

Auch Grice beschäftigte sich mit den Problemen von Kommunikation, die auf die Maschine-Maschine-Kommunikation noch intensiver zutreffen. Insbesondere beschäftigte er sich mitsogenannten Implikaturen von Kommunikation. Seiner Theorie legt er ein Kommunikations-prinzip, er nennt es CP für Cooperative Principle, zugrunde, das für maximale Effizienz derKommunikation sorgen soll: “Make your conversational contribution such as is required,at stage at which it occurs, by the accepted purpose or direction of the talk exchange inwhich you are engaged.“22 Außerdem legte er vier Kategorien fest, die durch Maximen fürKommunikation repräsentiert werden (Quantity, Quality, Relation und Manner):

1. Quantity

(a) Make your contribution as informative as is required

(b) Do not make your contribution more informative than is required

2. Quality (Try to make your contribution one that is true)

(a) Do not say what you believe to be false

(b) Do not say that for which you lack adequate evidence

3. Relation (Be relevant)

4. Manner (Be perspicuous)

(a) Avoid obscurity

(b) Avoid ambiguity

(c) Be brief

(d) Be orderly

Diese Maximen23 werden in der Umgangssprache allerdings ständig verletzt, und Maschinensind nicht in der Lage die meisten Verletzungen der Maximen als solche zu erkennen undanschließend die Aussage richtig zu interpretieren. Insbesondere im Bereich Manner ergebensich Schwierigkeiten, gerade was Ungenauigkeit oder Ambiguitäten betrifft.

Ganz allgemein kommt hinzu, dass sprachliche Varianz nicht in Gänze einprogrammierbarist. Zwar können Agents auf Synonymdatenbanken zugreifen, aber die Vielfalt menschlicherÄußerungen machen es schwer immer die richtige Deutung eines Satzes herauszufinden – dietypisch menschliche Suggestivverneinung, Dialektwörter, umgangssprachliche Verwendung

22 Grice 1975, S. 45.23 Ebd., S. 47ff.

5 FAZIT 10

von sprachlichen Quantoren24 und vieles mehr erschweren dies.Und zuletzt bleibt die Schwierigkeit der Sprechakttheorie selbst. Die Vielzahl an kritischenAuseinandersetzungen sowie eine große Uneinigkeit in diesem Forschungsbereich sind einIndiz für die mögliche Unterdefiniertheit der Theorie. In einigen Bereichen ist die Sprech-akttheorie unterentwickelt, so sind beispielsweise nicht alle Sprechakte auf der Ebene derIllokution enthalten. Selbst wenn es also möglich wäre den Agents die Grundsätze derSprechakttheorie beizubringen, blieben die Unzulänglichkeiten der Sprechakttheorie selbst.

Der Begriff “Semantic“ Web etablierte sich also eigentlich nicht zu Recht im Kontext einerMaschine-Maschine-Kommunikation, die auf Datenbankabfragen beruht. Hitzler, beispiels-weise, umgeht dieses Problem, in dem er den Begriff der Semantik im Kontext der Informatikumdeutet, und als “die Bedeutung von Worten bzw. Zeichen(-ketten) und ihre Beziehungenuntereinander“25 beschreibt. Aber der Begriff des “Semantic Webs“ entbehrt eigentlicheiner Rechtfertigung für seine Verwendung und vermittelt einen falschen Eindruck derTechnologie, die eben das, was die Semantik ausmacht, gar nicht zu leisten vermag.

5 Fazit

“At present, the greatest needs are in the areas of integration, standardization, develop-ment of tools, and adoption by users.“26, fasst Antoniou die Probleme des Semantic Webszusammen. Doch das größte Hindernis für eine schnelle Entwicklung vom Web 2.0 zumSemantic Web sind die User, Antonious letzter Punkt: “The question is not so much atechnological but rather a practical one: Will we be able to demonstrate the usefulness ofthis technology quickly and powerfully enough to create momentum (recreating somethingsimilar to the early stages of the World Wide Web)?“27 Die Technologien sind entwickelt,aber die Öffentlichkeit betrachtet die Entwicklung des semantischen Webs kritisch oderbegegnet ihm mit Desinteresse und Unwissen. Und es ist eine wichtige Frage, die sichdie Kritiker stellen: Überwiegen die Vorteile eines semantischen Webs die Nachteile? Istder Datenschutz in Gefahr, wenn Agents im Web das Denken übernehmen, alle Dienstemiteinander verbunden sind und Daten austauschen?Dennoch, gerade im Bereich e-Learning oder innerhalb von unternehmens- oder organi-sationsinternen Informationsstrukturen könnte eine semantische Aufbereitung der Datenvon großem Vorteil sein. Verknüpfte Informationen, die von einem Computer intelligentverarbeitet werden, könnten Forschungen vorantreiben, Zeit sparen und für ein besseresInformationsmanagement sorgen.

24 In der Umgangssprache sind Äußerungen oft unterdeterminiert und unterquantifiziert. “Der Mensch istein Homo Sapiens“ ist eine definitorische Aussage, die alle Menschen meint. Die grammatikalisch ähnlicheAussage “Der Mensch ist gern auf Reisen“ meint, dass die Mehrheit der Menschen vermutlich gerne reist,wobei Ausnahmen nicht ausgeschlossen sind.

25 Hitzler et al. 2007, S. 13.26 Grigoris Antonuoi 2004, S. 7.27 Fensel 2003, S. 225.

5 FAZIT 11

Gegen eine schnelle Entwicklung und semantische Aufbereitung dieser Daten spricht alsonichts. Ob und wie sich das semantische Web allgemein durchsetzen wird, wird die Zeitzeigen.

Literatur 12

Literatur

Berners-Lee, Tim: Weaving the Web. London: Orion Business, 1999.

Castells, Manuel: Die Internet-Galaxie. Internet, Wirtschaft und Gesellschaft. Wiesbaden:VS-Verlag für Sozialwissenschaften, 2008.

Densel, Dieter: The Semantic Web and Its Languages. IEEE Intelligent Systems, 2000Nr. 15 (6), S. 67–73.

Fensel, Dieter: Spinning the Semantic Web. Bringing the World Wide Web to Its FullPotential. Cambridge, Massachusetts, London: MIT Press, 2003.

Google: www.google.de, Stand: Mai 2010.

Grice, Herbert Paul: Logic and Conversation. InCole, Peter/Morgan, Jerry (Hrsg.):Syntax and Semantics, Volume 3: Speech Acts. Academic Press, 1975, S. 41–58.

Grigoris Antonuoi, Frank van Harmelen: A Semantic Web Primer. Cambridge, Massa-chusetts, London: MIT Press, 2004.

Gruber, Tom: Toward principles for the design of ontologies used for knowledge sharing.International Journal of Human-Computer Studies, 43 1995, S. 907–928.

Hitzler, Pascal et al.: Semantic Web: Grundlagen. Berlin: Springer, 2007.

Lassila, Ora/Adler, Mark: Semantic Gadgets: Ubiquitous Computing Meets the Se-mantic Web. In Fensel, Dieter (Hrsg.): Spinning the Semantic Web. MIT Press, 2003,S. 363–376.

Löbner, Sebastian: Semantik. Eine Einführung. Berlin: Gruyter, 2003.

Merschmann, Helmut: Das Internet soll klüger werden.www.spiegel.de/netzwelt/web/0,1518,561831,00.html, Stand: Mai 2010.

Naughton, John: A brief history of the future - From radio days to internet years in alifetime. Woodstock, United States of America: overlook press, 2000.

Searle, John: What is a Speech Act? 1965, S. 39–53.

Searle, John: Indirect Speech Acts. In Cole, Peter/Morgan, Jerry (Hrsg.): Syntaxand Semantics, Volume 3: Speech Acts. Academic Press, 1975a, S. 59–82.

Searle, John: A taxonomy of illocutionary acts. 1975b, S. 344–369.

Tim Berners-Lee, James Hendler, Lassila Ora: The Semantic Web: a new form ofWeb content that is meaningful to computers will unleash a revolution of new possibilities.Scientific American, 2001 Nr. 284 (5), S. 34–43.

W3Ca: Resource Description Framework (RDF). http://www.w3.org/RDF, Stand: August2010.

Literatur 13

W3Cb: Web Ontology Language (OWL). http://www.w3.org/2004/OWL, Stand: August2010.

Wolfram Alpha: www.wolframalpha.com, Stand: Mai 2010.

semantisches web

Education