web-2.0-forschung der kwarc-gruppe

29
Web-2.0-Forschung der KWARC-Gruppe 3. Web Montag Bremen Christoph Lange, Matthias Bröcheler International University Bremen (Jacobs University Bremen ab Frühjahr 2007) 27. November 2006 Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 1 / 18

Upload: christoph-lange

Post on 18-Nov-2014

853 views

Category:

Technology


0 download

DESCRIPTION

Web Montag, Bremen, November 2006

TRANSCRIPT

Page 1: Web-2.0-Forschung der KWARC-Gruppe

Web-2.0-Forschung der KWARC-Gruppe3. Web Montag Bremen

Christoph Lange, Matthias Bröcheler

International University Bremen(Jacobs University Bremen ab Frühjahr 2007)

27. November 2006

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 1 / 18

Page 2: Web-2.0-Forschung der KWARC-Gruppe

Inhalt

1 KWARC@IUB

2 GrundlagenSemantic WebOMDoc

3 ProjekteWas kann man mit OMDoc machen?Wo kriegt man die Daten her?

4 Ausblick

5 Quellen

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 2 / 18

Page 3: Web-2.0-Forschung der KWARC-Gruppe

KWARC@IUB

Wir und unsere Interessen

http://kwarc.eecs.iu-bremen.de

Arbeitsgruppe um Prof. Michael Kohlhase an derInternational University Bremen und am DFKI(Deutsches Forschungszentrum für künstliche Intelligenz)

1 Professor, 1 Dozent, 5 Doktoranden, 2 Master-Studenten,≈ 5 Bachelor-StudentenInteressen:

KWARC = „Knowledge Adaptation and Reasoning for Content“?Semantik von Dokumentstrukturen mit formaler Logik untersuchenMathematisches Wissen verwaltenMehrwertdienste auf WissenssammlungenE-Learning, soziale Software, Communities of Practice

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 3 / 18

Page 4: Web-2.0-Forschung der KWARC-Gruppe

KWARC@IUB

Wir und unsere Interessen

http://kwarc.eecs.iu-bremen.de

Arbeitsgruppe um Prof. Michael Kohlhase an derInternational University Bremen und am DFKI(Deutsches Forschungszentrum für künstliche Intelligenz)

1 Professor, 1 Dozent, 5 Doktoranden, 2 Master-Studenten,≈ 5 Bachelor-StudentenInteressen:

KWARC = „Knowledge Adaptation and Reasoning for Content“?Semantik von Dokumentstrukturen mit formaler Logik untersuchenMathematisches Wissen verwaltenMehrwertdienste auf WissenssammlungenE-Learning, soziale Software, Communities of Practice

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 3 / 18

Page 5: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen Semantic Web

Semantic Web für Web-2.0-Kenner

Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,Mikroformaten, Webservice-Beschreibung, intelligenteSuchmaschinen)„Schwache Künstliche Intelligenz“ (Leuf): Metadatendranschreiben („annotieren“), bis es die Maschine verstehen kannStatt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)verwendenStatt Hacks und Mashups: Logisches Schlussfolgern aufWissensdatenbank⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0. . . aber (noch) wenige nicht-akademische Software /

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18

Page 6: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen Semantic Web

Semantic Web für Web-2.0-Kenner

Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,Mikroformaten, Webservice-Beschreibung, intelligenteSuchmaschinen)„Schwache Künstliche Intelligenz“ (Leuf): Metadatendranschreiben („annotieren“), bis es die Maschine verstehen kannStatt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)verwendenStatt Hacks und Mashups: Logisches Schlussfolgern aufWissensdatenbank⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0. . . aber (noch) wenige nicht-akademische Software /

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18

Page 7: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen Semantic Web

Semantic Web für Web-2.0-Kenner

Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,Mikroformaten, Webservice-Beschreibung, intelligenteSuchmaschinen)„Schwache Künstliche Intelligenz“ (Leuf): Metadatendranschreiben („annotieren“), bis es die Maschine verstehen kannStatt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)verwendenStatt Hacks und Mashups: Logisches Schlussfolgern aufWissensdatenbank⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0. . . aber (noch) wenige nicht-akademische Software /

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18

Page 8: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen Semantic Web

Semantic Web braucht Web 2.0

Semantic Web deckt nicht das ganze Web 2.0 abSemantische Software muss nicht sozial sein (kann aber)nicht an bestimmte Software-Umgebung gebunden; alles kannsemantisch erweitert werden: Wiki, Blog, aber auch Desktopsagt nichts über Benutzerschnittstelle (z.B. Ajax)

⇒ Web 2.0 liefert die ideale Benutzerschnittstelle und die Community fürsSemantic Web

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 5 / 18

Page 9: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen OMDoc

Unsere Grundlage: das Datenformat OMDoc

Mathematik ist stark strukturiert und können wir gut, also probieren wirunsere Ideen zuerst daran aus ,

Open Mathematical Documents: „semantisches MathML“ auch fürgrößere Strukturen als FormelnWir betten Formeln in Kontext ein („Theorien“), um ihnenBedeutung zu geben: Definition/Satz/Beweis/Beispiel,Abhängigkeiten zwischen TheorienVon grober Strukturierung bis zu exakter FormalisierungWenn man das macht, können es Maschinen besser verstehen⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,automatisches Beweisen, Suchen, . . .Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragenAnwendungen in Physik, Geowissenschaften, Autoindustrie undRechtswesen geplant

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18

Page 10: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen OMDoc

Unsere Grundlage: das Datenformat OMDoc

Mathematik ist stark strukturiert und können wir gut, also probieren wirunsere Ideen zuerst daran aus ,

Open Mathematical Documents: „semantisches MathML“ auch fürgrößere Strukturen als FormelnWir betten Formeln in Kontext ein („Theorien“), um ihnenBedeutung zu geben: Definition/Satz/Beweis/Beispiel,Abhängigkeiten zwischen TheorienVon grober Strukturierung bis zu exakter FormalisierungWenn man das macht, können es Maschinen besser verstehen⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,automatisches Beweisen, Suchen, . . .Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragenAnwendungen in Physik, Geowissenschaften, Autoindustrie undRechtswesen geplant

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18

Page 11: Web-2.0-Forschung der KWARC-Gruppe

Grundlagen OMDoc

Unsere Grundlage: das Datenformat OMDoc

Mathematik ist stark strukturiert und können wir gut, also probieren wirunsere Ideen zuerst daran aus ,

Open Mathematical Documents: „semantisches MathML“ auch fürgrößere Strukturen als FormelnWir betten Formeln in Kontext ein („Theorien“), um ihnenBedeutung zu geben: Definition/Satz/Beweis/Beispiel,Abhängigkeiten zwischen TheorienVon grober Strukturierung bis zu exakter FormalisierungWenn man das macht, können es Maschinen besser verstehen⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,automatisches Beweisen, Suchen, . . .Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragenAnwendungen in Physik, Geowissenschaften, Autoindustrie undRechtswesen geplant

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18

Page 12: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

MathWebSearch: Suche nach mathematischen Formeln

http://search.mathweb.org

eine OMDoc-Anwendung für kleine Strukturen (= Formeln)a · (b + c) kann dasselbe sein wie (x + y) · z (Umbenennung vonSymbolen, Reihenfolge)MathWebSearch crawlt und indiziert mathematische DatenquellenSuchanfrage ist Formel mit Platzhaltern ((?+?)·?), System kenntEigenschaften der OperatorenBenutzerschnittstelle: Anfrage in XML-Sprache eingeben oder übergrafischen FormeleditorWebservice-API für andere Anwendungen

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 7 / 18

Page 13: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

MathWebSearch: Suche nach mathematischen Formeln

http://search.mathweb.org

eine OMDoc-Anwendung für kleine Strukturen (= Formeln)a · (b + c) kann dasselbe sein wie (x + y) · z (Umbenennung vonSymbolen, Reihenfolge)MathWebSearch crawlt und indiziert mathematische DatenquellenSuchanfrage ist Formel mit Platzhaltern ((?+?)·?), System kenntEigenschaften der OperatorenBenutzerschnittstelle: Anfrage in XML-Sprache eingeben oder übergrafischen FormeleditorWebservice-API für andere Anwendungen

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 7 / 18

Page 14: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 8 / 18

Page 15: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 9 / 18

Page 16: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 10 / 18

Page 17: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Locutor: Management of Change

eine OMDoc-Anwendung für große StrukturenViele Systeme können Dokumente verwalten, aber Abhängigkeitenzwischen diesen?

Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –nicht nur in der Mathematik

Eine Änderung einer Begriffsdefinition kann alleDokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!Wenn Michael Dokument A ändert, wie wirkt sich das auf DokumentB aus (. . . welches Matthias morgen bearbeiten will)?

Unterscheide Semantik-Änderung von Korrektur eines TippfehlersJe mehr strukturelle Semantik, desto bessere Assistenz

Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.Subversion) oder Wiki

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18

Page 18: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Locutor: Management of Change

eine OMDoc-Anwendung für große StrukturenViele Systeme können Dokumente verwalten, aber Abhängigkeitenzwischen diesen?

Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –nicht nur in der Mathematik

Eine Änderung einer Begriffsdefinition kann alleDokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!Wenn Michael Dokument A ändert, wie wirkt sich das auf DokumentB aus (. . . welches Matthias morgen bearbeiten will)?

Unterscheide Semantik-Änderung von Korrektur eines TippfehlersJe mehr strukturelle Semantik, desto bessere Assistenz

Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.Subversion) oder Wiki

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18

Page 19: Web-2.0-Forschung der KWARC-Gruppe

Projekte Was kann man mit OMDoc machen?

Locutor: Management of Change

eine OMDoc-Anwendung für große StrukturenViele Systeme können Dokumente verwalten, aber Abhängigkeitenzwischen diesen?

Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –nicht nur in der Mathematik

Eine Änderung einer Begriffsdefinition kann alleDokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!Wenn Michael Dokument A ändert, wie wirkt sich das auf DokumentB aus (. . . welches Matthias morgen bearbeiten will)?

Unterscheide Semantik-Änderung von Korrektur eines TippfehlersJe mehr strukturelle Semantik, desto bessere Assistenz

Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.Subversion) oder Wiki

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18

Page 20: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

arXMLiv: Annotation wissenschaftlicher Artikel

Automatisierte Gewinnung von OMDoc-Daten im großen StilarXiv: Server mit über 400.000 vorveröffentlichten wissenschaftlichenArtikelnNicht semantisch, Suche im Volltext oder nach KategorienarXMLiv: automatische Konvertierung der arXiv-Dokumente von LATEXzu strukturiertem (oder besser noch: semantisch annotiertem) XML. . . damit sie für MathWebSearch & Co. nutzbar werden ,

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 12 / 18

Page 21: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

arXMLiv: Annotation wissenschaftlicher Artikel

Automatisierte Gewinnung von OMDoc-Daten im großen StilarXiv: Server mit über 400.000 vorveröffentlichten wissenschaftlichenArtikelnNicht semantisch, Suche im Volltext oder nach KategorienarXMLiv: automatische Konvertierung der arXiv-Dokumente von LATEXzu strukturiertem (oder besser noch: semantisch annotiertem) XML. . . damit sie für MathWebSearch & Co. nutzbar werden ,

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 12 / 18

Page 22: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

SWiM: Semantisches Wiki für Mathematik

Community erstellt und bearbeitet (OMDoc-)WissenSemantisches Wiki = Wiki mit Semantic-Web-Erweiterungen

Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.Webmontag in Bremen)Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt anVeranstaltung teil“)Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)

OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einerOntologie) und navigierbar machen ; MehrwertdienstBisher Prototyp (mit Demo), noch viel zu tun:

Zerstörung von Abhängigkeiten verhindern (Management of Change)Social Tagging: Wie schwierig finden Leser ein Beispiel?Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18

Page 23: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

SWiM: Semantisches Wiki für Mathematik

Community erstellt und bearbeitet (OMDoc-)WissenSemantisches Wiki = Wiki mit Semantic-Web-Erweiterungen

Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.Webmontag in Bremen)Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt anVeranstaltung teil“)Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)

OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einerOntologie) und navigierbar machen ; MehrwertdienstBisher Prototyp (mit Demo), noch viel zu tun:

Zerstörung von Abhängigkeiten verhindern (Management of Change)Social Tagging: Wie schwierig finden Leser ein Beispiel?Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18

Page 24: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

SWiM: Semantisches Wiki für Mathematik

Community erstellt und bearbeitet (OMDoc-)WissenSemantisches Wiki = Wiki mit Semantic-Web-Erweiterungen

Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.Webmontag in Bremen)Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt anVeranstaltung teil“)Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)

OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einerOntologie) und navigierbar machen ; MehrwertdienstBisher Prototyp (mit Demo), noch viel zu tun:

Zerstörung von Abhängigkeiten verhindern (Management of Change)Social Tagging: Wie schwierig finden Leser ein Beispiel?Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18

Page 25: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 14 / 18

Page 26: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 15 / 18

Page 27: Web-2.0-Forschung der KWARC-Gruppe

Projekte Wo kriegt man die Daten her?

CPoint: Semantische Dokumente im Office

Einzelanwender schreibt OMDoc in vertrauter ArbeitsumgebungOMDoc-Editor als PowerPoint-Plugin (invasiver Editor)Strukturelle Semantik für Anwender: Keine spitzen Klammern mehrschreiben! ,

Migrationspfad: Annotation bereits vorhandener Kursfolien, Exportins Semantic Web möglich

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 16 / 18

Page 28: Web-2.0-Forschung der KWARC-Gruppe

Ausblick

KWARC und die Web-2.0-Community

Wir bieten: Semantic Web, Ontologien, formale Logik: solide Grundlagenfür ein besseres Web 2.0 – wenn sie wirklich angewendetwerden!

Wir suchen: Industriekooperationen, Wünsche der Anwender(Einzelanwender und Communities), Ideen fürBenutzerschnittstellen

Vielen Dank!

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 17 / 18

Page 29: Web-2.0-Forschung der KWARC-Gruppe

Quellen

Quellen

Semantic Web G. Antoniou, F. v. Harmelen: A Semantic Web Primer(Buch, 2004)B. Leuf: The Semantic Web: Crafting Infrastructures forAgency (Buch, 2006)

OMDoc M. Kohlhase: OMDoc: An Open Markup Format forMathematical Documents (Buch, 2006)

MathWebSearch M. Kohlhase, I. Șucan: A Search Engine forMathematical Formulae (Konferenzbeitrag, 2006)

Locutor N. Müller: An Ontology-Driven Management of Change(Konferenzbeitrag, 2006)

SWiM Ch. Lange: A Semantic Wiki for Mathematical KnowledgeManagement (Diplomarbeit, 2006; Poster)

CPoint A. Kohlhase: CPoint – ein invasiver, semantischer Editor fürwiederverwendaren Content in MS PowerPoint(Konferenzbeitrag, 2006)

Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 18 / 18