Universität Dortmund
Lehrstuhl für künstliche Intelligenz
LS 8 – Künstliche Intelligenz
Prof. Dr. Katharina Morik
Timm Euler, Felix Jungermann, Ingo Mierswa, Michael Wurst
www-ai.cs.uni-dortmund.de
Universität Dortmund
Hauptstudium
• Eigentlich ist die Universität immer die Gemeinschaft der Lehrenden und Lernenden.
• Spätestens aber im Hauptstudium wird gemeinsam geforscht!
Wissen
Universität Dortmund
K ü n s tlich e In te llig en z
N atü rlich sp rach lich e S ys tem e:B era tu n g ssys tem e
Textvers teh enM asch . Ü b erse tzu n g
M asch in e lles L ern en :B eg riffserwerb
W issen sen td ecku n g
W issen s rep rä sen ta tion :P lan u n g ssys tem e
w issen sb as ie rte P rob lem lö su n gA u tom atisch es B ew e isen
B ild verarb e itu n g :B ild - u n d S zen en vers teh en
g ra fisch e S ys tem eM u s tere rken n u n g
Linguistik
Statistik
Logik
Psychologie
Mustererkennung
Lernbarkeit
evolutionäre Strategien
LS6
LS7
LS12
LS8LS2
LS11
Universität Dortmund
LS8-Schwerpunkt: Maschinelles Lernen
• Textsammlungen – Web 2.0– Automatische Auszeichnung von Textteilen
• Induktive Datenbanken (data mining)– Welche Kunden werden
• ihren Vertrag kündigen?• mein neues Produkt kaufen?
• Mediensammlungen– Strukturierung nach verschiedenen Aspekten
Universität Dortmund
LS8-Stil
Eine gute Theorie ist die beste Praxis!• Systeme entwickeln, die weltweit eingesetzt werden
– MOBAL– Yale (jetzt: RapidMiner)
• Theoretische Aussagen, die den Beobachtungen entsprechen – Vollständigkeit der gefundenen Regeln– Fehlerschranke nah an beobachteten Fehlern– Inspektionsmöglichkeiten
Universität Dortmund
Lebenszyklus der Forschung
• Stützvektormethode zur Textklassifikation:– Formales Modell TCat– Schranke des erwarteten
Fehlers
Thorsten Joachims 2002
• Induktive logische Programmierung:– Obere und untere
Lernbarkeitsschranke gemäß LE, LB, LH
– Schnellster Beweiser für eingeschränkte Hornlogik
Jörg-Uwe Kietz 1996
• Lernen von Merkmalsextraktionen aus Musikdaten (Mierswa 2002)• Organisation von Musiksammlungen (Wurst 2005)• Automatische Erkennung von
Eigennamen (Rössler 2006)•Verteiltes data mining
Universität Dortmund
Musikdaten
• Klassifikation von Musikstücken nach Benutzerpräferenzen– Automatische Merkmalsextraktion
• Clustering von Musiksammlungen nach verschiedenen Gesichtspunkten
• Verteiltes kollaboratives Strukturieren
Jetzt das selbe für Videos?
Universität Dortmund
Nemoz
NEtwork Media OrganiZer:
Collaborative clustering in P2P networks
Einbindung von Yale
Kopieren
Clustering
Klassifikation
Stöberngemäß eigener Präferen
zen
Universität Dortmund
Lehre am LS 8
• Vorlesung "Wissensentdeckung und maschinelles Lernen (Data Mining)“ mit Fachbereich Statistik 4V+2Ü jedes Sommersemester
• Vorlesung „Maschinelles Lernen“ rein Informatik 2V + 2Ü WS 2006/7
• PGs:– KDD Cup (endete SoSe 2004)– Kollaboratives Strukturieren von Multimediadaten in
peer2peer-Netzen (endete SoSe2005)– Intelligence Service – Informationsextraktion aus dem Web
• Seminare zu Spezialthemen
Universität Dortmund
Abgeschlossene Diplomarbeiten...
• Stephan Deutsch (2006). Outlier Detection in Usenet Newsgruppen.
• Benjamin Helbig (2005). Eine Umgebung zur Informationsextraktion aus Geschäftsbriefen.
• Mierswa, Ingo (2004). Automatisierte Merkmalsextraktion aus Audiodaten.
• Hüppe, Christian (2003). Benutzergeführtes Lernen von Dokumentstrukturauszeichnungen aus Formatierungsmerkmalen.
• Michaelis, Stefan (2000). Techniken des Data Mining zur Analyse von Telekommunikationsnetzwerken
Universität Dortmund
Erwartungen an Diplomandinnen
• Von der Anwendung zur Methode zur Theorie und wieder zurück!
• Fragestellungen aus der Anwendung in solche des Fachs übertragen
• Algorithmen entwickeln• Vorhandene Systeme erweitern• Sorgfältige Evaluation• Und...
Universität Dortmund
Lesen!
• Bücher:– Hand, Mannila, Smyth– Mitchell– Schölkopf, Smola
• Zeitschriften:– JMLR (im WWW)– MLJ (Kluwer)– Knowledge and
Information Systems (Springer)
• Proceedings:– ICDM– KDD– PKDD– ICML– ECML
Universität Dortmund
Offene Diplomarbeiten -- Beispiele
• Entdecken wissenschaftlicher Communities anhand von home pages.
• Lernen von taggings mit SVMstruct
• Automatische Merkmalsextraktion aus Bilddaten
• Personalisierte Literaturempfehlung für interdisziplinäres Arbeiten