Gottfried Vossen5. Auflage 2008
Datenmodelle, Datenbanksprachen
und Datenbankmanagementsysteme
Kapitel 16: Grundlagen des Data Mining
© 2008 Gottfried Vossen
16.1 Einführung
16.2 Klassifikation
16.3 Clusterbildung
16.4 Assoziationsanalyse
16.5 Sequenzanalyse
16.6 Web-Mining
Inhalt
Datenmodelle, 5. Auflage, Kapitel 16 2
© 2008 Gottfried Vossen
Datenquellen (Operationale Datenbanken)
Datenlager(Data Warehouse)
Data Cleansing, Extraction,
Transformation, Loading (ETL)
Selektion
Mining-Resultate
Data Mining
Wissen, Information
Interpretation,Visualisierung
Relevante Daten
16.1 Der KDD-Prozess
3Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
Data Mining
voraussagend(predictive)
beschreibend(descriptive)
KlassifikationClustering
Assoziations-analyse
Sequenz-Analyse
Web-Analyse
16.2 Data Mining in der Übersicht
4Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
Abschluss
Einkommen Einkommen Einkommen
ohne Bachelor Master
-30K 30-50K 50-80K 80+K
16.3 Beispiel einer Klassifikation
5Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.4 Beispiel einer in Cluster aufzuteilenden Datenmenge
6Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.5 Erstes Clustering
7Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.6 Alternatives Clustering
8Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.7 Beispiel einer Warenkorbtabelle
9Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.8 Nach KundenIDs sortierte Warenkorbtabelle
10Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
ABCD
ABC ABD ACD BCD
AB AC BC AD BD CD
A B C D
{}
16.9 Beispiel zum Dynamic Itemset Counting (DIC)
11Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.10 Warenkorbtabelle zum FP-Growth-Verfahren
12Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
{}
f:1
c:1
a:1
m:1
p:1
Kopftabelle
Item Häufigkeit Kopf f 1c 1a 1b 1m 1p 1
16.11 Erster Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung 16.10
13Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
{}
f:2
c:2
a:2
b:1m:1
p:1 m:1
Kopftabelle
Item Häufigkeit Kopf f 2c 2a 2b 1m 2p 1
16.12 Zweiter Schritt zur Erzeugung des FP-Tree zum Warenkorb aus Abbildung 16.10
14Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
{}
f:4 c:1
b:1
p:1
b:1c:3
a:3
b:1m:2
p:2 m:1
Kopftabelle
Item Häufigkeit Kopf f 4c 4a 3b 3m 3p 3
16.13 Endgültiger FP-Tree zum Warenkorb aus Abbildung 16.10
15Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.14 Beispieltabelle studentischer Aktivitäten
16Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.15 Beispiel einer Episode
17Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.16 Beispiel einer Signalfolge
18Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.17 Windows in einer Signalfolge
19Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.18 Beispiele für Episoden
20Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
Webseite Hyperlink
16.19 Das Web als Graph
21Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
Such-maschinen
-Index
Benutzeranfrage
Indexer
Laufzeitsystem
Crawler
InternetWebseiten
16.2
0 G
rund
sätz
liche
Arb
eits
wei
se
eine
r Suc
hmas
chin
e
Datenmodelle, 5. Auflage, Kapitel 16 22
© 2008 Gottfried Vossen
Gefundene Dokumente
Relevante und gefundene Dokumente
Relevante Dokumente
Alle Dokumente
16.21 Ergebnisklassifikation im Information Retrieval
23Datenmodelle, 5. Auflage, Kapitel 16
© 2008 Gottfried Vossen
16.22 Ausschnitt aus dem Log eines Web-Servers
24Datenmodelle, 5. Auflage, Kapitel 16