Download - Business Intelligence Vorstellung der Ergebnisse des Business Intelligence Projekts

Business Intelligence

Vorstellung der Ergebnisse

des Business Intelligence Projekts

Master Digitale Logistik und Management

Präsentiert von: Maxim Beifert, Mohamed Oukettou

Gliederung

Ist-Situation und Datenvorbereitung• Datensäberung• Datenreduktion

Data Mining Verfahren• Naive Bayes• Clustering mit K-Means• J48/ ID3

• Schlussfolgerung

Ist-Situation und Datenvorbereitung

Ist-Situation:

Insgesamt 54 und 234 Datensätze. Verschiedene Themen (Finanzen,

Wohnsituation, Studium, Freizeit, Verkehrsmittel, Zufriedenheit).

Datenvorbereitung• Datensäuberung: fehlende Daten manuell einfügen. inkonsistente Daten Betriebswirtschaft- Bachelor BW Wirtschaftsinformatik- Bachelor WI

Datenvorbereitung

• Datenreduktion (Ausgangspunkt 54*234= 12636) auf 34 Spalten und Datensätze von 234 auf 229 (34*229= 7786)

Ausblenden von Attributen: z.B wie bewegst dich in Wismar (Anderes und

Motorad) fast 100% benutzen kein Motorad sowie keinen anderen

Verkehrsmittel

Entfernen von Datensätze

Zusammenfassen von Attributen:– In welchen Wohnverhältnissen lebst du (Eigentumswohnung- Mietwohnung- Wohngemeinschaft-

Studentenwohnheim- Eltern)

– wie kommst Du zur Hochschule (Bahn, Bus, Auto, Fahrrad, ZuFuß)

– Wie bewegst Du Dich in Wismar (Bus- Auto- Fahrrad- Zu Fuß)

Datenvorbereitung

Finanzen Wohnsituation Studium Freizeit Verkehrsmittel Zufriedenheit

-Bafög- finanzielle Unterstützung - Arbeit- Budget

-Wohnverhältnis- Fläche

-Studiengang- Semester- Erstsudium- Grund für S in Wismar-Leistung im S

-Fernseher - Fernseh (Std)- Onlinespiele- (Std)-Sport-WE in Wismar

-Ankunft nach Wismar- Bewegung in Wismar

-Zufriedenheit mit der Lebens-situation- Zufriedenheit mit der S Leistung

Ziel: Zufriedenheit mit der aktuellen Lebenssituation als Student in Wismar vorhersagen

Data Mining Verfahren

• Naive Bayes:

Am Anfang wählen wir alle KategorienUnd erzielen wir die Ergebnisse:


• In einer anderen Vorgehensweise nehmen wir die Kategorien im einzelnen Die Tabelle zeigt die erzielten Ergebnisse

Themen Accuracy % ; Anzahl von Daten

Error % ; Anzahl von Daten

Finanzen 45,6 ; 21 54,3 ; 25

Studium 41,3 ; 19 58,6 ; 27

Wohnsituation 52,1 ; 24 47,8 ; 22

Freizeit 45,6 ; 21 54,3 ; 25

Zufriedenheit 52,1 ; 24 47,8 ; 22

Verkehrsmittel 58,6 ; 27 41,3 ; 19


• Clustering K-Means

• K= 5 k= 4


• Clustering K-Means


• Entscheidungsbaum mit J48 und ID3 • J48


• J 48

Themen Accuracy % ; Anzahl von Daten

Error % ; Anzahl von Daten

Finanzen 47,8 ; 22 52,17; 24

Studium 30,4; 14 69,5%; 32

Wohnsituation 47,8; 22 52,1; 24

Freizeit 54,3; 25 45,6; 21

Zufriedenheit 47,8; 22 52,1; 24

Verkehrsmittel 43,4; 20 56,5; 26


• ID3• Im allgemein das Verfahren von ID 3 Algorithmus sieht aus wie J48

Schlussfolgerung

• Umsetzung die Theorie in der Praxis

• Verwendung von verschiedenen Verfahren des Data Mining

• mit dem Naive Bayes Verfahren erzielt man die besten Ergebnisse

• J48 und ID3 sind Verfahren zur Generierung von Entscheidungsbäume

und liefern fast die gleiche Egebnisse

Download - Business Intelligence Vorstellung der Ergebnisse des Business Intelligence Projekts

Top Related