My_X: my ExpertisesMaßgeschneiderte Online Analysen
László Pitlik, Ungarn
27. GIL-Jahrestagung, Stuttgart
05.03.2007.
INNOCSEKK 156/2006: Projektabschluss Anfang 2008
INNOCSEKK 156/2006
Gliederung:
• Ziele, Zielgruppen, Mehrwerte
• Vorgeschichte des Know How (Motivation)
• Geplante Dienstleistungen
• Aktueller Stand der Entwicklung
• Partnersuche, Referenzprojekte
• Zusammenfassung
INNOCSEKK 156/2006
Ziele, Zielgruppen, Mehrwerte:
• Strategische Ebene:– Demokratisierung der Data Mining Services– für alle, die alltägliche Entscheidungs-
probleme und wenig Daten, bzw. keine IT- Experten, keine eigenen großen Rechenkapazitäten haben…
• Wirtschaftliche Ebene:– Bezahlungen nach „prepaid-Logik“– Mehrsprachige Dienste
INNOCSEKK 156/2006
Vorgeschichte des Know How:
• unnötige Subjektivität in den Ähnlichkeits-analysen, Objektvergleichen, im Modellieren
• Vernachlässigung der automatisch generierte online Expertensysteme in der Wissensrepräsentation/Wissenstransfer
• zu sehr problemspezifisches Modellieren statt context free (vgl. CBR-basiert) zu denken
• mystische Einstellungen: viele Daten, bessere Modelle?
• offline Software-Packete mit vielen ungenutzten Modulen und jährlichen Lizenzgebühren
INNOCSEKK 156/2006
Subjektivität:
• Tenderbewertungen, Benchmarking und best practice Analysen anhand von willkürlichen (korrupten?) Gewichte-, Punktesysteme
• Bewerten ohne Bilanzieren (vgl. Preis <--> Leistungsverhältnisse)
• Argumentieren ohne Nachhaltigkeits-/ Konsistenzkontrolle (vgl. Politikdebatten)
INNOCSEKK 156/2006
Online Expertensysteme:
• Neben Fachbücher • viele gemeinnützigen Faktensammlungen • und automatisch ableitbaren online
Expertensysteme– z.B. Produktionsfunktionen, genetische
Potentiale auf Knopfdruck anhand von Testbetriebsdaten
– Verstehen von komplexen Bilanzkennzahlen durch „Zahlenmystik“…
INNOCSEKK 156/2006
Fallbasiertes Schließen:
• alles lässt sich anhand von Ähnlichkeiten (überraschend) logisch interpretieren!
• Quantenmechanik und Spieltheorie münden in der Ähnlichkeitsanalyse(!)?
• Methodisch gesehen: Archäologie = Futurologie(!)?
• Heuristik = im Unbewusstsein agierende Fakten(!)?
• KI = unbewusste Heuristikbildung in Quellcodes zu zwingen(!)?
INNOCSEKK 156/2006
Viele Daten, bessere Modelle?
• bei der Modellqualität zählen nur die extremen Faktenkombinationen
• Modellqualität hängt – von der Komplexität der zu verfolgende Ziele– und von der Datenqualität ab
• Gleich gute (alternative) Modelle gibt es viele…
INNOCSEKK 156/2006
Geplante Kerndienste:Dienstleistungsschleife:• beschränkte OLAP-Dienste, damit die Fakten
schnell und beliebig abfragbar werden…• Online Analysen, welche anhand der abgefragten
Daten (Objekt-Attribut-Matrizen) arbeiten können…• automatische Ableitung von Online
Expertensysteme, damit das entdeckte Wissen sofort weitergeleitet werden kann,
• automatische Berichterstellung (basierend auf Textbausteine) anhand der Analyseergebnisse…
• Rückführung der berechneten Werte in die OLAP-Dienste, damit Ergebnisse und Fakten zusammen visualisierbar werden…
INNOCSEKK 156/2006
Geplante Hilfestellungen:
Portal als virtuelles Klassenzimmer:• Online Bibliothek• Online Nachrichten• Online Foren• Wiki-Dienste• FAQ• Help• Mehrsprachigkeit
INNOCSEKK 156/2006
Aktueller Stand der Entwicklung:
• Anhand von Vorprojekten stehen Prototype von Hilfestellungsmodulen meistens bereits zu Verfügungen.
• Die Kerndienste (OLAP, Ähnlichkeitsanalyse, Expertensystem-generierung) wurden inzwischen auch als Prototype teilweise erstellt.
• Mehrsprachigkeitspotentiale sind in den Strukturen vorgegeben.
INNOCSEKK 156/2006
Laufende Arbeiten:
• Integration der Prototype
• Suchen nach benutzerfreundlichen Lösungen
• Testen der Prototype (Belastung, Funktionalität, Handhabbarkeit)
• Vorbereiten von neuen Kerndienste
• Konsultationen mit potentiellen Anwendern
• Iterative Entwicklungsschritte
INNOCSEKK 156/2006
Partnersuche, Referenzprojekte I.Bisher angeschlossene Hauptthemengebiete
Unterstützung:• für Anschaffungsprozeduren (vgl. Produkte),• bei der Auswahl jeglicher Art von Lieferanten,• für Prognosen (von Fußballergebnissen über Witterung
bis hin zu Börse)• der Konsistenzkontrollen (z.B. Segmentierungen,
Politikvarianten)• bei den Nachhaltigkeitskontrollen (z.B. Migration)• beim Ableiten von Produktionsfunktionen und
Expertensysteme• beim Entdecken von begrifflichen Zusammenhänge
INNOCSEKK 156/2006
Partnersuche, Referenzprojekte II.Ausgewählte Themen:• Politik
– Medikamente: minimieren von Nebenwirkungen und Kosten
– Ableiten der Idealkurve von Leitzinsen
• Landwirtschaft– Ableiten von Produktionsfunktionen,
Ertragstendenzen, genetische Potentiale– Auswahl von Zuchttieren– Anschaffung von Maschinen, Geräten, Futtermittel
INNOCSEKK 156/2006
Partnersuche, Referenzprojekte III.• Wirtschaft:
– Analyse von Bilanzergebnissen (best practice, benchmarking)
– Konkurrenzanalyse (Brandwerte, Preispolitik)– Prognosen der Preisentwicklung– Wald-, Acker-, Immobilienbewertung– Bewertung von Mitarbeitern
• Gesellschaft: – GDP vs. Kriminalstatistik– Entdecken von Umzugszwängen– Sportwetten
INNOCSEKK 156/2006
Zusammenfassung:
• Im Zentrum: Context free Methodik
• Triebkraft: Dienstleistungsschleife
• Mehrwertlogik: – ressourcen-schonendes Wirtschaftsmodell– Qualitätssicherung für Analyseergebnisse
• Lebenslanges Lernen: jeder ist Willkommen im virtuellen Klassenzimmer
INNOCSEKK 156/2006
Literatur:Nachhaltigkeitstagung:
http://miau.gau.hu/miau/101/mta_en.doc Universitätsbulletin:
http://miau.gau.hu/miau/91/bulletin_en.doc 26. GIL-Jahrestagung:
http://miau.gau.hu/miau/85/gil26_full.doc EFITA-Beitrag:
http://miau.gau.hu/miau/81/efitawcca2005_kjm_en.pdf Biomathematik-Tagung:
http://miau.gau.hu/miau/80/kjm_en_ecology.doc Nitra-Tagung: http://miau.gau.hu/miau/92/nitra_full.doc CAPRI-Report: http://miau.gau.hu/miau/101/bulletin_en.doc
INNOCSEKK 156/2006
Anhang: ceteris paribus
- Maisertrag (Y) vs. Düngemittelkosten- Klassen (X)- Übrige Variablen konstant gehalten- Produktionsfunktion durch Expertensystem mit 288 Stufen- Genetisches Potential: um 13t/ha - Berechnungen anhand von Testbetriebsdaten
Y
5400
56005800
60006200
6400
0 5 10 15
Y
INNOCSEKK 156/2006
Anhang: online Expertensystem I.
(Expertensystemstufen: Kostenpositionen in 1000HUF/Hektar)
Problem: Maisertragsfunktion
• automatisch abgeleitet (max. Herstellungszeit 30 Minuten)
• 8 Objekte (Regionen), 15 X-Attribute (Bilanzpositionen)
• Ergebnis: 288 Regeln (=3*4*2*2*2*3)
• 6 aktive Attribute, 9 passive (Geräusche)
INNOCSEKK 156/2006
Anhang: online Expertensystem II.
• Als aktiv anerkannte Attribute:– Genetik: Saatgutkosten und Tierzukäufe– Düngemittelkosten– Lohnkomponente
• Als passiv anerkannte Attribute:– Gesamtlohn– Kosten für Pflanzenschutzmittel?, Strom, Wasser,
Diesel, Futter, sonstige Materialien, Materialien insgesamt
– Gesamtkosten (Pflanzen-, Tierproduktion)