![Page 1: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/1.jpg)
Vom Zählerdenken zum KundendenkenDatenqualitätsmangement für EnergieversorgungsunternehmenDrs. Holger Wandt, Principal Advisor
![Page 2: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/2.jpg)
Energiemarkt in Deutschland• 1988: EU-Richtlinie zur Liberalisierung des
Energiemarktes führte 1998 zur Verabschiedung des neuen Energiewirtschaftsgesetzes in Deutschland
Einige Folgen:• Neue Marktteilnehmer• Auflösung der Versorgungsgebiete• Fusionswelle unter EVU’s• Regelung für Stromdurchleitung und Vergütung• Buchhalterliche Trennung der Unternehmensbereiche
Erzeugung, Übertragung und Verteilung Aus einstigen Monopolisten wurden
Energiedienstleistungunternehmen, die ihre Kunden kennen wollen
![Page 3: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/3.jpg)
Einheitliche Kundensicht
![Page 4: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/4.jpg)
Folgen? Ein fiktives Fallbeispiel.....• Mehrere Datenbanken von ungleicher Qualität (u.a.
durch Fusionen)• Aufbau eines zentralen Kundenbildes & Ermittlung von
potentiellen Dubletten im internen Datenbestand• Abgleich mit externen Dateien • Online–Kontrolle zur Vermeidung von neuen Dubletten• Online Suche• DQ-Maßnahmen für Adressen
Die Einführung einer Datenqualitätsstrategie, die beruht auf der Identifikation der Kundendaten
![Page 5: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/5.jpg)
Beim erkennen der Kunden geht es also um die Frage: Was ist was in Kundendaten?
![Page 6: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/6.jpg)
Was ist was?
• 3,14• π• 3,1415926535• 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, ….• 144 (Fibonacci-Reihe)
![Page 7: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/7.jpg)
Relationship data? Adressdaten? Kundendaten? Kontaktdaten? Stammdaten?
Was ist was?
![Page 8: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/8.jpg)
Frau Elisabeth Meier
![Page 9: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/9.jpg)
Mme. Françoise Durand
![Page 10: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/10.jpg)
Frau Anna Reiber-Sanders+49-69-445534-4600
![Page 11: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/11.jpg)
7483 Peter Arnold Frank
7195 Mohammed Ouazzani Benhaddou
4704 Panos Ioanides
![Page 12: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/12.jpg)
Int. Transp. Unt. GmbHHans-Dieter MeierBeim Schlump 1-520026 Hamburg
![Page 13: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/13.jpg)
Sven NilssonNybyn 10SE-234 56 LillbynSWEDEN
![Page 14: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/14.jpg)
ESAG Energieversorgung Sachsen Ost AG
![Page 15: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/15.jpg)
CQCS International Consulting Ltd.
![Page 16: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/16.jpg)
Dr. John J. Farren jr.
John J. Pharan jr. PhD
![Page 17: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/17.jpg)
Suomen Posti OYTuotteet/ Mediapalvelut/ Osoitepalvelut
![Page 18: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/18.jpg)
Was ist was in Kundendaten?
• Natural language processing:– Zergliederung der Bestandteile– Kontextanalyse – Überprüfung der Ambiguität– Syntaktische und semantische
Zusammenhänge– Phonetische Variation und Parität– Mustererkennung– Anwendung von landspezifischen Sprach-
und Kulturregeln
![Page 19: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/19.jpg)
Erfassung des Wissens
• Segmentierung (Definition der verschiedenen Datengruppen)
• Attribute der Gruppen• Attribute der einzelnen Wissenselemente• Zusammenhang (z.B.: Abkürzung oder Plural
eines Elements)• Regeln: Groß- Kleinschreibung, Interpunktion,
Silbentrennung, usw.
![Page 20: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/20.jpg)
Datenelemente näher betrachtet
Nachnamen:• Doppelnamen, Namen aus mehreren Teilen,
“ausländische” Namen, Adelsnamen• Diakritische Zeichen• Frequenzverteilung• Ambiguität
![Page 21: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/21.jpg)
BeispieleKarin Schönfelder-Kindermann Mathilde Baader StephanJosefine Freifrau Arz von StraussenburgAntonio Gomes Martinez de Pereira Rodriguez
Hermann BündenbänderHülya Ümmügülsüm
Heinz Müller Heinz Müllet
Thomas Lutz Lutz Thomas
![Page 22: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/22.jpg)
Namen aus anderen Sprachgebieten
Patronyme:
Sergei Ivanovich GolubevOlga Ivanovna Golubeva
Olav Svenson x Anna Thorgeirsdottir
Björn Olavson Majbritt Olavsdottir xHelga Nilsdottir
Sven Björnson
![Page 23: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/23.jpg)
Familienname?• auf der Straße• Säugling• Todeskino• Direktor• Vor
• zum Norde (jedoch: Zumnorde)• Matthauer (jedoch: Mathauer)• Üding (jedoch: Uedink)
![Page 24: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/24.jpg)
![Page 25: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/25.jpg)
Natural Language Processing
![Page 26: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/26.jpg)
Ambiguität, Kontextanalyse und Mustererkennung: natural language processingArt Gallery Meyer
Kunsthandel Art. Meyer
A. Meyer Fachgeschäft für Kunstart.
![Page 27: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/27.jpg)
Ambiguität, Kontextanalyse und Mustererkennung: natural language processing
Thomas Lutz
Thomas & Lutz
Schubert, Thomas & Lutz
![Page 28: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/28.jpg)
Muster
• Harry Edward Johnson / Harry Edward Ireallygotaweirdsurname
• IBM / HAL
• Maschinenfabrik Mertens / Vergaserinnenbeleuchtungsfabrik Mertens
![Page 29: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/29.jpg)
Muster?
KARL OTTO GRAF LAMBSDORFFEVA MARIA BARON POTOCKI
Hi-Fi Johanson & Gruber GmbHEm-Lo Emmerich und Lohmeier GmbH
![Page 30: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/30.jpg)
Zwischenfazit
• Verschiedene Arten von Kundendaten• Verschieden Attribute• Bedeutung ist abhängig vom länderspezifischen
Kontext und von semantischen und syntaktischen Zusammenhängen
Intelligente Interpretation is wissenbasiert. Wie hilft dieses Wissen bei Datenqualitätslösungen, wie z.B. Dublettenbereinigung?
![Page 31: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/31.jpg)
Wie hoch ist die Übereinstimmung?
August Meier Speditionsgesellsch. m.b.H
AMSPED GmbHWissensbasiert: Hohe
Übereinstimmung
Mathematisch: Niedrige Übereinstimmung
Dublette
Zweifel
Keine Dublette
![Page 32: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/32.jpg)
Einige Vergleichsmethoden
• Stringvergleich:– Wort– Wortbildvergleich– Trigrammvergleich
• Phonetischer Vergleich durch Graphem-Phonem-Umsetzung Milleaux oder Milo
• Wissensbasierter Vergleich: z. B. Wissen über Zusammensetzung Arabischer Namen Muhamad Abdullah al Musa Abu Ishaq oder Erkennung von kontextabhängiger Bedeutung Art Gallery Simon versus Paul Simon & Art Garfunkel
Die effiziente Kombination von Vergleichsmethoden ergibt das beste gewünschte Resultat.
![Page 33: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/33.jpg)
Beispiele
Piet Pieter Peter .pi .pi .pepie pie petiet iet eteet. ete ter
ter er.er.
![Page 34: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/34.jpg)
Beispiele
Src Global Id V-Id Name
M2 M2-0009424542
9424542 ANANSI BLUMEN
L1 L1-0039016324
39016324
GAERTNEREIBETRIEB ANANSI - WITT
M2 M2-0009439493
9439493 P.T.W.- FREIBURG
AS PH-PHYSIKWERK
46062 PHYSIK.TECHN.WERKSTÄTTEN
AS AS-0000018843
18843 TENHAGEN STAMM VERLAG
S1 DU-0403310154
10006645
Ten Hagen & Stamm GMBH
![Page 35: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/35.jpg)
Database-IDKlang NachnameKlang Kernwort StraßeKlang Kernwort OrtVornamenGekürzte VornamenKernwort NachnameKernwort StraßeHausnummer RestnamePostleitzahl Geburtsdatum
100010050501000707310010080
0
100
Beschreibungen VergleichsmethodenGewichtungs-
faktor
1510105510101020201010
Sub-score
Score 78
70 Schwellenwert
Konfiguration
Phonologischer VergleichMatrixvergleich
WortbildBuchstabensequenzTrigrammvergleich
HausnummerPostleitzahlen
DatumvergleichKein Vergleich
Evaluation
Resultat
Die effiziente Kombination von Vergleichsmethoden ergibt das beste gewünschte Resultat.
75
![Page 36: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/36.jpg)
Data Quality Life Cycle
Inspect
Merge
Enrich
Report
Cleanse
Transform
Identify
![Page 37: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/37.jpg)
Datenqualitätsstrategie
Assessment der Daten- und
Informationsstruktur
Assessment der Datenqualität
Besprechen der DQ-Probleme
und der Ursachen
Definieren der Lösungen und
Bereinigung der existierenden
Daten
Definierte Lösungen
implementieren
Verbesserung der
Datenqualität messenDefinieren der
Lösungen um zukünftige
Verschmutzung vorzubeugen (technisch +
Prozess)
Verbesserung der
Datenqaulität melden
Messen VerbessernImplemen-
tieren Pflegen
Datenqualität pflegen
![Page 38: Presentation Holger Wandt/HI 'Vom Zählerdenken zum Kundendenken](https://reader035.vdokument.com/reader035/viewer/2022062511/54bf20294a7959b6698b45a0/html5/thumbnails/38.jpg)
Fazit
• DQ-Probleme sind universell• Liberalisierung des Energiemarktes ist der
Katalysator für DQ-Lösungen für alle EVU’s• ROI für Energieversorgungsunternehmen ist
sehr hoch:– Know your customer– Operational excellence
Intelligente Tools führen zur effizienten DQ-Strategie:
Vom Zählerdenken zum Kundendenken