die grundlage für wichtige · montaje de yugo, hp = 10 item motor classification 26101600 power 10...
Post on 28-Oct-2019
4 Views
Preview:
TRANSCRIPT
<Insert Picture Here>
Product Data Quality
Verbesserung der Artikel-Stammdatenqualität,
automatisch und in Echtzeit
Ralf Kittel, Oracle
„Die Pflege von Stammdaten ist
die Grundlage für wichtige
Geschäftsprozesse und –
entscheidungen.“
The following is intended to outline our general
product direction. It is intended for information
purposes only, and may not be incorporated into
any contract. It is not a commitment to deliver any
material, code, or functionality, and should not be
relied upon in making purchasing decisions. The
development, release, and timing of any features
or functionality described for Oracle’s products
remains at the sole discretion of Oracle.
Safe Harbor Statement
Agenda
1. Datenqualität – Status Quo
2. Produkt-Stammdaten
3. Möglichkeiten der Qualitätssteigerung
4. Nutzen von semantischen Technologien
5. Integration in bestehende IT-Systeme
6. Beispiele aus Retail, High-Tech, Life Science, Public
7. Demo
Jede Firma braucht saubere Daten.
Viele glauben, sie trifft es nicht.
Doch es kann schon
zu spät sein.
Datenqualität
Quelle: Autobild.de
Warum kann ich nicht die
Berichtsergebnisse sehen, die ich
brauche?
Warum habe ich so viele doppelte
Daten? Die meinsten sind
inkorrekt.
Warum greifen meine
Anwendungen auf veraltete Daten
zurück?
Herausforderungen des Information Managements
Kontinuierliches Steigern der Datenqualität
„SAP-Anwender vertrauen der Qualität der eigenen
Daten nicht!“ Quelle: http://www.e3cms.de/index.php?id=3223
Neue Barc-Studie (Februar 2010) untersucht
Wahrnehmung von Datenqualität bei Anwendern von
SAP-Systemen.
Bild: Die wichtigsten Daten im Unternehmen
Quelle: BARC Institut, Würzburg, März 2011
Wie kritisch ist die Qualität Ihrer Unternehmensdaten
für unternehmerische Entscheidungen?
Quelle: BARC Institut, Würzburg, März 2011
Top 5 Probleme beim Einsatz von BI-SoftwareQuelle: The BI Survey 9 und BARC Institut, Würzburg, März 2011
Was sind Produktdaten?
Bei Datenqualität denken viele zunächst
nur an KundenstammdatenKunde
(PLZ, Ort, etc.)
Produkt (Benennung, Klassifizierung, Artikelnummer, Lieferant, Preis, Verfügbarkeit, Lagerort, Stückliste, SKU, Betriebsmittel, Verpackung, etc.)
Over 30,000 categories …Single format/ country
Kundenstammdaten
• Relativ feste Syntax
• Schreibfehler
• Namen Äquivalenten
• Abgleich basierend auf Wahrscheinlichkeiten
Artikelstammdaten
• Haben keine fixe Syntax – wenige Standards
• Unendliche Variabilität - Format, Inhalt, Syntax
• Haben unterschiedliche Regelungen für die einzelnen Artikelkategorien
• werden oft von mehreren Anwendungen bzw. Abteilungen verwendet/erzeugt
• sind bei analytischen Auswertungen oft die Kriterien, nach denen ausgewertet wird.
• werden meistens langfristig gehalten.
• Komplexe Lieferkette (Hersteller, Distributor, Zulieferer, …)
Artikelstammdaten
Unstrukturiert & nicht standardisiert
Was ist das?
10hp motor 115V Yoke mount
mtr, ac(115) 10 horsepower 115volts
MOT-10,115V, 48YZ,YOKE
This 10hp yoke mounted motor is rated for 115V with a 5 year warranty
10 Caballos, Motor, 115 Voltios
TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR
Motor, TEAO, 1725 RPM, 48YZ, 15 Voltios, Montaje de Yugo, hp = 10
Item Motor
Classification 26101600
Power 10 horsepower
Voltage 115
Mounting Yoke
Artikelstammdaten
Wie sie in IT-Systemen zu finden sind
Product IDManufa-
cturerDescription Product Type Power Voltage Mount
ABC123 AA Inc. 10hp motor 115V Yoke mount Motor, AC/DC 10hp 115V Yoke
abc-123 A.A. mtr, ac(115) 10 horsepower 115volts AC/DC Motor 10 115 AC.
ABC/123/Q AA/Craft 10 Caballos, Motor, 115 Voltios Mot-AC 10 H-pow 115
QA-ST5 Craft TEAO HP = 10.0 1725RPM 115V 48YZ YOKE MTR 26101604
Z99 Z99 MOT-10,115V,48YZ,YOKE Z99
Motor powered pulley, 3/4" Motor
Inkonsistente
Namen
Viele Informationen, aber
meistens nicht
standardisiert und
unberechenbar
Attribute nicht
standardisiert,
fehlend oder falsch
Falsch
klassifiziert
Inkonsisten
tes Format
Inkonsistente und
fehlerhafte
Klassifizierung
Vielfache
Dubletten
(oft schwer
zu
entdecken)
Verwendung von Produktdaten im
Order to Cash ProzessVertrieb, Entwicklung, Beschaffung, Planung, Herstellung …
• Lieferantendaten sind
oft nicht standardisiert.
• Produktdaten werden
oft in verschiedenen
Systemen geführt.
• Ungenaue Daten führen
zu Fehlern in der
Planung und in der
Fertigung.
• Bestellung auf Grund
von Fehlern im
Produktkatalog.
met
Asia OperationsEuropean Ops Service Providers Supply Network
Folgen schlechter Produktdaten
Kaizen: 7 Verschwendungsarten
7 Mudas
BeständeEnd-, Halbfertigprodukte,
Zulieferteile u. Materialien die als Bestände lagern sind nicht
wertschöpfend
7
TransportBewegung von Materialien
oder Produkten ist nicht wertschöpfend
5
Überproduktionmehr als notwendig fertigen
1
BewegungJede Körperbewegung, die
nicht zum Wertzuwachs beiträgt ist unproduktiv
4
Nacharbeit/FehlerFehlerhafte Produkte stören
den Produktionsfluss und erfordern teure Nachbesserung
3
2
Wartenuntätige Hände eines
Mitarbeiters. Prozesstaktung nicht optimiert
6Herstellung
Unzureichende Technologieoder Konstruktion
Muda = japanisch für Verschwendung
Häufige Lösungsstrategien …
reichen bei Artikelstammdaten nicht aus
Manual
– Viel zu teuer
– Viel zu langsam
– Nicht wirklich skalierbar
;3.5 MM 20 MM
* ^ | G = "MM" | ^ | G = "MM" | [{FM}="CATHETER" ] |
[{T1}="BALLOON"]| [{BR}!="OPTIPLAST"]
COPY [1] temp1
COPY_A [2] {Q1}
COPY "X" {C1}
COPY [3] temp2
COPY_A [4] {Q2}
RETYPE [1] 0
RETYPE [2] 0
RETYPE [3] 0
RETYPE [4] 0
CALL Ballon_Measurements
Individual-
programmierung
– Zeitaufwändig
– Zu viele
Ausnahmen
– Unvollständige /
zweideutige
Antworten
“Massenexport nach
Excel”
– Zu teuer
– Zu langasam
– Keine kontinuierliche
Kontrolle
SAP Excel-Export/Import für Stammdatenpflege
Manuelle StammdatenPflege mit Excel-Unterstützung
Quelle: http://www.e-3.de/
Der Lösungsansatz:
Automatisches Extrahieren, Aufbereiten, Validieren und
Speichern von Stammdaten
Extrahieren
SpeichernValidieren / Testen
Aufbereiten
Die Lösung: Oracle Product Data Quality Lifecycle
Iterativer Prozess zur langfristigen Verbesserung der
Datenqualität
Überwachen Analysieren
BereinigenAnreichern
Die Lösung: DataLens™
Automatisches Aufbereiten & Validieren
• DateLens™ entspricht einer optischen Linse
• Zeigt die Daten so an, wie gewünscht (eingestellt)
• keine „dauerhafte“ Datenhaltung
• Automatisch und in Echtzeit
• Enthält Kontextwissen über z.B.:
• verschiedenen Produktkategorien
• Vokabular
• Abkürzungen
• Regeln
• Attribute
• gültige Werte
• Übersetzungen
• Standards
• Klassifizierungen
• Informationserkennung im Zusammenhang (Kontext) und mit der richtigen
Bedeutung(Semantik)
• selbstlernend
• in jeden beliebigen Prozess integrierbar (z.B. Stammdatenanlage)
Aufbereiten & Validieren
Semantik macht den Unterschied.
Wikipedia: Semantik nennt man die Wissenschaft von
der Bedeutung der Zeichen und Wörter.
• Die Bank, 1000$
– Geldinstitut oder Sitzgelegenheit?
• 3M, Medizin
– 3 Meter oder Unternehmen?
• Schuh, 4 polig
– Laufschuh oder Klemmenschuh?
Was leistet die Semantische Erkennung von
Product Data Quality?
• Standardisieren von Attributen - jeder Standard
• Standardisieren von Beschreibungen - beliebige Länge oder Norm
• Übersetzen - von jeder Sprache in jede Sprache
• Klassifizieren mit jedem beliebigen Schema - UNSPSC, eClass, Zoll, etc.
• Validieren – Attributwerte
• Anreichern - aus externen Quellen
• Abgleichen - ID Prüfung, funktionelle Übereinstimmung, usw.
• Merge – Regelbasiertes Zusammenführen
• Gap-Analyse – Erkennen von fehlenden Informationen und ggf. anreichern
• Verbesserungsvorschläge
Standardisieren von Varianten in ein Format
• Standardformat kann jederzeit geändert werden
• Standardformat kann allgemeingültig sein oder z.B. für einen speziellen Artikel-Typ
Oracle Product Data QualityErkennen von Standards & Konvertierung/Umrechnung
Data StandardizationAutomatisches Data-Cleansing
Keine Standarddaten (vorher)
Data
StandardizationEngine
Standardisierte Data (nachher)
Standardisierung der Item Beschreibung
Übersetzen von jeder Sprache in jede Sprache
Attribute extrahieren und standardisieren
Klassifizierung
Industrie-und Unternehmensstandards anwenden
1
2
3
4
5
RESPCF AX300OHM1/4W5%
220 ohm CF AX 0.5W 10 % ress
English
Spanish
Russian
Description
Resistance Power Tolerance
Catalog Category UNSPSC Procurement Class
1
2
4
3
5
300 Ohm 0.25 Watt 5%
Resistor 32121609 R-I
Resistor 300 Ohm 5% 0.25 Watt Axial Carbon Film
Resistor 300 Ohmio 5% 1/4 Vatio Película Axial de Carbón
Резистор 300 Ом 5% 1/4 Ватт Аксиальная Карбонная Пленка
English
Spanish
Russian
Description
Resistance Power Tolerance
Catalog Category UNSPSC Procurement Class
220 Ohm 0.5 Watt 10%
Resistor 32121609 R-X
Resistor 220 Ohm 10% 0.5 Watt Axial Carbon Film
Resistor 220 Ohmio 10% 0.5 Vatio Película Axial de Carbón
Резистор 220 Ом 10% 0.5 Ватт Аксиальная Карбонная Пленка
Die Lösung: Oracle Product Data Quality (PDQ)
Extrahieren und Publizieren von Stammdaten
Extrahieren Speichern/Publizieren
CRM
EBS
SAP
GDSN
Other
Users
CRM
EBS
SAP
Custom Apps
BI
Extrahieren: Oracle PDQ kann Daten aus vielen verschiedenen Datenquellen extrahieren, z.B. Texte, Microsoft Excel-Tabellen, Web Services, XML und Datenbanken. Dabei kann PDQ sogar auf implementierte DB-Funktionen/Prozeduren zugreifen.
Publizieren: Oracle PDQ kann die bearbeiteten Daten in verschiedenen Zielsysteme speichern - auch gleichzeitig in mehrere Zielsysteme z.B. im XML-, Excel- oder Text-Format. Die Daten können auch automatisch an einen FTP-Server versendet werden.
CRM
EBS
SAP
GDSN
Other
Users
CRM
EBS
SAP
Custom Apps
BI
Prozessintegration Oracle PDQ Integration in ein MDM/PIM-System und Prozess
Product Data HubRecord
Sh
are
Co
nso
lid
ate
Govern
Cleanse
Integration in jedes beliebige MDM/PIM-System.
Standardintegrationen verfügbar, oder via Web-Services u/o
SOA-Architektur.
Typische Einsatzgebiete
• Migrations-/Systemharmonisierungsprojekte
• Datenintegrationsprojekte
„Wie sehen die Daten aus, die zusammengeführt werden sollen“
• Business Intelligence („Garbage in garbage out“)
• Kostenreduktion im Beschaffungswesen, z.B.
Lieferantenreduktion – Wer liefert was? Ausgabenanalysen, etc.
• Reduktion Time-to-Market, z.B. Teilereduktion
• User Experience im Webshop steigern
• Stammdatenübersetzung/-normierung
• Funktionserhöhung innerhalb IT-Anwendungen (z.B. ERP, PLM, SCM)
• Governance und Compliance
• Integration in MDM/PIM
• Risikomanagement
• Fehlermanagement
• Vollständigkeitsprüfung
• Data Quality Firewall /-Lifecycle
Product Data Quality – Auszug aus unsere Kundenliste
Manufacturing & Distribution Healthcare Retail
MC Healthcare/ Nihon Hospital
Beispiel: Elektronische Komponenten - WiderstandAnalysieren, Extrahieren, Transformieren, Standardisieren -
pro Produktkategorie
Sehr variable Syntax (Muster)
DataLens
Semantische Erkennung identifiziert die
Artikelkategorie und die Attribute mit sehr variablen
Daten.
Der Artikel kann dann wie gewünscht gereinigt
(standardisierten) werden.
Extraktion und Standardisierung
der Attribute
Klassifikation gemäß verfügbaren Schemas
und Industrie- oder eigene Standards
Normierte Beschreibungen passen zu allen Standards und
Formate
Übersetzung in jede beliebige Sprache (inkl. double-byte
Sprache)
DataLens™
Beispiel: BüroordnerAnalysieren, Extrahieren, Transformieren, Standardisieren -
pro Produktkategorie
Description
GLOVE PROTEGRITY SMTH GRIP MICRO PF LATEX SURG 6.0" LRG 100 / BX 5LBS
GLOVE LARGE 100EA PROTEGRITY PF LATEX SURGICAL 6.0" TEXTURE GRIP
GLVS LINER PWD 6.0" FR LTX SUG TEXT GRP ULTRATUFF CUT RESIST STRL LG
PROTE GLVS SURG LARGE PF SMTH GRIP CASE OF 1000 LTX BLU 9.0IN.
GLVE PROTGRITY TEXT SMT PF LATX SURG 7.5IN MD 250 CTN 10LBS
GLVE PROTEGRITY TEXT 100 BOX PF LATEX SURGICAL 5.5IN 20-LBS. MEDIUM
LF GLOVES TEXT ESTM SMT PF SYNTHETIC XLG SURG 7.5IN. 500 / CASE 20 LBS.
GLOV EXAM LTX 7.5IN FREE SYN ( VINYL ) VHA+ PF N/S SM 17.5 LBS.
XLRG GLOVES SMTH STERILE PWD LTX PROCEDURE 8.0IN
GLOVE EXAM TEXT 6.5" LTX FR N/S PWD VINYL INSTAGARD SM TEXT GRIP
GLOVE 8IN. SMTH MD NOVA PLUS PF NITRILE EXAM TEXTURE
CR100BT BROWN 8" SMOOTH GRIP LATEX MED CLEANRM GLOVE 5.5 IN 10 LBS TUFFY
ESTEEM 6.5" GLOVE EXAM BOX OF 100 LATEX VHA+ TEXT PF N/S LG 50LBS
SMTH GRIP ESTM 7.5" GLOVE LF EXAM SYN VHA+ PF N/S MED 12 DOZ 100OZ.
GLV PF ESTEEM NEU-THERA 8.5IN. NITRILE EX SZ XL 5PDS
GLV EXAM PF SYN ESTEEM W/NEU-THERA 7.0" SZ MD 200/BOX 20-LBS
MED GLVE EXAM N/S PF 500 COUNT LATEX POSITIVE TOUCH ESTEEM 7.5"
GLV EXAM ESTEEM LATEX VHA+ TXT PWDRLESS N/S 5.5" XS 100 PER CTN
TUFFY CR100BT BROWN LATEX CLEANROOM GLOVE 8.5 " SMOOTH GRP 10LBS. XLRG
XS GLV CLN PROCES TXT GRP ULTRACLEAN 100 PER BX STER SYN DURAPRENE CP 7.5IN 12LBS.
Beispiel: Medizinische Handschuhe (Life Science)
Item Type Size Materials Grip Brand Length Shipping Weight
Surgical Large Latex Smooth Protegrity 6.0 IN. 5 LBS.
Surgical Large Latex Textured Protegrity 6.0 IN.
Surgical Large Latex Textured Ultratuff 6.0 IN.
Surgical Large Latex Smooth Protegrity 9.0 IN.
Surgical Medium Latex Smooth Protegrity 7.5 IN. 10 LBS.
Surgical Medium Latex Textured Protegrity 5.5 IN. 20 LBS.
Surgical Extra Large Synthetic Textured Esteem 7.5 IN. 20 LBS.
Exam Small Latex 7.5 IN. 17.5 LBS.
Procedure Extra Large Latex Smooth 8.0 IN.
Exam Small VINYL Textured Instagard 6.5 IN.
Exam Medium Nitrile Smooth Nova Plus 8 IN.
Cleanroom Medium Latex Smooth Tuffy 8 IN. 10 LBS.
Exam Large Latex Textured Esteem 6.5 IN. 50 LBS.
Exam Medium Synthetic Smooth Esteem 7.5 IN. 100 OZ.
Exam Extra Large Nitrile Esteem 8.5 IN. 5 LBS.
Exam Medium Synthetic Esteem 7.0 IN. 20 LBS.
Exam Medium Latex Positve Esteem 7.5 IN.
Exam Extra Small Latex Textured Esteem 5.5 IN.
Cleanroom Extra Large Latex Smooth Tuffy 8.5 IN. 10 LBS.
Cleanroom Extra Small Synthetic Textured Ultraclean 7.5 IN. 12 LBS.
Extract & Standardize
Sehr variable Syntax (Muster)
Beispiel: Grundbuch Dokumente (Freitext)
Beispiel:
Grundbuchinformationen in Freitext. Wichtige Informationen sind aus dem Text extrahiert worden, um strukturierte Suche zu unterstützen.
39
Data Mastering in Action
Sampled 28k items across 20 categories
2120 Capacitors:
11976 Resistors:
Corrected, enriched, standardized
…in real-time
Primary Resistor Attributes
Before
% Populated
Resistance 39%
Tolerance 36%
Power 35%
Classification - DRI 40%
Classification - HTS 15%
Classification - UNSPSC 0%
After
% Populated
96%
98%
98%
100%
100%
100%
Primary Capacitor
Attributes
Before
% Populated
Capacitance 23%
Tolerance 23%
Voltage 21%
Classification - DRI 40%
Classification - HTS 15%
Classification - UNSPSC 0%
After
% Populated
98%
99%
98%
100%
100%
100%
40
Standardize & validate for load
ItemHub
Search
X-RefExternalDB
Cleanup legacy
Transform and integrate between systems
Drive Standards System-by-System, Process-by-Process
42
Data Challenges – Same Product, Different Numbers
3M™ DuraPrep™ Surgical Solution (Iodine Povacrylex [0.7% available Iodine] and Isopropyl Alcohol, 74% w/w) Patient Preoperative Skin Preparation
Allegiance - M8630
Owens & Minor - 4509008630
BBMC-Colonial - 045098630
BBMC-Durr - 081048
Kreisers - MINN8630
Midwest - TM-8630
Pacific - 3/M8630
UnitedUMS - 001880
Industry Distributor Numbers
for 3M Product # 8630:
Different distributors and hospitals
use different identification numbers
Oracle PDQ - Zusammenfassung
Quality Governance – Data Steward Dashboard
Standardize• Std. Classification(s)
• Std. Attributes
• Std. Descriptions
• Translate (inbound)
Match• De-duplicate
• Merge
Repurpose• Translate (outbound)
• (Re-)classify
• (Re-)standardize
• (Re-)format
Exception Management – Validation & Remediation
Enrich• Classify
• Extract/append info
Semantic Recognition – Contextual understanding & learning
top related