entwurf und realisierung einer digitalen bibliothek zur verwaltung von notenhandschriften dipl.-ing....
Post on 05-Apr-2015
111 Views
Preview:
TRANSCRIPT
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften
Dipl.-Ing. Temenushka IgnatovaDatenbank- und Informationssysteme, Universität Rostock
Tage der Forschung, Rostock 13.11.2003
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 2
Überblick
• Ziele und Aufgaben
• Die digitale Notenhandschrift
• Techniken und Werkzeuge
• System-Architektur
• Systemprozesse und -komponenten
• Subsystem für Schreibererkennung
• Arbeitsansatz
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 3
Ziele des Teilprojekts
• Interaktiver elektronischer Zugang zu den Notenhandschriften und ihren Metadaten für Online- Recherche für Musikwissenschaft und Öffentlichkeit
• Integration spezialisierter digitaler Werkzeuge und Techniken für die Handschriftanalyse historischer Notenhandschriften
• Einsatz in einer digitalen Bibliothek
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 4
Aufgaben digitaler Bibliotheken
• Archivierung von Sammlungen digitaler Informationsobjekte und Wahrung ihrer Integrität
• Bereitstellung von Informationsobjekten für interaktive Benutzung
• Bereitstellung von „ informationslogistischen Grundlagen für die Erzeugung und Integration neuen Wissens“
Zusammenfassung der Definitionen der „Digital Library Federation“ und Walter Umstätter: „Die Digitale Bibliothek: Inhalte und technische Anforderungen.“
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 5
Aufgaben der digitalen Bibliothek für Notenhandschriften
• Speicherung und Erschließung der Komponenten digitaler Notenhandschriften als Einheit
• Zugriffsmethoden für verschiedene Nutzerszenarios
• Integration spezialisierter Bildverarbeitungs- und Data Mining-Techniken sowie Werkzeuge für die Schreibererkennung
• Unterstützung der Schnittstelle bei der Integration in der digitalen Bibliothek der Universität Rostock
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 6
Die digitale Notenhandschrift
Bibliographische Daten
Werk- und Quellenbeschreibung
Digitalisate
Handschrift Charakteristiken
Bibliothekskatalog Digitalisate
Handschriftanalyse- Werkzeuge
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 7
Techniken
• Konkrete Techniken und Verfahren für digitale Bibliotheken nicht definiert, konkrete Ziele bestimmen optimale Lösung
• Hauptkriterien: Informationscharakteristik, -verarbeitung und -präsentation
• Speicherungs-, Retrieval- und Zugriffstechniken auf heterogene Daten, Techniken für die Benutzerschnittstelle für Browsen und Suchen in Beständen von Notenhandschriften
• Objektrelationale Datenbanken als grundlegende Umgebung (IBM DB2)
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 8
System-Architektur
Gescannte Seitenvon Notenhandschriften
TIFF
Handschriftenkatalog
LaTex
Daten-Extraktion
Bibliographische- und Quellenbeschreibungsdaten
Taxonomie derHandschriftenmerkmale
HTML
_______________________________________________________________________________________________________________________________________________________________________________
ORDBMS
_______________________________________________________________________________________________________________________________________________________________________________
Daten-Speicherung
Daten-Speicherung
DigitalisateHandschriften-
merkmalsvektoren
MetadatenSuche/
Navigation
Schreiber-Identifikation
UDFs und UDTs oder integrierte
externe Anwendungen
Extraktion derHandschriftenmerkmale
Klassifikation derHandschriftenmerkmale
HandschriftsmerkmalExtraktion
Clustering derHandschriftenmerkmale
Taxonomie derHandschriftenmerkmale
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 9
Daten-Extraktion
• Bibliographie- und Quellenbeschreibungsmetadaten aus dem Handschriftenkatalog – Extraktion von Daten und Aufbereitung als XML
• Handschriftenmerkmale – manuelle Analyse (Taxonomie)
• Handschriftenmerkmale – automatische Analyse (Bildverarbeitungstechniken)
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 10
Daten-Integrität
• Erweiterbare ORDBMS zur Speicherung von benutzerdefinierten Datentypen und entsprechende Methoden für Retrieval und Zugriff
• Integrität der verschiedenen Datentypen durch relationale Eigenschaften des Datenbanksystems garantiert
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 11
Notenhandschriften-Metadaten
• Verwendeter Notenhandschriften-Katalog entspricht z.T. RISM-Metadatenformat
• Für Integration in Universitätsbibliothek ist Abbildungsschema für eNoteHistory-Metadaten zu definieren – MAB2, RISM
• Handschriftencharakteristiken als Erweiterung für existierende Metadatenformate
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 12
Zugriffsmethoden
• Nutzerdefinierte Retrieval- und Zugriffsmethoden und existierende Erweiterungen in ORDBMS
• IBM Net Search Extender für Volltextsuche und IBM Intelligent Miner für Clustering und Klassifikation
• Integration von benutzerdefinierten Methoden für inhaltsbasiertes Retrieval auf Basis der Handschriftencharakteristiken
• High-Level API für standardisiertes Retrieval von Notenhandschriftendaten für Nutzeranwendungen
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 13
Nutzerszenarios
High-Level API für Daten-Retrieval und Zugriff
Nutzeranwendungen
Suche
Navigation
Schreiberidentifikation
ORDBMS
Bibliographische und Quellenbeschreibungs-
Metadaten
DigitalisateTaxonomie der Handschriften-
merkmale
Handschriften-merkmalsvektoren
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 14
System-Architektur
Gescannte Seitenvon Notenhandschriften
TIFF
Handschriftenkatalog
LaTex
Daten-Extraktion
Bibliographische- und Quellenbeschreibungsdaten
Taxonomie derHandschriftenmerkmale
HTML
_______________________________________________________________________________________________________________________________________________________________________________
ORDBMS
_______________________________________________________________________________________________________________________________________________________________________________
Daten-Speicherung
Daten-Speicherung
DigitalisateHandschriften-
merkmalsvektoren
MetadatenSuche/
Navigation
Schreiber-Identifikation
UDFs und UDTs oder integrierte
externe Anwendungen
Extraktion derHandschriftenmerkmale
Klassifikation derHandschriftenmerkmale
HandschriftsmerkmalExtraktion
Clustering derHandschriftenmerkmale
Taxonomie derHandschriftenmerkmale
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 15
Schreiberidentifikation
Merkmals-Clustering
Merkmals-Klassifikation
Ergebnis: Klassifikation
Notenhandschrift
Merkmals-Extraktion
Handschriften-merkmalsvektoren
Handschriften-merkmalsvektoren
Taxonomie der Handschriftenmerkmale
Handschriften-Clustering
Handschriften-Klassifikation
13.11.2003 Digitale Bibliothek für Notenhandschriften FB Informatik 16
Arbeitsansatz
• Evaluierung der existierenden DB2 Data Mining Clustering- und Klassifikationsverfahren im
„Intelligent Miner for Data“
• Vergleich und Evaluierung der Methoden zur Datenbankerweiterung – Integration externer Anwendungen, Implementierung eigener Erweiterungen
top related