Die ZBW ist Mitglied der Leibniz-Gemeinschaft
Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft
Kirsten Jeude 12.04.2013
Metadaten-Management im Leibniz-Informationszentrum Wirtschaft
„metadata“ Shira Golding, https://secure.flickr.com/photos/boojee/3743753784/in/photostream
Seite 2
Auf Du und Du mit Dublin Core & Co. – Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft
1. Was sind Metadaten? 2. Metadatenstandards (inkl. Exkurs XML) 3. Application Profiles und Interoperabilität 4. Mapping 5. Schnittstellen 6. Metadaten im Semantic Web 7. Metadaten-Management in der ZBW 8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der
Zukunft
Gliederung
1. Was sind Metadaten?
Seite 3
Was sind Metadaten? Definitionen über Definitionen • „… are (structured) data about data.“ Miller, Eric: An introduction to the resource description framework. In: D-Lib Magazine, (May) 1998; Foulonneau, Muriel; Riley Jenn
(2008): Metadata for Digital Resources; u.v.m.
• „Unter Metadaten ("Daten über Daten") versteht man strukturierte Daten, mit deren Hilfe eine Informationsressource beschrieben und dadurch besser auffindbar gemacht wird.“
SUB Göttingen Metadata Server
• „… structured, encoded data that describe characteristics of information-bearing entities to aid in their identification, discovery, assessment, and management of the described entities“
American Library Association´s Committee on Cataloguing
• „… is any type of formal description of a resource, regardless of format“ Mitchell, Nicole: Metadata Basics (The Southeastern Librarian, Fall 2006)
• „…is cataloging done by men“ Delsey, Tom, National Library of Canada
• „… is machine understandable information about web resources or other things.“ Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997.
• „An item of metadata is a relationship that someone claims to exist between two entities.“ Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources • „I like to think of metadata as data which removes from a user (human or machine) the need
to have full advance knowledge of the existence or characteristics of things of potential interest in the environment“
Lorcan Dempsey, zit. in: Foulonneau, Muriel; Riley Jenn (2008): Metadata for Digital Resources
Seite 4
Metadata “is machine understandable information about web resources or other things.“ (Tim Berners-Lee)
Web-Ressourcen:
Seite 5
Andere Dinge:
Bücher und Zeitschriften etc.:
Museums-Objekte: Bilder:
Tonträger:
Personen:
Metadata “is machine understandable information about web resources or other things.“(Tim Berners-Lee)
Seite 6
Karteikarte im Zettelkatalog
Metadaten – getrennt vom Objekt Metadaten – im Objekt enthalten
CIP (Cataloging in Publication)
Datensatz in bibliographischer Datenbank
Header einer HTML-Seite mit Metadaten
Metadata „is any type of formal description of a resource, regardless of format“ (Nicole Mitchell)
Metadaten in Form von COinS (Mikroformat) in HTML-Seite
Seite 7
Metadata „are (structured) data about data“ (Eric Miller)
Metadaten sind „Daten über Daten“
Daten - Buch „Daten über Daten“
Metadata / Marcia Lei Zeng and Jian Qin
Zeng, Marcia Lei *1956-*
Qin, Jian *1956-*
London : Facet, 2008
xvii, 365 p. : ill. ; 23cm
Includes bibliographical references and index
1-85604-655-9, 978-1-85604-655-8 (pbk)
Metadaten
STRUKTURIERTE
Metadaten-Schema
Titel
Verfasser
Sonstige beteil. Person
Erschienen:
Umfang
Anmerkung
ISBN
Schlagwörter
Seite 8
Metadata „are (structured) data about data“ (Eric Miller)
Metadatenformate (maschinen-lesbar)
Bezeichner eines Merkmals (Menschen-lesbar)
4000 Suchen mithilfe semantischer Metadaten (PICA3)
021A $a Suchen mithilfe semantischer Metadaten (PICA+)
331Suchen mithilfe semantischer Metadaten (MAB)
245 00 $a Suchen mithilfe semantischer Metadaten (MARC21)
<titleInfo><title>Suchen mithilfe semantischer Metadaten</title></titleInfo>
(MODS)
Grundsätzlich und pragmatisch
Seite 9
PPN: Titel: Verfasser: Sonst. Personen: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: Mehr zum Thema:
Zeng, Marcia Lei Verfasser: Metadaten-Element
Metadatensatz
folgt Regeln (z.B. Nachname Komma Leerzeichen Vorname)
Element-Wert
571230652 Metadata / Marcia Lei Zeng and Jian Qin Zeng, Marcia Lei *1956-* Qin, Jian *1956-* London : Facet, c2008 xvii, 365 p. : ill. ; 23cm Includes bibliographical references and index 1-85604-655-9, 978-1-85604-655-8 (pbk) : £39.95 *Metadaten / *Metadata Dewey-Dezimalklassifikation: 025.3
Metadata „are (structured) data about data“
Seite 10
Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“
AUFGABEN von Metadaten (FRBR User Tasks)
1. Verlässliches FINDEN ermöglichen: Recherche nach vom Benutzer festgelegten Kriterien.
2. IDENTIFIZIEREN: Unterscheiden, was verschieden ist, z.B. Unterscheidung von zwei Texten oder Aufnahmen, die mit demselben Titel veröffentlicht wurden.
3. AUSWÄHLEN: Zusammenführen, was zusammengehört, den Benutzerbedürfnissen entsprechend : z.B. Auswahl eines Texts in einer Sprache, die der Benutzer versteht
4. Zu Gewähltem ZUGANG ERHALTEN: z.B. Bestellung für eine Publikation abgeben
FRBR: Functional Requirements for Bibliographic Records
Seite 11
Metadata is „[…] to aid in their identification, discovery, assessment, and management of the described entities“
TYPEN von Metadaten
Deskriptive Metadaten : Beschreiben eine Ressource zum Zweck der Entdeckung, der Identifikation, der Auswahl und des Zugangs
Strukturelle Metadaten: Beschreiben die interne Organisation einer Ressource. Beschreiben, wie miteinander verbundene Objekte miteinander in Beziehung stehen, z.B. wie Seiten geordnet werden müssen, damit ein Kapitel entsteht.
Administrative Metadaten: „meta-metadata“; Informationen, die helfen eine Ressource zu verwalten:
Technische Metadaten: Enthalten Informationen über Format und Dateityp
Metadaten für das Rechtemanagement: Enthalten Informationen, die für die Berechtigung des Zugriffs und Informationen über das geistige Eigentum dienen
Herkunfts-Metadaten (Provenienz-Metadaten): Metadaten über die Herkunft der Ressource: Feststellung der Vertrauenswürdigkeit; Bewahrung der Nutzbarkeit
Seite 12
• Formale Beschreibung einer Ressource • Strukturierte „Daten über Daten“ • Ein Metadatensatz besteht aus Metadaten-Elementen und den dazugehörigen
Werten • Für eine Vielzahl an Dingen (Texte, Bilder, Objekte, Personen, etc.) • Getrennt vom beschriebenen Objekt oder enthalten im Objekt • menschen-lesbar, maschinen-lesbar (und maschinen-interpretierbar) • Aufgaben von Metadaten sind die Unterstützung beim Finden, Identifizieren,
Auswählen einer Ressource, sowie Zugang zu ihr erhalten • Es gibt verschiedene Typen von Metadaten: deskriptive, administrative,
technische Metadaten, Struktur- und Provenienz-Metadaten, Metadaten für das Rechtemanagement
Seite 13
Zusammenfassung: Was sind Metadaten?
2. Metadatenstandards
Seite 14
Metadatenstandards
Standards? "The nice thing about standards is that you have so many to
choose from. Furthermore, if you do not like any of them, you can just wait for next year's model."
Quelle: Andrew Tanenbaum, Computer Networks, 2nd edn., p. 254
Ein Metadatenstandard • sorgt für: Konsistenz der Metadaten • verbessert: Metadatennutzung • erlaubt: Austausch von Metadaten und die Verlinkung von
Objekten anwendungsübergreifend
Seite 15
Metadatenstandards „A content metadata standard is defined as an open specification that itemizes a set
of elements and their meanings. Each element is tagged with an identifier (e.g., "Title", "Author") that distinguishes the element from other elements within the standard. In addition, each element has a set of constraints or rules specifying the allowable content of the element and its relationship to other elements within the standard.“ (http://www.niso.org/publications/white_papers/crosswalk/ )
"A metadata schema provides a formal structure designed to identify the knowledge
structure of a given discipline and to link that structure to the information of the discipline through the creation of an information system that will assist the identification, discovery, and use of information within that discipline" . American Library Association Committee on Cataloging: Description and Access (CC:DA) Task Force on Metadata
Seite 16
Aufbau eines Metadaten-Standards am Beispiel Dublin Core
Dublin Core Metadata Initiative (DCMI)
Zunächst für die Beschreibung von Webressourcen
15 Kern-Elemente (“Core”): Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, and Rights
Alle optional und wiederholbar
Reihenfolge der Elemente beliebig
http://dublincore.org/documents/dces/
Title ”Metadata Demystified”
Creator ”Brand, Amy”
Creator ”Daly, Frank”
Creator ”Meyers, Barbara”
Subject ”metadata”
Description ”Presents an overview of metadata conventions in publishing.”
Publisher ”NISO Press”
Publisher ”The Sheridan Press”
Date ”2003-07"
Type ”Text”
Format ”application/pdf”
Identifier ”http://www.niso.org/standards /resources/Metadata_Demystified.pdf”
Language ”en”
Seite 17
Dublin Core Metadata Element Set Dublin Core Simple: 15 Elemente:
titel Titel creator Verfasser oder Urheber contributor Mitarbeiter publisher Verlag subject Thema des Inhalts (Sacherschließung) date Datum coverage Abdeckung description Beschreibung language Sprache type Art, Gattung format Format identifier Eindeutige Identifizierung relation Beziehung source Quelle rights Rechte
Seite 18
Dublin Core - Metadatenelemente
Element (property): Merkmal / Eigenschaft einer Ressource, wie Titel, Autor etc.
„An Element is a property of a resource. As intended here, "properties" are attributes of resources – characteristics that a resource may "have", such as a Title, Publisher, or Subject.“ (DCMI Glossary)
Seite 19
Dublin Core Element Set - Übung
DC element value title creator contributor publisher subject date coverage
DC element value description language type format identifier relation rights
Sprache: rumänisch, englisch
Seite 20
Dublin Core Element Set - Übung: Lösung
Sprache: rumänisch, englisch
DC element value title Intelectuali Români implicati în
dezvoltarea civilizatiei economice title Romanian intellectuals inolved in
the development of the economic civilization
creator Saizu, Ioan contributor ----- publisher Ed. Acad. Romane subject Wirtschaftsgeschichte subject Rumänien date 2003 coverage Rumänien
DC element value description -------------- language rumänisch language englisch type Buch / Book format 308 S. identifier 973-270983-9 relation --------------- rights ---------------
Seite 21
Dublin Core Metadata Terms
15 Elemente bieten wenig Differenzierung. Was tun?
Dublin Core Metadata Terms
Element Refinement: Verfeinerung der Bedeutung eines Elements
Die Refinements können als Unterbegriff des Elements verstanden werden.
Beispiel: Element „Description“ mit den Refinements „Abstract“ oder „Table of Contents“
55 Terms: http://dublincore.org/documents/dcmi-terms/
dc.description Kann jegliche Art von Beschreibung enthalten
dcterms.abstract Hier sind nur Abstracts zulässig dcterms.tableOfContents Hier sind nur Inhaltsverzeichnisse zulässig
Seite 22
Encoding Schemes Weitere semantische und syntaktische Differenzierung bieten Encoding Schemes
Wie, in welcher Form wird das Element beschrieben?
Kodierungs-Schema, kontextabhängige Informationen oder Parsing-Regeln (Syntax-Analyse-Regeln), die dazu beitragen, den Wert eines Elements zu interpretieren.
Semantics is about meaning; syntax is about form Weibel, S. et.al. (2002)
Semantik: Semantik (von Altgriechisch σημαίνειν sēmaínein ‚bezeichnen‘, ‚zum Zeichen gehörig‘), auch Bedeutungslehre, nennt man die Theorie oder Wissenschaft von der Bedeutung der Zeichen. Zeichen können in diesem Fall Wörter, Phrasen oder Symbole sein. Die Semantik beschäftigt sich typischerweise mit den Beziehungen zwischen Zeichen und Bedeutungen dieser Zeichen. [http://de.wikipedia.org/wiki/Semantik]
Syntax: die rein formalen Beziehungen zwischen (sprachlichen) Zeichen, z.B. Datumsangabe: soll in der Syntax YYYY-MM-DD erfolgen.
Seite 23
Vocabulary Encoding Schemes
Vocabulary Encoding Scheme (VES):
Beschreibt, dass der Wert eine Bezeichnung aus einem kontrollierten Wortschatz ist, z.B. Wert = Klasse (Notation) aus der DDC, Deskriptor aus dem Standard Thesaurus Wirtschaft (STW), etc.
Bsp. Element „subject“ mit dem Encoding Scheme „DDC“
<dcterms:subject xsi:type „dcterms:DDC“>330</dcterms:subject>
Achtung! Jetzt kommt ein Thema, und zudem stammt
der Wert aus der DDC
Seite 24
Vocabulary Encoding Schemes: Klassifikationen – Thesauri – Schlagwörter und mehr
Klassifikationen DDC Dewey Decimal Classification UDC Universelle Dezimalklassifikation BK Basisklassifikation LCC Library of Congress Classification RVK Regensburger Verbundklassifikation JEL: Klassifikation des Journal of Economic Literature
Thesauri STW Standard Thesaurus Wirtschaft TGN Getty Thesaurus of Geographic Names TheSoz Theaurus Sozialwissenschaften IBLK Europäischer Thesaurus Internationale Beziehungen und Länderkunde MeSH Medical Subject Headings AGROVOC Agrarwissenschaften, Forstwirtschaft, Fischerei, Nahrungsmittel und verwandter Gebiete INFODATA Thesaurus Informationswissenschaft
Normdateien (authority files) GND Gemeinsame Normdatei (Personen, Körperschaften , Schlagwörter) LCSH Library of Congress Subject Headings Rameau Normdatei der BnF VIAF Virtual International Authority File
Sonstiges kontrolliertes Vokabular IMT Internet Media Type (auch MIME- Type ) klassifiziert den Dateityp z.B. für DC-Element „format“ DCMIType Vocabulary Ressourcentype z.B. für DC-Element „type“
Seite 25
Syntax Encoding Schemes
Syntax Encoding Scheme (SES):
Gibt an, wie die Zeichenketten, die bei der Beschreibung eines Objekts verwendet werden, aufgebaut sein müssen und regelt damit die syntaktische Struktur der Beschreibung, z.B. „JJJJ-MM-TT" als Standardausdruck eines Datums.
Bsp. Element „Date“ mit Encoding Scheme „JJJJ-MM-TT“
<dcterms:date xsi:type dcterms:W3CDTF>2007-12-04</dcterms:date>
Achtung! Jetzt kommt ein Datum und außerdem hat
es das Format JJJJ-MM-TT
Seite 26
Syntax Encoding Schemes Normen und weitere Standards ISO 8601 Data elements and interchange formats - Information interchange - Representation of dates and times W3C-DTF „defines a profile of ISO 8601, the International Standard for the representation of dates and times „ DCMI Period Encoding Scheme (Zeiträume): „for identifying a single time interval using its limits „ DCMI BOX Encoding Scheme (geographische Räume): „method for identifying a region of space using its geographic limits and representing that information as a value string.“ DCMI Point Encoding Scheme (geographischer Punkt): „a mechanism for indicating a point in space using its geographic coordinates and representing that information as a value string. „
URIs (Uniform Resource Identifier) URL Uniform Resource Locator URN Uniform Resource Name Handle Handle DOI Digital Objekt Identifier PURL Persistent Uniform Resource Locator
Weitere Identifier ISBN International Standard Book Number: ISBN 978-3-7657-2781-8 ISSN International Standard Serial Number: ISSN 4177-0815 BICI Book Item and Component Identifier SICI Serial Item and Contribution Identifier (ANSI/NISO standard Z39.56). ISMN International Standard Music Number Seite 27
Syntax and Vocabulary Encoding Schemes
RFC 3066: Vorläufer der ISO-639 ISO 639 Sprachen (Sprachcodes):
ISO 639-1 (Alpha-2 Code) ISO 639-2 (Alpha-3 Code) ISO 639-3 (Alpha-3 Code for comprehensive coverage of languages)
Semantisch im Hinblick auf das enthaltene Vokabular. Syntaktisch im Hinblick auf die Kodierung in bestimmter Anzahl Zeichen automatisch prüfbar (Plausibilitätsprüfung).
http://upload.wikimedia.org/wikipedia/commons/thumb/9/95/ISO_639_Schematische_Darstellung.svg/700px-ISO_639_Schematische_Darstellung.svg.png
Seite 28
Metadaten-Standards und -Schemas definieren zulässige Elemente und ihre Bedeutung (Semantik), sowie ihre Form (Syntax):
• Sachliche Definition des Inhalts (content rules). Diese besagen, wie die Werte für das Datenelement ausgewählt und repräsentiert werden.
• Regeln über die Form des Feldinhalts (representation rules): z.B. Regeln über die Groß- und Kleinschreibung
• Regeln über die Syntax des Inhalts, also wie der Inhalt codiert werden muss: z.B. ein Datum muss immer in der Form YYYY-MM-TT eingegeben werden (syntax encoding scheme)
• Regeln über die zulässig Inhalte (content values), z.B. der Inhalt des Feldes muss aus einem kontrollierten Vokabular, wie z.B. dem STW, der DDC, der UDC, der BK, etc. stammen (vocabulary encoding scheme)
• Angaben zur Wiederholbarkeit und Verpflichtung eines Elements
• Angaben wie verschiedene Elemente miteinander in Beziehung stehen
Zusammenfassung: Aufbau eines Metadatenstandards
Seite 29
Zusammenfassung: Aufbau von Dublin Core
• Dublin Core Metadata Element Set = 15 Elemente (Dublin Core Simple)
• Dublin Core Metadata Terms (Dublin Core Qualified)
• Element Refinements = 55 Elemente
• Encodings Schemes und Refinements sind „Qualifier“ • Dublin Core Qualifier: http://dublincore.org/documents/usageguide/qualifiers.shtml
• Dublin Core auf Deutsch: KIM - Kompetenzzentrum Interoperable Metadaten
Seite 30
Prinzipien von Dublin Core One-to-One-Principle - Das 1:1-Prinzip: Jede Beschreibung (decription) steht für ein und nur ein Objekt (Ressource), z.B.
eine Beschreibung für einen gedruckten Text, eine weitere für die elektronische Ausgabe.
Dumb-Down-Principle – Prinzip der Vereinfachung: Die Bedeutung eines Elements kann verfeinert, aber nicht erweitert werden. Beispiel: Element „description“ mit den refinements „ToC“ oder „Abstract“ (dumb
down der Eigenschaft und des Wertes) Appropriate Values – Angemessene / entsprechende Inhalte: „Best Practice“ : menschen- und maschinelesbar.
Seite 31
Prinzipien von Dublin Core
1. Simplicity: Einfachheit der Beschreibung
2. Semantic interoperability: Semantische Interoperabilität
3. International consensus: Internationale Übereinkunft über Standard
4. Interdisziplinary: Interdisziplinär einsetzbar
5. Extensibility: Erweiterbarkeit, keine Beschränkung auf DC-Elemente
6. Modularity: Modular, im Baukasten-Prinzip verwendbar
7. Modifiability: Jedes Element kann durch die Angabe eines Attributs verändert werden
8. Optionality: keine Pflichtfelder
9. Repeatability: Alle Elemente können mehrmals in einem Datensatz auftreten 10. Independency: Unabhängigkeit von einer spezifischen Syntax
Seite 32
Metadatenformate
bibliographisch / deskriptiv
Metadatenstandard ist nicht gleich Metadatenformat Dublin Core Metadatenstandard • als .txt-Datei • als .html- oder .xhtml-Datei • als .xml-Datei • als .rdf-Statements Syntax Guidelines für die korrekte Konstruktion von DC-Datensätzen in diese Formate: http://dublincore.org/specifications/ Grundsätzlich: • Metadatenstandards als Text-Standard entwickelt und nachträglich weitere Repräsentationen • Originäre XML-Standards • Proprietäre Formate, z.B. .mrc für MARC
Metadatenformat, z.B. DC-DS-XML
Seite 33
Exkurs XML
Extensible Markup Language = erweiterbare Auszeichnungs-Sprache
Beispiele für Auszeichnungssprachen: HTML (Hypertext Markup Language), SGML (Standard Generalized Markup Language), XML
Standard zur Erstellung von maschinen- und menschenlesbaren Dokumenten
Der Standard wurde vom World Wide Web Consortium (W3C) definiert
Befehle in Form von semantischen tags: <titel> </titel>, <date> </date>, <creator></creator>
<befehl>Information</befehl>
Seite 34
Unterschiede zwischen HTML und XML Unterschied zu HTML Tags sind nicht festgelegt. Sie werden für
spezielle Anwendung definiert: Datenbank 1: <autor>Marx, Karl<autor/> Datenbank 2: <verfasser>Marx, Karl<verfasser/> HTML „Kann man sehen“ = Auszeichnung der
Strukturierung von Inhalten XML transportiert Semantik = logische
Auszeichnung der Inhalte
Gemeinsamkeiten Auszeichnungssprachen Stammen von SGML ab Befehle in Form von tags Textformat (im Sinne von
Nicht-binär)
<h1>Metadaten für Einsteiger</h1>
Jetzt kommt eine Überschrift: 20 pt., fett
Ende Überschrift: Absatz-schriftart
HTML
<titel>Metadaten für Einsteiger</titel>
Hier kommt der Titel der Ressource
Hier endet der Titel der Ressource
XML
Prä
sent
atio
n Bedeutung
Seite 35
XML - Eigenschaften • Trennt strikt zwischen Daten und Verarbeitung der Daten: Welche Software für
die Verarbeitung verwendet wird, ist nicht festgelegt. • XML = Textformat: erleichtert es Menschen die enthaltene Information zu verstehen
und macht unabhängig von bestimmten technischen Implementierungen • Für hoch-strukturierte Daten (aus relationalen Datenbanken) und semi-
strukturierte Daten (von Menschen verfasste Texte) • Einfach: leichter zu erlernen und leichter zu implementieren als Vorfahren (SGML)
.csv vs. .xml
Seite 36
XML - Eigenschaften
• Flexibel: da „tags“ (Bezeichner) in XML nicht festgelegt sind, kann jeder Betreiber sein eigenes Format entsprechende seiner Bedürfnisse erstellen.
• Flexible vs. Interoperabel: DB1: <verfasser>, DB2: <autor>, aber identische Semantik
• Metadatenformate ausgedrückt in XML:
100 1 $aSchultz, Theodore Paul,$0(DE-601)060006277.
245 10 $aChanging world prices, women's wages, and the fertility transition :$bSweden, 1860 - 1910 /$cT. Paul Schultz.
MARC21
MARC21 in XML
Seite 37
Metadatenstandards in XML Metadata Object and Description Schema
• Originärer XML-Standard
• Entwickelt als Kompromiss zwischen dem komplexen MARC21 und dem einfachen Dublin Core
• Für elektronische Ressourcen
• Entwickelt vom Network Development and MARC Standards Office der LoC
• Bildet Teile der MARC21-Elemente ab, bei Standard-Konvertierung Informationsverlust
Seite 38
Machine-Readable Cataloging - MARC21 Internationales Austausch- und Speicherformat • für bibliographische Nachweise
in Bibliothekskatalogen • Entwickelt von der LoC • ANSI/NISO Z39.2 • Viele Dialekte
1000 Elemente mit Unterfeldern und Indikatoren • ca. 60 am häufigsten
verwendete • Fixed Fields (00X) Kat.-Regelwerk: AARC2 Format: .mrc / .marc Tools: Marc-Editor „MarcEdit“
xxxxxnaa a22yyyyy c 4500 001 592906469 003 DE-601 005 20090728100724.0 008 090304s2008 000 0 eng d 016 7 $a7153508$2DE-600 040 $aGBVCP$bger$erakwb 041 0 $aeng 100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-588)133059545 245 10$aEscaping the unemployment trap :$bthe case of East Germany /$cChristian Merkl; Dennis J. Snower 300 $bgraph. Darst. 650 7$81.1\x$aLangzeitarbeitslosigkeit$0(DE-601)091374367$0(DE-STW)18124-6$2stw 650 7$81.2\x$aArbeitsproduktivität$0(DE-601)091347742$0(DE-STW)10440-1$2stw […] 700 1 $aSnower, Dennis J.$eAuthor$4aut$0(DE-601)366752960$0(DE-588)124825109 773 08$iIn: $tJournal of comparative economics$dAmsterdam : Elsevier$gVol. 36, No. 4 (2008), p. 542-556$q36:4<542-556$w(DE-601)130445541$x0147-5967 773 08$iIn: 900 $aGBV$bZBW Kiel <206> 952 $d36$j2008$e4$c12$h542-556 954 $a26$b923675930$c01$x0206
http://www.loc.gov/marc/ Seite 39
650 = Sachschlagwort Indikator 1 = undefiniert Indikator 2 = Quelle des Vokabular wird spezifiziert in Unterfeld 2 Unterfeld a = Deskriptor Unterfeld 0 = Identifier der Ressource in der Datenbank „DE-601“ (GBV) Unterfeld 2 = Deskriptor stammt aus dem STW
Unterfelder und Indikatoren
Seite 40
Project of Integrated Catalogue Automation - PICA
PICA+: Datenbank-Format
PICA3: Katalogisierungssicht
u.a. GBV, SWD, HEBIS, DNB
für bibliographische Nachweise in Bibliothekskatalogen
ca. 1300 Informationseinheiten: Elemente mit Unterfeldern
Verschiedene Satztypen, die miteinander verknüpft sind (Hierarchische Datensätze)
Kat.-Regelwerk: RAK (D)
001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/00 $9091347742$8Arbeitsproduktivität 045D/00 $9091384966$8Qualifikation 045D/49 $b49 101B $004-03-09$t09:15:56.000
Seite 41
Pica3 - Pica+
Katalogisierungssicht Pica3
Datenbanksicht PICA+
Seite 42
43
Pica3 - Pica+ Steuerzeichen in Pica3 sind Unterfelder (subfields) in Pica+ Subfield Eine individuelle Informationseinheit in einer strukturierten Datei. Eine Untergliederung eines Feldes. Beispiel: ein Feld für Titelangaben hat mehrere Unterfelder: HST, Zusatz, Verfasserangabe
Seite 43
Beispiele für Metadatenstandards Metadatenstandards 1. für bibliographische Ressourcen: z.B. Pica+, MODS, DC 2. für den Datentausch: z.B. MAB 2, MARC21, ONIX 3. für Multimedia-Objekte: z.B. MIX (Bilder), MPEG-7/21 (Video) 4. für digitale Sammlungen: z.B. METS (Wrapper) 5. für sozialwiss. Forschungsdaten: z.B. DDI, SDMX 6. für Archive (Findbücher): z.B. EAD 7. für die Langzeitarchivierung: z.B. PREMIS 8. für die Strukturauszeichnung von Dokumenten: z.B. TEI 9. für Museumsobjekte: z.B. LIDO
Seite 44
Seeing Standards: A Visualization of the Metadata Universe (Jenn Riley)
http://www.dlib.indiana.edu/~jenlrile/metadatamap/seeingstandards.pdf Seite 45
DOKUMENTATION eines Metadaten-Standards • „Uses and Features“ • „Usage Guidelines“ • „Implementation Guidelines“ • „Schemas and Outline“ • „Data Dictionary“ • “Specification” • Encoding Guidelines • Code Lists • Beispiel-Datensätze • Tutorials • Mailinglisten und Foren
• Einsatzgebiet und –möglichkeiten • Anwendungsregelwerk • Aufzählung und genaue Definition
der Elemente • Kodierungs-Regeln • Kodierungs-Listen • Beispiel-Datensätze • Anleitungen mit Übungen • Mailinglisten und Foren
Metadatenstandards kennenlernen
100 1 $aMerkl, Christian$0(DE-601)533312205$0(DE-588)133059545
Seite 46
• Metadatenstandards sorgen für die Konsistenz der Metadaten und verbessern damit Nutzung und Austausch
• Ein Metadatenstandard ist aufgebaut aus Metadaten-Elementen (Eigenschaft / Merkmal einer Ressource; property)
• Metadatenelemente werden definiert hinsichtlich ihrer Bedeutung (Semantik) und hinsichtlich der Form (Syntax)
• Es gibt Vocabulary Encoding Schemes (Klassifikationen, Thesauri, kontrolliertes Vokabular, Normdateien, Schlagwortlisten)
• und Syntax Encoding Schemes (Normen, URIs, weitere Identifier) zur genaueren Definition von Metadatenelementen
• Zur Definition eines Elements gehört auch eine Aussage über die Wiederholbarkeit und Verpflichtung eines Elements, sowie darüber, wie einzelne Elemente miteinander in Beziehung stehen.
Seite 47
Zusammenfassung: Metadatenstandards
• Metadatenstandard ist nicht gleich Metadatenformat: ein Standard (z.B. Dublin Core) kann in verschiedenen Formaten auftreten: z.B. DC-HTML, DC-XML, DC-RDF
• XML eignet sich, weil es menschenlesbar und gleichzeigt maschinelesbar ist, weil es gut für hoch-strukturierte Daten einsetzbar ist und weil es flexibel ist, da die Tags nicht festgelegt sind.
• Einige Standards weisen spezielle strukturelle Besonderheiten auf: Subfields, Indikatoren, externe und interne Sichten.
• Es gibt eine Vielzahl von Standards je nach Einsatzzweck und/oder Typ der Ressource
• Wenn man Standards kennenlernen möchte, bedient man sich der Standard-Dokumentationen
Seite 48
Zusammenfassung: Metadatenstandards
3. Application Profile
Seite 49
PPN
Titel
Verfasser Sonst. Beteil.Person
Umfang
ISBN
Schlagwörter
Fussnoten Verwandte Ressourcen
URL
Metadaten-Standard einer „Community“ / Domain, z.B. PICA, Dublin Core, DDI etc.
DOI Tongeschlecht
Epoche
Bildformat
Anzahl Pixel
Primärkörperschaft
Format
URN
Kompression
Handle
Regie
Metadatenstandard und Metadatenschema Metadatenformat /-Schema einer bestimmten Anwendung, z.B. Repository für Publikationen
Metadaten-Elemente einer realen Informations-einheit
Titel: Verfasser: Sonst. Personen: Körperschaft: Erschienen: Umfang: Anmerkung: ISBN: Schlagwörter: URL:
Seite 50
Metadaten-Dokumentation für individuelle Anwendungen: Application Profiles “In DCMI usage, an application profile is a declaration of the metadata terms an organization, information resource, application, or user community uses in its metadata. In a broader sense, it includes the set of metadata elements, policies, and guidelines defined for a particular application or implementation. […] An application profile is not considered complete without documentation that defines the policies and best practices appropriate to the application.” (DCMI Glossary)
Application Profile (AP): Metadaten-Profil, -schema einer bestimmten Anwendung, das Elemente aus einem oder mehreren Standards enthält Festlegung der • Elemente • Unterfelder/Refinements • Encoding Schemes • Wiederholbarkeit • Pflichtfelder
Dokumentation der • Struktur • Richtlinien • Best Practice
http://www.dlib.org/dlib/june06/chan/06chan.html
Seite 51
AP - Grundsätzliche Überlegungen Welchen Zweck hat die Anwendung? • Verwaltung von Daten für den
“Hausgebrauch”? • Organisations-übergreifender
Datenaustausch? • Integration der Daten in
Webdienste? • … Welche Funktionen soll die
Anwendung unterstützten? • Erweiterte Suche? • Browsing? • Facetten? • …
Was für Objekte werden beschrieben? • Text, Personen, Filme …? • … Welche Beziehungen gibt es zwischen
den Objekten? • Ist Urheber von … • Ist Teil von … • … Was brauche ich, um meine Ziele und
Anforderungen umzusetzen? • Welche Metadatenterme? • Was für Encoding Schemas? • Was für Einschränkungen?
Seite 52
Praxis – Kriterien für die Formatauswahl
Erst prüfen • Gibt es für meine Anwendung
bereits einen Standard? • Welcher Standard wird in meiner
Community genutzt? • Welcher Standard passt zu meiner
Anwendung / in meinem Kontext? • Welcher Standard entspricht am
ehesten meinen Anforderungen?
– “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Seite 53 Metadata Madness wheel, Musebrarian, http://www.flickr.com/photos/musebrarian/3289649684/
Praxis – Kriterien für die Auswahl des/der Standard(s)
– “Use elements and qualifiers to meet the needs of your local context, but ... – remember that your metadata may be interpreted by machines and people, so ... – consider whether the values you use will aid discovery outside your local context.“ Greenberg, J. “Dublin Core History and Basics”, Tutorial ASIST DC 2008 (http://dc2008.de/wpcontent/uploads/2008/09/tutorial-1.pdf)
Daran denken • Auswahlkriterien: Anforderungen und Nachnutzbarkeit der Anwendung • Dokumentation ist wichtig
• Verletze niemals die semantischen Grenzen eines Standards
Ja! zur semantischen Verfeinerung Nein! zur semantischen Erweiterung
Seite 54
dcterms.creator
Application Profile - Namensräume
DCMI namespace: "a collection of DCMI terms URIs“ (DCMI term URI: "The URI that identifies a term..“)
„The purpose of an application profile is to adapt or combine existing schemas into a package that is tailored to the functional requirements of a particular application, while retaining interoperability with the original base schemas.“ Weibel, S. et.al. (2002)
55
dc.creator
Seite 55
Application Profile - Namensräume
Namensräume: können für spezifische Anwendungen definiert werden Die Deklaration von Namensräumen erlaubt Designern von Metadaten-Schemas den
Kontext, in dem ein bestimmtes Element verwendet wird, genau zu benennen und sichert zu, dass dieses Element im Namensraum eindeutig ist.
dc dc.titel dc.creator dc.subject dc.description
dcterms dcterms.dateIssued dcterms.abstract dcterms.coverage dcterms.spatial
vascoda vap.placeOfPublicationvap.edition vap.thematic vap.ddc
meinAP dc.titel dc.creator dc.Subject dcterms.dateIssued dcterms.abstract dcterms.coverage vap.placeOfPublicationvap.edition vap.thematic vap.ddc
Namensräume
Namespace Policy for the Dublin Core Metadata Initiative (DCMI) http://www.dublincore.org/documents/dcmi-namespace/
Seite 56
Application-Profile - Singapore Framework „...a framework for designing metadata applications for maximum interoperability and for documenting such applications for maximum reusability.“
(http://dublincore.org/architecturewiki/SingaporeFramework/)
• Das Singapore Framework für Dublin-Core-Anwendungsprofile nennt die Rahmenbedingungen um Metadatenanwendungen möglichst interoperabel zu gestalten und so zu dokumentieren, dass sie nachnutzbar sind.
• Es definiert die Komponenten, die erforderlich und hilfreich sind, um ein Anwendungsprofil (Application Profile) zu dokumentieren.
• Das Singapore Framework ist die Grundlage für die Beurteilung von Anwendungsprofilen in Hinblick auf Vollständigkeit der Dokumentation und auf Übereinstimmung mit den Prinzipien der Web-Architektur.
Seite 57
Application Profiles - Singapore Framework
http://www.dublincore.org/documents/singapore-framework/ http://www.kim-forum.org/Subsites/kim/SharedDocs/Downloads/DE/Uebersetzungen/singaporeFramework.pdf?__blob=publicationFile (deutsch)
• Funktionale Anforderungen (verpflichtend)
• Domain-Modell (verpflichtend)
• Beschreibungssatz-Profil (verpflichtend)
• Nutzungsrichtlinien (fakultativ)
• Richtlinien für die syntaktische Kodierung (fakultativ)
Seite 58
Zusammenfassung: Application Profile
• Metadatenschemas, bzw. -profile bestehen aus Elementen aus einem oder mehreren Metadatenstandards
• Ein Applikation Profile ist die Festlegung der einsetzbaren Elemente und deren Bedingungen (Encoding Schemes, Wiederholbarkeit, Verpflichtung, etc.) sowie der zu nutzenden Richtlinien.
• Grundsätzliche Überlegungen: Zweck der Anwendung, Funktionen der Anwendung, beschriebene Objekte und Beziehungen zwischen Ihnen.
• Man sollte eingeführte Standards nachnutzen und kann auch mehrere Standards kombinieren.
• Um Elemente aus verschiedenen Standards eindeutig benennen zu können werden Namenräume (namespaces) verwendet.
• Eine Handreichung zur Erstellung optimaler Application Profiles bietet das Singapore Framework der DCMI.
Seite 59
Application Profile
„The main goal of application profiles is to increase the "semantic interoperability" of the resulting metadata instances within a community of practice, by going beyond the universal consensus of a single standard, without compromising the basic interoperability that the standard enables across the boundaries of these communities.“
[Special section on semantic interoperability in global information systems, ACM SIGMOD Record, Vol. 28, No. 1, March 1999.]
Seite 60
Interoperabilität
Interoperabilität ist die Fähigkeit unterschiedlicher Informationssysteme miteinander zu kommunizieren und so Metadaten möglichst effizient und sinnvoll und mit einem minimalen Verlust an Information auszutauschen.
systemübergreifender Austausch von Metadaten unter möglichst geringem Aufwand.
Problem: Austausch oder Integration von Daten, die in verschiedenen Standards vorliegen
Seite 61
62
Interoperabilität Strukturelle Interoperabilität
• gegeben, wenn unterschiedlichen Metadatenschemas ein gemeinsa-mes Datenmodell zugrunde liegt (z. B. DCMI Abstract Model, FRBR).
Syntaktische Interoperabilität
• gegeben, wenn unterschiedliche Metadaten-Schemas in einer gemeinsamen Kodierungssyntax (z. B. XML, RDF) wiedergegeben werden.
Semantische Interoperabilität
• gegeben, wenn unterschiedliche Metadatenschemas ein gemeinsames Vokabular (Metadatenstandard) verwenden
Seite 62
Interoperabilität - Übung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000
Pica+
MODS
Seite 63
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?
Interoperabilität - Lösung 001@ $026$aU 001A $00206:04-03-09 001B $00206:10-03-09$t10:42:23.000 001D $00206:04-03-09 001U $0utf8 001X $00 002@ $0Asu 003@ $0592906469 010@ $aeng 011@ $a2008 021A $aEscaping the unemployment trap$dthe case of East Germany$hChristian Merkl; Dennis J. Snower 027D/00 $aJournal of comparative economics$pAmsterdam$nElsevier$00147-5967$z7153508 028A $dChristian$aMerkl$9533312205$8Christian@Merkl ; PND-ID: 133059545 028B/01 $dDennis J.$aSnower$9366752960$8Dennis J.@Snower ; PND-ID: 124825109 031A $d36$j2008$e4$c12$h542-556 034M $agraph. Darst. 039B $cIn$9130445541$8Journal of comparative economics. - Amsterdam : Elsevier$x200800000360004458 039B $cIn$7!562253327! 045D/00 $9091374367$8Langzeitarbeitslosigkeit 045D/49 $b49 101B $004-03-09$t09:15:56.000
Pica+ (text)
MODS (xml)
Seite 64
Frage: Sind diese beiden Metadatenschemas in irgendeiner Hinsicht interoperabel?
4. Mapping
Seite 65
Was bedeutet „Mapping“? Aufgabe: Integration heterogener Metadaten in einem System: EconBiz
Dublin Core (XML)
PICA 3
Titel=4000
Titel=<title>
• Metadaten verschiedener Provenienz, die in verschiedenen Formaten vorliegen
• Mittels Suchmaschine-Technologie unter einer Oberfläche durchsuchen
• Verfeinerung per Drill-Down
Seite 66
• „Übersetzen“ der Elemente und Regeln von einem Standard (Schema / Format) in einen anderen
• Mapping: die sich entsprechenden Bestandteile zweier unterschiedlicher Metadaten-Standards oder -schemata miteinander in Beziehung setzen samt Regeln
• Metadata "mapping" refers to a formal identification of equivalent or nearly equivalent metadata elements or groups of metadata elements from different metadata schemas, carried out in order to facilitate semantic interoperability (Getty Glossary)
Element DB2 – MAB (Ziel) DB1 – PICA (Quelle) Anmerkungen
Bezeichner Syntax Bezeichner Syntax Anweisung für Transformation
Verfasser 100 Nachname, Vorname 3000 Vorname@Nachname
Quell-Wert vor Klammeraffen in Zielformat mit Komma Leerzeichen hinter Quell-Wert nach Klammeraffen schreiben, […]
[…]
Seite 67
Was bedeutet „Mapping“?
Seite 68
Crosswalk
“A table that maps the relationships and equivalencies between two or more metadata schemes. Crosswalks or metadata mapping support the ability of search engines to search effectively across heterogeneous databases”. http://dublincore.org/documents/usageguide/glossary.shtml#C
Crosswalk
A crosswalk ist "a mapping of the elements, semantics, and syntax from one metadata scheme to those of another„. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf ).
Crosswalks sind laterale Mappings, d.h. sie sind Einbahnstrassen von einem Schema in das andere.
Seite 69
Einige Problemfelder beim Mappen:
• Mapping zwischen zwei unterschiedlich mächtigen Standards / Schemas: fehlende Felder im Zielformat / mehr als ein Feld im Zielformat
• Unterschiedliche Eigenschaften: Einige Felder können als obligatorisch (Pflichtfeld) und andere als optional deklariert werden. Das wiederholte Vorkommen eines Elements kann zulässig sein oder nicht (Wiederholfähigkeit).
• Unterschiedliche Syntax der Felder (unterschiedliche syntax encoding schemes): (z.B. A: „Vorname“, „Nachname“ und B: „Name“ (Nachname, Vorname) und C: „Vorname@Nachname“)
• Verschiedene terminologische Vokabulare (unterschiedliche vocabulary encoding schemes): Werden unterschiedliche Vokabulare (z.B. Klassifikationen) verwendet müssen, diese ebenfalls „übersetzt“ werden (Cross-Konkordanz).
Mapping in der Praxis - Problemfelder
Seite 70
Mapping in der Praxis In welcher Beziehung stehen die zu mappenden Elemente zueinander? Grad der strukturellen Übereinstimmung: • 1:1 one-to-one • 1:n one-to-many • n:1 many-to-one • 1:0 one-to-none Grad der semantischen Übereinstimmung: • = äquivalent • > Oberbegriff • < Unterbegriff • ≈
Seite 71
Mapping in der Praxis = "is the same as„ Semantik des Quell- und des Zielformats stimmen überein.
Einfaches Element-to-Element-Mapping (Aber: Encoding Scheme beachten!)
<dcterms:abstract> DC-Definition: A summary of the resource <mods:abstract> MODS-Def.: a summary of the content of the resource
Quelle Ziel
Seite 72
<dc:language>Deutsch</dc:language> <mods:languageTerm type= "code" authority="iso639-2b"> ger</mods:languageTerm>
< Quell-Element ist „Unterbegriff“ des Zielelements Semantik des Quellelements ist enger gefasst, als die des möglichen Zielelements.
Quelle Ziel
<mods:relatedItem type=„isReferencedBy> </relatedItem>
<dc:relation></dc:relation> DC-Definition: A related resource.
MODS-Definition: Citations or references to published bibliographic descriptions, reviews, abstracts, or indexes of the content of the resource
Mapping in der Praxis
Seite 73
Mapping in der Praxis > Quell-Element ist „Oberbegriff“ von Ziel-Element Semantik des Quellelements ist breiter gefasst, als die des Zielelements.
<dc:subject> DC-Def.: „The topic of the resource.“ (nicht eingeschränkt; Geographika, Sachschlagwörter, Zeitschlagwörter etc.)
<mods:subject> MODS-Def: "topic" is used as the tag for any topical subjects <mods:topic> that are not appropriate in the <geographic>, <temporal>, <titleInfo>, or <name> subelements
nicht zulässig!
Quelle Ziel
Seite 74
Mapping in der Praxis
Quellformat: MIX <Compression>
<CompressionScheme>1</CompressionScheme>
<CompressionLevel>10</CompressionLevel>
</Compression>
Zielformat: Dublin Core: ?
nicht möglich Informationsverlust!
http://commons.wikimedia.org/wiki/File:Rotten_apple.jpg
Seite 75
1:0 Im Zielstandard gibt es kein Feld, das mit der Semantik des Quellelements übereinstimmt.
Mapping in der Praxis 1:n Quell-Element muss auf zwei oder mehrere Ziel-Elemente verteilt werden / Nur Teil eines Quellelements kann auf Ziel-Element gemappt werden <gils:ContactName> The name of the person acting as contact for the information resource.
<name type="personal"> <namePart type="given"></namePart> <namePart type="family"></namePart> </name>
Transformationsregel angeben: anhand Syntax der Werte nach möglichen Trennzeichen (Steuerzeichen) suchen
http://commons.wikimedia.org/wiki/File:Apfelteiler_fcm.jpg
Seite 76
n:1 Mehrere Quell-Elemente entsprechen Ziel-Element Nur zwei oder mehr verschiedene Informationen gemeinsam ergeben die Zielsemantik
Mapping in der Praxis
<part> <detail type="volume"> <number>24</number> Band </detail> <detail type="issue"> Heft <number>2</number> </detail> <extent unit="page"> Seitenangabe
<start>23</start> <end>45</end>
</extent> </part>
<dc:bibliographicCitation> Definition: A bibliographic reference for the resource. Comment: Recommended practice is to include sufficient bibliographic detail to identify the resource as unambiguously as possible.
Seite 77
Regel mit welchen Steuerzeichen die einzelnen Werte im Ziel-Element zusammen-gesetzt werden sollen
http://commons.wikimedia.org/wiki/File:Fruit_salad_%281%29.jpg
Mapping in der Praxis Wiederholbarkeit
Quell-Element ist wiederholbar, Ziel-Element nicht Alle Werte des Quell-Elements in Ziel-Element mappen. Dabei Trennzeichen als
Regel angeben
Seite 78
Quell-Element ist nicht wiederholbar, Ziel-Element ist wiederholbar Trennzeichen im Quell-Elements als Steuerzeichen für Zerlegung des Feldwerts nutzen
dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> Regel: alle Begriffe aus dc:subject in <ex:theme> mit Leerzeichen Semikolon Leerzeichen getrennt
<ex:theme> Begriff1 ; Begriff2 ; Begriff3</ex:theme> dc:subject: Begriff1 dc:subject: Begriff2 dc:subject: Begriff3 Regel: Trenne die Begriffe in <ex:theme> anhand
Steuerzeichen (Leerzeichen Semikolon Leerzeichen)
Mapping in der Praxis
Verpflichtung Quell-Element ist Pflichtfeld, Ziel-Element nicht Kein Problem Quell-Element ist nicht verpflichtend; Zielelement ist Pflichtfeld Versuchen passende Werte aus einer Kombination von Quell-
Elementen zu generieren. Wenn nicht möglich , Mapping nicht möglich.
Seite 79
Mapping in der Praxis Probleme mit den Daten: 1. Missing data: Werte sind nicht vorhanden 2. Incorrect data: Werte entsprechen nicht den Konventionen 3. Confusing data: unzulässige / fehlende Trennzeichen, eingebettete HTML-Tags 4. Insufficient data: fehlende Angabe welches kontrollierte Vokabular, Format etc.
verwendet wird.
Iterativer Prozess
Daten-analyse
Mapping
Konver-tierung
Kontrolle
Seite 80
Zusammenfassung: Mapping und Crosswalks
• Beim Mappen wird semantische, syntaktische und strukturelle Interoperabilität hergestellt.
• Voraussetzung für ein korrektes Mapping ist die klare und präzise Definition der Elemente in den jeweiligen Standards.
• Das Mapping sollte das Erstellen von Transformationsregeln ermöglichen, mit denen sich die Daten aus dem einen Schema möglichst vollständig in das andere Schema überführen lassen.
• Eigentliches Konvertieren der Daten mittels programmiertem Script
• Mapping ist der erste Schritt zur Integration heterogener Daten in einem System
Seite 81
Mapping - Übung
Seite 82
Quelle: MODS-Schema: Element language mit encoding scheme
Soll nach PICA (GBV) gemappt werden!
Aus der GBV-Katalogisierungsrichtlinie:
<language> <languageTerm type="code" authority="iso639-1"> de </languageTerm> </language>
Die Kategorie 1500 enthält Angaben zur Sprache des vorliegenden Textes in codierter Form. Die Codierungen erfolgen nach ISO 639-2, vgl. Anhang 2. Bei Neuaufnahmen im System ist die Angabe der Sprachbezeichnung verbindlich.
Fragen: Was muss man beim Mapping beachten? Ist ein Mapping möglich?
Mapping - Lösung
Seite 83
Antwort: Ja, ein Mapping ist möglich: die Semantik der Felder in den beiden Schemas stimmen überein. Aber: das Vokabular muss „übersetzt“ werden. Anhand einer Konkordanz zwischen ISO 639-1 und ISO 639-2 müssen die Werte konvertiert werden. de ger
Zusammenfassung: Mapping und Crosswalks
Seite 84
“A crosswalk is a specification for mapping one metadata standard to another. Crosswalks provide the ability to make the contents of elements defined in one metadata standard available to communities using related metadata standards. Unfortunately, the specification of a crosswalk is a difficult and error-prone task requiring in-depth knowledge and specialized expertise in the associated metadata standards. Obtaining the expertise to develop a crosswalk is particularly problematic because the metadata standards themselves are often developed independently, and specified differently using specialized terminology, methods and processes. Furthermore, maintaining the crosswalk as the metadata standards change becomes even more problematic due to the need to sustain a historical perspective and ongoing expertise in the associated standards.” http://www.niso.org/publications/white_papers/crosswalk/
5. Schnittstellen
Seite 85
Schnittstellen Softwareschnittstellen / softwareseitige Datenschnittstellen : • definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und
Komponenten ausgetauscht werden • Z39.50:
• Netzwerkprotokoll, das • im Bibliothekswesen Standard zur Abfrage von bibliographischen
Informationssystemen • Mit dem Zusammenführen der Daten hat die Bedeutung der Abfrage von
verteilten Informationssystemen mit Z39.50 abgenommen
• SRU: • Nachfolger von Z39.50 • HTTP-basierte Protokoll Search/Retrieve via URL (SRU/SRW), • Techniken basieren auf etablierten Internet-Standards wie URI und XML
Seite 86
87
Linkresolver • System zur Verfügbarkeitsanzeige wissenschaftlicher Publikationen. • HTTP-basierter Service • Metadaten der Quelle (Source) + gespeicherte Informationen über lokale Bestände
und Lizenzen • Links auf "passende" Dienste wie elektronische Volltexte, Dokumentenlieferdienste,
den lokalen OPAC und den Buchhandel
Link-Resolver
http://www3.interscience.wiley.com/resolve/openurl? genre=article &issn=0022-2380 &volume=30 &issue=6 &spage=1017
OpenURL
Seite 87
openURL „The OpenURL is a protocol for interoperability between an information resource and a service component that offers localized services in an open linking environment. It is in effect an actionable URL that transports metadata or keys to access metadata for the object for which the OpenURL is provided. „ (http://www.oclc.org/research/projects/openurl/default.htm)
• Standard ANSI/NISO Z39.88 • ANSI/NISO Z39.88 - The OpenURL Framework for Context-Sensitive Services • Pflege und Entwicklung OCLC • Key-Encoded Value Guidelines:
http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html
Seite 88
openURL
Standard für die Übermittlung von bibliographischen Metadaten (Context-Sensitive Linking)
http://openurlgw.hbz-nrw.de/gw ?aulast=Clark &aufirst=Timothy &au=Wright%2C+Mike &atitle=So%2C+Farewell+Then+.+.+.+Reflections+on+Editing+the+Journal+of+M anagement+Studies &jtitle=Journal+of+management+studies+%3A+JMS &stitle=J.+Manage.+Stud.+(GB) &date=2009 &volume=46 &issue=1 &pages=1-9 &issn=00222380 &coden=JMASB2 &genre=article
Seite 89
OAI-PMH - OAI Protocol for Metadata Harvesting
Open Archives Initiative (OAI):
• Initiative von Betreibern von Dokumentenservern, um die abgelegten elektronischen Publikationen besser auffindbar und nutzbar zu machen
• OAI Protocol for Metadata Harvesting (OAI-PMH) zum Einsammeln (Harversting) und Weiterverarbeiten von Metadaten
• Metadaten werden von Data Providern bereitgestellt • Geharvestete Datensätze werden von Service Providern aufbereitet und
bereitgestellt • kleinster gemeinsamer Nenner: Dublin-Core-Datenmodell • Erweiterung mit zusätzlichen Standards (z.B. MODS, MARC mittels MARCXML)
empfohlen • http://www.openarchives.org/pmh/
Seite 90
OAI-PMH - OAI Protocol for Metadata Harvesting
OAI-Anfrage an EconStor
http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=didl&identifier=oai:econstor.eu:10419/41393
Seite 91
92
OAI-PMH - OAI Protocol for Metadata Harvesting http://www.econstor.eu/dspace-oai/request? verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:econstor.eu:10419/41393
Seite 92
93
OAI-PMH - OAI Protocol for Metadata Harvesting
6 verbs um ein Repository abzufragen: • GetRecord: individuellen Datensatz abfragen • Identify: Information über Repository
abfragen • ListRecords: um Datensätze zu harvesten • ListIdentifiers: Abkürzung von ListRecords: man bekommt nur header; nicht Datensätze
• ListMetadataFormats: die zur Verfügung stehen Metadatenformate abfragen
• ListSets: Kollektionen eines Repositorys abfragen
Seite 93
OAI-Explorer
Schnittstelle um Repositories interaktiv auf ihre Übereinstimmung mit dem OAI-PMH zu testen. http://re.cs.uct.ac.za/
Seite 94
Schnittstellen für Literaturverwaltung
Seite 95
COinS (ContextObjects in Spans) • Methode zur Einbindung von bibliographischen Metadaten in HTML-Seiten • Basiert auf OpenURL • Browser-Plugins / weitere Programme können aus den „unsichtbaren“ COinS im
Quelltext einer Webseite • OpenURL-Links für einen Linkresolver erzeugen • Metadaten auslesen (Literaturverwaltung)
• Prinzip: Mikroformat
Schnittstellen für Literaturverwaltung
Seite 96
Zusammenfassung: Schnittstellen
Seite 97
• Schnittstellen definieren, wie Kommandos und Daten zwischen verschiedenen Prozessen und Komponenten ausgetauscht werden
• Ein Linkresolver ist eine "Allround-Schnittstelle" zur Anzeige von Verfügbarkeits-informationen.
• OpenURL nutzt für jedes Dokument einen abstrakten Namen, der durch einen Mechanismus zu einer URL aufgelöst wird (Actionable URL)
• Key-Encoded-Values: einem Schlüssel (Element) wird ein Wert zugeordnet • OAI-PMH: OAI Protocol for Metadata Harvesting: Schnittstelle zum Harvesten
von Metadaten von Dokumentenservern • Dublin-Core-Datenmodell • häufig zusätzliche Standards
• Metadaten für die Literaturverwaltung: • RIS, BibTeX, EndNote, Mikroformat COinS
6. Metadaten für das Semantic Web
Seite 98
Metadaten für das Semantic Web Problem heutiger Suchmaschinen 1. Unpassende Suchergebnisse
Suchanfrage ist mehrdeutig (Homonymie / Polysemie)
2. Fehlende Suchergebnisse
Synonyme werden bei Suche nicht berücksichtigt
z.B. Suche nach „Zukunftsforschung“ findet nicht „Futorologie“, „future studies“
Ursache • Mangel an expliziter Semantik
Seite 99
100
Mikroformate: semantische Annotation • Formate zur »Feinstrukturierung« von Webseiten. • (X)HTML-Dokumente menschen- und maschinenlesbar mit Infos ergänzt • Mikroformate nutzen vorhandene XHTML-Attribute • Informationen lassen sich aus einer Website extrahieren und anderen
Programmen zugänglich machen • Domain-spezifische Vokabulare: Termine, Kontaktinformationen, soziale
Beziehungen. • http://microformats.org/
Seite 100
BEGIN:VCALENDAR VERSION:2.0 PRODID:http://www.example.com/calendarapplication/ METHOD:PUBLISH BEGIN:VEVENT UID:[email protected] ORGANIZER;CN="Alice Balder, Example Inc.":MAILTO:[email protected] LOCATION:Somewhere SUMMARY:Eine Kurzinfo DESCRIPTION:Beschreibung des Termines CLASS:PUBLIC DTSTART:20060910T220000Z DTEND:20060919T215900Z DTSTAMP:20060812T125900Z END:VEVENT END:VCALENDAR
• Microdata erweiterte Microformats und überwindet deren Schwächen (z.B. unflexibel) • Ausdruckstärkere semantische Annotation von Webseiten • Specification: http://www.w3.org/TR/microdata/ • Attributerweiterung für HTML5: itemprop, itemref, itemtype, itemscope, ..
Microdata: Schema.org
Seite 101
• 2011: Initiative der Suchmaschinenbetreiber Google, Bing, Yahoo, Yandex: schema.org
• “create and support a common set of schemas for structured data markup on web pages.”
• Nutzen für Fachportal EconBiz: Verbesserte Verbreitung der Meta-daten
Microdata: Schema.org
Seite 102
Google Structured Data Testing Tool: http://www.google.com/webmasters/tools/richsnippets
Semantic Web Tim Berners Lee (1998): Semantic Web Roadmap: “The web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help.” http://www.w3.org/DesignIssues/Semantic.html
Nur möglich, wenn die Information von Maschinen gelesen und interpretiert werden kann
Heute: • Versuch die Bedeutung einer Information zu extrahieren • Fehleranfällig
Semantic Web: • Web Content in natürlicher Sprache wird explizit mit
semantischen Metadaten ausgezeichnet • Semantische Metadaten kodieren die Bedeutung des Inhalts in
maschinen-interpretierbarer Art
Seite 103
Tim Berners-Lee at Campus Party Brasil, 2009, http://commons.wikimedia.org/wiki/File%3ATim_Berners-Lee_CP.jpg
Semantic Web Erweiterung des World Wide Web:
Seite 104
„Im Web werden immer mehr veröffentlichte Daten in RDF (s.u.) vorliegen, d.h. sie folgen denselben Standards und können daher frei miteinander kombiniert und verlinkt werden. So entsteht das Semantic Web als eine verteilte Datenbank, die komplexe Abfragen und Schlussfolgerungen über dezentral vorliegende Daten ermöglicht.“ Linked Data und die Bibliothekswelt Adrian Pohl (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf
formale Sprache für die Bereitstellung von Metadaten im WWW Umgesetzt werden diese Beschreibungen nach dem RDF-Modell entweder als
Graph oder nach der RDF-Syntax als XML. Eine Ressource (z.B. eine Monographie) wird durch eine bestimmte Eigenschaft
(property) bzw. Relation beschrieben. Diese Eigenschaft kann einen bestimmten Wert annehmen.
Das Kapital „Marx, Karl“ hatAutor
Ressource Eigenschaft Wert
RDF - Resource Description Framework
Subjekt Prädikat Objekt http://d-nb.info/gnd/4099309-7 dc.creator „Marx, Karl“ http://d-nb.info/gnd/4099309-7 dc.creator http://d-nb.info/gnd/118578537
Subjekt muss URI (Uniform Resource Identifier) sein, Objekt kann eine weitere URI oder ein String (Zeichenkette) sein
Seite 105
Tripel
Ressource - URI - Repräsentation
Seite 106
Repräsentation: Webseite über St. Michaelis
http://dbpedia.org/resource/ St._Michaelis_Church,_Hamburg URI: Identifier für St. Michaelis
Ressource: St. Michaelis
http://commons.wikimedia.org/wiki/File:Michel_-_Noord.jpg
• Uniform Resource Identifier (URI): Zeichenfolge, die zur Identifizierung einer abstrakten oder physischen Ressource dient
• eindeutiger dauerhafter Identifikator einer Ressource
Ressource - URI - Repräsentation
Seite 107
« Ceci n'est pas une pipe » « Das ist keine Pfeife »
René Magritte: La trahison des images, 1928–29
Richtig! Das ist ein Bild einer Pfeife = Repräsentation
Bedeutung für Beschreibung von Bibliotheksressourcen: verschiedene Metadatenstandards können in RDF integriert werden
„The Resource Description Framework (RDF) of the World Wide Web Consortium (W3C) is another model that "provides a mechanism for integrating multiple metadata schemes" [NISO, 2004] for the description of Web resources. It is a data model that provides a framework within which independent communities can develop vocabularies that suit their specific needs and share vocabularies with other communities. It utilizes the XML namespace to effectively allow RDF statements to reference a particular RDF vocabulary or schema. „Zeng, M.L.; Chang, L.M. , http://www.dlib.org/dlib/june06/zeng/06zeng.html
Beispiel DC-RDF: Die Ressource ‚http://ilrt.bristol.ac.uk/people/cmdjb/‘ hat den Titel ‚Dave Beckett´s Homepage‘ und hat den Autor ‚Dave Beckett‘, hat Herausgeber ‚ILRT; University of Bristol‘ und hat das Erstellungsdatum ‚31.7.2002‘
RDF - Resource Description Framework
Seite 108
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Übung
Seite 109
Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
dc:date dc:creator
dc:title dc:identifier dc:contibutor
Eigenschaften
ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008
1. Übersetzen Sie die Information „Harry Potter wird bei Carlsen verlegt“ in RDF und ordnen Sie die Bestandteile Subjekt, Prädikat und Objekt zu:
RDF - Resource Description Framework - Lösung
Seite 110
Subjekt Prädikat Objekt Harry Potter wird verlegt bei Carlsen
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/990563480
http://d-nb.info/gnd/136971857
“Metadata for semantic and social applications”
Greenberg, Jane
ID: http://d-nb.info/990563480 Titel: Metadata for semantic and social applications Verfasser: Greenberg, Jane (http://d-nb.info/gnd/136971857) Jahr: 2008
dc:date
dc:creator
dc:title
http://d-nb.info/990563480 „2008“
dc:creator
2. Übersetzen Sie die Informationen in RDF und visualisieren Sie die Tripel (URI = Ellipse, Relation = Pfeil, Quadrat = Literal, „einfacher Text“)
Meta-Modell: RDF-Schema
Seite 111
http://d-nb.info/gnd/4099309-7 dc:creator „Marx, Karl“
dc:Bibliographic Resource dc:Agent dc:creator
rdfs:class rdfs:class rdfs:property
rdfs:class
rdf:type
rdf:type
rdf:type
rdf:type rdf:type
rdfs:subClassOf rdfs:subClassOf rdfs:subClassOf
domain range
RDFS
RDF
112
SKOS – Simple Knowledge Organisation System • formale Sprache zur Kodierung von
Wissensorganisationssystemen wie Ontologien, Thesauri, Klassifikationen, Taxonomien, andere Arten von kontrolliertem Vokabular
• baut auf dem Resource Description Framework (RDF) und RDF-Schema auf • skos:broader (Oberbegriffe) • skos:narrower (Unterbergiffe) • skos:related (verwandte Begriffe) • …
Seite 112
Web of Linked Data
RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für Entitäten = Web of Data
Cool URIs don't change What makes a cool URI?
A cool URI is one which does not change.
What sorts of URI change?
URIs don't change: people change them. http://www.w3.org/Provider/Style/URI
Seite 113
Semantic Web Stack
http://commons.wikimedia.org/wiki/File:Semantic_Web_Stack.png
114
Daten für das Semantic Web veröffentlichen: Linked (Open) Data Grundsätze von Linked Data 1. Verwende URIs als Name für Objekte. 2. Verwende http-URIs, so dass andere den Namen nachschlagen können. 3. Wenn jemand einen Namen nachschlägt, stelle hilfreiche Informationen zur
Verfügung und benutze Standards (RDF, SPARQL). 4. Stelle Links zu anderen URIs bereit, so das man Weiteres entdecken kann.
On the Web
Machine-readable data
Non-proprietary format
RDF standards
Linked RDF
Linked Open Data (LOD) ist Linked Data, welche unter einer offenen Lizenz veröffentlicht wird, die eine freie Nachnutzung nicht behindert. 5 Stars of Linked Open Data:
Seite 114
Web of Linked Data
Seite 115
2007
2009
2011
Linked Data in Bibliotheken
Seite 116
Warum? • Sichtbarkeit im Web
maximieren • Bestände leichter auffindbar
machen • Nachnutzbarkeit
sicherstellen: insbesondere durch nichtbibliothekarische Domänen
• Bibliographische Nachweise durch die Verknüpfung mit anderen Informationen anreichern
• Recherchemöglichkeiten optimieren
EconStor goes LOD
Linked Data in Bibliotheken Bereitstellen und Nutzen von kontrollierten Vokabularen und Ontologien in RDF
• DBPedia: • Projekt der Universität Leipzig, FU Berlin und OpenLink Software • strukturierte Informationen aus Wikipedia extrahieren und in RDF bereitstellen • Dreh- und Angelpunkt der Linked Data Cloud • http://dbpedia.org/
• Standard Thesaurus Wirtschaft: http://zbw.eu/beta/econ-ws/about • Gemeinsame Normdatei der Deutschen Nationalbibliothek:
http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html • ….
Bereitstellen und Nutzen von Titeldaten in RDF • hbz: http://lobid.org/about • B3Kat (BSB, KOBV): http://lod.b3kat.de/doc • …
Seite 117
Linked Data in Bibliotheken Bereitstellen von Tools
• Culturegraph: Plattform für Dienste und Projekte rund um die Themen Datenvernetzung, Persistent Identifier und Linked Open Data für kulturelle Entitäten
• http://www.culturegraph.org/
Internationalisierung der bibliothekarischen Regelwerke • Resource Description and Access (RDA)
• Umsetzung geplant in D für 2015 • Format-unabhängig • Entwicklung ausgerichtet auf Nutzung im Semantic Web
• FRBR- und RDA-Vokabular
Seite 118
119
Metadata Registries • Identifikation existierender Elemente verschiedener Schemas und Application Profiles • Zur Nachnutzung und Konsultation bereitstellen • Ermöglichen automatische Anfragen von Anwendungen, die die URIs, die einem
Schema enthalten sind, auflösen können. “The presence of a metadata registry application promotes the wider adoption, standardization and interoperability of metadata by facilitating its discovery, and reuse, across diverse disciplines and communities of practice" [Dublin Core Metadata Registry].
http://rdvocab.info/ Seite 119
Metadata Registries
Cross-Domian http://metadataregistry.org/
Domian-specific http://dcmi.kc.tsukuba.ac.jp/dcregistry/
Seite 120
Linked Data Anwendungen
Seite 121
Zusammenfassung: Semantic Web
• Semantic Web: das „verstehende Web“: Informationen werden auf der Ebene ihrer Bedeutung miteinander verknüpft.
• Voraussetzung: • Maschinen-Interpretierbarkeit der Information RDF • Eindeutigkeit eines Konzepts (einer Person, einer Körperschaft, eines
Themas) URI: Zeichenfolge, die zur dauerhaften Identifizierung einer abstrakten oder physischen Ressource dient
• Vokabular zu Modellierung einer Ontologie: RDFS, OWL, SKOS • RDF + Sprache zur Auszeichnung der Beziehungen (z.B. SKOS) + URIs für
Entitäten = Web of Data • Bibliotheken nutzen und veröffentlichen Linked Open Data • Recherche über Daten verschiedener Domänen • Verbessert Nachnutzbarkeit • Microformats und Microdata: „Semantic Web light“
Seite 122
7. Metadaten-Management in der ZBW
Seite 123
• Unterstützung beim Aufbau und Pflege der
Informationssysteme des Informationszentrums
• Koordination der Datenlieferungen
• Hilfestellung in allen Fragen zu Metadaten-Formaten und Standards
Metadaten-Management in der ZBW
Querschnittsaufgabe
Metadaten-Management
Seite 124
• Mitarbeit in Abteilungs-übergreifende Teams der ZBW
• Mitarbeit in Drittmittel-Projekten
• Enge Zusammenarbeit mit der Abteilung „Innovative Informations- systeme & Publikationstechnologien“
• Mitarbeit in Kooperation und (internationalen) Arbeitgruppen
Metadaten-Management in der ZBW
Metadaten-Management
Seite 125
Aufgaben des Metadaten-Managements Metadatenstandards und Mapping
• Expertise bzgl. Metadaten-Standards und Regelwerken
• Erarbeiten von Crosswalks
Entwicklung und Weiterentwicklung von Metadatenformaten
Neue Systeme:
• Auswahl geeigneter Metadatenstandards gemäß der Anforderungen an das System, Ggf. Kombination mehrerer Standards
• Entwicklung eines interoperablen Schemas
• Erstellung von Application Profiles (Dokumentation)
Bestehende Systeme, Z.B. EconStor, da|ra:
• Kontinuierliche Weiterentwicklung angepasst an sich wandelnde Anforderungen
Seite 126
Koordination von Datenlieferungen Weitere Aufgaben des Metadaten-Managements
• Bereitstellung / Auswertung von Testdaten und Dokumentationen
• Dokumentation von eingehend und ausgehenden Datenlieferungen
• Ansprechpartnerin für alle Fragen bzgl. Metadatenformat, Katalogisierung und Bereitstellung
Seite 127
Qualitätsmanagement und Weiteres Weitere Aufgaben des Metadaten-Managements
• Mitarbeit System-Entwicklung: Funktionen, die auf Metadaten aufbauen, z.B. „Ähnliche Titel“, Merkliste, Exporte in Literaturverwaltungsprogramme
• Weitere Fragestellungen:
• Heterogene Sacherschließung in EconBiz
• Dublettenproblematik: Wie erkennen wir Dubletten?
• Qualitätsmanagement:
• Erstellen von Statistiken
• Datenanalysen: z. B. Prüfung einzelner Kategorien auf zulässige Inhalte
• Datenanalysen: z.B. Stand der Normierung: hohe Bedeutung für das Zusammenführen von Beständen mit gleichen Merkmalen und Zukunftsfähigkeit der Metadaten
Seite 128
Anforderungen an Metadaten-Managerinnen und -Manager
bibliothekarische Metadatenstandards
Regelwerke und Frameworks
Vokabulare und Normen
Normdateien
RAK-WB
Seite 129
• Analytisches Denken
• Spaß daran, sich ständig mit neuen
Aufgaben (Standards, Technologien)
zu beschäftigen und weiterzubilden
Methoden Best Practices
Auszeichnungs-sprachen
Technologien
Hochspezialisierter Arbeitsbereich im Bibliothekswesen
Anforderungen an Metadaten-Managerinnen und -Manager
Seite 130
8. Berufsfeld Metadaten-Management im Kontext der Bibliothek der Zukunft
Seite 131
I LOVE META DATA
• Querschnittsaufgabe • Kooperationen und Projekte • Hoch-spezialisierter Arbeitsbereich • Wissenschaftliche Bibliotheken: Zentrale Fachbibliotheken, Universitäts-
bibliotheken, Nationalbibliotheken, Verbundzentrale • One-Person-Librarians
„Metadaten-Management? Wer muss das wissen?“
Bibliothek der Zukunft
Seite 132
l
Verweisung vom zweiten Bestandteil des zusammengesetzten Namens (§ 319) Ist nach den Regeln ein zusammengesetzter Name in der Ordnungsgruppe des Familiennamens anzusetzen, so wird vom zweiten und von allen weiteren Hauptbestandteilen des zusammengesetzten Namens verwiesen. Die bei der Verweisung übergangenen Teile des zusammengesetzten Namens werden an das Ende der Ordnungsgruppe der Vornamen gestellt (319,1).
l
RAK
Seite 133
Ausbildungsinhalte (2011/2012), untersucht v. A. Schafrick
Bibliothek der Zukunft Metadatenstandards
41
44
2
12
11
0
011
1
10
31
0
00
111
100
0
0 1 2 3 4 5 6 7
Nicht spezifizierte bibliothekarischeMetadatenformate
PICA +PICA3MAB2
MABMABxmlMarc21
ISBDDCTEI
VRAISAD G
EAD
Nicht spezifizierte archivarischeMetadatenformate
Wahlpflichtmodul
Pflichtmodul
Auswertung der Inhalte aus den jeweils aktuellsten öffentlich zugänglichen Modulhandbüchern der grundständigen Studiengänge in Deutschland im Bereich Bibliothekswesen mit dem Bildungsziel Bachelor of Arts (7 Hochschulen). Ergänzt um Inhalte aus den Vorlesungsverzeichnissen WS 2011/2012 und SS 2012.
3
1
3
4
3
7
1
2
1
1
2
1
2
1
2
0
1
0
1
0
0
0
0 1 2 3 4 5 6 7
Forschungsdatenmanagement
Semantic Web (Linked Data,Vokabulare, semantische
Persistent Identifer(Systembeispiele, Aufgaben)
Digitale Langzeitarchivierung(Archivierungsformate, ...)
Normierte Datenübergabe und -integration in verteilten Systemen
Datenmodellierung/Datenmodelle
Aktuelle Entwicklungen beiStandards zum Datenaustauch
Kommunikationsprotokolle (OAHPMH, Z39.50)
Crosskonkordanzen, TerminologieMapping
Metdata-Crosswalks
Unterschiede Austauschformat,Internformat …
Wahlpflichtmodul
Pflichtmodul
Seite 133
„Woher soll ich das wissen?“
Seite 134
„Metadaten-Management? Chancen?“
Bibliothek der Zukunft
Stellenanzeigen für Bibliothekarinnen und -Bibliothekare (Dipl. und B.A.) in Bibliotheken des spezialisierten und hochspezialisierten im deutschsprachigen Bereich vom 01.11.2011-30.04.2012 aus inetbib und Bibliojobs
Seite 134
Automatisierung • Automatische Indexierung und Klassifizierung • Automatische Strukturerkennung von elektronischen Dokumenten • Automatische Formalerschließung von elektronischen Dokumenten • Schließen von Lücken bei Formal- und Sacherschließung • Ergebnisse reichen derzeit nicht an intellektuelle Ergebnisse heran • Semi-automatische Verfahren • „Automatische Verfahren funktionieren nicht automatisch“ Entwickeln und Betreuen von automatischen Verfahren
„In der Bibliothek arbeiten bald nur noch Informatiker“
Bibliothek der Zukunft
Seite 135
Seite 136
„Wer geht denn in die Bibliothek? Ist doch alles im Internet“
Bibliothek der Zukunft
Seite 136 „Zur Bibliothek“, bmgnrs, http://www.flickr.com/photos/gigl/4807897633/
http
://w
ww.
wer
-wei
ss-w
as.d
e/th
eme1
99/a
rticl
e709
8730
.htm
l
Buchlose Bibliothek wächst und gedeiht
Bibliothek der Zukunft
Seite 137
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg
Metadaten: • (semi-)automatisch erstellte
Metadaten • Metadaten für das Semantic Web • RDF, RDFS • OWL • SKOS • Ontologien statt Schlagwortlisten • Modellierung
Seite 138
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg
Forschungsdaten: • Mitarbeit bei der Entwicklung von
Forschungsumgebungen • Entwicklung von
Publikationsplattformen • Unterstützung / Beratung der
Forscher • Langzeitarchivierung, Dokumentation
und Verbreitung • ganz praktisch: z.B. Normierung von
Entitäten • Data Librarian: unterstützt bei
Recherche nach FD und bei der Erstellung von Metadaten
Seite 139
What is our role?
Bibliothek der Zukunft
http://thinklinks.files.wordpress.com/2013/03/beyondthepdf2_day1_hires.jpg
Informationssysteme: • Integration von Metadaten aus
verschiedenen Domänen: Bibliotheken, Museen, Archive, …, Internet
• Erleichterte Verfügbarkeit für elektronische Dokumente (Rechtemanagement)
• Dienst dort bereitstellen, wo die Nutzer sind: von Facebook bis Forschungsumgebung
Seite 140
What is our role?
Bibliothek der Zukunft
Seite 141
Auf Du und Du mit Dublin Core & Co.
„Metadata is a love note to the future”, Cea., https://secure.flickr.com/photos/centralasian/8071729256/in/photostream/ Seite 142
Seite 143
Literatur
Seite 143
Berners-Lee, Tim: Design Issues. Architectural and philosophical points, 6. Januar 1997 http://www.w3.org/DesignIssues/ Brand, A., Daly, F., Meyers, B., & National Information Standards Organization (U.S.)(2003):Metadata demystified: A guide for publishers. Bethesda, Md: NISO Press. (www.niso.org/standards/resources/Metadata_Demystified.pdf ) Caplan, Priscilla: Metadata Fundamentals for All Librarians. Chicago, 2003, ALA Editions Dublin Core Metadata Initiative: DCMI Glossary. http://dublincore.org/documents/usageguide/glossary.shtml Foulonneau, Muriel; Riley, Jenn (2008): Metadata for digital resources: implementation, systems design and interoperability. Oxford: Chandos. Greenberg, J. (2008): Dublin Core History and Basics. Tutorial ASIST DC 2008 http://dc2008.de/wp-content/uploads/2008/09/tutorial-1.pdf Harper, Corey (2010): Dublin Core Metadata Initiative: Beyond the Element Set – NISO Information Standards Quarterly, v.22, no. 1, Winter 2010. http://www.niso.org/publications/isq/2010/v22no1 Hillman, D. I., & Westbrooks, E. L. (2004). Metadata in Practice. Chicago: ALA Editions. In Baca, M., & Getty Research Institute. (2008). Introduction to metadata. Los Angeles (Calif.: Getty Research Institute. Miller, Eric (1998): An introduction to the resource description framework. In: D-Lib Magazine, Volume 4 Issue 5, May 1998. http://www.dlib.org/dlib/may98/miller/05miller.html Mitchell, Nicole: Metadata Basics (2066): In: The Southeastern Librarian, Vol. 54: Iss. 3, Article 6 . http://digitalcommons.kennesaw.edu/seln/vol54/iss3/6/
Literatur National Information Standards Organization (U.S.). (2004): Understanding metadata. Bethesda, MD: NISO Press. (http://www.niso.org/publications/press/UnderstandingMetadata.pdf ) Pohl, Adrian (2011): Linked Data und die Bibliothekswelt. Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen). http://www.hbz-nrw.de/dokumentencenter/produkte/lod/aktuell/pohl_2011_linked-data_ODOK.pdf Riley, Jenn (2008-2010): Seeing Standards: A Visualization of the Metadata Universe. http://www.dlib.indiana.edu/~jenlrile/metadatamap Söllner, Konstanze (2008):„Academic Librarian of the Future“-Woher kommen die Spezialisten für die neuen Aufgaben in den Bibliotheken?. 102. Deutscher Bibliothekartag <Leipzig, 2013> http://nbn-resolving.de/urn:nbn:de:0290-opus-14644 St. Pierre, Margaret; LaPlant, William P. (1998): Issues in Crosswalking Content Metadata Standards.(NISO White Papers). Bethesda, MD: NISO. http://www.niso.org/publications/white_papers/crosswalk/ Weibel, S. et.al. (2002): Metadata Principles and Practicalities. In: D-Lib-Magazin, Vol. 8, No. 4, April 2002 Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part I: Achieving Interoperability at the Schema Level. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/chan/06chan.html Zeng, M.L.; Chang, L.M. (2006): Metadata Interoperability and Standardization – A Study of Methodology Part II: Achieving Interoperability at the Record and Repository Levels. In: D-Lib-Magazin, Vol. 12, No. 6, June 2006. http://www.dlib.org/dlib/june06/zeng/06zeng.html Zeng, Marcia Lei, Jian Qin (2008): Metadata. New York: Neal-Schuman Publishers.
Seite 144
Webressourcen
K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Blogs Metadata Matters: Bloggerin: Diane Hillmann: http://managemetadata.com/blog/
Coyle's InFormation: Bloggerin: Karen Coyle: http://kcoyle.blogspot.de/
Managing Metadata: Bloggerin: Laura Smart: http://library.caltech.edu/laura/
Metadata Discussion Group (Indiana University Libraries): https://blogs.libraries.iub.edu/metadata/
Fachjournale Journal of library metadata. 2008. New York, NY: Haworth Press. http://www.informaworld.com/smpp/title~db=all~content=t792306902 .
D-Lib-Magazin (frei): http://www.dlib.org/
Seite 145
Webressourcen
Fortbildung K.I.M. Kompetenzzentrum Interoperable Metadaten: http://www.kim-forum.org/
Hyperlinked Library MOOC: http://slisweb.sjsu.edu/about-slis/news/detail/free-online-course-extends-learning-individuals-across-globe
OpenHPI: (Hasso-Plattner-Institut für Informatik) https://openhpi.de/
Tools Dublin Core Tools zur Erstellung / Bearbeitung: http://www.dublincore.org/tools/ Marc-Tools, wie z.B. MarcEdit: http://www.loc.gov/marc/marctools.html Notepad++: Freier Text-Editor für große Dateien. Suchen und Ersetzen mit regulären Ausdrücken möglich Firefox-AddOns: Dublin Core Viewer, Operator (Mikroformaterkennung) Chrome-AddOn: Schema Explorer (Mikrodata), OpenLink Data Explorer
Seite 146
Metadatenstandards
• Dublin Core: www.dublincore.org • Pica3/Pica+: (Katalogisierungsrichtlinie des Gemeinsamen Bibliotheksverbunds):
http://www.gbv.de/vgm/info/mitglieder/02Verbund/01Erschliessung/02Richtlinien/01KatRicht/inhalt.shtml
• MARC21: http://www.loc.gov/marc/ • MODS: http://www.loc.gov/standards/mods/ • METS: http://www.loc.gov/standards/mets/ • Library of Congress Standards: http://www.loc.gov/standards/ • ONIX: http://www.editeur.org/83/Overview/ • TEI: http://www.tei-c.org/index.xml • DDI: http://www.ddialliance.org/ • BibTeX: http://www.bibtex.org/ • RIS: http://www.refman.com/support/risformat_intro.asp • COinS (KEV): http://epub.mimas.ac.uk/openurl/KEV_Guidelines-200706.html
Seite 147