2011 06-09 bibtag2011-kett_vernetzungsstrategien_dnb

Post on 05-Jul-2015

414 Views

Category:

Education

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Linked-Data-Aktivitäten der Deutschen NationalbibliothekNationale und internationale Vernetzungsstrategien

Jürgen Kett

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Die Nationalbibliografie ist ein Graph im Graph des Graphen der Graphen

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20112

3 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Linked Data

NPs, Wikipedia,Homepages,Dienste

Wissenschaftl. DatenSocial Data

News, EreignisseNormen, Standards

Internat. BibliografienGebäude

KunstwerkeArchivalien

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20114

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20115

Planung: • DNB-Titel in einfacher Form noch in diesem Jahr.• Für die DDB ist ebenfalls ein Dataset geplant.

Herausforderungen

– Interoperabilität steigern

– Für leichte Nutzbarkeit / einfachen Zugang sorgen

– Vernetzungsgrad erhöhen

– Mehr Arbeitsteilung / übergreifende Prozesse

– Persistenz/Transparenz

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20116

Herausforderungen

– Interoperabilität steigern

– Für leichte Nutzbarkeit / einfachen Zugang sorgen

– Vernetzungsgrad erhöhen

– Mehr Arbeitsteilung / übergreifende Prozesse

– Persistenz/Transparenz

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Publizieren vonLinked (Open) Data

7

Linked-Data-Mythen

– Alles ist dezentral: keine zentralen Datenquellen / Prozessknoten mehr

– Triple Stores sind ideale DBMS für Bibliotheken

– SPARQL = ideale Suche, nur die GUI fehlt

– Linked Data = Semantische Suche

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20118

Beobachtungen

– Nicht alle interessanten Daten werden als RDF/über SPARQL angeboten.

– Verknüpfungen zwischen Datensets müssen gepflegt werden. Häufig ist dies ein kooperativer Prozess.

– Komplexe Matching-/Clustering-Verfahren brauchen effizienten und direkten Zugriff auf große Wissensbasen.

– Am Besten: Vernetzung/Dublettenvermeidung bei der Datenerstellung, nicht danach.

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 20119

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.

10

???

FacebookAmazon VIAFGNDKatalog1 Katalog2

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Finde Publikationen von Mitgliedern der Facebook-Gruppe „Elvis lebt“ zum Thema „Hüftschwung“ sortiert nach Amazon-Bewertung.

11<

FacebookAmazon VIAFGNDKatalog1 Katalog2

???

definitiv nicht vorhanden

vielleicht nicht vorhandenunpräzise

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Suchmaschine oder andere Recherchedienstleistung

12

Dataset6Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6

Unverknüpfte Entitäten / Dubetten

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201113

Dataset1 Dataset5Dataset4Dataset2 Dataset3 Dataset6

Culturegraph.org

Suchmaschine oder andere Recherchedienstleistung

Offene Plattform zur Datenvernetzung

Culturegraph.orgOffene Plattform zur Datenvernetzung

persistente Identifizierung von Entitäten

Verwaltung und Veröffentlichung von Mappings

Berechnung von Ähnlichkeiten und Verknüpfungen

Offene Daten / Freie Software

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201114

Initiales Projekt: „Resolving und Lookup-Dienst für bibliografische IDs“

– Kooperation hbz/DNB im Auftrag der AG Verbund.

– Aufbau einer Plattform zur Sammlung relevanter Identifier für Titel.

– Bündelung und Identifizierung ähnlicher Ressourcen über eine gemeinsame URI (CG-URI).

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201115

16 | Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

TripleStore

NoSQLDB

RESTSRU-Update OAI SPARQLOAIREST SRU

Map/Reduce

Verteilte Berechnung Von Ähnlichkeitsclustern

SPARQLRESTProvinienz/Historie

17

Fazit

– Vernetzte Daten im WWW sind die Zukunft.

– Veröffentlichung der Daten im Web als Linked Data ist ein idealer Startpunkt.

– Um den Vernetzungsgrad zu erhöhen und Stabilität zu erreichen, werden zusätzliche Infrastruktur, Werkzeuge und passgenaue Erschließungsprozesse benötigt.

– Offene Schnittstellen und Datenformate sind Voraussetzungen.

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

18

Quellen

– Plattform / Projektseitewww.culturegraph.org

– Mailinglisteculturegraph@lists.d-nb.de

– Hbz-Wikihttps://wiki1.hbz-nrw.de (Bereich Semantic Web)

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 2011

Fragen?

| Jürgen Kett | Bibtag 2011: Nationale und internationale Vernetzungsstrategien | 09.06 201119

top related