Linked Open Data
Eine Perspektive für die Bibliothekswelt?
DACHELA 2010, 16.06.2010, Wien
Felix Ostrowski <[email protected]>
Quo vadis, Katalog?
Ziel: von hier...
...nach hier!
Vorteil: wir haben es im Bibliothekswesen bereits jetzt mit strukturierten, verlinkten Daten zu tun
Probleme:Worüber in einem Datensatz gesprochen wird, bleibt implizit
Daten folgen keinem domänenübergreifenden Standard
Lösungsansätze:Entitäten mit einem Identifikator versehen
Daten nach Webstandards veröffentlichen
Der Status Quo
Was ist Linked Open Data?
http://www.w3.org/DesignIssues/diagrams/layers/sweb.png
Linked Data Prinzipien1. Use URIs as names for things2. Use HTTP URIs so that people can
look up those names.3. When someone looks up a URI,
provide useful information, using the standards (RDF, SPARQL)
4. Include links to other URIs. so that they can discover more things.
http://www.w3.org/DesignIssues/LinkedData.html
(HTTP) URIs
RDF
<http://lobid.org/resource/123>< http://purl.org/dc/elements/1.1/creator><http://d-nb.info/gnd/118512676> .
<http://lobid.org/resource/123><http://purl.org/dc/elements/1.1/title> „Ansichten eines Clowns“@de .
<http://lobid.org/resource/123><http://purl.org/dc/elements/1.1/subject><http://dewey.info/class/830> .
…
<http://dewey.info/class/830><http://www.w3.org/2004/02/skos/core#prefLabel> „Literaturen germanischer Sprachen“@de .
<http://dewey.info/class/830><http://www.w3.org/2004/02/skos/core#notation> „830“ .
...
<http://d-nb.info/gnd/118512676><http://d-nb.info/gnd/preferredNameForThePerson> „Heinrich Böll“ .
<http://d-nb.info/gnd/118512676><http://xmlns.com/foaf/0.1/birthday> „1901-12-21“^^xsd:date .
N-Triple RDF-Darstellung
SKOS@prefix ddc: <http://dewey.info/class/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
ddc:16 skos:prefLabel "Logik"@de ;
skos:notation "160" ;
skos:narrower ddc:161 ;
skos:narrower ddc:162 ;
skos:broader ddc:1 .
ddc:161 skos:prefLabel "Induktion"@de ;
skos:notation "161" .
ddc:162 skos:prefLabel "Deduktion"@de ;
skos:notation "162" .
ddc:1 skos:prefLabel "Philosophie und Psychologie"@de ;
skos:notation "100" .
http://www.w3.org/RDF/Validator/
OWL
SPARQLAlle Bücher von Autoren, die in der gleichen Stadt wie Ludwig Wittgenstein geboren wurden, und zwar vor ihm:SELECT ?book
WHERE {
<http://dbpedia.org/resource/Ludwig_Wittgenstein> <http://dbpedia.org/property/birthPlace> ?city .
<http://dbpedia.org/resource/Ludwig_Wittgenstein> <http://dbpedia.org/property/birthDate> ?wbday .
?book <http://dbpedia.org/ontology/author> ?author .
?author <http://dbpedia.org/property/birthPlace> ?city .
?author <http://dbpedia.org/property/birthDate> ?abday .
FILTER (?abday < ?wbday)
}
http://dbpedia.neofonie.de/browse
Skyscrapers in China built before 2000 with more than 50 floors
http://richard.cyganiak.de/2007/10/lod/lod-datasets_2009-07-14.png
Das Web wird zur Datenbank!
Das Web wird zur API!
Referenz auf Entitäten durch URIs Prädikation durch RDFKlassifikation anhand von SKOSRegelwerke durch OntologienAbfragen / Browsen mit SPARQL
Zwischenresümee
Migrationspfad für bestehende Daten
Daten analysierenURIs nachnutzen / prägenOntologien evaluieren, anpassen,
kreierenDaten (ad-hoc) konvertieren Im Web bereitstellen
Und was ist mit dem Datensatz?
Benannte Graphen
Native Datenhaltung in RDF
Katalogisierungsclient erzeugt RDF auf Basis von Ontologien
Daten werden in benannten Graphen organisiert
Benannte Graphen werden in Triplestores gespeichert
Triplestores werden virtuell vereintDisclaimer: relativ neue Technologie!
Zusammenführung von Graphen
Dezentrale Datenhaltung
Open Data Prinzip
"A piece of knowledge is open if you are free to use, reuse, and
redistribute it"
http://www.opendefinition.org/
Geeignete Lizenzen
Keine Non-Commercial LizenzenMöglichkeiten:
Attribution (ODC-BY)Attribution-Share-Alike (ODbL) Public-Domain (CC0, PDDL)
http://www.opendefinition.org/licenses/#Data
Warum?
Anwendung des Open-Access-Gedankens auf (Meta)Daten
Kompatibilität: Im Semantic-Web verwischen die Grenzen zwischen einzelnen Datenbanken
Information möglichst weit sichtbar und zugänglich machen
Wie?
Rechtlichen Status von (Fremd-)Daten klären
Wenn möglich, Veröffentlichung der Daten als Gesamtabzug
Verwendung einer mit der „Open Definition“ kompatiblen Lizenz
Nachhaltige Pflege der veröffentlichten Daten
Die Zukunft von Bibliotheksdaten?
Ein möglichst stark vernetzter Knoten in der LOD-Cloud
Nicht mehr an eine Art oder einen Ort der Präsentation gebunden
Nicht mehr an einen alleinigen Zweck gebunden
Im Web auffindbar
Vielen Dank!
Fragen? Gerne jetzt oder auch später an [email protected]
http://creativecommons.org/licenses/by-sa/3.0/de/