metasuche mit pazpar2

Post on 25-Jan-2015

437 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

Vortrag zur Metasuche mit pazpar2 auf dem Bibliothekartag 2012.

TRANSCRIPT

Metasuche mit pazpar2Sven-S. Porst

Niedersächsische Staats- undUniversitätsbibliothek Göttingen

dankeselbst vorstellenarbeite an der SUB, an Metasuche und virtuellen Fachbibliothekeninsbesondere Lib AAC, GEO-LEO, SUB Metasuche

Metasuche

•Was ist Metasuche?

•… hört sich an wie ein Albtraum

•… ist aber manchmal unvermeidlich

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Was: Metasuche / förderierte Suche / verteilte Suchegleichzeitige Abfrage aus mehreren entfernten Datenquellengemeinsame Anzeige der ErgebnisseAlbtraum (Unvollständigkeit, Geschwindigkeit, Unzuverlässigkeit, Indexe/Möglichkeiten) also: technisch problematisch + potentiell schlechte user experience also: wenn möglich vermeiden + lokalen Index nutzenAber: schwierig, Daten dafür zu bekommen + Updates + hoher Aufwand

Schritte

1. Daten holen

2. Daten normalisieren

3. Ergebnisse verfügbar machen

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.20121. Protokolle (Z39.50, SRU, Solr) / Abfragesprache (CCL/RPN, CQL, Solr) / Ergebnisformat (ISO 2709, XML)2. Normalisieren (heterogene Eingabge → homogene Ausgabe) / MARC/DC/Solr → internes Format / unterschiedlich: Detailtiefen, codierte Informationen (z.B. Medientyp, Sprache)3. Verfügbar machen: wann (a/synchron)? Quellen mischen? Facetten? Exportformate? UX?

bisherige Lösungen

• ohne Support (alt oder selbstgebaut)

• monolithisch (feste Oberfläche)

• an der SUB Göttingen Entscheidung für pazpar2 als Ersatz

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012SUB früher: iPort + eigenes GEO-LEOandere Lösungen, z.B. Metalib, i.d.R. in andere Produkte eingebundenEntscheidung der SUB für: homogene Infrastruktur,

pazpar2

• http://indexdata.com/pazpar2

• open source

• aktive Entwicklung durch Index Data

• Daten, keine Nutzeroberfläche

• als Dienst einbindbar

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Index Data: yaz + andere Projekte, viele Server beruhen auch auf yaz … bieten Support an»Dienst«: primär Schritte 1+2 für Daten: eigene Nutzeroberfläche wird benötigt

1. Daten holen

• basiert auf yaz

• Z39.50, SRU, Solr

• … und zugehörige Abfragesprachen

• liest XML und MARC 21 Daten

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012yaz: Standardbibliothek für bibliographische Verbindungen (Z39.50, SRU, Solr) Liest XML und ISO 2709; NICHT MAB oder unstrukturierte Daten tmarc?liest Daten in 20er Schritten

2. XML Workflow

• internes Datenformat ist XML

… mit frei definierbaren Feldern

• Normalisierung durch XSLT

• XSLTs verkett- und nachnutzbar

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012ISO 2709 wird in MARC XML oder tmarc konvertiertXSL Beispiele: ISO 639-1 zu ISO 639-2/B Sprachcodes oder Fehlerbereinigung

Internes Datenformat

• XSLT für MARC 21 enthalten

• gibt ein gutes Datenformat vor

• Facettierung pro Feld

• Deduplizierung

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012MARC 21 gerne totgesagt, aber: weit verbreitet, Detailtiefetmarc.xsl gibt gutes Datenmodell + eigene Felder (language, multivolume-title, …)Facetten: gute Normalisierung wichtig, ICU Filter anwendbarDeduplizierung: recht einfaches Modell auf Feldbasis, + Merging (siehe Anschlußvortrag S. Lohrum)

MARC 21 → pazpar2

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Datensatz aus OLC SSG-Geo, ArtikelAutoren in MARC 700Sprache unbekanntArtikeldetails in MARC 773

3. Abfrage

• keine Weboberfläche

• http/XML Schnittstelle

• sessionbasiert: init / search / show

• JavaScript zur Kommunikation: pz2.js

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012weitere Befehle: ping / bytarget / termlist / record / settings /

Anzeige

• elementarer JavaScript Client dabei

• erweitert für SUB Göttingen:

• Interface auf Deutsch und Englisch

• ZDB-JOP, Google Books und Maps

• Exportformate

• Nutzungsanalyse mit piwik

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Export RIS/BibTeX/COiNSpiwik: knapp 10% erweiterte Suche, detailanzeige ca 1:1 mit Suchen, gut 10% Facetten, Export 1%, Google Books 2%Histogramm

Bemerkungen

• Entwicklungen: Facettierung, Solr

• Zugriffskontrolle mit pazpar2-access

• TYPO3 Einbindung

• Beispiele:

• GEO-LEO: geo-leo.de

• Lib AAC: aac.sub.uni-goettingen.de

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012auch: Verbesserungsmöglichkeiten (Deduplizierung, Services abfragen, Protokoll)

Demo

http://geo-leo.de/bibtag

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012Demo: Suche nach Solling Treffer Artikel »Numerical Assessment …«, Vollanzeige + JOP Facette Karte Sonderblatt Waldfunktionenkarte + Google Maps Histogramm

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

Vielen Dank

• http://github.com/ssp/pazpar2-all

• porst@sub.uni-goettingen.de

• Fragen?

Metasuche mit pazpar2 • Sven-S. Porst, SUB Göttingen • Bibliothekartag • 24.5.2012

top related