goobi präsentation darmstadt 2009
DESCRIPTION
Vorstellung des Produktions- und Präsentationssystems "Goobi" auf der Sektion IV Tagung des deutschen Bibliotheksverbandes 2009 in DarmstadtTRANSCRIPT
Digitale Zukunft – Von der Digitalisierung zur Dokumentverfügbarkeit
Dipl. Sozw. Ralf Stockmann (SUB Göttingen)
Orientierung an den Praxisregeln der DFG
• Formate – TIFF, PDF, TEI
• Qualität – 600/300 dpi
• Volltexte – TEI / XML
• Schnittstellen – OAI
• Verfügbarkeit – DFG-Viewer – Persistent Identifier
• Metadaten (METS/MODS) – Bibliographische, Struktur,
technische
“es war eine gute Idee…“
Orientierung an den Praxisregeln der DFG
• Formate – TIFF, PDF, TEI
• Qualität – 600/300 dpi
• Volltexte – TEI / XML
• Schnittstellen – OAI
• Verfügbarkeit – DFG-Viewer – Persistent Identifier
• Metadaten (METS/MODS) – Bibliographische, Struktur,
technische
PR
OD
UC
TION
P
RE
SE
NTATIO
N
Ablauf eines Digitalisierungsprojektes
1. Zielsetzung 2. Auswahl des Materials 3. Benchmarking / Standards 4. Produktionsorganisation / Logistik
5. Arbeitsvorbereitungen (AV) 6. Digitalisierung 7. Qualitätskontrolle (QK) 8. Bildoptimierung / Verarbeitung 9. OCR / Volltextgenerierung 10. Metadatengenerierung
11. Präsentation / Verwertung 12. Zugang / Evaluation 13. (Langzeit) Archivierung
Modularer Aufbau
Produktionsumgebung
Nutzermanagement
• Personen • Gruppen • Rollen • Projekte
“to-do” Listen für jede MitarbeiterIn
Workflowstatus auf Werkstückebene
METS Editor
METS Export zu ZVDD, DFG-Viewer, Europeana, DDB, …
Integrierter Image Viewer (AJAX) OCR Integration
Statistik und Controlling
Präsentationsumgebung
Präsentationsebene: TYPO 3 / Lucene Design und Funktionen online anpassbar
Volltextsuche
OCR Renderfarm beim GBV
• ABBYY Recognition Server • Vorletze Nacht: 300.000 Seiten • NICHT: Fraktur • Wortkordinaten • Volltexte mit TEI Strukturierung
DFG Praxisregeln zu OCR • Es sei aber ausdrücklich vor der Gefahr
gewarnt, dass Nutzer bei mangelnder Dokumentation zu falschen Ergebnissen geführt werden.
• Auf die Suchbedingungen sollte an deutlich sichtbarer Stelle hingewiesen werden.
• Vorteilhaft ist auch, den Text – selbst bei mäßiger Qualität – nicht zu verstecken, damit sich der Nutzer selbst ein Bild von der Qualität seiner Recherchebasis machen kann.
Anzeige des (TEI) Volltextes
OCR Layer über Image
OCR Layer über Image
OCR “Leselupe”
Auf OCR aufsetzende Funktionen
• Named entity recognition – Personen – Orte – Ereignisse
• Semantische Suche • Historische „Plagiatsfälle“ (nach C. Mahnke)
Digitales Inhaltsverzeichnis mit Seitenzahlen
PDF download (auch Unterkapitel)
Projectcounter.org Nutzungsstatistiken
RSS feeds, OAI (konfigurierbar)
Integration des DFG-Viewers
Open Source
• Entwicklergemeinschaft im Aufbau
Partner
Goobi Homepage
www.goobi.org