etb.eun.org etb ist 1999 - 11781 iuk 2001 metadaten + heterogenität in etb 12.03.2001 kluck...
TRANSCRIPT
etb.eun.org
12.03.2001Kluck (HUB/IZ)
1
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Metadaten und Heterogenitäts-behandlung als wesentliche
Elemente zur Entwicklung eines Europäischen Schul Portals - Das
Projekt European Schools Treasury Browser – ETB
Präsentation auf der 7ten Jahrestagung der IuK Initiative Trier 11.-14.03.2001
Michael KluckHumboldt-Universität Abteilung Pädagogik u. Informatik (HUB)
InformationsZentrum Sozialwissenschaften Bonn (IZ)
etb.eun.org
12.03.2001Kluck (HUB/IZ)
2
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Einleitung (I)Einleitung (I) Das ETB Projekt ist in den Kontext des Europäischen
Schulnetzes (EUN) eingebettet. www.eun.org Das Europäische Schulnetz bildet den Rahmen für
die Kooperation zwischen den Europäischen Bildungsministerien zur Förderung des Einsatzes von IuK-Technologie im Bildungswesen.
EUN beruht auf einem Europäischen Netzwerk nationaler und regionaler Computernetzwerke von Materialiensammlungen zu Schulen.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
3
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
BUILD THE BUILD THE ““SCHOOLNET INFORMATION SPACESCHOOLNET INFORMATION SPACE””
etb.eun.org
12.03.2001Kluck (HUB/IZ)
4
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Einleitung (II)Einleitung (II) ETB erarbeitet die technologischen und strukturellen
Voraussetzungen für dieses Netzwerk der Netzwerke. Aufbauend auf einem vorhergehenden Projekt soll ETB
die technische Infrastruktur und die inhaltsbe-zogene Integration der verschiedenen Dienstleistun-gen und ihrer kulturellen und sprachlichen Kontexte bereitstellen.
Diese Präsentation konzentriert sich auf die Integra-tion der Inhalte der beteiligten Netzwerke und Mate-rialsammlungen.
Die wichtigsten Nutzergruppen sind Lehrer und Schüler.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
5
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Entwicklung eines gemeinsamenEntwicklung eines gemeinsamenMetadatensatzesMetadatensatzes
Kontext and Zielsetzung:Bereitstellung ähnlich strukturierter InformationenErleichterung gezielter SucheVermeidung von Vermischung einer spezifischen
Suche und dem unstrukturierten Universum des Internet:
- Thema versus Personennamen (i.e. Ohm, Kierkegaard)- Unterschiedliche fachspezifische Bedeutungen (z.B.
Leistung, Disziplin)- Fachspezifische Bedeutung versus allgemeinsprachliche
Bedeutung (i.e. Lehre, services)
etb.eun.org
12.03.2001Kluck (HUB/IZ)
6
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Metadaten Abgeleitet von den Dublin Core Metadaten-
Elementen und dem EUN Metadatensatz (entwickelt im vorangehenden EUN Projekt)
Weitgehend minimalisiert, aber mit PflichtfeldernM = PflichtkategorieO = Wahlkategorie
RDF Syntax wird benutzt.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
7
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Metadatenelemente (I)Title Titel MCreator Autor MSubject Gegenstand O
or M?!Description Beschreibung MPublisher Veröffentlichung OContributor Mitwirkender ODate Datum OType Typ O
etb.eun.org
12.03.2001Kluck (HUB/IZ)
8
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Metadatenelemente (II)Format Format O Identifier Identifikation MSource Quelle OLanguage Sprache MRelation Bezug zu OCoverage Abdeckung ORights ManagementRechte OAudience Anwender OEUN User Level Schulstufe O
etb.eun.org
12.03.2001Kluck (HUB/IZ)
9
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Metadatenelemente (III) Element Gegenstand (subject)
Neben frei vergebenen KeywordsETB ThesaurusbegriffeTon- oder Video-Clip, der den Inhalt einer
Audio-, audiovisuellen, Bild- oder multimedialen Quelle charakterisiert.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
10
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Metadatenelemente (IV)• Element Schulstufe (EUN user level)
- Schulstufe oder Altersgruppe in der die Ressource eingesetzt wird
- Vorschule- Primarstufe- Erwachsenenbildung- Sekundarstufe- Berufsbildung- Hochschulbildung- Jugendliche (Material für Kinder und Jugendliche im
Allgemeinen)- Erwachsene (Material für Erwachsene im Allgemeinen)
etb.eun.org
12.03.2001Kluck (HUB/IZ)
11
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Produktion der Metadaten Direkter Eintrag durch die Autoren (unter
Benutzung vorgegebener Regeln/Definitionen oder eines Online-Formulars)
Generierung durch die Datensammlungen selbst während des Inputs
Extraktion aus bestehenden unkodierten Daten unter Anwendung von Extraktions-regeln
etb.eun.org
12.03.2001Kluck (HUB/IZ)
12
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Metadaten-Extraktion und AbbildungMetadaten-Extraktion und Abbildung Für verschiedene Datensammlungen, die
unterschiedliche Metadatenstrukturen haben, werden Abbildungsschemata in den ETB Metadatensatz festgelegt.
Für Datensammlungen ohne Metadatenschemata werden Metadaten aus den Eintragungen in den Dokumenten extrahiert, soweit strukturierte Elemente der Ressourcen ermittelt werden können und ein Algorithmus für ihre Konvertierung in Metadatenfelder angewendet werden kann.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
13
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Metadatenaustausch via NNTPMetadatenaustausch via NNTP
etb.eun.org
12.03.2001Kluck (HUB/IZ)
14
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
etb.eun.org
12.03.2001Kluck (HUB/IZ)
15
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Technische Ziele von ETBTechnische Ziele von ETB Ein neuer Ansatz für ein Europäisches Netzwerk von
Datensammlungen Ein Netzwerk basierend auf “Verteilen” nicht
“Einsammeln” Mehrwert für die Benutzer durch einen Thesaurus Erhaltung der vollen örtlichen Kompetenz bezüglich
der Editionspolitik Kontrollinstrumente für die Garantie einer hohen
Qualität Größere Publizität Unterstützung der Multilingualität
etb.eun.org
12.03.2001Kluck (HUB/IZ)
16
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Thesaurus (I)ETB Thesaurus (I) Suchprobleme
Problem der natürlichen Sprache:- Synonyme, Homonyme, Polyseme, Phrasen,
Komposita, SchreibungsvariantenFehlen einer RelevanzkontrolleMultilingualität
etb.eun.org
12.03.2001Kluck (HUB/IZ)
17
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Thesaurus (II)ETB Thesaurus (II) Vorteile eines Thesaurus
Effektive Kontrolle der Indexierungssprache (Vorzugsbenennungen, zwischensprachliche Äquivalenz)
Systematische Darstellung der Deskriptoren (leichte Navigation durch die Terminologie)
Indexierung und Suche mit Hilfe der Postkoordination von Begriffen
Umsetzung der Empfehlungen von Dublin CoreBasis um Heterogenitätsprobleme zu lösen
etb.eun.org
12.03.2001Kluck (HUB/IZ)
18
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
ETB Thesaurus (III)ETB Thesaurus (III)Der Inhalt der Datensammlungen im EUN
Kontext (= Multimedia-Material, Lehrmaterial, Schulprojekte) und die Schulen als Anwendungsbereich und Lehrer und Schüler als Hauptzielgruppen bedürfen einer spezifischen Terminologie.
Nur wenige Datensammlungen im Bereich Schule haben bisher eine eigene Terminologie entwickelt.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
19
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Bearbeiten der HeterogenitätBearbeiten der Heterogenität (I) (I) Benutzung vorhandener Inhaltsbeschreibungen Die Befassung mit der Heterogenität auf der Ebene des Inhalts
bedeutet: Gleiche Wörter oder Phrasen können in verschiedenen
Kontexten unterschiedliche Inhalte ausdrücken (z.B. Bildung, Klasse):
- Sie können irgendwo im Volltext einer Internetquelle vorkommen.
- Sie können der Kode eines Klassifikationsschemas sein, der einem Dokument zugeordnet wurde.
- Sie können ein Indexierungsbegriff sein, der aus einem spezifischen Thesaurus stammt
etb.eun.org
12.03.2001Kluck (HUB/IZ)
20
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Bearbeiten der Heterogenität (II)Bearbeiten der Heterogenität (II)Nutzung vorhandener intellektueller Arbeit,
die von den verschiedenen Datensamm-lungen oder den Autoren der Ressourcen geleistet wurde: Indexierung oder Klassi-fizierung von Dokumenten auch wenn dies mit unterschiedlichen Schemata oder Terminologien geschehen ist.
Nutzung vorhandener Terminologien oder Klassifikationsschemata zur automatischen Erstellung von Transferbeziehungen
etb.eun.org
12.03.2001Kluck (HUB/IZ)
21
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Bearbeiten der HeterogenitätBearbeiten der Heterogenität (III) (III) Methoden zur Lösung von Heterogenitäts-
problemen intellektuelle Erstellung von Cross-Konkordanzen
zwischen relevanten Terminologien und Klassi-fikationsschemata und zwischen verschiedenen Sprachen und automatische (statistische) Generierung Transferbeziehungen
Entwicklung von Transferkomponenten zwischen diesen Terminologien und Schemata und zwischen diesen und den Wörtern, die im Volltext vorkommen (co-occurrence analysis, fuzzy methods, neural networks etc.)
etb.eun.org
12.03.2001Kluck (HUB/IZ)
22
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Mehrsprachiger ZugangMehrsprachiger Zugang (I) (I) Unter Nutzung des ETB Thesaurus und der
Bearbeitung der Heterogenität:Der ETB Thesaurus ermöglicht die Indexierung oder die Suche in jeder der enthaltenen Sprachen und die Ergebnisse können automatisch in allen anderen Sprachen gefunden werden.Die Heterogenitätsbehandlung (intellektuell oder automatisch durchgeführt) erlaubt die Benutzung jedes (sprachspezifischen) Schemas: Ergebnisse können auch in den anderen Schemata oder Sprachen gefunden werden.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
23
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Mehrsprachiger Zugang (II)Mehrsprachiger Zugang (II) Nutzung der Ergebnisse der Cross-Language
Information Retrieval und seiner Evaluierung (siehe: CLEF = Cross-Language Evaluation Forum unter www.clef-campaign.org )
etb.eun.org
12.03.2001Kluck (HUB/IZ)
24
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
SchlussSchluss ETB ist in eine vorhandene, sich schnell entwickeln-
de Anwendung für Praktiker (Lehrer und Schüler) mit einer guten politischen Unterstützung für den Einsatz von Iuk-Technologien im Bildungsbereich integriert.
ETB ist in die führende Forschung auf den Gebieten verteilter Netzwerke, Metadaten, (mehrsprachiges Information Retrieval, mehrsprachige Thesauri und Heterogenitätsbehandlung integriert.
etb.eun.org
12.03.2001Kluck (HUB/IZ)
25
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
Vielen Dank für Ihre Aufmerksamkeit!Vielen Dank für Ihre Aufmerksamkeit! weitere Informationen
zum mehrsprachigen ETB Thesaurushttp://www.en.eun.org/eun.org2/eun/en/etb/content_frame.
cfm?lang=en&ov=3813 Zu weiteren Aspekten des ETB-Projekts
(Beschreibung ganzer Sammlungen, Qualitätsmanagement, technische Lösungen)
http://www.en.eun.org/eun.org2/eun/en/etb/sub_area_frame.cfm?sa=195&row=1
Michael Kluck‘s Veröffentlichungen http://www.educat.hu-berlin.de/~kluck/kl-personal.html
etb.eun.org
12.03.2001Kluck (HUB/IZ)
26
ETB IST 1999 - 11781IuK 2001Metadaten + Heterogenität in ETB
LiteraturhinweiseLiteraturhinweise Ardö/Koch 1999: Anders Ardö, Traugott Koch: Automatic classification applied to the full-text Internet documents in a robot-
generated subject index. In: Online Information 99. Proceedings. 23rd International Online Information Meeting. London, 7-9 Dec 1999, p.239-246. Manuscript at: http://www.lub.lu.se/~traugott/online99.htm
Kluck et al. 2000: Michael Kluck, Jürgen Krause, Matthias Müller, in Kooperation mit Rudi Schmiede u.a. Virtuelle Fachbibliothek Sozialwissenschaften. Bonn: 2000 (= IZ-Arbeitsbericht, Nr. 19); at http://www.bonn.iz-soz.de/publications/series/working-papers/#Virtuell pdf-file for downloading.
Koch/Vizine-Goetz 1999: Traugott Koch, Diane Vizine-Goetz: Automatic Classification and Content Navigation Support for Web Services. DESIRE II co-operates with OCLC. In: Annual Review of OCLC Research 1998 http://www.oclc.org/oclc/research/publications/review98/koch_vizine-goetz/automatic.htm
Koch 1998: Traugott Koch: Nutzung von Klassifikationssystemen zur verbesserten Beschreibung, Organisation und Suche von Internet-Ressourcen. Buch und Bibliothek 50:5, p.326-335. Manuscript with hyperlinks at: http://www.ub2.lu.se/tk/publ/bubmanus.html
Meier 2000: Wolfgang Meier, Matthias N.O. Müller, Stefan Winkler: Virtuelle Bibliothek Sozialwissenschaften. Problembereich und Konzeption. In: Bibliotheksdienst, Vol. 34, No. 7/8, 2000, p. 1236-1244 http://www.dbi-berlin.de/dbi_pub/bd_art/bd_2000/00_07_12.htm
Krause 1999: Jürgen Krause: Sacherschließung in virtuellen Bibliotheken. Standardisierung versus Heterogenität. In: Grenzenlos in die Zukunft. 89. Deutscher Bibliothekarthag in Freiburg im Breisgau 1999. Frankfurt am Main: 2000 (ZfBB-Sonderheft 77)
Krause 1996: Jürgen Krause: Informationserschließung und -bereitstellung zwischen Deregulation, Kommerzialisierung und weltweiter Vernetzung [Schalenmodell]. Bonn: 1996 (= IZ-Arbeitsbericht, Nr. 6); at http://www.bonn.iz-soz.de/publications/series/working-papers/#Informationserschließung pdf file for downlaoding.
Krause/Marx 2000: Jürgen Krause, Jutta Marx: Vocabulary Switching and Automatic Metadata Extraction or How to Get Useful Information from a Digital Library. In: First DELOS Workshop on Information Seeking Searching and Querying in Digital Libraries, Zürich, Switzerland, 11.-12.12.2000 (forthcoming in the proceedings)
Krause 2000: Jürgen Krause: Information Systems for Social Science Research. A Perspective from Information Science. In: Symposium Information system for social sciences, 1.-2.10.2000, Mannheim (forthcoming in the proceedings)
Weibel/Koch 2000: The Dublin Core Metadata Initiative. Mission, Current Activities, and Future Directions. In: D-Lib Magazine 6 (12) 2000 at: http://www.dlib.org/dlib/december00/weibel/12weibel.html