bayerisches geologisches landesamt gi tagung hannover 06.- 07. juni 2005 erfahrungen mit der...
Post on 05-Apr-2015
110 Views
Preview:
TRANSCRIPT
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Einsatz eines ThesaurusEinsatz eines Thesaurus
Thesaurus
Thesaurus element
internally related through-BT broader term-NT narrower term-UF used for-RT related term
Key list
Key element
Application data
data references key elementsvia foreign key relationships
interested citizens,non geo-scientists etc.
non professional approachto the data
geo-scientists
professional approachto the data
Transfer information from selected thesaurus termsto their equivalent key lists or key elements or direct to the attributes
.
Thesaurus
Thesaurus element
internally related through-BT broader term-NT narrower term-UF used for-RT related term
Key list
Key element
Application data
data references key elementsvia foreign key relationships
interested citizens,non geo-scientists etc.
non professional approachto the data
geo-scientists
professional approachto the data
Transfer information from selected thesaurus termsto their equivalent key lists or key elements or direct to the attributes
.
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Fachdaten des BISFachdaten des BIS
Alle Daten haben RaumbezugAlle Daten haben Raumbezug ! !
Punktdaten Punktdaten (derzeit ca. 150.000 Einzelobjekte)(derzeit ca. 150.000 Einzelobjekte)
• Bohrungen, bodenkundliche Profile, geologische Aufschlüsse …• Schichtenverzeichnisse• Proben- und Labordaten
Flächendaten Flächendaten (31 Fachebenen mit ca. 270.000 Objekten)(31 Fachebenen mit ca. 270.000 Objekten)
• Geologische und Bodenkundliche Grundlagenkarten• Hydrogeologische Spezialkarten• Rohstoffkarten
Orientierungsdaten Orientierungsdaten (13 Fachebenen)(13 Fachebenen)
• Topographische Karten verschiedener Maßstäbe• Verwaltungsgrenzen• Naturräumliche Gliederung
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
BIS-ClientsBIS-Clients
Behördennetz ClientBehördennetz Client Java Swing basiertJava Swing basiert
• Zugang über BehördennetzZugang über Behördennetz• DatenrechercheDatenrecherche• DatenpflegeDatenpflege• DatenexportDatenexport• Kompletter DatenumfangKompletter Datenumfang• Objektzugriff nach BerechtigungsprüfungObjektzugriff nach Berechtigungsprüfung• Exakte LageinformationExakte Lageinformation
• Zugang über InternetZugang über Internet• Keine ZugriffsbeschränkungKeine Zugriffsbeschränkung• Alle ObjekteAlle Objekte• Wenig Objekt-DetailsWenig Objekt-Details• Ungenaue LageinformationUngenaue Lageinformation
Internet Client (GeoFachdatenAtlas)Internet Client (GeoFachdatenAtlas) HTML basiertHTML basiert
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
System-Architektur (einfach)System-Architektur (einfach)SchichtenarchitekturSchichtenarchitektur
BIS-ClientBIS-Client
Applikations-ServerApplikations-Server
DatenbankDatenbank
HTML-ClientHTML-Client
Web-ServerWeb-Server
CORBACORBA
JDBCJDBC
HTTPHTTP
TCP/IPTCP/IP
FirewallFirewall
BehördenBehördenÖffentlichkeitÖffentlichkeit
DatenpoolDatenpool
DatengenerierungDatengenerierung
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Fachklasse
Attributgruppe
Attribut
Tabelle
Feld
Objekt
Zukunft ?
Metadatenmodell (vereinfacht)Metadatenmodell (vereinfacht)
OODBOODB
XML-DBXML-DB
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Modellierung mit MetadatenModellierung mit Metadaten
Fachliches ModellFachliches Modell
Metadaten
Metadaten-RepositoryMetadaten-Repositoryin Oracle DBin Oracle DB
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Metadaten-PflegewerkzeugMetadaten-Pflegewerkzeug
FachklasseFachklasse
AttributgruppeAttributgruppe
AttributAttribut
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Abstraktes MetamodellAbstraktes Metamodell
FachklasseFachklasse
AttributgruppeAttributgruppe
BeziehungBeziehung
BohrungBohrung
Allgemeine Allgemeine StammdatenStammdaten
ProbeProbe
Model BuilderModel Builder(Serverstart)(Serverstart)
7322BG0000027322BG000002
R-Wert: 44 50600R-Wert: 44 50600
H-Wert 35 20400H-Wert 35 20400
Proben-ID 7322BG0001GProben-ID 7322BG0001G
Probenart: GesteinsprobeProbenart: Gesteinsprobe
ObjektfabrikObjektfabrik(Laufzeit)(Laufzeit)
generiertgeneriert instantiiertinstantiiert
Abstraktes, statisches Abstraktes, statisches MetamodellMetamodell
Dynamische Klassen im SpeicherDynamische Klassen im Speicher ObjekteObjekte
aus Metadatenaus Metadaten
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Schlüssellisten im BISSchlüssellisten im BIS
ApplikationsdatenSchlüssellisten& SchlüsselFachthesaurus
300 Schlüssellisten300 Schlüssellisten
60.000 Fachbegriffe 60.000 Fachbegriffe
Daten referenzierenSchlüssel
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
SchlüssellistenSchlüssellisten
• Vorteile der „terminologischen Kontrolle“Vorteile der „terminologischen Kontrolle“
• Eindeutigkeit bei der „Beschlagwortung“Eindeutigkeit bei der „Beschlagwortung“
• Erleichterung bei Formulierung von RecherchenErleichterung bei Formulierung von Recherchen
• Vorgabe von zielführenden Recherchebegriffen
• Generierung von Suchkriterien unter Zuhilfenahme von
Hierarchischen Strukturen
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Zugänge zu den Inhalten des BISZugänge zu den Inhalten des BIS
Experten mit guten internen KenntnissenExperten mit guten internen Kenntnissenüber Datenmodell und internen Aufbau über Datenmodell und internen Aufbau
Interessierte „Laien“ ohne DatenmodellkenntnissInteressierte „Laien“ ohne Datenmodellkenntniss
u.U. lange Suchzeitenu.U. lange Suchzeiten
Im schlechtesten Fall erfolglose RechercheIm schlechtesten Fall erfolglose Recherche
Verweise zu den gesuchten ObjektenVerweise zu den gesuchten ObjektenISPU / UOKISPU / UOK++
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
27%
16%3% 3% 51%
schlüssellistenbasierte alphanumerische & CLOBsnumerische zeitbezogenesonstige
SchlüssellistenThesaurus, z.B.UOK-Thesaurus,UMTHES,GEMET,SNS
Recherche und Beschlagwortungüber Schlüssellisten
Verbesserte, inhaltliche Erschließungdurch Einsatz von Thesauri
Felder im BIS
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Eingesetzte ThesauriEingesetzte Thesauri
GEMET (General Multilingual Environmental Thesaurus)GEMET (General Multilingual Environmental Thesaurus)
SNS Semantischer Netzwerk ServiceSNS Semantischer Netzwerk Service
UOK ThesaurusUOK Thesaurus
UMTHES (Thesaurus des UDK)UMTHES (Thesaurus des UDK)
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
DatenmodellDatenmodell
conceptconcept
property_typeproperty_type
property_valueproperty_value
languagelanguage
relation_idrelation_id
term_sourceterm_source
term_targetterm_target
relation_typerelation_type
weightweight
term_idterm_id
conceptconcept
cccc
term_typeterm_type
classclass
cc_term_idcc_term_id
concept_idconcept_id
namename
base_ccbase_cc
CONCEPTCONCEPT
TERMTERM
RELATIONRELATION
CONCEPT_PROPERTYCONCEPT_PROPERTY
relationrelation
property_typeproperty_type
property_valueproperty_value
languagelanguage
RELATION_PROPERTYRELATION_PROPERTY
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Iteration über alle Begriffe des Thesaurus
Iteration über alle Begriffe des BIS
Analyse der Begriffe,Zerlegen in Worte
Analyse der Begriffe,Zerlegen in Worte
Wortstammbildung"stemming"
Wortstammbildung"stemming"
Vergleichen der Stämmevon allen Begriffen des Thesaurus
mit allen Begriffen des BIS
Gewichtung der Übereinstimmungenund Erstellen einer "Crosskonkordanz"
Crosskonkordanzbildung zwischen Thesaurus und BISCrosskonkordanzbildung zwischen Thesaurus und BIS
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Gewichtung der gefundenen CrosskonkordanzenGewichtung der gefundenen Crosskonkordanzen
2 * nEqualStemsweight= ___________________________________
nStemsThesaurus + nStemsDataSource
nEqualStems = Anzahl gleicher Wortstämme zwischen Thesaurus und Datenquelle
NStemsThesaurus = Anzahl aller Wortstämme im Thesaurusbegriff
NStemsDataSource = Anzahl aller Stämme im BIS-Begriff
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
TheVi XMLTheVi XML<?xml version="1.0" encoding="ISO-8859-1"?><?xml version="1.0" encoding="ISO-8859-1"?>
<thevi_document<thevi_document xmlns:xi="http://www.w3.org/2001/XInclude">xmlns:xi="http://www.w3.org/2001/XInclude">
<head><head>
… …
</head></head>
<concept_collection top="TheVi"><concept_collection top="TheVi">
… …
</concept_collection></concept_collection>
<concept_collection top=„BIS_SL3451"><concept_collection top=„BIS_SL3451">
… …
</concept_collection></concept_collection>
<concept_collection top=„Gemet"><concept_collection top=„Gemet">
… …
</concept_collection></concept_collection>
… …
</thevi_document></thevi_document>
DokumentbeschreibungDokumentbeschreibung
Begriffssammlung MetamodellBegriffssammlung Metamodell
Begriffssammlung BIS SchlüssellisteBegriffssammlung BIS Schlüsselliste
Begriffssammlung GemetBegriffssammlung Gemet
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
TheVi XML – Concept CollectionTheVi XML – Concept Collection
<concept_collection top="..."><concept_collection top="...">
<languages><languages> … </languages>… </languages>
<representations><representations>
<node_representation> … </node_representation><node_representation> … </node_representation>
… …
<edge_representation> … </edge_representation><edge_representation> … </edge_representation>
… …
</representations></representations>
<terms><terms>
<term> … </term><term> … </term>
… …
</terms></terms>
<relations><relations>
<relation> … </relation><relation> … </relation>
… …
</relations></relations>
</concept_collection></concept_collection>
Sprachen (Default, Alternativen)Sprachen (Default, Alternativen)
DarstellungsvorschriftenDarstellungsvorschriften
TermeTerme
RelationenRelationen
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
TheVi XML und TransformationenTheVi XML und Transformationen
TheVi XMLTheVi XML
XSLTXSLTXTMXTM RDFRDF
z.B. Omnigatorz.B. Omnigator z.B. Protégéz.B. Protégé…… ……
DBDB
(Oracle 10g)(Oracle 10g)
GIRGGIRG
(Webserver mit(Webserver mit
CGI-Perl-Skripten)CGI-Perl-Skripten)
WebbrowserWebbrowser
(Javascript enabled,(Javascript enabled,
Java Plugin)Java Plugin)
TheVi AppletTheVi Applet
TheVi TheVi
ApplikationApplikation
export
export
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Arten von Verbindungen Arten von Verbindungen
VerbindungenGEMET <--> BIS
BIS Thesaurus,z.B. Gemet
•Vom Thesaurus zu BIS KlassendatenVom Thesaurus zu BIS Klassendaten
•Vom Thesaurus zu BIS InstanzdatenVom Thesaurus zu BIS Instanzdaten
Thesaurus -> FachklasseThesaurus -> Fachklasse
Thesaurus -> AttributgruppeThesaurus -> Attributgruppe
Thesaurus -> AttributThesaurus -> Attribut
Thesaurus -> Instanz StammdatenThesaurus -> Instanz Stammdaten
Thesaurus -> Instanz SchichtdatenThesaurus -> Instanz Schichtdaten
Thesaurus -> Instanz ProbendatenThesaurus -> Instanz Probendaten
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Art des Mappings zwischen Thesaurus und BISArt des Mappings zwischen Thesaurus und BIS
Bis_Verweise
AB Aufschluß Bodenkunde
BG Bohrung
QU Quelle
AG Aufschluss Geologie
EF Einzelfundpunkt
GP Geologisches Profil
KB Kartierpunkt Bodenkunde
GR Georisk Profil
AB Instanzdaten
AB Instanz 1 z.B. "7423 AB 000065"
AB Instanz N z.B. "8443 AB 000999"
AB Attribut
AB Attributgruppe
AB Fachklasse
Metadaten
Instanzdaten
~ BIS Proxies
Thesaurus
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Thevi Darstellung der gefundenen BeziehungenThevi Darstellung der gefundenen Beziehungen
Einschränkung auf ein TK-BlattEinschränkung auf ein TK-Blatt
Eine TheviXML Datei mit drei Concept Collections:Eine TheviXML Datei mit drei Concept Collections:
1. GEMET Thesaurus1. GEMET Thesaurus
2.2. Concept Collection mit den BIS StellvertreterobjektenConcept Collection mit den BIS Stellvertreterobjekten des TK Blattes des TK Blattes 74357435 Pfaffenhofen a.d. Ilm Pfaffenhofen a.d. Ilm
3. Eine ConceptCollection mit den zwischen3. Eine ConceptCollection mit den zwischen GEMET und den BIS-Objekten des Blattes 7435 GEMET und den BIS-Objekten des Blattes 7435 gefundenen Crosskonkordanzengefundenen Crosskonkordanzen
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
BIS Objekte auf Blatt 7435 PfaffenhofenBIS Objekte auf Blatt 7435 Pfaffenhofen
1517 Bohrungen BG1517 Bohrungen BG
53 Aufschluss Bodenkunde AB53 Aufschluss Bodenkunde AB
25 Quellen QU25 Quellen QU
71 Einzelfundpunkt EF71 Einzelfundpunkt EF
43 Geologisches Profil GP43 Geologisches Profil GP
196 Aufschluss Geologie AG196 Aufschluss Geologie AG
1905 BIS Objekte auf Blatt Pfaffenhofen1905 BIS Objekte auf Blatt Pfaffenhofen
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Thevi Daten im Touchgraph Thevi Daten im Touchgraph
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Thevi MetamodellThevi Metamodell
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Thevi InstanzverweiseThevi Instanzverweise
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Erste ErgebnisseErste Ergebnisse
Allein zwischen GEMET Terms und BIS ergeben sich über die Allein zwischen GEMET Terms und BIS ergeben sich über die gewählte Methode > 16.000.000 Crosskonkordanzengewählte Methode > 16.000.000 Crosskonkordanzen
Den größten Anteil an den gefundenen Konkordanzen hattenDen größten Anteil an den gefundenen Konkordanzen hattendie BIS Schlüssellisten mit 82 %die BIS Schlüssellisten mit 82 %
Das Datenmodell hat sich zur Verwaltung der Thesauri sowie derDas Datenmodell hat sich zur Verwaltung der Thesauri sowie derCrosskonkordanzen bewährtCrosskonkordanzen bewährt
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
AusblickAusblick
Weitere Thesauri sollen zur Crosskonkordanzbildung Weitere Thesauri sollen zur Crosskonkordanzbildung herangezogen werdenherangezogen werden
Dazu soll auch versucht werden, die angebotenen Web-ServicesDazu soll auch versucht werden, die angebotenen Web-Serviceszu nutzen und nicht mit redundanten Offline-Beständen zu arbeitenzu nutzen und nicht mit redundanten Offline-Beständen zu arbeiten
Bayerisches Geologisches Landesamt
GI Tagung Hannover 06.- 07. Juni 2005
Erfahrungen mit der Anbindung externer ThesauriErfahrungen mit der Anbindung externer Thesauri
Vielen Dank fürs ZuhörenVielen Dank fürs Zuhören
www.bis.bayern.dewww.bis.bayern.de
top related