xml-struktur: tei (text encoding initiative)
DESCRIPTION
Die Grundlagen und die Einsatzmöglichkeiten der XML-Struktur TEI-P5 werden vorgestellt.TRANSCRIPT
![Page 1: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/1.jpg)
1
Ursula Welsch
XML-Struktur Text Encoding Initiative
![Page 2: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/2.jpg)
2
Agenda
• Vorrede • Geschichte und Weiterentwicklung • Einsetzbarkeit • Grundkonzept • Metadaten • Allgemeine Textelemente • Dokumenttypen • Besonderheiten • Strukturkonfiguration • Qualitätssicherung und Weiterverarbeitung • Fazit
![Page 3: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/3.jpg)
3
Vorrede
Das Herzstück einer XML-Anwendung ist die Struktur!
• Struktur muss die Inhalte abbilden – nicht das Printwerk
• Semantik so viel wie notwendig für geplante Anwendungen
• Inhaltsmodelle so eng wie möglich für hohe Datenqualität
• Unterstützung von Autor, Redaktion und Produktion
![Page 4: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/4.jpg)
4
Standard-DTDs im Verlagswesen
• DocBook: www.docbook.org
• NLM – National Library of Medicine: dtd.nlm.niv.gov/3.0/
– JATS = Journal Article Tag Suite
– NCBI BTL = National Center of Biotechnology Information Book Tag Library
• TEI – Text Encoding Initiative: www.tei-c.org
![Page 5: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/5.jpg)
5
Geschichte und Weiterentwicklung
Text Encoding Initiative (TEI)
• Entstehung ab Ende der 80er Jahre
• erste Ausgabe der "Guidelines" Mai 1994
• Entwicklung, Nutzung und Pflege bis 2000 als Gemeinschaftsaktivität mehrerer wissenschaftlicher Disziplinen
• seit 2001 TEI Consortium
• Aktuelle Version: TEI P5
In Arbeit:
• SIG Correspondence
Ergänzung
• Music Encoding Initiative (MEI)
![Page 6: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/6.jpg)
6
Einsetzbarkeit
• Ziel: alle Arten von wissenschaftlichem Text
• Dokument orientiert: teiCorpus, TEI
• Anpassungskonzept: Einzelmodule, die je nach Bedarf zu einer Anwendung compiliert werden müssen
• Ausnahme: TEI lite
• Einsatz: heute vor allem in den Digital Humanities
• Lizenz: Creative Commons Lizenz (3.0 Unported)
![Page 7: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/7.jpg)
7
Grundkonzept
• Sprache: englisch
• Dokumentation: ausführlich (1613 Seiten), englisch
• Trennung von Metadaten und Text • Semantische Strukturen:
z.T. in den Elementnamen, z.T. in Attributwerten • Konfigurierbarkeit:
via Online-Tool ROMA => DTD, XML-Schema, Relax NG
![Page 8: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/8.jpg)
8
Metadaten
Element: teiHeader Teile: • fileDesc:
bibliografische Beschreibung • encodingDesc:
Besonderheiten der verwendeten Struktur • profileDesc:
textliche Beschreibung des enthaltenen Korpus • revisionDesc:
Enstehungs- und Bearbeitungsgeschichte der Datei
![Page 9: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/9.jpg)
9
Metadaten
Beispiel: • Tag-Nutzung • Wichtig für
Langzeitarchivierung
![Page 10: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/10.jpg)
10
Allgemeine Textelemente
Hierarchische Struktur • text (front, body, back)
• div und div1, div2 etc.
Absatzformate • Generell: p
• wissenschaftliche, z.B. argument, note, eg
• editionsspezifische, z.B. del, add,rdg
• ansonsten mit dem Attribut @type bei nahezu jedem
Element spezifizierbar
![Page 11: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/11.jpg)
11
Allgemeine Textelemente Zeichenformate • eine reiche Palette von Elementen zur
linguistischen und • interpretatorischen Beschreibung des Texts,
z.B. s, seg, hi, emph, foreign, mentioned, term, title etc.
Verweise • ref, ptr, anchor, seg, xptr, xref
![Page 12: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/12.jpg)
12
Allgemeine Textelemente Abbildungen • Figure:
gruppiert alles, was zu der Abbildung gehört • Graphic: ist die Abbildung selbst
![Page 13: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/13.jpg)
13
Allgemeine Textelemente
Tabellen • sehr simple eigene
Struktur • nur row und cell • kein Header-Element • für komplexere Tabellen
HTML- oder CALS-Tabellenmodell integrierbar via Namensräume
![Page 14: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/14.jpg)
14
Dokumenttypen Zeitschriften • Wie Bücher, Monografien
![Page 15: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/15.jpg)
15
Dokumenttypen Lexika • Eintrag: entry
• Bedeutungen: sense
![Page 16: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/16.jpg)
16
Besonderheiten • Editionen mit
– Urkunden – Nachlässe (Briefe, Tagebücher, Notizbücher) – Gesamtwerk
![Page 17: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/17.jpg)
17
Die Aufgabe von Editionen
• Bereitstellung einer zuverlässigen Textgrundlage für jedwede historische oder interpretatorische Betrachtung systematische Sichtung sämtlicher zugehöriger
Überlieferungsträger
zeichengetreue Transkription der Textzeugen
genetische Dokumentation und Textkonstitution
• Verbreitung der Buch- bzw. Online-Publikation, je nach Quellenlage – zu dem Zweck: die Autographen und alten Urkunden zu schonen
(z.B. Vermeidung von direktem Hautkontakt oder ungünstigen klimatischen Bedingungen)
Lücken im Bestand zu schließen, die z.B. durch Verluste und Aufteilungen in der Folge der beiden Weltkriege des 20. Jhs. entstanden sind
![Page 18: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/18.jpg)
18
Digitalisate
![Page 19: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/19.jpg)
19
Bibliographie des Editionsobjekts Dazu gehören z.B.:
Lagerort der Originale (Bibliothek, Nachlass ...)
genaue Bezeichnung (Titel, Sigle, Aktenzeichen ...)
bis auf Einzel-Dokumentbasis
Strukturanforderung:
klare Trennung von Metadaten und Textbeschreibung
Metadatenbereich mit „Feldern“ für alle notwendigen Angaben
TEI:
teiHeader/fileDesc – titleStmt
– publicationStmt
– sourceDesc
![Page 20: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/20.jpg)
20
Bibliographie des Editionsobjekts
Strukturdiagramm:
Strukturbeispiel:
![Page 21: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/21.jpg)
21
Beschreibung der Materialität Dazu gehören:
Beschreibung der äußeren Gestalt
ggf. aufgeteilt in Blätter, Seiten, Einzelobjekte ...
Strukturanforderung:
textliche Beschreibung des Textträgers
ggf. Zeilen-, Seiten-, Spaltenwechsel ...
ggf. Zuordnung von Sub-Dokumenten
TEI:
physDesc
lb, pb, cb
@rend
![Page 22: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/22.jpg)
22
Beschreibung der Materialität
Strukturdiagramm:
Strukturbeispiel:
![Page 23: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/23.jpg)
23
Repräsentation des Textes Dazu gehören:
verschiedene Dokumenttypen, z.B. Briefe, Urkunden, Notizbücher, Prosatexte, Gedichte, szenische Texte ...
mit allen spezifischen Anforderungen an die Aufbereitung
Strukturanforderung:
bei Briefen: z.B. Absender, Anrede, Briefkorpus, Grußformel, Postscriptum ...
bei Notizbüchern: Art der Notiz, Sub-Dokumente ...
bei Gedichten: Strophen, Verse ...
bei Szenischen Texten: Akte, Figuren, Sprechertext, Regieanweisungen ...
TEI:
Briefe: opener mit dateline, address, closer mit salute
Gedichte/Szen.Texte: lg/l, role, actor, cast, caesura ...
![Page 24: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/24.jpg)
24
Repräsentation des Textes
Strukturdiagramm:
Strukturbeispiel:
![Page 25: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/25.jpg)
25
Kennzeichnung von Metainformationen Dazu gehören z.B.:
Personennamen
Datumsangaben
Ortsangaben
Strukturanforderung:
bei Personennamen: Vor- und Nachname, Namensteile
bei Datumsangaben: Tag-Monat-Jahr, gesichert/ungesichert
bei Ortsangaben: geografische bzw. politische Zuordnung, historischer Kontext, Klassifizierung z.B. als Stadt, Land ...
TEI (verschiedene Möglichkeiten):
rs type=person vs. persName/forename+surname, role
rs type=date vs. date/@when/@from/@to/@precision
rs type=place vs. placeName, geogName, region, state
![Page 26: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/26.jpg)
26
Kennzeichnung von Metainformationen
Strukturdiagramm:
Strukturbeispiel:
![Page 27: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/27.jpg)
27
Textkritik Dazu gehören:
Beschreibung der Textvariationen, die am Textträger erkennbar sind, z.B. nachträgliche Korrekturen des handschriftlichen Texts
Anstreichungen oder Anmerkungen im gedrucktem Material, ggf. mit verschiedenen Stiften
einschließlich der Schreib-Topographie (oben, unten, drüber...)
Strukturanforderung:
Streichungen, Ergänzungen, Änderungen
verschränkte Unterstreichungen
Angabe der Position
TEI:
subst, del, add, restore, unclear, damage ...
app, rdg, ..., sic, supplied ...
![Page 28: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/28.jpg)
28
Textkritik
Strukturdiagramm:
Strukturbeispiel:
![Page 29: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/29.jpg)
29
Überlieferungskritik und Kommentierung
Dazu gehören:
Kennzeichnung der Stelle im Primärtext
Kommentartext mit Auszeichnungen, Metainformationen, Verweisen auf andere Textstellen ...
Strukturanforderung:
Textanker: eindeutige Benennung, eindeutiger Bezug
Kommentartext: vielfältige Textauszeichnung, da hier z.B. auch Gedichte, Zitate, Übersetzungen und Hinweise auf andere Kommentare, Primärtextstellen oder Sekundärliteratur ihren Ort haben
TEI (jeweils verschiedene Möglichkeiten):
Textanker: ref vs. anchor vs. milestone
Kommentartext: note vs. ref (als Verweisziel)
![Page 30: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/30.jpg)
30
Überlieferungskritik und Kommentierung
Strukturdiagramm:
Strukturbeispiel:
![Page 31: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/31.jpg)
31
Strukturkonfiguration
![Page 32: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/32.jpg)
32
Qualitätssicherung und Weiterverarbeitung
Teilweise sehr umfangreiche Inhaltsmodelle, z.B.: • Unterstrukturen in Überschriften:
ca. 54 Unterelemente neben Text • Unterstrukturen in Absätzen:
ca. 54 Unterelemente neben Text
![Page 33: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/33.jpg)
33
Probleme bei der Datenerstellung
editionsübergreifend unterschiedliche Auszeichnungen
![Page 34: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/34.jpg)
34
Probleme bei der Datenerstellung
trotz redaktioneller Vorgabeliste keine einheitlichen Attributwerte
Vermischung von semantischer und typografischer Auszeichnung – auch englischer und deutscher Benennungen ...
![Page 35: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/35.jpg)
35
Qualitätssicherung in der Redaktion
![Page 36: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/36.jpg)
36
Weiterverarbeitung
Verfügbare Stylesheets, u.a.:
![Page 37: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/37.jpg)
37
Fazit
Für nahezu alle verlagsrelevanten und wissenschaftlichen Textanforderungen gibt es semantische Elemente.
Weitere Semantisierung über allseits verfügbare Attribute wie z.B. @type und @subtype.
In der Regel Verzicht auf ganz enge Inhaltsmodelle – jedoch Konfiguration via ROMA möglich.
Trotzdem sind umfangreiche und präzise Erläuterungen im Redaktionshandbuch notwendig, um einen konsistenten Einsatz der XML-Strukturen zu erreichen.
![Page 38: XML-Struktur: TEI (Text Encoding Initiative)](https://reader034.vdokument.com/reader034/viewer/2022051208/5475611eb4af9fa30a8b5af5/html5/thumbnails/38.jpg)
38
Vielen Dank für Ihre Aufmerksamkeit!
Ursula Welsch
www.welschmedien.de
www.xml-schule.de