der oxygen-xml-editor und das dta-oxygen-framework dtaox · der oxygen-xml-editor und das...

of 32 /32
Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX Matthias Boenig & Susanne Haaf

Author: truonghanh

Post on 20-Aug-2019

224 views

Category:

Documents


0 download

Embed Size (px)

TRANSCRIPT

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Der oXygen-XML-Editor

    und das DTA-oXygen-Framework DTAoX

    Matthias Boenig & Susanne Haaf

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Der oXygen-XML-Editor:

    Erste Schritte

    http://www.deutschestextarchiv.de/doku/basisformat

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Unicode und Schriften

    • Der Text sollte im Unicode-Standard kodiert sein

    • Häufige Zeichen können von der Tastatur eingegeben werden

    • Seltenere Sonderzeichen werden mittels Unicode-Entitäten

    wiedergegeben

    • Unicode-basierte Fonts:

    – http://sourceforge.net/projects/junicode/?source=dlp

    – http://unifoundry.com/unifont.html

    • Hilfe bei der Suche nach Unicode-Kodierungen (Beispiele)

    – BabelMap: http://www.babelstone.co.uk/software/babelmap.html

    – http://shapecatcher.com/

    – http://www.charbase.com/

    – http://www.decodeunicode.org/

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Einstellung der Kodierung

    Sie gelangen in diesen Dialog, über das Menü: Optionen → Einstellungen → Kodierung des Dokuments

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Einstellung der Kodierung

    Der Oxygen-Editor ist in den meisten Fällen in dieser Art bezüglich Kodierung eingestellt. Die Einstellung ist zu ändern auf: 1. UTF-8 2. Nicht schreiben 3. Berichten Gespeichert werden die Einstellungen erst, wenn der Button „Anwenden“ betätigt wurde. Das Fenster wird mit dem Button „OK“ geschlossen.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Unicode-Zeichen

    in DTAQ gibt es zur Identifikation der Unicode-Entitäten auf der Startseite eine extra-Suche und eine Übersicht über die im DTA verwendeten Zeichen

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Unicode-Zeichen im oXygen-Editor

    Sie gelangen in diesen Dialog über das Menü: Optionen → Einstellungen → Code-Vorlagen

    Möchten Sie eine neue Vorlage anlegen, drücken Sie auf diesen Button.

    Möchten Sie eine vorhan-dene Vorlage benutzen, um eine gleichartige Vorlage zu erstellen, bietet sich das Duplizieren an.

    • häufige einzelne Zeichen oder -folgen können im Oxygen-Editor als Code-Vorlagen (Textbaustein) gespeichert werden

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Unicode-Zeichen im oXygen-Editor

    • Formulierung einer neuen Code-Vorlage

    • Achtung: Leerzeichen und Return sind relevant, d.h. werden ggf. mit eingefügt

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    • Ex- und Import der Vorlagen Die Vorlagen können untereinander ausgetauscht werden. Zu beachten ist: 1. evtl. ist es sinnvoll, dass

    alle Mitarbeiter die gleichen Vorlagen verwenden

    2. Beim Anlegen neuer Vorlagen sollte man sich entsprechend abstimmen

    Um die eigenen Vorlagen zu exportieren, wird der Button "Exportieren" verwendet. Es werden immer alle Vorlagen exportiert. Gespeichert werden die Vorlagen in Form einer XML-Datei.

    Um die Vorlagen aus anderen oXygen-Instanzen (von PC zu PC) zu importieren, wird der Button "Import" verwendet. Es werden immer alle Vorlagen importiert.

    Unicode-Zeichen im oXygen-Editor

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    • Verwendung der Vorlage

    Mit der Tastenkombination STRG+Shift+Leerzeichen/Space öffnet sich das Code-Vorlagen-Fenster im Editor. Mit den Pfeiltasten oder Anfangsbuchstaben der jeweiligen Vorlagen kann in der Liste navigiert werden.

    Unicode-Zeichen im oXygen-Editor

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    • Alle Leerzeichen anzeigen

    Hilfreiche Einstellungen im oXygen-Editor

    Mit dieser Option werden im Textfenster beim

    Bearbeiten eines Dokuments alle

    Leerzeichen durch farbige (hier: rote) Hochpunkte

    angezeigt.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    • Zwischenspeichern und Sicherungskopien anlegen

    Sicherungs-kopie

    Zwischen-speichern

    oXygen-Menü: Optionen >

    Einstellungen > (links) Editor >

    Öffnen/Speichern

    Hilfreiche Einstellungen im oXygen-Editor

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Das DTA-oXygen-Framework (DTAoX)

    http://www.deutschestextarchiv.de/doku/basisformat

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Problemstellung (1)

    XML-TEI schreiben ist sperrig …

    … und fehleranfällig Bildquelle: Wikipedia (http://commons.wikimedia.org/wiki/File:Amelita_galli-curci.jpg)

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Problemstellung (1)

    • XML-Editoren wie z.B. oXygen bieten Unterstützung bei der Vermeidung von Fehlern, oXygen z.B. durch:

    – Wohlgeformtheits- und Validierungs-Parser

    – Sprechende Fehlermeldungen

    – Funktionen zur Auto-Vervollständigung

    – Hilfreiche Ansichten (z.B. XML-Struktur-Ansicht)

    – …

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Trotzdem kann man sich im TEI-Wald schnell verlieren …

    Problemstellung (1)

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Problemstellung (2)

    • Editoren wünschen sich oft während ihrer Arbeit eine Visualisierung der TEI/XML-Kodierung zu Korrekturzwecken

    • Diese Visualisierung soll:

    – gegenüber dem XML-Code mehr Übersichtlichkeit gewährleisten

    – für jeden schnell zugänglich sein

    – möglichst sämtliche TEI-Kodierungen ihrer Bedeutung entsprechend umsetzen

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Ausgangslage

    • Autor-Ansicht des oXygen-Editors ermöglicht WYSIWYG-nahe Darstellungen

    • oXygen bietet eine default-Visualisierung für TEI-Dateien im Autor-Modus: das TEI-Framework

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Ausgangslage

    TEI-

    Framework

    des oXygen-

    Editors

    Hierfür sind

    individuelle

    Anpassungen

    möglich …

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTA-oXygen-Framework

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Installieren von DTAoX

    • Download unter: http://www.deutschestextarchiv.de/doku/software#dtaox

    DTAoX-1.1.1.zip speichern und entpacken

    Windows: setup.exe ausführen; als Installationsverzeichnis das aktuelle oXygen-Hauptverzeichnis (in der Regel im "Programme"-Ordner) auswählen

    Linux/Mac OS: Verzeichnis "DTAoX" im oXygen-Hauptverzeichnis in das Unterverzeichnis "frameworks" kopieren; die Fonts im Verzeichnis "Fonts" installieren

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTAoX: Erste Schritte

    1. oXygen öffnen

    2. TEI-Datei in der Editor-Ansicht öffnen

    3. in den TEI-Wurzelknoten das Attribut-Wert-Paar

    @xml:id="dtabf" eintragen:

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTAoX: Erste Schritte

    1. oXygen öffnen

    2. TEI-Datei in der Editor-Ansicht öffnen

    3. in den TEI-Wurzelknoten das Attribut-Wert-Paar

    @xml:id="dtabf" eintragen

    4. Umschalten auf die Autor-Ansicht

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Exkurs: Begriffe

    • Framework: – eine Sammlung von Vorlagen – eine Sammlung von Stylesheet für Druckausgabe, Internet oder

    Mobilgeräte – eine spezielle Menüanpassung und Symbolleisten

    • Ansichten – Text Code-Ansicht – Raster XML-Tags werden als Raster angezeigt – Autor WYSIWYG-ähnliche Ansicht des Textes

    („What You See Is What You Get“ (englisch für „Was du siehst, ist [das,] was du bekommst.)

    • Tag oder Element

    – ist ein Bezeichner für einen bestimmten Inhalt – Inhalt –

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Die DTAoX-Menüleiste

    • lb (Zeilenumbruch): ohne weitere Unterelemente. Mit einem Klick auf „lb (Zeilenumbruch)“ wird ein Zeilenumbruch an der Stelle eingefügt, an der sich der Cursor befindet.

    • Brief: Elemente, die briefspezifische Texteinheiten kennzeichnen, z. B. , etc.

    • Dokumentstruktur: Elemente, die Strukturierungen der Vorlage kennzeichnen, welche den äußeren Zugang zur Quelle ermöglichen, z. B. , , etc.

    • Drama: dramenspezifische Elemente, z. B. , etc. • Eingriffe: Elemente, die editorische Eingriffe kennzeichnen ( sowie ) und

    Elemente, die dazu beitragen, einen Druckfehler, eine Normalisierung oder eine Abkürzung anzuzeigen.

    • Einschübe: Elemente, die Blöcke kennzeichnen, welche den Fließtext auf Dokument- oder Elementebene unterbrechen, z. B. , , etc.

    • Lyrik: Elemente, die lyrikspezifische Texteinheiten kennzeichnen ( und ). • Phrasenstruktur: Elemente, die die Funktion oder das Erscheinungsbild einzelner Wörter

    oder Phrasen spezifizieren, also z. B. , etc. • Tabelle: Elemente, die die Struktur von Tabellen beschreiben, z. B. , etc. • Textstruktur: Elemente, die die Semantik oder die Erscheinung von Textteilen beschreiben

    sollen, z. B. , , . • Titelseite: Elemente, die Textabschnitte auf der Titelseite eines Werkes beschreiben, z. B.

    , , etc. • Zitate: Elemente, die Zitate u. ä. kennzeichnen, z. B. , etc. • Darüber hinaus kann das gesuchte Element nach seinem Level ausgesucht werden. Dafür

    stehen die drei Kategorien Level 1, Level 2, Level 3 zur Verfügung.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTAoX: Die Farben

    • Level 1: Grün

    – Elemente, die verwendet werden müssen, um das DTA-

    Basisformat zu erfüllen. Diese Elemente werden konsequent

    im DTA-Kernkorpus verwendet.

    • Level 2: Blau

    – Elemente, deren Verwendung lt. DTA-Basisformat empfohlen

    wird, auf die jedoch verzichtet werden kann. Diese Elemente werden in allen Texten des DTA-Kernkorpus verwendet.

    • Level 3: Violett

    – Elemente, die im DTA-Basisformat enthalten sind, jedoch

    nicht konsequent in den Texten des DTA-Kernkorpus

    angewandt werden. Die Verwendung dieser Elemente ist

    fakultativ.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTAoX: Darstellung des Layouts

    • Zeilenumbrüche werden durch ↵ dargestellt.

    • Kapitelüberschriften werden durch größere Schrift gekennzeichnet.

    • Dünne, schwarze, durchbrochene Linien kennzeichnen horizontale Linien im

    Text. Falls erforderlich, können darüber hinaus rote und blaue Linien durch

    die @rendition-Werte "#hrRed" bzw. "#hrBlue" dargestellt werden.

    • Fuß- und Endnoten werden an der Stelle im Text angezeigt, an der sie

    eingewiesen sind, d.h. nicht am Ende einer Seite bzw. eines Kapitels. Sie

    werden in kleinerer Schrift dargestellt.

    • Spaltenumbrüche werden ebenfalls durch einen gelben durchbrochenen

    Balken gekennzeichnet.

    • Eingriffe in den Text werden folgendermaßen dargestellt: Bei Korrekturen

    von Druckfehlern erscheint der korrigierte Text in grüner Schrift. Die falsche

    Form wird durch kursives „(sic!)“ gekennzeichnet. Im Fall von

    Normalisierungen bzw. Auflösungen von Abkürzungen wird der Inhalt der

    Elemente bzw. neben der ursprünglichen Form (in bzw.

    ) im Kursivdruck angezeigt.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    DTAoX: Formatierungen

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Im Menü „DTABf“ > „Tags-Anzeigemodus“ kann zwischen verschiedenen möglichen Darstellungsweisen der Textannotation gewählt werden:

    • Ganze Tags mit Attributen zeigt jedes Tag mit seinem Namen sowie dem Namen und Wert aller Attribute an.

    • Volle Tags zeigt jedes Tag mit seinem Namen an, allerdings ohne Attribute.

    • Block Tags zeigt nur die Tags vollständig an, die einen gesamten Textblock umschließen.

    • Inline Tags zeigt nur die Tags vollständig an, die nicht einen gesamten Textblock umschließen, sondern innerhalb von Zeilen beginnen und/oder enden.

    • Partielle Tags zeigt durch kleine Dreiecke an, wo sich Tags befinden, ohne jedoch die Elementnamen mit darzustellen.

    • Keine Tags zeigt den reinen Text ohne Tags an.

    Anzeige von Tags und Attributen in der oXygen-Autor-Ansicht

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Anzeige von Tags und Attributen in der oXygen-Autor-Ansicht

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Einfügen eines neuen Elements

    • Cursor positionieren und die Eingabetaste drücken

    oder

    • die Tastenkombination Strg+E drücken.

    In beiden Fällen erscheint ein Fenster mit allen Elementen, die an dieser Stelle erlaubt sind, in alphabetischer Reihenfolge.

  • Der oXygen-XML-Editor und das DTA-oXygen-Framework DTAoX

    Attribute-Vergabe und Korrektur

    • Alt + Return

    oder

    • Fenster > Ansicht zeigen > Attribute