Lernmodul 1
Linguistisches Propädeutikum
Institut für ComputerlinguistikUniversität Zürich
http://www.cl.uzh.ch
Simon [email protected]
Version von 28. März 2007
1PDF-Version: http://www.cl.uzh.ch/siclemat/lehre/ling-prop/script/script.pdfHTML-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/script/html/script.htmlFolien-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/slides-4up.pdf
Inhaltsverzeichnis
1 Linguistisches Propädeutikum I 1
2 Linguistisches Propädeutikum II 8
Linguistisches Propädeutikum I: Morphologie
Simon [email protected]
Institut für ComputerlinguistikUniversität Zürich
Linguistisches Propädeutikum
Wort Wortarten Morphologische Merkmale STTS
Übersicht
Wort
Lehre von den Wortarten
Morphologische Merkmale
STTS
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 2 / 28
Wort Wortarten Morphologische Merkmale STTS
Lernziele
I Kenntnis der Begriffe Wort, Token, Lexem, Lemma, LexemverbandI Kenntnis der Wortartenlehre für DeutschI Kenntnis der morphologischen Kategorien für Deutsch und EnglischI Kenntnis und Anwendung des Stuttgart-Tübingen-Tagsets (STTS) mit
Hilfe der ReferenzkarteI Erfahrungen mit computerlinguistisch unterstützter, halbautomatischer
linguistischer Annotation von Morphologie und Wortarten
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 3 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Wort
Definition (nach [Bußmann 1990])Wort. Intuitiv vorgegebener und umgangssprachlich verwendeter Begriff fürsprachliche Grundeinheiten, dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind.
Beispiel (Was ist ein Wort?)
1. Sie wollte vor allem am 1. Spiel teilnehmen.2. Sie nahm z.B. an dem 2. Spiel teil.3. Das gibts doch nicht!4. Blick Online verlost zum Film-Start das «Ich bin Borat»-Kit [. . . ]
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 4 / 281
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Präzisierungsversuche des Wort-Begriffs
Sprachliche Ebenen zur Präzisierung des Wort-BegriffsI phonetisch-phonologisch: Kleinstes durch Wortakzent und Grenzsignale
wie Pause oder Knacklaut theoretisch isolierbares LautsegmentI orthographisch-graphemisch: durch Leerstellen im Schriftbild isolierte
EinheitI morphologisch: Grundeinheit, welche flektierbar istI lexikalisch-semantisch: kleinster Bedeutungsträger, welcher im Lexikon
kodifiziert istI syntaktisch: kleinste verschieb- und ersetzbare Einheit des Satzes
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 5 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Gängige Wortauffassungen [Linke 2001]
Wieviele verschiedene Wörter hat dieser Satz?Wenn hinter Fliegen eine Fliege fliegt, fliegt eine Fliege Fliegen nach.
Antworten� 11� 7� 6� 5� __
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 6 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Antwort 11: Wort als Vorkommen einer Wortform
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt7 eine8 Fliege9 Fliegen10
nach11.
Definition (Token)Ein Token ist ein einzelnes Vorkommen einer Wortform in einem Text.
BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Tokenbetrachtet. Die Antwort wäre dann . . .
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 7 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Antwort 7: Wort als Wortform
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt6 eine4 Fliege5 Fliegen3
nach7.
Definition (Wortform)Eine Wortform ist eine rein graphematische Einheit eines Textes.
BemerkungDieselbe Wortform kann Wörter unterschiedlicher Bedeutung repräsentieren
I Die Fliege war tot.I Er trug eine samtene Fliege.I Fliege nicht so schnell!
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 8 / 282
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Antwort 7: Wort als syntaktisches Wort
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt6 eine4 Fliege5 Fliegen3
nach7.
Definition (Syntaktisches Wort)Ein syntaktisches Wort ergibt sich aus einer Wortform kombiniert mit ihrenmorphosyntaktischen Merkmalen.Rein orthographische Varianten einer Wortform werden für ein syntaktischesWort normalerweise zusammengefasst.
Beispiel (Wortform vs. syntaktisches Wort)Die Wortform “Fliegen” kann mindestens 4 syntaktische Wörterrepräsentieren: “Fliege” in Nominativ, Akkusativ, Dativ oder Genitiv Plural.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 9 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Antwort 6: Wort als Lexem
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5, fliegt5 eine4 Fliege3 Fliegen3
nach6.
Definition (Lexem im engen Sinn)Ein Lexem ist eine Menge (Paradigma) von syntaktischen Wörtern, welchesich nur in bestimmten morphosyntaktischen Merkmalen (Kasus, Numerus,Tempus usw.) unterscheiden.
Definition (Nennform, Zitierform, Grundform, Lemma)Ein Lemma ist eine lexikographische Standard-Notation für ein Lexem.
Beispiel (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im NominativSingular repräsentiert. Verb-Lexeme durch den Infinitiv. Wie werdenVerb-Lexeme im Latein notiert?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 10 / 28
Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem
Antwort 5: Wort als Lexemverband
Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3, fliegt3 eine4 Fliege3 Fliegen3
nach5.
Definition (Lexemverband, auch Lexem im weiten Sinn)Ein Lexemverband ist eine Menge von Lexemen, welche den gleichenWortstamm haben.
BemerkungLexemverbände umfassen typischerweise Lexeme mit unterschiedlichenWortarten.
Beispiel (Satz als Menge von Lexemverbänden)Wie lässt sich die Menge der Wörter des Beispielsatzes in Mengennotationals Lexemverband darstellen?
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 11 / 28
Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz
Wortarten nach [Bußmann 1990]
Definition (Redeteile, engl. parts of speech (PoS))Wortarten sind das Ergebnis der Klassifizierung der Wörter einer Sprachenach morphologischen, syntaktischen und/oder semantischen Kriterien.
Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca. 100 vor Chr.) wirkte starkbis ins 19. Jahrhundert. Für Deutsch wurde in den Schulen lange dietraditionelle 10-Wortarten-Lehre (Numerale als eigene Kategorie) gemässAdelung (1781) vermittelt. Mit der 5-Wortarten-Lehre nach Hans Glinzsetzte sich ab den 50er-Jahren eine flachere Einteilung durch, welcheexplizite (operationalisierbare) und durchgängige Klassifikationskriterienanwendet.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 12 / 283
Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz
Klassifikationskriterien
Abbildung: Die 5 Hauptwortarten nach Glinz [Stocker et al. 2004]
Welcher Fachbegriff wäre präziser anstelle von “Wörter” in der Abbildung?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 13 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Morphologische Kategorien und ihre Merkmale
Definition (auch morphosyntaktisches oder grammatisches Merkmal)Die morphologischen Merkmale sind Ausprägungen von morphologischenKategorien wie Genus, Kasus, Numerus, Person, Tempus, Modus undKomparation, welche durch die Flexion realisiert werden.
Flexion: Bildung von den unterschiedlichen syntaktischen Wortformeneines Lexems
I Konjugation von VerbenI Deklination von Nomen, Adjektiven, Artikeln und PronomenI Steigerung von Adjektiven
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 14 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Das Genus (engl. gender): Grammatisches Geschlecht
Fachbegriff Deutsch Englisch STTS BeispielMaskulinum männlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum sächlich neuter Neut HuhnUnterspezifiziert n/a n/a * Ferien
BemerkungDer Plural von Genus lautet Genera.
Beispiel (Bei welchen Wortarten ist die Kategorie Genus ausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 15 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Numerus (engl. number): Grammatische Zahl
Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Hühner
BemerkungDer Plural von Numerus lautet Numeri.Beispiel (Bei welchen Wortarten ist die Kategorie Numerusausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 16 / 284
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Kasus (engl. case): Fall
Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum
BemerkungDer Plural von Kasus lautet Kasus.
Beispiel (Bei welchen Wortarten ist die Kategorie Kasus ausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 17 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Modus (engl. mode, mood): Aussageweise
Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Möglichkeitsform subjunctive mood Konj er gehe
BemerkungenDer Plural von Modus lautet Modi.Die Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst.Im STTS ist dies durch das V.IMP ausgedrückt.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 18 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Das Tempus (engl. tense): grammatische Zeit, Zeitform
Fachbegriff Deutsch Englisch STTS BeispielPräsens Gegenwart present tense Pres er gehtPräteritum Vergangenheit past tense Past er ging
BemerkungenDer Plural von Tempus lautet Tempora.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 19 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Die Person (engl. person)
Fachbegriff Deutsch Englisch STTS Beispiel1. Person Sprecher first person 1 ich gehe2. Person Angesprochene second person 2 du gehst3. Person Person, Sachverhalt third person 3 er geht
BemerkungenDer Plural von Person lautet Personen; die Verwendung ist allerdingsungebräuchlich.
Beispiel (Bei welchen Wortarten ist die Kategorie Person ausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 20 / 285
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Der Grad (engl. degree): Steigerung, Komparation
Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Höchststufe superlative Sup schlauste
Beispiel (Bei welchen Wortarten ist die Kategorie Grad ausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 21 / 28
Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion
Die Adjektiv-Flexion (engl. adjective inflection)
Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best. Artikel weak Schw der schlaue
FuchsGemischte Flexion mit ein, kein,. . . mixed Mix keine schlau-
en FüchseStarke Flexion ohne Artikel strong St schlaue
Füchse
Beispiel (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexionausgeprägt?)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 22 / 28
Wort Wortarten Morphologische Merkmale STTS
Stuttgart/Tübingen-Tagset (STTS)
I http://www.cl.unizh.ch/clab/hilfe/stts/I Das Standard-Tagset des Deutschen [Schiller et al. 1999]
(vergleichbar mit dem Penn-Treebank-Tagset für Englisch)I Wichtige linguistische Korpora wie NEGRA-Korpus oder
TIGER-Korpus sind mit STTS annotiert.I Frei verfügbare Werkzeuge zum automatischen Bestimmen von
Wortarten (sogenannte “Tagger”) liefern mit STTS-Tags versehenenOutput.
I Eine Notationsvariante von STTS ist als europäischer Standard fürDeutsch (EAGLES ELM-DE) [EAGLES 1996] spezifiziert worden.
I Alternativen: Münsteraner Tagset [Steiner 2003]
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 23 / 28
Wort Wortarten Morphologische Merkmale STTS
Besonderheiten von STTS
I ‘Wortarten’ für satzinterne und -finale InterpunktionI Kategorie für fremdsprachliches Material (FM)I Feine Aufgliederung bei PartikelnI Durchgängige Unterscheidung von attribuierend vs. substituierend bei
PronomenI Eigennamen sind eine semantisch definierte Klasse.I Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven
geworden...
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 24 / 286
Wort Wortarten Morphologische Merkmale STTS
Vertiefung
I Referenzkarte zu STTS und dem NEGRA-SprachmodellI Manuals für das Programm annotate [Plaehn 2000, Plaehn 1998]I http://www.canoo.net aus Basel hat eine sorgfältige linguistische
Terminologie im Web und viel (!) Anschauungsmaterial aus ihremMorphologiesystem.
PflichtlektüreNachschlagen von mindestens 30 Tags im Annotationshandbuch[Schiller et al. 1999] bei Unsicherheit im Annotieren von Wortart undmorphologischer Kategorie
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 25 / 28
Wort Wortarten Morphologische Merkmale STTS
Literaturangaben I
I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.
I EAGLES (1996).ELM-DE: EAGLES Specifications for German morphosyntax: LexiconSpecification and Classification Guidelines, electronic,http://www.ilc.cnr.it/EAGLES96/pub/eagles/lexicons/elm_de.ps.gz,http:/www.cl.uzh.ch/siclemat/lehre/papers/EAGLES1996.pdf Arbeitsmaterial.
I Gallmann, Peter und H. Sitta (2001).Deutsche Grammatik. Lehrmittelverlag, 3. Aufl., Konzis und verständlich.
I Linke, Angelika et al., Hrsg. (2001).Studienbuch Linguistik. Niemeyer, Mit interaktivem Lernprogramm aufCD-ROM.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 26 / 28
Wort Wortarten Morphologische Merkmale STTS
Literaturangaben II
I Plaehn, Oliver (1998).ANNOTATE: Bedienungsanleitung ,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn1998a.pdf Arbeitsmaterial.
I Plaehn, Oliver (2000).ANNOTATE v3.6 – Quick Reference,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn2000.txt Arbeitsmaterial.
I Schiller, Anne, S. Teufel und C. Stöckert (1999).Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines undgroßes Tagset), http://www.ims.uni-stuttgart.de/projekte/corp-lex/TagSets/stts-1999.pdf.
I Steiner, Petra (2003).Das revidierte Münsteraner Tagset / Deutsch (MT/D). Beschreibung,Anwendung, Beispiele und Problemfälle,http://santana.uni-muenster.de/Publications/tagbeschr_final.ps.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 27 / 28
Wort Wortarten Morphologische Merkmale STTS
Literaturangaben III
I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 28 / 287
Linguistisches Propädeutikum II: Syntax
Simon [email protected]
Institut für ComputerlinguistikUniversität Zürich
Linguistisches Propädeutikum
Proben Satz Syntaxanalyse Baumbanken
Übersicht
Linguistische Proben
Satz
Syntaxanalyse
Baumbanken
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 2 / 29
Proben Satz Syntaxanalyse Baumbanken
Lernziele
I Kenntnis der klassischen syntaktischen ProbenI Kenntnis der Begriffe Satz, Konstituenz, Dependenz, Konstituente,
Kern, Kopf, Satzglied, PhraseI Kenntnis der wichtigsten syntaktischen FunktionenI Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe
der ReferenzkarteI Erfahrungen mit computerlinguistisch unterstützter, halbautomatischer
linguistischer Annotation von syntaktischen StrukturenI Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in
einer Baumbank
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 3 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Linguistische Testverfahren
Definition (Linguistische Proben)Eine linguistische Probe ist ein experimentelles Analyseverfahren derstrukturellen Linguistik, das gezielt die sprachliche Kompetenz benutzt, umgrammatische Aussagen verifizieren (bestätigen) oder falsifizieren(verwerfen) zu können.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 4 / 298
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Ersatzprobe
DefinitionIn der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durcheinen grammatisch eindeutig zu interpretierenden Ausdruck ersetzt. DieInterpretation des Satzrestes muss dabei unverändert bleiben.
Beispiel (Bestimmung des Kasus)Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 5 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Ersatzprobe für PronomenManchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeitschaffen.Beispiel (Bestimmung der Wortart von “das”)
I Das ist das Angebot, das uns überzeugt hat.I Dieses ist das Angebot, welches uns überzeugt hat.I * Welches ist das Angebot, dieses uns überzeugt hat.I ? Das ist dieses Angebot, welches uns überzeugt hat.
Probleme der InterpretationI Test bestanden vs. nicht bestanden ist manchmal abhängig von der
ursprünglichen Interpretation des Satzes.I Ob die Interpretation des Satzrestes sich ändert durch den Ersatz, ist
nicht immer leicht zu beurteilen.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 6 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Einsetzprobe
DefinitionIn der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontexteingesetzt, der ihn grammatisch eindeutig interpretiert.
Beispiel (Bestimmung der Wortart)Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis *Der gratis Baum Adverb
Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmaswie Konjugation für Verben oder Steigerung für Adjektive.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 7 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Weglassprobe
DefinitionIn der Weglassprobe wird von einem grösseren mehrdeutigen Ausdrucksoviel Material wie möglich entfernt, um einen eindeutigen Ausdruck zuerhalten.
Beispiel (Bestimmung eines Satzglieds)1. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
2. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
3. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
4. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.
FrageWarum nicht Variante 4?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 8 / 299
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Verschiebeprobe
DefinitionIn der Verschiebeprobe werden Wörter und Wortgruppen im Satzumgestellt, so dass der Satz grammatisch bleibt und sich am Inhalthöchstens die Gewichtung ändert.Damit lassen sich die Anfang und Ende von Satzgliedern erkennen.
Beispiel (Bestimmung von Satzgliedern)1. Die Sitzung mit dem Chef bereite ich morgen vor.2. Morgen bereite ich die Sitzung mit dem Chef vor.
3. Ich bereite die Sitzung mit dem Chef morgen vor.
Regeln: Tausche immer 2 Kandidaten aus, um nicht unnötigungrammatische (Pseudo-)Sätze zu erzeugen. Ersetze in einfachen Sätzenimmer das Satzglied vor dem flektierten Verb.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 9 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Verschiebeprobe
Beispiel (Unzulässiges Verschieben)
1. Die Sitzung mit dem Chef bereite ich morgen vor.2. * Morgen ich bereite die Sitzung mit dem Chef vor.
3. #Die Sitzung bereite ich morgen mit dem Chef vor.
GründePseudo-Satz 1 ist ungrammatisch. Satz 2 hat eine andere Bedeutungbekommen durch die Umstellung.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 10 / 29
Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen
Umformungsprobe
DefinitionIn der Umformungsprobe werden Sätze umfassend umgebaut.
Beispiel (Funktion von Nebensätzen)
1. Es würde mich freuen, wenn du mitkämest .
2. Dein Mitkommen würde mich freuen.
Der Nebensatz mit “wenn” erfüllt eine analoge Funktion wie “Es”.
Beispiel (Infinitivumformung zur Subjekterkennung)
1. Die Lärche ist ein Nadelbaum.2. ein Nadelbaum sein / die Lärche
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 11 / 29
Proben Satz Syntaxanalyse Baumbanken
Satz
Definition (nach [Bußmann 1990])Satz (engl. clause oder sentence). Nach sprachspezifischen Regeln auskleineren Einheiten (sog. Konstituenten) konstruierte Redeeinheit, diehinsichtlich Inhalt, grammatischer Struktur und Intonation relativvollständig und unabhängig ist.
Definition (nach [Dudenredaktion 2005])Ein Satz ist eine Einheit, die aus einem finiten Verb und allen vom Verbverlangten Satzgliedern besteht. Darüber hinaus kann der Satz zusätzlicheAngaben enthalten.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 12 / 2910
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Konstituenz
Definition (nach [Bußmann 1990])Konstituente. In der strukturellen Satzanalyse (sog. Konstituentenanalyse)Bezeichnung für jede sprachliche Einheit (Wort, Wortgruppe) , die Teileiner grösseren sprachlichen Einheit ist.
Definition (nach [Bußmann 1990])Ziel und Ergebnis der Konstituentenanalyse ist die Zerlegung einessprachlichen Ausdrucks in eine hierarchische definierte Abfolge.
Definition (Konstituenz)Konstituenz ergibt sich aus der unmittelbaren Dominanz und linearenPräzedenz zwischen Konstituenten.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 13 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Konstituenten in der Annotate-Darstellung
!"#
$$%&
'($)(*(+,-
.#/#0
1123+
'($)($4#5(306
.#78.9#
:;<:
$,5(*(:==($)(!9
1#4>"06?0.#0
++
2#-(:==($)(*
?06
@A+
!!
&"5"=#0
++
+#?9(:==($)(*
#"0
$B@1C
!!
D
ED
!!
F#45?G/#0
1123+
'($)($4#5(306
"/4#
$$A!:B
*(:==($)
HI.)"G/=#"9#0
++
2#-(:==($)(*
8?5J?4#"J#0
113CK
!!
(
E(
!!
+@ +@ +@ +@
+$
L< L; L<
+$
A: M;
!N M;
L+$
A: !1$ M;
1$
AL
!
L<
!
L<
O P Q ' R S T U V W PO PP PQ
SOO SOP
SOQ SO'
SOR SOS
SOT
L!
Konstituente auf Wortebene
Rein syntaktische Konstituente
Präzedenz auf Wortebene
unmittelbare Dominanz
Präzedenz
Jedes Wort und jeder ovale Knoten repräsentiert eine Konstituente.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 14 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Köpfe (engl. head) / Kern (engl. kernel)
DefinitionEin Kopf oder Kern einer Konstituente ist diejenige Unterkonstituente,welche die grammatischen Eigenschaften ihrer Mutterkonstituente bestimmtund von der die Geschwisterkonstituenten abhängig sind. Der Kern istnormalerweise nicht weglassbar (Weglassprobe).
Beispiel (Welches ist der Kern der geklammerten Konstituenten?)I Er [hält ihm den Ausweis unter die geschwollene Nase].I Sie rennt [mit dem Mobile hantierend] zum Kiosk.I Es wird [viel zu oft] telefoniert.I [Die Frau, die zum Kiosk rannte, ] war aufgeregt.I Sie fühlte sich [wie in einem schlechten Film].I Aber sie war auch [in einem ziemlich schlechten Film].
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 15 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Typen von Konstituenten
1. Verbalgruppe, -phrase (VP): Konstituente mit einem verbalen Kern. InNEGRA umfasst VP nur infinite, d.h. nicht-flektierte Kerne. DieKategorie Satz (S) hat finite Verbalkerne.
2. Nominalgruppe, -phrase (NP): Konstituente mit Nomen oderPronomen als Kern.
3. Adjektivgruppe, -phrase (AP): Konstituente mit Adjektiv oderadjektivisch verwendetem Partizip als Kern.
4. Adverbgruppe, -phrase (AVP): Konstituente mit Adverb als Kern.5. Präpositionalgruppe, -phrase (PP): Konstituente mit Präposition oder
Postposition als Kern.6. Konjunktionalgruppe, -phrase: Konstituente mit der Konjunktion “als”
oder “wie” als Kern. In NEGRA ebenfalls mit PP bezeichnet.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 16 / 2911
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Koordination, Konstituenz und Köpfe
DefinitionKoordination (Beiordnung) ist eine syntaktische Struktur, welche aus zweioder mehr Konjunkten (Wörter, Wortgruppen oder Sätzen) besteht.
Beispiel (Koordination von Konstituenten aus NEGRA-Korpus)I Selbst die flotteren Passagen werden nie ausgelassen und fröhlich. [Satz 35]I Oder saß es wieder einmal immer nur mit der Teeflasche im Auto und in der
Sportkarre? [Satz 9328]I Wenn es eine Organisation gibt, der vertraut wird und die etwas erreichen kann, ist
das die Kirche. [Satz 11’978]
ProblemWas ist der Kopf?Keine Entscheidung in NEGRA, denn es gibt die Konstituenten CS, CNP,CAP usw.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 17 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Dependenz und syntaktische Funktion
DefinitionDependenz ist die syntaktische Relation der Abhängigkeit zwischenKonstituenten.
Definition (nach [Bußmann 1990])Syntaktische Funktion ist ein Sammelbegriff für Beschreibungsgrössen wie“Subjekt”, “Objekt”, “Prädikat”, “Adverbial”, “Attribut” u.a., welche nachSprachtyp oder Grammatiktheorie unterschiedlich verwendet werden, um dieBeziehung zwischen abhängigen Konstituenten zu bestimmen.
HinweisTraditionelle Ansätze blenden gerne die syntaktische Funktion des “Kerns”sowie der koordinativen Verknüpfungen aus.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 18 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Syntaktische Funktionen in der Annotate-Darstellung
!"#
$$%&
'($)(*(+,-
.#/#0
1123+
'($)($4#5(306
.#78.9#
:;<:
$,5(*(:==($)(!9
1#4>"06?0.#0
++
2#-(:==($)(*
?06
@A+
!!
&"5"=#0
++
+#?9(:==($)(*
#"0
$B@1C
!!
D
ED
!!
F#45?G/#0
1123+
'($)($4#5(306
"/4#
$$A!:B
*(:==($)
HI.)"G/=#"9#0
++
2#-(:==($)(*
8?5J?4#"J#0
113CK
!!
(
E(
!!
+@ +@ +@ +@
+$
L< L; L<
+$
A: M;
!N M;
L+$
A: !1$ M;
1$
AL
!
L<
!
L<
O P Q ' R S T U V W PO PP PQ
SOO SOP
SOQ SO'
SOR SOS
SOT
L!Trad. syntaktische Funktion
Kopf
Jedes eckige Kästchen repräsentiert eine Dependenz zwischen derdominierten und der dominierenden Konstituente.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 19 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Abbildung: Moderne Satzgliedlehre nach [Stocker et al. 2004]
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 20 / 2912
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Einige Satzglieder mit NEGRA-Funktion
I Subjekt (SB): Infinitivprobe oder Frageprobe (Wer oder was?). Subjektkann auch ein S oder eine VP sein!
I Akkusativ-Objekt (OA): Frageprobe (Wen oder was?) oderErsatzprobe (“ihn”)
I Dativ-Objekt (DA): Frageprobe (Wem?) oder Ersatzprobe (“ihm”)I Genitiv-Objekt (OG): Frageprobe (Wessen?) oder Ersatzprobe
(“seiner”)I Adverbiales und prädikatives Präpositionalglied, Adverbglied,
Konjunktionalglied u.ä. (MO) für ModifikatorI Nicht-finite Verbalteile (OC): Abhängig von flektiertem oder
nicht-flektierten Verb
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 21 / 29
Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder
Einige Gliedteile mit NEGRA-Funktion
I Artikel, attributive Adjektiv(phrasen), begleitende Pronomen (NK)I Präpositionen und konjunktionales “als” oder “wie” (AC)I Genitivattribute von Nominalphrasen (AG) oder feinere
Unterscheidung: pränominaler (GL) oder postnominaler (GR) GenitivI Koordinierende Konjunktion (CD) und die koordinierten Konstituenten
(CJ)I Platzhalter (PH) und wiederholte Elemente (RE)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 22 / 29
Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch
NEGRA-Baumbank
I Das erste grosse (20’000 Sätze) Baumbank-Projekt für Deutsch(1997-2001): http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/negra-corpus.html
I PP und NP werden mit flacher Hierarchie verbautI Ketten von infiniten Verben (VP) sind zu verschachtelnI Syntaktische Phrasenknoten werden nur für Wortgruppen gebildet, nie
für EinzelwörterI Keine annotierten Köpfe in NPI Keine explizite Unterscheidung der SatztypenI Annotationshandbuch [Brants et al. 1999] mit detaillierten RegelnI Die TIGER-Baumbank (TIGER-Korpus) (50’000 Sätze im 2006) ist
“Nachfolgeprojekt”
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 23 / 29
Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch
TIGERSearch: Ein modernes Suchwerkzeug
Lernen aus BeispielenBeim Annotieren ist es hilfreich, aus bereits (hoffentlich korrekt!)annotiertem Material zu lernen!
Die 3 Hauptfunktionen von TIGERSearch
Abfrage-Sprache (investigation)
Visualisierung der Suchresultate und Baumbank (exploration)
Einfache statistische Auswertung (condensation)
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 24 / 2913
Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch
Die wichtigsten Suchrezepte
I Wie wird das Wort “der” verwendet?[ word="der" ]
I Mit welchen Wortarten kommt das Wort “der” wie oft vor? (“#w:”brauchts für das Statistikmodul als Knoten-Identifikator)#w: [ word="der" ]
I Welche Adverbien kommen vor?#w: [ pos="ADV" ]
I Welche koordinierten Nominalphrasen kommen vor?#p: [ cat="CNP" ]
I Welche Dativobjekte kommen vor?[ ] >DA #da: [ ]
NB: [] > [] = unmittelbare Dominanz und [] . [] = lineare Präzedenz. . .Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 25 / 29
Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch
Weiteres
I Homepage von TIGERSearch: http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERSearch/
I Sofortbenutzung via X11: ssh -Y [email protected](ev. -Y durch -X ersetzen;Joe-Account; kein VPN erforderlich)
I Anleitung mit Bildern http://www.bubenhofer.com/korpuslinguistik/kurs/index.php?id=weitere_tiger.html
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 26 / 29
Proben Satz Syntaxanalyse Baumbanken
Vertiefung
I Das Kapitel Baumbanken [Carstensen et al. 2004, 414ff.]I Quiz Die Form der Satzglieder
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 27 / 29
Proben Satz Syntaxanalyse Baumbanken
Literaturangaben I
I Brants, Thorsten, R. Hendriks, S. Kramp, B. Krenn, C. Preis,W. Skut und H. Uszkoreit (1999).NEGRA Annotierschema, unpublished,http:/www.cl.uzh.ch/siclemat/lehre/papers/BrantsHendriks1999.pdfArbeitsmaterial.
I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.
I Carstensen, Kai-Uwe, C. Ebert, C. Endriss, S. Jekat,R. Klabunde und H. Langer, Hrsg. (2004).Computerlinguistik und Sprachtechnologie : Eine Einführung . Elsevier,München, http://www.ifi.unizh.ch/CL/CLBuch/.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 28 / 2914
Proben Satz Syntaxanalyse Baumbanken
Literaturangaben II
I Dudenredaktion, Hrsg. (2005).Duden, die Grammatik: unentbehrlich für richtiges Deutsch, Bd. 4 d. Reihe DerDuden. Dudenverlag, 7. Aufl.
I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.
Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 29 / 29
15