peter grzybek warum messen wir wortlängen nicht in der anzahl von buchstaben pro wort ?
TRANSCRIPT
Peter Grzybek
Warum messen wir Wortlängen
nicht in der Anzahl
von Buchstaben pro Wort ?
„Die Länge eines Lexems kann in der Anzahl der Grapheme, Phoneme, Phone, Morpheme
oder Silben gemessen werden.“
„ …, dass zwischen den einzelnen Metrisierungen eine numerische
Transformation vorgenommen werden kann.“
Hoffmann (2001: 84):
„Polylexie lexikalischer Einheiten in Texten“
Wortlänge und Bedeutungszahl
Slowakische Daten
nach Altmann/Schwibbe (1989: 68)
a = 3.68
b = -0.64
R² = 0.92
1 2 3 4 5 6
Wortlänge (in Silben)
0
1
2
3
4Bedeutungszahl
beobachtet
theoretisch (y=ax^b)
Wortlänge und Bedeutungszahl
Slowakische Daten
nach Altmann/Schwibbe (1989: 89)
a = 11.63
b = -0.84
R² = 0.90
1 2 3 4 5 6 7 8 9 10 11 12 13
Wortlänge (in Buchstaben)
0
2
4
6
8
10
12Bedeutungszahl
beobachtet
theoretisch (y=ax^b)
Darstellung der Worthäufigkeit als Funktion der Wortlänge. Der Spitzenwert der Wortlänge 3 (Buchstaben) kommt durch den häufigen Gebrauch von
Worten wie z. B. "ein", "der", "die" oder "das" zustande.
http://www.numberland.com/visual/wort.htm
http://www.engineeringobjects.com/eztyp/ezchardistrib.htm
P.M. Alekseev (1998):
Graphemic and Syllabic Length of Words in Text and Vocabulary
Gesamtstichprobe: 25.000 „fortlaufende Wörter“
Fünf Teilstichproben à 5.000 Wörter:• Gesprochene Sprache
• Privatbriefe
• Drama
• Poesie
• Journalistik
Vergleich zweier Texte von Puškin
Домик в Коломне / Евгений Онегин (I)
Wortlänge in Silben
Wortlänge in
Buchstaben
Domik v Kolomne
2.01(s² = 0.88)
4.85(s² = 5.83)
Evgenij Onegin (I)
2.06(s² = 1.01)
5.09(s² = 6.79)
Mittelwert-vergleich
t3621 = 2.01
p < 0.05
t3648 = 3.19
p < 0.005
Silben pro Wort
Grapheme pro Wort
Schiefe 0.589 0.415
Kurtosis – 0.357 – 0.325
Kolmogorov-Smirnov
0.221 (p < 0.001)
0.115 (p < 0.001)
Shapiro-Wilk0.845
(p < 0.001)0.961
(p < 0.001)
Korrelation: r = 0.871 (p < 0.001)
Домик в КоломнеWortlänge in Silben und Buchstaben
Grapheme und Silben pro Wort in Puškins
Domik v Kolomne
1 2 3 4 5 6 7 8 9 10 11 12 130
100
200
300
400
500
600
700
Si pro Wort
Gra pro Wort
Korrelation: r = 0.888 (p < 0.001)
Евгений Онегин (I)Wortlänge in Silben und Buchstaben
Silben pro Wort
Grapheme pro Wort
Schiefe0.841 0.615
Kurtosis – 0.518 – 0.030
Kolmogorov-Smirnov
0.222 (p < 0.001)
0.104 (p < 0.001)
Shapiro-Wilk0.849
(p < 0.001)0.961
(p < 0.001)
Grapheme und Silben pro Wort in Puškins
Evgenij Onegin (I)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
200
400
600
800
1000
1200
Si pro Wort
Gra pro Wort
Grapheme pro Silbe in Puškins
Evgenij Onegin (I) und Domik v Kolomne
1 2 3 4 5 6 72,00
2,20
2,40
2,60
2,80
3,00
Evgenij Onegin (I)
Domik v Kolomne
2,01,81,61,41,21,0,8,6,4,20,0
2,5
2,0
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
-2,0
S2
I2
S1
I1
Ord‘sches Schema
20 russische Texte
Wortlängen in Silben und Graphemen
Peter Grzybek
Warum wir Wortlängen
nicht in der Anzahl
von Buchstaben pro Wort messen…