theorie psychometrischer tests, ii u. mortensen mainz 2009

22
Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Upload: marthe-wuensch

Post on 06-Apr-2015

109 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Theorie psychometrischer Tests, II

U. Mortensen

Mainz 2009

Page 2: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Latente Variable und Antwortwahrscheinlichkeiten

1, Frage beantwortetgX

0, Frage nicht beantwortetgX

( ) ( 1| )g gF P X Item Characteristic FunctionItem Response FunctionItemfunktion

Skala für latente Variable

Notation: Lord & Novick (1968)

(Indikatorvariable)

Page 3: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Spezialfall: deterministisches Antwortverhalten (Guttman-Skalen)

Je steiler die Itemfunktion, desto größer die Trennschärfe des Items!

probabilistisches Anwortverhalten

Page 4: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Sich schneidende Itemfunktionen:

I3 für kleinere Merkmalsausprägungen schwieriger als I2, für größere ist I3 leichter als I2.

Page 5: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Wichtige Merkmale von Itemfunktionen:

Je steiler die Itemfunktion, desto besser werden Probanden mit verschiedenen Merkmalsausprägungen relativ zu einer bestimmten Ausprägung M getrennt; die Itemfunktion definiert die Trennschärfe des Items.

Steile Itemfunktionen trennen kaum zwischen Probanden mit einer Merkmalsausprägung kleiner als M und größer als M.

Flache Itemfunktionen trennen im gesamten Wertebereich des gemessenen Merkmals.

Je weiter „rechts“ die Itemfunktion auf der Merkmalsskala ist, desto schwieriger ist das Item.

Page 6: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Modelle für Itemfunktionen: das Ogive- und das logistische Modell

1. Das Ogive-Modell

2

( )

/2

( ) [ ( )]

( )

1( ) , 0.

2

g g

g g g

b

zg

F b

z dz

z e

Das Modell ist definiert durch die Verteilungsfunktion der Gauß-bzw. der logistischen Dichte, wird aber als Funktion des Parameters theta aufgefaßt!

2.Das logistische Modell:

( )

( )( )1

g g

g g

b

g b

eF

e

Page 7: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Die logistische Funktion als Approximation an die Gauß-Funktion

Page 8: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Interpretation der Parameter:

( )

( )( )1

g g

g g

b

g b

eF

e

( ) [ ( )]g g gF b

, ,

, ,

J e größer desto steiler ist dh ist Trennschärfeparameter

J e größer desto weiter rechts liegt dh ist Schwierigkeitsparameterg g g

g g g

F

b F b

Ogive-Modell Logistisches Modell

Generell gilt

Page 9: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Zur Deutung der Itemfunktion:

unterliegende Variablen (underlying variables – Bartholomew 1987)

Ansatz: das Merkmal/die Fähigkeit fluktuiert zufällig, ist es zum Zeitpunkt der Messung größer als ein kritischer Wert, wird das Item beantwortet bzw. die Aufgabe gelöst.

zufällige Variable, die die Ausprägung des Merkmals repräsentiert.

Für wird die Frage beantwortet/Aufgabe gelöst.a

a g

( 1| ) ( | ) ( )a a g gP X P F

( | ) ( ) ( ( ))ga g g gP b

Analog für die logistische Verteilung

Page 10: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

( | ) ( ) ( ( ))ga g g gP b

1/ , dh Trennschärfe ist reziprok zur Streuung des Merkmals

bg g

g g

Monotone Itemfunktionen Interpretation durch unterliegende Variablen

Bei geringer Streuung ist die Trennschärfe groß, bei großer Streuung ist sie klein.

Page 11: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

' .307gg

Aber: man hat in der Tabelle weibliche und männliche Probanden zusammengefasst!

Monotone ItemfunktionenLokale stochastische Unabhängigkeit

'

Vierfeldertafel für den Zusammenhang zwischen Items und g gI I

Page 12: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Auszählung für weibliche und männliche Items getrennt:

Die Korrelationen zwischen Ig und Ig‘ sind nun jeweils gleich Null, d.h. für „konstantes Geschlecht“ hat man lokale stochastische Unabhängigkeit!

Page 13: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone ItemfunktionenLokale stochastische Unabhängigkeit

, xz xz x yz yz yX b Z a e Y b Z a e

( , | ) 0Kov X Y Z z

( , ) 0x yKov e e

Für Z = z sind X und Y „lokal stochastisch unabhängig“.

Page 14: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Monotone Itemfunktionen

Lokale stochastische Unabhängigkeit

Definition: Die Beantwortungen der Items eines Tests sind lokal stochastisch unabhängig voneinander, wenn die Verteilungen der Punktwerte für alle Items für alle Personen mit gleicher Merkmalsausprägung stochastisch unabhängig sind.

Page 15: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische Testtheorie

Ansatz: Einer Antwort wird ein numerischer Wert X – der Score - zugeordnet. Der Testwert ist die möglicherweise gewogene Summe der Scores für die einzelnen Items

( ) ,

ist "wahrer Wert", ist "Fehler"

X

E X

Grundannahme:

Page 16: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische Testtheorie

Implikationen der Grundannahme:

(1) ( ) 0

(2) ( , ) 0

(3) ( , ) 0

(4) ( , ) 0

x y

x y

E

Kov

Kov

Kov

Diese Aussagen werden seit Gulliksen (1950) als „Axiome“ der Klassischen Testtheorie (KTT) bezeichnet.Es sind aber keine Axiome, sondern Folgerungen aus der Grundannahme.

Page 17: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische TesttheorieReliabilität

Reliabilität und ihre Abschätzung:

Reliabilität: der Test misst das Merkmal, das er misst, genau.

Operationalisierung: Der Test misst genau, wenn die Korrelation zwischen den Messwerten und den wahren Werten hoch ist.

( 1, 0) X

2 heißt Reliabilitätskoeffizientx

2 22

2 2, 1 d.h. x x

x x x x

Page 18: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

2 22

2 21 x

x x

Reliabilität:

Klassische TesttheorieReliabilität

Zur Berechnung muß oder bekannt sein!

Intuitive Betrachtung:

Gegeben seien zwei Tests mit Messwerten X und X‘, die beide das gleiche Merkmal messen – daraus müßte sich eine Abschätzung der Varianz der tau-Werte ergeben!

Page 19: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische TesttheorieReliabilität

' '

( , ') [( )( ' ')]( , ')

x x x

Kov X X EX X

'( ) , ( ') sind die Populationserwartungswerte

für die beiden Tests.x xE X E X

'

(1) '

(2)

Es gelte:

Dann heißen die Tests X und X‘ parallel.

Page 20: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische TesttheorieReliabilität

22

2( , ') ( )

Für parallele Tests gilt:

= Relxx

X X X

'

.

Die Korrelation zwischen und ist gleich

dem Quadrat der Korrelation zwischen und

X X

X

Page 21: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische TesttheorieKongenerische, äquivalente und parallele Tests

Die Abschätzung der Reliabilität eines Tests setzt die Konstruktion eines parallelen Tests voraus!Also eines Test mit gleichem Erwartungswert und gleicher Varianz.

1, ,

( ) , ( , ) ( , ) 0.

.

Es seien Tests gegeben, mit

X ,

Weiter

gelte

j j j

j j j j j k

j j j

n

j n

E X Kov Kov

Dann heißen die Tests kongenerisch.

Page 22: Theorie psychometrischer Tests, II U. Mortensen Mainz 2009

Klassische TesttheorieKongenerische, äquivalente und parallele Tests

( ) ( ) 0

( , ) 0,

Gilt darüber hinaus noch , und

so heißen die beiden Tests parallel.j k j

j k

Var X Var X

Kov

1, 0 ( , ) 0,Gilt und so heißen die

beiden Tests essentiell -äquivalent.j j j kK

Für irgend zwei Tests Tj und Tk gelte