Uit Wikipedia, de vrije encyclopedie
Cramérs V is een door de Zweedse wiskundige en statisticus Harald Cramér ontwikkelde associatiemaat voor twee categorische variabelen , dus variabelen die slechts op nominale schaal gemeten zijn.
De simultane verdeling van de beide variabelen
A
{\displaystyle A}
en
B
{\displaystyle B}
wordt gegeven door de kansen
p
i
j
=
P
(
A
=
A
i
,
B
=
B
j
)
,
i
=
1
,
…
,
r
;
j
=
1
,
…
,
k
{\displaystyle p_{ij}=P(A=A_{i},B=B_{j}),i=1,\ldots ,r;j=1,\ldots ,k}
De
χ
2
{\displaystyle \chi ^{2}}
-grootheid die de simultane kansen vergelijkt met de kansen bij onafhankelijkheid, is:
χ
p
2
=
∑
i
,
j
(
p
i
j
−
p
i
⋅
p
⋅
j
)
2
p
i
⋅
p
⋅
j
=
∑
i
,
j
p
i
j
2
p
i
⋅
p
⋅
j
−
1
{\displaystyle \chi _{p}^{2}=\sum _{i,j}{\frac {(p_{ij}-p_{i\cdot }p_{\cdot j})^{2}}{p_{i\cdot }p_{\cdot j}}}=\sum _{i,j}{\frac {p_{ij}^{2}}{p_{i\cdot }p_{\cdot j}}}-1}
Daarin is
p
i
⋅
=
∑
j
p
i
j
{\displaystyle p_{i\cdot }=\sum _{j}p_{ij}}
en analoog
p
⋅
j
=
∑
i
p
i
j
{\displaystyle p_{\cdot j}=\sum _{i}p_{ij}}
Bij statistische onafhankelijkheid tussen beide variabelen geldt:
p
i
j
=
p
i
⋅
p
⋅
j
{\displaystyle p_{ij}=p_{i\cdot }p_{\cdot j}}
;
dus:
χ
p
2
=
0
{\displaystyle \chi _{p}^{2}=0}
Bij volledige samenhang tussen de beide variabelen zijn er evenveel rijen als kolommen (
r
=
k
{\displaystyle r=k}
) en is (eventueel na herschikking):
p
i
i
=
p
i
⋅
=
p
⋅
i
{\displaystyle p_{ii}=p_{i\cdot }=p_{\cdot i}}
en
p
i
j
=
0
,
i
≠
j
{\displaystyle p_{ij}=0,\,i\neq j}
,
zodat:
χ
p
2
=
k
−
1
{\displaystyle \chi _{p}^{2}=k-1}
Voor de populatie is Cramérs V de parameter:
V
p
=
χ
p
2
min
(
r
−
1
,
k
−
1
)
{\displaystyle V_{p}={\sqrt {\frac {\chi _{p}^{2}}{\min(r-1,k-1)}}}}
,
met een waarde minimaal 0 bij onderlinge onafhankelijkheid en maximaal 1 bij volledige samenhang.
De parameter
V
p
{\displaystyle V_{p}}
kan geschat worden op basis van een steekproef uit de simultane verdeling van de variabelen
A
{\displaystyle A}
en
B
{\displaystyle B}
. De steekproef is gegeven in de vorm van de kruistabel met
r
{\displaystyle r}
rijen en
k
{\displaystyle k}
kolommen en waargenomen frequenties
(
n
i
j
)
{\displaystyle (n_{ij})}
van de uitkomsten
(
A
i
,
B
j
)
{\displaystyle (A_{i},B_{j})}
. Een geschikte schatter is de steekproeffunctie , die ook aangeduid wordt als Cramérs V:
V
=
χ
2
/
n
min
(
r
−
1
,
k
−
1
)
{\displaystyle V={\sqrt {\frac {\chi ^{2}/n}{\min(r-1,k-1)}}}}
Daarin is
χ
2
{\displaystyle \chi ^{2}}
de chi-kwadraatgrootheid :
χ
2
=
∑
i
,
j
(
n
i
j
−
n
i
⋅
n
⋅
j
n
)
2
n
i
⋅
n
⋅
j
n
=
n
∑
i
,
j
(
n
i
j
n
−
n
i
⋅
n
⋅
j
n
2
)
2
n
i
⋅
n
⋅
j
n
2
{\displaystyle \chi ^{2}=\sum _{i,j}{\frac {{\big (}n_{ij}-{\frac {n_{i\cdot }n_{\cdot j}}{n}}{\big )}^{2}}{\frac {n_{i\cdot }n_{\cdot j}}{n}}}=n\sum _{i,j}{\frac {{\big (}{\frac {n_{ij}}{n}}-{\frac {n_{i\cdot }n_{\cdot j}}{n^{2}}}{\big )}^{2}}{\frac {n_{i\cdot }n_{\cdot j}}{n^{2}}}}}
,
met
(
n
i
⋅
)
{\displaystyle (n_{i\cdot })}
en
(
n
⋅
j
)
{\displaystyle (n_{\cdot j})}
respectievelijk de rij- en kolomsommen en
n
{\displaystyle n}
de steekproefomvang, dus ook de totale som.
De steekproeffuncie
V
{\displaystyle V}
kan ook gebruikt worden als toetsingsgrootheid .