Estadiacutestica Descriptiva e Inferencial
Estadiacutestica Descriptiva e Inferencial
Estadiacutestica Descriptiva e Inferencial
E STADISTICA DESCRlPTIVA
E lNFERENCIAL
COLECCIÓN CIENCIAYTECNICA.
estadística descriptiva e inferencial
Thi s One
BJ5Y-2AY-0R82
Antonio Vargas Sabadlas
ESTADÍSTICA descriptiva
E INFERENCIAL
INTRODUCCIÓN 23
1.1. Sumas indicadas 23
1.2. Sumas dobles 27
1. DISTRIBUCIONES Y GRÁFICAS 33
1.1. Concepto y términos 33
1.2. Población, muestra e individuo 33
1.3. Caracteres y modalidades 34
1 .4. Variable estadística 35
1.5. Distribución de frecuencias 35
1.5.1. Frecuencia absoluta y relativa 36
1.5.2. Propiedades de las frecuencias 36
1.5.3. Frecuencias acumuladas 36
1.6. Parámetros y estadísticos 37
1.7. Tablas estadísticas 37
1.7.1. Tabla de una variable estadística discreta 38
1.7.2. Agrupación en clases 39
1.7.3. Tabla de una variable estadística continua 43
1.8. Representaciones gráficas 44
1.8.1. Representaciones de caracteres cualitativos 44
1.8.2. Representaciones de caracteres cuantitativos 49
1.8.2.1. Diagramas diferenciales 49
1.8.2.2. Diagramas integrales para variable discreta 53
1.8.2.3. Diagramas integrales para variable continua 54
1.9. Simetría y sesgo 56
1.10. Modalidad 56
1.11. Apuntamiento 57
12
2. CARACTERÍSTICAS DE POSICIÓN 63
2.1. Características de una distribución de frecuencias 63
2.2. Características de tendencia central 64
2.3. Media aritmética 65
2.3.1. Definición en el caso discreto 65
2.3.2. Propiedades de la media aritmética 66
2.3.3. Definición en el caso continuo 68
2.3.4. Ventajas e inconvenientes de la media aritmética 70
2.4. Otros valores medios 70
2.4.1. Media geométrica 70
2.4.2. Media cuadrática 72
2.4.3. Media armónica 73
2.4.4. Relación entre las distintas medias 74
2.5. Percentiles. Mediana 75
2.5.1. Definiciones 75
2.5.2. Cálculo de la mediana 76
2.5.2.1. Comportamiento de la mediana 79
2.5.3. Problema inverso 80
2.6. Cuartiles, quintiles y deciles 81
2.7. Moda 81
2.7.1. Definición 81
2.7.2. Cálculo de la moda 82
2.8. Ejercicios propuestos 84
BIBLIOGRAFÍA 561
La Matemática, en su afán por definir los conceptos con precisión y expresar los
razonamientos con claridad, emplea un lenguaje simbólico, que resulta difícil de enten
der si no se conoce bien el significado de los símbolos y signos de que se sirve.
Uno de los símbolos, que aparecerá profusamente a lo largo de las páginas de este
libro, es el símbolo de la suma indicada o «sumatorio», que representamos con la letra
griega Z (sigma mayúscula), y que emplearemos para expresar la suma de diversos
conjuntos de números.
Ejemplo 1. 1
La variable con índice A define así el conjunto de los ingresos por ventas que ha
realizado el dependiente.
Para expresar la suma de todos los ingresos, se procede de acuerdo con el criterio
que establece la siguiente definición:
24
y se debe leer como «la suma de» todos los valores que toma la variable A . empezan
do por el primero, A, (A, cuando i=l ) y terminando por el último, An (A, cuando i=n):
El índice inferior (i=l ) especifica que la suma empieza en A , y el índice superior
(i=n), colocado sobre la Z. señala el último de los sumandos.
La letra i, que hemos empleado para designar un índice genérico, es una variable
«muda», que puede reemplazarse por otra letra que no haya sido utilizada. Así:
n n n
La suma de todos los ingresos por ventas del dependiente de los grandes almace
nes se expresa como:
ÍA
que, una vez desarrollado, resulta:
5
Xa = A, + A, + A, + A, + A, = 22600+ 15500 + 8250 + 25200 + 32400= 103950
M
Una generalización de la definición 1.1 es la siguiente:
Xa
25
representa la suma de los ingresos por los artículos vendidos en segundo, tercero y
cuarto lugar:
4
La especificación del primero y del último de los índices es importante. Sin embar
go, en muchas ocasiones no se especifican. Cuando suceda esto, debe entenderse
que la suma se extiende a todos los elementos del conjunto que define la variable A.
Propiedades
Esta propiedad nos dice que, si cada sumando de una suma indicada se descom
pone en dos, el valor de ésta es el mismo que se obtiene de sumar los resultados de
las dos sumas parciales.
Ejemplo 1.2
Supongamos que el dependiente de los grandes almacenes del ejemplo I.1 cobra
por separado el importe neto del producto y el impuesto (IVA) que lo grava. Los
ingresos anteriores vendrían ahora desglosados en la forma:
siendo A=X+Y
i i i
Esta propiedad nos indica que, para hallar el precio neto, es igual sumar los pre
cios de venta de los artículos por un lado y los impuestos por otro y restar, que sumar
las diferencias entre el precio de venta y el IVA de cada uno de los artículos:
5 5
Así, por ejemplo, si todos los precios se multiplican por 2, el precio total será
también el doble. Esta propiedad se conoce como «distributiva», y es la que permite
sacar factor común:
J 5
%k = M (6)
V. Si k es una constante
N N
Nos interesa ahora resaltar dos reglas que no cumple la suma indicada:
1) YXY*(YX)(1Y)
es decir, no se obtiene el mismo resultado si se multiplica primero cada valor de X por
cada valor de Y, sumando a continuación los productos, que si se suman, por un lado
las X, y, por otro las Y, multiplicando a continuación las dos sumas.
Tampoco es igual la suma de los cuadrados de los valores de X y el cuadrado de
su suma.
2) 1X2*(1X)2
Ejemplo I.3
Son también numerosas las ocasiones en que nos encontramos con variables con
dos índices. Vamos a servirnos de un ejemplo sencillo para que el lector no habituado
a tratar con matrices descubra la necesidad y el modo de trabajar.
Ejemplo I.4
Años de antigüedad
1 2 3
Artículos 1 >
2
3
4 >>>
1 2 3
1 50 60 35
2 25 30 10
3 16 10 14
4 12 8 24
que, realmente, es un cuadro de números ordenados por filas y por columnas. Los
elementos de la primera fila son los precios del artículo 1 según el año de antigüedad:
50, 60, 35; los elementos de la primera columna son los precios de cada artículo con un
año de antigüedad,...
Cuando el número de filas(m) y de columnas(n) es grande, una manera de repre
sentar la suma de todos los elementos de la matriz es mediante la expresión:
(9)
M ¡=1
4 3 4 í 3 "\ 4 4 4 4
= (An + A2i + A.m + Aii) + (A12 + A22 + A35 + A42) + (A13 + A23 + A33 + A43) =
= (A/, + A« + A,.i) + fA2i + A22 + AuJ + M.i/ + A» + A.it) + (A4/ + A42 + A4.l) =
= (50 + 60 + 35) + (25 + 30 + 10) + ( 16 + 10 + 14) + (12 + 8 + 24) = 145 + 65 + 40 + 44 = 294
Hemos comprobado, por tanto, que el resultado es el mismo cualquiera que sea el
orden que sigamos para sumar, lo que podemos expresar mediante la fórmula:
rn n m f n \ ( m \
XX\o
,.i ¡.i
=X
,.i
Xa, -i ,»1Xa„ ) (10)
Esta propiedad resulta evidente, ya que la constante se puede sacar factor común
en las sumas simples, según hemos visto en (5). También resultan fáciles de compro
bar las siguientes:
IV X X I = mn = N, si mn = N. (14)
,.1 i.i
Ejemplo 1.5
r 4 >
J 3
í' ^
15>4i = 1 3, 14. = (3+32+33 + 3^X4 + 42+4')= 120-84 = 10080
,=l j=1 .-, > \» )
En ocasiones, interesa obtener sumas parciales de una suma doble, como puede
ser, en el ejemplo 1.4, la suma de los precios de todos los artículos con un año de
antigüedad (que se corresponde con la suma de los elementos de la primera columna
de la tabla):
4
o la suma de los precios de los artículos 1 y 2 (suma de las dos primeras columnas):
4
PRIMERA PARTE
ESTADÍSTICA DESCRIPTIVA
CAPITULO 1
DISTRIBUCIONES Y GRÁFICAS
Llamamos población o universo al conjunto de los elementos que van a ser obser
34
Se llama carácter de un individuo a cada una de las facetas bajo las cuales éste
puede ser analizado. El carácter es, por tanto, una propiedad que permite clasificar a
los individuos de la población.
Así, por ejemplo, los estudiantes de una universidad pueden ser analizados, entre
otros, según los siguientes caracteres: sexo, edad, cociente intelectual, calificaciones
en una determinada asignatura, estatura, peso,...
Un mismo carácter puede presentar distintas situaciones, a las que llamaremos
modalidades de dicho carácter. Así, el carácter sexo presenta dos modalidades: sexo
masculino y sexo femenino.
Aquellos caracteres que sólo admiten dos modalidades, como el sexo, se llaman
dicotómicos.
A) Propiedad fundamental:
es decir, cada uno de los individuos de la población debe tener una y sólo una de las
modalidades del carácter.
Para un mismo carácter, el número de modalidades que pueden ser analizadas es
variable. Así, el estado matrimonial de una persona puede considerarse bajo dos
modalidades: casado o soltero; tres modalidades: casado, soltero, viudo; cuatro mo
dalidades: casado, soltero, viudo, divorciado; cinco modalidades: casado, soltero,
viudo, divorciado, separado;...
35
B) Tipos de caracteres:
En efecto:
,-i N N ,=l N
(5)
h,- N N tí '
Hecho el recuento de los individuos que pertenecen a cada modalidad del carácter
analizado, se recogen los datos ordenados en una tabla.
38
c, n, f, lOOxf,
c. n, f. lOOxf,
c1
n f i
lOOxf
q \ t; lOOxf^
Total N i 100%
Ejemplo 1.1
"\ f lOOxf
lOOxf,
lOOxf
\ 100xfk
Total N 1 100%
Ejemplo 1.2
1 P%
0,14 14
7 0,14
13 0,26 26
20 0.40
15 0,30 30
35 0,70
0,16 16
43 0,86
4 ó más 0.14 14
50 1,00
Total 50 1,00 100%
40
Para facilitar el estudio de los posibles valores de una variable estadística conti
nua, éstos se agrupan en clases o intervalos de clase, que constituyen las modalida
des del carácter.
Generalmente se toman los intervalos solapados de forma que cubran todos los
posibles valores de la variable; son intervalos semiabiertos (cerrados por la izquierda
y abiertos por la derecha).
Representaremos la i-ésima clase por
te,,,e,) (7)
donde e,, es el extremo inferior del intervalo y e es el extremo superior, que no forma
parte del mismo.
La amplitud de clase es la distancia entre sus extremos. La amplitud de la clase i-ésima
es, por tanto:
a.=e-e ,
t i i-i (8)
v f
Las clases pueden tener una amplitud constante o variable, aunque es aconsejable
elegir los intervalos con amplitud constante.
Así, las estaturas de una muestra de estudiantes pueden agruparse en clases de la
siguiente forma:
de 1,55 m. a menos de 1,65 m.
de 1,65 m. a menos de 1,75 m.
de 1,75 m. a menos de 1,85 m.
más de 1,85 m.
La amplitud de las tres primeras clases es de 10 cm., mientras que la amplitud de la
última clase es indeterminada. Se dice que esta clase es abierta. Los extremos de clase
son 1,55; 1,65; 1,75;... Los intervalos de clase son [l'55,r65), [l'65,r75),... La última
clase no tiene extremo superior.
La elección del número de clases depende del recorrido y de la amplitud de cada uno
de los intervalos. Se define el recorrido o rango de una variable estadística como la
diferencia entre los valores mayor y menor de la variable. Si lo representamos por R. es:
R = máx(x^ - mui(x) (9)
Se puede fijar el número de intervalos y deducir la amplitud de éstos o bien fijar la
amplitud y calcular el número de intervalos.
Si son todos los intervalos de amplitud constante a=a, el número n de intervalos
de clase, la amplitud y el recorrido verifican la relación:
n = R/a (10)
Se suele actuar de acuerdo con los siguientes criterios:
1) El número total de intervalos de clase debe estar comprendido entre 5 y 15. Si se
elige un número menor, pueden darse inexactitudes, y un número mayor de 15 compli
41
Ejemplo 1.3
Ejemplo 1.4
Las calificaciones obtenidas por los alumnos de un colegio han sido reflejadas en
la siguiente tabla:
Intervalos Frecuencias
1-10 30
11-20 15
21-30 63
3140 84
41-50 50
51-60 46
61-70 32
71-80 14
Total 364
Es evidente que no están recogidas calificaciones no enteras, como puede ser una
puntuación de 50' 5 puntos, y, sin embargo, en alguna situación podría ser interesante
disponer de datos como éste.
Por ello, es conveniente elegir nuevos intervalos que contengan estos posibles
valores, manteniendo las frecuencias.
En este ejemplo, basta con tomar como extremos a los puntos medios entre los
extremos superior e inferior de cada dos intervalos contiguos, modificando también
los intervalos de modo que todos ellos tengan la misma amplitud.
La tabla de frecuencias para el ejemplo 1 .4. quedaría así:
Intervalos Frecuencias
0'5-10'5 30
10'5-20'5 15
20'5-30'5 63
30'540'5 84
40'5-50'5 50
W5-fti'5 46
60'5-70'5 32
70'5-80,5 14
Total 364
43
Ejemplo 1.5
183 182 165 179 174 171 179 182 193 188 164 186 170 173 175 177 168
169 191 176 172 181 168 175 160 171 166 164 171 176 181 188 183 188
163 181 187 191 172 176 181 174 176 184 171 169 169 179 178 162 178
177 158 161 179 162 174 167 180 172 185 188 174 177 171 182 163 172
187 168 156 161 168 183 172 186 179 192 157 168 178 173 183 157 166
195 173 178 188 164 163 170 164 168 159 169 187 184 166 169
I. Diagrama de rectángulos
Ejemplo 1.6
III. Pictograma
En este tipo de gráfico, cada modalidad del carácter se representa por una figura
no geométrica, como puede ser un automóvil, un edificio, una herramienta de traba
jo,... de tamaño proporcional a su frecuencia.
Para evitar confusiones, según se tomen las frecuencias proporcionales a la longi
tud, a la superficie o al volumen de la figura, debe tenerse en cuenta que. si la razón
de las longitudes es de 1/r. la razón de las superficies es de 1/r y la de los volúmenes
de 1/r". Un procedimiento alternativo consiste en tomar un dibujo como modelo y
repetirlo un número de veces proporcional a la frecuencia de la modalidad correspon
diente.
Ejemplo 1.7
Ciudad A B t D
N° de automóviles 500 KXX) 2000 3500
47
Representación alternativa:
A:
B:
C
l>.
IV. Perfiles
Los perfiles pueden adoptar forma radial, cuando las modalidades del carácter se
representan sobre radios que parten de un mismo punto, u ortogonal, cuando se
representan sobre unos ejes cartesianos.
La utilidad del perfil en el campo educativo se justifica por el hecho de captar, de
una vez. diversos rasgos o características del alumno.
Según los rasgos que se pretenden ilustrar, hay una gran variedad; hay perfiles
sobre intereses, aptitudes, rendimiento,... Los perfiles sobre rendimiento académico
reciben el nombre de nosogramas.
Los perfiles, realmente no son gráficos que correspondan a distribuciones de un
carácter. Sin embargo, los hemos incluido aquí, porque cabe la interpretación de las
calificaciones como valor de la frecuencia de cada asignatura.
A) Perfil ortogonal
Dado un sistema de ejes cartesianos, sobre el eje de abscisas se sitúan las diver
sas modalidades del carácter, como pueden ser las diversas asignaturas que cursa un
alumno: Matemáticas. Física, Química. Dibujo y Biología.
Sobre cada asignatura se marcan con un punto los valores correspondientes a
cada calificación. Uniendo los distintos puntos, se obtiene una línea quebrada, que
constituye el perfil ortogonal. Se suele completar la representación trazando alguna
paralela al eje de abscisas para resaltar un determinado aspecto.
Ejemplo 1.8
Asignaturas Calificaciones
Matemáticas 6 /
Física 5
Química 8
Dibujo 7
Biología 9
Figura 1 .4. Perfil ortogonal.
B) Perfil radial
Para construir el perfil radial, se fija un punto del plano como origen.
A partir de dicho punto se trazan tantos radios como
asignaturas, formando ángulos de la misma amplitud.
Sobre cada radio se toman segmentos proporciona
les a las calificaciones respectivas. La unión de los pun
tos extremos de los segmentos determina un polígono,
que constituye el perfil radial.
La figura 1 .5 muestra el perfil radial correspondiente
al ejemplo 1 .8.
VI. Cartograma
..',
II. Histograma
n¡
/> (15)
Se conoce este valor como densidad de frecuencia del intervalo [e¡ rei). El área del
rectángulo correspondiente a la clase i-ésima es, por lo tanto:
(16)
5, = — a,- = «,
a,
(17)
S = ¿i,= /V
Ejemplo 1.9
Un grupo de 200 alumnos han sido calificados de 0 a 100 por un profesor, que
facilita los resultados agrupados en intervalos de diferente amplitud, según muestra la
siguiente tabla:
8* = 20, = 0'8
A) Variable discreta
En este caso, se trazan unos ejes cartesianos; sobre el eje de abscisas se sitúan
los valores de la variable estadística X, y sobre el eje de ordenadas se llevan los
valores de las frecuencias tal como se hizo para construir el diagrama de barras.
En lugar de trazar la barras
completas, ahora se señalan los
puntos superiores de las mis
mas; uniéndolos mediante seg
mentos rectilíneos, se consigue
el polígono de frecuencias.
Para que la gráfica no quede
colgada, se supone que hay dos
valores más de la variable con fre
cuencia cero, uno anterior al pri
mero de sus extremos y otro pos
terior al último. De esta forma, se
prolonga el polígono en dos seg Figura 1.9. Calificaciones en Física y Matemáticas.
mentos hasta que sus extremos
toquen el eje de abscisas.
Para hacer comparaciones, a veces sobre un mismo gráfico se representan los
polígonos de frecuencias correspondientes a dos o más distribuciones.
Ejemplo 1.10
B) Variable continua
pequeñas las amplitudes de los intervalos de clase, se aproxima a una curva de una
distribución teórica, llamada «curva de frecuencias».
La curva de frecuencias es una especie de polígono de frecuencias simples suavi
zado, que proporciona una representación aproximada de la distribución de la pobla
ción correspondiente.
Cuando la variable estadística es continua, una vez fijados los intervalos de clase
sobre el eje de abscisas, se llevan sobre el eje de ordenadas las frecuencias relativas
acumuladas o los porcentajes acumulados.
Al trazar el polígono de frecuencias para variable continua, se tomaban los valores
de las frecuencias sobre el punto medio de la base superior de los rectángulos del
histograma.
En cambio, para trazar la curva acumulativa de frecuencias relativas, se toman
sobre la ordenada correspondiente al límite superior de cada intervalo de clase, pues
to que a cada extremo superior de los intervalos de clase se le asocia el tanto por
ciento de individuos de la población que quedan por debajo de dicho límite.
Trazando segmentos de paralelas al eje de abscisas a partir de cada punto hasta
llegar a la ordenada correspondiente al siguiente extremo de clase, y completando la
gráfica con dos semirrectas horizontales de modo análogo a como se procedió con
variables discretas, se obtendría el polígono de frecuencias acumuladas.
Sin embargo, en el caso continuo, no se suele utilizar el polígono de frecuencias
acumuladas, sino que se aproxima éste por una curva que se adapta a los puntos
obtenidos, sin que necesariamente tenga que tocar a todos.
55
Esta curva tiene forma de arco apuntado, por lo que también recibe el nombre de
ojiva.
Fijado un valor xo de la variable, es decir sobre el eje de abscisas, la ordenada
correspondiente en la ojiva señala el porcentaje de individuos de la población cuyo
carácter es menor o igual a x0. Por ello, la ojiva puede ser utilizada para el cálculo
gráfico de los centiles, según veremos.
Ejemplo 1.11
Figura 1.15. Cuna simétrica. Figura 1.16. Curva sesgada liacia la derecha.
1.10. Modalidad
1.11. Apuntamiento
Las medidas del grado de apuntamiento de una curva así como de su asimetría
serán objeto de estudio en el capítulo 3.
1.2. Los pesos (en Kgs.) de los niños recién nacidos en una clínica maternal
durante el último año han sido:
2'5-2'75 2'75-3 3- 3'25 3-25-3'5 3'5-3'75 3'75-4 4-4'25 4'25-4'S
27 36 85 144 98 56 32 32
58
1 .3. Durante el mes de junio se han registrado las siguientes temperaturas máximas
cada día:
1.5. Los obreros de una gran industria han sido clasificados por categorías labora
les, dándose los siguientes resultados:
Especialistas 1250
Oficiales de 2a 975
Oficiales de Ia 510
Técnicos de grado medio 35
Técnicos superiores 12
Altos cargos 8
1 ) Representar los datos mediante un diagrama de barras y otro de sectores. 2)
Construir el polígono de frecuencias simples y el polígono de frecuencias acumuladas.
1.6. El número de viajeros (en miles de personas) durante los 6 primeros meses del
año por carretera y ferrocarril ha sido el siguiente:
Trigo (fanegas) 487 546 434 465 503 3X8 405 298 600 446
Cebada (fanegas) 458 730 895 978 802 630 754 790 878 910
1.9. Un saltador de pértiga ha realizado, durante los 10 últimos días, las siguientes
marcas:
4'86 501 5'42 5'82 5' 12 5'01 6'00 5-92 5'90 5'95
35 48 63 24 46 58 46 32 26 83 84 96 32 94 28 46 53 62 75 76 44 3 1 59 83 45 22 29
91 60 61 5442 56 31 64 5648 59 91 87 78 7644 58 26 28 40 81 70 70 63 64 37 45
N° Trabajadores 7 8 15 25 18 9 6
X1 3 4 9 15 20
a 3 3 8 6 2
n 15 30 56 85 46 30 22 12
1.17. Las temperaturas máximas y mínimas durante los 15 primeros días de julio, en
una ciudad, han sido:
Máximas 37 30 33 28 35 36 36 32 34 30 28 30 36 34 32
Mínimas 16 14 18 15 20 21 19 17 18 16 16 20 20 21 19
1.18. La siguiente tabla recoge la vida media (en horas) de 500 lámparas:
Las tablas de frecuencias y los gráficos que acompañan a los datos de una distri
bución estadística no cabe la menor duda de que son métodos interesantes para
presentar un resumen de la misma, que puede resultar incluso vistoso y elegante. Sin
embargo, hemos definido, al principio, la Estadística Descriptiva como un método de
«descripción numérica». Nuestro interés se centra ahora en encontrar esos valores
numéricos o medidas que, por sí solos, describan la localización de datos de una
distribución.
Nos serviremos de un ejemplo1 sencillo que pone de manifiesto cómo estas medi
das nacen espontáneamente. En una clase de Matemáticas, surge la necesidad de
medir la longitud del encerado, y, al no disponer de una unidad de medida, el profesor
propone que cada alumno anote en un papel la medida que estime a simple vista. Se
recogen las anotaciones y se disponen en una tabla:
Se trata ahora de decidir, ante estos datos, qué valor se debe tomar como medida
de la longitud de la pizarra. Un alumno sugiere como medida 2'30 m., argumentando
que éste es el valor que más se da (la moda). Al profesor no le parece mal la elección,
pero la encuentra poco democrática, ya que sólo se tiene en cuenta la opinión de una
quinta parte de la clase.
Otro alumno insinúa que se tome 2'35 m.; lo argumenta diciendo que la mitad de la
clase ha dado una medida menor o igual que 2'30, y la otra mitad, una medida mayor
o igual que 2'40 (la mediana).
Tampoco el profesor queda satisfecho del todo porque no se valora en su justa
medida la opinión de cada uno de los alumnos. Así surge la idea de sopesar cada
1 El ejemplo está tomado de un trabajo del Profesor Pascual Ibarra, publicado en 1968 con
el título de «Democracia y Estadística».
65
1) Media aritmética para datos agrupados: Sea X una variable estadística discre
ta que toma los valores x ,x ,...,x con frecuencias absolutas a.ja.,...jL, respectivamen
te. Se define la media aritmética como el valor:
A, x,'h
(1)
N tV
A n.
También es: x = ¿¿xJ, ~ xif, + x2Í2+---+xJk , va que -77 ~ f,-
Ejemplo 2.1
2x3+4x6+5x5+6x3+8x1+10x2 101
x =. = 5,05
20 20
2) Media aritmética para datos no agrupados: En el caso particular de que cada
uno de los k valores de la variable estadística aparezca una sola vez (n =n2=...=nk=1),
como caso particular del anterior, la expresión de la media aritmética adopta la forma:
(2)
Las edades de tres niños son de 5, 7 y 9 años. La edad media de los tres es
7 + 8+9
x = -¿- = 8
Despejando x, se obtiene:
.- (4)
x = c + dz
Esta última fórmula permite hallar la media de X a partir de la media de Z, cuyos
cálculos resultan más sencillos si se eligen adecuadamente el nuevo origen y la escala.
Ejemplo 2.2
Tomando como origen el valor c=154 y como escala d=0,l vamos a construir la
tabla con los nuevos datos:
68
x. - c
x¡ n, x,-c l n
d
153,7 10 -03 -3 -30
153.8 15 -02 -2 -30
153,9 19 -0.1 -1 -19
154.0 21 0 0 0
154.1 14 0.1 1 14
154JZ 13 02 2 26
154.3 8 03 3 24
Total 100 -15
La media de la variable Z es
1 ^ -15
Ejemplo 2.3
174 190 183 180 168 163 194 182 168 171 171 188 191 167 167 185
185 189 169 172 175 161 173 170 184 190 166 162 191 174 179 189
189 168 161 165 174 166 167 186 178 178 173 173 181 176 172 180
173 177 182 178 170 175 174 182 181 162 177 180 185 160 161 195
186 160 187 164 171 188 158 186 169 165 159 187 156 159 176 191
69
Vamos a calcular la media, en primer lugar, agrupando todos los valores en clases.
El recorrido es R= 195- 156=39, que, aumentándolo en 1, resulta 40. Se pueden elegir 7
clases de amplitud 6.
Aunque hoy es menos importante simplificar los cálculos, ya que disponemos de
excelentes calculadoras y paquetes informáticos que los evalúan directamente, vamos
a efectuar un cambio de origen y de escala, reflejando los datos en la tabla para
observar los distintos pasos.
Tomaremos como origen el valor de una de las marcas situadas hacia el centro, por
ejemplo, c=175, y, como unidad de escala, la distancia entre dos marcas de clase
consecutivas, d=6.
Calcularemos también la media para valores sin agrupar con el fin de corroborar
cómo efectivamente hay un pequeño sesgo con respecto al valor real de la media,
debido a la suposición tácita de que los datos se distribuyen de una manera homogé
nea en sus correspondientes intervalos de clase.
c¡ - c
Extremos c.
1
a i
C.-C zi~ el z¡n¡
- / i 13
.volr. .yo.0'1625
Haciendo uso de (4), la media de la variable X es:
Ejemplo 2.4
En la siguiente tabla, se han modificado los datos del ejemplo 2. 1 , de modo que los
dos alumnos que tenían una calificación de 10 en Matemáticas, tienen ahora un 1.
Calificaciones 2 4 5 6 8 1
V de alumnos 3 6 5 3 1 2
Valores medios de uso menos frecuente que la media aritmética son la media
geométrica, la media cuadrática y la media armónica.
A) Definición
Dada la variable estadística X, que toma los k valores xrx2„.„xk con frecuencias
absolutas nrn, nk, siendo n,+n,+...+nk=N1 se define la media geométrica como:
71
(5)
xc = *IxVxV...xV
xc yjxix2... «»
B) Cálculo
l i ] <
= — [logf x, /"+...+ logfxi r] = —[nilogx, +... + «JogxÁ/= — L».logx,
/V Aí « ¡=/
Esta última relación nos dice que «el logaritmo de la media geométrica es igual a la
media aritmética de los logaritmos2».
Para calcular la media geométrica, basta con tomar antilogaritmos en la igualdad
anterior: t
X'iJogx,
xG = antilog —
N
Por tratarse de un caso particular, se procede de igual modo para calcular la media
geométrica cuando los datos no se dan agrupados:
XlogJr,
Tomando antilogaritmos, queda: xc = antilog J
2 Por cumplir esta propiedad, la media geométrica es llamada por algunos autores «media
logarítmica»,
72
Ejemplo 2.5
Asignaturas L M Q B F D
Calificaciones 7 8 7 6 5 9
A) Definición
Dada la variable estadística X, que toma los k valores x^x,,...^ con frecuencias
absolutas n.fL,...JL, siendo n,+n,+...+nk=N, se define la media cuadrática como:
605
Su valor para el ejemplo 2.1 es: Xa = J = J30,25 = 5,5
73
B) Ventajas e inconvenientes
A) Definición
Dada la variable estadística X, que toma los k valores x,,x2,...,xk con frecuencias
absolutas n^n,,...,nk, siendo n,+n2+...+nk=N, se define la media armónica como:
N N
Xa
ni
— + — +. n2 (9)
Xl
.+—
x2 Xk
1~
i.l x,
20
Su valor para el ejemplo 2.1 es: x ., = = 4.145
4,825
En el caso particular de que las frecuencias absolutas de los k valores de la
variable estadística sean todas iguales a 1 (n,=n2=...=n|=l), se obtiene la expresión:
k k
x.
' —
1 — 1 1 - * 1 (10)
+ +.
Xl x2 Xk ¡.1 x¡
74
B) Ventajas e inconvenientes
Las cuatro medias, que acabamos de definir, están relacionadas entre sí por la
cadena de desigualdades:
Ejemplo 2.6
1 ) Media armónica:
10 10
-=X r-jMTs-1.9887
1,90+'"+2.08
2) Media geométrica:
/ /
\ogxc, = —(\ogl.90+... + ]og2,08)=— (0.2787+.. .+0.3180) = 0.2987
3) Media aritmética:
/ '" 1
~x-iblr-T¡9-9-h"
75
4) Media cuadrática:
2.5. 1 . Definiciones
A) Percentil
B) Mediana
Tiene especial interés el percentil de rango 50, al que denominamos mediana, que
es, por tanto, «el valor de la variable estadística que divide a la población en dos
partes iguales, una vez ordenados los individuos por valor creciente del carácter».
En el estudio de los percentiles se nos plantean dos cuestiones de interés:
I. Dado un percentil, calcular el valor correspondiente de la variable.
76
Ejemplo 2. 7
10 2 20
8 1 18
6 3 17
5 5 14
4 6 9
2 3 3
77
X n
20 --
10 2
18 -
8 1
17
6 3
14 -
5 5 N/2
9 —-
4 6 3
2 3
0123456789 10
X n 1 i
-20 1-
10 2
-18
8 1
- 17 -
6 7
10 ' N/2 r1'5-
5 1
9
4 6 3
2 1
0 -
0123456789 10
Figura 2.2. Tabla y curva de frecuencias acumuladas para el ejercicio 2.7. modificado.
7S
Tenemos así el intervalo mediano [5,6). Como valor de la mediana se suele tomar el
punto medio de dicho intervalo:
5+6
M„ = —— -5,5
3) La variable es continua
El proceso que se sigue en este caso, para encontrar el valor particular, cuya
frecuencia acumulada sea igual a N/2, es el siguiente:
A) Se divide el número de observaciones N entre 2.
B) Se lleva el valor N/2 a la columna de frecuencias absolutas acumuladas (N).
Ahora puede suceder:
i) Que el valor N/2 se encuentre en la tabla, con lo que N/2 será la frecuencia
absoluta acumulada de un cierto intervalo de clase [e ^e), y la mediana será el extre
mo superior del mismo.
ii) Que N/2 no se encuentre en la columna de las N . Entonces, este valor estará
comprendido entre los valores N y N, que corresponden a las frecuencias absolutas
acumuladas de los intervalos [e¡ ,,e t) y [e ..e), respectivamente.
Como N/2>N , la mediana se encontrará en el intervalo [c ,,e), al que llamamos
«intervalo mediano». Por interpolación, se halla el incremento de intervalo que co
rresponde al incremento de la frecuencia hasta llegar a N/2.
La mediana se obtiene de sumar este valor al extremo inferior, e ,, del intervalo
mediano [ei ,,e).
El siguiente ejemplo clarifica el proceso:
Ejemplo 2.8
• eipleados
,l
Salario lensual N,
100 110 2
50 -
t í
15
18 12
90
B0
100
90
4
6
44 1 1
< x >
70 80 10
28
60 70 ;'. 13
50 60 13 >
0
(25-13)x(70-60) 12x10
28-13 - 15 ~8
N/2- N,
Mi — Si i + 'Ü¡ (12)
II,
2.7. Moda
2.7. 1 . Definición
Se define la moda (Mj como «el valor de la variable estadística que corresponde
al máximo del diagrama diferencial». Si la variable estadística es discreta, es el valor de
la variable estadística que tiene mayor frecuencia. De la propia definición se despren
de que la moda no tiene por qué ser única, ya que pudiera haber dos o más valores de
la variable con la misma frecuencia máxima.
Una distribución con dos modas recibe el nombre de bimodal, con tres modas,
trimodal,...
La moda no tiene en cuenta una parte importante de los datos, por lo que se utiliza
como medida descriptiva de localización, y no suele usarse en la investigación.
Un ejemplo en que tiene interés el uso de la moda es el caso de apostar al número
que aparece en la cara superior de un dado si éste tiene la cara opuesta cargada. Es
82
evidente que al número de dicha cara corresponde la mayor frecuencia, por lo que
este número es al que tenemos que apostar si deseamos ganar.
En este caso, el valor de la moda debe estar más cerca del intervalo contiguo al
intervalo modal de mayor frecuencia. La figura 2.5 permite encontrar el valor del incre
mento que hay que añadir al valor del extremo de la izquierda, e , del intervalo modal,
para obtener un valor puntual de la
moda.
En efecto, los triángulos APC y
BPD son semejantes por tener los
ángulos iguales: los ángulos P por
ser opuestos por el vértice, y los
otros dos por ser alternos internos
entre paralelas.
Sus lados homólogos son, por
tanto, proporcionales, y también son
proporcionales sus bases y alturas.
Utilizando las propiedades de la
Figura 2.4. Cálculo de la moda. proporcionalidad, se deduce
83
PN BD PN+MP BD+AC MP AC
MP~ AC MP AC PN+MP BD+AC
AC n, - n, ,
de donde MP = (PN + MP) = a
BD + AC («, - «w ) + (", - ",-, )
donde:
e i- 1, es el extremo inferior de la clase modal,
h . la diferencia de las frecuencias de la clase modal y de la clase inferior contigua,
h.+1 la diferencia de las frecuencias de la clase modal y de la clase superior contigua,
& la amplitud del intervalo modal.
Ejemplo 2.9
59 72 71 68 67 78 57 57 75 61 69 39 80 46 57 94 59 76 54 64 62
616148 48 86 65 65 63 60 644166 68 67 68 27 68 64 76 72 67
2.2. Un saltador de longitud ha conseguido hacer, durante los 10 últimos días, unas
marcas de:
7'68; 8'04; 7'86; 8'01 ; 7'82; 8' 1 2; 801; 7'92; 8'00; 7'95.
2.5. La producción de trigo en una cooperativa agrícola durante los 7 últimos años
viene recogida en la siguiente tabla:
85
2.7. Las temperaturas máximas y mínimas durante los 15 primeros días de julio, en una
ciudad, aparecen en la siguiente tabla:
Máximas 37 30 33 28 35 36 36 32 34 30 28 30 36 34 32
Mínimas 16 14 18 15 20 21 19 17 18 16 16 20 20 21 19
1 ) Calcular las medias de las temperaturas máximas y mínimas. 2) Hallar las tempe
raturas medianas máximas y mínimas. 3) Encontrar las modas.
2.9. Las puntuaciones obtenidas por un grupo de universitarios en unas pruebas para
acceder a un puesto de trabajo en una industria fueron:
Puntuaciones 0-10 10-20 20-30 3040 40-50 5060 60-70 70-80 80-90 90-100 100-110
2.10. Según los indicadores económicos facilitados por la CEE, el PIB por habitante de
los diversos países de Europa en el año 1986 era:
2.1 1. Un profesor facilita las notas de sus alumnos por medio de la siguiente tabla:
2. 12. Calcular las medias aritmética, geométrica, armónica y cuadrática para la distribu
ción definida por la siguiente tabla, y comprobar la relación que existe entre ellas:
X. 3 4 9 15 20
"' 3 3 8 6 2
2.14. La oficina central de un banco ha contado la cantidad de dinero que retiraron los
clientes en un determinado día, agrupando las cantidades en clases de 20000 ptas.:
87
1 ) Hallar la cantidad media de dinero retirada por los clientes. 2) Calcular la media
na, interpretando su resultado. 3) Hallar el rango del percentil correspondiente a 70000
ptas.
2.15. Las calificaciones obtenidas por 1300 alumnos en las pruebas de acceso a la
universidad, que se evaluaron de 0 a 100, han sido:
Puntuaciones (X) (17,25] (25,33] (33,41] (41.49] (49,57] (57,65] (65,73] (73,81] (81,89]
N" Alumnos 18 66 132 216 425 212 117 90 18
2. 16. Hallar los cuartiles para los datos del ejercicio 2.9 e interpretar los resultados que
se obtengan.
2.17. Hallar la media, la mediana y la moda del ejercicio 1 . 1 7 del primer capítulo.
Son diversos los coeficientes que se definen para medir la dispersión, dependien
do, en cada caso, de la característica a la que se hace referencia y de si se pretende o
no relacionar una distribución con otra. Atendiendo a este último criterio, se pueden
clasificar en medidas de dispersión absolutas y relativas.
3.2. 1 . Recorrido
R,=Q,-Q, (2)
Ejemplo 3. 1
El primer cuartil. Q . deja por debajo el 25% de las puntuaciones, que son 20: por
tanto Q, cae dentro del intervalo 30-40.
Hasta el límite inferior del intervalo, 30, hay 9 puntuaciones; faltan 1 1 para llegar a
20. Entonces, interpolando, resulta que
si 15 valores corresponden a una amplitud 10 del intervalo,
1 1 valores corresponden a 1 lxlO/15=7'33. luego
Q=30+7'33=37'33
El tercer cuartil, Q , deja por debajo el 75% de las puntuaciones, que son 60; este
valor es mayor de 44. por lo que Q, cae dentro del intervalo 50-60.
92
Hay 44 puntuaciones hasta el límite inferior del intervalo, 50, y faltan 16 para llegar
a 60. Interpolando como antes, resulta
si 21 valores corresponden a una amplitud 10 del intervalo,
16 valores corresponden a 16x10/21=7'62, luego
Q=50+7'62=57'62
El recorrido intercuartílico es: R=57'62-37'33=20'09
y el recorrido semiintercuartílico: RS =20' 09/2= 10' 045
Di-—px,-Jdn, (51
93
Ejemplo 3.2
Datos ordenados 12 14 16 18 20 21 23 25 29 34 40
X -X -10'9 -8'9 -6'9 -4'9 -2'9 -1'9 O'l 2'1 6'1 111 IV 1
\x, -x\ 10'9 8'9 6'9 4'9 2'9 1'9 O'l 2'1 6'1 111 17'1 72'9
-9 -7 -5 -3 -1 0 2 4 8 13 19
A-*a 9 7 5 3 1 0 2 4 8 13 19 71
%-Mg\
Datos reordenados 0 12 3 4 5 7 8 9 13 19
Media=252/ll=22'9
Mediana= 21
Desviación media respecto de la mediana=71/l 1=6'45
Desviación media respecto de la media=72'9/l 1=6'62
Desviación mediana=5
3.2.4.1. Definiciones
(6)
(7)
Siy = - (8)
II. Si a todos los valores de una distribución se les suma (o resta) una constante
k, la varianza de la nueva distribución no varía.
Si y = x ± k => si = si
95
min
±4Xf x, - c )' n, = —I Xf
'
x, - x Y n (10)
N
Esta última propiedad nos dice que, si efectuamos la media de los cuadrados de
las desviaciones de los valores de la variable con respecto a un valor C, el valor
mínimo se obtiene cuando C es igual a la media, lo que hace que la varianza sea la
medida cuadrática de dispersión óptima.
IV. Teorema de Konig: Dado un número real c, la media de los cuadrados de las
desviaciones respecto de c es igual a la varianza más el cuadrado de la distancia entre
la media y c:
k
-xff, + (x-cf (11)
i-l ¡=i
que nos indica que «la varianza es la diferencia entre la media de los cuadrados y
el cuadrado de la media».
Esta última fórmula (o su expresión con frecuencias absolutas), que exponemos a
continuación, simplifica notablemente los cálculos:
(k y
¿J x,- x )' n, ¿éx:n, k X*'«_
N N N N (13)
-
Caso de frecuencias unitarias: Si la frecuencia de cada uno de los valores de la
variable es igual a 1 , resulta:
( k '
Yé(x,-x)' ¿xi
-x =
k
Z.xi -
P
)
(14)
i.i k
-
96
x 1 (15)
a a
II. Si a todos los valores de una distribución se les suma (o resta) una constante
k, la desviación típica de la nueva distribución no varía.
Si y = x ± k . Sr = sx (16)
(17)
Ejemplo 3.3
Calificaciones 2 4 5 6 8 10
N° de alumnos 3 6 5 3 12
x¡ n, x, n, Xt-X (xi-xf ( x, - x f m
2 3 6 -3,05 9,3025 27,9075
4 6 24 -1,05 1,1025 6,6150
5 5 25 -0,05 0,0025 0,0125
6 3 IS 0,95 0,9025 2,7075
8 1 8 2,95 8,7025 8,7025
10 2 20 4,95 24,5025 49,0050
Total 20 101 94,9500
Xt n¡ x,n, x¡ XiTk
2 3 6 4 12
4 6 24 16 %
5 5 25 25 115
6 3 18 36 108
8 1 8 64 64
10 2 20 100 200
Total 20 101 245 605
(ioir
\605- . 4,7475: s = 2,1788
20 20
(18)
R (19)
Rr = —
x
CV-- (20)
V = 1O0xCV (21)
SiX*0 (22)
SiMe*0 (23)
Ejemplo 3.4
Matemáticas Física
Calificaciones N° de alumnos Calificaciones N° de alumnos
15 3 2 12
25 5 3 9
35 8 5 12
40 14 6 5
45 16 7 4
47 5 9 4
49 3 10 8
Total 54 54
3.4. Momentos
Tanto la media como la varianza son casos particulares de un concepto más gene
ral, el de momento. Los momentos de una distribución son unos valores específicos
que se deducen a partir de todos sus datos y que son característicos de cada distri
bución, de modo que dos distribuciones son iguales si tienen iguales todos sus
momentos.
Se utilizan, en Estadística, dos tipos de momentos (potenciales y factoriales).
Definimos los momentos potenciales, que son los que vamos a necesitar:
Sea r un número entero positivo y c un número real cualquiera. Se llama momento
de orden r respecto de c al valor dado por la expresión:
i,Í
m„ = — £(*,-* /n, = 77 X», = ^
/ 4
N i.i
1 !
Cuando c=0 se tienen los momentos respecto al origen. Así, el momento de orden
r respecto al origen, que representaremos por ar, es:
ar = -l(xr0fn¡=-Z¿n (26)
1 ,
a, = —Z^xin, = x
1 ■
m2 = ü2 - a. (27)
102
Esta fórmula relaciona el momento central de orden 2 con los momentos respecto
al origen. Es otra manera de expresar el teorema de Kónig para C=0.
mr = 2Jx,-aiífi
i-i
-gx/f.-(-)¿xr«lfl+(-)gxr^f.-... + (-l)^«^.-
'«r-(J)«A-l+(J)«l««---- + (-l¡r*i"
Para valores particulares de r, se tienen las siguientes fórmulas que dan los prime
ros momentos centrales en función de los momentos respecto al origen:
Ejemplo 3.5
12 13 50 70 35 12 65 74 15 76 40 38 45 20 35
30 25 45 44 76 82 53 60 25 23 57 90 40 35 80
— 1365 77601
x=a/ = __ = 45.5 «, = — = 25*67
5034610 353818317
a3 = = 167820 '33 a* = = 11 793943' 9
30 30
2) Momentos centrales:
será nulo, ya que se anularán entre sí los cubos de las diferencias positivas con los de
las negativas.
En cambio, si la distribución es asimétrica, el tercer momento central es tanto
mayor en valor absoluto cuanto más acentuada sea la asimetría de la curva. En efecto,
al elevar al cubo las diferencias, los valores extremos influyen más que los valores
próximos a la media en el cálculo de m,.
Además, el signo de m coincidirá con el sentido de la asimetría.
Por lo tanto, el momento central de orden 3 es un valor adecuado para obtener una
medida de la asimetría de una distribución. Con el fin de utilizar una magnitud sin
dimensión, se usa el coeficiente de asimetría de Fisher (AK):
Ah= — (32)
s
Si AF>0, la distribución presenta asimetría positiva (hacia la derecha).
Si AF=0, la distribución es simétrica.
Si AF<0, la distribución presenta asimetría negativa (hacia la izquierda).
105
x-Mo (33)
A
Si dos distribuciones tienen la misma varianza, aquella que tenga mayores frecuen
106
cias en los valores próximos a la media, tendrá también mayores frecuencias en los
valores extremos y, en cambio, tendrá menores frecuencias en los valores intermedios.
El momento central de orden 4 será, por tanto, mayor en la distribución que tenga
un mayor apuntamiento. Esta es la razón por la que se usa, como medida del apunta
miento de una distribución, el coeficiente del momento de aplastamiento:
nu (36)
A.
s4
g4 = A4-3 (37)
Si g4>0. la curva es más apuntada que la normal de misma media y misma desvia
ción típica (se dice leptocúrtica),
si g4=0, la curva es igual de apuntada que la normal (mesocúrtica),
si g4<0, la curva es menos apuntada que la normal (platicúrtica).
En la figura 3.2 tenemos una imagen de tres curvas con distinto apuntamiento.
Ejemplo 3.6
m, 31287 31287
S3 22725" 11736'6
Por ser AF=0'266>0, el coeficiente de Fisher confirma el sesgo hacia la derecha.
3) Coeficiente del momento de aplastamiento:
m 5235327 5235327
A4 = V= 22725' = 266695'42 = ''96S
Salarios n i
c N1 en. u1 P.1 %
70-90 60 80 60 4800 4800 6 3'65
90-110 180 100 240 18000 22800 24 1737
110-130 300 120 540 36000 58800 54 44'81
130-150 200 140 740 28000 86800 74 66' 15
150-170 150 160 890 24000 110800 89 84'45
170-190 80 180 970 14400 125200 97 95'42
190-210 30 200 1000 6000 131200 100 100
(42)
109
50 -qn (43)
Mi = e¡¡+ a¡
donde:
e es el límite inferior de la clase medial,
qM es la cantidad acumulada (en porcentaje) inferior a la clase medial,
q. es la cantidad acumulada (en porcentaje) de la clase medial,
a. es la amplitud de la clase medial.
En el ejemplo 3.7, la mediala es M=l 30+4' 86= 134' 86.
Al no ser iguales las unidades de medida utilizadas, las calificaciones de los can
didatos no son comparables.
Debemos, por lo tanto, transformar las calificaciones, pasándolas a una escala
común de modo que las transformadas tengan la misma media y la misma desviación
típica.
Si a las calificaciones originales les restamos su media y dividimos por su desvia
ción típica, se transforman ambas en otras de media cero y desviación típica 1 .
Las calificaciones de nuestros dos candidatos son ahora:
X,-X, 55-45 10
ft 2 2
Como estas nuevas calificaciones tienen una distribución de media cero, observa
mos que las dos están por encima de la media y asimismo, al ser la desviación típi
ca 1 . comprobamos que la primera calificación está 0,83 desviaciones típicas por en
cima de la media, en tanto que la segunda está solamente 0,5 desviaciones típicas por
encima de la media.
El proceso que acabamos de seguir, por el cual transformamos los valores x de
una variable en otros z, que se obtienen de restar a cada valor x de la variable su
media y dividir el valor así obtenido por la desviación típica s:
X,-X (44)
Z, =
s- — —s = I.
queda por encima o por debajo de la media de su distribución, puesto que se sabe que
ésta es igual a cero.
Además, al ser la desviación típica igual a 1, nos indica cuántas desviaciones
típicas está por encima o por debajo de la media.
Las puntuaciones tipificadas poseen la gran ventaja de que la distribución normal
N(0,1 ) está tabulada y es sencilla de manejar e interpretar.
Sin embargo, el investigador debe comunicar los resultados por él obtenidos y
hacerlos inteligibles a personas no versadas, como puede ser el caso del profesor que
quiere facilitar las calificaciones de sus alumnos a los padres de éstos. Seguramente
algún padre no entenderá que una calificación de cero indica que su hijo está en la
media del curso, ni sabrá interpretar una calificación negativa.
Por este motivo, se han diseñado otras calificaciones de interpretación más fácil.
3.8.1. Puntuaciones T
T = 10Z + 50 (45)
Las puntuaciones SAT siguen, por lo tanto, una distribución de media 500 y
desviación típica 100. Así, una puntuación Z=l se transforma en una puntuación
SAT= 1 OOx 1 +500=600, lo que significa que está por encima de la media (500) y a una
distancia de la misma de una desviación típica.
III
-'iVfjá?'"
c~ (49)
m"2 = mi
' 12
(50)
2 240
Ejemplo 3.8
A) Sin corrección:
m2=49'8584 y m=5204' 1006.
B) Corregidos:
m\=49'8584-3=46'8384;
m' =5204' 1006-397'0912+37'8=4344'8094.
3.1. En el ejercicio 2.6, teníamos las calificaciones obtenidas por 1300 alumnos en las
pruebas de acceso a la universidad, que se evaluaron de 0 a 100 puntos:
114
Puntuaciones 17-24 25-32 33-40 41-48 49-56 57-64 65-72 73-80 81-88 89-96
V alumnos 18 66 132 216 425 212 117 90 I8 6
X1 1 2 3 4 5 6 7 8 9
"l
4 8 5 6 4 9 3 2 2
3.3. Los beneficios repartidos por una empresa aparecen reflejados en la siguiente
tabla:
Cantidad (millares) 3540 4045 45-50 50-55 55-60 6065 65-70 7075
N° de empleados 8 9 18 25 28 12 14 6
Calificaciones 3.54 44'5 4'5-5 5.5'5 5.5.6 6#5 6'5-7 7-75 T5-8 8-8'5 8'5-9 9-9'5
V alumnos 6 10 31 38 63 70 41 20 15 8 6 5
X. 3 4 5 6 7 8 9
"i
3 5 9 8 6 6 4
115
3.6. Hallar los cuatro primeros momentos respecto al origen de la distribución del
ejercicio 2. 1 1 del capítulo 2.
3.7. La talla (en metros) de 200 reclutas está recogida en la siguiente tabla
3.8. Las gratificaciones que han percibido los empleados de una compañía están refle
jadas en la siguiente tabla, expresadas en miles de pesetas:
t
3540 4045 45-50 50-55 55-60 60-65 65-70 70-75
a i
80 111 130 166 100 78 40 19
3.10. Calcular los cuatro primeros momentos centrales de la distribución del ejercicio
2.2 del capítulo 2.
3.1 1. Las puntuaciones obtenidas en un test de visión espacial realizado a dos grupos
de alumnos de tercero de Bachillerato en dos institutos de Toledo han sido:
Puntuaciones <20 21-15 26-30 31-35 36-40 41-45 46-50 51-55 >56
Instituto A 1 8 4 6 13 3 1 0
Instituto B 0 3 4 12 4 7 4 2 i
Ciudad A Ciudad B
Calificación N° de alumnos Calificación N° de alumnos
4 16 7
5 8 4 20
6 22 5 8
7 6 6 10
8 12 7 10
9 7 8 8
Total 71 63
3.14. Se ha medido la cantidad de litros de leche que da diariamente una vaca de una
determinada raza durante un período de 15 días, obteniéndose los siguientes resulta
dos:
20'5 12*6 23'8 19'2 16'4 15 21 18'3 22 17'4 18 18'6 9 172 19'4
1) Calcular la media, la varianza y la desviación típica. 2) Hallar el recorrido
intercuartílico y el recorrido semiintercuartílico.
20 17 10 6 15 9 13 10 8 21 18 27 12 31 6
17 5 24 29 11 7 8 20 16 31 15 12 21 24 16
3.16. Se han realizado diez mediciones del diámetro de un émbolo, obteniéndose las
siguientes medidas:
3'97 3'87 3'99 4'05 4'06 4'01 4'01 3'89 3'97 3'99
117
Hallar los cuatro primeros momentos respecto al origen y los coeficientes de asi
metría de Fisher y de Pearson.
Propiedad I La varianza de y = x¡ / d es
k ( ,. -v
[xx l "
X(-v,-y//í, X7--7 n, -fZix,-xfm ,
/=/ , = i\<> ") - d~ ¡,¡ '- 2
si N N N ~ d2 Sx
N N
Propiedad II: La varianza de y =x+k es
j k j k j k
si = — Xí y¡ - y fn¡= 77XU, - k -x+k)2n¡= — Xí x, - x fn¡= si
¿jx*n¡ ¿¿x2n¡
c~ - 2cx+ x~ . = (c -x )' + .
N N
k k k
Hemos señalado que la media es una medida muy sensible a cambios en los
extremos. En general, siempre que un conjunto de datos estadísticos presente alguna
anomalía o haya motivos para creer que su distribución se aparta de la normal, se
deben utilizar características que ofrezcan una mayor resistencia.
Se dice que una característica es «resistente» cuando es afectada mínimamente
por la presencia de datos anómalos (alejados de los valores centrales).
La mediana, M , es el índice de localización principal en las nuevas técnicas.
El valor d(M,) señala la distancia de la mediana a los valores extremos, que. en
principio y según la definición establecida en el capítulo 2, viene determinada por:
/
d(M,¡)=-(N + l) (1)
Este índice recoge el 50# de los valores centrales de la distribución de los datos,
eliminando así la influencia de valores extremos.
4.3.2. Trimedia
(3)
2 4
En el numerador aparece la suma de todos los datos comprendidos entre los dos
cuartiles, y en el denominador el número C de tales datos.
Al evaluar la centrimedia, no se deben de tener en cuenta los datos repetidos,
procurando, en todo caso, que el número de valores repetidos que se suprimen sea el
mismo a ambos lados.
Estudiando la posición relativa de la media aritmética y de la centrimedia, se
puede detectar la presencia o no de simetría. Se sabe que un valor de la centrimedia
superior a la media aritmética denota un sesgo hacia la izquierda.
Ejemplo 4.1
Se trata de evaluar los índices que acabamos de introducir para la serie de datos
que constituyen los pesos de 20 jóvenes:
123
39 42 36 34 43 42 45 52 54 37 44 72 33 49 56 62 63 44 44 47
33 34 36 37 39 42 42 43 44 44 44 45 47 49 52 54 56 62 63 72
R./2 Q,-Q,
CVe = .7.
Q "Q., + Q,
Su interpretación es la siguiente:
Si H^O, la distribución es simétrica.
Si H^O, hay asimetría positiva.
Si H <0, hay asimetría negativa.
125
El índice de Kelly hace uso del 80% de los datos. Se define como:
Cío + CiR,
H2 = M,¡ (9)
Cw+Cw-2Mi
H,= (10)
2 M¿
Se interpreta del mismo modo que el índice de Yule.
Entre los diversos índices para el estudio del apuntamiento, el más interesante es
el índice K. que se define a partir de los centiles de orden 10 y 90 y de los cuartiles:
K= (11)
¡'9(Q,-Q,)
Ejemplo 4.2
Veamos cuáles son los valores de los índices de forma correspondientes a los
datos del ejemplo 4. 1 :
1) Indice de simetría de Yule:
Q,+ Qi-2MJ 40^+53-2x44
2 Md 2\44
lo que indica un insignificante sesgo hacia la derecha.
2) Indice de simetría de Kelly:
Cw+C^^Mj 34 + 63-2x44
Hi = ~ ~ ~~ = O'IO
2M,, 2x44
que confirma el resultado anterior.
3) Indice de curtosis:
C yfí - C /o 63-34
K= 1'22
1'9(QrQ,) 1'9(53-40'5)
luego la curva es leptocúrtica.
126
Uno de los métodos más ingeniosos que surge del análisis exploratorio de Tukey
es el «diagrama de tronco y hojas». Se trata de una mezcla entre histograma y tabla
de frecuencias, que permite hacer un análisis transversal detallado de los datos. Se
complementa con el gráfico en caja y extensión, cuyo diseño es de menor precisión.
El enfoque transversal permite , una vez ordenados los datos, seleccionar mejor
la representatividad de los intervalos de clase.
Para describirlo, nos vamos a servir del siguiente ejemplo:
Ejemplo 4.3
545 580 526 503 573 501 606 641 623 705 391 422 365 343 437
428 453 452 526 112 445 726 338 497 563 625 639 451 446 873
536 652 561 734 542 586 573 492 740 920 647 433 565 329 525
columna central ordenada desde el tronco más bajo al más alto, incluyendo todos los
valores intermedios, aunque no formen parte de ningún dato.
La rama que contiene a la mediana (índice fundamental en los métodos
exploratorios), se resalta en uno de los márgenes de la tabla (la primera columna,
habitualmente). Esta columna se denomina «columna de frecuencias», y, en ella se
sitúan las frecuencias acumuladas, pero sumándolas en un doble sentido, comenzan
do por ambos extremos hasta llegar a la fila en que se encuentra la mediana, en cuyo
lugar se pone el valor de la frecuencia absoluta correspondiente a su rama entre
paréntesis.
De este modo, se consigue destacar la rama que divide a la población en dos
partes iguales.
La suma de la frecuencia de la rama que contiene a la mediana y de los dos
valores contiguos en la columna de frecuencias es igual al número N de datos, lo que
puede ser útil como elemento comprobatorio de que no se ha olvidado ningún valor.
La columna de frecuencias facilita el cálculo de la «profundidad» de cada dato.
La «profundidad» de un dato es su distancia al extremo más próximo.
El diagrama de tronco y hojas correspondiente a los datos del ejemplo 4.3 podría
ser entonces:
1 1 1
1 2
6 3 2 3469
17 4 22 3 3445 5 99
(15) 5 00222 3 446667788
13 6 0222444 5 6
4 7 02
2 8 7
1 1* 1
1 lo
1 2*
1 2o
4 3* 43 2
6 3o 96
12 4* 2 3 2443
17 4o 55959
(8) 5* 42002342
20 5o 8766876
13 6* 042 234
7 6o 5
6 7* 02 34
2 7o
2 8*
2 8o 7
1 9* 2
Este último gráfico nos muestra mejor las lagunas que hay entre los troncos 1 y
3 y del 7* al 8o. También se aprecia que el 6 es un valor poco frecuente y la
presencia de datos alejados en ambos extremos.
El número de ramas que se elige está en función de la forma de los propios datos,
por lo que no se siguen las normas de la elección del número de clases que vimos en
el capitulo 1. Dentro de la flexibilidad que hay, uno de los criterios más extendido
consiste en seleccionar un máximo de L ramas, que en función del número N de
datos, es:
(12)
L = 2-JÑ, si /V < 100
BAJOS 1 112
4 3* 2 34
6 3o 69
12 4* 223344
17 4o 5 5 599
(8) 5* 00222344
20 5o 6667 7 8 8
13 6* 0 2 2 3 44
7 6o 5
6 1* 0234
2 7o
2 8*
2 8o 7
ALTOS 1 920
N=45 JNIDAD== 100 3ol6=360-369
Hasta ahora hemos venido trabajando con la mediana y los cuartiles. Sin embar
go, los métodos exploratorios suelen utilizar otros índices, los «cuartos» y los
«octavos»; incluso la mediana se determina siguiendo otro criterio cuando el número
de datos es par.
El criterio que se sigue para determinar la mediana es:
A) Si el número N de datos es par, se toma como valor de la mediana, M ,, el valor
de la variable que ocupa, en la serie de datos ordenada, el lugar 1/2 (N+l) - 1/2, que
representamos por d(M )':
/ /
(1(M.l)=-(N + 1)-- (14)
d(M,)=-(N + l) (15)
d(H)=-{d(Mj)+l) (16)
nos indica la posición de cada cuarto con respecto al extremo más cercano.
Aunque no siempre coinciden, se pueden utilizar, en su lugar, los cuartiles, ya
que, en la práctica, la diferencia no es substancial.
También se suele dividir cada cuarto en dos partes iguales, obteniéndose dos
nuevos índices: «octavo inferior(E) y superior(EJ».
El «octavo inferior» es, por tanto, el valor de la variable que, situado por debajo
del primer cuarto, tiene una profundidad igual a la parte entera de 1/2 (d (H ) +1),
1 De esta forma, la mediana siempre coincide con uno de los datos, lo que resulta razonable cuando se
trabaja con variables discretas.
131
mientras que el «octavo superior» es el valor de la variable que. situado por encima
del cuarto superior, tiene una profundidad igual a la parte entera de 1/2 (d (H ) +1). La
distancia. d(E). de los octavos al extremo más próximo es
d(E)=-{d(H)+l) (17)
Ejemplo 4.4
H1 = 39 Hs = 54
y. " ttri=44 E =62
1 S
Sucede que, si comparamos la serie de datos con que trabajamos con la distribu
ción normal, la amplitud del rango intercuartos debe ser igual a 1'5 veces la
desviación típica.
Entonces, si consideramos un intervalo formado añadiendo a cada uno de los
extremos del intervalo intercuartos la extensión 1'5 . IQR, el nuevo intervalo cubrirá
todos los valores de la población salvo el 7% de los mismos, dejando un 3'5% en
cada uno de los extremos.
A los valores que quedan fuera de dicho intervalo se les denomina «exteriores».
Los valores más alejados del centro, pero todavía interiores, son denominados
«adyacentes».
Se distinguen dos tipos de valores exteriores: «alejados» y «remotos». Para
definirlos con precisión, se introducen dos pares de límites llamados «limites inter
nos», que distan un «paso» de los cuartos, y «límites externos», que distan 2
«pasos» de los cuartos.
Entonces los límites internos inferioriL) y superior(LJ se obtienen de restar y
sumar un paso a cada uno de los cuartos inferior y superior, respectivamente:
Los valores de la variable que caen en el espacio comprendido entre los límites
internos y los externos, se consideran datos «alejados», y aquellos que sobrepasan
los límites extemos se consideran datos «remotos».
Las fronteras para determinar los datos anómalos se han establecido comparando
estos intervalos con los correspondientes a la normal, de modo que la probabilidad
de que aparezca un dato remoto es inferior a CT00698.
133
* remotos
O alejados
..... adyacentes. 2 P
1' 5 P
11.
"d Paso
H ,
1' 5 P
adyacentes
2 P
O alejados
* remotos
Una caja rectangular forma el núcleo del gráfico. Para construirla, se toman
sobre una recta vertical u horizontal, según la posición que se quiera dar al gráfico,
divisiones que abarquen el rango de la distribución.
Se marcan los cuartos y la mediana mediante tres segmentos paralelos con las
medidas que proporciona la tabla de letras-índices. Uniendo sus extremos por dos
segmentos paralelos, queda determinada la caja, que abarca el 50% de los datos. Del
punto medio de ambos costados de la caja salen dos segmentos rectilíneos («exten
siones» o «patillas»), cuya longitud máxima es 1'5 pasos.
Los extremos de las patillas coinciden con los datos «adyacentes». La longitud
máxima será nula cuando el dato «adyacente» coincida con el cuarto correspondien
te. Más allá de las extensiones se encuentran los datos «alejados» en una zona que
va desde los límites internos hasta los límites externos; se representan por el
símbolo «o».
Los datos remotos son los que caen fuera de los límites externos, y se representan
por un «*».
El gráfico en caja y extensión proporciona:
1) La «mediana» (segmento interior a la caja), que nos da una idea de la
localización de los valores centrales.
2) La «dispersión» (facilitada por la posición de los cuartos).
3) La «simetría central» (detectada por la posición de la mediana respecto de los
cuartos).
4) La «simetría de los extremos» (puesta de manifiesto por la longitud de las
extensiones).
5) El «apuntamiento» (relación entre la longitud de la caja y las extensiones).
6) Los «datos anómalos», (situados fuera de los límites internos).
Ejemplo 4.5
Calificaciones 12 4 5 6 7 8
N" de alumnos 112 7 7 8 5
BAJOS 1 10
N-31 2 2 0
P(«d) = 16
tld = 6 2 3
H1=S Hs^7 H= 6 4 4 00
p(H)=8 E =4 E =B ~
i 1 E= 6 11 5 0000000
P(E)=3 L ^2 L =8
i s (7) 6 0000000
13 7 00000000
5 8 00000
4. 1 1 . Transformaciones de datos
4. 1 1 . 1 . Transformaciones de potencias
p: 2, 3
Cuando p=0, la transformación es T(x)=log(x).
Estas transformaciones se deben de realizar sobre los datos originales, no sobre
los datos tipificados. En otro caso, la transformación afectaría a los índices de
tendencia central y a la propia forma, y nos encontraríamos con valores negativos
que podrían no tener imagen.
Sin embargo, a veces se dan este tipo de valores en los datos originales, en cuyo
caso será conveniente realizar un cambio de origen antes de aplicar la transforma
ción de potencia.
Para saber cuál es el valor de la potencia más adecuado, una manera de proceder
consiste en ensayar varias transformaciones y calcular los nuevos promedios de cada
serie de datos transformados, eligiendo aquella que dé unos promedios más precisos
entre sí. Existen otros métodos menos laboriosos, como puede ser el de la pendiente,
que exponemos seguidamente.
138
(27)
1-m (28)
Ejemplo 4.6
12 16 20 25 30 35 38 40 45 50 57 65 74 76 90
Mj = 40.Ü = 45, E = 46
que cumplen la relación:
Mj < H < E
lo que indica un sesgo hacia la derecha, luego debe de ser p<1. Apliquemos ahora el
método de las pendientes para determinar el mejor valor de p. La siguiente tabla
recoge un resumen de los resultados:
X, x5 UJ vi m.i
H 25 65 5,3 5 0.94
1 16 76 11.7 6 0.51
3'46 4 4'47 5 5"47 5'91 6" 16 6'32 6'7 7'07 7'54 8'06 8'6 8'71 9'48
Los datos transformados proporcionan unos promedios más próximos entre sí:
M.i = 6'32/H = 6'53,~E = 635
lo cual es señal de que la nueva serie de datos tiene menos sesgo. Podemos compro
bar este resultado trazando los diagramas de tronco y hojas correspondientes a las
dos series de datos (los situamos «espalda contra espalda» para compararlos mejor):
(28)
Ejemplo 4.7
Los histogramas para los datos del enunciado y para sus imágenes por una
transformación de raíz cuadrada pueden apreciarse en las figuras 4.6 y 4.7.
11U
90 2
1'5 H
50
30
4.1 Determinar la mediana, los cuartos, los octavos y los límites externos para la
serie de datos:
55 45 29 45 16 28 71 36 92 63 10 11 26 18 32 91 26 18 32 91 26 27 73 31 26
4.2. Construir el diagrama de tronco y hojas para los datos del ejercicio 4.1.
98 120 130 95 100 110 97 125 128 97 94 105 101 99 90 100 102 93 102
70 220 205 360 410 800 920 980 770 420 196 190 145 95 350 400
4.5. Se ha realizado una encuesta para averiguar el número de personas que convi
ven en una misma vivienda de un barrio de determinada ciudad, obteniéndose los
resultados:
N° de personas 1 2 3 4 5 6 7 8
Frecuencias 10 25 56 15 10 8 3 1
18 13 18 19 16 17 14 17 16 15 16 17 14 14 16 13 15 16 13 16 18 18 12 19 12 16 18 16 16
404 326 125 65 89 326 145 190 63 109 320 208 190 216 314 60 92 185 280 143
200 66 189 218 63 313 216 180 204 324 109 63 140 105 107 79 88 69 208 400
270 109 66 403 66 360 305 275 180 402 120 208 122 200 55 78 55 202 160 102
4.8. Preguntados por los gastos que realizan a la semana 850 adolescentes de 12 a
14 años, se han obtenido las siguientes respuestas:
4.9. Las puntuaciones obtenidas por dos grupos de alumnos en dos pruebas, una de
conocimientos (X ) y otra de capacidad de abstracción (Y) han sido:
x, 15 15 16 17 17 18 18 18 18 18 19 20 20 21 21 21 22 22 23 23 23 26 29
Y. 17 16 17 18 16 17 18 19 19 20 18 20 19 20 18 19 22 21 18 13 16 22 21
4.10. Una empresa ha decidido hacer un reajuste laboral entre sus empleados, con el
acuerdo de asignar las distintas categorías laborales en función de unos baremos
acordados con los trabajadores, de forma que:
1) Se ordena la población según la puntuación obtenida, y se divide en cuatro
partes iguales.
2) Se asignan las categorías A, B, C y D, por este orden, a los empleados que se
encuentren en cada una de las partes.
4.11. El volumen de ventas (en millones de pesetas) realizado por las veinte sucur
sales de unos grandes almacenes ha sido:
4.12. La producción de trigo y maíz obtenida en los diez últimos años por una
cooperativa agrícola (expresada en fanegas) ha sido la siguiente:
Trigo 180 195 214 217 220 253 260 300 298 306 302 298
Hallar los índices de variación cuartílica de las dos series de datos. ¿Cuál de ellas
es la más homogénea?
4.14. Las puntuaciones obtenidas por un grupo de alumnos en una prueba objetiva
han sido:
21 23 25 33 35 37 38 38 39 39 42 42 43 43 44 46 48 48 51 51 52 54 54 55
55 56 58 61 61 61 62 64 65 66 68 68 70 70 70 70 70 70 70 70 71 72 72 73
74 74 75 76 76 76 77 80 81 86 91 92 93 94 94 95 95 98 98 99
4.15. Se han tomado dos muestras de 180 familias para hacer un estudio de las
declaraciones sobre la renta en dos provincias (A y B) de una comunidad autónoma,
obteniéndose los siguientes resultados:
144
Renta sobre limo ptas. (0,10) [10.20)[20,30) [30.40) [40.50) [50.60) [60,70) [70,80) (80.90)
N° familias de A 18 35 43 29 18 10 12 6 9
N" familias de B 12 30 53 39 15 14 9 6 2
Los individuos de una población pueden ser clasificados atendiendo a dos carac
teres simultáneamente. Así, puede hacerse un estudio de la población adulta de un
país atendiendo a dos caracteres de sus individuos, como pueden ser la talla y el
peso.
De este modo se obtiene una distribución bivariante de frecuencias, cuyos datos
pretendemos:
a) presentar mediante una tabla estadística de doble entrada;
b) definir sus distribuciones marginales;
c) definir sus distribuciones condicionadas;
d) estudiar las distintas representaciones gráficas;
e) analizar los problemas de regresión y correlación.
Los dos caracteres observados, X e Y, no tienen por qué ser del mismo tipo.
Pueden ser los dos cuantitativos, como es el caso de la talla y el peso, los dos
cualitativos, o uno cualitativo y otro cuantitativo.
La representación gráfica de una variable estadística bidimensional depende de la
naturaleza de los caracteres. Según sean los caracteres cualitativos o cuantitativos, y
éstos discretos o continuos, pueden presentarse seis alternativas.
f = ^-
Ja N (1)
£í>«=.V
=i J.\
(2)
ya que se supone que tanto las modalidades X como las modalidades Y deben ser
incompatibles y exhaustivas.
II. La suma de las frecuencias relativas extendida a todos los pares de modalidades
es igual a la unidad:
££/„=
¡-i
(3)
En efecto:
P i Pin 1 P i /
X\Y Y, Y2 \ Yq
n„ n 12 n.ii n ,iq
n 22 n 2i 2q
X,l
n„ n.,i2 n n iq
Xp n p2, n pi n pq
Para cada i, los valores n se obtienen de sumar las frecuencias absolutas de cada
l.
5.4.1.1. Propiedades
Para cada Ji, los valores n i se obtienen de sumar las frecuencias absolutas de cada
una de las columnas de la tabla, se sitúan en una fila marginal en la parte inferior de la
tabla, y definen la distribución marginal del carácter Y.
La frecuencia relativa marginal de la modalidad Y será:
/..- N (7)
5.4.2.1. Propiedades
En efecto: N
Xp n p- n pi n pq np fr
F.U.111. B.1 n n .i
ni N 1
Fxm. f, f fJ fq 1
149
(X,
n.,
X «;J
"«
X, n.¡
(¡
x, 11 ,
-,
fV
X n 'i f¡
X n f¡
p pi p
Total n 1
' n, (?)
Y \ Y2 Yi Yq Total
nu n„ n, n 'i n iq n
f¡ f; f¡ f i
fi 1
5.5. 1 . Propiedades
I. (10)
^x¡n¡ 1 p - I 1 .
si = '77 X( x¡ - x fn¡., sx = y\~Zj(x¡ - x fn¡ (12)
N N~i N~i
ty¡n., j , ryi, ~
(13)
151
Varianza de X/Y=y :
Varianza de Y/X=x :
Ejemplo 5. 1
n 15 30 30 25 100 1
f 0'15 0'30 0'30 0'25 1
Podemos observar cómo hay 1 5 jóvenes que miden entre 1 .50 y 1 ,60; 30 jóvenes
que miden de 1 .60 a 1 ,70; 30 jóvenes que miden de 1 ,70 a 1 ,80, y 25 jóvenes que miden
de 1.80 a 1,90.
Asimismo, hay 5 jóvenes que dan un peso comprendido entre 40 y 45 kilogramos;
5 jóvenes con peso entre 45 y 50. etc.
La media de los pesos es:
1 4, , 12206 i
« = -7^Jx,-63,7 y>t, = -77—- = 122,06; s, = -J122,06 = 11,04
100 ~; 100
1.027
t*lñti(yr1'715fn> 100
0.0102; ív = y/0,0102 =0.10
Veamos ahora cuál es la distribución de los pesos (variable X). pero únicamente de los
jóvenes que miden de 1,60 a 1,70. Se trata de la distribución de la variable X condicio
nada por Y=1.65, que vendrá dada por la siguiente tabla:
153
f Y=I,65
"i V.i* i
40-45 2 0,066
45 - 50 2 0.066
50-55 4 0,133
55-60 7 0,233
60-65 6 0.200
65-70 3 0.100
70 - 75 2 0,066
75-80 2 0.066
80-85 2 0,066
30 1
La distribución de las estaturas (variable Y), pero sólo de los jóvenes que pesan
de 70 a 75 Kilogramos, es decir, la distribución de Y condicionada por X=72,5 vendrá
dada por la tabla:
5.7.1. Independencia
i i i i.
Luego
lo que significa que Y/X tiene la misma distribución que Y, para todo i. Luego Y es
independiente de X, c.q.d.
La proposición 5.2 nos dice que «siempre que un carácter X sea independiente de
155
otro carácter Y, lo será Y de X». Por ello, se dice que los dos caracteres son indepen
dientes.
Ejemplo 5.2
\' y, y2 y, ?4 y, n,
A
«i
2 í 5 4 i 15
x, 6 9 15 12 3 45
X, 4 6 10 8 2 30
X4 8 12 20 16 4 60
n.o 20 30 50 40 10 150
Basta con observar cómo las frecuencias absolutas de cada modalidad son pro
porcionales entre sí y a las frecuencias absolutas marginales; en otras palabras, las
filas son proporcionales entre sí, y también lo son las columnas.
5.7.2. Dependencia
Ejemplo 5.3
Edad Esposo 25 26 27 28 29
Edad Mujer
19 150 0 0 0 0
20 0 280 0 0 0
21 0 0 320 0 0
22 0 0 0 440 0
23 0 0 0 0 410
Es evidente que hay una relación funcional entre las edades de marido y mujer:
cada hombre está casado con una mujer 6 años más joven.
Ejemplo 5.4
En una ciudad próxima a la del ejemplo anterior, al analizar las edades de marido y
mujer entre sus 1500 matrimonios, se obtuvieron los siguientes resultados:
Ejemplo 5.5
En una tercera ciudad, menos hipotética que las anteriores, al comparar las edades
157
entre marido y mujer de 7500 matrimonios jóvenes, se obtuvieron los siguientes resul
tados:
En esta última ciudad no hay dependencia funcional entre las edades de esposo y
esposa. No obstante, puede existir una cierta relación de dependencia entre ambas
edades, relación que será estudiada en el capítulo 6.
5.8. Momentos
-c/(y. -dfn,i
Mr (c,d) ■- (17)
N
Tienen interés los momentos que se obtienen cuando el par (c,d) es el par formado
por las medias marginales o el par formado por las coordenadas (0,0) del origen.
(19)
158
p i p i
ZMx,-xf(y¡-yfnv ¿,¿t(xi-x?nv
¡.i ¡.i MJ.l
mx-
N N
p i
Y.yL(x,-xf(yryfn¡¡ p t
z,L(y¡-yfn,
1=1 ¡=1 2
m¡2 -
N N
5.8.4. Proiriedades
1 p - l V
I. x = —£*,«, (20)
11. 1 Y 2 1 * (21)
La propiedad III nos permite obtener las varianzas marginales de modo más senci
llo a partir de los momentos respecto al origen.
Ejemplo 5.6
M 3344445555566667777888899
F 4644564566756776889789 10 9 10
Solución:
M\F 4 5 6 7 8 9 10 Total
3 1 0 1 0 0 0 0 2
4 2 1 1 0 0 0 0 4
5 1 1 2 1 0 0 0 5
6 0 1 1 2 0 0 0 4
7 0 0 0 0 2 1 0 4
8 0 0 0 1 1 2 1 4
9 0 0 0 0 1 1 0 2
Total 4 3 5 4 4 3 1 25
3 2 6 9 18
4 4 16 16 64
5 5 25 2=¡ 125
6 4 24 36 144
7 4 28 49 196
8 4 32 64 256
9 2 18 81 162
25 149 965
160
— 149
M = a,„ = — = 5,96
965
a2o = ^r = 38,6
s„ = J3,0784 =1,7545
171
F= a„, = — = 6,84
1265
Om = -zj- = 50,6
5.8.5. Covarianza
Esta propiedad nos indica que la covarianza es la media del producto de las varia
bles menos el producto de las medias.
Ejemplo 5.7
v, v,
an =¿^¿_M /
F,n„ = —(4x3x1 7026 = 41,04
+ 6x3xl+. .. + 10x10x1) = ——
25 25
hacer una agrupación en clases, éstas serían muy poco numerosas y de gran ampli
tud, por lo que los cálculos resultarían poco precisos.
En estas situaciones, se estudian los pares de valores (xi,y,). donde i recorre los N
individuos de la población, considerando la frecuencia absoluta de cada par igual a la
unidad. De esta forma, las medias y varianzas marginales vienen dadas por:
~x=iÍx-~y=ity, (24)
V(X)=j¿t(x,-x? V(Y)-—tAyryf (25)
y la covarianza por:
1 N
mu = —?,(x,-x)(y,-y) (26)
« * i= 1
Ejemplo 5.8
La tabla adjunta representa los pesos y las alturas de los 12 estudiantes de una
clase:
p 71 72 72 73 73 75 75 75 76 76 76 77
F 166 1"68 1'68 T69 T68 T68 170 170 173 173 175 177
Solución:
- 1 % 891
1 ) Peso medio: P = — X P, = ~TT = 74,25
12 i=¡ 12
- 1 & 20.45
2) Altura media: A = — ^A, = —— = 1.7041
12,-¡ 12
1 ,66; 1 ,68; 1 ,68: 1 ,68; 1 ,68; 1 .69; 1 ,70; 1 ,70; 1 ,73; 1 ,73; 1 ,75; 1 ,77
Como el número de valores es par, la altura mediana será la media aritmética de los
dos valores centrales:
1.69 + 1.70
M,, = ~ = 7.695
163
Las alternativas que pueden presentarse según sea la naturaleza de los caracteres
son:
a) los dos caracteres son cualitativos;
b) X es cualitativo e Y cuantitativo discreto;
c) X es cualitativo e Y cuantitativo continuo;
d) X e Y son cuantitativos discretos;
e) X e Y son cuantitativos continuos;
f) X es cuantitativo discreto e Y cuantitativo continuo.
Por otra parte, al hacer la representación gráfica de una variable bidimensional,
podemos pretender:
i) mostrar la distribución conjunta;
ii) mostrar cada una de las distribuciones condicionadas según un carácter en
función de las modalidades del otro.
Esto da lugar a una gran variedad de representaciones gráficas, dependiendo
también su uso del campo de investigación.
Ejemplo 5.9
100
50 -
China
Carbón Petróleo Hierro Acero Todos
EE.UU. Canadá
Cuando uno de los dos caracteres, por ejemplo X, presenta únicamente dos moda
lidades, se puede utilizar un diagrama de sectores constituido por dos semicírculos de
diferente radio (uno por cada modalidad del carácter), que se elabora de acuerdo con
los siguientes criterios:
i) los radios se toman proporcionales a la raíz cuadrada de las frecuencias absolu
tas marginales del carácter dicotómico, n ;
ii) los ángulos centrales son proporcionales a las frecuencias relativas condiciona
das V.i
De este modo, se consiguen dos semicírculos de diferente radio, cada uno de los
cuales corresponde a una de las dos modalidades del carácter dicotómico.
Las áreas de los sectores serán, por tanto, proporcionales a las frecuencias abso
lutas de la distribución conjunta, n , ya que el área del sector es proporcional a la
amplitud del ángulo por el cuadrado del radio:
Ejemplo 5.10
Consideremos la distribución, por razón del sexo y estado civil, de las personas de
40 a 50 años residentes en el año 1990 en una pequeña ciudad, según describe la
siguiente tabla:
Los radios de los semicírculos deben ser proporcionales a las frecuencias absolu
tas: 7965 y 7265.
Necesitamos, para determinar los ángulos centrales, las distribuciones condiciona
das acumuladas según el estado civil para las dos modalidades (mujeres y hombres)
del carácter dicotómico:
Varones(7265) Soiteros
Divorciados
1tujere5(7965)
Ejemplo 5.11
La siguiente tabla contiene la distribución del número de hijos por familia según la
clase social a que pertenecen:
C1\N°H 1 2 3 4 5 Total
Baja 45826 61200 31324 7150 803 146403
Media 35456 32124 28425 5322 1165 102492
Me-Alta 34625 38246 25430 5224 976 104492
Alta 15260 14916 8241 1280 324 40021
Total 131167 146486 93430 19076 3259 15230
168
CI\N" H 1 2 3 4 5
Baja 313 73' 1 94'5 99"5 100
Media 34'6 66'0 937 98'9 100
Mi- Mía 33'2 69"8 94'2 99'2 100
Uta 38' 1 75'4 %'8 98"0 100
Total 33'4 70'6 94.4 99'2 100
Las cuatro primeras filas nos proporcionan las alturas acumuladas de los rectán
gulos que corresponden a las distribuciones condicionadas según el número de hijos,
en tanto que una quinta fila contiene los datos globales.
En la figura 5.4 puede apreciarse su representación. La quinta pila de rectángulos
corresponde a la distribución conjunta.
ido -i
zz
,¡),
en
4 hijos
50 -
3 hijos
h1 jos
1 hi jo
C1WH 1 2 3 4 5 Total
Baja 34'9 41'8 33'6 38'0 24'6 379
Media 62'0 637 64' 1 65'9 60'6 63' 1
Me-Alta 88'4 89'8 91 '3 96'3 90' 1 89'9
Alta 100 100 100 100 100 100
2 3 4 5"
Ejemplo 5. 12
MVCN 4 5 6 7 8 9 10 Total
2 2 3 1 0 0 0 0 6
3 3 5 4 2 2 1 0 7
4 3 5 4 2 2 1 0 17
5 4 4 4 4 2 2 0 20
6 5 4 4 5 3 2 1 24
7 2 2 3 2 4 2 0 15
8 1 1 0 2 2 1 1 8
9 0 0 1 1 0 0 1 3
Total 19 22 18 17 13 8 3 100
Ejemplo 5.13
M\CN 11 12 13 14 Total
130-140 0 1 0 0 1
140-150 3 1 0 1 9
150-160 7 10 12 6 35
160-170 3 12 15 5 35
170-180 0 2 5 3 10
Total 13 27 35 15 100
172
Ejemplo 5.14
La siguiente tabla recoge las alturas y los pesos de 470 jóvenes de una de las
provincias de Castilla-La Mancha:
173
Por ser las frecuencias múltiplos de 10 o valores muy próximos a un múltiplo de 10,
vamos a tomar este valor como razón de la proporcionalidad. Así, para representar
una frecuencia absoluta de 60. dibujaremos 6 puntos.
5.13.3.2. Estereograma
f'' y el volumen a b ——
f = /-.
ab ' ' «A "
La suma de los volúmenes de todos los paralelepípedos será igual a la unidad, ya
que
/.=,
126
íee
uo
f,0
40
¿O
Ejemplo 5.15
La siguiente tabla recoge los pesos y las alturas de 12 jóvenes de 16 años, cuyo
diagrama de dispersión puede apreciarse en la figura 5.10.
(X) 45 53 57 61 67 63 49 54 61 53 49 60
(Y) 165 172 166 174 159 180 169 177 183 180 169 175
195
+ +
175
155
-i i i i i i i i—r~
40 50 60 70 80
X\Y 100 50 25
14 1 1
18 2 3 —
22 — 1 2
5.3. Poner un ejemplo de variable estadística bidimensional (X,Y), en que las variables
X e Y sean independientes, y otro en que sean dependientes.
X\Y 11 12 13 14 17 18
8 8
9 32 8
10 2
11 10
15 40
5.5. La siguiente tabla de doble entrada contiene las frecuencias absolutas de la distri
bución conjunta de las variables estadísticas X e Y. ¿Son independientes X e Y?
¿Cómo debería ser la tabla para que fueran independientes?
X\Y Y1 Y2 Ym i
2 3 4
x2 5 15 10
5.6. Determinar, para la distribución del ejercicio 4.1, los siguientes momentos respecto
al origen:
5.7. La siguiente tabla contiene los pesos y las alturas de 20 jugadores de un equipo
de fútbol:
Peso (X) 73 76 80 73 78 82
Altura (Y) 1'65 1'68 1'76 170 172 176
N° de jugadores 4 3 4 2 5 2
5.8. Los ingresos totales (I) de 10 familias y los gastos en transporte (T) durante el
último mes han sido:
177
T 3 5 10 9 11 11 12 8 7 7
5.9. Las calificaciones de 15 alumnos en el primero (X) y segundo (Y) examen parcial
de Estadística son:
X 647845678566537
Y 567 10 64975867837
AvanceVEdad 7 8 9 10 11 12 13 14
10- 16 3 2 1
17-23 6 5 2
24-30 1 10 2 1 3 1 2
31-37 ! 2 2 9 4 3 2 1
38-44 1 3 5 4 9 4 2
45-51 2 2 6 9 7 5 1
52-58 2 3 10 6 1
5.1 1. Para los datos del ejercicio 5.10, hallar las varianzas marginales y la covarianza.
5.12. La siguiente tabla recoge el espacio (en metros) recorrido por un coche desde que
el conductor pisa el freno hasta que se detiene, para distintas velocidades (en km./h.):
Velocidad 20 30 40 50 60 70
Distancia 18 29 46 67 98 132
5.13. Se sabe que los caracteres X e Y de los 50 individuos de una población son
independientes. Si X presenta 4 modalidades e Y seis, construir una tabla en la que
aparezca claramente la independencia de ambos caracteres.
5.14. Los pesos y las alturas de 290 hombres están recogidos en la siguiente tabla:
50-55 .> 1
55-60 7 8 4 2
60-65 5 15 22 7 1
65-70 2 12 63 1l) 5
70-75 7 28 12 12
75-80 2 10 2() 7
80-85 ll 4 2
X 0 1 2 3 4 5 6 7 8 9
Y 62 43 6.4 8.4 8.6 12.1 11,3 12.9 13.7 14.1
5.16. La siguiente tabla recoge las edades en que se han casado 20 parejas:
Edad Mujer 25 18 21 29 24 19 23 27 25 23 24 30 19 17 26 20 25 28 27 21
Edad Esposo 28 13 22302722222625 24 25292225262427262725
5.17. Hacer una representación gráfica de la distribución conjunta del ejercicio 5.10, y
representar también el avance de la capacidad psicomotora en función de las edades.
179
5.18. La siguiente tabla contiene los pesos y las alturas de los alumnos de una clase:
Pesos (X) 73 76 78 82 80 73
5.19. La siguiente tabla contiene la distribución de 270 familias de una ciudad según
los gastos (X) mensuales totales (en miles de ptas.) y los gastos (Y) que habitualmen-
te dedican a cosas superfluas (en miles de ptas.):
5.20. La producción (X) de trigo, maíz, arroz y mijo en los países de Francia, Australia,
EE.UU. y China (en miles de toneladas) en 1990 viene recogida en la siguiente tabla:
Apéndice al capítulo 5:
Demostración de las propiedades de las frecuencias condicionadas y de los momentos
I. Demostración de (10):
p . p n J p 1
Lfí = L— = — Z"« = —ni = 1
i.i i.i nl ni i.i n,
i i n; 1 1 l
y ¿,fi = X— = ~ S"« = ~~ «i. = i
i.i i.i n, n, i.i n,
II. Demostración de (1 1):
1 p i l p l/ l p i 1 p
x = — xx^yj"./ = ttXX*»* = T7X*Zn« = ttS^«/
'» i.1 J.l « , = ;/=/ A, ,./ i-i A" 1 = /
I P i l P i J i P J i
y = -TfLLrfyinv = ttXIv,«v = -¡¿LyiLnv = — 5>/«.;
l p ¡ 1 p i i p i ¡ p
V. Demostración de (22):
y p i ~ 1 p i
«20 = TtXXf*. - * )V y/ - y )"n„ = — YSL(x, - x fn„ =
« i.l i.i N ,=/ i.2
1 ,' •- 1 p i i » j 1 p i
= ..IX(r --ri +x )», =-:IXx»,r ;,-,'XI,l;"» + TT> SX»« =
<»,=//=/ N i., l-i A. /=//=/ A1 ,./>/
= a 20 - 2 x2 + x2 = a20 - x2 = a» - a/o
181
] p i i r i
mo2 = —'Z^(x,-x f(y¡-y fn„ = — XXí .v, - y fn¡¡ .
N ,.i¡.i N ¡.i
l r i 1 .,,
= T:ÍX(yr2yy,+
/> ,./ /./
y"M, = — £5».,-—
¡y i.i i,i n
2y££y,«,+—
¡.i i.i ¡y
v",II«.-
,.i ¡.i
=
(*) mu = ai r aioOoi
Ahora bien:
YHéxiy¡n«
m ,-i
a,, .
N
y, al ser independientes X e Y, en virtud de la proposición 5.2, es
n, n,
l p i i p \( 1 4 K
= ~¿Hx,y' n,n,
N ainam
mu =an-aioam=amaoraioam = 0, c.q.d.
CAPITULO 6
REGRESIÓN Y CORRELACIÓN
1 El término regresión, que hoy usamos con un sentido de «relación» entre variables estadís
ticas, tiene su origen en un estudio que publicó Francis Galton en 1886. en el que. analizando la
estatura media de los esposos y la estatura media de los hijos, llegó a la conclusión de que hay una
tendencia a aproximarse (regresar) a la estatura media de la población.
185
La condición necesaria para que esta expresión sea mínima es que las derivadas
parciales de primer orden respecto de cada uno de los parámetros se anulen. De esta
manera se obtiene el siguiente sistema de ecuaciones lineales, llamadas normales,
cuya resolución nos permite obtener los valores de los parámetros y, por tanto, la
expresión de la función ajustada:
ac rvl 1 « \
y =-2¿J2J[y,-f(x,.a,M: aj\n„f Ui =0
o ai
da2 ~~l J
p 1
dC
-2^^,-^x¡.01.02 on)\n,J\ = 0
da„
í V 2
C=—¿t(y,-bx,-ar (2)
Hemos de hacer mínima una función que depende de dos variables, a y b, lo cual
se consigue igualando a cero las derivadas parciales. No obstante, vamos a tratar de
determinar los parámetros a y b en el supuesto de que sólo se tengan conocimientos
sobre funciones reales de una única variable real.
Tratamos de buscar, para un valor b dado, el valor de a que hace mínimo a C.
Después determinaremos b haciendo mínimo el mínimo parcial que hayamos obtenido
previamente.
Por tanto, supuesto b fijo, la expresión C depende de a, y, si posee algún mínimo,
éste debe ser una raíz de
188
da
Ahora bien
dC 2 v 2 1 N b f
¡te* -*§*-■
= -2[y-¿x-a]
Entonces, haciendo -2[y-¿x-a] = 0, resulta \-bx-a = 0, de donde
v = bx + a (3)
Esta expresión nos dice que el punto w^ v) pertenece a la recta, es decir, la recta
de regresión de Y sobre X pasa por el centro de gravedad G de la nube de puntos P .
La expresión (3) nos dice también que el mínimo de C se obtiene para el valor
a = v - bx . El mínimo parcial obtenido será
I v - - i
m = min C = — ¿J v,-bx,- v + bx ) =
« N ¡.i
= ^I[y,-v-^x,-x)]-'
Debemos encontrar ahora el valor de b que hace mínimo a m. Para ello, debe ser b
tal que
dm
Tb-°
dm 2 .¡L, -,r - - ,
1E--^lU-4y,-y-Mx,-x})
$Ax,-x»yry)-bYAx,-xf = 0
, N 1, i mu
,¡i/*-'*
Para este valor de b, se obtiene como valor de a:
- - mu-
a = y-bx= y-—Tx
s\
Como la recta es y=bx+a, sustituyendo los valores hallados para a y b, se tiene
- mu - mu mn - -
y = y-—rx+—rx = —T(x-x)+y
r, s; rt
de donde resulta
- mn — (4)
y-y = —T(x-x)
si
2) su pendiente es b = —7-
(5)
si
(6)
I',x,y, ^^
^^ '& X ' - X
De la expresión de la recta de
regresión de X sobre Y se sigue que:
b.. =. (7)
6.4.4. Predicciones
Ejemplo 6. 1
s 2 = a - a- = 26'2-25 = 1'2
y 02 01
X Y XY X2 Y
8 4 32 64 16
8 6 48 64 36
6 3 18 36 9
6 5 30 36 25
7 4 28 49 16
8 6 48 64 36
5 4 2(1 25 16
6 4 24 36 16
7 6 42 3) 36
7 4 28 49 16
Figura 6.5: Rectas de regresión del ejemplo 6.1.
8 5 40 64 25
7 7 44 49 49 4) La covarianza es positiva, luego son positivos
8 6 48 64 36 los coeficientes de regresión, y, por tanto, las dos
6 5 30 36 25 rectas son crecientes.
8 6 48 64 36 En efecto, al ser b >0, a mayor nota en Física
IOS 75 533 749 393 corresponde mayor nota en Matemáticas.
5) Se puede predecir que un alumno con un 8 en
Matemáticas tendrá una nota de 5,57 en Física, pues:
y=5-fO'57(8-7)=5-fO'57=5'57
6.5. Correlación
(8)
En efecto, cuanto mayores sean las diferencias entre los valores observados y los
valores teóricos de la variable dependiente, menor será la intensidad de la relación
entre las variables.
Se dará una dependencia funcional cuando todos los puntos de la nube caigan
sobre la gráfica de la función ajustada, en cuyo caso la varianza residual será nula.
193
La varianza residual, como medida del grado de dependencia entre dos variables,
presenta dos inconvenientes:
1 ) La unidad de medida no permite hacer comparaciones de la dependencia entre
grupos de variables.
2) Proporciona una medida inversa del grado de intensidad entre las variables: si la
varianza residual es grande, los puntos de la nube están alejados de la curva ajustada
y, en consecuencia, la dependencia entre las variables será pequeña.
Estas dos dificultades se resuelven dividiendo la varianza residual por la varianza
marginal de la variable dependiente (Y), y restando este cociente de la unidad:
con lo cual el valor de la medida que se obtiene armoniza con el sentido de la correla
ción. A este índice de la correlación se le llama coeficiente de determinación y se le
representa por R2:
S'n
R- = 1- .').
si
Extrayendo la raíz cuadrada del coeficiente de determinación, se obtiene una medi
da adimensional, que es el coeficiente de correlación general de Pearson, al que
representamos por R:
(10)
R- iA
6.5.1.1. Propiedades del coeficiente de correlación general de Pearson
-1<R<1 (12)
Con el fin de simplificar los cálculos, vamos a suponer una vez más que la variable
estadística (X,Y) toma los N valores (xi,y,) con frecuencia 1.
Tendremos
* * -.. _. (Sny»
Yt(yl-yf-2-^Jt(x,-xHyi-y)+ ~^ It(x,-xf
Sx St Sx Sx Sx
Entonces
195
(13)
í,í,
x-x=r—(y-y) (16)
Sy
<l-l
III. ( V (18)
N^xin, - Z..x,n,
,-/ \¡.i
Ejemplo 6.2
X Y X2 Y: XY
1.60 64 2.% 4096 102.4
1,65 « 2,72 4356 108.9
1.70 (vS 2.89 4624 1 15.6
1.75 7() 3.06 4900 1 22.5
1.80 72 3.24 5184 129.6
8.50 340 14.47 13160 579
El hecho de que dos variables sean incorreladas significa que entre ellas no hay
ninguna relación de dependencia lineal, pero puede haber otro tipo de dependencia.
La relación entre dependencia y correlación la establece la siguiente proposición:
Ejemplo 6.3
Y 4 7 10 13 16 17
X
1 3 4 3 0 0 0
2 0 7 9 4 0 0
3 0 0 4 12 4 0
4 0 0 4 2 4 0
5 0 7 9 4 0 0
6 3 4 3 0 0 0
199
Y 4 7 10 13 16 17
X
1 3 4 3 0 " 0 10
2 0 7 9 4 0 0 20
3 0 0 4 12 4 0 20
4 0 0 4 2 4 0 20
5 0 7 9 4 0 0 20
6 3 4 3 0 0 0 10
6 22 32 32 8 0 100
Serán entonces:
— 350 , _, 1450
12.25 = 2,25; s, = 1,5
1042 , -, 11830
Y = ^rr = ¡0,42; s\ = am - Y' = —rz^r - 108,5764 = 9,7236; s, = 3,1182
100 100
3647
an , = 36,47; in„ = a„-XY = 36,47 - 36,47 = 0
100
Luego K=-jT = ñs
Cuando los datos proporcionados por los valores de las variables no vienen da
dos por sus frecuencias absolutas, sino por el orden que éstas ocupan en la observa
ción, resulta más difícil medir la intensidad de la relación, puesto que se posee menos
información sobre las variables. Consideremos el siguiente ejemplo:
Ejemplo 6.4
Cinco alumnos son evaluados en Física y Química por dos profesores. Estos, en
lugar de dar las calificaciones, han facilitado el lugar que ocupan en las respectivas
asignaturas:
Física Química
Luis 2 2
Carlos 5 4
Pedro 3 3
Manuel 1 1
Julián 4 5
201
(19)
El valor obtenido, 0'9, es muy próximo a 1, lo que indica que los profesores han
dado calificaciones similares.
Un valor muy próximo a -1 habría indicado que los alumnos mejor calificados por
un profesor, serían los peor calificados por el otro.
Ejemplo 6.5
El valor obtenido, 0'20, nos indica una correlación muy débil entre el sexo y la
aptitud para el idioma inglés.
6.6.3. Coeficiente 0
Si las dos variables son dicotómicas por su propia naturaleza, se utiliza el coefi
ciente <t>. cuyo fundamento se estudia en el capítulo 15.
203
Supongamos que las variables dicotómicas admiten las dos modalidades A (acier
to) y E (error), y designemos por:
a=número de individuos con la modalidad A de X y la A de Y.
b=número de individuos con la modalidad E de X y la E de Y.
c=número de individuos con la modalidad A de X y la E de Y,
d=número de individuos con la modalidad E de X y la A de Y.
según se recoge en la siguiente tabla
Y
A | E
v A a c
X E d b
cd-ab
<l>; (21)
yj(a + c)(d + b)(a + d)(c + b)
Ejemplo 6.6
Supongamos que se realiza una prueba a 80 estudiantes con dos tandas de pre
guntas, y se pretende averiguar si existe correlación entre las dos tandas de pregun
tas a la vista de las respuestas dadas por los estudiantes: 1 8 respondieron con acierto
a las dos tandas de preguntas. 16 contestaron erróneamente a ambas, 20 respondieron
con acierto a la primera y erróneamente a la segunda, y 26 respondieron erróneamente
a la primera y con acierto a la segunda. El siguiente cuadro recoge los resultados:
i '
A E
A 18 20
X
E 26 16
20x26-18x16
: 075
y¡( 18 + 20)(26 + 16)( 18 + 26)(20 + 16)
lo que supone una correlación muy débil.
204
Surgen, a veces, situaciones, en que, siendo continuas por su naturaleza las varia
bles, sus resultados se dan dicotomizados. Es éste el caso en que, tras someter a un
conjunto de personas a una serie de pruebas, se les asigna la calificación final de
«apto» o «no apto».
Cuando deseemos estudiar la relación entre dos variables de naturaleza continua,
cuyos valores se han dicotomizado, si estamos interesados en la relación existente
entre las variables representadas por los datos dicotomizados, se utiliza el coeficiente
de correlación tetracórica o de atributos, que designamos por rr
La expresión de este coeficiente es muy compleja. Vamos a utilizar una expresión
que da una aproximación bastante buena:
(22,
Ejemplo 6. 7
Los 20 empleados de una oficina que tienen relación directa de trato con el público
han sido evaluados a través de una encuesta que ha permitido clasificarlos según su
trato B(bueno) o M(malo) con los clientes.
Un directivo de la empresa piensa que existe una relación entre la forma en que un
empleado trata a los clientes y su dimensión humana. Atendiendo a este criterio, los
empleados han sido clasificados en gruesos(G) y delgados(D). según pasen o no de
55 kgs. de peso.
Se trata de estudiar la correlación entre estas variables, cuyos resultados
dicotomizados se recogen en la siguiente tabla:
Y
G D
B 7 3
X
M 4 6
205
Este resultado indica una correlación negativa muy débil entre el peso de los
empleados y su forma de tratar al público.
Ejemplo 6.8
X Y X: Y: XY
1981 3.1 3924361 9,61 6141.1
1982 3.0 3928324 9.00 5946,0
1983 19 3932289 8.41 5750.7
1984 2.8 3936256 7.84 5555.2
1985 2.6 3940225 6,76 5161.0
1986 2,6 3944186 6,76 5163.6
1987 15 3948169 6,25 4%7.5
1988 2,4 3952144 5.76 47712
- 15876 , -, 31505964
x = —— = 1984,5; sx = a20 - x = 3938240,3 = 5,25; sx = 2,29
S
- 21,9 -, 60.J9
v = —— = 2, 7375; j' = a„, - y 7,4939 = 0,0548; sy = 0,23
8 8
43456,3
ÍJ/, = = 5432,04; mu = a,i-awa0i = 5432,04 - 5432,57 = -0,53
8
- mu -0,53
El coeficiente de regresión es p ,, = ~~r = . -. = -0, /
j, 5,25
3D 2i ,
da N^t
dD 2i .
T7" = T, ¿Jax, +bx, +c-y,)x¡ = 0
dD 2£ .
a¿,x¡ + b^x, + cN = X y,
Ejemplo 6.9
La siguiente tabla muestra los porcentajes de niños fallecidos durante los seis
meses que duró una epidemia:
Mes 12 3 4 5 6
Porcentaje 2'2 3'3 5'5 9'4 14'4 22' 1
Si se dibuja la nube de puntos, parece lógico ajustar una parábola. Vamos a cons
truir una tabla para facilitar los cálculos:
208
X Y X2 X3 X4 XY X**7
1 2'2 1 1 1 2'2 2'2
2 3'3 4 8 16 6'6 13'2
3 5'5 9 27 81 16'5 49'5
4 9'4 16 64 256 37'6 150'4
5 14'4 25 125 625 72'0 360'0
6 22' 1 36 216 12% 132'6 795'6
21 56'9 91 441 2275 2675 1370'9
Se llega al sistema:
con lo cual ambos problemas quedan reducidos al caso de regresión lineal, ya que las
ecuaciones (25) y (26) son las ecuaciones de una recta.
209
Ejemplo 6.10
PV" =k
donde B y k son constantes.
Tomando logaritmos, resulta logf+ P log V = log A-
y = a + bx
1) Vamos a determinar la recta de mínimos cuadrados de Y sobre X; para ello,
disponemos los valores necesarios en la siguiente tabla:
X=logV Y=logP X2 Y: XY
2.9777 0.6532 8.8666 0.4266 1.9450
3.0338 05682 92039 03228 1.7238
3,1027 0.4471 9,6267 0.1998 1,3872
3.1908 0,3222 10.1812 0,1038 1.0280
33170 0.1461 11.0024 0.0213 1.4846
3,3776 0,0413 11.4081 0,0017 0,1394
18.99% 2.1781 603892 1.0762 6,7082
- 18,9996 60,2892
= 3,1666; s\ = a:o-x' 10,0273 = 0,0208; s, = 0,1444
6
2,1781 1.0762
y= 0.3630; sl = a02-y = 0.1317 = 0.0476; s, =0.2181
6
6,70)
au , = 1,11804; mn = an-awam= 1,1 1804- 1,14947 = -0.03143
PV' 139497
3) Estimación de la presión correspondiente al volumen V=1750 cm':
Si V=1750 cm\ será log/J+ llogV = log 139497, de donde:
6. 1 . Para los datos de los ejercicios 5. 1 y 5.2, 1 ) hallar la recta de regresión de Y sobre
X; 2) calcular el coeficiente de correlación, dando una interpretación del valor obteni
do.
X 3 5 7 8 12
Y 24 20 12 10 4
6.3. Hallar la recta de regresión de Y sobre X y de X sobre Y para los datos del
ejercicio 5.12. Hacer una predicción de los gastos superfluos que tendrá una familia
cuyos gastos totales son de 85000 ptas.
6.5. La siguiente tabla contiene el número de meses que lleva entrenando un jugador
de golf y el número de golpes que necesita para hacer el recorrido de un determinado
campo:
Tiempo (X) 1 2 3 4 5 6 7 8 9
N" de golpes (Y) 80 77 74 71 69 68 68 65 63
6.8. Cien personas son sometidas a dos pruebas, una física y otra de tipo psicotécnico.
Veinticinco personas superaron correctamente ambas pruebas, veinte fallaron en las
dos, dieciocho superaron la prueba física y fallaron en la prueba psicotécnica, y
treinta y siete superaron la prueba psicotécnica y no pasaron la prueba física. Para
estudiar la correlación entre ambas pruebas, ¿qué coeficiente de correlación se debe
usar? Calcularlo.
6.9. Con los datos del ejercicio 5.1 1, 1) ajustar la recta de regresión por el método de
mínimos cuadrados y por el método gráfico; 2) hacer una estimación del número de
bacterias que habrá al cabo de 12 horas.
Sexo V V M M V V M M M V V V
Calificación 7 8 6 7 9 5 3 4 6 4 3 6
6. 1 1 . La siguiente tabla contiene la distribución de 200 familias según los ingresos totales
(X) y los gastos que por término medio dedican a transporte (Y) (en miles de pesetas):
6.12. Pensando que hay una cierta relación entre el peso y las calificaciones, se han
clasificado los alumnos de una clase de 40 en gordos(G), si pesan más de 50 kgs. y
delgados(D), si pesan menos, y en aplicados(A), si su calificación supera el 5, y no
aplicados(N), en otro caso. Los resultados están recogidos en la siguiente tabla:
G D
A 12 10
N 11 7
¿Qué coeficiente de correlación hay que aplicar? ¿Hay alguna relación entre el
peso y las calificaciones?
6.13. Se ha realizado un cultivo artificial en una incubadora a 30°C y 210 r.p.m. Partien
do de un pH inicial de 2'5 y un tanto por ciento de oxígeno variable, se mide la
concentración en levadura y glucosa en función del tiempo, obteniéndose los si
guientes resultados:
Tiempo (horas) 0 12 3 4 5 6 8 12 13
C. Ievadura(g/1) OMOO'15 015 0M7 0'21 0-2I 0-26 0'26 0'35 r03 rio
C. glucosa* g/1) 10 10 10 8'3 8'3 8'3 8'3 6'3 6'3 5'5 5'5
Ingresos 3 10 9 3 8 9 3 7 7 4 3 2
Calificación F E F F E E F F E F F F
6. 15. Para los datos del ejercicio 6. 1 3, representar la curva de regresión de crecimiento
de la concentración de glucosa (Z), y estudiar el tipo de ajuste que conviene, hallando
la curva de regresión de Z sobre X.
6.17. El mismo tipo de cultivo artificial y con los mismos datos iniciales del ejercicio
6.13, se llevó a cabo en un fermentador, obteniéndose los siguientes resultados para
la concentración de glucosa:
Tiempo (horas) 0 1 2 3 4 5 6 7
C. glucosa(g/I) 4 2"5 3'1 5.2 8'6 14'2 21'0 29'4
6.18. Diez alumnos del Curso de Orientación Universitaria han sido evaluados por sus
respectivos profesores de Matemáticas y de Física, quienes han facilitado el listado
de los alumnos ordenados atendiendo a la calificación, pero sin especificarla, siendo:
Nombres Carlos Luis Juan José Mario Pedro Antonio Julián Alberto Felipe
Matemáticas fi 1 3 7 8 5 2 10 4 9
Física 8 7 6 4 5 9 10 1 3 2
¿Qué coeficiente se debe utilizar para estudiar la relación entre las calificaciones de
los dos profesores? Calcularlo.
215
Apéndice al capítulo 6:
Demostración de las propiedades del coeficiente de correlación de Pearson
I. Llamemos m'n a la covarianza de X' e Y', y a' y a'o, a las medias de X' e Y',
respectivamente. Entonces:
N N
m'n acmu mu ,
luego r = = = , c. q. d.
Sx-Sr asx cs, sxsr
II. Para demostrar esta propiedad, partimos del segundo miembro de la expresión
(13), y desarrollamos por separado numerador y denominador:
Desarrollando el numerador multiplicado por N, se obtiene:
,v N
Ns„ = Nmn= ^(x,-x)(yry) = ^/x,y, - x,y -x y,+ xy) =
N \ N
( N \
1>' I* l \ \ ,,±yl
x, y, —+ N
N N NN
( N (N \ N \ (N )f
lx,
V"1 )
I* X.v N
lx, X*
lx,y,-2^ N N N
N Y (N V
¿gXi S.v,
Ns.sy=N
,v
Iv;- v=/A7 /
N Y
I*
i=l
S.v,
Lrf. N (=/ A7
Nm,i
N sKs,
a7
/
Multiplicando por ,— , queda finalmente
y[N2
N í N >
I.v,
,c.q.d.
N (N Y N (N Y
M \M )
SEGUNDA PARTE
7. 1 . Experimentos aleatorios
AnB = {4,6}
Si hay dos sucesos de un mismo experimento que no pueden tener lugar simul
táneamente, como es el caso de los sucesos P={ obtener número par} e I={ obtener núme
ro impar} cuando se lanza el dado, se dice que los sucesos PeI son incompatibles.
La intersección de dos sucesos incompatibles, en principio, carece de sentido. Por
ello, se define el suceso imposible como aquel suceso que no puede tener lugar
nunca; de este tipo es el suceso «obtener un número mayor que 6».
Representaremos al suceso imposible por el símbolo 0, y consideraremos que
forma parte de todo experimento. De esta forma, la intersección de dos sucesos in
compatibles es el suceso imposible.
221
AuB = {2.3.4.6}
El suceso contrario del suceso A={ obtener número par} es A'={ obtener número
impar}.
La unión de un suceso con su suceso contrario es un suceso que siempre tiene
lugar. A tal suceso le llamamos suceso seguro.
AcE.VA
y también se cumple que el suceso imposible está contenido en todo suceso:
0cA,V¿
Au(finC) = (AuB)n(AuC)
El proceso de demostración es el que se utiliza para demostrar una igualdad entre
conjuntos, que consiste en demostrar la doble inclusión. Veamos, en primer lugar que
jMfinC)c(AuB)nUuC)
Sea x un suceso elemental cualquiera perteneciente al primer miembro:
xe Au(BnC)
Entonces, por la definición de la unión de sucesos, se tiene:
xe (AuB)n(AuC)
Demostremos ahora la relación de contenido recíproca:
(Aufi)n(AuC)cAu(finC)
Sea x un elemento cualquiera perteneciente al primer miembro:
xe (AuS)n(AuC)
Por la definición de la intersección, se tiene:
xe AuByxe AuC
Entonces, puede suceder que xe A, en cuyo caso jce Au(SnC), y estaría de
mostrado, o bien xe A, en cuyo caso, como xe AuByxe AuC, se verifica que
xe Byxe C, y, por tanto, x e Au(BnC), lo que completa la demostración.
223
A-B = AnB'
Utilizando un diagrama de Venn para representarlos gráficamente, en la figura 7.1,
observamos cómo la diferencia A-B viene dada por los sucesos elementales de A que
no están en B (zona rayada).
Cuando lanzamos el dado, si A={2, 4, 6} y B={ 1, 2, 4, 5}, es A-B={6}.
AAB = (A-B)u(B-A)
A,r\Ai = ®, si i * j UA,=E
224
VA e U => A' e V
El álgebra de Boole es un caso particular de a-álgebra, que sólo exige que se cumpla
el primer axioma para la unión finita. La clase de las partes de C es una a-álgebra.
Con estas definiciones, es posible precisar algunos de los conceptos que hemos
introducido de una manera intuitiva.
Ejemplo 7.1
E={0.1,2,3,4,...}yU=P(E)
Un espacio muestral es de tipo continuo si contiene una infinidad no numerable
de puntos muestrales.
Ejemplo 7.2
E = {xeyi\0<x<l}
lin un espacio muestral de Upo continuo, la a-álgebra no nene por que coincidir
con P(E).
Un caso particular de espacio muestral discreto se tiene cuando el número de
puntos muestrales es finito. Entonces se dice también que es de tipo finito. La clase
P(E) es un álgebra de Boole.
Ejemplo 7.3
Ejemplo 7.4 AA
A
A ^^ B AB
Un experimento compuesto consis / ~-~ AB
' R
te en sacar una bola de una urna que / ^^ C BC
*- B C
contiene tres bolas: azul(A), blanca (B) \ —— x Bx
En la figura 7.3, se observa cómo las distintas trayectorias del diagrama de árbol
proporcionan los diferentes puntos muestrales.
f(A) = ^
n
Propiedades de las frecuencias:
P:U->3i
que verifica los tres siguientes axiomas:
I. P(A)>0,VAeU (1)
II. Si Ai,A2,...e U, siendo los A incompatibles dos a dos, se verifica
P\yiA;\=XP(Ai) (2)
m.P(E)=1. 0)
En esta definición intervienen tres elementos fundamentales: el suceso seguro E,
la a-álgebra U de sucesos de E y la aplicación P. A la terna (E,U,P) formada por estos
tres elementos se le denomina espacio probabilístico o espacio de probabilidades.
Como consecuencia de los axiomas que acabamos de definir, se deducen las pro
piedades que van a permitir calcular la probabilidad de un suceso cualquiera.
1 . Si A' es el suceso contrario de A, esP(A') = 1 - P(A), VA e V (4)
En efecto, por el tercer axioma, es
P(A\jA') = P(E) = 1
y, por el segundo axioma, al ser A y A' incompatibles,
P(AuA') = P(A) + P(A')
luego P(A)+P(A')=1, de donde resulta P(A')=1-P(A).
2. P(0) = 0 (5)
En efecto, 0 = £", y, por la propiedad 2, esP(0) = 1 - P(E) = 1-1 = 0
3.SiA,BeUyAczB^>P(A)<P(B) (6)
En efecto, si A c B, B = A u {B - Á) , siendo A y B-A incompatibles. Por el axioma
2, será P(B) = P(Á) + P(B - A) , y, como P(B-A)>0 por el primer axioma, debe ser
P(A)<P(B).
4. P(A)<1, cualquiera que sea A. (7)
En efecto, cualquiera que sea A, A está contenido en E, luego P(A)<P(E)=1.
228
El tipo de sucesos más frecuente en la práctica diaria nos obliga a hacer una
restricción, que nos va a conducir a la definición clásica de probabilidad o regla de
Laplace.
Sea un espacio muestral finito, donde E={ara: an} y la s-álgebra de sucesos es
la clase de las partes de E, U=P(E). Si es admisible el axioma adicional de que «todos
los sucesos elementales son equiprobables», es decir
P{a,}=P{a:}=...=P{an}
será: P(E)=P{a¡}+P{a,}+...+P{a„}=nP{a}=l
y, por tanto P{a}=l/n, para i=l,2 n.
Entonces, si un suceso A de P(E) está formado por k sucesos elementales, será:
• / ¿
7r¡ « «
donde k es el número de veces que se da el suceso A (casos favorables), en tanto que
n es el número de pruebas realizadas (casos posibles).
Podemos expresar la relación anterior en la forma:
Este resultado se conoce como «regla de Laplace», y nos dice que «la probabili
dad de un suceso es el cociente de dividir el número de casos favorables a dicho
suceso entre el número de casos posibles», siempre que los sucesos elementales se
puedan considerar todos con la misma probabilidad.
La regla de Laplace permite asignar probabilidades en una gran parte de las situa
ciones que se presentan: suele tratarse de espacios muestrales finitos, en que los
sucesos elementales son equiprobables.
Ejemplo 7.5
P(C)+P(X)=1
230
Ejemplo 7.6
Ejercicio 7.5.1
Ejercicio 7.5.2
P(AnB) (13)
P(B/A)
P(A)
Demostración:
En efecto:
Propiedades:
1. P(AnB)= P(A)P(B/A), P(A)>0 (14)
Esta propiedad se obtiene de despejar P(A) en (13).
2. P(Ar\Br\C) = P(A)P(B/ A)P(C / Ar>B) (15)
En efecto, P(AnBnC) = P(AnB)P(C/ AnB) = P(A)P(B/ A)P(C / AnB)
Ejemplo 7.7
Una urna contiene 4 bolas blancas y dos rojas. Se extraen dos bolas consecutiva
mente sin devolución. Si la primera bola extraída resultó blanca, ¿cuál es la probabili
dad de que la segunda bola también sea blanca?
• o o • o
• o o • o o
P(B/A) = P(B)
235
Propiedades
(1-P(A))(1-P(B)) P(A')P(B')
= P(A')
P(B') P(B')
luego A'yB' son independientes.
Sucesos independientes dos a dos: Los sucesos de una familia S se dice que
son independientes dos a dos cuando VA, Be S=> A y B son independien-
tes.
Ejemplo 7.8
Solución: Designemos por A al suceso «ser chica» y por B al suceso «ser fuma
dor».
1) Con los datos del enunciado, tenemos:
P(A) = 0'45, P(B) = O1 40, P(Ar\B) = 0' 10
P(Ar\B) a10
luego P(B/A)- ,C22
P(A) 0'45
2) Como P(B/A)=0'22 y P(B)=0'4, el suceso B depende de A, y los sucesos «ser
fumador» y «ser chica» no son independientes.
P(A)P(B/A.) (18)
P(A,/B),
^P(AJP(B/A.)
237
Demostración:
como los sucesos A, constituyen un sistema completo, son incompatibles dos a dos,
y, por tanto, los sucesos BnA, también son incompatibles dos a dos; luego, en virtud
del segundo axioma de la probabilidad, la expresión anterior es igual a
Ejemplo 7.9
En una ciudad hay tantos hombres como mujeres. El 30 por ciento de los hombres
son universitarios y el 20 por ciento de las mujeres también lo son. Se elige una
persona al azar que resulta ser universitaria. Hallar la probabilidad de que se trate de
una mujer.
Una variable aleatoria es una aplicación que asocia a cada suceso elemental un
número real. Conviene definir este concepto con precisión, puesto que es la idea
fundamental que permite dar un tratamiento riguroso a los fenómenos aleatorios.
Ejemplo 7.10
Una variable aleatoria X puede tomar un conjunto de valores finito, infinito nume
rable o una infinidad no numerable de valores reales. Será discreta o continua, por
tanto, según sea su contradominio o imagen.
La variable aleatoria definida por el número de caras que salen cuando se lanzan
dos monedas es una variable discreta; su contradominio está formado por los puntos
del conjunto:
C={0,U}
Hay variables aleatorias que tienen por imagen toda la recta real o algún intervalo
de la misma
(a,b), [a.b), (a,b), (-oo,a), [a,+oo),...
A este tipo de variable aleatoria, que no toma valores aislados, le llamamos varia
ble aleatoria continua, esto es:
240
Si tenemos una variable aleatoria discreta, como puede ser el número de caras que
aparecen al lanzar dos monedas, es conveniente representar las probabilidades con
que toma la variable aleatoria cada uno de los valores numéricos x, por una fórmula.
Esta fórmula debe ser una función de x, f(x), esto es
Ejemplo 7.11
X 0 1 2
fíx) 1/4 1/2 1/4
f °. six <0
1
s¡0< x < 1
4
F(x) = 3
si 1 <x< 2
4
1. si x>2
T t . -i-
O I 2 D I 2
Función de densidad: La función real de una variable real f(x) es una función
de densidad de la variable aleatoria X si verifica
1. f(x)>oyxe(X (20)
2 í^f(x)dx = / (21)
Ejemplo 7.12
Solución:
2/5(x+2). siO<x<l
0, resto
0. si x < 0
1 , 4
F(x):
— x' + — x, si 0 < x < 1
1, six>l
2 Este término tan expresivo para designar el valor medio se establece en los orígenes del
"Cálculo de Probabilidades", hacia el sigo XVII. en que los juegos de azar eran el campo de
aplicación de la Estadística, y el interés del jugador se centraba en la "esperanza" de conseguir un
premio.
245
(26)
\lx = E(X): - 5>«.
si X es discreta; y, si X es continua, es
(27)
\iX = E(X) = J xf(x)dx,
Ejemplo 7.13
2) 1 *x >
E(X)=)~xflx)dx = \'ox-(x + 2)dx=- l~3X+X
ir1!- 1
246
Sea (E,U,P) un espacio probabilístico, y sea X una variable aleatoria definida en él.
Consideremos la función real de una variable real /i:9í —» 91 tal que la imagen de la
variable aleatoria X está contenida en el dominio de h.
Podemos hablar entonces de la función compuesta h-X=h(X), que es una aplica
ción de E en 9? tal que
(h-X)(a)=(h(X))(a)=h(X(a)), para a perteneciente a E.
Si la imagen inversa por h(X) de cualquier intervalo de la forma (-lx,,x] es un suceso
de U, h(X) será una variable aleatoria. Una condición suficiente para que h(X) sea una
variable aleatoria es que h sea uniforme y continua.
Dada una variable aleatoria X, si h(X) es una variable aleatoria, se puede hablar de
la esperanza matemática de h(X):
si X es discreta; y, si X es continua, es
uM.J = E[h(X)] = ¡'~h(x)f(x)d* (29)
Ejemplo 7.14
Si, para la variable aleatoria X del ejemplo 7.12, definimos la función h(X)=2X+l, la
esperanza matemática de esta nueva variable aleatoria será:
V 2 2(i , 31
E(2X + l) = ]o(2x+l)-(x + 2)dx = -)J2xr + 5x + 2)dx = —
1. Sea X una variable aleatoria. Si las funciones de X, g(X) y h(X), son dos varia
bles aleatorias tales que existen E[g(X)] y E[h(X)], entonces existe también E[g(X)±h(X)]
y es
E[g(X)±h(X)]=E[g(X)]±E[h(X)] (30)
247
Ejemplo 7.15
n , V" ! 1 1 1 1 ,1111
i ri
a=r2'2
o =-
7 , 14 , 208 2 128 37
2) o2 = ¡Jx-\iff(x)dx = ^ 4X + 15 x ' 225 x + 225 X. 450
y ^=\\-^=0,28
\450
2. Sea X una variable aleatoria con distribución de probabilidad f(x), y sea g(X)
una función de la variable aleatoria X. Entonces la varianza de la variable aleatoria
g(X) es:
a > t""(x - u f f(x)dx + ¡~Jx - u f f(x)dx > t^k'a f(x)dx + j^k'cr f(x)dx
resulta que
ct > k2a[tk°flx)dx + i~koflx)dx]
Ejemplo 7.17
Una variable aleatoria X tiene de media u= 1 0 y como varianza a:=4, siendo desco
nocida su distribución de probabilidad. Queremos hallar: 1) P(5<X<15); 2) P(IX-1I<3);
3)P(IX-10I>3).
5 5 "| / 4 21
P(5 < X < 15) = P 10-- 2< X <10 + - 2 \>1- r= 1-— = —
2 2 ) (5/ 2 y 25 25
Luego P(5<X<15)>21/25.
< 3 3)45
2)p{\X-ia<3) = P(-3<X-10<3)=P(10-3<X<10+3)=P 10--.2<X<10+-.2\> /--=-
2 2 4 9
3 3)14
3) P(\X-10\>3) = 1- P{\X-10\<3) = 1- P 10--.2<X<10+-.2\< ;=-
2 2 ) (3/2 r 9
4
luego H\X-10\>3)<-
252
7. 1 5. Cambio de variable
Proposición 7.3: Sea X una variable aleatoria discreta con función masa de
probabilidad f(x). Si Y=h(X) es una variable aleatoria que define una transfor
mación biyectiva entre los valores de X e Y de tal forma que la ecuación y=h(x)
puede resolverse en función de y, siendo x=g(y), entonces la distribución de la
variable aleatoria Y es
t(y)=flg(y)] (44)
En efecto: t(y)=P(Y=y)=P[X=g(y)]=f[g(y)]
Ejemplo 7.18
X 6 10 21
Rx) 0'3 O'l 0'6
19-1
g(19) = P(Y = 19). P(X =6) = 0.3
3 )
253
31-l)
g(3l) = P(Y=3l), ,P(X = 10)=0,1
Y 19 31 64
Proposición 7.4: Sea X una variable aleatoria continua con función de densi
dad f(x). Si Y=h(X) define una transformación biyectiva entre los valores de X
e Y de tal forma que existe y es única la transformación inversa x=h '(y)=g(y),
entonces la función de densidad de la variable aleatoria Y es
t(yHlg(y)P (45)
Ejemplo 7.19
/
flx) = , si a < x < b
b -a
Vamos a determinar la función de densidad de la variable aleatoria Y=-3X.
Aplicando el resultado anterior, es:
/
,íu / --y l/í-í-7^-
3 b-a 3(b-a)
si -3b < y < -3a
254
7. 16. Momentos
M(C)=E[(X-Cfl (46)
Mr(Q^(x-CfJ(x) (47)
y, si X es una variable aleatoria continua:
Mr(C)=)(x-Cff(x)dx (48)
Cuando C=0, se tienen los momentos respecto al origen, que se denotan por ar.
Si la variable aleatoria X es discreta, será:
ar = Zx'f(x) (49)
y, si X es una variable aleatoria continua:
+ 00
a, = ¡ xrf(x)dx (50)
Esta proposición nos indica que el momento de orden r respecto al origen coincide
con el valor de la derivada de orden r de Mx(t) en el punto t=0.
Ejemplo 7.20
Esta proposición no sólo permite identificar una distribución por su función gene
radora de momentos, sino que proporciona un método para hallar la distribución de
importantes estadísticos.
7. 1 8. Ejercicios propuestos
7.1. Se selecciona una carta de una baraja de 52 cartas. Llamemos A al suceso «obte
ner espadas» y B al suceso «obtener as». Calcular: P(A). P(B) y P(AnB)
7.2. Consideremos un dado cargado de tal forma que la probabilidad de que salga un
número es proporcional a dicho número.
1 ) Describir el espacio probabilístico. 2) Hallar la probabilidad de que salga un
número impar. 3) Hallar la probabilidad de que salga un número mayor que 2. 4) Hallar
la probabilidad de que salga un número impar mayor que 2.
7.3. De un lote que contiene 10 piezas, de las cuales cuatro tienen defecto, se extraen
dos al azar. Hallar la probabilidad de que:
1 ) las dos piezas tengan defecto; 2) ninguna de las dos piezas tenga defecto; 3) al
menos una de las piezas tenga defecto.
7.5. Sea E un espacio muestral que consta de tres puntos muestrales, E={a,,a,,a,}.
Averiguar si las funciones siguientes definen un espacio de probabilidades:
1) P(a,)=l/2, P(a>l/3, P(a,)=l/3.
2) P(a,)=l/2, P(a>-1/4, P(a,)=l/2.
3) P(a,)=l/3, P(a2)=l/3, P(a,)=l/3.
7.6. Se sacan tres cartas simultáneamente de una baraja española. Hallar la probabili
dad de que:
1) las tres cartas sean reyes; 2) dos sean rey y otra caballo; 3) las tres cartas sean
de distinto palo.
7.7. Un experimento consiste en lanzar dos dados y anotar la suma de puntos de sus
caras superiores. Hallar la probabilidad de:
1) obtener una suma igual a 13; 2) obtener una suma igual a 10; 3) obtener suma
mayor que 5.
7.8. Una urna contiene 10 bolas blancas y 6 rojas. Si se extraen sucesivamente dos
bolas, hallar la probabilidad de que:
1) las dos bolas sean rojas; 2) la primera bola sea blanca y la segunda roja; 3) una
bola sea blanca y la otra roja.
7.9. En una facultad universitaria, el 30 por ciento de los estudiantes son extranjeros.
De ellos, el 20 por ciento disfrutan de beca. También son becados el 10 por ciento de
los estudiantes nacionales. Hallar la probabilidad de que un estudiante elegido al azar
tenga beca.
7. 10. Tres matrimonios salen a cenar juntos. El camarero del restaurante les asigna un
puesto al azar en la mesa. Hallar la probabilidad de que:
1) se sienten juntas las mujeres; 2) coincida un matrimonio concreto; 3) no coinci
da un matrimonio concreto.
7.13. Dos urnas tienen las siguientes composiciones: la primera tiene 8 bolas azules, 6
blancas y 4 rojas, y la segunda tiene 12 azules, 6 blancas y 8 rojas. Se saca una bola
al azar de la primera urna y se traslada a la segunda. A continuación se extrae una bola
al azar de la segunda urna, que resulta ser roja. ¿Cuál es la probabilidad de que la bola
que se traspasó de la primera a la segunda urna sea azul?
7.14. Tres cazadores, disparando a la vez, matan un león, acertándole con dos impac
tos. La probabilidad de que el primer cazador haga blanco es de 5/6, la del segundo es
de 4/6 y la del tercer cazador es de 3/6. ¿Cuál es la probabilidad de que sean los dos
últimos los que han acertado?
7.15. En una factoría hay dos máquinas que fabrican la misma pieza. Se sabe que la
primera produce un 5% de las piezas con defecto, y la segunda un 6%. Un cierto día,
en que se han producido 100 piezas con la primera de las máquinas y 200 con la
segunda, se realiza una inspección, que consiste en elegir una pieza al azar.
1) Hallar la probabilidad de que la pieza elegida tenga defecto. 2) Si la pieza selec
cionada es defectuosa, ¿cuál es la probabilidad de que haya sido fabricada con la
primera de las máquinas?
7.16. Un vendedor llama al domicilio de una familia que tiene dos hijos. Le abre la
puerta uno de los hijos, que resulta ser varón. ¿Cuál es la probabilidad de que los dos
hijos sean varones?
7. 17. Carlos y Luis juegan una partida de dados. Comienza Carlos lanzando un dado,
luego lo lanza Luis, y se repite el proceso hasta que uno de los dos gana. Ganará
Carlos si sale un 2, sin haber salido 4, y ganará Luis si sale 4 sin que haya salido el 2.
¿Cuál es la probabilidad de que gane Carlos?
7.18. Disponemos de 20 urnas, seis de las cuales tienen 3 bolas blancas y 6 rojas,
cinco tienen 4 blancas y 4 rojas, siete tienen 5 blancas y 5 rojas, y dos tienen 6
blancas y 4 rojas. Se elige una urna al azar y se saca una bola que resulta ser blanca.
Hallar la probabilidad de que la urna elegida tenga 5 bolas blancas y 5 rojas.
7.19. La distribución de probabilidad de una variable aleatoria discreta viene dada por
la siguiente tabla
X 1 3 5 7 9 11
fU) 0'05 0'25 O'IO 0'30 OTO 0'20
1) Hacer la representación gráfica de la distribución de probabilidad. 2) Hallar la
función de distribución y representarla gráficamente. 3) Hallar la media, la varianza y la
desviación típica.
259
f(x) = ~x,x=l,2 20
Hallar: 1 ) P(X=6); 2) P(5<X<12); 3) P(X2<64).
7.21. Una urna contiene 4 bolas, y se sabe que dos de ellas son rojas. Se realiza una
prueba que consiste en sacar las bolas una a una de la urna hasta encontrar las dos
rojas. Si llamamos X al número de pruebas necesarias, encontrar la distribución de
probabilidad de X.
X -10 12
«x) 1/4 1/4 1/3 1/6
0, si x<0
7.25. Un experimento consiste en hacer tres disparos. Se sabe que las probabilidades
de hacer blanco con el primero, segundo y tercer disparo son:
p=0'l,p2=0'3yp=0'6
Se define la variable aleatoria X = «número total de impactos». Hallar: 1) la espe
ranza matemática de X; 2) la varianza de X.
260
7.26. Un juego consiste en sacar una carta de una baraja española, de modo que, si la
carta extraída es un caballo o un rey, el jugador percibe 500 ptas., y, si se trata de un
as o un tres, percibe 1000 ptas.; en cambio, si se extrae otra carta diferente de las
anteriores, el jugador tiene que pagar 400 ptas. Hallar: 1) la ganancia media esperada;
2) la varianza de la ganancia.
P[\X-E(X)\<r]>0,9
7.28. Sea X una variable aleatoria, cuya distribución de probabilidad viene dada por la
siguiente tabla:
7.31. El tiempo de espera (en días) para conseguir una exploración con un «scanner»
en un hospital sigue una ley que viene dada por la distribución de probabilidad
1 *
-es, sit>0
F(x):
0, resto
261
X 5 2 4
fix) O'l 0'3 0'6
8. 1 . Distribuciones probabilísticas
Una variable aleatoria discreta también queda determinada por su función de dis
tribución:
F(x) = P(X < x)
Cuando una variable aleatoria discreta toma cada uno de sus valores con la misma
probabilidad, se dice que sigue la distribución uniforme.
Así sucede cuando lanzamos un dado regular sobre un tablero y observamos el
número que aparece en la cara superior. Cada uno de los resultados posibles {1,2,3,4,5,6}
tiene la misma probabilidad de salir.
Siendo más precisos, diremos:
Demostración:
i.I n n ,=i
Ejemplo 8.1
/
E[XJ = -(l + 2 + 3 + 4+5 + 6) = 3'5
6
a\ = -[(l-3'5f + (2-3'5f+...+(6-3'5f]= — = 2'9I66
o '12
Consideremos un experimento aleatorio tal que cada vez que tiene lugar, pueden
darse dos resultados: A (al que llamaremos éxito) o su contrario A' (fracaso), de modo
que la probabilidad de éxito es:
P(A)=p
y la probabilidad de fracaso:
P(A')=q=l-p
permaneciendo invariables dichas probabilidades durante toda la experiencia.
Un experimento con estas características se conoce como experimento de Bernoulli.
Supongamos que se realizan dos pruebas consecutivas e independientes. Enton
ces el espacio muestral estará formado por los cuatro sucesos:
AA, AA, A A, A A
a los que corresponden, respectivamente, las probabilidades:
X 0 1 2
p, q2 2pq p2
266
p'q"'
la probabilidad de un suceso de r éxitos y n-r fracasos.
Ahora bien, el suceso «obtener r éxitos y n-r fracasos» se puede dar de
n!
r!(n-r)!
formas distintas, que coinciden con las permutaciones con repetición de n elementos
en que r son A y n-r son A':
AA...r.AAA\.."r.A'
r!(n-r)!
En efecto: (p + q)"=l
!(">,
ya que p+q=l.
o ~L L-L
0 12 3 4 5 0)23456789 )0
Mx(t) = E(e")
T=0 Vr /
l(fjl
Derivando con respecto a t, se tiene:
dMy(t)
= n(pe'+q)" pe'
dt
d:Mx(t)
~'— = np\e(pe +q) +(n- l)(pe +q] pe e'\
dt
Ejemplo 8.2
Una variable estadística puede satisfacer las condiciones para ser considerada
binomial. Sin embargo, su distribución se separa del modelo teórico a causa de las
fluctuaciones del muestreo, según veremos en el próximo capítulo.
Para que una distribución empírica coincida con la distribución teórica, habría que
realizar infinitas experiencias.
Cuando una distribución de frecuencias satisface las condiciones necesarias para
ser considerada binomial, la distribución teórica que mejor se ajusta es la que tiene la
misma media que la distribución empírica.
Por ello, para efectuar el ajuste, se calcula la media de la distribución empírica de
frecuencias, x, y se utiliza la binomial de parámetro p = xln, ya que la media de la
binomial B(n,p) es x = np.
Una cuestión importante es establecer una medida de la bondad del ajuste, pero
esta cuestión se aborda en el capítulo 1 2.
Ejemplo 8.3
N° de jóvenes favorables 5 9 10 11 13 14 16 17 18 19
N° de grupos 2 6 13 14 25 16 12 7 3 2
Para ajustar la binomial. hay que identificar la media de la distribución, que viene dada
por el cociente de dividir el número de jóvenes ( 1 300) entre el número de grupos ( 1 00):
-A 1300
/00 ,
luego 1 3 jóvenes de cada 50 son favorables a la eutanasia activa por término medio.
Si suponemos que la probabilidad de que un joven sea partidario de la eutanasia
activa es p, como cada grupo de jóvenes se compone de 50, se trata de una binomial
B(50,p), siendo
x 13
P=- n =—50 = 0'26
Por tanto, admitimos que la opinión de los jóvenes sobre el tema de la eutanasia
activa sigue una distribución binomial B(50,0'26).
270
siendo A>0 una constante que representa el número promedio de resultados por uni
dad de tiempo o región.
El número promedio de resultados se calcula a partir de u=Xj. donde t es el tiempo
o región específica, con lo que la distribución de probabilidad es de la forma
x!
La variable aleatoria de Poisson teóricamente puede tomar cualquier valor entero,
I ,.
0 1 2 3 4 5 6 01 2 3 45678 01234 56789 10
pero la probabilidad de que tome un valor alto disminuye rápidamente cuando x toma
un valor superior a \i.
r ili:
En efecto:
E(X)=pe^^=t^^ = ^p^^l
Haciendo y=x-1, se tiene la última igualdad, pues
„, (x-l)! ,.o y!
Por lo tanto:
E(X)=\il=\l
Veamos ahora el cálculo de la varianza. Para ello, utilizaremos la expresión
var(X) = E{x2)-[E(X)]2
272
Ahora bien
Como los dos primeros sumandos del anterior sumatorio son nulos, se tiene
con lo que
var(X) = £U-) - [E(X)\ = u : + u - u * = H
Ejemplo 8.3
Cuando una distribución de frecuencias cumple las condiciones que permiten con
siderar que sigue la ley de Poisson, la distribución que mejor se ajusta es aquella que
tiene la misma media que la distribución empírica.
Para efectuar el ajuste, se calcula la media de la distribución empírica, y se utiliza la
distribución de Poisson de parámetro igual a dicha media.
La distribución de Poisson puede utilizarse para aproximar distribuciones binomiales
cuando la probabilidad p de éxito es próxima a 0 y el número de pruebas muy grande.
La siguiente proposición, cuya demostración omitimos, establece las condiciones para
que la aproximación sea buena.
Ejemplo 8.4
Definición 8.4: Una variable aleatoria X sigue una distribución normal con
parámetros |i y o, siendo |i un número real cualquiera y o>0, cuando su fun
ción de densidad es
f(x) = —p-éFT , Vx € 9? (8)
oV27t
Esta definición proporciona una familia de distribuciones normales, de modo que,
para cada pareja de valores que asignemos a los parámetros |i y o, tendremos una
distribución diferente.
Fijados los valores de |i y o, queda perfectamente determinada la distribución
normal.
En efecto, esta función satisface las dos condiciones necesarias para ser una
función de densidad:
1) f(x)>Oyxeft
2) jfMdx = /
Demostración
x- M 1
Si hacemos el cambio y = , se tiene dv = —dx, con lo cual
o o
Luego
7 2 7 r 2 7 / / Jl\ 1 ,-
ífix)dx = 72i l e7dy = im ! z:e^dz - iz\ir ^rn - '
275
= Vrc
a¡
8.3.1. Propiedades
g(t) = em~2~yte'X
VIH. Los parámetros |i y o son, respectivamente, la media y la desviación típica de
la distribución normal.
Pasamos la demostración de las propiedades al apéndice de este capítulo.
m=m
Figura 8.4: Curvas normales con la misma Figura 8.5: Curvas normales de igual
varianza y distintas medias. inedia v distintas varianzas.
En cambio, dos curvas normales con la misma media y distintas varianzas estarán
situadas en la misma posición sobre el eje de abscisas; la curva con mayor desviación
típica será más baja y dispersa. Esto es así, porque el área bajo las dos curvas tiene
que ser igual a 1 .
La proporción de la población, cuyos valores están comprendidos entre dos pun
tos x, y x2, es el área bajo la curva y sobre el eje de abscisas comprendida entre las
ordenadas correspondientes a dichos puntos, que, en otras palabras, es la probabili
dad de que la variable aleatoria X tome cualquier valor entre x, y x,.
El cálculo de dicha probabilidad o área se realiza por medio de integrales definidas:
P(x,<X<x2)= íf(x)dx
Estas integrales han sido tabuladas, pero es necesario tipificar la variable antes, ya
que los datos tabulados corresponden a la normal tipificada.
es también una variable aleatoria cuya distribución es normal de parámetros |i=0 yo=1.
Al cambio de variable
X-u
Z= -
a
f(z)=^eí''yze* (9)
Las propiedades que acabamos de ver nos permiten trazar la gráfica correspon
diente a la función de densidad de la normal tipificada N(x;0,l ).
En la figura 8.7, se observa la simetría con respecto al eje de ordenadas, el valor
máximo que corresponde a x=0, y cuya ordenada es aproximadamente 0'4, así como
los puntos de inflexión para x=-1 y x=1.
278
Esta integral proporciona el área que hay bajo la curva normal tipificada y sobre el
eje de abscisas en el intervalo (-°°,z\.
La función de distribución da la probabilidad de que la variable tipificada Z tome
un valor menor o igual que z.
F(z) = P(Z<z)
8.4.4. Áreas bajo la curva normal Figura 8.9: Áreas iguales por simetría.
1 U-n\2
P(x, < X < x,) = J N(x;\i,o)dx = U
&j2n ,,
~dx
M M
Esta área depende de los valores de |i y o. La figura 8.10 nos muestra el área bajo
dos curvas normales, N(x^^) y N(x;|i,,o\). comprendida entre dos valores x, y x,. Se
puede apreciar cómo las dos regiones son de distinto tamaño.
Este resultado parece indicar la necesidad de elaborar infinitas tablas, una por
cada media y cada desviación típica, para calcular el área comprendida entre los valo
res x, y xr
El siguiente resultado, sin embargo, nos va a permitir calcular el área bajo una
curva normal cualquiera comprendida entre dos valores, por medio del área bajo la
normal tipificada comprendida entre los valores transformados de los anteriores.
280
Proposición 8.8: Sea X una variable aleatoria normal, cuya función de distri
bución es Fx(x) y sea F?(z) la función de distribución de la variable aleatoria
tipificada Z=(X-u.)/a. Entonces se verifica que
{x<x}Jz = ^<^.z
Esta proposición nos permite relacionar áreas bajo una curva normal general con
áreas bajo la normal tipificada.
En efecto, acabamos de demostrar la siguiente igualdad:
Por tanto, el área bajo la curva normal general comprendida entre las ordenadas
x=a, y x=a2 es igual al área bajo la curva normal tipificada comprendida entre sus
transformadas z=b y z=bv
f (z)
La distribución normal N(z;0.1) está tabulada. Las tablas A. 3 del apéndice propor
cionan el área bajo la curva normal tipificada correspondiente a P(Z<z). La tabla A. 3.1
da áreas para valores negativos de la variable, comenzando en -3 '49 y terminando en
281
Ejemplo 8.5
Sabiendo que la variable aleatoria X sigue una distribución normal de media u=10
y desviación típica a=2'5, vamos a calcular:
a) la probabilidad de que la variable aleatoria X tome un valor menor o igual que
12; b) la probabilidad de que X tome un valor comprendido entre 9 y 12; c) la proba
bilidad de que X sea mayor que 12.
12-10'
P(X < 12) : P(Z < 07}) = (Y7881
t 2'5 2'5
282
I ¡ x l
10 12 0 O'B
X-10 12-10"
c) P(X>12) = 1-P(X<12) = 1 < = /-P(Z<C8):
25 " 25
= 1-0'7881 = 0'2119
Ejemplo 8.6
Una empresa que tiene 2000 empleados paga a éstos un salario cuya media es de
800 ptas. por hora de trabajo, con una desviación típica de 75 ptas.
Si los salarios están distribuidos normalmente, se trata de hallar:
a) el porcentaje de empleados que cobra menos de 650 ptas. a la hora:
b) el porcentaje de empleados que ganan más de 900 ptas. a la hora:
c) el porcentaje de empleados que ganan un salario comprendido entre 700 y 900
ptas. por hora de trabajo;
d) la probabilidad de que un empleado elegido al azar gane un salario inferior a 750
ptas. por hora de trabajo;
e) el número de empleados que ganan por debajo de las 750 ptas. a la hora;
f) el valor del salario por hora de trabajo, por encima del cual se encuentran el 20%
de los empleados que más ganan.
P(X>900) = 1-P(X<900):
900-800
*
1-P\Z<
75
= 1-P(Z<¡'33).
1-0'9082 = 0'0918
lo que supone un 97c de los emplea
dos.
c) Calculamos, en primer lugar, la
probabilidad de que un empleado ele
Figura 8.15: Empleados que cobran entre
gido al azar gane un salario comprendi 700 y 900 ptas.
do entre 700 y 900 ptas.
P(700<X<900) =
(700-800 900-800
= p\ <z<
{ 75 75
= P(-1'33 <Z< ¡'33) = P(Z < 1'33)-P(Z < -1'33) = 0'9082 - 0'091 8 = 0'8164
O El valor, por encima del cual se encuentran el 20% de los empleados que más
ganan, coincide con el valor por debajo del cual se encuentran el 80% de los emplea
dos que menos ganan.
Luego se trata de hallar, en primer lugar, el valor de la variable tipificada z, tal que
P(Z<z,)=0'80.
La tabla A. 3. 2 del apéndice nos proporciona el valor z =0'84. Este valor correspon
de a la variable tipificada. Deshaciendo el cambio, resulta:
x,-800
«84 = —
Proposición 8.8: Sea X una variable aleatoria binomial de media |i=np y varianza
(T=npq. Cuando n tiende a °°, la variable aleatoria
X-np
.Jripq
sigue una distribución normal tipificada N(z;0,l).
Un gráfico nos ayudará a entender el proceso que se sigue para aproximar una
distribución binomial por una normal:
A) Se dibuja el histograma correspondiente a la binomial.
B) Se superpone la curva normal con la misma media y varianza que la binomial.
La probabilidad de que la variable aleatoria binomial X tome un valor concreto xo
es igual al área del rectángulo del histograma cuya base contiene el valor xo.
285
Cuando se realiza la aproximación, hay que tener en cuenta que se está aproximan
do una variable discreta por una variable continua, lo que exige una corrección de
continuidad, que consiste en utilizar la siguiente igualdad:
Esta igualdad nos indica que, para calcular la probabilidad de que la variable
binomial tome valores enteros mayores o iguales que a y menores o iguales que b. se
aproxima por el área bajo la normal comprendida entre a-0'5 y b+0'5, lo que supone
añadir la mitad de las áreas de los rectángulos extremos, que, de otro modo, se perde
rían.
En el caso particular en que X tome un determinado valor entero r, la corrección de
continuidad viene dada por la igualdad (14). Se aproxima por el área bajo la normal
comprendida entre los valores r-0'05 y r+0'05, que es una aproximación del área del
rectángulo cuya base está centrada en r.
P(X =r) = P(r-0'05 <X< r + 0'05) (14)
Ejemplo 8.7
Una variable aleatoria X sigue una distribución binomial B(x;n,p) con n=10 y p=0'4.
Veamos la aproximación que se consigue con la normal, calculando las probabilidades
P(X=5) y P(3<X<6) mediante:
a) la tabla de la binomial;
b) la aproximación por la normal.
Solución:
Dibujaremos el histograma correspondiente a la binomial B(x;10,0'4), superponien
do después la curva normal de media |i=np=4 y varianza o:=npq=2'4.
Esta gráfica nos facilita una primera panorámica de la bondad del ajuste.
a) Las tablas de la binomial nos proporcionan, para n=10, r=5 y p=0'4, el valor
0'2007.
Si aproximamos el valor de P(X=5) por la normal, hay que evaluar el área bajo la
normal de media n=10x0'4=4 y varianza a2=10x0'4x0'6=2'4, comprendida entre los va
lores 4'5 y 5'5:
Í4'5-4 5'5-4)
P(4'5<X<5'5) = P\ —— <Z<—— =P((y32<Z <0'96) =
Ejemplo 8.8
Solución:
Se trata de una distribución binomial, donde el número de preguntas es n=100 y la
probabilidad de responder correctamente a cada una de las preguntas es p=l/5=0'2.
Al ser np=100x0'2=20>5 y nq=100x0'8=80>0, se puede aproximar por una normal
N(x;20,4).
Entonces
Í9'5-20 T0S -20'
P(10 < X <20)= P(9'5 < X < 2'05) = P\ <Z<
\ 4 4
287
8.2. La probabilidad de que una persona muera a causa de un virus es 1/250. Hallar la
probabilidad de que mueran seis de las 1000 personas siguientes que sean contagia
das por el virus.
8.4. La probabilidad de que una válvula cardíaca funcione al cabo de dos años es 0'75.
Hallar la probabilidad de que, de las 3500 válvulas colocadas, 2600 estén funcionando
al cabo de 2 años.
8.5. Se sabe que el 0'002 por ciento de los terremotos que se dan en una zona propen
sa a los seísmos es superior al índice 6 de la escala de Richter. Si se producen 500
temblores de tierra en un año, 1 ) hallar la probabilidad de que más de dos tengan una
intensidad superior a 6 en dicha escala. 2) ¿Cuál es el número de terremotos de inten
sidad superior a 6 esperado?
8.6. El número medio de aviones que piden pista para aterrizar en un aeropuerto es de
tres por minuto. Si la torre de control puede atender a ocho aviones por minuto como
máximo, ¿cuál es la probabilidad de que, en un determinado minuto, el número de
aviones sea tal que no puedan ser controlados?
8.7. Una industria de electrónica ha adquirido un robot para montar sus productos.
Durante el mes de prueba, se ha comprobado que 14 días no hubo ningún fallo, 12
días hubo un solo fallo, 3 días se dieron 2 fallos y un solo día se produjeron 3 fallos.
288
8.8. Se sabe que el 25% de los estudiantes de una universidad son fumadores. Se
selecciona al azar una muestra de ocho estudiantes. 1) ¿Cuántos de ellos se espera
que sean fumadores? 2) Hallar la probabilidad de que ninguno sea fumador. 3) Hallar
la probabilidad de que tres sean fumadores.
8.9. Una factoría del automóviles adquiere 500 componentes para montar en sus co
ches. La empresa suministradora le comunica que uno de cada 100 componentes tiene
defecto. Calcular: 1 ) la probabilidad de que 5, 6 ó 7 sean defectuosos; 2) la media y la
desviación típica de la variable X= «número de componentes defectuosos»; 3) los
extremos del intervalo entre los que se encuentran las 3/4 partes del número de com
ponentes defectuosos (utilizar la desigualdad de Tchebycheff); 4) la probabilidad co
rrespondiente al intervalo del apartado anterior.
8.10. De una urna, que contiene 15 bolas rojas y 20 blancas, se extraen seis bolas con
reemplazamiento. Si se define la variable X = «número de bolas rojas extraídas», 1)
¿qué distribución sigue la variable X?; 2) ¿cuál es el número medio de bolas rojas
extraídas?
8.12. Una máquina saca con defecto un 20% de las piezas que fabrica. Si se seleccio
nan seis piezas fabricadas por la máquina, hallar la probabilidad de que: 1 ) dos de ellas
tengan defecto; 2) tengan defecto más de dos; 3) ninguna tenga defecto.
8.13. En un paquete de 25 lámparas hay tres que están fundidas. Hallar la probabilidad
de que, al sacar 3 al azar, una al menos de las tres esté fundida.
8.14. Dada una distribución normal N(z;0,l), calcular las siguientes probabilidades:
1) P(Z<2'25); 2) P(Z>0'35); 3) P(Z<-1 '34); 4) P(Z£2'28); 5) P(-1'5<Z<0,96)
8.15. Dada una distribución normal N(x;l,2), calcular las siguientes probabilidades:
1) P(X<2'35); 2) P(X<-2'35); 3) P(X<5'56)
289
8.16. Dada una distribución normal N(z;0,l ), calcular el valor de a tal que:
1 ) P(Z<a)=0'9798 2) P(Z<a)=0' 1 762
3)P(0'34^<a)=0'1664 4) P(a<Z<r%)=0'6765
8.17. Una variable aleatoria X. que sigue una distribución normal, es tal que
P(X>4)=0'3085 y P(X<7'5)=0'8944
Hallar su media y su desviación típica.
8.18. Se sabe que la estatura de los jóvenes españoles en edad de cumplir el servicio
militar sigue una distribución normal de media 1 '69 m. y desviación típica 0'08 m. Si se
incorporan al ejército 10000 jóvenes, hallar:
1 ) El número de reclutas cuya estatura está comprendida entre 1 '60 y 1 '70 cm.
2) El número de reclutas que miden menos de 1 '60 m.
3) El número de reclutas que miden más de 1 '70 m.
8. 19. Se sabe que la talla de una población de pigmeos se distribuye según una normal
de media 1,35 y desviación típica 0'6. Hallar:
1 ) Entre qué valores en torno a la media de la población se encontrarán el 80% de
los pigmeos.
2) La altura, por encima de la cual, se halla el 15% de los más altos.
Longitud (cm.) 15-16 16-17 17-18 18-19 19-3) 31-21 21-22 22-13 23-24 24-15 15-26 26-27
N° arbustos 4 6 17 22 59 78 62 53 34 20 7 3
8.22. En una clase de 60 alumnos, se sabe que cada uno falta el 4 por ciento de los
días. Hallar la probabilidad de que un día determinado: 1) estén todos los alumnos en
clase; 2) Falten 10 alumnos: 3) falten más de 10 alumnos.
290
Apéndice al capítulo 8:
Demostración de las propiedades de la distribución normal
I. Se trata de una función exponencial, que está definida para todo número real y
toma valores estrictamente positivos.
II. La simetría respecto de x=u resulta evidente, puesto que
f(u-x)=f(M+x)-
III. y=0 es una asíntota horizontal, ya que ümf(x) = 0
1-5 f^i44*»ffl-4».-
luego los puntos de abscisa x=|i-s y x=|i+s pueden ser dos puntos de inflexión. Los
intervalos de concavidad y convexidad se obtienen fácilmente:
Si -°°<x<u-o, es f"(x)>0 y la curva es cóncava,
si |i-o<x<|i+o, es f"(x)<0 y la curva es convexa,
si n+0<x<+°°, es f'(x)>0 y la curva es cóncava.
Esto corrobora que en x=n~o y x=n+o hay dos puntos de inflexión.
\-j=eldy = e¡'
ya que Jí T—' e 2 d\ = I .
- \27t
VIII. Si utilizamos la función generatriz de momentos, resulta:
i) g'(t) = e»'--r(Vi+tdl)
Entonces E(X)=g'(0)=|i.
ü) g'(t)=e,u-~h(\l+tat r + crV"*^
ESTADÍSTICA INFERENCIAL
CAPITULO 9
INFERENCIA ESTADÍSTICA
9. 1 . Fundamento teórico
Las poblaciones, con cuyos datos trabaja el estadístico, son habitualmente dema
siado amplias, de tal forma que no suele ser posible recoger la información de todos
sus elementos, ni siquiera de una parte importante de los mismos.
Incluso en poblaciones menos numerosas, la recogida de datos no siempre es
fácil, unas veces porque lo impide el coste de la propia toma de la información y otras
porque la información lleva consigo la destrucción de los individuos que la compo
nen.
Ante estas situaciones, el investigador puede optar por la selección de un
subconjunto de elementos de la población (muestra), del que recopilará la información
que necesita.
El estadístico, por lo tanto, sólo utiliza los datos que le proporciona la muestra
seleccionada, y, sin embargo, las conclusiones que obtiene deben ser válidas para
toda la población.
Conseguir las técnicas necesarias para realizar inferencias acerca de una población
completa a partir de los datos de una muestra de la misma es el objeto de la «Estadís
tica Inferencial», cuyo fundamento teórico está basado en el modelo matemático del
«Cálculo de Probabilidades».
9.2. Objetivos
Ejemplo 9.1
En el proceso de selección de una muestra, puede suceder que, una vez seleccio
nado y computado un elemento, éste sea devuelto a la población, pudiendo ser selec
cionado de nuevo para formar parte de la misma muestra. En tal caso, se habla de
muestreo con reemplazamiento.
En cambio, si una vez seleccionado un elemento, no puede volver a formar parte
de la misma muestra, se habla de muestreo sin reemplazamiento.
Cuando utilizamos el método de muestreo con reemplazamiento, el resultado de la
extracción de cada elemento es independiente de los resultados anteriores. Además,
en el muestreo con reemplazamiento, el número de individuos de la población no se
acaba nunca, por lo que se puede dar el hecho de muestras con tamaño mayor que el
número de individuos de la población.
En poblaciones finitas, si el muestreo es sin reemplazamiento, el resultado de una
extracción depende de los resultados de las anteriores.
9.6. Estadístico
Sea (X,,X2,...,Xn) una muestra aleatoria simple. Si ahora, para cada muestra posible,
definimos una función numérica de sus datos:
l(X,,X2,...,Xn)
los valores así obtenidos junto con las probabilidades de obtener las respectivas
muestras constituyen una distribución del estadístico 1 en el muestreo.
El estadístico 1(X .Xy...X ) es, por tanto, una variable aleatoria. A este estadístico
nos referíamos en el apartado 1 .2.3, llamándolo entonces estadístico inferencial para
indicar que se trataba de un estadístico cuya función es la de inferir o estimar el valor
de algún parámetro de la población; en adelante, le llamaremos estadístico solamente.
Si el estadístico 1 sirve para estimar el parámetro poblacional L, se dice que 1 es un
estimador' de L.
La notación más frecuente consiste en designar al parámetro de la población por
una letra del alfabeto griego (n será la media, O la desviación típica,...) y al estadístico
que se utiliza como estimador de dicho parámetro con la misma letra sobre la que se
coloca el acento circunflejo:
ÍMT,...
Una estimación puntual de algún parámetro de la población X es un valor particu
lar X del estadístico X.
Así, por ejemplo, un valor particular del estadístico media muestral, calculado desde
una muestra de tamaño n, es una estimación puntual del parámetro poblacional u.
Entre los estadísticos de uso más frecuente se encuentran:
A) La media, mediana y moda, como estimadores de parámetros de tendencia
central.
B) La cuasivarianza y la desviación típica muestral, como estimadores de los
parámetros de variabilidad.
Las definiciones de estos estadísticos coinciden con las que se dieron en los
primeros capítulos para las características de una variable estadística. Aparecen aho
ra, como novedad, la cuasivarianza y la desviación típica muestral.
J - „-/
siendo X la media muestraI
i-i
%x] (2)
n(n - ¡)
1 " I "
s~ = :¿Á.x,-xf = -¿Xx2,-2xxl + x:) =
n-li, n-li.i
I n n
14
Teniendo en cuenta que x ■- J,*, si se multiplica y divide por n, se tiene:
"~
n¿,jn-n ¡
Y.x¡-2nx~ + nx~ =
Mn-lKZ n(n-l)
n^x,'- Xr
- ,.i V.w ¡
n(n-l)
la media muestral.
Para cada muestra particular k, tenemos un valor particular de la media muestral
— x¡ + xi+... + x„
x,= n
Con estos valores j podemos construir una distribución de frecuencias, con lo
que tendríamos la distribución muestral de la media.
Ejemplo 9.2
A) Estimador insesgado:
Ejemplo 9.3
entonces poco probable un salto de 7'50 metros, pero mucho menos probable será
obtener una muestra completa de 40 jóvenes cuyo salto medio sea de 7'50 metros.
Es menos probable obtener un valor extremo de la media muestral que obtener el
mismo valor extremo en un salto particular.
Este razonamiento nos lleva a pensar que será menor la dispersión de la media
muestral que la de la distribución de la población, disminuyendo la dispersión muestral
a medida que aumenta el tamaño de la muestra.
El teorema central del límite permite estimar la dispersión de la distribución de las
medias muestrales a partir de una muestra.
Teorema central del límite: Dada una población de media \i y varianza finita
O2, la distribución en el muestreo de la media tiende, cuando aumenta el tama
ño n de la muestra, a la distribución normal
N (3)
V VnJ
Por tanto, en las hipótesis del teorema1, la media muestral será u- = u y la varianza
de la media muestral a-r = —
n .
a,--?-
v«
(4)
y se conoce como error típico de la media.
La desviación típica de la población a suele ser desconocida. En este caso se toma
la desviación típica muestral s como estimación de a, quedando como error típico
estimado de la media:
a, --L (5)
Vn
En general, se llama error típico de un estadístico* a la desviación típica de su
distribución muestral.
3 El teorema central del límite es válido en el caso discreto y en el caso continuo (sólo exige
que la varianza sea finita), dependiendo el grado de aproximación del tamaño de la muestra y del
tipo de población.
4 La mayoría de los autores al «error típico estimado» le llaman «error típico» únicamente.
305
Ejemplo 9.4
9. 1 2. Estimación puntual
Consideremos una población que tiene una distribución normal N(|i.o). donde u. es
la media y a la desviación típica, y sea (XrX, Xn) una muestra aleatoria simple de
dicha población. Entonces:
A) Un estimador puntual de la media poblacional |i es la media maestral:
Propiedades:
N" flexiones 35 41 46 48 50 52 53 54 56 60
N° alumnos 5 6 2 10 15 6 11 10 5 5
A) p es un estimador insesgado de p.
\ ri( I n )
B) p es de mínima varianza, siendo op =J (6)
Ejemplo 9.6
0'54x0'46 0,Q45
120
Supongamos una población tal que las modalidades del carácter siguen una distri
bución de Poisson de parámetro \l, y sea (X ,X,,..., X ) una muestra aleatoria simple.
Entonces, un estimador puntual del parámetro es la media muestral:
i "
Propiedades:
1. |1 es un estimador insesgado de u.
Ejemplo 9.7
Número de bacterias 0 1 2 3 4 5 6 7 8 9 10 11
Número de cámaras (1 2 7 16 16 18 13 8 7 3 3 2
487
La estimación es u>-jr=-=J' 13
a/ O2 (Si
¡V
v ni ni
X-Y-(\l,-\l2)
Entonces Z sigue una distribución normal N(0.1).
a,
—+— a^
II I II2
i) n +n,>30y n =n,
310
X - Y -( u - u )
Entonces Z = , ' es normal N(0, 1 ).
Si S2
—+—
n, ri2
ii) n +nn<30
En esta situación, debemos considerar dos posibles alternativas, según sean las
varianzas poblacionales desconocidas íguales o distintas:
a) Varianzas iguales:
X-Y-(y*r\i2)
El estadístico f - r~. j sigue una t de Student con n^n^-2 gl,
s¡— + —
V n, ri2
siendo s la raíz cuadrada positiva de la media ponderada de las cuasivarianzas
muestrales:
II I II2
( 2 2Y
Si S2
\nl "-V
siendo f 2V ( 'V
(11)
S, S
n, + 1 n2 + /
Ejemplo 9.8
Primera muestra 8'2 83 8'4 8"4 8'5 8'6 8'6 8'6 87 8'8
Segunda muestra 8'1 8'2 8'2 8'3 8'4 8'4 8'5 8'5 8'5 87 8'8 8'9
si = 0'003S
í3 = 0'0055
Como n,+n,= 10+12=22<30 y las varianzas poblacionales son desconocidas, pero
iguales, la estimación que tomaremos de la desviación típica de la diferencia de medias
es:
a,,=sj—+— =0029
Ejemplo 9.9
muestras que han dado los siguientes resultados en cuanto al número de horas con
tinuadas de funcionamiento correcto:
Para tomar una decisión, los cirujanos necesitan hacer una estimación del cociente
de las varianzas de la población.
Suponiendo que las dos poblaciones sean normales, una estimación de la razón de
las varianzas viene dada por el cociente de las varianzas muestrales:
s) 2100
-, = = 079
s\ 2650
Ejemplo 9.10
D Í,D, = —(-66)=-4'4
sD = j8'935=2'98
Para conocer la eficacia de una vacuna anticatarral, se suministra ésta a una mues
tra aleatoria de 50 personas. Se observa que sólo 4 de ellas se han acatarrado.
314
4(,-4-)
50)
=0'066
Ejemplo 9.12
N° de flexiones 35 41 45 46 48 50 52 53 54 56 60
N" de alumnos 5 6 5 2 10 15 6 11 10 5 5
En efecto, si tomamos a=0, el intervalo estará formado por la recta real completa,
pero no hemos conseguido información alguna; ya sabíamos que el parámetro era un
número real.
Los valores más usuales para a son a=0'05 ó a=0'01, siendo preferible el valor
0'05 que proporciona un intervalo de confianza del 95%; pero la elección dependerá,
en cada caso, de las necesidades y exigencias del investigador.
Una vez seleccionado el nivel de significación a, hay que determinar a partir de la
distribución del estadístico A, dos valores X y X , que dependen de a, tales que
X— u
Por tanto, la variable tipificada Z = —-— se distribuye según una normal N(0, 1 ).
A/ñ
Si elegimos un nivel de significación a=0'05, tendremos que hallar dos valores Xi
y X2 tales que
P(Xi<Z<X2) = l-a (15>
Ot/2.0025
a/2.0'02b
P = l-a
o — a
i -za/2-r<X-n<za/,^
V/I v«
/-a
Multiplicando ahora por -1 cada uno de los términos, se invierte el orden de las
desigualdades, resultando:
a a
4 V» \n
= l-a
— a ~ o 1 (16)
X ~ Zn /z ~7= , X + za 12 ~7=
Este intervalo es tal que contiene el valor del parámetro con una probabilidad igual
al-a.
Una vez realizado el experimento, para una muestra concreta, se obtiene un valor
particular de la media muestral xo.
318
(17)
h V'i \rt.
y, como el tamaño de la muestra es n=80, se tienen los datos necesarios para hallar un
intervalo confidencial:
2'75 2'75
4978 - 1'96 -r= < u < 4978 + 1'96 -¡=
y¡80 yÍ80
4978 - 0'60 < n < 4978 + 0'60
/ = [49'18.50'38J
que, al ser un intervalo particular, podrá cubrir o no el verdadero valor del parámetro.
Distintas muestras darán diferentes valores de la media y, por tanto, darán lugar a
distintos intervalos de confianza. Así pueden observarse los intervalos de la figura
9.3; todos ellos son de la misma amplitud, ya que ésta depende únicamente del valor
crítico, una vez se ha fijado el tamaño de la muestra.
Los centros de los intervalos señalan las diferentes estimaciones puntuales. No
todos los intervalos cubren el valor del parámetro.
— í — s (19)
/= X-ta/2 r~ , X + ta/2 r'
Vn y1n
320
Para una muestra particular, se tendrán los valores Xa y sa que darán lugar al
intervalo particular
Ejemplo 9.13
Se trata de hallar un intervalo de confianza del 95% para cubrir la vida media de
una población de lámparas halógenas a partir de los resultados que se han obtenido
en una muestra de 20 lámparas, cuyos períodos de duración (expresados en horas)
han sido:
480 345 427 386 432 429 378 440 434 503
436 451 466 394 422 412 507 433 480 429
Se supone que la duración de las lámparas sigue una distribución normal, pero se
desconocen la media y la varianza de la población.
Como estimador de la media, se toma la media muestral, y, como estimador de la
varianza, la cuasivarianza. Calculando sus valores, resulta:
Yo = 434'2
so = 40'63
Si fijamos un nivel de significación a=0'05, al ser n=20, la variable
s / yjn
sigue una distribución de Student con 19 gl. El nivel a=0'05 proporciona en las tablas
un valor crítico t0,o2j=2'093.
El intervalo de confianza del 95% es, por lo tanto:
40'63 40'63
1„ 434'2 - 2'093 434'2 + 2'093
420
es decir:
I=[415'18,453'21]
Este intervalo puede cubrir o no el verdadero valor del parámetro (vida media de
las lámparas).
}2\
yin yin
y la amplitud del intervalo depende del error típico (ahora estimado) de la distribución
de la media muestral.
Hablando, por tanto, en sentido de amplitud, no se puede afirmar que el intervalo
de confianza proporcione mayor calidad que la estimación por punto.
322
Una muestra pequeña puede proporcionar resultados poco fiables, mientras que
una muestra grande puede resultar demasiado costosa. Por ello, en numerosas ocasio
nes, interesa determinar previamente el tamaño de la muestra.
Se trata de determinar el tamaño n que debe tener una muestra para que la distan
cia entre la media poblacional y la media muestral sea menor que un cierto valor e al
que llamaremos error.
Debe ser, por lo tanto
\X-\i\<e
o, lo que es equivalente
e =za/2-¡=
(22)
e
Ejemplo 9.14
Solución
Por tratarse de una distribución normal, sabemos que, al ser l-a=0'95, es a=0'05,
y el valor crítico que proporciona la tabla de la normal N(0, 1 ) es z .= 1 '96. Luego
323
, V2 a2 (1'96?0'2
»-(**) 7—^7—™» «77
La muestra debe tener, por consiguiente, 77 elementos.
(n-l)s' (23)
X =
p(xL,2<x2<xí,2) = i-u
siendo Xa/2 el valor de la X ~ con n-1 gl. que deja un área de ot/2 unidades a la derecha
y X ,.o^ el valor de la X ' con n-1 gl., que deja un área de l-a/2 a la izquierda.
J 2 (n-l)s2 ,
1-a
\
Si dividimos cada término de las desigualdades por (n-1)s2, al tratarse de una
cantidad positiva, se mantiene el orden de las mismas:
324
(24)
Ejemplo 9.15
Solución:
La cuasivarianza es s2=0'852=0'7225
Entonces, para oc=0' 10, es a/2=0'05 y l-a/2=0'95.
Las tablas de la X ' para 24 gl y a=0'05, nos proporcionan los valores
donde F2-a/2. „r/. n2-, es el valor de la abscisa que deja a la izquierda un área de aJ2, y
f es el valor de la F que deja a su derecha un área de l-a/2.
/7,n,-U,-l
Multiplicando cada uno de los términos de las desigualdades por s22/s,2, e invir-
tiendo el sentido de éstas, queda:
O] Si /
Ái '
^S2 r a/2.nrlMrl
<-7<— .
®2 ^2 * I-a I2.nrl.nrl J
1-a
I
Teniendo en cuenta que — *'a/2,nr/,nr,
Fl-a/2.nrl.n2-l
( 2 I
5/
resulta < ~2 < 2 ra/2.n2-l.ni-l 1-a
\S2 fa/2.nrl.n2-l O? S
quedando finalmente como intervalo de confianza del (1-a) 100% para el cociente de
las varianzas a,/CJ2:
. ,, (26)
$2 Fa/2.nrl.ni-1 í
°/2,n -l,n -1
Ejemplo 9.16
cada litro de combustible, con una cuasivarianza de l'l km. por litro, y otros 12
coches de la marca B, que proporcionan una media de 15 km. recorridos por litro, con
una cuasivarianza de 2'9 km. por litro.
Si se supone que la distancia recorrida por cada litro de combustible sigue una
distribución normal en ambas marcas, hallar un intervalo de confianza para el cociente
de varianzas.
Entonces
1 = (VI3,1'25)
Un intervalo de confianza para el cociente de los errores típicos ojo, se obtiene
del anterior extrayendo la raíz cuadrada de los extremos:
/ =((T36,1'12)
1
1350 1480 1610 1740
". 24 30 40 6
9.3. Los pesos de los alumnos de una escuela universitaria están distribuidos normal
mente con media |i=51,5 kgs. y desviación típica a=2,8 kgs. Si se selecciona una
muestra de tamaño n=50, hallar la media y la desviación típica muestrales.
9.4. Se sabe que el peso medio de los alumnos de una universidad es de 50'3 kgs. con
una desviación típica de 2,4 kgs. Si se selecciona una muestra de 40 alumnos, hallar:
327
1 ) la probabilidad de que el peso total de los alumnos esté comprendido entre 1960 y
2000 kgs.; 2) la probabilidad de que el peso total sea superior a 2000 kgs.
9.5. Una máquina produce 200 piezas diarias, siendo 0,2 la probabilidad de que una
pieza salga con defecto. Hallar: 1) la probabilidad de que 70 de las piezas fabricadas en
un día sean defectuosas; 2) la probabilidad de que las 3/4 partes de las piezas no
tengan defecto.
9.7. Una población se compone de los números 3, 4, 6, 8 y 10. Consideremos todas las
muestras posibles que se pueden formar de tamaño 2, con reposición. Hallar: 1) la
media y la desviación típica de la población; 2) la media y la desviación típica de la
media en el muestreo.
13 19 12 16 13 7 8 15 16 7 19 27 10 4 10 15 7 5
3 10 7 10 18 5 13 6 10 7 13 7 9 13 22 18 25 14
9.9. Los pesos de 4500 estudiantes de bachillerato de una ciudad están distribuidos
normalmente con una media de 56' 5 kgs. y una desviación típica de 2' 5 kgs. Si se
seleccionan 40 muestras con reposición de 20 estudiantes cada una, hallar la media y
la desviación típica de la distribución de las medias muestrales.
9.10. De una población distribuida normalmente con media 40 y desviación típica 2'5
se extrae una muestra de tamaño 8, y, de otra población también distribuida normal
mente, con media 35 y desviación típica 2, se extrae una muestra de tamaño 6. Hallar
la probabilidad de que la diferencia de las medias muestrales sea menor que 7.
9.11. Se extrae una muestra de tamaño n=20 de una población normal con varianza
conocida a2=5. Hallar la probabilidad de que la cuasivarianza muestral: 1) sea mayor
que 8' 5; 2) sea mayor que 3 y menor que 5.
328
9.14. Un almacenista ha adquirido de una fábrica 100 lámparas, cuya duración media
ha sido de 1000 horas. Sabiendo que la desviación típica de la producción de lámparas
de la fábrica es de 40 horas, hallar un intervalo de confianza del 99% para la duración
media de la población.
9. 19. Una muestra aleatoria de 100 automovilistas consultados por el servicio nacional
de tráfico ha dado como resultado que un automóvil recorre por término medio 1 6400
km. al año con una desviación típica muestral de 2300 km. Hallar un intervalo de
confianza del 95% para el recorrido medio de un automóvil en España.
329
9.20. ¿Cuál debe ser el tamaño de la muestra para el ejercicio anterior si se quiere tener
una confianza del 95% de que la media muestral difiera menos de 400 kilómetros de la
media real?
9.22. De una población normalmente distribuida con desviación típica conocida o=3'5,
se quiere extraer una muestra. ¿Qué tamaño debe tener si la probabilidad de que la
media muestral diste de la media poblacional más de 1 '5 debe ser igual a 0'05?
9.23. En un centro escolar, se sabe que el número de faltas de ortografía que cometen
los alumnos está distribuido normalmente. Se seleccionan dos muestras al azar, una de
8 alumnos de un grupo, y otra de 10 alumnos de otro grupo, a quienes se les hace un
dictado, que da los siguientes resultados:
Grupo 1 9 7 9 11 11 12 12 15
Grupo 2 7 9 9 11 11 11 11 13 13 14
9.25. Se conoce, por sondeos previos, que el 80% de los 1000 alumnos de una univer
sidad son partidarios de hacer huelga. ¿Cuál debe ser el tamaño de la muestra para
que, con un nivel de significación del 5%, la proporción de alumnos partidarios de la
huelga diste menos de 0'02 de la proporción de la población?
9.26. El tiempo que un niño está ante el televisor sigue una distribución normal. Una
muestra de 90 niños dio una media de 8 horas semanales con una desviación típica de
2'5 horas. Hallar un intervalo de confianza del 95% para la media de horas que un niño
está ante el televisor.
9.27. Una población se distribuye normalmente con media 30 y desviación típica 6'5.
Si se extraen muestras de tamaño 20, hallar un intervalo de confianza para la desvia
ción típica muestral.
CAPITULO 10
CONTRASTES DE HIPÓTESIS
Ejemplo ¡0.1
El significado de esta alternativa supone admitir que la diferencia entre el valor del
estimador y el valor del parámetro no se debe a un error de muestreo, sino a que la
hipótesis nula no es correcta. En otras palabras, si la hipótesis nula fuera correcta, se
habría producido un suceso «suficientemente improbable» como para rechazar dicha
hipótesis, lo cual supone admitir que la muestra seleccionada pertenece a otra pobla
ción con una media distinta de 4950.
Situación real
H es cierta H, es cierta
Decisión Acepta H0 Decisión correcta Error de tipo II
del
fabricante Rechaza Ho Error de tipo I Decisión correcta
334
rresponden a las dos colas de la figura 10.1. El área de cada cola es a/2=0'025, y el área
total de rechazo, también llamada «región crítica», es la suma de las áreas de ambas colas:
0'025-tO'025=0'05
que es el valor del nivel de significación elegido.
Para poder adoptar una decisión, se necesita conocer la distribución del estadísti
co adecuado, que, en nuestro ejemplo, es la media muestral.
Sabemos que la media muestral X sigue una distribución normal
.V
que no sigue una distribución normal. La distribución normal es una buena aproxima
ción cuando el tamaño de la muestra es mayor que 30.
La distribución de la variable t, válida para todos los tamaños de la muestra, es
una t de Student con n-1 grados de libertad.
Para hallar la cuasivarianza muestral, hay que calcular las n diferencias a la media
X, -X.
Como la suma de todas las diferencias es cero, en virtud de esta relación, la n-
ésima diferencia queda determinada cuando se han evaluado las n-1 primeras. Luego,
337
Ejemplo 10.2
4917 4948 5082 5105 4865 5068 4935 5090 5045 5080
5136 5084 4909 4935 5120 4936 5014 5125 4933 5088
Con estos datos, los valores obtenidos para la media y la desviación típica
muestrales son:
X = 502075 Y s = 87'94
luego el error típico de la media es:
S 87'94
a-x = -¡= = —f— = 87'94
4n V20
Como la media de la población establecida en la hipótesis nula es u=4950, será:
X-u. 502075-4950 7075
t= = = = 3'59
s/Jn 19'66 1966
El valor crítico que corresponde, en la tabla, a la t con 19 gl al nivel 0'025=0'05/2 es
ta/2„=2'093
El valor estimado t=3'59 es mayor que el valor crítico 2'093, por lo que el suceso es lo
«sufientemente improbable» como para rechazar la hipótesis nula Ho y llegar a la conclu
sión de que no se puede admitir que la duración media de las baterías sea de 4950 horas.
Los contrastes de hipótesis que hemos planteado hasta aquí se caracterizan por el
hecho de existir dos colas o áreas de rechazo de la hipótesis nula, una en un sentido
y otra en el lado opuesto de la curva.
338
Ejemplo 10.3
Si el tamaño de la muestra
(número de alumnos) es 26, el
valor de la t de Student con 25 gl
que deja el 5% de las calificacio
nes medias por encima del valor
crítico, (es decir, en la cola supe
rior de la distribución), corres
ponde al valor crítico
W=1'708
Luego la hipótesis nula será
Figura 10.3: Contraste unilateral (n<30).
rechazada si la variable tipificada
De esta forma, resulta más fácil rechazar la hipótesis nula para el profesor cuando
los resultados se producen en el sentido por él previsto, ya que un contraste bilateral
exigiría un valor de t superior: t,5nn,5=2'060.
Z=
O /4ñ
que deja el 57c de las calificacio
nes por encima corresponde al
valor
Figura 10.4: Contraste unilateral (n>30).
W1'»
La hipótesis nula será rechazada si la variable toma un valor superior a 1 '65, en
lugar de 1 '96, como sucedía en el caso bilateral.
Ejemplo 10.4
En efecto, al ser —
341
-7093 = í/Vn
r= y 7093 = s/yjn
£
\i=X±7093
4~n
Luego los límites del intervalo son:
límite inferior: X-7093-¡=
X-7093-r<\i<X + 7093-¡=
•Jn vn
Figura 10.5: Intervalo de confianza del 95% para la vida media de baterías.
Este es un intervalo aleatorio tal que la probabilidad de que cubra el valor de la media
de la población es 0'95. Ahora bien, el fabricante dispone de una única muestra y, para
esa muestra particular, el valor de la media muestral es en el ejemplo que nos ocupa:
X„=5020'75
y el valor de la desviación típica muestral:
so = 8794
So
luego = 1966
420
y, por lo tanto, se tiene el intervalo particular
342
Quien utiliza las técnicas de los contrastes de hipótesis, generalmente está intere
sado en que la hipótesis alternativa sea aceptada, ya que suele ser ésta su hipótesis
de trabajo.
Por este motivo, es importante, al plantear un contraste de hipótesis, que haya una
probabilidad alta de aceptar la hipótesis alternativa cuando ésta sea correcta.
Resulta evidente que el interés del investigador, además de trabajar con un nivel
de significación pequeño, está en que el contraste tenga la mayor potencia posible, de
tal modo que se disponga de una probabilidad alta de que sea aceptada la hipótesis
alternativa (que es la hipótesis de trabajo), cuando ésta sea correcta.
A) Nivel de significación:
B) Tamaño de la muestra:
Se ha podido ver cómo el error típico de cada estadístico depende del tamaño n de
la muestra, que aparece en el denominador como raíz cuadrada de n, raíz cuadrada de
n-1,... lo que confirma que la significación de un contraste, que está en función del
estadístico elegido, depende del tamaño de la muestra a partir de la cual éste ha sido
evaluado.
Por tanto, si permanecen constantes las restantes variables, cuando el tamaño
muestral aumenta, disminuye el error típico del estadístico y, en consecuencia, crece la
potencia.
Cuando una hipótesis nula es falsa, puede serlo en un grado más o menos alto. No
es posible conseguir apreciar la intensidad de su grado de falsedad comparándola con
una hipótesis alternativa genérica, como sucede al contrastar las hipótesis
con una hipótesis alternativa específica, en que se fija un valor concreto del parámetro,
como puede ser:
H,= n = li0+2
Como medida del grado de falsedad de la hipótesis nula se utiliza el índice de
discrepancia, T, que proporciona una medida de la diferencia entre las hipótesis nula
y alternativa, y que se expresa como un valor tipificado.
r=d-
o
siendo d = u - u0
El índice de discrepancia señala la diferencia entre los valores postulados en las
hipótesis, medida en desviaciones típicas.
Este factor Y está relacionado con las restantes variables que intervienen en la
determinación de la potencia, de forma que, si se aumenta el índice de discrepancia,
crece la potencia, ya que resulta más probable rechazar la hipótesis nula cuando
aumenta el grado de falsedad.
Por otra parte, si se mantienen constantes el resto de los factores, cuanto mayor
sea el índice de discrepancia, menor es el tamaño de la muestra necesario para obtener
un contraste significativo.
En la práctica, a veces no resulta fácil determinar el índice de discrepancia más
adecuado; en estas situaciones, se toma algún valor convencional de modo similar a
la forma en que se procede para fijar el nivel de significación. Los valores que habi-
tualmente se toman en estas situaciones son específicos de cada prueba. En el con
traste de la media, se suelen tomar los valores: r=0'2, T=0'5 ó T=0'8, según se desee
una potencia pequeña, media o alta.
J a-(\l»+d) ) J a-\l„ d
p\z< '7r> = n„+j = p\z<—ff H-llg+tl -
/Vn
= P Z<za- H = |i„ + ¿ (li
o/Vn
De ( 1 ) se deduce que
"¿P ~ <Kt (2)
a / 4ñ
de donde se obtiene
2a +; V¿ (3)
~Zp - Za (4,
a / 4ñ
de donde resulta
, /r + z» =-V« (5)
Las ecuaciones (3) y (5) relacionan los errores de tipo I y de tipo II con el tamaño
de la muestra y la distancia entre los valores del parámetro en la hipótesis nula y en la
hipótesis alternativa específica.
346
y» - , M
El factor de equilibrio coincide con el primer miembro de las expresiones (3) ó (5),
según el tipo de prueba:
Los valores de la potencia están tabulados. La tabla A.7 del apéndice A propor
ciona los valores de la potencia en función del factor de equilibrio 8, del nivel de
significación a y del tipo de prueba (bilateral o unilateral).
El índice de discrepancia, T, y la función del tamaño de la muestra, f(n), son
específicas de cada prueba.
347
El índice de discrepancia, que mide la diferencia entre los valores del parámetro en
ambas hipótesis, viene dado en unidades de desviación típica. Así, en la prueba
anterior:
r=d/a
La función f(n) depende del papel que n desempeña en la expresión del error típico
del estadístico que se utiliza para cada prueba. En el contraste anterior:
fin) = 4n~
Ejemplo 10.5
á 50
/-(3 Z>: ,u =n„+d\=P Z>1'96--
/4n~ 350 /V 100 )
= P(Z> (Y53) = 1-P(Z< 0'53) = 1 - (Y701 9 = (Y2981
Por tanto, la potencia del
contraste es aproximadamente
0'3.
Resulta más cómodo traba
jar con el factor de equilibrio,
puesto que la tabla A.7 nos
da directamente el valor de la
potencia en función de 5, para
el nivel de significación y el
tipo de prueba elegidos.
El factor de equilibrio, Figura 10.8: Potencia del contraste de il-4950 con
para los datos del ejemplo M=5000 (l-fi=0 3).
10.5, es
50
5= r-fin) = —yfñ- 1100 = 1'42
350 '
Para 8=1 '42, a=0'05 y una prueba bilateral, la tabla A.7 proporciona, para la poten
cia, un valor de 0'3, que coincide con el resultado que acabamos de obtener.
Si se quiere una mayor potencia, habrá que modificar alguna de las variables. Así,
348
aumentando el tamaño de la
muestra, aumentaría la poten
cia del contraste.
Rechazo
En cambio, la potencia
disminuye si, manteniendo fi
jas las restantes variables,
tomamos un valor específico
de la hipótesis alternativa más
próximo al valor del parámetro
de la hipótesis nula, 4950,
como puede ser u=4975. Figura 10.9: Potencia del contraste de |t=.í950 con
La hipótesis alternativa es 11=4975 (l-fi=0ll).
ahora:
H,= \i =4975= \ln + 25
Entonces:
u» + 25-u„ 4975-4950 25
r=— —= = — = O'o7
a 350 350
y, por tanto
8 = Vf(n) = ff074wb = &7
Si o=0'7, para una prueba bilateral y un nivel de significación a=0'05, la tabla A.7
proporciona un valor de la potencia
1-B=0'11
Observamos cómo, al acercarnos al valor real del parámetro, la potencia disminu
ye, mientras que la probabilidad de error de tipo II aumenta:
B=1-011=0'89
correspondiente a la hipótesis
nula y a el nivel de significación.
Cuanto más se aproxima el valor
específico del parámetro en la
hipótesis alternativa al valor de
la hipótesis nula, mayor es el
error de tipo II y, en consecuen
cia, menor es la potencia. Para
un contraste bilateral, la poten |J = Ho
cia es simétrica respecto de la
recta u=H0 y alcanza su valor Figura 10.10: Curva de potencia.
mínimo para 1-P=^,.
Para el nivel de significación prefijado a=0'05 y muestras de tamaño 100, si con
mente el tamaño de la muestra. Por otra parte, es de desear una probabilidad alta,
como B=0'20, de cometer un error de tipo II, si se tiene en cuenta que el investigador
debe ser cauto a la hora de rechazar una hipótesis nula cuando ésta sea verdadera,
pues ello le podría causar una notable falta de prestigio profesional.
Supongamos que, en lugar de predeterminar el tamaño de la muestra, quisiéramos
averiguar cuál debe de ser el tamaño adecuado de la misma en función de la potencia
y del nivel de significación, para una prueba bilateral.
Las relaciones (3) y (5) nos permiten evaluar el tamaño de la muestra en función
del nivel de significación, de la potencia y de la distancia entre los valores del parámetro
correspondientes a las hipótesis nula y alternativa específica, obteniéndose:
(9)
n
tu '2+za)~ a 5-V 8- (10)
d2 d2 " r2
donde ahora es 8=z ¡x/2„+z„.(i
Ejemplo 10.6
Solución: Si a=0'05 y 1-B=0'95, para una prueba bilateral, la tabla 1.7 proporciona
el valor 8=3 '6.
50 50
Como T = — = — = 0.143
a 350
3'6
resulta: = 634
(y143
Se necesita una muestra de 634 baterías para conseguir una potencia de 0'95 con
un nivel de significación del 5% en una prueba bilateral.
351
10.1. De una población normalmente distribuida con desviación típica a=4,3, se extrae
una muestra de tamaño n=100, cuya media es 27,6. Efectuar el contraste de H,=|i=26
con H = n * 26 al nivel de significación del 5%.
10.3. La estatura media de las mujeres de Castilla-La Mancha se estima que es de 1 '65
m. con una desviación típica de 0'68 m. Se selecciona aleatoriamente una muestra de
60 mujeres de la provincia de Toledo, que da una estatura media de 1 '67 m. ¿Se puede
sacar la conclusión de que las mujeres de Toledo son más altas que las del resto de la
comunidad?
10.4. Una máquina, que llena botes de refrescos, se ajusta de modo que la cantidad de
refresco que deja en cada bote siga una distribución normal de media 250 mi. y con
una desviación típica de 20 mi. Se realiza una prueba de inspección para ver si la
cantidad servida por la máquina está de acuerdo con la programación establecida. La
prueba consiste en tomar una muestra aleatoria de 25 refrescos y medir su contenido,
resultando una media de 236 mi. A la vista del resultado, ¿se puede llegar a la conclu
sión de que la máquina se ajusta a la programación?
10.6. Con los datos del ejercicio 10.5, hacer el contraste de H,=u=l 15 con H =H<1 15.
10.7. De una población normalmente distribuida con desviación típica conocida a=3'6,
se extrae una muestra de tamaño 20, que da una media de 25 '4. Para un nivel de
significación del 5% y una prueba bilateral, hallar la potencia del contraste de H, =H=27
con IL=ií=30.
10.8. Con los datos del ejercicio 10.7, hallar el tamaño mínimo que debe tener una
muestra si se quiere conseguir una potencia del 80%.
352
10.9. ¿Cuál debe ser el tamaño mínimo muestra1, en el ejercicio 10.4, para conseguir un
nivel de significación del 5% y una potencia del 80%, si se quiere contrastar la hipó
tesis nula Hn:u=250 con la hipótesis alternativa específica H,:n=240?
10.10. En una determinada región de España, se ha hallado que la vida media de una
muestra aleatoria de 90 personas que han fallecido en los tres últimos meses, es de 71
años. Si suponemos que la vida media de los españoles sigue una distribución normal
de media 69 años y desviación típica 8'5 años, ¿se puede afirmar que la vida media en
esa región es mayor?
10. 1 1 . La duración de cierto modelo de neumáticos de automóvil es de 49000 km. con una
desviación típica de 3400 km. Un inventor presenta una patente asegurando que la
duración media aumenta considerablemente. Para contrastar esta afirmación, se prueban
15 neumáticos fabricados con la nueva patente, obteniéndose los siguientes resultados:
49500, 52000, 57000, 60000, 45000, 45000, 5 1000, 56000, 58000, 61000, 46000, 57000,
54000, 58000 y 55000.
10.14. Construir un intervalo de confianza del 95% para el ejercicio 10.13, y hallar la
potencia del contraste para una hipótesis alternativa específica H :H=27 cm. en una
prueba bilateral con un nivel de significación del 5%.
10.15. Se sabe que una población está distribuida normalmente con media |1=12 y
desviación típica a=30. Determinar el tamaño que debe tener una muestra para efec
tuar el contraste de H,=u=12 con H=u=6, si se quiere conseguir una potencia de 0'95
y un nivel de significación o(=0'05.
353
10.16. Un industrial de la rama del frío quiere demostrar que la vida media de sus
motores para frigoríficos es superior a las 90000 horas. Para ello dispone de una
muestra de 35 frigoríficos.
10.17. Un fabricante de hilo de acero afirma que el hilo fabricado por su empresa tiene
un coeficiente de ruptura de 120 Kgs. con una desviación típica de 4'5 Kgs. Se
selecciona una muestra de 40 hilos de acero y se miden los coeficientes de ruptura,
dando una media de 1 1 5 kgs.
/. Muestras grandes:
que se distribuye según una t de Student con n +n,-2 grados de libertad, donde
(n,-l)s)+(n2-l)s]¡ 1 1
Sxr = i' 1 7 1 +_
(x-y)-(n,-l0
z=
—+ —
til n2
Cuando se trabaja con pequeñas muestras, se deben hacer las siguientes precisio
nes:
A) Si las dos muestras tienen el mismo tamaño o un tamaño muy próximo y las
poblaciones tienen la misma forma o una forma muy parecida, el contraste de la t
de Student produce resultados correctos.
B) Si los tamaños muestrales son distintos, pero las varianzas poblacionales, aun
que desconocidas, son iguales, el uso de la t de Student es correcto.
C) Si los tamaños muestrales son distintos y las varianzas de las poblaciones
también son diferentes, no es correcto el uso de la t de Student. En este caso, se
debe intentar seleccionar muestras del mismo tamaño; si esto no fuera posible,
hay pruebas especialmente diseñadas.
Vamos a estudiar, en primer lugar, el contraste de diferencia de medias en el caso
de muestras independientes, haciendo dos apartados según se trate de grandes o
pequeñas muestras.
358
Entendemos por muestras grandes aquellas cuyo tamaño es mayor o igual que 30,
para las cuales son válidos los contrastes de diferencias de medias que se basan
tanto en la t de Student como en la distribución normal.
Ambos métodos dan un buen resultado; su finalidad es comprobar si la diferencia
entre los resultados de las medias muestrales es un reflejo de una situación real en las
poblaciones o se trata de una diferencia debida al azar.
En todos los campos de la investigación se presentan a menudo situaciones simi
lares a la que plantea el siguiente ejemplo:
Ejemplo 11.1
1 0 1
2 0 1
3 1 1
4 3 2
5 7 7
6 8 6
7 5 4
8 6 6
9 7 4
10 1 0
359
Efectuados los cálculos, las medias y cuasivarianzas de ambas muestras con sus
tamaños figuran en el siguiente cuadro:
G. experimental G. de contraste
Media 6'68 6' 15
Cuasivarianza 3' 10 4'00
Tamaño muestral 38 32
Por medio de esta prueba, el profesor quiere saber si el incremento que se observa
en la nota media del grupo experimental es una garantía de que el modelo de simula
ción supone una mejora en el rendimiento escolar de los alumnos.
En otras palabras, hay que conocer si la diferencia entre las calificaciones medias
de ambas muestras es motivo suficiente para afirmar que las medias de las respectivas
poblaciones son también diferentes y, por tanto, lo son las propias poblaciones, o
bien, si dicha diferencia se debe únicamente al error que introduce el azar al seleccio
nar cada muestra.
El interés se centra en discernir si la diferencia H, - n, entre las medias de las dos
poblaciones, que se suponen distribuidas normalmente, es igual a cero', o lo que es
igual, si |i, = |i, .
Luego las hipótesis nula y alternativa para un contraste bilateral son:
Por tratarse de muestras grandes de dos poblaciones cuyas varianzas son desco
nocidas, se realiza el contraste por medio de la t de Student.
Bajo la hipótesis nula, el estadístico
X-Y
/=-
Sx-Y
(n,-1)s]+(n,-l)S2 (1
Sxr — — + —I
n¡ + ri2-2
s= ~
n¡ + n2 - ¿
1 También podría contrastarse la hipótesis de que la diferencia de medias tome otro valor
distinto de cero.
360
¡(n,-I)s;+(n2-l)s-; í —
I — 1)
S,y = , ~ +
X -Y 6'68-6'15
(n,-l)sl+(n2-l)sl( 1 1- 37 3'10 + 3I 4( 1 I
+
ni + ti2 -2 \n¡ n? , 68 (38 32
0'53 0'53
= 1'18
40'202 0'45
La tabla de la t de Student para una prueba bilateral con a=0'05 y 68 gl da un valor
crítico t =1'99. Como el valor obtenido, 1'1 8. es menor que 1'99, el profesor se ve
obligado a aceptar la hipótesis nula, lo que seguramente le decepcionará, ya que tiene
que admitir que el programa que ha elaborado no influye en el rendimiento del alumno
en la forma que él esperaba.
A) Hemos de advertir que, aún cuando los resultados del contraste conducen a la
aceptación de la hipótesis nula, no debemos inferir que se haya demostrado que las
medias de ambas poblaciones son iguales, pues, aunque no estuviera determinada,
había una probabilidad de cometer un error de tipo II.
La conclusión que se debe sacar es similar a ésta: «no se ha encontrado una razón
suficiente para aceptar la hipótesis de que el modelo de simulación influya en el
rendimiento académico del alumno».
B) Si, por el contrario, el resultado del contraste hubiera dado un valor superior al
valor crítico, por ejemplo, t=2'03; en otras palabras, si el contraste hubiera resultado
significativo, habríamos tenido que rechazar la hipótesis nula, aceptando, por consi
361
(X-Y)-{\ir\i,)
Sx-r
que se distribuye según una t de Student con ^+^-2 grados de libertad.
Este estadístico da lugar al intervalo de confianza aleatorio del 95% dado por
X~i-X~2-d
t =.
SxTxi
se distribuye según una t de Student con n,+n,-2 grados de libertad. Luego, para una
prueba unilateral, se tiene
( d, \ f \
a
P-Jh -,uru,=</ .P\t<ta- ,|ir|i, = </
-t9 = r„
Sx,x:
y, por tanto
tu +/p =. (I)
íFi-F,
363
/a/2 + f3 (2)
S.V Y.
í/ n¡n2
fa/.' + fp (4)
S V /// + B2
Cuando los tamaños de las muestras son distintos, se toma como tamaño común
a ambas muestras la media armónica de sus tamaños:
2 2it/7i2
]- ]- n¡ + n.2
fl i ll:
de donde resulta
n¡ + ll: 2
364
(5)
'"+'9=7\ §
t„,2+h =-
1
Según este resultado, el índice de discrepancia y la función del tamaño muestral
(6)
siendo
(ni-Dsl+(n2-l)s2
n¡ +n.2-2
El factor de equilibrio será:
8=t¡+tB, si el tipo de prueba es unilateral
8=t -+L, si el tipo de prueba es bilateral
Las expresiones (5) y (6) permiten determinar el tamaño de cada una de las mues
tras, una vez han sido fijados el nivel de significación y la potencia del contraste. En
efecto, despejando n, se obtiene
2(ta+tfj)'s
(7)
2(ta/2 + t»)'s2
(Si
d
según el tipo de prueba.
Como 8=t. +t , para una prueba unilateral y 8=t„/,+tB, si el tipo de prueba es bilate
ral, sustituyendo 8 y V en (7) y (8), llegamos a la misma expresión:
(8^
(9)
Ejemplo 11.2
2) ¿Qué tamaño deben tener las muestras experimental y de contraste para conse
guir una potencia de 0'90 con un nivel de significación del 5%?
Solución
I) Potencia del contraste: Vamos a calcular la potencia por los dos métodos que
discutimos en el capítulo anterior.
A) Método directo: Utilizando el «Cálculo de Probabilidades», sabemos que la
probabilidad de cometer error de tipo II es
a Á d d
P =P-ta,2- -<'</«/2—^
\ Sxix2 Sxrx:
37. 310 + 31 .4
—« = 1'87
Entonces resulta:
. d n 0'5 35
La tabla A.7, para a=0'05 y un valor del factor de equilibrio de 1 '087 en una prueba
bilateral, proporciona un valor de la potencia de 0'2, que coincide con el que acaba
mos de obtener por el método directo.
Se necesitan, por lo tanto, dos muestras de tamaño 296 para obtener un nivel de
significación del 5% y una potencia del 90%.
¡jí
Figura 11.3: Gráfico de cajas hemliitus
Ejemplo 11.3
De una población normal con desviación típica a=2'l se extrae una muestra
aleatoria de tamaño ^=20, cuya media muestral es 7'4. Se extrae una segunda muestra
aleatoria de tamaño n,=24 de una población normal diferente con desviación típica
a2=1'5, dando una media de 6'9. Ensayar la hipótesis de que las medias poblacionales
son iguales.
Al ser conocidas las varian
zas de las poblaciones, la dife
rencia de medias muestrales
X -Y es un estimador inses-
gado de la diferencia de medias
p,-p, de la población, que sigue
una distribución normal
(
N u,-u. / \ 2 5%
n, ll2
A Y 7'5-6'S
/= = ¡'25
(y¡~4= i4'41 2'25
n, + n2 1 20 + 24
que, comparado con el valor crítico, 1 '96, correspondiente a la normal N(0,1 ) para un
contraste bilateral con un nivel de significación a=0'05, conduce al mismo resultado
que la t de Student. Ya vimos que la t, cuando el número de 'grados de libertad es
grande, tiende a confundirse con la normal N(0.1 ).
d d
P=/> .z*,r <Z<za/2-
n¡ n: Tt/ it: )
369
Por tanto
"Zli "Mt/
n =
u, ..+2n)"(cr; + cr:) (12)
d2
que nos proporciona el tamaño que deben de tener las muestras experimental y de
contraste para un nivel de significación a y una potencia dada 1-B.
Si el contraste es unilateral, la expresión (11) toma la forma
¿u T «.p V^ (13)
Vo/+o;'
370
Ejemplo 11.4
Si, en el ejemplo 1 1 .3, queremos contrastar la hipótesis nula H0=n -|i =0 con la
alternativa específica HMi -h2=0'5, veamos cuál es la potencia del contraste para una
prueba bilateral y a=0'05. También vamos a calcular el tamaño que deberían de
tener ambas muestras para conseguir un nivel de significación oc=0'05 y una
potencia l-B=0'95.
1) Cálculo de la potencia
Luego
o <y5 i—
Para 8 = 0'90, a = 0'05 y una prueba bilateral, la tabla A.7 proporciona una potencia
de 0' 15, que coincide con el valor que acabamos de encontrar.
2) Tamaño de la muestra
Ejemplo 11.5
Proposición 11.1: Si s{2 y s,2 son las cuasivarianzas de dos muestras indepen
dientes de tamaños n, y n,, respectivamente, procedentes de poblaciones dis
tribuidas normalmente, el estadístico
s]/a2,
S2/O2
F,2.12.oo5=2,6866yF,,,,»ol=4'1553
Entonces, al ser el valor F=l '21 menor que los valores críticos a los niveles 0'05 y
0'O1, aceptamos la hipótesis nula, o lo que es igual, la igualdad de las varianzas
poblacionales.
¡(ni-l)sl + (n2-l)s2 (1
— + —'
Sxy
nl + n2-2
t24.0023=2'064
El valor obtenido en el contraste. 2'03, es menor que el valor crítico, 2'064, por lo
que el contraste no es significativo y podemos concluir que «no hay motivo suficien
te para pensar que el nuevo fertilizante mejora la producción de trigo».
Sin embargo, el valor obtenido para t es muy próximo al valor crítico, por lo que
sería aconsejable repetir la experiencia antes de tomar una decisión definitiva.
374
Cuando las muestras son pequeñas y las varianzas distintas, ciertas modificacio
nes en la t de Student conducen a un resultado fiable.
Vamos a exponer dos métodos que exigen, para su aplicación, que las muestras
sean independientes y las distribuciones de las poblaciones normales o aproximada
mente normales. Más adelante veremos cómo se puede inferir la normalidad de una
población a partir de los datos aportados por la muestra.
/. Método de Cochran-Cox:
t¡S'- +?.'Sf
tims = 2 '
donde
t, es el valor de la t de Student con n,-1 gl y nivel a=0'05
t2 es el valor de la t de Student con n,-1 gl y nivel a=0'05
X es la media del grupo experimental.
Y es la media del grupo de contraste.
X-Y
t =.
v4 + Si
que se compara con el valor t0 proporcionado por la fórmula de Cochran-Cox, de
forma que, si el valor de la variable t es menor que el valor que proporciona la fórmula,
se acepta la hipótesis, y si es mayor, se rechaza.
Ejemplo 11.6
bando los días de supervivencia del grupo de estas 10 cobayas y de las 9 restantes,
a las que se les administra el fármaco tradicional. Los resultados obtenidos (expresa
dos en horas) son los siguientes:
Tratados 1503 620 752 1215 1890 340 1670 1256 1887 1310
No tratados 790 3% 681 630 1030 898 1024 745 910
Con los datos del ejemplo, para un nivel del 0'05, se obtienen los siguientes
valores:
s2, 2814797
s\x = n,-l7 = 9 = 31275'52
s¡ 416447
r m-1 8 5205'58
f
2'262 . 31275'52 + 2'306 . 5205'58 7962174 y ]5i
31275'52 + 5205'58 36481'! 1~
Este es el valor crítico, al nivel del 5%, que se toma para comparar el valor de la
variable t, que, para los datos del ejemplo 1 1.6, es:
Este valor de t=2'38 es mayor que el valor t005=2' 1 8 que proporciona la fórmula de
Cochran-Cox para un nivel a=0'05, por lo que se rechaza la hipótesis nula, llegando a
la conclusión de que el nuevo fármaco es efectivo para detener la enfermedad.
n, n,
sigue una distribución t de Student con
(s2, I ni + si I n2)'
v=
[(s2,/n,f/(n,-l)] + [(sl/n2f/(n2-l)]
grados de libertad.
Aplicando este tipo de contraste al ejemplo 11.6, que satisface las condiciones
exigidas, se tiene:
(530322 /10 + 204'072 / 9)2
v=r 2 ^~T~f , , |= 1184 = 12
( 530'32' / 10)' /9\ + [( 204'07' / 9J / 8\
377
Ejemplo 11.7
Telespectadores 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Puntuaciones antes 48 56 65 60 43 28 62 39 70 29 31 57 51 18 54
Puntuaciones después 41 59 70 60 49 50 50 50 75 25 40 57 60 30 61
378
t=
¡Sn
Como hipótesis nula se establece que la diferencia de las medias de las valoracio
nes antes y después de la recepción del mensaje es cero. Si se pretende hacer un
contraste bilateral, las hipótesis nula y alternativa son:
Luego
D 4'4 4'4 4'4
~ [si~ ¡69'54 ~ 4*64 ~ 2'15 '
/, v 15
Si elegimos el nivel de significación a=0'05, el valor crítico de la t de Student con
14 gl para un contraste bilateral es:
379
Como el valor obtenido t=2'04 es menor que 2' 145, se acepta la hipótesis nula,
concluyendo que el mensaje no ha ejercido influencia en el electorado.
Comot a/2,14
,,, =T 145, será:
Ejemplo 11.8
El gobierno de una nación desea someter a referéndum una ley fundamental que,
para ser aprobada, necesita de la mayoría absoluta de los sufragios emitidos.
380
Y
P(l-P)
es normal N(0, 1 ).
Se puede plantear un contraste de hipótesis bilateral:
Hipótesis nula: //o = p = 05
Hipótesis alternativa: H, = p±05
Si se elige un nivel de significación del 5%, al ser p=0'54, tendremos:
0'54-0'5 0'04
V49
05,05 00267
350
Inconvenientes:
H,FP„=0.5
Supongamos que se desea contrastar con la hipótesis alternativa de que hay una
diferencia de 5 centésimas, utilizando una prueba bilateral:
El factor de equilibrio, 8, viene dado, del mismo modo que en el caso del contraste
de la media, por
5 =rV^
por lo que
8 =07 4350 = J'87
Llevando este valor a la tabla de potencias, para 6=1 "87 y a=0'05, se obtiene el
correspondiente valor de la potencia:
1-B=0'44
Una potencia de 0'44 debe hacer pensar que, aunque el resultado del contraste fue
no significativo, esta conclusión no se puede considerar determinante, ya que supone
una probabilidad de cometer error de tipo II bastante alta:
B=0'56
"ÍT¡
Para determinar n, se busca, en la tabla A.7, el valor de 8 correspondiente a una
potencia 1-B=0'80 y un nivel de significación a=0'05. resultando:
6=2'8
Entonces
(2'sY
n=[—j=28- = 784
Como puede apreciarse, para conseguir en las mismas condiciones, una potencia
de 0'80, se necesita una muestra de tamaño mucho mayor.
z=:ÍPrPzHPrP2)
PAijP2l2
(PrP2)
/=
/"/ '.''
Ejemplo 11.9
Solución:
y q=14)'54=0'46
Por lo tanto, la estimación del estadístico es
ff45-0'65
Z= , = -789
11.1. Una muestra aleatoria de tamaño n=24, seleccionada de una población normal
con una desviación típica a,=4'9, dio una media x = 78. Extraída una segunda muestra
de tamaño n,=34 de otra población también normal con desviación típica o\=3'2, dio
como media 3c =70. Realizar un contraste para la igualdad de las medias de ambas
poblaciones.
1 1.3. La presión arterial de 15 enfermos es controlada antes y después de que les sea
administrado un medicamento, dando los siguientes resultados:
Antes 9 7 8 11 10 8 9 10 11 8 9 10 7 9 10
Después 9 6 9 9 9 6 8 9 10 8 6 S X 7 9
386
1 1.4. Una factoría de automóviles quiere decidir si, con un nuevo tipo de neumáticos,
se logra reducir el consumo de combustible. Para ello, realiza dos pruebas con 15 de
sus coches: una, con los neumáticos habituales y la otra, con el nuevo tipo de neumá
ticos en las mismas condiciones de recorrido y con los mismos conductores.
Los resultados de ambas pruebas fueron los siguientes (expresados en kilómetros
recorridos por litro de combustible consumido):
Nuevo 5*3 6'1 4'8 5'2 71 4'9 5'3 5'1 5*3 67 6'8 6'6 5'8 4'9 6'3
Habitual 5'1 5'9 47 5'3 6'8 47 5'4 4'9 5'0 6'4 67 6'4 5'9 57 5'9
Suponiendo que las dos poblaciones se distribuyen normalmente, ¿se puede con
cluir que. con el nuevo tipo de neumáticos, el consumo es menor? Utilizar un nivel de
significación de 0'05.
11.6. ¿Qué tamaño deberían tener las muestras del ejercicio 1 1.4 para conseguir una
potencia de 0'90, si se quiere contrastar una diferencia entre las medias de 200 metros
en una prueba bilateral al nivel de significación del 5%?
Antes 21 18 9 20 16 25 10 17 26 23 25 20 I8
Después 20 22 18 25 21 29 16 21 29 22 27 23 21
media de 26 mg. por litro con una desviación típica de 4 mg. por litro. Una segunda
muestra de 20 botellas de agua tratada con los productos de la otra industria da una
media de 24 mg. por litro con una desviación típica de 2'5 mg. por litro.
Suponiendo que la concentración de nitritos en el agua sigue una distribución
normal, se pide:
1 ) Realizar un contraste de homogeneidad de varianzas al nivel de significación del
0'05.
2) Hacer un contraste para averiguar si el segundo método es más eficaz que el
primero con un nivel de significación a=0'05.
1 1.9. Determinar el tamaño que deben tener dos muestras procedentes de poblaciones
independientes y homogéneas, de las que desconocemos su varianza. para contrastar
una diferencia entre las medias de 3 unidades, con un nivel de significación a=0'05 y
una potencia de 0'80 en una prueba bilateral. Se dispone de una estimación de la
varianza de 10'3.
1 1.10. Una cadena de televisión realizó una encuesta para averiguar las preferencias
de programación entre sus telespectadores, a la que respondieron 180 mujeres y 134
hombres. 64 mujeres y 30 hombres mostraron su preferencia por uno de los progra
mas. ¿Se puede concluir, con un nivel de significación del 0'05, que hay una preferen
cia en cuanto al sexo por ese programa?
11.14. En una ciudad, se han seleccionado dos muestras aleatorias de 180 y 90 jóve
nes. El 18% de los jóvenes de la primera muestra y el 23% de la segunda resultaron
fumadores.
1 ) ¿Se puede decir que hay una diferencia significativa entre las dos muestras en
cuanto al número de fumadores?
11.17. Se ha medido la fluidez verbal de los jóvenes de dos zonas de una ciudad. Una
muestra de 18 jóvenes de la primera zona dio una fluidez verbal media de 30 palabras
con una desviación típica de 3.5. Una muestra de 16 jóvenes de la otra zona dio una
media de 27 palabras con una desviación típica de 4,1. ¿Se puede decir que hay una
diferencia significativa entre la fluidez verbal de los jóvenes de ambas zonas al nivel
de significación del 5%?
1 1.18. Se han seleccionado 18 personas de una zona rural y 12 de una zona urbana, a
quienes se les ha pasado un test preparado para medir el nivel de conciencia frente al
problema de la droga. La zona rural ha dado una puntuación media de 38 con una
desviación típica de 7'2, mientras que la media de la zona rural ha sido de 39' 1 con una
desviación típica de 3'2.
1 ) Hacer un contraste para la homogeneidad de varianzas. 2) ¿Se puede sacar la
conclusión, al nivel de significación del 0'05. de que los habitantes de la zona rural
están más mentalizados frente al problema de la droga que los de la zona urbana?
CAPITULO 12
AJUSTE, INDEPENDENCIA Y HOMOGENEIDAD
Ejemplo 12.1
Resultados (X) 12 3 4 5 6
Frecuencias (O) 42 40 43 38 37 35
De acuerdo con estos datos, ¿se puede inferir que las discrepancias con respecto
a los valores esperados son debidas a las fluctuaciones en el muestreo?, o ¿debería
mos concluir que el dado está cargado y la distribución resultante no es uniforme?
En el problema interviene una variable, que es el número que aparece en la cara
superior del dado. Las categorías o niveles son los seis posibles valores: 1 , 2, 3, 4, 5, 6.
Los resultados obtenidos nos muestran las frecuencias observadas, que represen
taremos por CL Así:
0=42 es el número de veces que salió el número 1.
Establecida la hipótesis nula, que consiste en suponer que «cada uno de los
resultados tiene una probabilidad de salir igual a 1/6», se obtienen las frecuencias
esperadas, que representaremos por E, y son:
E1 =240/6=40
(1)
Número O i
E OrE ((W (CW/E,
1 44 40 4 16 0.400
2 37 40 -3 9 0,225
3 43 40 3 9 0,225
4 38 40 -2 4 0,100
5 40 40 0 0 0,000
6 35 40 -5 25 0,625
1,575
X2= 1,575
Para un nivel de significación a=0'05 y 5 gl, la tabla A.5 proporciona el valor
crítico:
Y2
A. 005.5 = "'"'
1 1 07
392
Ejemplo 12.2
r = ¡'23
La tabla A.5. para a=0'05
y 2 gl. da un valor crítico:
Ejemplo 12.3
¿Se puede afirmar que la distribución de frecuencias de las puntuaciones del test
puede ser aproximada por una distribución normal de media u=43 y desviación típica
o=ll?
Se trata de realizar un contraste de bondad de ajuste de una variable (la puntua
395
ción obtenida por cada uno de los alumnos), que presenta 1 1 categorías (los interva
los de clase).
Las tres primeras categorías tienen una frecuencia menor de 5, por lo que se
agrupan en una sola categoría, así como las dos últimas. Quedan 8 categorías y, por
tanto, serán 7 los grados de libertad.
La siguiente tabla recoge las nuevas categorías y sus frecuencias observadas y
esperadas más las columnas adicionales con los cálculos necesarios para obtener el
valor del estadístico:
: P(Z < -0'72) - P(Z < -1'18) = 0*2358 -ff1190 = 0'I 168
Luego
Ev=0' II 68x60=7
De modo análogo se cal
culan las frecuencias espera
das de las restantes catego
rías.
El valor que resulta para
el estadístico es:
-118 -072 -0'27 0't8 063 109 1.54
X:=4'714
Figura I2..V Área correspondiente a cada categoría. Como las categorías se
han reducido a 8 al combinar
las frecuencias de clases contiguas, el número de grados de libertad es 7.
La tabla A.5. para 7 gl y un nivel de significación a=0'05, proporciona un valor
crítico
ran5: = 1'4067
Puesto que el valor del estadístico, 4714, es menor que el valor crítico, 14'067, se
acepta la hipótesis, y, por consiguiente, que las puntuaciones del test se ajustan a
una distribución normal de media 43 y desviación típica 1 1 .
Ejemplo 12.4
En la última columna de la tabla figuran los residuales de doble raíz. Como ninguno
de los valores cae fuera del intervalo (-T96, 1,96), aceptamos la hipótesis nula y. en
consecuencia, que la distribución empírica de los datos se ajusta a la normal.
Hemos utilizado el estadístico y£- para contrastar una hipótesis sobre las frecuen
cias teóricas esperadas de datos referidos a una sola variable. Vamos a ver ahora que
también es posible utilizar este estadístico para hacer un contraste sobre la relación
entre dos variables cuando se conocen las frecuencias conjuntas de sus datos.
Cada una de las variables puede presentar dos o más categorías, cuyas frecuen
cias se presentan en una tabla de doble entrada, que recibe el nombre de tabla de
contingencia.
Las categorías de una de las variables se sitúan en las filas y las categorías de la
otra en las columnas.
399
Ejemplo 12.5
Calificaciones en Química
Suspensos C. medias C. altas
Calificaciones Suspensos 32 21 4 57
en C. medias 15 40 22 77
Física C. altas 6 11 14 31
53 72 40 155
La prueba se basa en las diferencias entre los valores de las frecuencias observa
das y de las frecuencias esperadas. Las frecuencias esperadas son las que tendrían
lugar si H„ fuera verdadera; se obtienen fácilmente si se estiman las probabilidades de
que se den simultáneamente las categorías A y B de ambas variables a partir de las
frecuencias marginales.
Consideremos los siguientes sucesos:
A=tener suspenso en Física, B =tener suspenso en Química,
A,=tener calificación media en Física, B,=tener calificación media en Química,
A,=tener calificación alta en Física, B,=tener calificación alta en Química.
Las probabilidades de cada uno de los sucesos se estiman a partir de las frecuen
cias marginales:
P(A,)=57/155. P(A>77/155. P(A,)=31/155
P(B,)=53/155. P(B,)=72/155. P(B,)=40/155
Consideremos ahora los sucesos:
400
Calificaciones en Química
Suspensos C. medias C. altas
Calificaciones Suspensos 32 (15'8) 21 (26'5) 4 (14'7) 57
en C. medias 15 (21 '4) 40 (35'8) 22 (19'9) 77
Física C. altas 6 (8'6) 11 (14'4) 14 (8) 31
53 72 40 155
401
0, E (X-E «w (O.-e^/E,
X = 2O07
(8)
Ejemplo 12.6
Se asume como hipótesis nula que la proporción de suspensos de cada uno de los
profesores es la misma, así como la proporción de aprobados.
En definitiva, se trata de probar si las calificaciones dadas por los tres profesores
son homogéneas con respecto al número de alumnos que suspende o aprueba cada
uno de ellos.
La asunción de la homogeneidad como hipótesis nula supone que las frecuencias
estimadas se deben obtener de la misma forma que en la prueba de independencia, es
decir:
donde
Ai es el suceso «suspender»
A, es el suceso «aprobar»
B¡ es el suceso «ser calificado por el profesor B 1.
B, es el suceso «ser calificado por el profesor B2.
B es el suceso «ser calificado por el profesor B3.
AinB, es «suspender con el profesor Bl»
AinB, es «suspender con el profesor B2»
AnB es «suspender con el profesor B3»
A,nB i es «aprobar con el profesor B 1 »
A,nB, es «aprobar con el profesor B2»
A,nB, es «aprobar con el profesor B3»
404
o, «i O.E «w (O.-E^/E
17 18 -1 1 0,05
15 18,9 -3,9 15,21 0,80
20 15,1 4.9 24,01 1,59
21 20 1 1 0,05
25 21,1 3.9 15,21 0,72
12 16,9 .4$ 24,01 1,42
4'63
Como el valor obtenido, 4'63, es menor que el valor crítico, 5'99, se acepta la
hipótesis nula, y, por tanto, la homogeneidad de las calificaciones de los tres profeso
res en cuanto al número de alumnos que aprueban y suspenden.
= 1 (0,-E.):
cuya distribución es aproximadamente una x2 con (r-1)x(2-1)=r-1 gl. El criterio, para
valorar las frecuencias esperadas, es análogo al que hemos empleado para las pruebas
de independencia y homogeneidad.
Ejemplo 12.7
o, E 0,-E «W (O.-E^/E.
ir i
.0'34
Los grados de libertad son: (3-1)x(2-1)=2xl=2.
La tabla A.5 del apéndice A. para a=0'05 y 2 gl, proporciona un valor crítico
La estimación del estadístico es 0'34, que es menor que el valor crítico, 5'99, por lo
que se acepta la hipótesis nula, admitiendo que la proporción de circuitos integrados
defectuosos que suministran las tres factorías es la misma.
La prueba sobre independencia nos permite averiguar si hay algún tipo de depen
dencia entre dos variables a partir del conocimiento de las frecuencias.
Sin embargo, aún cuando el contraste de independencia resulte significativo, no
podemos sacar ninguna conclusión acerca de la magnitud de la intensidad de la
relación entre las dos variables.
Se utilizan habitualmente tres tipos de medidas, llamadas coeficientes de contin
gencia, para evaluar el grado de relación: el coeficiente O, que se utiliza cuando la
tabla de contingencia es de dimensión 2x2, y los coeficientes C y O de Cramer, que
se usan con tablas de dimensiones superiores a 2x2.
12.6.1. Coeficiente 0
O! (10)
12.6.2. Coeficiente C
(11)
Cm . (12)
O, = (13)
N(h-l)
Curados No curados
Tratamiento 1 18 10
Tratamiento 2 24 8
Tratamiento 3 28 12
¿Se pueden considerar igualmente eficaces los tres tratamientos al nivel del 0'05?
12.3. Un equipo de médicos ha ensayado cinco tratamientos diferentes con 460 enfer
mos, observando si los pacientes mejoraban o no. Los resultados obtenidos figuran
en la siguiente tabla:
Tratamiento A B C 1) E Total
N" de enfermos 95 108 82 90 85 460
N° enfermos curados 17 10 13 20 7 67
Al nivel de significación del 5%, ¿se puede llegar a la conclusión de que existe
diferencia significativa entre la eficacia de los medicamentos?
12.4. Se quiere averiguar si la práctica religiosa está relacionada con el nivel de ingre
sos de una familia. Consultadas mil familias, se obtuvieron los siguientes resultados:
Nivel de ingresos
Bajo Medio Alto
Práctica Sí 215 206 180
Religiosa No 136 107 156
Según estos resultados, ¿es correcto afirmar que la práctica religiosa es indepen
diente del nivel de ingresos de las familias?
X 1 2 3 4 5 6
n¡ 26 30 37 34 39 31
Al nivel del 5%. ¿se puede asegurar que se trata de un dado equilibrado?
12.6. Se lanza una moneda 200 veces, obteniéndose 136 caras y 64 cruces. Con un
nivel de significación de 0'05, ¿se puede garantizar que la moneda no está cargada en
una de sus caras?
Fumador No fumador
H 19 31
Sexo
M 20 28
Con un nivel de significación del 0'05, ¿se puede afirmar que el hecho de ser
fumador es independiente del sexo?
¿Se puede considerar que estos datos proceden de una población normal de media
6 y desviación típica 1 '2, al nivel de significación del 0'05?
CAPITULO 13
ANÁLISIS DE LA VARIANZA
interviene una única variable independiente, que presenta diversos niveles de trata
miento o causas asignables. Es también llamado «análisis de la varianza
unidireccional» o «diseño de factor único».
El diseño completamente aleatorio se basa en la aplicación de cada nivel de trata
miento a un grupo de unidades o sujetos experimentales, de modo que las unidades
se asignan a los grupos aleatoriamente, y los tratamientos son asignados también de
forma aleatoria a cada uno de los grupos.
La variable independiente puede ser causa de diferencias apreciables en la varia
ble dependiente, en cuyo caso se hace necesario controlar la variable independiente.
El control se puede ejercer clasificando los sujetos en bloques o grupos homogéneos
con respecto a la variable independiente. La asignación de los sujetos a cada bloque
se hace de forma aleatoria, y también los bloques son asignados aleatoriamente a
cada nivel de tratamiento. Este tipo de diseño se conoce como «diseño de bloque
aleatorio».
Cuando el diseño completamente aleatorio incluye dos o más variables experimen
tales independientes, presentando cada una de ellas dos o más niveles de tratamien
tos, se tiene el «diseño factorial» o «diseño de factor múltiple».
El diseño factorial se utiliza para estudiar los efectos que producen dos o más
niveles de tratamientos.
Con el fin de optimizar los diseños generales, hay una serie de procedimientos,
como la replicación o el equilibrio de los efectos, cuyo uso da lugar a diseños especia
les cuales son el diseño «de bloques incompletos», el de «parcela dividida» y el
diseño «jerárquico».
Nos vamos a limitar al estudio de los diseños generales, siguiendo la metodología
habitual, partiendo, en cada situación, de un ejemplo tipo.
Muestras
1 2 j n
XTI X 12 X Ii X In
X X X X
Unidades
Xmi X m2 Xmi X mn
Ejemplo 13.1
X = 704
Si elegimos una de las calificaciones, por ejemplo, la cuarta de la segunda muestra,
89, su variación respecto de la media global es:
89-70'4=18'6
Esta variación es la suma de la variación con respecto a la media de la segunda
muestra, a la cual pertenece, más la variación de la media global con respecto a la
media de la segunda muestra:
89-70'4=(89-8 1 '6H<8 rf>70'4)=74+ 1 1'2= 1 8'6
-11,2- -7
70'4 81 '6 89
La igualdad anterior es cierta para cada puntuación con respecto a la media de su
correspondiente muestra:
Esta diferencia no puede deberse a la influencia del método utilizado por el profesor,
puesto que se siguió el mismo método con todos los alumnos del grupo 2; se trata,
por tanto, de una diferencia que no tiene explicación a no ser que se haya producido
un error a causa del mismo proceso de muestreo.
La diferencia entre la media global y la media del grupo aporta, en cambio, la
influencia del método seguido en cada muestra más la parte de error que corresponda
al propio muestreo.
La igualdad (1 ) surge de admitir un modelo matemático lineal, que supone aceptar
la aditividad de los efectos de las causas asignables y no asignables.
Se supone que los errores se distribuyen normalmente con media cero y varianza a2.
Si u es la media de la población para todos los tratamientos, es decir:
1 "
y llamamos
Xy = li +a ,+8« (3)
o, lo que es igual:
X* .u = a, +§o (4)
donde Xa i = 0,
,. -i
(5)
donde x.i es Ia media del j-ésimo grupo y X son las distintas observaciones. Al
tratarse de n grupos, una vez evaluadas n-1 diferencias, la siguiente es obligada,
luego a la suma de cuadrados intragrupo corresponden
gla=n- 1 grados de libertad.
El estimador «intergrupos» es una medida de la dispersión de las medias de los
diferentes grupos.
El estimador intergrupos, por tanto, viene dado en función de las diferencias de
las medias de los distintos grupos y la media global X.,-X
A la suma de los cuadrados de dichas diferencias le llamamos suma de cuadrados
intergrupos o suma de cuadrados debidos al error (SCE):
En cada grupo hemos supuesto m réplicas u observaciones, por lo que hay m-1
grados de libertad para cada grupo; como son n grupos, a la suma de cuadrados
intergrupos le corresponden
Proposición 13.2: «La suma de los cuadrados de las desviaciones con respec
to a la media global es igual a la suma de los cuadrados de las desviaciones
intragrupo más la suma de las desviaciones intergrupos»:
m n m n m n
(9)
m n m n ni n
Hll[X„-x1)' + 2j,J,(X„-XJ)(xi-x.)+Il(x,-l).'
.i J.1 i.1 i.1
Y£(XirxiX%-x) = %(xrX)%\Xv-xi)
¡,i i.i ¡,i ¡,i
Ahora bien,
XU,rxJ = o
419
por ser la suma de las desviaciones de los elementos de cada grupo respecto a su
media. „ „,
Por consiguiente 'L(xi-Xj^L[Xii-xJ) = 0
i=i
m n in n m n
(10)
Los cálculos del estimador F se efectúan de acuerdo con las definiciones conoci
das. Sin embargo, éstos resultan más cómodos si se utilizan métodos abreviados para
evaluar las varianzas, y se sigue un cierto orden.
Para obtener las variaciones, se procede del siguiente modo:
/) Suma de cuadrados:
SCT = J,^(xrx):
Para su cálculo, es más cómodo utilizar la expresión equivalente:
\'m " T
XI>. (12)
scx=2ux¡-x)
Para el cálculo, es más cómodo utilizar la expresión equivalente:
(13)
2) Grados de libertad:
3) Medias cuadráticas:
Origen de la variación SC gl MC F
Intragrupo (Tratamiento) 10212 3 340-4 7-5
Intergrupos (Error) 725'6 16 45'35
Totales 1746'8 19
Xh ~ Xk
t= (14)
JMCE
424
sigue una distribución t de Student con N-n grados de libertad, donde N es el número
total de observaciones, n el número de grupos, mh el número de observaciones de la
h-ésima muestra y m^ es el número de observaciones de la k-ésima muestra.
Utilizando este estadístico, se pueden ir contrastando cada pareja de medias por
separado, rechazando aquellas parejas que den un resultado significativo al nivel de
significación elegido previamente.
En el caso particular de que todas las muestras tengan el mismo número de ele
mentos (mh=mk=m), se puede determinar, para un nivel de significación a, «la menor
de las diferencias significativas (LSD: Least Significant Difference) entre las medias,
necesaria para que el contraste dé un resultado significativo». En efecto, basta con
hallar
Entonces todos los pares de medias que difieran en más de 9'03, serán
significativamente diferentes al nivel 0'05.
El resultado se suele disponer en una tabla de doble entrada, marcando con un *
la diferencia cuyo contraste resulta significativo. Así, para el ejemplo 13.1, si ordena
mos las medias de menor a mayor, para evitar valores negativos, resulta:
Y X Y A' .
xj 0 3 7,8 18,8*
X, 0 4,8 15,8*
X, 0 11.0
x2 0
siendo on ,
Xa X, Xj x2
X.4 0 3 7,8 18,8*
X, 0 4.8 15,8*
X.} 0 11,0*
x2 0
MCE
siendo a, =
Los valores del rango estudentizado de Tukey vienen tabulados en la tabla A.9
del apéndice A. Si el valor absoluto de una de las diferencias es mayor que RT, se
consideran las medias correspondientes significativamente diferentes.
Apliquemos la prueba de Tukey al problema planteado en el ejemplo 13.1.:
El valor del rango de Tukey, para a=0'05, k=4 y gle=16, nos lo da la tabla A. 9, y es
r=4'05
Como la desviación típica de las diferencias es oT=4'26, el rango menos significa
tivo de Tukey es
Comparando las diferencias entre las distintas medias y disponiéndolas en una tabla,
se obtiene el mismo resultado que daba la prueba de Scheffé (ver tabla pág. 428).
De la prueba de Tukey se deduce, por tanto, que las diferencias significativas se
dan entre la primera y segunda, y entre la segunda y cuarta medias.
Observamos cómo la diferencia entre la segunda y tercera medias no es detectada
como significativa por las pruebas de Scheffé y de Tukey, mientras que sí es detecta
da esta diferencia por la prueba de Duncan y la prueba t protegida.
428
X.4 X, x¿ X2
x4 0 3 7,8 18,8*
Xj 0 4,8 15,8*
X.i 0 11,0
X.i 0
I 3(7'5-l)
Este valor nos indica que hay una relación bastante fuerte entre los distintos
métodos de enseñanza y las calificaciones del alumno.
Hemos estudiado el tipo de diseño utilizado cuando los grupos que se comparan
se clasifican atendiendo a un único criterio, es decir, cuando interviene una única
variable independiente.
Si se considera una segunda variable independiente o factor, éste puede tener única
mente el carácter de control de la variable independiente, en cuyo caso tenemos el diseño
de bloque aleatorio. En cambio, si la segunda variable independiente es una variable de
tratamiento, cuyos efectos deseamos conocer, se trata de diseño factorial. Ambos tipos
de diseño son estudiados como «análisis de varianza doble», y sólo difieren en el modo
de interpretar el análisis. Nos limitaremos al estudio del diseño factorial.
Cuando son más de dos las variables independientes, se habla de «análisis de
varianza multidireccional». No hay limitación teórica en cuanto al número de variables
independientes, aunque, en la práctica, existen limitaciones a la hora de obtener el
429
A,III'
. ,, A.,, .,...,' A mil, .
211'
v // —7/ y
/ /
Al co c„ c,, c
A? c. c- c c
Hl B2 B3 IW
número de sujetos adecuado para los diferentes niveles de tratamiento de cada varia
ble, así como en el momento de hacer una interpretación de los resultados.
Con el fin de facilitar las fórmulas generales, vamos a considerar un experimento de
dos factores A y B, en el que las observaciones se asignan de modo aleatorio. Se
consideran n niveles de tratamiento para el factor A y p niveles de tratamiento para el
factor B, obteniéndose así np celdas de tratamiento, distribuidas en n filas y p columnas.
Cada una de las celdas contiene m observaciones, que constituyen m réplicas de
combinaciones de tratamientos de los diversos niveles de cada factor.
En concreto, trabajaremos sobre un ejemplo tipo, con dos variables independien
tes (dos factores A y B), presentando el primer factor dos niveles de tratamientos (Al
y A2), y el segundo, cuatro niveles (B1, B2, B3, B4). Tenemos así 2x4=8 celdas.
El diagrama de la figura nos puede ayudar a comprender el diseño.
En la celda Cn están las m observaciones o réplicas Xn,,X,n,...,Xml,, que correspon
den a la combinación de los tratamientos Al y B1.
Ejemplo 13.2
1 A
yk es la media de cada celda.
ni
- 1 », P J P
X , = — Z,ljXiik = — ¿i X a es la media de las filas,
mp„,M pk=,
H0': «Las interacciones entre los tratamientos debidos al primero y segundo factor
son nulas», es decir:
H„':Ylk=0,j=1.2 nyk=1.2 p.
Esta hipótesis se contrasta con la alternativa:
Hi': Yk*0, Para algún par de valores j,k.
Las dos primeras hipótesis se refieren a la no existencia de diferencias entre las
medias de la población. La tercera hipótesis contrasta la interacción debida a los dos
factores.
Utilizando los estimadores de las componentes del modelo teórico dado por la
ecuación (18). se obtiene la igualdad:
sc,-XXXta-xJ2 (20)
(21)
¡-/ /./ l=í
«2-SZZU-*-*-)2 (23)
SCI
MCI (26)
,11
B) Media cuadrática del segundo factor (MC2):
SC2
MC2. (27)
g'2
C) Media cuadrática de la interacción (MCJ2):
SC12
MC12 = (28)
gll2
D) Media cuadrática intergrupos (MCE):
SCE
MCE = (29)
gle
434
En el caso concreto del diseño 2x4, se comprueban tres hipótesis nulas que hacen
referencia al primero y segundo factor y al efecto conjunto de ambos factores.
La primera prueba trata de comprobar el efecto del primer factor (tipo de fertilizan
te) sobre la cosecha. Se utiliza el estadístico
MCI
F= (30)
MCE
que sigue una F de Fisher-Snedecor con gil y gle grados de libertad.
La segunda prueba contrasta el efecto del segundo factor (variedad de trigo)
sobre la cosecha. Se utiliza el estadístico
MC2
(31)
MCE
que sigue una F de Fisher-Snedecor con gl2 y gle grados de libertad.
La tercera de las pruebas contrasta el efecto de interacción. Se utiliza el estadístico
MC12
F= (32)
MCE
que sigue una F de Fisher-Snedecor con gl 1 2 y gle grados de libertad.
Para efectuar los contrastes, en primer lugar tenemos que calcular las sumas de los
cuadrados, que, divididas por los respectivos grados de libertad, conducen a las
medias cuadráticas y éstas a los estadísticos de cada una de las pruebas.
Construimos la tabla de totales, a partir de la cual se evalúan fácilmente las sumas
de cuadrados:
Bl B2 B3 B4 Suma filas
Al 50 40 50 55 195
A2 57 30 60 30 177
Suma columnas 107 7(1 110 85 Total=372
1) Sumas de cuadrados:
A) Suma de cuadrados total (SCT): Se calcula del mismo modo que en el análisis
unidireccional, utilizando la igualdad:
435
. IÍ¿x„
N
£]>>,« £l>, im
/ , / . xod 2^2-,2^ ^'Jk
) \m i.l M J
SC1 = -+...+-
mp mp mp N
\,=i i-i )
SC2 = +... + -
mu mu mn N
cuyo proceso de cálculo consiste en:
436
a) hallar la suma(T) de los cuadrados de los totales de cada columna divididos por
el número de elementos de cada columna:
1072 702 11O2 852
T = -,o-+w+lo- + Jo-356T4
b) restar de T el valor D, ya evaluado para el cálculo de SCT:
SC2=T-D=3567'4-3459'6=107'8
D) Suma de cuadrados para la interacción: La suma de cuadrados para la interacción
se obtiene, en la práctica, utilizando la expresión:
( '" Y fm Y fm
2) Grados de libertad:
B) Grados de libertad del segundo factor (gl2): Vienen dados por el número de
niveles del segundo factor menos 1 :
gl2=P-1
En el ejemplo: gl2=4- 1 =3
En el ejemplo: glt=40-1=39
En el ejemplo: gle=40-8=32
3) Medias cuadráticas:
/. Primera prueba:
F=MC1/MCE=8' 1/5'78=1'40
Para la distribución F con 1 y 32 grados de libertad, la tabla correspondiente nos
proporciona, para un nivel 0'05, el valor:
1 0'05. 1.32
=4' 15
Como F=l'40<4' 15, el contraste no es significativo al nivel a=0'05, y se acepta la
hipótesis nula a dicho nivel.
Origen de la variación SC gl MC F
Primer factor (fertilizante) 8'1 1 8' 10 1'4
Segundo factor (variedad) 10T8 3 35'93 6'21
Interacción 79'3 3 26'43 4.57
Variación intergrupos 185'2 32 578
Totales 380'4 39
439
Al ser nulo el efecto de la interacción, se considera cada uno de los factores como
si se tratara de análisis de la varianza unidireccional. Pueden presentarse, en este
caso, las siguientes situaciones:
1 ) Una de las dos primeras pruebas no es significativa: El factor correspondiente
a la prueba no significativa no ejerce efecto alguno sobre los resultados, por lo
que no se deben hacer comparaciones múltiples.
2) Uno de los factores significativos sólo tiene dos niveles: No es necesario
realizar la prueba de comparaciones múltiples, puesto que ya se sabe que la dife
rencia entre las dos medias es significativa.
3) Una de las dos primeras pruebas es significativa y el factor correspondiente
tiene más de dos niveles: En este caso, se realizan las pruebas de comparaciones
múltiples para las distintas medias.
En el ejemplo 13.2. han resultado significativas la prueba de interacción y la del
segundo factor.
Se trata de aplicar la técnica del ANOVA para analizar los efectos de cada trata
miento del primer factor en cada uno de los niveles del segundo factor, y a la inversa.
Designaremos por SCA(Bk) a la suma de cuadrados del factor A para el nivel k
del factor B y por SCB( Aj) a la suma de los cuadrados del factor B para el nivel j del
factor A.
El proceso de cálculo es análogo al que hemos seguido antes, y partiremos tam
bién de la tabla de totales (T , ):
Bl B2 Bk Total
Al T T
A2 T T T:
Ap T, T
p1 p2 p
Total T, T, T\ T
Bl B2 B3 B4 Tot. filas
Al 50 40 50 55 195
A2 57 30 60 30 177
T. columnas 107 70 110 85 Total=372
( " V
r-l 50- 57- 107-
SCA(B¡)= = 4,9
5 5 10
441
1t¡3 ln
~H ~\£¿ J 50- 60- 110- 10
SCA(B3) :
m mn 5 5 10
( n
SC1+SC12=SCA(B1)+SCA(B2)+SCA(B3)+SCA(B4)=87'4
SCB(Al)-.
ín f^ 50- 402 502 552 1952 ? ?, .,.-
5 5 5 5 ~20
v
X lT2• 572 302 602 302 ~1772
SCB(A2) = = 163' 35
ni mu 5555 "20
La suma de estos dos sumandos debe ser igual a la suma de cuadrados del segun
do factor más la suma de los cuadrados de la interacción:
SC2+SC12=SCB(A1)+SCB(A2)=187'1
a/2=0'05/2=0'025
442
0'025. 3, 32
Origen de la variación SC Si MC F
A en nivel Bl 4.9 1 4,9 0,86
A en nivel B2 10 I 10 1,73
A en nivel B3 10 1 10 1,73
A en nivel B4 62,5 1 623 10,81
B en nivel Al 23,75 3 7,91 136
B en nivel A2 1633 3 54,45 9,42
Variación interceldas 1852 32 5,78
Totales 459,7 40
Bl B2 B3 B4 Bl B2 B.1 B4
Figura 13.2: Interacción nula Figura 13.3: Interacción para el ejemplo 13.2
Debemos hallar el valor de «la menor de las diferencias significativas (LSD)». Para
ello, utilizaremos la fórmula (15), en donde MCE=5'78. m=10 y t005 ,,=2'037; luego
X: X, X, X ,
sK 0 1"5
0
37*
2'2
4*
2'5*
0 0'3
'H*1^ 0
Resultan significativas, en el nivel A2. las diferencias de las medias de Bl con B2,
B 1 con B4. B2 con B3 y B3 con B4.
Como resumen final, podemos concluir:
A) Si se siembra la variedad de trigo B4, se debe utilizar el tipo de fertilizante Al .
ya que Al incide de modo positivamente significativo en la variedad B4.
B) Si se utiliza el fertilizante A2. es preferible sembrar las variedades Bl ó B3.
C) Si se actúa con independencia del fertilizante, con las variedades B 1 ó B3 se
obtiene una mejor producción.
13.1. Las calificaciones obtenidas por cuatro estudiantes en Matemáticas, Física. Quí
mica y Dibujo han sido:
Con un nivel de significación del 0'05, ¿se puede llegar a la conclusión de que las
cuatro asignaturas tienen el mismo grado de dificultad?
13.3. Para probar la eficacia de cuatro tratamientos distintos sobre tres tipos diferentes
de enfermedades, se confeccionaron aleatoriamente 4 grupos, a cada uno de los cua
les se asignaron al azar 9 pacientes con el mismo tipo de enfermedad.
Tres de los pacientes de cada grupo fueron tratados con una terapia distinta. Los
resultados de los distintos tratamientos se evaluaron de 0 (mínima efectividad) a 5
(efectividad máxima), según recoge el siguiente cuadro:
Enfermedad
Bl B2 B3 B4
0 2 2 3
Al 0 1 0 2
1 1 2 4
Tipo 2 1 3 0
de A2 1 0 4 1
Terapia 0 1 5 0
1 0 1 0
A3 4 0 1 2
4 0 2 0
13.4. Con el fin de evaluar los efectos de las distintas formas de administrar un nuevo
fármaco para regular la hipertensión arterial, se ha seleccionado al azar una muestra de
20 enfermos, a los que se les ha distribuido en cuatro grupos también aleatoriamente.
El primero de los grupos será tratado con una dosis que debe tomar una vez al día,
el segundo con la misma dosis administrada dos veces al día, el tercero tomará doble
dosis cada dos días y el cuarto tomará la dosis equivalente cada tres días.
Después de dos meses de tratamiento, se hizo un control de la tensión a todos los
enfermos, obteniéndose los siguientes resultados:
1 ) Realizar el contraste para ver que no hay diferencia significativa en las distintas
formas de administrar el tratamiento. 2) Si el contraste resulta significativo, aplicar
447
alguna de las pruebas pareadas para detectar dónde se dan unas diferencias significa
tivas.
13.5. Se han preparado tres tipos de piensos compuestos para alimento del ganado
vacuno, que se administra a vacas de tres razas distintas, anotando la ganancia media
en peso al cabo de un mes:
Tipo de pienso
ABC
Raza 1 21 20 15
Raza 2 20 26 21
Raza 3 18 28 15
1) ¿Se puede asegurar que la ganancia en peso es la misma para cada tipo de
pienso? 2) ¿Influye el tipo de pienso en la ganancia de peso en una determinada raza?
13.6. En un análisis sobre los efectos del tiempo que se dedica diariamente al estudio
de una determinada asignatura y el rendimiento, se seleccionaron al azar 30 estudian
tes, a los que se distribuyó en cinco grupos de modo que: los estudiantes del primer
grupo dedicaron una hora, los del segundo, una hora y media, los del tercero, tres, y
los otros dos grupos, cuatro y cinco horas de estudio, respectivamente.
Transcurridos tres meses, se les hizo una evaluación, que dio los siguientes resul
tados:
Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5
4 3 6 9 9
5 5 7 10 10
3 6 5 s 9
3 4 7 8 8
5 4 9 9 9
4 5 8 9 9
13.8. Una compañía de autobuses desea saber el efecto que produce en sus conduc
tores el número de horas de servicio continuado. Selecciona 24 conductores, a los que
distribuye en cuatro grupos. Somete a cada uno de los grupos a una prueba después de
haber realizado un servicio continuado de 4, 6, 8 y 10 horas de conducción. Los resulta
dos de la prueba sobre los efectos negativos de la conducción (reflejos, percepción
visual, somnolencia,...) están resumidos en los datos del siguiente cuadro:
13.9. Plantea el ANOVA correspondiente al ejercicio 13.8, si cada uno de los grupos se
divide en dos niveles atendiendo a la edad de los conductores, de forma que los tres
primeros resultados de cada uno de los grupos correspondiera a conductores con
edad inferior a 40 años, y los tres últimos a conductores de 40 años de edad en
adelante.
Enfermedad
Bl B2 B3 m
37 27 30 44
31 24 33 44
Al 35 29 28 47
29 32 22 39
43 28 29 33
Tipo 39 33 35 31
de
examen 21 22 29 32
23 21 26 37
A2 25 19 22 40
20 25 31 37
27 26 23 32
24 22 26 27
M(YJ=a + (k (1)
p=a+bx (2)
Nuestro problema es encontrar una recta de ecuación y=a+By que nos de la mejor
estimación posible de la relación entre las variables X e Y.
453
llamada modelo de regresión lineal simple, donde E es el error del modelo, que debe
tener necesariamente media cero.
Cada una de las observaciones particulares de la muestra debe verificar la ecua
ción (3):
v =a + (3 x¡+bi
donde 8 es el valor particular del error cuando Y=y .
P = tt + I3 x
Por otra parte, cada una de las observaciones particulares de la muestra verifica la
relación
y¡ = a + bx¡ + e¡
Nlx,y,-{lx,tLy,
b (5)
Nlx;-(lx.f
5>,-b?.x, (6)
a-
N
Los valores a y b que proporcionan las fórmulas (5) y (6) son sólo estimaciones
particulares de los parámetros poblacionales a y B.
Ahora bien, si pudiéramos repetir el experimento, para los mismos valores de x, en
cada repetición se obtendrían distintas estimaciones de a y B. Estas estimaciones
pueden ser tomadas como posibles valores que tomarían dos variables aleatorias A y
B, que son los estimadores de a y B.
De acuerdo con el modelo de regresión planteado, los valores de x permanecen
fijos, variando únicamente los valores de y, lo que implica que los estimadores A y B
dependen sólo de los valores que tomen las variables aleatorias Y., que a su vez
dependen del modelo elegido
Y,=a + B X, + E,
Pues bien, si se admite que, para cada experiencia particular, las variables aleatorias
E. son independientes y, además de tener media cero, tienen la misma varianza a2, las
variables aleatorias Y. serán también independientes con media a+Bxi y varianzas
iguales a a2.
Para poder hacer un contraste de hipótesis sobre los parámetros poblacionales a
y B, es necesario admitir además la hipótesis de normalidad de las E., i=l,2 N.
Bajo estas hipótesis, se demuestran fácilmente las dos siguientes propiedades:
= 7';-2fc7„ + b2Tl
Ahora bien. teniendo en cuenta que
1
N .* x\
s] 1 „2 " T\
NTx
456
T T~
resulta: SCE = 7"; - 2-^T„ +^7; = T; - bT„, cqd.
de libertad.
SCR=Jjy,-y,)?
y a la suma de cuadrados del primer miembro le designaremos por SCT (suma de
cuadrados totales):
SCR/1
II. El estimador F = sigue una distribución F de Fisher-Snedecor con
SCE/(n-2)
1 y n-2 grados de libertad.
Designaremos por MCR (media cuadrática de la regresión) al cociente de dividir la
suma de cuadrados debida a la regresión (SCR) por su número de grados de libertad ( 1 ):
SCR
MCR =
I
El cociente de dividir la suma de cuadrados residuales (SCE) por su número de
grados de libertad (n-2) es la media cuadrática residual, que designaremos por MCE:
SCE
MCE.
n-2
El estimador para el contraste es:
MCR
(13)
MCE
El contraste se realiza calculando una estimación de F. Entonces, fijado el nivel de
significación a, si el valor de la estimación dada por F es mayor que el valor crítico
F^ , que proporciona la tabla de la F de Fisher-Snedecor, se rechaza la hipótesis
nula, y, si es menor, se acepta.
Los cálculos se suelen disponer en una tabla de varianza que recoge las fuentes
de variación, las sumas de cuadrados, los grados de libertad y las medias cuadráticas:
Ejemplo 14.1
T("K) 15 30 50 70 90 110 130 150 170 190 210 230 270 290 300
Cp(J/mol) 0.7 4.7 11,6 16,3 19.1 20.9 22,1 22,9 23,7 24,1 21,4 24,2 25,3 25,4 25,5
^ , ( !y,)" 287, 92
SCT = lyj - — = 6358,87 = 833, 1 1
N 15
WXX,y,-(IjO(S.v,) 15x52713,5-2305x287,9
b= '—;—V^ = ^— = 0,069
Nlx;-(I.x,)~ 15x477125-2305-
(Ix,)(lv) 2305x287,9
T„ = Ix,y,- = 52713,5- — = 8472,87
N 15
SCR = bT„ = 0,069x8472,87 = 584,63
SCE 248,48
MCE = = = 19,11
n-2 13
C) Estimador:
MCR 584,63
F= = — = 30,59
MCE 19,11
Si elegimos un nivel de significación a=0'05, el valor crítico es F , =4'67.
Como F=30'59>4'67, el contraste resulta significativo, luego rechazamos la hipóte
sis nula y admitimos, por lo tanto, la existencia de una relación lineal entre la tempera
tura y la capacidad calorífica de la plata, de acuerdo con los datos de la muestra.
Los datos se recogen en la siguiente tabla resumen:
460
En el apartado 14.4. 1 ., hemos utilizado las técnicas del análisis de la varianza para
contrastar la hipótesis nula H„ ■ P =0 con la hipótesis alternativa H¡ = P *0. Este
contraste se podía haber realizado también haciendo uso de las propiedades del esta
dístico B. cuando se admite que~
en el modelo Y iir
=a+BX +E , los errores E i están distri-
buidos normalmente.
Ahora vamos a servirnos del estimador T .
B-P
¡/yfti
Como T sigue una distribución t de Student con n-2 grados de libertad, bajo la
hipótesis nula H„ ■ p = 0, se evalúa el valor que toma
b
T=
TJr!
para la estimación de B proporcionada por la muestra.
Elegido un nivel de significación a, para una prueba bilateral, si T<-t„/, o TVt^, se
rechaza la hipótesis nula. En otro caso, se acepta.
El estadístico T permite también la construcción de un intervalo de confianza para
B. que vendrá dado por
^,,^<P<fl + ,„,-^
y, para una muestra particular, se tendrá el intervalo
s s
/ =
Ejemplo 14.2
Con los datos del ejemplo 14.1, se trata de: i) contrastar la hipótesis nula H„ u p =0
con la hipótesis alternativa H = P * 0 utilizando el estimador T; ii) hallar un intervalo
de confianza para B.
461
Solución:
, v , (Ix.)' 23052
T\ = Lx- - = 477125 = 1229233
N 15
r-r , , SCE 25171
luego jT\ = J122923'3 = 350'6 y s2 = = => s = 4'4
n-2 13
„ , 0V69
Por lo tanto t= = 5'49
4'4/350'6
Tenemos calculados los datos necesarios: b=0'069, s=4'4, -Jt] = 350'6 y t^=2'16.
El intervalo particular del 95% de confianza será:
( 4'4 4'4 \
I = 0'069 . 2'16 ,0'069 + 2' 16 + = (0'04,0'09)
{ 350'6 350'6 I
que sigue una t de Student con n-2 grados de libertad, para realizar el contraste de la
hipótesis nula H„ = a =0 con la hipótesis alternativa H, = a * 0 . Este estadístico
también permite construir un intervalo de confianza para a, que vendría dado por:
462
Ejemplo 14.3
Con los datos del Ejemplo 14.1: i) contrastar la hipótesis nula Ha=a = 0 con la
hipótesis alternativa Hl = a * 0. ii) hallar, para a, un intervalo de confianza del 95%.
La recta de regresión muestral se utiliza para hacer predicciones, que pueden ser
de dos tipos. Fijado un valor concreto xo de la variable independiente X, podemos:
a) hallar o predecir la respuesta media Po;
b) predecir un valor particular y0 de Y0 cuando x=x0.
j- (x0-xY
oi=<r
N T2
463
10
/ , (x0-xf 1 M0-xY
siendo t- el valor crítico de la t de Student con n-2 grados de libertad para un nivel
de significación a y una prueba bilateral.
Ejemplo 14.4
Con los datos del ejemplo 14. 1 . queremos determinar un intervalo de confianza del
95% para la respuesta media Po correspondiente a un valor de la temperatura x, = 100°K.
Solución: Por los cálculos realizados antes, sabemos que b=0'069 y a=8'65, luego
la ecuación de la recta de regresión muestral es
y=8'65+0'069x
Entonces, para xQ=100, se obtiene y =8'65+0?069- 100= 15'55
Disponemos de los datos:
s=4'4, TsM22923'3, \lP , =2' 16 y = = — X* = 153'66.
N
Luego un intervalo de confianza del 95% para PQ es:
/ (x0-x)
=cr
N T2
Si se toma s2 como estimación de a2, el estimador y0-Yg que se obtiene, se distri
buye aproximadamente según una t de Student con n-2 grados de libertad.
El intervalo de predicción para una sola respuesta yo es, por lo tanto:
a , /, 1 ,(x„-x)T „ ¡ ] (x,-xf
/=
Ejemplo 14.5
Con los datos del ejemplo 14.1, determinemos un intervalo de predicción del 95%
de confianza para yo cuando xn=100.
Solución: Tenemos ya los datos necesarios calculados:
s=4'4, n=15, t.,2=2' 16, T¿=122923'3,x=153'66ey0=15'55.
El intervalo será:
r
1 (100-1537 y 1 (100-1537 f
5'6-2'16-4'4,l + — + - ,15'6 + 2'16-4'4,1 + — +-
1 15 122923'3 V 15 122923'3
= (5'63,25'47)
465
Podemos observar cómo este intervalo es más amplio que el intervalo para la
respuesta media, como era de esperar, ya que el error de predicción es mayor cuando
se predice un solo valor que cuando se predice una media de valores.
En la selección del modelo de regresión lineal, hemos supuesto que no hay térmi
nos de grado superior al primero, por lo que, en la suma de los cuadrados de los
errores, sólo influyen las fluctuaciones propias debidas al error de muestreo.
Sin embargo, cuando es admisible realizar repeticiones del experimento y observar
las distintas respuestas a un mismo valor de la variable independiente X, la suma de
cuadrados de los errores se puede descomponer en dos sumandos, uno de los cuales
contiene la variación de Y en función de los valores asignados a X, es decir, la
variación debida únicamente al azar, el segundo sumando contiene la variación
debida a los términos de orden superior al primero, por lo que se conoce como varia
ción debida a la falta de ajuste.
Supongamos, por tanto, que se pueden realizar distintas observaciones para un
mismo valor x de la variable X. En concreto, vamos a suponer que disponemos de una
muestra aleatoria de tamaño N. en la que se dan k valores distintos de x, de modo que
«para cada valor x de x se han realizado n observaciones de la variable Y .
Para cada uno de los k valores x de la variable X, tenemos n observaciones
i i
N = 2>,
Si designamos por
i- i
y¡ = — (14)
(16)
k n, k nl
k n¡ k n, k n,
k n¡ k Rr
R
La última igualdad surge de hacer la sustitución y¡ = — teniendo en cuenta que
¡=1
Finalmente queda:
k n, k R;
(17)
SCE-SCEP (19)
MCA
k-2
SCEP (20)
MCEP-
n-k
es la media cuadrática debida al error puro.
Entonces el contraste se lleva a cabo por medio del estimador:
MCA (21)
MCEP
Ejemplo 14.6
Para una serie de disoluciones acuosas de etanol, se han determinado los volúme
nes específicos(Y) para las fracciones(X) de masa de etanol. controlando éstas a tres
niveles, cuyos resultados figuran a continuación. Se trata de:
1 ) Ajustar una recta de regresión de Y sobre X.
2) Realizar un contraste para la falta de ajuste.
468
N
4n~i
Ejemplo 14.7
Publicidad Ventas
25 450
30 500
20 430
25 480
35 520
40 550
45 600
30 460
25 460
40 500
Al empresario le interesa averiguar si existe alguna relación de tipo lineal entre las
472
rj^2 2'574
14'97
4U? 0'172
Ws=2'306
Como t=14'97>2'306. se rechaza la hipótesis nula, aceptando que hay razones para
pensar que el coeficiente de correlación lineal de la población es distinto de cero, o lo
que es igual, que existe correlación entre la inversión en publicidad y las ventas de los
productos anunciados.
Hemos utilizado el hecho de que el estadístico t sigue una distribución t de Student.
Sin embargo, para realizar el contraste del coeficiente de correlación lineal, no
necesitamos hacer uso del estadístico, ya que existen unas tablas de correlación
debidas a Pearson (A. 10 en el apéndice A). Para N-2 gl y un nivel de significación a,
proporcionan el valor crítico, con el que se debe comparar el valor r obtenido a partir
de la muestra. Si el valor absoluto de r es mayor que el valor crítico, se rechaza la
hipótesis nula; en otro caso, se acepta.
473
Para determinar la potencia del contraste, debemos establecer una hipótesis alter
nativa específica.
Consideremos como hipótesis nula H„ = p =0 y como hipótesis alternativa
H,=p=pr
Como índice de discrepancia, sirve el propio valor específico del coeficiente de
correlación, p,. Si tomamos como función del tamaño de la muestra
f(n) = yÍfTl
el factor de equilibrio será:
5 =Vf(n)= p,y[Ñl
La tabla A. 7, para a=0'05 y una potencia de 0'70, nos proporciona el valor 8=2'5.
Entonces
2'52
N = -—;+I = lI
0'8-
Luego se necesita una muestra de tamaño 1 1 para conseguir una probabilidad 0'70
de rechazar la hipótesis nula, si el valor de p, es 0'8 (ó -0'8, puesto que el contraste
es bilateral).
Por lo tanto, si r=0'8, es r=0'64, y podemos afirmar que el 64% de la variación total de
los valores de Y en la muestra se debe a una relación lineal entre los valores de X e Y.
También es útil su complemento, 1-r, llamado varianza residual o coeficiente de
no alineación, que representa la proporción de la variación de Y que no es explicada
por la relación lineal con los valores de X.
que coincide con el que encontramos para el coeficiente de regresión, aunque ahora
aparece como cociente del coeficiente de determinación (dividido por 1 gl) entre la
varianza de los residuos (dividida por n-2 gl).
Se utiliza, por tanto, para contrastar la variación debida al modelo postulado con la
variación debida al error.
Ejemplo 14.8
Test (X) 7 9 4 7 4 6 9 5 2 3 4 6
C. final (Y) 4 4 3 6 2 8 6 7 3 6 5 6
Veamos si se puede aceptar la hipótesis de que no hay una relación lineal entre las
dos variables.
Siguiendo la técnica del análisis de la varianza, debemos calcular las sumas de cuadra
dos, sus grados de libertad y los cuadrados medios.
A) Sumas de cuadrados:
(Ix,)(lv) 66x62
T„ = lx,yr- - = 361—^ = 20
N 12
SCR = bT„=0'36x20 = 72
SCE = SCT - SCR = 35'66 - 77 = 28'46
B) Cuadrados medios:
SCR
MCR = = 7'2
SCE 2'846
MCE = —- = —— = 2'846
n-2 10
C) Estimador:
MCR 72
F= : 2'529
MCE 2'846
Si elegimos un nivel de significación a=0'05, el valor crítico es FooS i M =4'96.
Como F=2'529<4'96, se acepta la hipótesis nula, y, por tanto, que el coeficiente de
correlación es cero, lo que supone que no existe una relación lineal entre las puntua
ciones del test de inteligencia y las calificaciones finales.
Los datos se recogen en la siguiente tabla resumen:
Ejemplo 14.9
1
ComO Sy = r——
resulta:
rr—í H T
\lh-3 ti2-.
478
\97 + 127
Por ser Z=1'72 menor que 1 '96, que es el valor crítico de la normal para un nivel de
significación a=0'05 y una prueba bilateral, la conclusión es que la diferencia no es
significativa.
Palabras X 36 18 15 13 26 26 28 13 31 13 38 18 40
Ingresos Y 190 155 190 160 180 165 175 170 185 140 205 155 215
14.2. Se han medido las alturas (X) de 15 padres y las alturas (Y) de sus primogénitos.
La siguiente tabla recoge los resultados (expresados en centímetros):
Altura padre X 182 172 177 165 160 170 162 165 187 175 167 162 185 182 167 162
Altura hijo Y 177 167 172 167 170 177 167 172 182 170 177 160 182 177 167 167
14.3. Con los datos del ejercicio 14.2., hallar: 1) un intervalo de confianza para el
coeficiente de regresión; 2) un intervalo de confianza para el término independiente
479
(a) de la recta de regresión; 3) los límites del intervalo de predicción de una respuesta
para las alturas de los hijos cuyos padres midan 162 cm.
Grado de ansiedad 37 30 26 23 18 16 10 10 12 14 22 19 28 27 16 22 18
14.5. Con los datos del ejercicio 14.2., contrastar la hipótesis de que el coeficiente de
correlación de la población es 0'7.
14.7 Dos muestras de tamaños n,=25 y n,=32 han dado como coeficientes de correla
ción r^0'6 y r,=0'45. ¿Se puede decir que hay una diferencia significativa entre los
dos coeficientes de correlación al nivel del 1%?
14.9. Determinar el tamaño mínimo que debe tener una muestra para poder afirmar que
un coeficiente de correlación de 0'4 difiere de cero significativamente para un nivel de
0'05 y una potencia de 0'75?
14.10. Una sustancia química, al ser sometida mediante un proceso industrial a dife
rentes temperaturas, dio las siguientes cantidades:
Temperatura IX) l'O TI 1'2 1'3 1'4 1'5 1'6 17 1'8 1'9 2'0 2'1 2'2 2'3
Cantidad (Y) 103 9'0 107 ll'O 117 11'1 10'8 12'4 1T5 11'4 127 12'9 13'4 127
480
14.1 1. Para los datos del ejercicio 14.10., dibujar la línea de regresión y las bandas de
confianza del 95% para la respuesta media.
14.13. Estudios sobre la posible relación entre la riqueza de léxico de los jóvenes y los
ingresos familiares han proporcionado para una muestra de 120, un coeficiente de
correlación de 0'45, y, para otra muestra de 230, un coeficiente de correlación de 0'3 1 .
1) ¿Se puede concluir que hay una diferencia significativa entre los dos coeficien
tes de correlación? 2) ¿Puede admitirse como cierto el valor que proporciona la
primera muestra?
14.14. Con los datos del ejercicio 14.12. hacer un contraste sobre la linealidad del
modelo.
14.16. Para los datos del ejercicio 14.10.. determinar un intervalo de confianza del 957c
para la cantidad correspondiente a una temperatura de 1 '75.
El uso de los métodos no paramétricos tiene ciertas ventajas y también sus incon
venientes, que conviene tener presentes, principalmente en aquellas situaciones en
que son aplicables ambos.
484
Recordemos que, cuando las muestras son grandes, los métodos paramétricos se
pueden aplicar aún en el caso en que la población no sea normal, dando resultados
fiables.
Analicemos algunas de las ventajas e inconvenientes que se aprecian en los mé
todos no paramétricos:
1) No se exige la normalidad de la distribución de la población de donde se extrae
la muestra.
2) Las pruebas no paramétricas son más simples y fáciles de aplicar. Los estimadores
que se utilizan requieren un nivel menos amplio de conocimientos matemáticos, y
sólo son necesarios cálculos muy sencillos como ordenar, contar o sumar.
3) Cuando el tamaño de la muestra no es muy grande, los cálculos en las pruebas
no paramétricas son más rápidos.
4) Los contrastes no paramétricos son aplicables a una clase más amplia de pobla
ciones, pues requieren menos precisión en las hipótesis.
5) La dificultad más importante que presentan los métodos no paramétricos es que
no aprovechan toda la información que proporciona la muestra, por lo que una
prueba no paramétrica resulta menos eficiente que la correspondiente prueba
paramétrica.
6) Cuando los dos métodos son aplicables, la prueba paramétrica resulta más
potente que la correspondiente prueba no paramétrica. Una prueba no paramétrica
requiere un tamaño muestral mayor que una prueba paramétrica.
Con relación a este último aspecto, se introduce el concepto de eficiencia de la
potencia de la prueba no paramétrica (Ep) como la razón entre el tamaño muestral de
la prueba paramétrica (Np) y el tamaño muestral de la prueba libre (N, ), expresado en
porcentaje, es decir:
Er = 100— (1)
125
EP = 100jJq=83%
Las pruebas basadas en rangos se utilizan cuando los datos reflejan la posición
relativa de los individuos de la población, dando su número de orden con respecto a
dos variables, sin dar los valores que toman éstas.
El problema que se plantea es el de estudiar las diferencias de localización entre
las poblaciones a partir, no del conocimiento de los valores que toman las variables,
sino del orden en que están dados sus valores.
En los contrastes paramétricos, cuando hablábamos de localización, nos refería
mos al valor de la media de forma que, al afirmar que «las puntuaciones de una
distribución eran mayores que las de otra», se entendía que la media de la primera era
mayor que la media de la segunda.
En cambio, cuando los datos vienen dados por rangos, decir que «las puntuacio
nes de una distribución son mayores que las de otra», significa que, si vamos obte
niendo, uno a uno, datos de ambas poblaciones, más de la mitad de las veces, el valor
del dato que se obtiene en la primera será mayor que el correspondiente de la segun
da.
En el estudio de las pruebas basadas en rangos, vamos a distinguir dos posibles
situaciones, según sean las muestras independientes o no.
Para muestras independientes, estudiaremos la prueba de la suma de rangos en el
caso de dos muestras, y la prueba H de Kruskal-Wallis, que se emplea para comparar
la localización de más de dos muestras. Para muestras dependientes, veremos la prue
ba de Wilcoxon.
* N(N + 1)
X*. = 2 (2)
Esta fórmula es muy conocida; se trata de la suma de los N primeros términos de
una progresión aritmética: 1+2+3+...+N.
Se llama ordinal medio (R) de N observaciones a la media del conjunto de los N
primeros números naturales.
II. El ordinal medio de N observaciones es
- N+l
Enefecto: ^ = ^r = ^- = K±l
Esta última propiedad nos dice que, si hay 18 observaciones, el ordinal medio es
19/2=9'5.
III. Si extraemos Ni datos de un conjunto de N, la suma de ordinales esperada (TE)
eS: - N,(N+1)
TE=N,R = 2 (4)
(la suma de los ordinales del grupo elegido es igual a la suma de ordinales espera
da para dicho grupo).
, T,-TE
4) Estimar el valor del estadístico Z =
o,
Fijado un nivel de significación a y un tipo de prueba (bilateral o unilateral), si el
valor que se obtiene para Z cae fuera de la región crítica, se rechaza la hipótesis nula,
y, por tanto, se admite que la suma de los ordinales del primer grupo es distinta de la
suma de los ordinales esperada por azar, lo que nos lleva a la conclusión de que hay
una diferencia significativa en la localización de ambas poblaciones.
Si la estimación de Z fuera positiva y el contraste significativo, llegaríamos a la
conclusión de que los rangos de la primera población serían superiores a los rangos
de la segunda, lo que significa que la mediana de la primera población es superior a la
mediana de la segunda. Aquí, por tanto, la mediana juega un papel importante como
medida de la localización.
Ejemplo 15.1
Grupo 1 51 76 54 55 80 60 71 76 57 74 60 63 82 52
Grupo 2 63 54 85 98 % 77 78 66 97 91 91
Solución:
Si observamos los datos de ambas muestras, cabe pensar que las poblaciones no
son normales. De ahí que nos planteemos un contraste no paramétrico como la prueba
de la suma de rangos.
Para realizarlo, ordenamos las N=N +N =14+1 1=25 observaciones por rangos, asig
nando a la puntuación más baja el rango 1, y el rango 25 a la más alta. Si aparecen
observaciones repetidas, se reemplazan éstas por su rango medio.
488
Después de ordenar por rangos, tenemos el siguiente cuadro, en el que los rangos
14'5, 3'5, 7'5 y 9'5 no vienen expresados por números naturales, ya que corresponden
a observaciones repetidas, que han sido reemplazadas por su rango medio:
Grupo 1 Grupo 2
X R Y R
51 1 63 95
76 145 54 35
54 35 85 20
55 5 98 15
80 18 96 23
60 75 77 16
71 12 78 17
76 145 66 11
57 6 97 24
74 13 91 215
60 75 91 215
63 95
82 19
52 2
Vamos a realizar el contraste utilizando la suma de rangos del primer grupo, T=l 33.
La suma de ordinales esperada para el primer grupo es:
N,(N + 1) 14 26
Tf = 2 = ~~2- = l82
y la desviación típica de la suma de ordinales del primer grupo (que coincide siempre
con la del segundo) es:
¡14 II 24
= .J308 = 17'55
T, - T, 133 - 182
Z =
o 17'55 = -2'79
489
es decir, se obtiene el valor opuesto al que teníamos antes, lo que conduce a la misma
solución. La diferencia está en que ahora hemos utilizado el grupo de puntuación más
alta.
Eficiencia de la prueba
Intensidad de la relación
Realizado el contraste, el hecho de que resulte significativo nos dice que hay una
diferencia entre las localizaciones de las dos poblaciones. Sin embargo, nada sabemos
acerca de la intensidad de la relación entre las localizaciones.
Es interesante obtener una medida de dicha intensidad. El coeficiente rf., que
proporciona una medida de la relación entre la variable dicotómica (pertenecer o no al
grupo) y la variable continua, que ha sido ordenada de 1 a N, se define como
2(R,-R.)
(7)
siendo R i la media de los rangos del grupo 1 , R , la media de los rangos del grupo 2,
y N el número de observaciones.
Con los datos del ejemplo 15.1, se obtiene:
2(9'5-17'45)
rl- 25 -°'63
490
T. T. Tl N(N + ,y
SCA = — + — +...+ — - ,X.
N, N? Nk 4
Se utiliza, para el contraste, el estadístico H de Kruskal-Wallis:
12SCA
Ejemplo 15.2
Para probar tres proyectos de motor, una industria del automóvil midió la potencia
media desarrollada por cada uno de ellos a partir de tres muestras, cuyos datos están
recogidos en la siguiente tabla:
23.24
Comprobamos que T=Ti+T2 + T¡ = =276
La suma de cuadrados intragrupo es:
1052 85'52 85'52 23 -242
SCA = + —— +... + = 3612'84-3312 = 300'85
6 7 10 4
Entonces
12.300'85
H= = 6'54
23.24
Como la estimación de H. 6'54, es mayor que el valor crítico. 5'991. se rechaza la
hipótesis nula, y, consecuentemente, que las poblaciones tengan la misma localización.
Cuando la prueba de Kruskal-Wallis resulta significativa, como acaba de suceder,
debemos realizar pruebas adicionales, tal como hacíamos en la prueba F del análisis de
la varianza, para determinar qué poblaciones son las que difieren entre sí.
Vamos a realizar la prueba de suma de rangos para cada pareja de grupos. Esta
prueba es una prueba protegida del tipo de la prueba LSD de Fisher.
En la práctica, cuando comparemos dos grupos, por ejemplo, el 1 y el 2, prescindi
remos del grupo 3. Por tanto, habrá que reasignar de nuevo los rangos, ahora del 1 al
13, en los dos primeros grupos:
493
Grupo 1 Grupo 2
X R X R
34'2 13 28'9 4
29'6 7 28'2 2
33'8 12 33'2 11
33' 1 10 279 1
30'5 9 30'9 8
28'4 3 29'5 6
29"2 5
Por lo tanto
Ti-Te 54-42
1'85
Ot ' 6'48
Como Z=1'85 es menor que el valor crítico z =1'96, concluimos que entre los
grupos 1 y 2 no hay diferencia significativa.
Si comparamos los grupos 1 y 3, reagrupando los datos, resulta:
Grupo 1 Grupo 3
X R X R
34'2 16 29'2 9
29'6 10 28'3 5
33'8 15 27'6 3
33' 1 13 27'6 3
30'5 12 33'5 14
28'4 6 30'1 11
28'6 7
28'8 8
26'4 1
27'6 3
494
Por lo tanto
Como Z=2'42 es mayor que el valor crítico z¡U= 1 '96. concluimos que resulta signi
ficativa la diferencia entre los grupos 1 y 3.
Dejamos para el lector la comparación de los grupos 2 y 3.
Eficiencia de la prueba
Intensidad de la relación
6'54-3+l
Ejemplo 15.3
2a prueba 53 54 40 30 53 60 38
36 59 39 42 40
Ia prueba 47 53 42 26 60 54 38 39 58 36 42 38
Solución: Las dos muestras son dependientes, puesto que se trata de las mismas
personas, a quienes se les califica dos veces, luego parece adecuada la prueba de
Wilcoxon.
Para facilitar los cálculos, situamos, en un cuadro, las diferencias en valor absolu
to, la ordenación de éstas por rangos, y los dos subgrupos correspondientes a las
diferencias positivas y negativas con sus rangos.
x2 x, D R|DI R+ R
53 47 6 8.5 8,5
54 53 1 1 1
40 42 -2 3 3
30 26 4 7 7
53 60 -7 10 10
60 54 6 8,5 8.5
36 38 -2 3 3
38 38 0
59 56 3 5.5 5.5
39 36 3 5.5 5.5
42 42 0
40 38 2 3 3
Eficiencia de la prueba
Intensidad de la relación
Por ejemplo, si nos dan las observaciones ...,27,86,87,..., cuando las sustituimos
por sus rangos ...,5,6,7,..., se pierde la información de que la primera observación es
mucho menor que las otras dos y de la proximidad entre éstas.
A pesar de todo, la pérdida de potencia de las pruebas basadas en rangos es
pequeña; varía de un 5% para muestras grandes a un 10% para muestras pequeñas.
Hay otro tipo de pruebas no paramétricas que, aún siendo de uso muy común,
soportan una mayor pérdida de información, teniendo una eficiencia del 70% ó 75%.
Vamos a analizar tres de dichas pruebas, dos para muestras independientes, como
son la prueba de la mediana y la prueba de rachas de Wald-Wolfowit, y estudiare
mos la prueba de los signos para muestras dependientes.
Ejemplo 15.4
A 87 68 77 68 75 69 80 69 82 73 97 93 68 93 76 76 98 7 1 78 89 73 70
B 82 93 96 87 95 99 75 86 70 98 72 75 97 93 85 78 77 75 92 94 83
C 83 76 71 75 94 98 78 77 77 73 72 76 84 83 71 72 93 91
Observamos que las muestras están sesgadas, por lo que vamos a realizar la
prueba de la mediana.
Con este fin, calculamos, en primer lugar, la gran mediana, cuyo valor es:
GM=78
La tabla de contingencia con el número de puntuaciones mayores que 78 y meno
res o iguales que 78 es:
A B C Total
Mayores de 78 13 8 7 28
Menores o iguales de 78 7 14 11 32
Total 20 22 18 60
A B C Total
Mayores de 78 13 (9'33) 8(10'26) 7 (8-4) 28
Menores o iguales de 78 7(10'66) 14(1173) 11 (9'6) 32
Total 20 22 18 60
0¡ * <w (O-E)2
v 1 K (O.-E^/E
13 9\33 3,67 15.46 144
7 10,66 -3,66 1339 T25
8 10,26 -2,26 5,10 0'49
14 11,73 2,27 5,15 0'44
7 8,4 -1,4 1,% 0'23
11 9.6 1.4 1.% 0.20
3'56
Eficiencia de la prueba
Intensidad de la relación
JJ6
C= = 0'236
N+X 60 + y56
y el valor del coeficiente <DC de Cramer para los mismos datos es
501
^N(h-l) Í601 J
Los dos coeficientes nos indican que la intensidad de la relación entre la pertenen
cia a un determinado sector social y la actitud hacia el estudio es pequeña.
Ejemplo 15.5
Cada una de estas subsucesiones es una racha. Se puede definir la racha como
un conjunto de símbolos idénticos separados por dos símbolos diferentes, o por uno
solo cuando está al comienzo o al final de la sucesión.
Mediante la prueba de rachas, se divide a la población en dos categorías de datos
(SI o NO, VERDADERO o FALSO,...), que son mutuamente excluyentes. Cada catego
ría tendrá N| símbolos VyN, símbolos F, siendo N^N^N.
En la muestra del ejemplo 15.5, con un tamaño 1 1 , hay 6 rachas: la primera con dos
V, la segunda con dos F,...
Esta prueba tiene su fundamento en el número de rachas que cabe esperar que se
den por puro azar, de tal forma que, si el número de rachas es superior o inferior al que
cabría esperar, se rechaza la hipótesis de que la muestra fue seleccionada aleatoriamente.
Supongamos que se forman todas las sucesiones posibles con los N, símbolos V
y los N, símbolos F, para un total de ^r^+N, símbolos.
El conjunto de todas estas sucesiones posibles tiene una distribución muestral, de
modo que, si definimos la variable aleatoria
502
y vananza
, 2N,N:(2N,N,-N,-N:)
°R~ (N, + N:f(N, + N?-l) (12)
Entonces, el estadístico
(13)
Ejemplo 15.6
Se ha consultado a 19 amas de casa sobre el número de días que les dura una
bombona de gas butano. Las respuestas aparecen en el orden en que se dieron:
20 3033 13 60 55 65 23 1440 58 18 47 45 15 2154 36 24
¿Se puede afirmar que se trata de una muestra elegida aleatoriamente?
Solución: La mediana de la muestra es 33. valor único que coincide con un dato,
por lo que prescindimos de él.
Sustituimos ahora cada dato por el signo +, si es mayor que el valor de la mediana.
y, por el signo -. si es menor. De esta forma, se obtiene la sucesión:
+ + + -- + + - + + -- + + -
El número de rachas es R=9. habiendo 9 símbolos + y 9 símbolos -.
La media y la varianza de R son, por tanto:
503
2-9-9 , . ,„ , 2-9-9(2-9-9-9-9)
X —V (14)
donde f es el número de diferencias positivas, f el número de diferencias negativas,
y N el número total de observaciones, después de haber eliminado los casos en que
las diferencias se anulaban.
Si la estimación que se obtiene para el estadístico es mayor que el valor crítico
X2005 , se rechaza la hipótesis nula, y, por tanto, que las dos muestras tienen distribu
ciones distintas.
Ejemplo 15.7
Previa 630 62 1 552 530 742 525 480 545 624 690 750 503 530 730 720 624
Post. 670 702 57 1 584 72 1 570 480 634 624 670 794 58 1 610 725 720 624
Este ejemplo presenta una pequeña variante, ya que la hipótesis nula no es que la
mediana de las diferencias entre pares de datos sea cero, sino que sea 50. Por ello,
hallaremos las diferencias, y restaremos 50. A los valores así obtenidos les aplicare
mos la prueba de los signos en la forma en que ha sido expuesta.
Disponiendo los resultados en una tabla, queda:
Ȓ 40 81 19 54 -21 35 0 89 -20 0 44 7S 80 -5 0 0
n,4>. -10 31 -31 4 -71 -15 39 -70 -6 28 30 -55
Puesto que 0'33<3'841. se acepta la hipótesis nula. y, por tanto, que la diferencia
entre las calificaciones medias es de 50 puntos.
505
Primera muestra 693 660 754 710 647 701 610 721 682 620 685
Segunda muestra 702 640 715 682 670 705 588 683 690
¿Se puede afirmar que las dos muestras proceden de la misma población? (Realizar
el contraste de la suma de rangos).
15.4. La siguiente tabla contiene los datos de tres muestras aleatorias de una pobla
ción ordenadas por rangos:
Ia muestra 8 4 7 6 3 9
2a muestra 2 4 5 7 5
3a muestra 10 9 8 6
Al nivel de significación del 5%, ¿existe diferencia significativa entre las tres mues
tras?
15.5. Se han seleccionado cuatro muestras formadas por 5 lámparas de cuatro marcas
diferentes (A, B, C y D). Calculada la duración de las lámparas, se obtuvieron los
siguientes resultados:
506
Averiguar si hay diferencia entre las marcas al nivel de significación del 0'O1. En
caso afirmativo, realizar la prueba de suma de rangos para determinar qué marcas
difieren entre sí.
15.6. Se ha hecho una pregunta a 20 personas, que debían responder con V (verdade
ro) o F (falso). La secuencia con las 20 respuestas ha sido:
VVFVVFVVVFVFFVFFVFFV
¿Se puede considerar que las respuestas han sido aleatorias? Utilizar los niveles
de significación del 1% y del 5%.
15.7. Una compañía de seguros imparte un cursillo a 20 agentes domiciliarios con el fin
de incrementar el número de pólizas. Al cabo de un mes, se constata que 12 de los
agentes han conseguido incrementar el número de pólizas con respecto a meses ante
riores, 5 han conseguido los mismos resultados, y 3 han bajado. ¿Se puede afirmar
que el cursillo ha sido eficaz?
15.8. Un profesor imparte clase a dos grupos de alumnos. Uno de los grupos es de
tercero de bachillerato diurno y el otro también de tercero, pero de régimen nocturno.
Con el mismo método de enseñanza y el mismo examen, las calificaciones obtenidas
fueron:
Diurno 68745 8437665 7 3 666852
Nocturno 573246567443356
1 ) ¿Se puede afirmar que hay una diferencia significativa entre las calificaciones de
ambos grupos? 2) En caso afirmativo, hallar una medida de la intensidad de la
relación.
Instrumento I 91 94 59 77 81 64 89 75 82 %
Instrumento II 84 79 51 68 69 70 76 88 74 87
TABLAS ESTADÍSTICAS
511
TABLA A.l
Distribución binomial1
P(X
B(n,p) «-(1)^
0.01 0.05 0.10 0.15 0.20 0.25 0.30 1/3 0.35 0.40 0.45 0.49 0.5
.9801 .9026.8100.7225 .6400.5625 4900 4444 4225 3600 3025 .2601 .2500
.0198 .0950.1800.25 50 .3 200.3750 4200 4444 4550 4800 4950 .4998 .5000
.0001 .0025 .0100.0225 .0400.0625 0900 1111 1225 1600 2025 .2401 .2500
.9703 .8574 .7290.6141 .5120.3219 .3430.2963 .2746 .2 160 . 1664 . 1 327 . 1 250
.0294.1354.2430.3251 .3840.4219.4410.4444.4436.4320.4084.3823.3750
.0003 .007 1 .0270 .05 74 .0960.1406 . 1 890 .2222 .2389 .2880 .3 34 1 .3674 .3750
.0000.0001 .0010.0034.0080.0156.0270.0370.0429.0640.091 1 .1 176.1250
.9606 .8145 .656 1 .5 220 .4096 .3 164 .2401 . 1 975 . 1 785 . 1 296 .09 1 5 .0677 .0625
.0388 .1715 .2916.3685 .4096.4219 .4 1 1 6 .395 1 .3 845 .3456 .2995 .2600.2500
.0006 .0135 .0486.0975 .1536 .2109 .2646.2963 .3105 .3456 .3675 .3747 .3750
.0000.0005 .0036.01 15 .0256.0469 .0756.0988 .1115 .1536.2005 .2400.2500
.0000.0000.0001 .0005 .0016.0039 .0081 .0123 .0150.0256.0410.0576.0625
.9510.7738 .5905 .4437 .3 277 .2373 .1681 .1317 .1 160.07 7 8 .0503 .0345 .0312
.0480.2036.3280.3915 .4096.3955 .3602 .3292 .3 I 24 .2592 .2059 . 1 657 . 1 562
.0010.0214 .0729.1382 .2048 .2637 .3087 .3292 .3364 .3456.3369.3185 .3125
.0000.0011 .0081 .0244 .0512 .0879.1323 . 1 646 . 1 8 1 1 .2304 .2757 .3060 .3 1 25
.0000.0000.0004.0022 .0064.0146.0284.0412.0488.0768 . 1 1 28 . 1470 . 1562
.0000.0000.0000.0001 .0003 .0010.0024.0041 .005 3 .0 1 02 .0 1 85 .0283 .03 12
.9321 .6983 .4783 .3206 .2097 .1335 .0824 .0585 .0490.0280.0152 .0090.0078
.0659.25 73 .3720 .3960 .3670 .3 1 1 5 .247 1 .2048 . 1 848 . 1 306 .087 2 .0603 .0547
.0020.0406.1240.2097 .2753 .3 1 1 5 .3 1 77 .3073 .2985 .261 3 .2 1 40 . 1 740 . 1 64 1
.0000.0036.0230.0617 .1 147 .1730.2269 .2561 .2679 .2903 .1918 .2786.2734
.0000 .0002 .0026 .0109 .0287 .05 77 .0972 . 1 280 . 1442 . 1 935 .2388 .2676 .2734
.0000.0000.0002.0012 .0043 .0115 .0250.0384.0466.0774.1 1 72 . 1 543 . 1 64 1
.0000.0000.0000.0001 .0004.0013 .0036.0064.0084.0172 .0320 .0494.0547
.0000 .0000 .0000 .0000 .0000 .0001 .0002 .0005 .0006 .0016 .0037 .0068 .0078
n k 0.01 0.0 5 0.10 0.15 0.20 0.25 0.30 1/3 0.35 0.40 0.45 0.49 0.5
8 0 .9227 6634 4305 2725 1678 1001 0576 0390 0319 0168 0084 0046 0039
1 .0746 2793 3826 3847 3555 2670 1977 1561 1373 0896 0548 0352 0312
2 .0026 .0515 1488 2376 2936 3115 2965 2731 2587 2090 1569 1183 1094
3 .0001 0054 0331 0839 1468 2076 2541 2731 2786 2787 2568 2273 2188
4 .0000 0004 0046 0158 0459 0865 1361 1707 1875 2322 2627 2730 2734
5 .0000 0000 0004 0026 0092 0231 0467 0683 0808 1239 1719 2098 2188
6 .0000 0000 0000 0002 0011 0038 0100 0171 0217 0413 0703 1008 1094
7 .0000 0000 0000 0000 0001 0004 0012 0024 0033 0079 0164 0277 0312
g .0000 0000 0000 0000 0000 0000 0001 0002 0002 0007 0017 0033 0039
9 0 .9135 6302 3874 2316 1342 0751 0404 0260 0207 0101 0046 0023 0020
1 .0830 2985 3874 3679 3020 2253 1556 1171 1004 0605 0339 0202 .0176
2 .0034 0629 1722 2597 3020 3003 2668 .2341 2162 1612 1110 0776 0703
3 .0001 0077 0446 1069 1762 2336 2668 .2731 2716 2508 2119 1739 1641
4 .0000 .0006 .0074 0283 0661 1168 1715 2048 2194 2508 2600 2506 2461
5 .0000 .0000 .0008 0050 .0165 0389 .0735 1024 1181 1672 2128 2408 2461
6 .0000 .0000 0001 0006 0028 0087 0210 0341 0424 0743 1 160 .1542 1641
7 .0000 .0000 .0000 0000 0003 0012 0039 0073 0098 0212 0407 0636 0703
S .0000 .0000 .0000 0000 0000 0001 0004 0009 0013 0035 0083 0153 0176
9 .0000 .0000 .0000 0000 0000 0000 0000 0001 0001 0003 0008 0016 0020
10 0 .9044 .5987 .3487 .1969 1074 .0563 .0282 0173 .0135 0060 0025 .0012 .0010
1 .0914 .315 1 .3874 .3474 2684 .1877 .1211 0867 .0725 0403 0207 .0114 0098
2 .0042 .0746 .1937 2759 3020 2816 .2335 1951 .1757 1209 0763 .0495 0439
3 .0001 .0105 .0574 1298 .2013 2503 2668 .2601 .2522 2150 1665 .1267 1 172
4 .0000 .0010 .01 12 0401 0881 1460 .2001 .2276 .2377 2508 2384 .2130 .2051
5 .0000 .0001 .0015 0085 .0264 0584 .1029 .1366 .1536 2007 2340 .2456 .2461
6 .0000 .0000 .0001 .0012 .0055 .0162 .0368 .0569 .0689 1115 .1596 .1966 .2051
7 .0000 .0000 .0000 .0001 .0008 0031 .0090 .0163 .0212 .0425 .0746 .1080 .1172
8 .0000 .0000 .0000 .0000 .0001 0004 .0014 .0030 .0043 .0106 .0229 .0389 .0439
9 .0000 .0000 .0000 .0000 .0000 0000 .0001 .0003 .0005 .0016 .0042 .0083 .0098
10 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0008 .0010
513
TABLA A.2
Distribución de Poisson2
p. 0 1 2 3 4 5 6 7 8 9 10 1 1 12
2.2 .1 108 2438.2681 1966 1082 .0476 .0174.0055 0015 .0004 .0001 0000
2.4 .0907 2177.2613 2090 1254 .0602 .0241 .0083 0025 .0007 .0002 0000
2.6 .0743 1931 .2510 2176 1414 .0735 .0.3 19 .0118 00.38 .00 1 1 .0003 OOOI OOOO
2.8 .0608 1703 .2384 2225 1557 .0872 .0407 .0163 0057 .0018 .0005 0001 0000
3.0 .0498 1494.2240 2240 1680 .1008 .0504.0216 0081 .0027 .0008 0002 0001
3.2 .0408 1304.2087 2226 1781 . 1 140 .0608.0278 0111 .0040 .0013 0004 .0001
3.4 .0334 1 135 .1929 2186 1858 .1264 .0176.0348 0148 .0056 .0019 0006 .0002
3.6 .0273 0984 .1771 2125 1912 .1.377 .0826.0425 .0191 .0076 .0028 0009 .0003
3.8 .0224 0850.1615 2046 1944 .1477 .0936.0508 0241 .0102 .0039 0013 0004
4.0 .0183 0733 .1465 1954 1954 .1563 .1042.0595 0298 .0132 .0053 0019 0006
k
0 1 i 3 4 5 6 7 8 9 10 1 1 1 2
1»
5.0 .0067 .0337 .0842 1404 .1755 1755 1462 1044 0653 0363 0181 .0082 0034
6.0 .0025 .0149 .0446 .0892 .1339 1606 1606 1377 1033 0688 0413 .0225 0113
7.0 .0009 .0064 .0223 0521 .0912 1277 1490 1490 1304 1014 0710 .0452 0264
8.0 .0003 .0027 .0107 .0286 .0573 0916 1221 1396 1396 1241 0993 .0722 0481
9.0 .0001 .001 1 .0050 0157 .0337 0607 091 1 1171 1318 1318 1 186 .0970 0728
10.0 .0000 .0005 .0023 0076 .0189 0378 0631 0901 1 126 1251 1251 . 1 137 0948
n 0 1 2 3 4 5 6 7 8 9 10 1 1 1 2
TABLA A3.1
P(Z<-z„.)-- T¿ dz
.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
-0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641
-0.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247
-0.2 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859
-0.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483
-0.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121
-0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776
-0.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451
-0.7 .2420 .2389 .2358 .2327 .2297 .2266 .2236 .2206 .2177 .2148
-0.8 .2119 .2090 .2061 .2063 .2005 .1977 .1949 .1922 .1894 .1867
-0.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611
-1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379
-1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170
-1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .09853
-1.3 .09680 .09510 .09342 .09176 .09012 .08851 .08691 .08534 .08379 .08226
-1.4 .08076 .07927 .07780 .07636 .07493 .07353 .07215 .07078 .06944 .06811
-1.5 .06681 .06552 .06426 .06301 .06178 .06057 .05938 .05821 .05705 .05592
-1.6 .05480 .05370 .05262 .05155 .05050 .04947 .04846 .04746 .04648 .04551
-1.7 .04457 .04363 .04272 .04182 .04093 .04006 .03920 .03836 .03754 .03673
-1.8 .03593 .03515 .03438 .03362 .03288 .03216 .03144 .03074 .03005 .02938
-1.9 .02872 .02807 .02743 .02680 .02619 .02559 .02500 .02442 .02385 .02330
-2.0 .02275 .02222 .02169 .02118 .02068 .02018 .01970 .01923 .01876 .01831
-2.1 .01786 .01743 .01700 .01659 .01616 .01578 .01539 .01500 .01463 .01426
-2.2 .01390 .01355 .01321 .01287 .01255 .01222 .01191 .01160 .01130 .01101
-2.3 .01072 .01044 .01017 .009903 .009642 .009387 .009137 .008894 .008656 .008424
-2.4 .008198 .007976 .007760 .007549 .007344 .007143 .006947 .006956 .006569 .006387
-2.5 .006210 .006037 .005868 .005703 .005543 .005386 .005234 .005085 .004940 .004799
-2.6 .004661 .004527 .004396 .004269 .004145 .004025 .003907 .003793 .003681 .003573
-2.7 .003467 .003364 .003264 .003167 .003072 .002980 .002890 .002803 .002718 .002635
-2.8 .002555 .002477 .002401 .002327 .002256 .002186 .002118 .002052 .001988 .001926
-2.9 .001866 .001807 .001750 .001695 .001641 .001589 .001538 .001489 .001441 .001395
-3.0 .001350 .001306 .001264 .001223 .001183 .001114 .001107 .001070 .001035 .001001
TABLA A3.2
P(Z<za) = J e~2~ dz
.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0.5 .69 1 5 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0.7 .7580 .7611 .7642 .7673 .7703 .7734 .7764 .7794 .7823 .7852
0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8661
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .90147
1.3 .90320 .90490 .90658 .90824 .90988 .91149 .91309 .91466 .91621 .91774
1.4 .91924 .92073 .92220 .92.364 .92507 .92647 .92785 .92922 .93056 .93189
1.5 .93319 .93448 .93574 .93669 .93822 .93943 .94062 .94179 .94295 .94408
1.6 .94520 .94630 .94738 .94845 .94950 .95053 .95154 .95254 .95352 .95449
1.7 .95543 .95637 .95728 .95818 .95907 .95994 .96080 .96164 .96246 .96327
1.8 .96407 .96485 .96562 .96638 .96712 .96784 .96856 .96926 .96995 .97062
1.9 .97128 .97193 .97257 .97320 .97381 .97441 .97500 .97558 .97615 .97670
2.0 .97725 .97778 .97831 .97882 .97932 .97982 .98030 .98077 .98124 .98169
2.1 .98214 .98257 .98300 .98341 .98382 .98422 .98461 .98500 .98537 .98574
2.2 .98610 .98645 .98679 .98713 .98745 .98778 .98809 .98840 .98870 .98899
2.3 .98928 .98956 .98983 .990097 .990358 .990613 .990863 .991106 .991344 .991576
2.4 .991802 .992024 .992240 .992451 .992656 .992857 .993053 .993244 .993431 .993613
2.5 .993790 .993963 .994132 .994297 .994457 .994614 .994766 .994915 .995060 .995201
2.6 .995339 .995473 .995604 .995731 .995855 .995975 .996093 .996207 .996319 .996427
2.7 .996533 .996636 .996736 .996736 .996928 .997020 .997110 .997197 .997282 .997365
2.8 .997445 .997523 .997599 .997673 .997744 .997814 .997882 .997948 .998012 .998074
2.9 .998134 .998193 .998250 .998305 .998359 .998411 .998462 .998511 .998559 .998605
3.0 .998650 .998694 .998736 .998777 .998817 .998856 .998893 .998930 .998965 .998999
517
TABLA A.4
Distribución t de Student4
litZta»)
n/p .40 .30 .20 . 10 n5 .025 (110 .005 .001 .0005
1 .325 727 1.376 3.078 6.314 12.71 31.82 63.66 318.3 636.6
2 .289 617 1.061 1.886 2.920 4.303 6.965 9.925 22.33 31.60
3 .277 584 .978 1 .638 2.353 3.182 4.541 5.841 10.22 12.94
4 .271 569 .941 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 .267 559 .920 1.476 2.015 2.571 3.365 4.032 5.893 5.859
6 .265 553 .906 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 .263 549 .896 1.415 1.895 2.365 2.998 3.499 4.785 5.405
g .262 546 .889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 .261 543 .883 1.383 1 .833 2.262 2.821 3.250 4.297 4.781
10 .260 542 .879 1.372 1.812 2.228 2.764 3.169 4.144 4.587
11 .260 540 .876 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 .259 539 .873 1 .356 1.782 2.179 2.681 3.055 3.930 4.318
13 .259 538 .870 1 .350 1.771 2.160 2.650 3.012 3.852 4.221
14 .258 537 .868 1 .345 1.761 2.145 2.624 2.977 3.787 4.140
15 .258 536 .866 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 .258 535 .865 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 .257 534 .863 1 .333 1.740 2.110 2.567 2.898 3.646 3.965
18 .257 534 .862 1 .330 1 .734 2.101 2.552 2.878 3.611 3.922
19 .257 533 .861 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 .257 533 .860 1 .325 1.725 2.086 2.528 2.845 3.552 3.850
21 .257 532 .859 1.323 1.721 2.080 2.518 2.831 3.527 3.819
22 .256 532 .858 1.321 1.717 2.074 2.508 2.819 3.505 3.792
23 .256 532 .858 1.319 1.714 2.069 2.500 2.807 3.485 3.767
24 .256 531 .857 1.318 1 711 2.064 2.492 2.797 3.467 3.745
25 .256 531 .856 1.316 1.708 2.060 2.485 2.787 3.450 3.725
26 .256 531 .856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 .256 531 .855 1.314 1 .703 2.052 2.473 2.771 3.421 3.690
28 .256 530 .855 i Ji3 1.701 2.048 2.467 2.763 3.408 3.674
29 .256 530 .854 1.311 1.699 2.045 2.462 2.756 3.396 3.659
30 .256 530 .854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
40 .255 529 .851 1 .303 1.684 2.021 2.423 2.704 3.307 3.551
50 .255 528 .849 1.298 1.676 2.009 2.403 2.678 3.362 3.495
60 .254 527 .848 1.296 1.671 2.000 2.390 2.660 3.232 3.460
80 .254 527 .846 1.292 1.664 1.990 2.374 2.639 3.195 3.415
100 .254 526 .845 1.290 1.660 1.984 2.365 2.626 3.174 3.389
200 .254 526 .845 1.286 1 .653 1.972 2.345 2.601 3.131 3.339
500 .253 525 .842 1.283 1.648 1 .965 2.334 2.586 3.106 3.310
oo .253 525 .842 1.282 1.645 1.960 2.326 2.576 3.090 3.291
4 Adaptada de «Statistical Tables for Biological. Agricultural and Medical Research», de R.A.
Fisher y F. Yates, Oliver and Boyd. Edimburgo, 1963.
518
TABLA A.5
Distribución y - de Pearson5
p{x2zxU
n/a 0.995 0.99 0.98 0.975 0.95 0.90 0.10 0.05 0.025 0.02 0.01
1 .000039 ,00015 .00062 0.00098 0.00393 0.0158 2.706 3.841 5.024 5.412 6.635
2 0.0100 0.0201 0.0404 0.0506 0. 1 03 0.211 4.605 5.991 7.378 7.824 9.210
3 0.0717 0.115 0.185 0.216 0.352 0.584 6.251 7.815 9.348 9.837 11.345
4 0.207 0.297 0.429 0.484 0.711 1.610 7.779 9.488 11.143 11.668 13.277
5 0.412 0.554 0.752 0.831 1.145 1.610 9.236 11.070 12.832 13.388 15.086
6 0.676 0.872 1.134 1.237 1 .635 2.204 10.645 12.592 14.449 15.033 16.812
" 0.989 1.239 1.564 1.690 2.167 2.833 12.017 14.067 16.013 16.622 18.475
8 1.344 1.646 2.032 2.180 2.733 3.490 13.362 15.507 17.535 18.168 20.090
9 1.735 2.088 2.532 2.700 3.325 4.168 14.684 16.919 19.023 19.679 2 1 .666
10 2.156 2.558 3.059 3.247 3.940 4.865 15.987 18.307 20.483 21.161 23.209
1 1 2.603 3.053 3.609 3.816 4.575 5.578 17.275 19.675 21.920 22.618 24.725
12 3.074 3.571 4.178 4.404 5.226 6.304 18.549 21.026 23.337 24.054 26.217
13 3.565 4.107 4.765 5.009 5.892 7.042 19.812 22.362 24.736 25.472 27.688
14 4.075 4.660 5.368 5.629 6.571 7.790 21.064 23.685 26.1 19 26.873 29.141
15 4.601 5.229 5.985 6.262 7.261 8.547 22.307 24.996 27.488 28.259 30.578
16 5.142 5.812 6.614 6.908 7.962 10.312 23.542 26.296 28.845 29.633 32.000
17 5.687 6.408 7.255 7.564 8.672 10.085 24.769 27.587 30.191 30.995 33.409
18 6.265 6.408 7.906 8.231 9.390 10.865 25.989 28.869 31.526 32.346 34.805
19 6.844 7.633 8.567 8.907 10.117 11.651 27.204 30.144 32.852 33.687 36.191
20 7.434 8.260 9.237 9.591 10.851 12.443 28.412 31.410 34.170 55.020 37.566
21 8.034 8.897 9.915 10.283 11.591 13.240 29.615 32.671 35.479 36.343 38.932
22 8.643 9.542 10.600 10.982 12.338 14.041 30.813 33.924 36.781 37.659 40.289
23 9.260 10.196 11.293 11.688 13.091 14.041 32.007 35.172 38.076 38.968 41.638
24 9.886 10.856 11.992 12.401 13.848 15.659 33.196 36.415 39.364 40.270 42.980
25 10.520 11.524 12.697 13.120 14.611 16.473 34.382 37.652 40.646 41.566 44.314
26 11.160 12.198 13.409 13.844 15.379 17.292 35.563 38.885 41.923 42.856 45.642
27 11.808 12.879 14.125 14.573 16.151 18.114 36.741 40.113 43.194 44.140 46.963
28 12.461 13.565 14.847 15.308 16.928 18.939 37.916 41.337 44.461 45.419 48.278
29 13.121 14.256 15.574 16.047 17.708 19.768 39.078 42.557 45.722 46.693 49.588
30 13.787 14.953 16.306 16.791 18.493 20.599 40.256 43.773 46.979 47.962 50.892
TABLA A.6.1
Distribución F de Fisher-Snedecor6
p{f>F,wx„iM) = 0'05
a=0.05
n/n, 1 2 3 4 5 6 7 8 9
6 Adaptada de «Biometrica Tables for Slatisticians». de E.S. Pearson y H.O. Harley. 1954.
520
TABLA A.6.1
a=0.05
n/n, 10 12 15 20 24 30 40 60 120 OO
1 241.88 243.91 245.85 248.01 249.05 250.09 251.14 252.20 253.25 254.32
2 19.396 19.413 19.429 19.446 19.454 19.462 19.471 19.479 19.487 19.496
3 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944 8.5720 8.5494 8.5265
4 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459 5.7170 5.6878 5.6581 5.6281
5 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3984 4.3650
6 4.0600 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6688
7 3.6365 3.5747 3.5108 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298
8 4.3472 3.2840 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276
9 3.1373 3.0729 3.0061 2.9365 3.9005 2.8637 2.8259 2.7872 2.7475 2.7067
10 3.9782 3.9130 3.8450 2.7740 3.7372 2.6996 2.6609 2.621 1 2.5801 2.5379
1 1 2.8536 2.7876 2.7186 2.6464 2.6090 2.5705 2.5309 2.4901 2.4480 2.4045
12 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 2.3410 2.2962
13 2.6710 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064
14 2.6021 2.5342 2.4630 2.3879 2.3487 2.3082 2.2664 2.2230 2.1778 2.1307
15 2.5437 2.4753 2.4035 2.3275 2.2878 2.2468 2.2043 2.1601 2.1 141 2.0658
16 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096
17 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.1040 2.0584 2.0107 1.9604
18 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168
19 2.3779 2.3080 2.2341 2.1555 2.1141 2.0712 2.0264 1.9796 1.9302 1.8780
20 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432
21 2.3210 2.2504 2.1757 2.0960 2.0540 2.0102 1.9645 1.9165 1.8657 1.8178
22 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 1.9380 1.8895 1.8380 1.7831
23 2.2747 2.2036 2.1882 2.0476 2.0050 1.9605 1.9139 1.8649 1.8128 1.7570
24 2.2547 2.1834 2.1077 2.0267 1.9838 1.9390 1.8920 1.8424 1.7897 1.7331
25 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.71 10
26 2.2197 2.1479 2.0716 1.9898 1.9464 1.9010 1.8533 1.8027 1.7684 1.7110
27 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7307 1.6717
28 2.1900 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541
29 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6377
30 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223
40 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089
60 1.9926 1.9174 1.8364 1.7480 1.7001 1.6491 1.5943 1.5343 1.4673 1.3893
120 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 1.4290 1.3519 1.2539
oo 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591 1.3940 1.3180 1.2214 1.0000
521
TABLA A.6.2
Distribución F de Fisher-Snedecor
P[F>Fmuni.n) = 0'01
a=0,01
1
n,/n, ' 3 4 5 6 7 8 9
TABLA A.6.2
a=0.01
10 12 20 24 30 40 60 120
i 6055.8 6106.3 6157.3 6708.7 6234.6 6260.7 6286.8 6313.0 6339.4 6366.0
2 99.399 99.416 99.432 99.449 99.458 99.466 99.474 99.483 99.491 99.501
3 27.229 27.052 26.872 26.690 26.598 26.505 26.411 26.316 26.221 26.125
4 14.546 14.374 14.198 14.020 13.929 13.838 13.745 13.652 13.558 13.463
5 10.051 9.8883 9.7222 9.5527 9.4665 9.3793 9.2912 9.2020 9.1 1 18 9.0204
6 7.8741 7.7183 7.5590 7.3958 7.3127 7.2285 7.1432 7.0568 7.9690 7.8801
7 6.6201 6.4691 6.3143 6.1554 6.0743 5.9921 5.9084 5.8236 5.7372 5.6495
8 5.8143 5.6668 5.5151 5.3591 5.2793 5.1980 5.1156 5.0316 4.9460 4.8588
9 5.2565 5.1114 4.9621 4.8080 4.7290 4.6486 4.5667 4.4831 4.3978 4.3105
Id 4.0492 4.7059 4.5582 4.4054 4.3269 4.2469 4.1653 4.0819 3.9965 3.9090
1 1 4.5393 4.3974 4.2509 4.0990 4.0209 3.9411 3.8596 3.7761 3.6904 3.6025
12 4.2961 4.1553 4.0096 3.8584 3.7805 3.7008 3.6192 3.5355 3.4494 3.3608
13 4.1003 3.9603 3.8154 3.6646 3.5868 3.5070 3.4253 3.3413 3.2548 3.1654
14 3.9394 3.8001 3.6557 3.5052 3.4274 3.3476 3.2656 3.1813 3.0942 3.0040
15 3.8049 3.6662 3.5222 3.3719 3.2940 3.2141 3.1319 3.0471 2.9595 2.8684
16 3.6909 3.5527 3.4089 3.2588 3.1808 3.1007 3.0182 2.9330 2.8447 2.7528
17 3.5931 3.4552 3.31 17 3.1615 3.0835 3.0032 2.9205 2.8348 2.7459 2.6530
18 3.5082 3.3706 3.2273 3.0771 2.9990 2.9185 2.8354 2.7493 2.6597 2.5660
19 3.4338 3.2965 3.1533 3.0031 2.9249 2.8442 2.7608 2.6742 2.5839 2.4893
20 3.3682 3.231 1 3.0880 2.9377 2.8594 2.7785 2.6847 2.6077 2.5168 2.4212
21 3.3098 3.1729 3.0299 2.8796 2.8011 2.7200 2.6359 2.5484 2.4568 2.3603
22 3.2576 3.1209 2.9780 2.8274 2.7488 2.6675 2.5831 2.4951 2.4029 2.3055
23 3.2106 3.0740 2.9311 2.7805 2.7017 2.6202 2.5355 2.4471 2.3542 2.2559
24 3.1681 3.0316 2.8887 2.7380 2.6591 2.5773 2.4923 2.4035 2.3099 2.2107
25 3.1294 2.9931 2.8502 2.6993 2.6203 2.5383 2.4530 2.3637 2.2695 2.1694
26 3.0941 2.9579 2.8150 2.6640 2.5848 2.5026 2.4170 2.3273 2.2325 2.1315
27 3.0618 2.9256 2.7827 2.6316 2.5522 2.4699 2.3840 2.2938 2.1984 2.0965
2S 3.0320 2.8959 2.7530 2.6017 2.5223 2.4397 2.3535 2.2629 2.1670 2.0642
29 3.0045 2.8685 2.7256 2.5742 2.4946 2.4118 2.3253 2.2344 2.1378 2.0342
30 2.9791 2.8431 2.7002 2.5487 2.4689 2.3860 2.2992 2.2079 2.1107 2.0062
40 2.8005 2.6648 2.5216 2.3689 2.2880 2.2034 2.1162 2.0194 1.9172 1.8047
60 2.6318 2.4961 2.3523 2.1978 2.1154 2.0285 1.9360 1.8363 1.7263 1.6006
120 2.4721 2.3363 2.1915 2.0346 1.9500 1.8600 1.7628 1.6557 1.5530 1.3805
2.3209 2.1848 2.0385 1.8783 1.7908 1.6964 1.5923 1.4730 1.3246 1.0000
523
TABLA A.7
0.05 0.04 0.025 0.02 0,01 0.005 0.05 0.04 0.025 0.02 0.01 0.005
ContrasU bilateral (a) Contraste bilateral (a)
8 (1.10 0.08 0.05 (1.02 0,02 0.01 o 0.10 0.08 0.05 0.04 0.02 0.01
0.(1 0,05 0.04 0,02 0.01 0.09 0.01 2.4 0,78 0,74 0,67 0,63 0,53 0,43
0,1 0.06 0,05 0.03 0,02 0.01 0.01 2.5 0,78 0.77 0.67 0.57 0.55 0,51
0.2 0.07 0.05 0.04 0,02 0.02 0.01 2.6 0.83 0.80 0.74 0.71 0,61 0,51
0.3 0.08 0.05 0.05 0.04 o.o: 0.01 2.7 0.85 0.83 0.77 0.74 0.64 0,55
0.4 0.10 0.08 0.06 0.05 0.02 0.02 2,8 0.87 0.85 0,80 0,77 0.68 0,59
0.5 0.12 0,10 0.07 0.06 0.03 0.02 2.9 0.89 0.87 0.83 0.80 0.72 0.63
0.6 0,14 0.07 0.09 0.07 0.04 0.02 3.0 0.91 0.90 0.85 0.83 0,75 0.70
0.7 0,17 0.15 0.10 0.09 0.05 0.03 3,1 0.93 0.91 0.87 0,85 0,78 0,70
0.8 0.19 0.17 0.12 0.1 1 0.06 0.04 3.2 0.94 0.93 0.90 0.87 0,81 0.73
0.9 0,22 0.19 0.14 II. 1 í 0.08 0.05 3.3 0.95 0,94 0,91 0.89 0,83 0.76
1.0 0,25 0,23 0.17 0,15 0.09 0.06 3,4 0.96 0.95 0.93 0.91 0.86 0.79
1.1 0,29 0.26 0,19 0,17 0,11 0.07 3.5 0.97 0.96 0.94 0.93 0.88 0.82
1.2 0,33 0.30 0,22 0.20 0, 1 3 0.09 3.6 0.97 0.96 0.95 0.94 0.90 0.85
1.3 0,36 0.33 0,25 0.23 0,15 0.10 3.7 0.98 0.97 0.96 0.95 0.91 0.87
1,4 0.40 0,36 0.29 0.26 0.18 0.12 3.8 0,98 0.98 0.97 0.96 0.94 0,91
1.5 0.44 0,50 0.32 0.30 0.21 0.14 3.9 0.99 0.98 0.97 0.96 0.94 0,91
1.6 0.48 0,44 0.36 0.33 0.24 0.16 l.ll 0.99 0.99 0.98 0.97 0.95 0,92
1.7 0.52 0.48 0.40 0.36 0.27 0.19 4,1 0.99 0.99 0.98 0.98 0.97 0,96
1.8 0.56 0.52 0.44 0.40 0.30 0.22 4.2 0.99 0.99 0.99 0.98 0.97 0,95
1.9 0.60 0.56 0.48 0.44 0.34 0.25 4,3 0.99 0.99 0.99 0.99 0.96 0,96
2.0 0.63 0.59 0.52 0.48 0.37 0.28 4.4 0.99 0.99 0.99 0.99 0.98 0.97
2,1 0.67 0,63 0.55 0.5 1 0.41 0.32 4,5 0.99 0.99 0.99 0.99 0.99 0,97
2 2 0.71 0,67 0.59 0,56 0,45 0.35 4,6 0,99 0.99 0.99 0.99 0.99 0.98
2,3 0,74 0,71 0.63 0,60 0.49 0.39 4.7 0,99 0,99 0.99 0,99 0.99 0,98
Unilateral (a)
0.05 0.04 0.025 0.02 0.01 0.005
Bilateral (a)
l-B 0.10 0.08 0.05 0.04 0.02 0.01
0.30 1.13 1.13 1.44 1.53 1.81 2.06
0.35 1.27 1.37 1.58 1.67 1.95 2.20
0.40 1.40 1.50 1.71 1.80 2.08 2.33
0,45 1,53 1.63 1.84 1.93 2,21 2,46
0,50 1.65 1.75 1.96 2.05 2.33 2,58
0.55 1,78 1.88 2.09 2.18 2.46 2.71
0.60 1.91 2.01 2.22 2.31 2.59 2,84
0,65 2.04 2,14 2.35 2.44 2.72 2,97
0.70 2.18 2.28 2.49 2.58 2.86 3.11
0,75 2.33 2.43 2.64 2.73 3.01 3.26
0.80 2.50 2.60 2.81 2.90 3.18 3,43
0.85 2.69 2.79 3.00 3.09 3.37 3.62
0.90 2.94 3.04 3.25 3.34 3.62 3,87
0.95 3.30 3.40 3.61 3.70 3,98 4,23
0.99 1.98 4.08 4.29 4.38 4.66 4.91
0.999 4.74 4.84 5.05 5.14 5.42 5.67
524
TABLA A.8.1
ct=0.01
V 2 3 4 5 6 7 s 9 10
7 Adaptada de «New Tables for Multiple Comparison with a Control», de Ch.W. Dunnet.
«Biometrica», vol. 20. 1964.
525
TABLA A.8.2
0=0.05
p
V 2 3 4 5 6 7 8 9 10
8 Adaptada de . Critical Values lor Duncan's New Multiple Range Test», de H.L. Harter.
«Bimetrics», 1960.
526
TABLA A.9
cfc=0.05
V 2 3 4 5 6 7 8 9 10
TABLA A.10
9 Adaptada de «Statistical Tables for Biological, Agricultural and Medical Research», de R.A.
Fisher y F. Yates. «Oliver and Boyd», Edimburgo, 1962.
528
TABLA A.11
.000 .000 .200 203 .400 .424 .600 .693 .800 1.099
.005 .005 .205 208 .405 .430 .605 .701 .805 1.113
.010 .010 .210 213 .410 .436 .610 .709 .810 1.127
.015 .015 .215 218 .415 .442 .615 .717 .815 1.142
.020 .020 .220 224 .420 .448 .620 .725 .820 1.157
.025 .025 .225 229 .425 .454 .625 .633 .825 1.172
.030 .030 .230 234 .430 .460 .630 .741 .830 1.183
.035 .035 .235 239 .435 .466 .635 .750 .835 1.204
.040 .040 .240 245 .440 .472 .640 .758 .840 1.221
.045 .045 .245 250 .445 .478 .645 .767 .845 1.238
.050 .050 .250 255 .450 .485 .650 .775 .850 1.256
.055 .055 .255 261 .455 .491 .655 .784 .855 1.274
.060 .060 .260 266 .460 .497 .660 .793 .860 1.293
.065 .065 .265 271 .465 .504 .665 .802 .865 1.313
.070 .070 .270 277 .470 .510 .670 .811 .870 1.333
.075 .075 .275 282 .475 .517 .675 .820 .875 1.354
.080 .080 .280 2SS .480 .523 .680 .829 .880 1.376
.085 .085 .285 293 .485 .530 .685 .838 .885 1.398
.090 .090 .290 299 .490 .536 .690 .848 .890 1.422
.095 .095 .295 304 .495 .543 .695 .858 .895 1.447
.100 .100 .300 310 .500 .549 .700 .867 .900 1.472
.105 .105 .305 315 .505 .556 .705 .877 .905 1.499
.110 .110 .310 321 .510 .563 .710 .887 .910 1.528
.115 .115 .315 326 .515 .570 .715 .897 .915 1.557
.120 .120 .320 332 .520 .576 .720 .908 .920 1.589
.125 .125 .325 337 .525 .583 .725 .918 .925 1.623
.130 .130 .330 343 .530 .590 .730 .929 .930 1.658
.135 .135 .335 348 .535 .597 .735 .940 .935 1.697
.140 .140 .340 354 .540 .604 .740 .950 .940 1.738
.145 .145 .345 360 .545 .611 .745 .962 .945 1.783
.150 .150 .350 365 .550 .618 .750 .973 .950 1.832
.155 .155 .355 371 .555 .626 .755 .984 .955 1.886
.160 .160 .360 377 .560 .633 .760 .996 .960 1.946
.165 .165 .365 383 .565 .640 .765 1.008 .965 2.014
.170 .170 .370 388 .570 .648 .770 1.020 .970 2.092
.175 .175 .375 394 .575 .655 .775 1.333 .975 2.185
.180 .180 .380 400 .580 .662 .780 1.045 .980 2.298
.185 .185 .385 406 .585 .670 .785 1.058 .985 2.443
.190 .190 .390 412 .590 .678 .790 1.071 .990 2.647
.195 .195 .395 418 .595 .685 .795 1.085 .995 2.994
10 Adaptada de «S1atistical Tables for Biological. Agricultural and Medical Research», de R.A.
Fisher y F. Yates, «Oliver and Boyd», Edimburgo, 1962.
APENDICE B
TEORÍA COMBINATORIA
COMBINATORIA
2
1 3
, 4
' 1 1
T ' -, 2 3
2
' 4 3 4
1 4 1
. 2
3
Ejemplo B. 1
En una carrera compiten 10 caballos. En los boletos de apuestas hay que poner el
nombre del primero, segundo, tercero y cuarto caballo. ¿Cuántos boletos hay que
rellenar, como mínimo, para estar seguros de acertar?
Solución: Cada agrupación diferirá de la otra por el orden en que coloquemos los
4 caballos o por la naturaleza de uno de los caballos, y no puede haber elementos
repetidos. Se trata de variaciones ordinarias de 10 elementos tomados de 4 en 4.
Luego el resultado es:
Vn = 10 9 8 7= 5040 boletos.
VR"m = VR"m'm
Tenemos, por tanto: y^ - m
VRÍ = VRÍ,m = m:
(2)
VRl = VR"Jm = m"'m = m"
Ejemplo B.2
B.3. Permutaciones
Ejemplo B.3
Ejemplo B.4
p7A.i .
14'
ru . 120120
P7P4P} 7!4!3!
Generalizando este resultado, el número de permutaciones con repetición de m
elementos, en donde uno de ellos se repite a veces, otro b veces,..., otro c veces,
siendo m=a+b+...+c, es
r m! (a + b+. (4)
Pt
" p„p„. Pe " a!b!...c! a!b!. .c!
B.5. Combinaciones
Y.
(' Ó)
(6)
En efecto:
V"„, m(m- l)-(m-n+ l) m(m- 1 ). . (m-n + l)(m- n)!
\n) P„ n!(m - n)! n!(m - n)!
Ejemplo B.5
¿De cuántas maneras se pueden extraer tres cartas a la vez de una baraja española?
La solución es equivalente a contabilizar el número de subconjuntos posibles de 3
elementos de un conjunto de 40; son, pues, combinaciones de 40 elementos tomados
de 3 en 3: . % Am
40 \ 40!
- 9880
\?)
3 / " 3!37!
Ejemplo B.6
CRÍ=Ct = (l)=Y = 15
APÉNDICE C
-e~>,six>0 (3)
f(x)='
0 , resto
siendo B>0.
C.1. 3. Distribución %2
Definición C.4: La variable aleatoria X tiene una distribución X ' con n gra
dos de libertad, si su función de densidad viene dada por:
7 *
x'2~' e p , si x > 0
"'" \22r(f2> (4)
0 , resto
siendo n un número entero positivo.
541
X2=Zf+- + Z2K
se distribuye según una X ' con n grados de libertad.
Un caso particular de éste es Z2 cuando Z es una variable aleatoria con una
distribución normal N(0,1). Z2 es una X ' con 1 grado de libertad. En la figura C.I
tenemos las gráficas de la X ' con n=l y n=6.
Para n>2, las curvas correspondientes tienen forma algo parecida a la de la normal,
pero con sesgo hacia la derecha.
Esta distribución está tabulada para distintos valores de n (tabla A.5 del apéndice A).
Para el uso de la tabla, se consi
deran áreas a la derecha del punto
r 0 2
P{x2^XÍ„)=a
La tabla A.5 proporciona valores
de Xñ.„ en función de a y n. Cada Figura C.2: Área y valor critico de la X2.
columna, a partir de la segunda, está encabezada por los valores a de las áreas. La
primera columna tiene los grados de libertad n, y, en el cuerpo de la tabla, figuran los
valores de X 2-
Así, por ejemplo, el valor de la X ' con 6 grados de libertad, que deja a la derecha
un área de 0'05, es
X0205.6 = 12592
X r + /» Ai r Ai p
La proposición C.2. nos indica que la suma de dos y2. es otra %2 que tiene, como
grados de libertad, la suma de los grados de las otras dos.
Definición C.5: Si Y es una variable aleatoria que sigue una distribución nor
mal N(0,1) y Xn2 otra variable aleatoria independiente de Y, que se distribuye
según una X2 con n grados de libertad, la variable aleatoria
Y
Vx;/«
es una variable aleatoria, cuya distribución es conocida como t de Student con
n grados de libertad, siendo n un número entero positivo.
1 Student es el seudónimo que utilizó W.S. Gossei cuando publicó, en 1908. la distribución que
lleva este nombre, para evitar que el dueño de la cervecería donde trabajaba conociera su identidad.
543
En la tabla A.4 del apéndice A, están tabulados los diferentes valores de la t para
distinto número de grados de libertad.
Para utilizar la tabla A.4, se consideran áreas a la derecha de un punto t (punto
crítico), que corresponde al valor de la abscisa que deja a su derecha un área igual a
a en una t con n grados de libertad, es decir:
P(t>ta.„)=a
La tabla A.4 difiere de la tabla de la normal en que las áreas, en la t, son los
encabezamientos de las columnas y los valores de t figuran en el cuerpo de la tabla, al
contrario de la normal.
I. La distribución t de Student con n grados de libertad tiene como media u=0, si n>1.
II. La distribución t de Student con n grados de libertad tiene como varianza
i n
cr = , si n > 2
n-2
P{F„,.„2>Ftt,„,„)=a
La propiedad que enunciamos a continuación relaciona los valores de la F con
los de la F , que permite evaluar los valores de la F para a=0'95 y a=0'99.
/
* /-« ,n,.n2 ~ rp
* a .n2.n1
RESPUESTA A LOS EJERCICIOS
DE NÚMERO PAR
547
CAPITULO 1
Clases n1 «I »1 lOOfj
0' 30 0' 05
..a \ \
HLCIFHREDMU
123456 7 99 10
548
Induttrla Construcción
CM
Agricultura
Otro»
d¡5É ■■■"
Servicios
,1 Mw i 4 • ti 10
U'5 - I
1 i—i i i , »
549
CAPITULO 2
CAPÍTULO 3
CAPITULO 4
4.2. 4.S
i 6 8 e
G f. 7 o
4.4.
M=16
Bd=350
,190 H,=770
HM80
E,=9S E^920
L, = 70 É=507-S
i!IEi-2 L =980
100 300
4.14.
CAPITULO 5
55-60 4
I- 76 w
60-65 22
65-70 63
1'72
1'70
o"
70-75 28 I" 68 —i»
i
75-80
80-85
10
14
Ul
73 76 78 80 82
II 1 I 1 I
Austral!a
CAPITULO 6
rrelación son iguales. Se cumple la pro 6.14. Se trata de dos variables, una conti
piedad I de 6.5.2.2. nua y otra dicotómica, luego se utiliza el
coeficiente de correlación biserial puntual,
6.8. Se debe aplicar el coeficiente <t>. que vale:
<I>=0'069, luego no existe correla
ción. Sí hay correlación.
6.10. Se utiliza el coeficiente de correla 6.16. 1) la recta pedida tiene por ecuación
ción biserial puntual, que es rb =0'21. La y=0'119x-0'668
correlación es muy débil. 2) El gasto estimado en transporte
es de 17182 ptas.
6.12. Se trata de dos variables continuas
dicotomizadas, por lo que se usa el coefi 6. 1 8. El coeficiente de Spearman, que vale:
ciente de correlación tetracórica, que es: rs=0'68.
rT=0'09
lo que indica una relación positiva muy
débil entre el peso y la aplicación en el
estudio.
CAPITULO 7
CAPÍTULO 8
CAPITULO 9
9.2. Media=2'5; desviación típica=0'64. 9.18. Intervalo del 95%: I=[ 1965.2035].
CAPITULO 10
10.2. Resulta Z=4'08>1'65, por lo que se 10.12. t=l'86<t¡9 002 =2'093, y se acepta
rechaza la hipótesis nula, tomando la de la hipótesis nula. La compañía asegura
cisión de no administrar el medicamento. dora no puede sacar la conclusión de que
la media que recorre un automóvil sea
10.4. Z=-3'5<-1'96, por lo que se rechaza superior a 16000 km.
la hipótesis nula, concluyendo que la
máquina no se ajusta a la programación. 10.14. 1) El intervalo es: I=[26'36,28'63].
2) La potencia es l-B=0'40.
10.6. t=-6'57<-2'53, luego se rechaza la
hipótesis nula, aceptando que U<1 15. 10.16. 1) Un contraste unilateral de
H0:u=90000 con H,:u>90000, utilizando la
10.8. El tamaño debe ser n=l 1 . t de Student, puesto que se desconoce la
desviación típica muestral.
10.10. Z=2'23>1'96, luego se rechaza la 2) Si admite una duración superior
hipótesis nula, por lo que, en principio se a 90000 horas, y resulta falso.
acepta una vida media superior en dicha 3) Si acepta una media de 90000
región. horas, cuando la media es superior.
CAPÍTULO 11
CAPITULO 12
12.2. El valor estimado del estadístico es 12.6. El valor estimado del estadístico es
X2 =12'59>X62oo5=12'59, luego se re % 2 = I095>X¿o« = 5'". luego se recha-
chaza la hipótesis nula, y, por tanto, se za la hipótesis nula, llegando a la conclu
admite una dependencia entre el hecho sión de que la moneda está cargada.
de vivir en una determinada zona y perte
necer a una clase. 12.8. El valor estimado del estadístico es
% 2 = \69'45)xla05 = 15'51, por lo que se
12.4. El valor estimado del estadístico es
X ' = 25'92)xl¡m5 = 5'99' Por lo tanto' se rechaza la hipótesis nula, y no se puede
rechaza la hipótesis nula, y se admite una aceptar que los datos procedan de una
relación de dependencia entre la práctica normal N(6,l '2).
religiosa y el nivel de ingresos de las fa
milias.
CAPITULO 13
vas entre las medias del tercero y cuarto Intragrupo i32' 33 4 33'o8 33'9
grupo, y entre las del primero con el se Intergrupos ei rori 24' 33 D 97
gundo, cuarto y quinto. No la hay entre
Total 156' 66 ¡:'.'
el primero y tercer grupo.
1 3.4. 1 ) La prueba del ANOVA simple re 2) Las cuatro pruebas dan diferencias sig
sulta significativa. La tabla resumen es: nificativas entre las medias del grupo ter
cero con el primero y segundo, del grupo
origen de la variación SC gi HC F
cuarto con el primero, segundo y tercero,
Inttagrupo 6'905 3 2.3018 4' 104
Intergrupos ¡error )
y entre la media del quinto con el prime
8' 972 16 Q'5608
ro, segundo y tercero.
Total 15' 877 19
557
cias significativas entre las medias del Intragrupo 858' 72 3 286' 24 8' 75
CAPITULO 14
14.6. Para una prueba bilateral, se obtiene La tabla resumen del ANOVA es:
como valor estimarlo: t=2'309; el valor
crítico es: t0.05 ,8=2'048, luego el contras origen de 1 3 variación SC gl nc r
te resulta significativo, por lo que se pue Regresión 13' 93 1 13' 93 36' 65
de admitir que el coeficiente de correla Error 4'58 12 o' 38
ción de la población es distinto de cero.
Total 18' 51 1 i
CAPITULO 15
-medias (sobre), 33 1
-selección del estadístico, 335
Caja. Ver «Gráfico en caja» -nivel de significación, 334
Cambio de variable, 252-256 -potencia, 342-350
Caracteres, 34 -no paramétricos. Ver «Distribución libre»
Cartograma, 48 -unilateral, 337
Causalidad, 199 -valoración del contraste, 339
Centrimedia, 122 Corrección de agrupamiento de Sheppard, 1 12
Centro de gravedad de la nube de puntos, 188 Correlación, 184, 192-205
Clase, intervalo de, 40 -al cuadrado (r), 474
Clase modal, 82 -biserial puntual, 201
Cochram-Cox, modelo de, 374 -causalidad (y), 199
Coeficiente -coeficiente de, 193,194
-de apertura, 98 -coeficiente *, 202
-de confianza, 315 -contraste basado en el ANOVA, 456
-de contingencia, 406-408 -contraste de la diferencia, 476
-coeficiente <1>, 406 -contraste basado en la t, 471
-coeficiente C, 407 -datos agrupados, 197
-coeficiente Oc de Cramer, 407 -de Pearson, 193-194
-de correlación. Ver «Correlación» -de Spearman, 200
-de determinación, 193, 195, 474 -demostración de propiedades, 215
-de regresión, 190 -estimación, 470
-de variación de Pearson, 98 -negativa, 194
-de variación media -positiva, 193
-respecto de la media, 99 -potencia y correlación, 476
-respecto de la mediana, 99 -tablas para el contraste, 471, 527
Combinaciones, 535 -tetracórica, 204
-con repetición, 536 -variables incorreladas, 198
-ordinarias, 535 Covarianza, 160
Comparaciones múltiples. Ver «Análisis de Crítica
varianza» -región, 335
Comprobación de hipótesis. Ver «Contrastes -valor, 335
de hipótesis» Cuadrática, media, 72
Condicionada, probabilidad, 232 Cualitativos, caracteres, 35
Contrastes de hipótesis, 331-354 Cuantiles, 75
-bondad de ajuste, de, 390 Cuantitativos, caracteres, 35
-bilateral, 338 Cuartil, 81
-coeficiente de regresión (sobre el), 456 Cuarto, 130
-consideraciones previas, 33 1 Cuasivarianza, 300
-con frecuencias, 389 Curtosis, 105, 125
-decisión final, 336 Curva
-decisiones posibles, 333 -acumulativa de frecuencias, 54
-determinación del valor crítico, 335 -de frecuencias, 52
-diferencia de medias (sobre), 355-388 -de Lorenz, 108
-establecimiento de las hipótesis, 332 -de potencia, 348
571
Hipótesis
-aceptar. 333
-alternativa, 331
Factor de equilibrio, 346 -contraste. Ver «Contraste de hipóte
Fisher. Ver «Coeficiente» sis», 331
Formación de las variaciones ordinarias, 531 -nula, 331
Frecuencia -rechazar, 333
-absoluta. 36. 146 Histograma, 49
-acumulada. 36 Homogeneidad de las varianzas. 37 1
-marginal. 147 Homogeneidad, pruebas de, 402
573
I K
Paso, 132 R
Pearson, coeficiente de
-asimetría. 105 Raíz, trasformaciones de raíz cuadrada. 140
-correlación general, 193 Recorrido, 90
-correlación lineal, 194 -intercuartílico, 91
-variación, 98 -semiintercuartflico, 91
Parabólica, regresión, 206 Recortadas, medias. 121
Parámetro. 37 Recta. Ver «Regresión»
Patillas, 134 Región de aceptación, 335
Perfil Región crítica, 335
-perfil ortogonal, 47 Regla de Laplace, 229
-perfil radial. 48 Regresión
Permutaciones -exponencial, 208
-con repetición, 534 -geométrica, 208
575
-lineal, 168
-contraste. Ver «Contrastes»
-elección del modelo, 452 t de Student, 542
-inferencias mediante la t, 460 T (puntuaciones), 1 1 1
-modelo de, 452 Tabla
-parámetros, 452 -de contingencia, 391
-parabólica, 206 -de letras-índice, 1 33
-recta de regresión de Y sobre X, 1 87- 1 89 Tablas de distribuciones
-recta de regresión de X sobre Y, 1 89 -de una variable continua, 43
Relación entre contrastes e intervalos, 339 -de una variable discreta, 38
Residuales, 396 Tablas estadísticas, 509
Resistentes, índices de localización, 121 -binomial. 51 1
Respuesta promedio, 462 -Fde Fisher-Snedecor. 519-522
Restricciones en el uso de la X2, 393 -normal. 515. 516
Riesgo de cometer error de tipo I, 334 -percentiles de Tukey, 526
-Poisson. 513-514
-potencia, 523
-rangos studentizados de Duncan. 524. 525
SAT (puntuaciones), 1 1 1 -t de Student. 517
Sectores (diagrama de), 46, 167 -valores críticos del coeficiente r de
Selección del estadístico para un contraste. 335 Pearson. 527
Sesgo, 56 -valores del estadístico de Fisher. 528
Sheppard, corrección de, 112 -X2 de Pearson, 5 1 8
Simetría, 56 Teoremas de
Sistema completo de sucesos, 223 -Bayes, 236
Spearmann (coeficiente de), 200 -central del límite. 304
Sucesos, 220-225 -Tchebycheff, 249
-contrario, 221 -de la probabilidad total. 236
-dependientes, 234 Test. Ver «Contrastes»
-diferencia de, 223 Tetracórica. Ver «Correlación»
-diferencia simétrica de. 223 Transformaciones de potencias, 137
-igualdad de, 221 Trimedia. 121
-incompatibles. 220 Tronco. Ver «diagrama en tronco».
-independientes dos a dos. 235 Tukey, 119
-independientes (mutuamente), 236 -prueba de. 427
-intersección de, 220 -tabla con los percentiles de. 526
-operaciones con, 220
-relación de contenido, 221 l
-unión, 221
Sumas indicadas, 23 Uniforme, distribución. 264
Sumas dobles. 27 Universo. 33
576