La Estadística Aplicada Al Análisis Economico PDF
La Estadística Aplicada Al Análisis Economico PDF
La Estadística Aplicada Al Análisis Economico PDF
AUTÓNOMA DE MÉXICO
FACULTAD DE ECONOMÍA
Abril 2007
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO
ÍNDICE
CONCEPTO Página
Introducción 1
I Generalidades ................................................................... 3
I.1 Definiciones de Estadística ................................................ 4
I.2 Diferentes clases de Estadística ....................................... 8
II La Estadística como Método de Análisis Económico........... 8
II.1 Aplicación del Método Estadístico a la Economía................ 10
Serie Estadística ................................................................... 11
II.2 Distribución de Frecuencias ................................................ 11
Ordenamiento de los datos en:
a) Serie Simple .................................................................... 12
b) Serie de Frecuencias ....................................................... 12
c) Serie de Clases y Frecuencias ........................................ 13
Presentación Gráfica: Histograma, ...................................... 14
Ojiva y .............................................................................
19
Polígono de Frecuencias ................................................. 21
II.3 Análisis de las Distribuciones de Frecuencias...................... 22
II.3.1 Medidas de Tendencia Central ....................................... 22
II.3.1.1 La Media Aritmética ................................................ 23
II.3.1.2 Mediana ................................................................... 28
II.3.1.3 Moda ................................................................... 31
II.3.1.4 Media Geométrica ................................................ 34
II.3.1.5 Media Armónica ........................................................ 37
II.3.1.6 Relación entre las Medidas de Tendencia Central ...... 40
II.3.1.7 Practicas I, II y III ................................................ 43
II.3.2 Medidas de Dispersión ................................................ 47
II.3.2.1 Rango ................................................................... 47
II.3.2.2 Desviación Media ................................................ 47
II.3.2.3 Desviación Estándar ................................................ 50
VIII.6.3 Práctica XI
................................................................ 239
BIBLIOGRAFÍA ..........................................................................
245
IN TRO D UC C IÓ N
Aun cuando existe una amplia bibliografía sobre el tema, dentro de la cual,
se deduce, que existen libros de excelente calidad en el país, creo que esta obra
tiene cualidades que le dan originalidad y la ubican como un libro de texto de
introducción a la estadística que ya hacia falta para llenar el hueco surgido por la
inexistencia del análisis estadístico aplicado a la economía mexicana. En otras
palabras, esta obra es original porque la presentación de su contenido se
caracteriza por; primero, la exposición del método, sus características y alcance,
fenómenos factibles de analizar y, finalmente, se aplica con el análisis e
interpretación correspondientes. Con ello se hace una aportación en la nueva
presentación del conocimiento, cuya transmisión resulta rápida y atractiva; en
ocasiones se ratifican o rectifican algunas interpretaciones superficiales o
radicales en cuanto a la bondad del método estadístico aplicado a la empresa y la
economía en general.
I. GENERALIDADES
Observan los estudiosos de esta ciencia que sus elementos básicos son:
Lógica e intuición, análisis y construcción, generalidad y particularidad.
Advierten que diversas actividades han destacado sus enfoques diferentes, y que
es únicamente el juego de estas fuerzas opuestas y la lucha por su síntesis lo que
constituye su teoría, su utilidad y el supremo valor de la ciencia matemática.
Sigificado de estadística
Al dar a conocer las definiciones que sobre ella existen, las estaremos
interpretando como la expresión de lo que se consideró en una fecha dada; lo que
era y para qué servía.
Así vemos que las definiciones que abarcan toda la segunda mitad del siglo XVIII
están enfocados a hacer de la Estadística una ciencia de información acorde con el
industrialismo que ya se gestaba en Inglaterra, y a la consolidación de los
Estados Europeos.
Con base en la doctrina del liberalismo y el surgimiento de nacionalismo
en la Europa continental, se fortalece el Estado cuyo poder se encuentra en
manos de esa clase social dinámica en sus orígenes llamada BURGUESIA, la que
diera impulso en general al estudio de las ciencias entre las cuales contamos la
Estadística.
Una vez terminadas las dos guerras mundiales, viene una paz que hace
posible que se logre un gran avance en la técnica de producción, en donde una vez
más surge la competencia entre las grandes corporaciones (monopolios), la que da
lugar a la búsqueda de nuevos métodos estadísticos que garanticen la producción
en masa y con el mínimo de defectivos (control estadístico de calidad). Hay otra
característica importante en esta segunda mitad del siglo XX; la liberación de una
gran cantidad de países que antes de la segunda guerra mundial eran "colonias",
y que, ahora como países independientes elaboran sus planes de desarrollo con
un conocimiento aceptable de la realidad en que se desenvuelven, gracias a la
aplicación de los métodos estadísticos en el estudio de sus economías.
1 10.334 "
2 9.756 "
3 9.339 "
4 8.357 "
5 7.364 "
6 7.401 "
7 6.531 "
Cada número expresa la edad de cada banco. Cuando los datos están
presentados en esta forma es difícil hacer observaciones; y se dice que estos
datos no están agrupados, que son simples o que pertenecen a una serie simple.
13 10 9 7 6 6
12 10 9 7 6 6
12 10 8 7 6 6
11 9 8 7 6 5
11 9 8 7 6 5
13 años 1
12 años 2
11 años 2
10 años 3
9 años 4
8 años 3
7 años 5
6 años 8
5 años 2
TOTAL 30
Amplitud 8
Amplitud de la clase = = =2
4
Número de clases que se desean
El número cuatro indica que se agruparon los datos en cuatro clases o grupos, y el
número dos expresa que cada clase tendrá una amplitud de dos unidades.
CLASES
(Grupos de edades)
F
De 5 a 7 15
De más de 7 a 9 7
De más de 9 a 11 5
De más de 11 a 13 3
Total 30
F=Frecuencia
Histograma
F
15
r
e 15
c
u 10 7
e 5
n 5 3
c
i 0
a 5 7 9 11 13
Clases (grupos de edades)
Intervalos de clase F Xi
De 5 a 7 15 6
De más de 7 a 9 7 8
De más de 9 a 11 5 10
De más de 11 a 13 3 12
Total 30
i= 1, 2, 3...n
Xi = marca de clase o punto medio.
Gráficamente tendremos
16
15
14
Frecuencias
12
10
8 7
6
5
4
3
2
0
5 61 7 82 9 10
3 11 12
4 13
Clases (grupos de edades)
Es interesante decir que autores como el Dr. Raúl Rojas Soriano(19), Croxton &
Cowden(2), entre otros, no cierran el Polígono de Frecuencias. Sin embargo, Yu
∗
Obsérvese que un punto medio es la suma de los límites inferior y superior de cada clase, la
cual se divide entre dos. También se le llama”punto medio de la clase o marca de clase”, que en
esencia es el valor representativo de cada clase.
1. Serie simple
2. Serie de frecuencia
3. Serie de clases y frecuencias
PASOS A SEGUIR
1. Se identifican el valor más grande y el más pequeño, que son: 96,500 - 11,169
2. Se calcula la amplitud: AM PLITUD = VALOR M AXIM O - VALOR
M INIM O
A = 96,500 - 11,169 = 85,331
PUNTOS MEDIOS
Intervalos de clase F PM
Total 50
Oscilación
Donde: i = i : Intervalo de clase
1 + 3.32 log(n )
n: Número de términos de la distribución
Oscilación
i=
1 + 3.32 log(n )
85,331
i= Oscilación = 96,500 - 11,169 = 85,331
1 + 3.32 log(50)
85,331 85,331
i= = = 12,929 ≈ 13, redondeando a miles
6.6
1 + 3.32 log(50)
de 11 a 24 6 17.5
de más de 24 a 37 7 30.5
de más de 37 a 50 11 43.5
de más de 50 a 63 6 56.5
de más de 63 a 76 6 69.5
de más de 76 a 89 8 82.5
de más de 89 a 102 6 95.5
Total 50
Frecuencia
Xi Acumulada
(fa)
menos de 24 6
menos de 37 13
menos de 50 24
menos de 63 30
menos de 76 36
menos de 89 44
menos de 102 50
OJIVA
60
50
F Acumulada
40
30
20
10
0
0 20 40 60 80 100 120
Clases
Serie Simple
3 13 8 5 14 10 5 6 14 18 6
1 10 13 14 2 10 11 6 19 9 3
10 9 2 9 6 14 10 10 6 5 11
17 6 17 13 8 18 19 9 8 17 5
11 9 11 13 9 8
X f(X)
1 1
2 2 5 Ls - Li = 19 - 1
3 2 19 - 1 = 18
18/5 = 3.6
5 4 10
6 6
8 4
9 6 20
10 6
11 4
13 4 8
14 4
17 3
18 2 7
19 2
50
∑ fx = 50
Con ello se puede construir una:
50 50/50*100 = 100
Frecuencias Relativas
15
10
0
1 2 3 4 5
1 2.8 4.6 6.4 8.2 10 11.8 13.6 15.4 17.2 19
Observación: La curva tiende a ser simétrica o normal aún con pocos datos. La
identificación de esta característica es muy importante, ya que permite aplicar
más métodos estadísticos al análisis de un mismo fenómeno económico, como se
verá posteriormente, haciendo o corroborando que la estadística es un apoyo
significativo para estudiar el comportamiento y caracterización de los fenómenos
económicos.
Los principales métodos usados para tal propósito son: Las de tendencia
central para medir la acumulación o concentración alrededor de cierto valor, y las
medidas de dispersión que sirven para medir la variación de los términos con
respecto a una medida de la tenencia central.
Entre las medidas de tendencia central encontramos que las más usadas
son la media aritmética, la media armónica, la media geométrica, la mediana y la
moda.
Se define como un valor medio tal, que si a cada término se le da ese valor,
resulta una suma igual a la de los valores de los términos de la sucesión dada.
Ejemplo (13) Sean los términos 1,5,2,9,7,8,5,3; como puede observarse
son términos no agrupados.
M ás generalmente:
x + x + x + x + x + ... + x = x1 + x 2 + x3 + ...xn
nx = x1 + x2 + ... + xn
n
∑ xi
Despejando la x , queda de la siguiente forma: x= i =1
x1 + x2 + x3 + ... + xn
x= donde i= 1,2,3,...,n
n
∑ xiF
x= i =1
N
Para una serie de clases y frecuencias:
∑ ( P . M.)F
i =1
x=
N
Demostración
∑ (xi − x ) = ∑ xi − ∑ x = ∑ xi − nx = nx − nx = 0
sean los términos 8, 3, 5, 10, 12.
Calculando su media X =
∑ xi = 38 = 7.6
n 5
Demostración.
∑ (xi − A) 2
= Q( X 1 , X 2 ,... X n ; A )
Tomando la derivada parcial de Q respecto a A se tiene:
∂Q
= −2∑ [( xi − A)] = − 2[∑ xi − nA];
∂A
1
∑ xi − nA = 0 → A = n ∑ xi = x
28
x= ∴ x = 56
.
5
= 4 + 1 + 1 + 9 + 4 = 19
Cuando A > x A = 6
Tenemos (3 - 6)2 + (4 - 6)2 + (6 - 6)2 + (7 - 6)2
= 9 + 4 + 0+ 1 = 18
Cuando A = x A = 5.6
(3-5.6)2 + (4-5.6)2 + (6-5.6)2 + (8-5.6)2 + (7-5.6)2 =
(-2.6)2+ (-1.6)2 + (0.4)2 + (2.4)2 + (1.4)2 =
6.76 + 2.56 + 0.16 + 5.76 + 1.96 = 17.20 l.q.q.d.
Demostración.
1
n∑
Como x = xi → nx = ∑ xi
nx = x1 + x 2 + ...+ x n
20
x= =4 n=5
5
Tendremos: 4(5) = 3 + 5 +6 + 4 + 2
20 = 20 1.q.q.d.
1. Su cálculo es sencillo.
2. Con su valor y el número de términos se puede calcular la suma de los valores
de los términos.
3. Puede calcularse conociendo solamente la suma y el número de los términos de
la serie.
1. Hay ocasiones en que un término que mide una modalidad anormal del
fenómeno influye en el promedio y puede ser que este no refleje la realidad.
2. Puede darse el caso de que el valor de la media para dos más series distintas
sea el mismo.
S erie S imple
x = A+
∑ ( xi − A ) x=
∑ xi
N N
X =A+
∑ Fi ( Xi − A ) x=
∑ Xifi
∑ fi ∑ fi
Con A = 3
30 87
X =3+ = 4.8 X= = 4.57
19 19
0 y menos de 2 1 1 -4 -4 1
2 y menos de 4 3 3 -2 -6 9
4 y menos de 6 5 5 0 0 25
6 y menos de 8 7 7 2 14 49
16 16 -4 4 84
X =A+
∑ Fi ( P * Mi − A ) x=
∑ ( fi * PMi )
∑ fi ∑ fi
Con A = 5
84
4 X= = 5.25
X =5+ = 5.25 16
16
Se define como el valor central que divide una distribución de modo que
quede de cada lado de ella un número igual de términos ordenados, éstos en
orden creciente ó decreciente.
N
−C
Md = Li + 2 ( i)
Fi
donde:
M d.=M ediana
M d. = 3
Xi Fi Fi
Acumulada
2 5 5
3 6 11
4 3 14
5 3 17
Total 17
∑ fi + 1
No. de orden o terminos =
2
17 + 1 18
No= = =9
2 2
1 y menos 2 5 10 0.07 5
3
3 y menos 4 2 8 -3.93 7
5
5 y menos 6 4 24 -1.93 11
7
7 y menos 8 4 32 -1.93 15
9
Total 15 74
74
x = = 4.93
15
Así, No= ∑
F + 1 15 + 1
= =8
2 2
7.5 − 7
Md . = 5 + ( 2)
4
Clase F Acumulado
Menos de 1 0
Menos de 3 5
Menos de 5 7
Menos de 7 11
Menos de 9 15
Ojiva
16
15
(9,15)
14
13
F
A 12 (7,11)
r
e c 11
u 10
c
m 9 (5.25,8)
u
u 8
e
l 7
n
a 6
c (5,7)
d 5
i
a 4
a
3 (3,5)
2
1
(1,0)
1 2 3 4 5 Md 6 7 8 9 10 11
Clases
M d = 5.25
Serie de frecuencias
X F
10 6
11 40
12 2
13 1
CLASES F
1 y menos de 3 5
3 y menos de 5 2
5 y menos de 7 4
7 y menos de 9 4
Total 15
Ejemplo:
Xi Fi
2 1
3 10
4 3
5 4
6 7
7 2
8 3
9 1
M o. = 3 M o. = 6 M o. = 8
En este caso se obtiene una situación multimodal, que, se reitera, en algunas
situaciones es útil conocerla.
RELACIÓN ENTRE LA MEDIA ARITMÉTICA,LA MODA Y LA MEDIANA
(7)
Por otra parte, si tomamos en cuenta la magnitud de cada error dentro del
criterio matemático, si denominamos a “e” como la cantidad del error sin
considerar su dirección o signo aritmético, y si deseamos minimizar la suma de
errores en que se incurre al estimar el valor de cada medición u observación, el
criterio matemático se expresa como Σe= mín, que solo la mediana lo
satisface. Lo anteror significa que si usaramos otra medida de tendencia central
para estimar cada estimación, la suma aritmética de los valores absolutos de los
errores sería mayor que la suma de los errores obtenidos cuando usamos la
mediana como estimador.
Ahora bien el tercer gran criterio que deben satisfacer los estimadores al
utilizarlos, es que la suma de errores al cuadrado sea un mínimo, que por
cierto, como ya vimos en páginas anteriores, solo lo satisface la media
aritmética; se representa por Σe 2 = mínimo, que es muy importante en el
análisis estadístico, en especial en el análisis de regresión ( relación de asociación
o de causalidad ), campo en el que se le conoce como el criterio de “mínimos
cuadrados” .
2 y menos de 4 2 3 -4 -8
4 y menos de 6 3 5 -2 -6
6 y menos de 8 5 7 0 0
8 y menos de 10 3 9 2 6
10 y menos de 12 2 11 4 8
Total 15 0
Verificación:
Si A = 7
∑ fi * ( P . M .− A)
X = A+
∑ fi
0
X = A+ = 7; X = 7
15
N
−C
Md . = L + 2 (i )
fi
15
−5
Md . = 6 + 2 (2 ) = 7
5
M d.=7
d1
Mo. = Li + ( i)
d1 + d 2
2
Mo.= 6 + ( 2) = 7
2+ 2
Mo. = Md . = x
histograma
X = Md. = Mo. = 7
Podemos concluir diciendo que la relación entre estas tres medidas de tendencia
central es indicativa de la dirección y extensión del alejamiento de los datos de la
distribución, de la simetría.
Definición: Es un valor tal, que multiplicado ese valor tantas veces como
el número de términos, resulta un producto igual al producto de los valores de los
términos de la serie dada.
Si los términos de la serie dada son: x1 , x 2 ,... x n , aplicando la propiedad
apuntada antes, resulta la expresión:
Despejando Mg = n x1 * x 2 * x3 *...*xn
Igualdad que nos dice: el promedio geométrico de una serie simple es igual
a la raíz que tiene como índice el número de términos, del producto de los valores
de los términos de la serie.
log( Mg) =
∑ log xi
n
Xi LogXi
1 0.00000
20 1.30103
7 0.84510
30 1.47712
18 1.25527
4.87852
Sustituyendo
Log M g = 4.87852/5 = 0.975704
Log M g = 0.975704
Antilog de 0.975704 = 9.0303
Luego M g. = 9.0303
log Mg =
∑ fi * log xi
∑ fi
Para una serie de clases y frecuencias :
log Mg =
∑ fi * log P .M .
∑ fi
Para fines prácticos es preferible calcular el logaritmo de la
media geométrica y luego el antilogaritmo de ésta.
Cálculo de M g
Xi Fi Log Xi Fi LogXi
12 3 1.0792 3.2375
10 6 1.0000 6.0000
15 9 1.1761 10.5848
20 12 1.3010 15.6124
22 7 1.3424 9.3970
37 44.8317
log Mg =
∑ fi * log xi
∑ fi
448313
.
log Mg = = 12116567
.
37
Antilog.de1.2116567=16.28
M g =16.28
Total 26 38.3023
log Mg =
∑ fi * log P .M .
∑ fi
383022
.
log Mg = = 14731615
.
26
M g.= 29.72
n = número de observaciones
xi = Observaciones i-ésima .
1
Xi Xi
1 1.0
2 0.5
3 0.3
4 0.3
5 0.2
15 2.28
2192
.
= 219
.
1
2192
.
= 1092
.
2
2192
.
= 0730
.
3
2192
.
= 0548
.
4
2192
.
= 0434
.
5
5=5 términos
SERIE DE FRECUENCIAS
Xi Fi 1/Xi Fi*(1/Xi)
3 1 0.33 0.33
4 2 0.25 0.50
2 3 0.50 1.50
5 4 0.20 0.80
Total 10 3.13
Ma =
∑ fi = ∑ fi
1 fi
∑ xi f ∑ xi
10
Ma = = 31948
.
313
.
CLASES Fi PM Fi/Pm
10 3.27
Ma =
∑ fi o ∑ fi
fi 1
∑ P .M . ∑ P .M . fi
10
Ma = = 3.08
3.24
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
0
2
X = Mo = Md
X < Md < Mo
SESGO NEGATIVO
PRÁCTICA I
Nombre:__________________________________________Grupo:_________
Problema 1. Construya usted una serie simple con los siguientes datos,
que representan la estatura de 20 estudiantes de la Facultad de Economía.
1.67, 1.72, 1.54, 1.57, 1.61, 1.61, 1.67, 1.54, 1.57, 1.72
1.85, 1.81, 1.54, 1.61, 1.81, 1.67, 1.81, 1.67, 1.61, 1.67
4 5 8 7 6 7 8 9 14 15
7 9 10 8 6 11 0 10 1 3
12 16 12 1 15 15 4 13 0 6
2 3 4 5 16 5 11 6 9 12
9 13 6 10 18 4 14 8 9 13
11 6 8 12 4 20 17 10 7 6
a) En base a estos datos, diga usted cuál es el número de hijos que se presentan
con mayor frecuencia en las familias campesinas y emita su opinión al respecto.
PRÁCTICA II
Problema 1. Los accidentes de trabajo ocurridos en 60 fábricas de la zona
industrial de Tlalnepantla en 1998, están dados en el siguiente cuadro.
0 a 4 3
5 a 9 6
10 a 14 15
15 a 19 12
20 a 24 10
25 a 29 9
30 a 34 5
60
a) Calcule usted la media aritmética, la media geométrica y la media armónica e
interprete cada uno de estos resultados, asimismo explique la relación que existe
entre ellas.
Miles de No. de
kilómetros llantas
de + 25 a 30 18
de + 30 a 35 12
de + 35 a 40 35
de + 40 a 45 20
de + 45 a 50 15
100
PRÁCTICA III.
PREGUNTAS
a) Ordene los datos anteriores en una serie de clases y frecuencias, de acuerdo al
método de Sturges.
'0-2 6
3-5 10
6-8 14
9-11 6
12-14 4
15-17 2
18-20 8
50
PREGUNTAS.
Ejemplo: datos: 2, 3, 4, 5, 6, 7, 8, 9
Rango = 9 - 2 = 7
D. M .=
∑ xi − x Serie simple
n
D. M .=
∑ fi xi − x Serie de frecuencias
∑ fi
D. M . =
∑ fi P .M .−x Serie de clases y frecuencias
∑ fi
Ejemplo: la temperatura en ciertos días del mes de mayo, expresada en
grados centígrados fué:
_
X1 | X1 - X |
22 2
23 1
23 1
24 0
25 1
26 2
27 3
170 10
170
x = = 24 o
7
D. M .=
∑ x1 − x
n
10
D. M . = = 142
. o
7
Primero se calcula X para después desviar con respecto a ella el valor de los
términos de la serie, en este caso las temperaturas observadas durante el mes de
mayo.
15
6
4
7
2
2
4
40
_ _
| X1 - X | Fi XiFi Fi | X1 - X |
3 5 120 15
2 4 102 6
2 2 46 4
1 7 168 7
0 8 200 2
1 2 52 2
2 2 54 4
30 742 40
x =
∑ x i fi D. M .=
∑ fi x − x
1
∑ fi ∑ fi
742 40
x = = 25 D. M . = = 133
. o
30 30
x =
∑ P . M. * f i
∑ fi
D. M . =
∑ fi P .M .−x
∑ fi
Temperatura en _
Intervalos Fi PM Fi PM | PM - X |
22 y menos de 24 5 23 115 -3
24 y menos de 26 9 25 225 -1
26 y menos de 28 10 27 270 1
28 y menos de 30 6 29 174 3
30 784 0
_
Fi | PM - X |
15
9
10
18
52
784 52
x = = 26o D. M . = = 173
. o
30 30
Xi δ a = Xi - X δa 2
1 -9 81
2 -8 64
5 -5 25
9 -1 1
11 1 1
13 3 9
14 4 16
25 15 225
80 0 422
X =
∑ x = 80 = 10
n 8
Xi Fi Xf δa δa 2 δa 2Fi
X =
∑ xifi = 201 = 287
.
∑ fi 70
σ=
∑ δ fi2
a
∑ fi
88.06
σ= = 11
.
70
σ =i
n(∑ δa F ) − ( ∑δaf )
2 2
= 0.5
85(169) − (33) 2
= 05
.
14365 − 1089
= 05
.
13276
= 05 . = 0.680
. * 136
n( n − 1) 85(85 − 1) 85(84) 7140
X =
∑ P . M. f
∑f
250.25
X =
85
X = 2.94
σ=
∑ ( P.M . − X ) fi = 39.38
2
∑ fi GENARO85SÁNCHEZ BARAJAS
PROFESOR: 61
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO
II.3.2.4 VARIANZA
Se define como el cuadrado de la desviación estándar
σ 2
=
∑ ( Xi − X ) = ∑ xi
2 2
σ2=
∑ fi( Xi − X )
2
Se dice que cuando C.V. toma valores alrededor del 10% se acepta X
como medida central representativa de los datos de un fenómeno bajo estudio;
cuando C.V. es mayor a 10%, se debe optar por otra medida de tendencia central
para representar el promedio de los datos del fenómeno bajo estudio.
Ejercicios
obtenga:
Respuestas
Respuesta 2
−
X = Σ fi(PM i) / Σ fi = 668.4/50 = 13.368, redondeado a 13.36
Respuesta 3
−
3a. Primera propiedad: Σ ( PM i- x )fi = 0
− − − −
( PMi - x ) ( PMi - x )fi ( PMI − x )2 ( PMi − x )2 fi
9.7-13.36=-3.66 -3.66(7)= -25.62 13.3956 93.7692
11.1-13.36=-2.26 -2.26(5)=-11.30 5.1076 25.5380
12.5-13.36=-0.86 -0.86(11)=-9.46 0.7396 8.1323
13.9-13.36=0.54 0.54(10)= 5.40 0.2916 2.9160
15.3-13.36=1.94 1.94(12)=23.28 3.7636 45.1632
16.7-13.36=3.34 3.34(4)=13.36 11.1556 44.6224
18.1-13.36=4.74 4.74(1)=4.74 22.4676 22.4676
Total 0.00 242.6087
−
3b.- Segunda propiedad: Σ (PM i- x )2fi= M INIM O=242.6087
−
CV= σ / x *100 = 2.20/13.36*100 = 16.5%
II.3.3.1 CUARTILES
.
Los cuartiles son medidas estadísticas de posición que tienen la
propiedad de dividir la serie estadística en cuatro grupos de números iguales de
términos.
De manera similar los deciles dividen a la serie en diez partes iguales y los
percentiles dividen a los términos de la serie en cien grupos iguales.
los deciles por D1, D2, D3,......, D9 y los percentiles con P1, P2, P3, .....,P99.
En cualquiera de los tres casos, la medida de posición seleccionada toma
el valor de uno de los términos o del punto medio entre dos términos.
Así mismo el número de orden del tercer cuartil ser igual a tres cuartos del
número de términos de la distribución más uno.
a) Si se adopta el símbolo No Q para denotar el número de orden, donde: No es el
número de términos y Q el cuartil a calcular, entonces en el ejemplo cuyos
términos son: 3, 4, 5, 7, 8, 10, 11, que es número de términos impar, el número
de orden se calcula así:
N +1 7 +1
NoQ1 = = = 2, el cual indica que el valor del segundo término (4) es el
4 4
valor de Q1, luego Q1 =4
N +1 7 +1
NoQ2 = = = 4, el cual indica que el valor del cuarto término (7) es el
2 2
valor de Q2 , y Q2=7
3( N + 1) 3(7 + 1)
NoQ3 = = = 6, que indica que el valor del sexto término (10) es el
4 4
valor de Q3 , y Q3 = 10
b)Cuando los datos estan agrupados en una serie de frecuencias como la siguiente:
1 6 6
4 15 21
8 14 35
14 4 39
39
39 + 1
NoQ1 = = 10∴ Q1 = 4
4
39 + 1
NoQ2 = = 20∴ Q2 = 4
2
3(39 + 1)
NoQ3 = = 30 ∴ Q3 = 8
4
Por otra parte se verifica que los tres cuartiles dividen a la distribución en
cuatro grupos iguales, en virtud de que a la izquierda del primer cuartil existe el
25% de términos de la distribución; de la misma forma a la izquierda del
segundo cuartil existe el 50% de la distribución y el tercer cuartil revela que a
su izquierda se localiza el 75% de los términos.
de 10 a 20 6 6
De + de 20 a 30 25 31
De + de 30 a 40 32 63
De + de 40 a 50 23 86
De + de 50 a 60 7 93
De + de 60 a 70 4 97
De + de 70 a 80 2 99
99
Gráficamente tendremos:
F Histograma
r
e
40 32
c
u 30 25 23
e
20
n 7
6 4
c 10 2
i 0
a Tiempo en Minutos
99 + 1
NoQ1 = = 25 ,significa que el 25 % de las observaciones se hallan a la
4
izquierda de Q1.
(30 − 20)
Luego Q1 = 20 + * 19 = 27.6 minutos.
25
Similarmente :
99 + 1 (40 − 30)
NoQ2 = = 50 ∴ Q2 = 30 + * 19 = 3594
. minutos
2 32
. − 27.60 1756
4516 .
Desviación cuartil = = = 8.78 minutos.
2 2
II.3.3 PRÁCTICA IV
Nombre______________________________________________Grupo ______
_________________________________________________________________
_______________________________________________________________
PROBLEM A 2.- Los siguiente valores son los rendimientos por hectárea de
un determinado producto agrícola (en toneladas) en 8 ejidos colectivos de
diferentes regiones del país:
1, 2, 3, 4, 5, 11, 11, 30.
Calificaciones No. de
estudiantes
20 - 29 3
30 - 39 6
40 - 49 5
50 - 59 7
60 - 69 10
70 - 79 29
80 - 89 12
90 - 99 8
80
Asimetría = 3( X − M d )
σ
M 1 primer momento = ∑
fx
=0
∑f
Donde:
x' = Xi − X
M 2 segundo momento = ∑
fx 2
=σ2
∑f
tercer momento = ∑
3
fx
M3 =0
∑f
cuando es simétrica, y M 3 es diferente de cero cuando no es simétrica.
M k, k ésimo momento = ∑
k
fx
∑f
Para medir la asimetría se usa el tercer momento que se iguala a cero en
una distribución simétrica.
Ejemplo:
DISTRIBUCIONES
Simétrica Asimétrica
Xi X1 X2 X3 Xi X1 X2 X3 X4
2 -3 9 -27 4 -1 1 -1 1
4 -1 1 -1 4 -1 1 -1 1
5 0 0 0 4 -1 1 -1 1
5 0 0 0 4 -1 1 -1 1
6 1 1 1 5 0 0 0 0
8 3 9 27 9 4 16 64 256
30 0 20 0 30 0 20 60 260
30 30
X = =5 X = =5
6 6
Curva A Curva B
Sesgada a la Derecha Sesgada a la izquierda
II.3.4.3. KURTOS IS
M4
Se refiere a la forma de la curva, que se obtiene con: A4 =
σ4
La medida de picudéz o kurtosis es alta cuando la curva es picuda o
alargada y es baja cuando es aplanada.
Tomando como referencia el ejemplo numérico anterior, podemos
obtener:
260
M4 = . ; También
= 433 como (σ 2 ) 2 = σ 4 = 1097
.
6
M4 4333
.
Así tenemos que A4 = 4
= = 394
.
σ 10.97
σ=
∑ [ (1 − 3) 2
+ (2 − 3) 2 + ( 3 − 3) 2 + ( 4 − 3) 2 + (5 − 3) 2 ]
5
3( 3 − 3)
Asimetría = =0
141
.
Gráficamente:
Contribuyentes
fi 1
x =Md.Mo
1 2 3 4 5 Xi
σ
1.- Obtenga el coeficiente de variación = *100
X
Como: Y =
∑ P . M. fi
=
36.5
= 365
.
∑ fi 10
σ=
∑ fi( P .M .−Y ) 2
=
485250
.
= 485250
. = 2.2
∑ fi 10
2.2
Sustituyendo CV . = (100) = 6027%
.
365
.
Md = Lim +
∑ fi + 1) / 2 − C i = 2 + 55. − 4 ( 3) = 2 + 15. ( 3) = 2 + 45. = 35.
(
∑ fi 3 3 3
M3 685
. M 5053
.
A3 = 3
= = 0. 6432; A4 = 44 = = 2.16
σ 105. σ 2342
.
Como A3 = 0.6432 la dirección es hacia la derecha como también lo
indica el coeficiente de Pearson.
M3 =
∑ fi( P .M. i − Y ) 3
=
685
.
= 685
.
∑ fi 10
685
.
Como σ 3 = 1065
. tenemos A3 = = 0.6432
1065
.
505. 3507
M4 = . ; σ 4 = 23.42
= 5053
10
_ _ _ _
(PMi - Y) (PMi - Y) fi (PMi - Y) fi (PMi - Y)4
3 3 4
Y Z
Curva
de
Lorenz
45°
0 Xm Xa X
I .G .=
∑ X (Y
1 1 + 1) − ∑Y ( X
1 1 + 1)
10,000
Facultad de Economía
X1 Y1 + 1 X1 (Y1 + 1) Y1 X1 + 1 Y1 (X1 + 1)
9.8 26.2
26.2 23.4 613.08 9.8 48 470.4
48 57.1 2,740.8 23.4 81.8 1,914.12
81.8 71 5,807.8 57.1 91.1 5,201.81
91.1 84.1 7,661.51 71 96.5 6851.5
96.5 88.5 8,540.25 84.1 98.3 8,267.03
98.3 91.2 8,964.96 88.5 98.9 8,752.65
98.9 94.3 9,326.27 91.2 99.4 9,065.28
99.4 95.4 9,482.76 94.3 99.5 9,382.85
I . G. = ∑ X (Y + 1) − ∑ Y ( X
1 1 1 1 + 1)
=
63,087.43 − 59,44564
.
=
364179
.
10,000 10,000 10,000
I.G.=0.3641 ó 36.41%
II.3.5.3 MÉXICO.DIS TRIBUCIÓN DEL INGRES O PERS ONAL REAL
MENS UAL POR CONCEPTO DE S ALARIO Y S UELDOS . 1950-1956 Y
1964- 1965.(5)
Menos de 75 12 14 19
75 - 149 29 23 18
150 - 199 23 16 11
200 - 299 17 17 22
300 - 399 10 10 11
400 - 499 4 7 6
500 - 599 2 5 5
600 - 799 2 2 3
800 - 999 1 2 1
1000 - 1499 1 3 2
1500 - ó más 1 2 2
Menos de 75 4 8 5 11
75 - 149 29 20 17 13
150 - 199 22 14 21 12
200 - 299 16 15 14 23
300 - 399 10 12 10 11
400 - 499 6 9 4 7
500 - 599 3 6 5 6
600 - 799 5 4 5 6
800 - 999 2 4 4 3
1000 - 1499 2 5 3 4
1500 - 2999 1 3 3
3000 - ó 0 2
más
en la tradores
Prod.
Hasta 299 34.1 56.3 49.1 21.7 18.1 14.5 14.3 4.4 4.3 2.8
300 - 749 41.1 35.6 41.2 48.2 49 46.9 60 16.6 37 12.9
750 - 999 8.7 4.2 3.9 10.2 15.4 16.2 11.4 10 20.3 14.5
1000 - 1500 9.4 2.4 3.5 10.8 12.9 13.5 10.4 23 25.2 31.5
1501 - 2000 2.5 0.9 0.9 3.4 2.1 5.7 3 10.5 7.1 7.5
2001 - 3000 2 0.1 0.8 3.4 1.8 1.1 0.8 7.9 4.7 11.2
3001 - 5000 1.2 0.3 0.4 1.6 0.5 2.1 - 11.6 1 10
5001 - 10000 0.7 - 0.1 0.7 - - 0.1 10.7 0.4 6.3
10001 ó más 0.3 0.1 0 0.1 - - - 5.2 0 3.1
RELACIÓN PORCENTUAL
REPÚBLICA M EXICANA
SECTOR SECUNDARIO
Estratos de Ingreso Número de Ingresos
SECTOR TERCIARIO
Estratos de Ingreso Número de Ingresos
variación
______________________
0 1
Ip é Iq indican el índice de precios y cantidades, respectivamente.
Un índice relativo se puede calcular para una mercancía o servicio, como el
caso anterior o para varios, como sucede en la realidad.
Su fórmula es Ip =
∑P 1
* 100; I q =
∑q 1
* 100
∑P 0 ∑q 0
Luego Ip =
∑ P Q ; Iq = ∑ q P
1 1
∑P Q 0 ∑q P 0
Ip =
∑P Q1 0
*100; Iq =
∑Q P 1 0
*100
∑P Q0 0 ∑Q P 0 0
Ip =
∑PQ 1 1
* 100; Iq =
∑q P 1 1
*100
∑P Q 0 1 ∑q P 0 1
Ip = ∑PQ 1 0
*
∑ P Q *100
1 1
∑P Q 0 0 ∑P Q 0 1
Iq ∑q P 1 0
*
∑ q P * 100
1 1
∑q P 0 0 ∑q P 0 1
Iv =
∑P q 1 1
* 100
∑P q 0 0
M edia armónica :
n
Ip = *100
Pi
∑ Po
n
Iq = * 100
q1
∑ qo
Puesto que hay diferentes métodos para calcular índices (M arshall,
Keynes, Ellsworth, etc.) el Prof. Iwing Fisher trata de homogeneizar su cálculo
De tal suerte que el índice que pase "esas" pruebas matemáticas es el que
debe usarse en opinión de Fisher. Como se verá más adelante con un ejemplo
numérico, sólo el índice de Fisher pasa estas pruebas, por eso lo llamó “ideal”
Ello significa que el cambio de base se hace por comodidad, ergo; por
ello expresa las variaciones en función de un año reciente, pero que de ninguna
manera mejora la serie o valores del fenómeno bajo estudio.
DEFLACTACIÓN
seleccionado previamente) se divide cada uno de los datos, entre el valor del
deflactor en ese año.
Así se hace para todos los datos del fenómeno bajo estudio durante un
período de tiempo dado. El cociente resultante es el valor real, en cada año, del
fenómeno de interés.
1 2 3 4 5 6 7
Inflación
Base Base Base Base
1968=100 INPC 1978=100 INPC 1994=100 INPC 2002=100
1968 100 30.2 30.2 0.08 0.08
1969 103.5 31.3 31.3 0.08 0.08 3.5
1970 108.7 32.9 32.30 0.09 0.09 3.2
1971 114.6 34.6 34.00 0.09 0.09 5.3
1972 120.3 36.4 35.70 0.10 0.10 5.0
1973 134.8 40.7 40.00 0.11 0.11 12.0
1974 166.8 50.4 49.50 0.13 0.13 23.8
1975 191.8 58.0 57.00 0.15 0.15 15.2
1976 222.1 67.1 66.00 0.18 0.18 15.8
1977 286.7 86.7 85.10 0.23 0.23 28.9
1978 330.8 100.0 100.00 0.27 0.27 17.5
1979 117.8 35.6 118.20 0.32 0.32 18.2
1980 149.0 45.0 149.30 0.40 0.40 26.3
1981 191.9 58.0 191.10 0.51 0.51 28.0
1982 302.4 91.4 303.60 0.81 0.81 58.9
1983 612.90 1.64 1.64 101.9
1984 1,014.10 2.71 2.71 65.5
1985 1,599.70 4.28 4.27 57.7
1986 2,979.20 7.97 7.95 86.2
1987 6,906.60 18.47 18.43 131.8
1988 14,791.20 39.55 39.47 114.2
1989 17,705.60 47.35 47.25 19.7
1990 22,481.50 60.12 60.00 27.0
1991 27,576.30 73.75 73.59 22.7
1992 31,852.80 85.18 85.01 15.5
1993 34,959.00 93.49 93.29 9.8
1994 37,394.10 100.00 99.79 7.0
1995 50,478.30 134.99 134.71 35.0
1996 67,836.64 181.41 181.04 34.4
1997 81,828.39 218.83 218.37 20.6
1998 94,890.15 253.76 253.23 16.0
1999 110,595.67 295.76 295.15 16.6
2000 121,092.62 323.83 323.16 9.5
2001 128,187.35 342.80 342.09 5.9
2002 100.21 100.21 5.7
103.5
*100 = 31.3 y asi sucesivamente hasta donde se desea hacer el cambio de
330.8
base.
Por ejemplo, en 2002 se deseaba inflactar las ventas hechas por las
empresas durante 1999, 2000, 2001 y 2002.
Para ello se cuenta con el índice de precios al consumidor para esos años
el cual nos permite mediante el cambio de base, hacer la inflactación
correspondiente: 2002 = 100
Nuevo Índice
Año Índice Para dividir Para multiplicar
2002 153.63 153.6 ÷ 153.63 = 100 153.6 ÷ 153.63 = 100
3 3
2001 118.18 118.1 ÷ 153.63 =0.77 153.6 ÷ 118.18 = 1.3
8 3
2000 99.95 99.95 ÷ 153.63 =0.65 153.6 ÷ 99.95 = 1.54
3
1999 85.1 85.1 ÷ 153.63 =0.55 153.6 ÷ 85.1 = 1.82
3
Ahora bien para deflactar.- Si fijamos 1999 = 100 año base, es decir,
llevamos el valor de las ventas a precios de 1999, en este caso se hace lo
contrario, es decir, hacemos un cambio de base al revés.
PODER ADQUISITIVO = I/ IP
I II III IV
Índice Variación Base inicial Importe Inflación
Nacional de Mensual para aplicar la de la Acumulada
Precios al del inflación del Inflación %
mes
Mes Consumido INPC (100+col. IV del del mes
r
renglón %
anterior)
A Enero 20,260.7 4.8 100 4.8 4.8
B Febrero 20,719.5 2.3 104.8 2.4104 7.2104
C Marzo 21,084.8 1.8 107.2104 1.92978 9.14018
D Abril 21,405.7 1.5 109.141187 1.63712 10.7773
E Mayo 21,779.2 1.7 110.778305 1.88323 12.66053
F Junio 22,258.9 2.2 112.661536 2.47855 15.13908
G Julio 22,664.8 1.8 115.14009 2.072522 17.211602
H Agosto 23,051.0 1.7 117.212612 1.992614 19.204216
H Septiembre 23,379.6 1.4 119.205226 1.668873 20.873089
J Octubre 23,715.7 1.4 120.874099 1.692237 22.565326
20.6 22.565326
La tasa de inflación del mes de febrero fue de 2.3 %. Sin embargo la tasa
de inflación acumulada durante estos dos meses de 1990 no fue la simple suma
de 4.8 + 2.3 = 7.1. El cálculo de la inflación acumulada al 29 de febrero es :
104.8 x 0.023 = 2.4104 + 4.8 = 7.21 % (columna IV renglón B ).
GENERALIZANDO PARA :
P1
∑P * 100
P1
log Ip= log
0
n
= log I p =
∑p0
+ log 100 − log n
P1
∑P
log Ip= log 0
+ log 100
n
n
M a de los relativos I p = P0
∑ P1
* 100
Paasche
M arshall
Ip =
∑ P (Q + Q ) * 100
1 0 1
∑ P (Q + Q )
0 0 1
I =
∑ P Q * ∑ Q P *100
1 0 1 1
∑P Q ∑Q P
p
0 0 0 1
I =
∑ P Q * ∑ Q P * 100
1 0 1 1
∑P Q ∑Q P
q
0 0 0 1
Iv = ∑
PQ 1 1
* 100 donde Iq = índice de cantidad
∑ PQ 0 0
Iv = índice de valor
2001 2002
Artículo Unidad Po Qo P1 Q1 P1Qo PoQo P1Q1 PoQ1
Maíz Kgs. 2 3 3 1 9 6 3 2
Arroz Kgs. 4 3 6 2 18 12 12 8
Papa Kgs. 6 4 9 3 36 24 27 18
Trigo Kgs. 8 5 12 4 60 40 48 32
Sal Kgs. 10 6 15 5 90 60 75 50
30 21 45 15 213 142 165 110
Laspeyres.
Ip =
∑ P1Q0 * 100 = 213 * 100 = 15. *100 = 150%
∑ P0Q0 142
Paasche
Ip =
∑PQ 1 1
* 100 =
165
* 100 = 15
. * 100 = 150%
∑P Q 0 1
110
M arshall
Ip =
∑ P (Q + Q ) * 100 = 45( 21 + 15) * 100 = 1620 * 100 = 15. * 100 = 150%
1 0 1)
∑ P (Q + Q )
0 0
30( 21 + 15)
1
1080
Ip = ∑ PQ * ∑ PQ
1 0 1 1
* 100 =
213 165
* * 100 = 15 . * 100 = 2.25 *100 = 15
. *15 . *100 = 150%
∑ PQ ∑ PQ 0 0 0 1 142 110
∑q P ∑ q P 0 0 0 1
P1
∑P 0 75
.
Ip = * 100 = * 100 = 15
. * 100 = 150%
n 5
M g de relativos
P1
∑P P1
log I p = log
n
0
* 100 = log
∑P 2
− log n + log 100
Por lo tanto log Ip = 2.1761
Su antilogaritmo = 150.0 %
M a de relativos
n 5
Ip = * 100 = * 100 = 149
. * 100 = 149% ≅ 150%
P0
∑ P1
335
.
M ARSHALL
Ip =
∑ P (Q 1 0 + Q1 )
* 100 =
378
* 100 = 150%
∑ P (Q 0 0 + Q1 ) 252
Donde:
2001 2002
Artículo Unidad Po Qo Pi Qi
Maíz Bushel 2,343.00 2,679.00 0.66 3,071.00
Algodon Libra 5,356.00 5,705.00 0.14 6,715.00
Heno Tonelada 20,150.00 76.59 17.78 76.16
Trigo Bushel 2.13 52.10 1.43 843.30
Avena Bushel 0.70 1,107.00 0.46 1,444.00
Papa Bushel 1.58 297.30 1.13 368.90
Azúcar Libra 0.10 4,371.00 0.05 4,817.00
Cabada Bushel 1.22 131.10 0.72 171.00
Tabaco Libra 0.39 1,444.00 0.21 1,509.00
Linaza Bushel 4.38 6.77 1.77 10.90
Centeno Bushel 1.33 78.70 1.26 61.90
Arroz Bushel 2.67 42.69 1.19 51.56
∑ PQ
1 0 ∑Q P1 0
es diferente de ∑Q P1 1
∑ P0 Q0 ∑Q P0 0 ∑Q P0 0
∑ PQ1 1
*
∑Q P1 1
es diferente de ∑Q P1 1
∑ PQ0 1 ∑Q P0 1 ∑Q P0 0
∑ PQ ∑ PQ
0 0 0 1 ∑Q P ∑Q P 0 0 0 1
la anterior ∑ PQ * ∑ PQ * ∑ Q P * ∑ Q P = ∑ P Q
1 0 1 1 1 0 1 1 1 1
∑ PQ ∑ PQ 0 0 ∑Q P ∑Q P ∑ P Q
0 1 0 0 0 1 0 0
Ejemplo:
∑ PQ 1 0
= 05824
. ;
∑P Q 0 1
=
12, 9686108
. .
= 10956
.
∑ PQ 0 0 ∑P Q 0 0
11,864.46125
.
Con Paasche:
∑ PQ 1 1
=
7 ,441317
. .45
= 05725
.
∑ PQ 0 1
12, 9986108
. .
∑ QP 1 1
=
7,441317
. .45
= 10769
. = 1078868
.
∑QP 0 1 6,910.027.39
tal que: (1.0769)(0.5725) ≠ 0.6272
∑ PQ 0 0
pero ∑ PQ1 0
se transforma ∑ PQ . 0 1
∑ PQ0 0 ∑ PQ 1 1
∑ P Q * ∑P Q
1 0 0 1
≠ 1.0
∑ P Q ∑ PQ
0 0 1 1
∑ PQ
1 1
se transforma ∑ PQ 0 0
.
∑ P0 Q1 ∑ PQ 1 0
pero
∑ PQ
1 1
*∑
Q0 P0
±1.0
∑ P0 Q1 ∑ Q0 P1
∑ Q P * ∑Q P
0 1 1 1
* ∑Q P * ∑Q P
1 0 0 0
= 1.0
∑Q P ∑ Q P
0 0 1 0 ∑Q P ∑Q P
1 1 0 1
∑ PQ 0 0 ∑ PQ 1 1
Recordando que :
∑ PQ 0 1
=
12,998.6108
.
= 17468157
.
∑ PQ 1 1 7,441317
. .45
luego (0.5824)(1.7468157) ≠ 1.0 porque 1.01734 ≠ 1.0
Con Paasche:
∑ PQ 1 1
se transforma en ∑Q P 0 0
∑ PQ 0 1 ∑Q P 0 1
donde ∑Q P 0 0
=
11864
, .46125.
= 17169919
.
∑Q P 0 1
6, 9100239
. .
Visto numéricamente:
Lu * Cu − 1
Cu =
100
donde:
Cu = Índice de cadena del año de estudio.
Lu = Eslabón relativo.
Cu - 1 = Índice en cadena del año anterior.
Para 2002
(1211. ) *(154.5)
Cu 2002 =
100
Cu 2002 = 187.09
Para ir hacia atrás en el tiempo a partir de un año base la ecuación se
resuelve para Cu - 1 en lugar de Cu. Así, el índice en cadena para 1998 será:
Cu 118.2
Cu − 1 = *100; Cu1998 = * 100
Lu 86.7
Por tanto Cu 1998 = 136.3.
Para 1995 tendremos
100
Cu 1999 = = 118.2
84.6
1.- Se obtuvo el índice mensual para los años de 1998 y 1999, por ser los años a
que corresponden la mayoría de las empresas.
1,418.20 1,199.40
I 1999 = = 118.18%; I 1998 = = 99.95%
12 12
2.- Al año de 1999 o sea 118.8 se le incorporó el 30% de la inflación estimada
para 2000, a fin de hacer este último igual a 100% o año base:
I2000 = 118.18 * 1.30 = 153.63 = 100.0%
INPC INPP
Es un indicador ( estimador porque Es un indicador de la evolución de los
viene de una muestra) del precios de los bienes y servicios que
comportamiento de los precios de los forman la producción de la economía en
bienes y servicios que consumen las un lapso dado.
familias en un lapso dado.
Incuye únicamente los bienes y Incluye: además del consumo familiar, a
servicios que adquieren las familias para los bienes y servicios intermedios, de
su consumo en un lapso dado. cconsumo del gobierno, de inversión y
∗
Indice de Precios al Consumidor, BANXICO.
de exportación.
Las ponderaciones están basadas en los Las ponderaciones se estiman con base
reportes que el INEGI levanta en los en el Sistema de Cuentas Nacionales de
hogares, los cuales al agregarse, M éxico, SCNM .
constituyen la Encuesta Nacional de
Ingreso gasto de los Hogares, ENIGH.
Incluye las importaciones como una No incluye a las importaciones.
fracción de los bienes que consumen las
familias.
Los precios son recabados en los Los precios se obtienen directamente de
establecimientos o fuentes de las empresas productoras de bienes o
información donde las familias acuden suministradoras de servicios.
a realizar las compras de los bienes y
servicios que consumen.
Peridicidad quincenal: Los resultados se Periodicidad mensual. Se publica a más
publican los días 10 y 25 de cada mes tardar el día 9 de cada mes en un bolitín
en el Diario Oficial de la Federación, en de prensa y en la hoja electrónica del
un boletín de prensa ( que se emite el Banco de M éxico.
día anterior a su publicación en el
Diario Oficial ) y en la hoja electrónica
del Banco de M éxico
Se elabora con base en precios al Los precios que se cotizan son
consumidor final que incluyen principalmente Libre a Bordo (LAB)
impuestos al consumo, costos de planta de producción. Por tanto, no
transporte y márgenes de incluyen impuestos al consumo, costos
comercialización. Las cotizaciones son de transporte ni márgenes de
proporcionadas de manera voluntaria y comercialización; se proporcionan de
se publican cada mes en el Diario manera voluntaria y son confidenciales.
Oficial de la Federación, manteniendo la
confidencialidad respecto a la fuentes
de información.
Se calcula para 46 ciudades y a nivel Presenta resultados a nivel nacional.
nacional.
III.8 PRÁCTICA V
ALUM NO__________________________________________GRUPO_____
Problema 1.- Un número índice es un valor relativo con una base igual al 100% y
se usa como indicador para el cambio relativo de una cosa o de un grupo de
cosas. Los números índices más importantes en el análisis económicos
pueden clasificarse en tres tipos 1)________________________________
2)________________________3)__________________________
Los números índices que se construyen para un sólo artículo se denominan
______________________________ y los que se construyen para un grupo de
artículos se llaman
______________________________________________________
Problema 2.- Los precios por unidad y las cantidades vendidas de un artículo
para los años de 2001 y 2002, están dados más abajo. Calcular los índices de
a) precios
b) cantidades
c) valores para 2002 con 2001 como base.
Problema 4.- Suponga que los precios y las cantidades de 4 artículos vendidos
durante los años de 2001 y 2002 en una ciudad son como sigue:
Problema 5.- Utilice la información del problema No. 4. Emplee los métodos de
promedios relativos para construir los números índices compuestos de
a) precios no ponderados
b) cantidades no ponderadas
c) precios ponderados y
d) cantidades ponderadas.
Contexto e importancia
EJEM PLO:
1
Cuando se dice que un medio ( ) es la probabilidad de obtener águilas en
2
el lanzamiento de una moneda, esto se dice sin haber lanzado la moneda al aire (el
experimento es el lanzamiento de la moneda). Por eso se dice que la probabilidad
así calculada es un valor esperado con el al método clásico o teórico, el cual
supone en el ejemplo que utilizamos de la moneda, una simetría básica en los
posibles resultados de un evento, por ello la moneda o el dado que se utilizará, no
deben estar deformada o en el caso del dado, no debe estar “cargado “, para poder
calcular la probabilidad a priori.
También debemos decir que el cálculo anterior se basa en el supuesto de que los
resultados posibles son mutuamente excluyentes e igualmente probables de
ocurrir. Al respecto, es conveniente decir que en el mundo de la economía y los
negocios los resultados posibles no son igualmente probables y no conocemos de
antemano su probabilidad de ocurrencia, situación que limita el uso del método
clásico para calcular las probabilidades. La mayor crítica es que el término
“igualmente probable” presupone el conocimiento previo de la teoría de la
probabilidad, situación que no siempre es cierta, además de que en el mundo real
no siempre podemos suponer que los resultados serán “igualmente probables”,de
ahí que sea interesante, muchas veces, recurrir al método de las frecuencias
relativas.
Es importante señalar que con este método para calcular la probabilidad, que a
medida que aumenta el número de observaciones de los eventos y de sus
resultados, aumenta la exactitud en el cálculo de la probabilidad, inclusive tiende
a estabilizarse en cierto valor, por ejemplo, si realizamos el experimento de lanzar
al aire, digamos 500 veces una moneda y registramos el número de veces que cae
“aguila “, la frecuencia relativa, es decir la probabilidad, tiende a estabilizarse
alrededor del valor 0.5. Derivado de lo anterior, decimos que la probabilidad asì
calculada es un valor estimado, cuya exactitud será mayor a medida que
aumentemos el experimento.
Una vez establecida la diferencia entre uno y otro de los dos métodos del
enfoque objetivo, a continuación podemos profundizar señalando lo siguiente:
)))))))))) ))))))))))
♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣ ♣♣♣♣♣♣♣♣
Evento A Evento C
.... ;;;;
Evento B Evento D
. . .
AXIOMAS DE LA PROBABILIDAD
Nº de casos favorables
P(A,A ó S,S)= Nº de casos posibles
2 1
= =
4 2
Aplicaciones:
La probabilidad fue 1.- Inferencia estadística:
desarrollada por M uestreo Estadístico, estimación de parámetros y
Pascal prueba de hipótesis
2.- Econometría:
M odelos Econométricos
3.- Teoría de las Decisiones:
Teorema de Bayes
Gráficamente :
D 6 o o o o o o Marco
muestral
A 5 o o o o o o constituido
por
D 4 o o o o o o 36
resultados
O 3 o o o o o o posibles
# 2 o o o o o o
1 1 o o o o o o
1 2 3 4 5 6
D A D O # 2
1 1 1 1
2 2 2 2
3 3 3 3
4 4 4 4
5 5 5 5
6 6 6 6
7 7 7 7
8 8 8 8
9 9 9 9
10 10 10 10
J J J J
Q Q Q Q
K K K K
A B
Cuando hay intersección entre ellos es decir, que tienen puntos en común,
decimos que no son eventos mutuamente excluyentes. Gráficamente se ven así:
A A,B B
A noA
La utilidad definida por, U, es una variable aleatoria que puede tomar los valores
de $150.00 si no se incendia la casa y, de $ 19,850.00 si es que se incencia
durante el año 2002, periodo que cubre la póliza contratada. Así, la función de
probabilidad de U es :
Ejemplo 3:
Con literales podemos decir que: (Cr) representa uno o varios resultados
de interés y (Cn) representa el total de resultados posibles, entonces si (P)
denota probabilidad, por consiguiente la P(Cr) = r/n.
(n1)(n2)(n3)..........(nk-1)(nk) formas´
IV.3.1 Permutaciones
b c abc
a
c b acb
O
r a c bac
i b
g c a bca
e
n a b cab
c
b a cba
A B C
Cálculo numérico: * * = 6 permutaciones
3 2 1
b) Dos a la vez n= 4 , r= 2 ; nP r
= 4P2 = 4*3=12
n! 4 * 3 * 2 *1 24
también se puede obtener con = = = 12
(n − r )! 2*1 2
a
b c permutaciones ba, bc, bd.
d
Origen
b
c d permutaciones cb, cd, ca.
a
a
d b permutaciones da, db, dc.
c
IV.3.2 COMBINACIONES
b
a Permutaciones Combinaciones
c ab ba ca ab bc ac
ac bc cb
a
Origen b
c
a
c
b
IV.3.3 EJERCICIOS
Así habrá (n) posibilidades para el primer objeto, n-1 para el segundo,
n-2 para el tercero y así sucesivamente hasta llenar el último lugar con el último
objeto.
PERM UTACIONES
(Arreglos ordenados posibles)
b c abc
a
c b acb
a c bac
Origen b
c a bca
a b cab
c
b a cba
7 ---- 3 -------- 1, 5, 7, 3.
3 ---- 5 -------- 1, 7, 3, 5.
1, 7
5 ---- 3 -------- 1, 7, 5, 3.
5 ---- 7 -------- 3, 1, 5, 7.
3, 1
7 ---- 5 -------- 3, 1, 7, 5.
1 ---- 7 -------- 3, 5, 1, 7.
3, 5
7 ---- 1 -------- 3, 5, 7, 1.
1 ---- 5 -------- 3, 7, 1, 5.
3, 7
5 ---- 1 -------- 3, 7, 5, 1.
3 ---- 7 -------- 5, 1, 3, 7.
5, 1
Origen 7 ---- 3 -------- 5, 1, 7, 3.
1 ---- 7 -------- 5, 3, 1, 7.
5, 3
7 ---- 1 -------- 5, 3, 7, 1.
1 ---- 3 -------- 5, 7, 1, 3.
5, 7
3 ---- 1 -------- 5, 7, 3, 1.
3 ---- 5 -------- 7, 1, 3, 5.
7, 1
5 ---- 3 -------- 7, 1, 5, 3.
1 ---- 5 -------- 7, 3, 1, 5.
7, 3
5 ---- 1 -------- 7, 3, 5, 1.
1 ---- 3 -------- 7, 5, 1, 3.
7, 5
3 ---- 1 -------- 7, 5, 3, 1.
También se puede obtener por medio del diagrama de árbol o con las
siguientes fórmulas. El diagrama de árbol es similar a los dos casos anteriores
excepto que el número de columnas en este caso es igual al número de objetos
tomados para cada permutación. En general sea:
Entonces:
Fórmula Nº 2
nP r = n(n-1)(n-2)(n-3)...(n-r+1) para r factores. Nótese que el último factor (n-
r+1) es simplificado de [n-r (-1), También cuando r = n, el último factor se
vuelve (n-n+1) = 1. Luego cuando r = n, está última fórmula es idéntica a la del
número 1.
n! 4 *3 *2 *1
También: nPr= = = 24 permutaciones
( n − r )! 1
b)Aquí, n = 4; r = 2; nPr = 4P2 = 4*3 = 12
n! 4 *3 *2 *1
También: nPr= = = 12 permutaciones
( n − r )! 2 *1
a ba
b c bc
d bd
Origen
a ca
c b cb
d cd
a da
d b db
c dc
b c a b c 1
a c d a c d 2
d b a d b 3
a c b a c 4
b c d b c d 5
d a b d a 6
. . .
Origen . . .
. . .
a b c a b 19
c b d c b d 20
d a c d a 21
a c d a c 22
d b a d b a 23
c b d c b 24
Otro ejemplo: Tres oficiales: Presidente, Vicepresidente y Secretario, van a ser
elegidos de 20 miembros de un club. ¿De cuántas maneras pueden ser elegidos
los tres oficiales?.
Aquí :n = 20; r=3; nPr= 20P3 = 20*19*18 = 6840 maneras
n! 20 * 19 * 18 * 17*...3 * 2 * 1
ó nPr= = = 6840maneras
( n − r )! 17 * 16 * 15*...3 * 2 * 1
Por ejemplo:
Los arreglos posibles del conjunto de letras (A, B) son AB y BA. Puesto
que el orden del arreglo no es considerado, el arreglo AB es el mismo que BA.
Por lo tanto hay solamente una combinación (A y B) posible para el
conjunto. Gráficamente :
a ________ b ab
dos
ORIGEN permutaciones y una combinación
b ________ a ba
3P 2
= 3*2 = 6; cada arreglo consiste de dos letras.
Las seis permutaciones consistentes en las mismas letras son
consideradas como tres combinaciones. Por lo tanto el número total de
combinaciones es:
3 P2 6
= =3
2! 2
b …………ab …………………………….a y b
a
c ………… ……….ac ……………………a y c
a …………ba
Origen b
c ………… ……………….bc …………b y c
a …………………. ca
c
b …………………………….cb
En general, sea:
n = El número total de objetos de un conjunto dado.
r = El número de objetos tomados a la vez para cada combinación.
nCr = El número total de combinaciones de n objetos, tomados r a la vez.
nPr n! n Pr n!
n Cr = = como nP r = entonces nCr = =
r! ( n − r)! r! r!(n − r)!
Así el ejemplo anterior también puede ser calculado con estas fórmulas:
3* 2 n! 3 *2 *1
nCr =3C2 = =3= = =3 combinaciones.
2 *1 r!( n − r)! 2!(3 − 2)!
20 P3 20 * 19 * 18
n Cr = 20 C 3 = = = 1140
,
3! 3* 2 *1
Generalizando entonces tenemos:
COM BINACIONES.
Si hay n objetos diferentes y si deseamos tomar r a la vez, su fórmula
será:
n Pr n!
n Cr = =
r! r!( n − r )!
De tal forma que si n = 52 y deseamos tomar r = 5 a la vez;
52 n! 52!
P = = = 2 ,598.960 maneras o combinaciones.
r !( n − r)! 5!(52 − 5)!
5
4 48
3 = 4 casos favorables y = 1128
, casos favorables, luego
2
.A
1/6+5/6=1
A B
Ejemplo:
No. de hijos por familia 0 1 2 3 4 5 ó más
Proporción 0.10 0.10 0.20 0.25 0.20 0.15
¿Cuál es la probabilidad de que una familia escogida aleatoriamente dentro de un
grupo tenga 5 o más hijos?.
Respuesta: 0.15, la proporción representa la probabilidad de acuerdo con el
cálculo de la probabilidad por el método de las frecuencias relativas.
¿Cuál es la probabilidad de que una familia tenga tres o más hijos?
A: P (3 hijos) = 0.25
B: P (4 hijos) = 0.20
C: P (5 o más) = 0.15
A B A A,B B
Por otra parte, es interesante recordar que así como el diagrama de Venn sirve
para ilustrar los eventos posibles de un experimento, los diagramas de árbol
sirven para ilustrar los resultados posibles de eventos sucesivos o múltiples.
En el caso del lanzamiento de una moneda dos veces el diagrama de árbol
será:
a = ÁGUILA b = SOL
½ a ………………..a a
½ a
Origen ½ b ………………..a b
½ a ………………..b a
½ b
½ b ……………….b b
Ejemplo:
Una caja tiene 3 bolas rojas (R) y 2 negras (N) luego la probabilidad de R
= 3/5; P (N) = 2/5 porque son cinco bolas en total.
Si queremos usar el diagrama de árbol este será:
Resultados
2/4 R ………………..R, R
3/5 R
Origen 2/4 N ………………..R, N
3/4 R ………………..N, R
2/5 N
1/4 N ………………..N, N
Ejemplo 4:
Si la verificación de un evento afecta la probabilidad de ocurrencia de
otro, el segundo es un evento dependiente del primero.
Ejemplo:
¿Cuál es la probabilidad de obtener un as en una segunda selección de cartas de
una baraja americana?. Ello dependerá de que hayamos escogido un as en la
primera selección.
4 1
A : P (As en la primera selección es) = =
52 13
3
B : P (As en la segunda selección es) =
51
4 3 12
P (A y B) = * = = 0.0045
52 51 2652
Si D = Probabilidad de diversificarse
Si ~D = Probabilidad de no diversificarse
Si B = Probabilidad de construir una nueva planta
Si ~B = Probabilidad de no construir una nueva planta.
IV.3.6 PRÁCTICA VI
Par saber como se generan, empezaremos haciendo el símil con una distribución
o arreglo de datos en lo que hemos dado en llamar una distribución de
frecuencias, que es una lista de todos los resultados posibles con la asociación
de una frecuencia observada por cada resultado.
Similarmente, una distribución probabilística también es una lista de
todos los resultados posibles, pero en lugar de la frecuencia observada, se indica
la probabilidad asociada con cada uno de los resultados.
Así, si tres monedas se lanzan al aire y se registran los resultados,
el número posible de águilas en un lanzamiento puede ser: 0, 1, 2, 3.
Aún cuando hay cuatro resultados posibles sólo uno ocurre en el
lanzamiento de tres monedas.
Suponiendo que realizamos o repetimos el experimento de lanzar diez
veces las tres monedas y se registra el número de veces que cae 0, 1, 2, 3. la
tabla que resulta es una distribución de frecuencias.
No de Frecuencia
águilas
Observada
0 2
1 4
2 4
3 0
mayoría. Para ello qué mejor referencia que el enfoque clásico o teórico, con el
que podemos determinar e indicar la probabilidad de cada producto: 0.1.2.3, , ya
que en su lugar determinamos o indicamos la probabilidad de cada producto,
situación que nos evita que cambie la distribución, es decir, siempre será 1/8
para cero aguilas o tres soles; 3/8 para un águila y dos soles; 3/8 para dos águilas
y un sol y 1/8 para tres águilas.
0 1 ÷ 8
1 3 ÷ 8
2 3 ÷ 8
3 1 ÷ 8
Uno de los primeros beneficios de estos cálculos es que dada una
distribución probabilística, se puede desarrollar una distribución de
frecuencias esperadas multiplicando el valor de cada una de las probabilidades
por el número total de veces que se repita el experimento.
Frecuencia esperada en el
No de lanzamiento de 3 monedas
águilas
24 veces
0 24 * 1 ÷ 8 = 3
1 24 * 3 ÷ 8 = 9
2 24 * 3 ÷ 8 = 9
3 24 * 1 ÷ 8 = 3
Raras veces la distribución de frecuencias observadas coinciden con la de
las esperadas, que se convierten en la mejor estimación de las primeras si el
experimento se realiza muchas veces. Luego una distribución de frecuencias
esperadas es una distribución probabilística.
No de Probabilidad
águilas
0 1 ÷ 8
1 3 ÷ 8
2 3 ÷ 8
3 1 ÷ 8
Para ello supongamos que una moneda se lanza al aire dos veces y nos
interesa obtener la probabilidad de que caigan "águilas". Los resultados posibles
son 0, 1, 2 "águilas"; así mismo en el caso de una moneda no deforme, en cada
lanzamiento la probabilidad de obtener águila (p) es 0.5 y la de sol es también
0.5 = q ; tal que q + p = 0.5 + 0.5 = 1. Luego la distribución binomial se
obtiene de (q + p)n donde n = 2 lanzamientos de la moneda. Así, con x
representando águilas.
X P(X)
0 0.25
1 0.50
2 0.25
1.00
Gráficamente.
A ¼
½
P(x) A
½
½ S ¼
Origen
140 A BARAJAS
PROFESOR: GENARO SÁNCHEZ ¼
½ ½
S
LA ESTADÍSTICA APLICADA AL ANÁLISIS ECONÓMICO
1.00
0.75
0.50
0.25
0 1 2 x
= 1/8+3/8+3/8+1/8
Estos resultados son iguales a los obtenidos con el diagrama de árbol y
corresponden a la probabilidad de obtener 0, 1, 2 ó 3 águilas en el lanzamiento de
3 monedas.
µ=
∑ Xp( X ) en lugar de X = ∑
xf
∑ p( X ) ∑f
σ=
∑ (x − µ ) p( x ) en lugar de
2
σ=
∑ (x − x ) 2
f
∑ p( x ) ∑f
Como la suma de las probabilidades es igual a 1 los denominadores de las
fórmulas se eliminan y queda :
µ= ∑ xp( x )
σ = ∑ (x − µ ) 2
p( x )
0 1 2 3 x 0 1 2 3 x
Ejemplo 1
Si el 50% de los hombres empleados en la Cía. Nestle son casados y si
tomamos una muestra aleatoria de dos hombres, ¿Cuál es la probabilidad de
que la muestra contenga 2, 1 ó 0 hombres casados?
p = 1/2 = q
p : probabilidad de que los hombres sean casados.
q : probabilidad de que no lo sean.
c = casado.
s = soltero.
Resultados Probabilidad
posibles de cada resultado
½ c ………………..c c ¼ = 0.25
½ c
Origen ½ s ………………..c s ¼ =
0.25
½ c ………………..s c ¼ = 0.25
½ s
½ s ………………..s s ¼ = 0.25
1.00
Agrupando los resultados en una tabla de frecuencias
(probabilidades) relativas, tenemos:
X P(X)
0 0.25
1 0.50
2 0.25
1.00
µ=
∑ xp( x ) en lugar de X = ∑
xf
∑ p( x ) ∑f
µ=1
σ=
∑ (x − µ ) p( x ) =
2
. = 071
050 . en lugar de σ = ∑ (x − x ) 2
f
∑ p( x ) ∑f
Estos resultados µ y σ se obtiene más fácilmente con:
µ = n p ; y σ = npq
donde n = número de veces que se realiza el experimento o tamaño de la muestra:
Si p = 1/2 y n = 2 ; µ = 2(1/2) = 1
σ = 2(1 / 2)(1 / 2) = 0.71
0.40
0
(Y)
0
0.15
0
-1.40 -1 µ 1 1.40 z
Ejemplo :
n=2 n=20
0 1 2 x
x
P(X)
n=200
x
La distribución binomial también se le llama de Bernoulli, porque fue
quien la desarrolló.
X P(X)
Autos Americanos
12080
0 20
0 . P ( x = 0) =
200
20
1 .
2 .
3 .
. .
. .
. .
120 80
8 12
8 . P ( x = 8) =
200
20
. .
. .
12080
20 0
20 . P ( x = 20) =
200
20
Suma 1.00
Ejemplo 2
N = 10 personas
n1 = 6 hombres
n2 = 4 mujeres
r=5
¿Cuál es la probabilidad de obtener hombres en una muestra de 5?
6 4
1 4 6(1)
= 6
1 = = 0.0238
10 252 252
5
6 4
2 3 15( 4)
= 60
2 = = 0.2380
10 252 252
5
6 4
3 2 20( 6) 120
=
3 = = 0.4761
10 252 252
5
6 4
4 1 15(4 ) 60
=
4 = = 0.2380
10 252 252
5
6 4
5 0 6(1)
= 6
5 = = 0.0238
10 252 252
5
.9757 ≅ 1.000
2
X P(X) XP(X) x-µ (x-µ) (x-µ)2P(X)
0 0.0000 0.000 -3 9 0.000
1 0.0238 0.024 -2 4 0.096
2 0.2380 0.476 -1 1 0.238
3 0.4761 1.428 0 0 0.000
4 0.2380 0.952 1 1 0.238
5 0.0238 0.120 2 4 0.096
3.000 0.668
µ = Σ X P(X)
µ=3
También se obtiene el mismo resultado con :
µ=np
µ = 5(0.6) = 3
ya que p = 0.6 = probabilidad de obtener "hombre" en una selección simple o
proporción de hombres en la población.
σ= ∑ (x − µ ) 2
p( x ) = 0.668 = 0.81
Ejemplo:
El gimnasio Gumesindo Brown del D.F. pide un aparato de ejercicios a
M onterrey; este es enviado con 200 tuercas para ser armado aún cuando sólo
requiere 198. Las dos tuercas adicionales son incluidas como reserva para que en
caso de que salieran defectuosas algunas se pudieran substituir con las dos de
repuesto. Las tuercas son hechas por una máquina automática que produce
tuercas defectuosas con una probabilidad de 0.01.
¿Cuál es la probabilidad de que el comprador no tenga suficientes
tuercas para armar el aparato?
p = 0.01
m = n p = 200 (0.01) = 2
donde:
x−µ
∑ σ
su promedio será Z = , como σ es una constante la podemos
N
1∑ ( x − µ )
sacar de la sumatoria Z = σ
N
la suma de la diferencia x − µ = 0 , luego
1[0]
0
Z = σ así tenemos Z = = 0 , lo que queda demostrado
N N
Ahora bien, demostrar que σ z = 1
2 2
x−µ x−µ
∑ σ − z ∑ σ − 0
σz = =
N N
( x − µ )2
2
x−µ 1
∑ σ ∑ σ 2 ∑ σ (x − µ)
2
2
σz = = =
N N N
1 ∑(x − µ) ∑(x − µ)
2 2
1
σz = 2 =
σ N σ N
∑(x − µ) 2
Sabemos que σ =
N
1 σ
Luego σ z = * σ = = 1
σ σ
Con ello ya podemos utilizar los valores de z que están el apéndice A, z es una
distribución teórica como la binomial, poisson e hipergeométrica, pero con datos
continuos que nos ayuda a hacer análisis, como los siguientes, una vez que la
hemos trazado.
µ
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
-2σ -1σ µ 1σ 2σ Z
Yx = N / σ * f(Z)
Xi − µ
Donde Z = del Apéndice A.
σ
Z ; es el valor de la abscisa o dicho en otras palabras, es el valor expresado en
unidades de desviación estándar, de cada uno de los valores originales denotados
con los símbolos Xi
Tabulaciones:
EJEM PLO 2
El tiempo de duración de 5 000 pilas para tomar fotografías producidas
por una compañía están normalmente distribuidas con media igual a 800 minutos
y σ = 40 minutos.
a) Construya gráficamente la curva normal correspondiente con intervalos de 1/2
de σ hasta 3 veces.
b) ¿Cuántas pilas duran entre 780 y 820 minutos?
c) ¿Cuál es la probabilidad de que al seleccionar una pila esta dure cuando menos
750 minutos?
N = 5 000; µ = 800; σ = 40
a)
Xi Xi-µ Xi − µ f(Z) Yx
Z=
σ
800 0 0.00 0.39894 49.86
820 20 0.50 0.35207 44
840 40 1.00 0.24197 30.24
860 60 1.50 0.12952 16.19
880 80 2.00 0.05399 6.74
900 100 2.50 0.01753 2.19
920 120 3.00 0.00443 0.55
Yx = N / σ * f(Z)
Yx = 5000 / 40 = 125
Yx = 125 * f(Z)
Ahora bien, para contestar el inciso b) tenemos que determinar Z 1 y Z 2 con
Z = Xi - µ / σ
Z 1 = 780 - 800 / 40 = -0.5 unidades de desviación estándar, cuya área es 0.1915
Z 2 = 820 - 800 / 40 = 0.5 unidades de desviación estándar, cuya área es 0.1915
Luego entonces,
P{(X)} = El área de Z 1 = -0.5 a Z 0 + el área de Z 0 a Z 2 = 0.5
750 800
V.5 PRÁCTICA VII
Nombre _______________________________________________________ No
de Cta.______________________ Grupo____________
1.- En una fábrica el 50% de los trabajadores son casados, con una muestra de
tres empleados, ¿cuál es la probabilidad de que:
a) Los tres son casados
b) Uno de ellos sea casado
c) Ninguno sea casado
3.- El 3% de los tornillos que produce una máquina son defectuosos, ¿cuál es la
probabilidad que de 100 tornillos escogidos al azar cuando mucho haya dos
defectuosos?
4.- Se ha comprobado que el 2% de una caja que contiene 200 pilas, son
defectuosas ¿cuál es la probabilidad que exactamente 3 de ellas sean
defectuosas?
Así, continuando con su aplicación, ahora veremos como se usa para la obtención
de muestras probabilísticas, que obtendremos de poblaciones finitas e infinitas.
M otivo por el cual es conveniente introducir de manera formal la definición de los
siguientes conceptos:
* * * * * *
* * * * * *
* * * * * *
(R, Q, P)
previamente. Las fórmulas del error estándar han sido desarrolladas para una
gran variedad de diseños muéstrales y en la actualidad es una cuestión rutinaria
su aplicación a cada uno de los casos.
estos elementos informativos-, los que deben contener todas las unidades de
interés y permitir determinar la probabilidad de su inclusión; así mismo, que
en el momento de levantar la encuesta, la identificación de cada unidad en la
muestra sea hecha sin ninguna ambigüedad.
Al conjunto de todos los elementos se le llama: MARCO MUES TRAL.
De acuerdo a la forma de seleccionar estas unidades se pueden dar las
siguientes maneras de hacerla:
Reemplazo:
Las selecciones sucesivas de una muestra probabilística pueden hacerse
con o sin reemplazo de las unidades obtenidas en las selecciones previas; por ello
al primer procedimiento se le llama muestreo con reemplazo y al segundo sin
reemplazo.
Probabilidad:
Si las unidades de muestreo en cada etapa son seleccionadas con la misma
probabilidad, el muestreo se llamará equiprobable; en el caso contrario se dice que
es de probabilidades variables de selección en la ó las etapas que correspondan.
Estratos:
La precisión al hacerse las estimaciones básicamente dependen de dos
factores:
Estas tablas consisten de dígitos puestos de manera tal que cada uno de
ellos reciba igual probabilidad de ser seleccionados. Estas tablas se construyen
de diferentes maneras:
- Usando la computadora de manera similar al proceso de la ruleta.
- Usando ciertas funciones matemáticas; ó
- Usando instrumentos mecánicos basados esencialmente en el principio de la
ruleta.
El uso de las tablas de números aleatorios puede ilustrarse con el siguiente
ejemplo, relativo a la selección aleatoria de la muestra.
Supóngase que se van a seleccionar tres Escuelas: de M edicina, Veterinaria
y Zootecnia para ser consideradas como muestra de las 18 escuelas de
M edicina Veterinaria y Zootecnia existentes en el país:
(11)
VI.2.5 MUES TREO ES TRATIFICADO
VI.3 APLICACIONES
E( y ) =
∑ ( y1 + y 2 + ...+ y n ) E ( y ) + E ( y ) + ...+ E ( y )
= 1 2 n
= E( y ) =
nY
por lo tanto
n n n
E( y ) = Y
Notación:
1 4 7 12 13
2 5 8 11 14
3 6 9 10 15 16
1 1 32
Y$ = Ny ; si N=16 y y=
n ∑y i =
4
(4 + 9 + 9 + 10) =
4
=8
tNs tNs
Ny − * 1 − F ≤ Y$ ≤ Ny + * 1− F
n n
Como se recordará:
S2 =
∑ (y i − y )2
=
∑y 2
i
− (y)2 =
278
− 8 = 55
.
n n 4
El total estimado de familias (128) se halla entre 125 y 131 con una
seguridad o confianza del 95%.
Si m= 5.4; Y$ = 128
Del resto de las áreas urbanas, se seleccionó una de cada estrato, con
probabilidad proporcional a su tamaño. Similarmente en los estratos rurales, un
pueblo o área fue seleccionado con probabilidad proporcional a su tamaño.
Una vez que se han diseñado las áreas y agrupado en estratos, en cada
estrato se seleccionan ciertas áreas usando algún criterio, generalmente se
aplica el llamado “probabilidad proporcional al tamaño", con el cual cada área
tiene una probabilidad ( proporcional ) de ser seleccionada de acuerdo a su
tamaño o significación dentro del estrato. Por ejemplo: Supongamos que
deseamos seleccionar con probabilidad proporcional a su tamaño una de las
siguientes cinco ciudades que integran un estrato:
Población Dígitos
Ciudad Población Acumulada Aleatorios Probabilidad
(en miles)
A 100,000 100 01 - 10 10 ÷ 35
B 40,000 140 11 - 14 4 ÷ 35
C 60,000 200 15 - 20 6 ÷ 35
D 70,000 270 21 - 27 7 ÷ 35
E 80,000 350 28 - 35 8 ÷ 35
Total estrato 350,000 35 ÷ 35
Una vez seleccionadas las manzanas, las familias se listarán en cada manzana y
el número requerido de ellas se obtendría usando una vez más la tabla de
números aleatorios.
Este método, que es en esencia una extensión del muestreo por áreas,
consiste en la aplicación de las últimas unidades del muestreo en localidades
adyacentes en lugar de permitir su dispersión en todas las áreas que
comprenden la muestra.
decimos: ε| x | ≥ | µ - x |
(xi) : 1, 2 y 3.
Su; µ =
1+ 2 + 3
=
∑x i
=2
3 N
Su; σ =
(1 − 2) 2 + (2 − 2) 2 + (3 − 2) 2
=
∑ ( xi − µ ) 2
=
2
= 0.81
3 N 3
σ N − n 0.81 3 − 2 0.81 1
σX = = =
n N −1 2 3 − 1 1.41 2
σ X =0.56(0.7) = 0.4
que nos sirve para graficar los valores estandarizados de las tres X 15: 1.5, 2.0 y
2.5, obteniéndose:
E ( X i ) = = 2 = µx = µx = ∑ i
6 X
3 N
Se pueden generar distintas distribuciones a partir del cálculo de la
muestra con o sin reemplazo.
Cuando la selección es con reemplazo se usa la fórmula Nn= 32 = 9
Interpretación: hay 9 muestras de tamaño 2, cuya composición es:
Media de la _
Muestra Composició muestra (xi) P (xi)
n
A 1,1 1.0 1 ÷ 9
B 1,2 1.5 1 ÷ 9
C 1,3 2.0 1 ÷ 9
D 2,1 1.5 1 ÷ 9
E 2,2 2.0 1 ÷ 9
F 2,3 2.5 1 ÷ 9
G 3,1 2.0 1 ÷ 9
H 3,2 2.5 1 ÷ 9
I 3,3 3.0 1 ÷ 9
18.0 9 ÷ 9
µx = ∑x i
=
18
= 2 = E( x)
N 9
1/3
s 05
. 05
.
Así X ± Zασx y como; σx = = = = 0.35
n 2 1.41
B C
X =2 X = 2.5
s = 1.0 s = 0.5
n=2 n=2
s 1 1 s 0.5 0.5
Para B σ x = = = 0.70; para C, σ x = = = 0.35
n 2 141
. n 2 141
.
X ± ZασX X ± ZασX
2 ± 196
. ( 0.70) 2.5 ± 1.96( 0.35)
2 ± 137
. 2.5 ± 0.70
Gráficamente.:
0
− −
x − Ζα
σ x
µ x x + Ζα σ x
en los tres casos es satisfactorio ver que el error de muestreo es inferior al error
permitido.
Nuevo ejemplo; ahora supongamos que ε = 50% y Zα = 0.68.
luego α = 50%
Limites Contiene a
Muestr X s σX Zα Zασ X Inferior Superior µx
a
A 1.5 0.5 0.35 0.68 0.238 1.262 1.738 No
B 2.0 1.0 0.70 0.68 0.476 1.524 2.476 Si
C 2.5 0.5 0.35 0.68 0.238 2.262 2.738 No
La muestra A y C no contienen a µx porque el grado de confianza ξ es
muy bajo; es decir hay menos área sobre la curva que ocasiona una Zα muy baja
que al ser combinada en Zασ X originan un intervalo más pequeño en torno a X ,
en la fórmula X ± Zασ X , con lo que aumentan la probabilidad α, de que X
no represente a µx.Estos resultados se corroboran con el suguiente análisis:
n = 49 X ± Zασ X
sustituyendo
σ = 700/mes 5500 ± 1.96(100)
X = 5500/mes 5500 ± 196
α =5%
Zα = ± 1.96
σx 700
σx = = ; ; por lo tanto σx = 100
n 49
0.95
0.025
0.025
x − Zα σ x x x + Zα σ x
µ x = E( x )
x − 1σ x x +1σ x
x − 2σ x x + 2σ x
x − 3σ x x + 3σ x
σ
donde σx = para una población infinita
n
σ N−n
σx = para una población finita
n N −1
σx
e = Zασx como σx = para una población infinita
n
σx
e = Zα
n
σx
n = Zα
e
2
σx Zα 2σ 2 x
n = Zα = para una población infinita.
e e2
Z 2ασ x2 N
n= 2 para una población finita.
e N − e 2 + Zα 2 σ x2
Ejemplo: En una población infinita ¿qué‚ tamaño de muestra será necesario para
producir un intervalo de confianza del 90% en que está la media de la población
verdadera, con un error permitido de 1.0 en cualquier sentido si la desviación
estándar de la población es 10.00?
16.5
e = 1.65( 10 / 272.25 ) = = 1 =error permitido = errordemuestreo , lo cual
16.5
es muy aceptable.
También, si sabemos que el error estándar = 10/16.5= 0.606
Luego aplicandolo al error permitido (e) en términos probabilisticos tendremos
que e = 1.65(0.606)= 1, se comprueba que el error de muestreo se mide con el
error estándar en términos probabilisticos.
CONSIDERACIONES:
N
1. Hay ocasiones en que conocemos N, en ese caso n =
Ne 2 + 1
Ejemplo: Con N= 603 y e= 5%
603 603
Tenemos n = = = 24047
.
1 + 603( 005
. ) 2
2.5075
1
2. Cuando no conocemos nada n = 2 digamos si e = 5 %
e
1 1
n= = = 400
(0.05)2 00025
.
3. Trabajando con proporciones o atributos diremos que en el muestreo simple
aleatorio: cada elemento tiene la misma probabilidad de ser seleccionado y,
por ejemplo con n = 300 y α = 5%, ξ = 95% Zα = 1.96, el error permitido (e) o
margen de error permitido para p = 0.5 = q será igual a:
pq ( 05
. )(05
. )
e= * Zα = *1.96
n 300
e = σp * Zα = 5%
1
Tomado del Profesor Stephen P. Shao.
ZαSx
2
. ) 2
3(084
n= = 0.20 = 158.76 = 159
e
Muestreo estratificado.
k
N − ni k
Ni − n
σ x = ∑ wi2 si2 i
N i * ni
; con proporciones: σp = ∑w i
2
pq
Ni *n
i=1 i =1
2 = pq
Si
donde:
i: estratos: 1,2,3,4,5,.....,K.
Ni
Wi : Proporción del estrato en la población =
∑N i
ni
Pi = ; n= tamaño de la muestra; ni= muestra en el estrato i-ésimo, Ni = estrato
n
i-ésimo.
Muestreo replicado
Xmax − Xmin K (Z − K )
σx =
K Z ( K − 1)
donde:
X max: La media mayor en la muestra replicada.
X min: La media menor en la muestra replicada.
Z : Tamaño de cada zona
K : Número de replicaciones.
N −n
σ p = p*q =
N *n
Por motivos prácticos decimos que en una muestra grande, dos errores estándar
proporcionan el intervalo de confianza del 95.45 %, para la proporción
verdadera de TV encendidas entre los 7 y 10 de la noche; la estimación del
intervalo será:
70 % ± 2 ( 2.3 ) ó entre 65.4 % y 74.6 %.
VI.6.2 ES TRATIFICADO:
Nº de T.V.
encendidas
Estrat Ni Nº de entre 7 y 10 hrs. Pi =ni / n
o entrevistas
n ni
1 7,000 200 160 160 ÷ 200 = 80 %
00003807
. + 0.0000216 + 0.0000912 = 0.0004935 ; σ p = 0022
. ó 2.2%
VI.6.3 REPLICADO:
Replica Nº T.V. P
entrevistas encendidas
1 80 59 74 %
2 80 57 71 %
3 80 61 76 %
4 80 53 66 %
5 80 62 78 %
Total 400 292 73 %
N = 10,000
S2= para un porcentaje = p*q
p = .5 por seguridad, es decir, trabajando con variancia máxima.
( 025
. )(10,000)
n= = 385 familias
( 0.25) + 10, 000(0.025)2
Vemos que el tamaño apropiado seria de 385 familias y no 400 para
hacer la investigación.
rápidamente. Sin embargo, como los demás métodos, también tiene sus
limitaciones. Obviamente no es aplicable si las entrevistas comprenden
cuestiones visuales - publicidad, pruebas de interpretación, etc. - . A la
vez, información altamente personal se obtiene con menos éxito por teléfono
que -por ejemplo.- a través de una entrevista personal.
d) Entrevistas personales: dentro de las formas directa de obtener los datos, este
método es sin lugar a dudas el más popular, por referirse a una conversación
directa " frente a frente " entre un miembro de la muestra y el entrevistador.
Como resultado, se puede obtener una gran variedad de información con
este método, el cual es flexible en varios sentidos. Por ejemplo, los datos
pueden ser registrados en grabadora o en cuestionarios.
Una tabulación hecha sin cuidado puede viciar una buena planeación y el
método de obtención de los datos. Así mismo, los peligros de los sesgos a un se
presentan en los procesos de preparación, clasificación y tabulación.
v) CLAS IFICACIÓN.
Es el arreglo de los datos en clases o categorías para ser
manipulados de acuerdo con la verificación de la hipótesis de trabajo.
vi) TABULACIÓN.
La tabulación es la etapa que sucede inmediatamente después a la crítica
de cuestionarios y es un conjunto de procedimientos que se adoptan para la
recopilación o vaciado de los datos en cuadros. Estos últimos comprenden las
diferentes relaciones que se establecen entre las variables comprendidas en el
estudio, así, habrá cuadros de una sola entrada, doble entrada, etc.
Los datos pueden ser tabulados manualmente o mecánicamente. La
tabulación manual se aconseja cuando las encuestas son pequeñas, existen
problemas de presupuesto o no hay ninguna posibilidad de procesar los datos
electrónicamente. Por el contrario, cuando la encuesta es grande, la tabulación
manual, además de tardada acarrea el riesgo de cálculos erróneos por lo
voluminoso de la información, aconsejándose el uso de las computadoras. Por
ello, será necesario que la información sea capturada y se diseñan los programas
que calcularán los datos de acuerdo con instrucciones específicas.
A) Con Xi : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
tenemos N = 10, luego con n = 2 se obtiene, sin reemplazo
N N! 10
n = ( N − n)! n! = (10 − 2)!2! = 45 muestras de tamaño dos y que constituyen
la nueva distribución de muestreo, que son:
∑( xi − x )
2
39 5 , 9 1 ÷ 45 7.0 .
40 6 , 7 1 ÷ 45 6.5 .
41 6 , 8 1 ÷ 45 7.0 .
42 6 , 9 1 ÷ 45 7.5 .
43 7 , 8 1 ÷ 45 7.5 .
44 7 , 9 1 ÷ 45 8.0 .
45 8 , 9 1 ÷ 45 8.5 .
45 ÷ 45 202.5
Generación de la distribución de muestras, con reemplazo; Nn = 102 = 100
µ = 45/10 = 4.5 .
σ= ∑(x − µ)
i
2
=
82.50
= σ = 2.87
N 10
Calculo de σ:
Xi Xi-µ (Xi-µ)2
0 -4.5 20.25
1 -3.5 12.25
2 -2.5 6.25
3 -1.5 2.25
4 -0.5 0.25
5 0.5 0.25
6 1.5 2.25
7 2.5 6.25
8 3.5 12.25
9 4.5 20.25
0 82.5
Ahora, calculando.
µx = E ( X i ) = ∑ i =
X 202.5
= 4.5 = µx
n 45
NOTA :número de muestras = 45.
σ N − n 2.87 10 − 2 2.87
σx = * = * = 089
.
n N −1 2 10 − 1 141 .
σx = 2.03( 0.94) = 192
.
Sp diferente de σp.
S1 =
∑ (x i − x )2
S 45 = ∑ (x i − x) 2
n n
S1 =
∑ [( 0 − 05. ) 2
+ (1 − 05
. )2 ] S 45 =
∑ [(8 − 8.5) 2
+ (9 − 8.5) 2 ]
2 2
S1 =
∑ [0.25 + 0.25] S 45 =
∑ [0.25 + 0.25]
2 2
0.50 0.50
S1 = S 45 =
2 2
S1 = 0.25 = 0.5 S 45 = 0.25 = 0.5
MARCO MUESTRAL
Número Composición de la
de
muestra muestra
1 0 , 1
2 0 , 2
3 0 , 3
4 0 , 4
5 0 , 5
6 0 , 6
7 0 , 7
8 0 , 8
. .
. .
. .
. .
. .
45 8, 9
S=
∑[ (8 − 4 ) 2
+ (0 − 4 )2 ]= 16 = 4 = 4
2
σN −n
X ± Zα σx donde σx = = 192
. del inciso B).
n N −1
Luego sustituyendo tendremos:
4 - (1.96) (1.92) límite inferior del intervalo de confianza = 0.2368
4 + (1.96)(1.92) límite superior del intervalo de confianza = 7.7632.
N 10 10
Ahora bien usando n = = =
1 + Ne 2
1 + 10(0.05) 2
1 + 0025
.
10
n= = 9.7 ≅ 10
1025
.
Observaciones:
Con las dos fórmulas se obtiene el mismos resultado. Ello indica que el
tamaño de la muestra debe ser el del universo. Esto es así, no debe
sorprendernos porque el universo es tan pequeño que la muestra debe ser igual
a 10 para que sea representativa.
h) La relación entre σ x y e.
σ N − n 2.87 10 − 2
σx = * = * = 192
.
n N −1 2 10 − 1
e = Zα σx = 1.96 (1.92) = 3.7632
Del inciso b), sabemos que µ x = 4.5 y del inciso f) sabemos que
x = 4.0 luego el error de muestreo = 4 − 4.5 = 0.5 ≤ 3.7637 = error
permitido. Es bueno el resultado.
VI.6.7 PRÁCTICA IX
8
1 2
3 7
5
9 10
4 6
Con : n = 2
tα = 2
Obtenga:
a) El número de manzanas en la colonia del Valle.
hay N = 10 manzanas.
d) Suponiendo que:
La primer manzana tiene 40 familias.
La segunda manzana tiene 36 familias.
Cálcule la media y desviación estándar de la muestra.
Puesto que:
M anzana 2 tiene 40 familias.
M anzana 7 tiene 36 familias.
_
X = 40 + 36 / 2 = 76 /2 = 38 familias.
(40 − 38) 2 + (36 − 38) 2 (2 ) 2 + (− 2) 2 8
S= = = =2
2 2 2
Sustituyendo
2 (10) 2 2 (10)2
380 − 1 − 0.2 ≤ Y$ ≤ 380 + 1 − 0.2
141
. 141
.
2 (10) 2 2(10) 2
380 − . ) ≤ Y$ ≤ 380 +
( 089 (089
. )
141
. 141
.
Interpretación:
El total estimado de familias Y, se halla entre 355 y 405 familias
con una probabilidad o seguridad del 95.45%
N n
N1= 180 n1= 15 hogares 1
hogares
N2= 70 n2= 4 hogares 2
hogares
N3= 100 n3= 5 hogares 3
hogares
Total 350 Total 24
ESTRATO 1
30 + 27 + 40 + 45 + 26 + 35 + 33 + 29 + 37 + 34 + 25 + 41 + 43 + 32 + 31
X1 =
15
508
X1 = = 3387
.
15
33.87 equivalente a 34
S1 =
∑(x i − x )2
=
546
= 36.4 = 6
n 15
Xi Xi − X1
( X i − X1 ) 2
30 30 - 34 = -4 16
27 27 - 34 = -7 49
40 40 - 34 = 6 36
45 45 - 34 = 11 121
26 26 - 34 = -8 64
35 35 - 34 = 1 1
33 33 - 34 = -1 1
29 29 - 34 = -5 25
37 37 - 34 = 3 9
34 34 - 34 = 0 0
25 25 - 34 = -9 81
41 41 - 34 = 7 49
43 43 - 34 = 9 81
32 32 - 34 = -2 4
31 31 - 34 = -3 9
546
ESTRATO 2
4 + 49 + 25 + 30 108
X2 = = = 27
4 4
S2 =
∑ (x i − x ) 2
=
1026
= 256.5 = 16.0
n 4
Xi Xi − X 1
( X i − X 2 )2
4 4 - 27 = -23 529
49 49 - 27 = -22 484
25 25 - 27 = -2 4
30 30 - 27 = 3 9
1026
ESTRATO 3
9 + 20 + 11 + 34 + 24 98
X3 = = = 19.6 equivale a 20
5 5
S3 =
∑ (x i − x) 2
=
414
= 82.8 = 91
.
n 5
( X1 − X 3 )
2
X1 X 1 − X3
9 9 - 20 = - 121
11
20 20 - 20 = 0 0
11 11 - 20 = -9 81
34 34 - 20 = 14 196
24 24 - 20 = 4 16
414
1
V(X) =
122500
[402.41 + 4219.75 + 15.732]
6195.36
V (X ) = = 0.0506
122500
VII.1 DEFINICIÓN
Estimación, es el proceso de usar un "estadístico muestral" para estimar el
parámetro desconocido.
Un parámetro se puede estimar de dos maneras:
1.- Estimación de un punto: Es la selección de un número único que se utiliza
para representar o estimar al parámetro.
Ejemplo: el precio de la leche es de $30.00 por litro en el D.F.
2.- Estimación de un intervalo: Es la estimación de un recorrido o rango dentro del
cual se espera que está‚ contenido el parámetro.
Ejemplo: El precio de la leche está entre los $28.00 y los $35.00 por litro.
En otras palabras, cuando no se conocen los parámetros de la población,
se pueden estimar recurriendo a muestras que permitan calcular intervalos dentro
de los cuáles pueden estar contenido el valor de los parámetros.
Estos intervalos se llaman intervalos de confianza y sus extremos se
llaman limites de confianza.
El grado de confianza, de el parámetro que‚ esté‚ contenido en el intervalo,
se determina por el número de errores estándar a los cuales les corresponde un
área bajo la curva que se denomina "coeficiente de confianza" (ξ épsilon ). Al
riesgo que el valor estimado de µ no se encuentra dentro del intervalo de
confianza construido alrededor de la media de la muestra, se le llama nivel de
significación (α alfa ) y es el área o probabilidad complementaria del coeficiente
de confianza, sí, numéricamente ξ = 1 - α ó E + α = 1 = ÁREA bajo la curva.
De esta manera, el intervalo de confianza se determina con:
Limite de confianza X ± Zασ x . . . . . . . . . (1).
Donde Z α = Valor especifico de Z en la tabla, asociado con determinado
coeficiente de confianza.
α = nivel de significación.
X = M edia muestral.
σx =σ / n
Ejemplo 1:
Se desea estimar el ingreso medio de los trabajadores de la compañía
NESTLE, con el fin de estudiar las condiciones de trabajo de los trabajadores y en
su caso pedir la revisión del contrato. Para ello, se selecciona una muestra
aleatoria de 49 trabajadores cuyo ingreso medio resultó ser de $ 5 500.00/mes.
Estudios previos, realizados por la Facultad de Economía -UNAM - en
esta empresa señala que la σ del universo es de $ 700.00/mes.
Con un nivel de significación de 5%, estimar: el ingreso medio de los
trabajadores;
n = 49
σ = 700
X = $ 5 500.00
α = 5%
Zα = ±196 .
ξ = 95%
X ± Zα σ x
5 500 ± 1.96 (100)
5 500 ± 196
Limite de confianza = 5 500 ± 196
Intervalo de confianza = 5 304 a 5 696
donde el limite inferior = $ 5,304.00
donde el limite superior = $ 5,696.00
ξ=95% c/u
0.95
α=0.025
α=0.025
x − Zα σ x x x + Zα σ x
Ejemplo 2.
Se desea estimar el gasto medio mensual en libros, del universo de estudiantes de
la Universidad de Aguascalientes, con un nivel de significación del 5% y una
muestra de 100 estudiantes seleccionados al azar, cuyo gasto medio mensual es
de $288.000. La experiencia señala que la población tiene una desviación estándar
de $ 20.000.
0.95 = ξ
α=0.025
α=0.025
x − 1.96σ x x x + 1.96σ x
0.34
x x Laterales Z
14 Valores originales
-1 Valores Z
que los precios estén entre $14 y $15. Para ello, se supone que los precios se
distribuyen normalmente.
Cuando no se conoce la forma o características de la distribución, pero se
conocen µ y σ , entonces con la desigualdad de TCHEBYCHEFF, cuya fórmula
es:
1
P( x − µ ≥ Kσ ) ≤ 2
K
Se puede calcular la masa o porción de la distribución la interpretación es:
la probabilidad de que un valor aleatorio ( xi ) de la distribución esté a un distancia
1
igual o mayor de K desviaciones estándar de la media, cuando mucho es: 2
K
En otra palabras, si K = 2, la probabilidad de que cualquier xi se encuentre
a una distancia de 2 o más desviaciones estándar de la media, cuando más es:
1 1 1
2
= 2 = = 0.25
K 2 4
De acuerdo con lo anterior en todos los casos la porción de la distribución
situada a dos o más desviaciones estándar, nunca podrá exceder al 25% del total,
independientemente de la forma de la distribución.
Otra interpretación sería que el 75% es la porción mínima de la
distribución que se halla en la distancia comprendida dentro de 2σ de la media.
1
En este caso, la fórmula sería: 1 − 2 = Kσ de µ.
K
Comparando lo anterior con la distribución normal, se recordará que en la
distancia de 2 σ de µ, se halla el 95.5% de la distribución, porción mucho mayor
que los limites minimos dados por la desigualdad de TCHEBYCHEFF, situación
atribuible a que dispone de menos información que la normal.
Sin embargo, la utilidad de TCHEBYCHEFF radica en que es aplicable a
cualquier tipo de distribución.
Porcentaje del área de la ddistribución dentro de kσ de µ
x − µ Distribución 1 Porcentaje
Z =K=
σ
Normal 1 − K
2
mínimo
dentro de Kσ
1 68.27 % 0.00
2 95.45 % 75.00
3 99.73 % 88.89
4 99.99 % 93.75
Ejemplo:
Si conocemos la distribución del ingreso familiar en Pochutla, Oaxaca, tal
que el ingreso medio mensual por familia es de $10,000.00 con una desviación
Gráficamente:
0.25 0.25
-0.67 0 + 0.67
Xi Xi S 2
=
∑ xi 2
S$ 2 =
∑ xi
2
n n−1
1 , 2 , 3 , 3 , 2.25 2.75 ÷ 4 2.75 ÷ 3
1 , 2 , 3 , 4 , 2.50 5.00 ÷ 4 5.00 ÷ 3
1 , 2 , 3 , 5 , 2.75 8.75 ÷ 4 8.75 ÷ 3
1 , 2 , 3 , 4 , 2.50 5.00 ÷ 4 5.00 ÷ 3
1 , 2 , 3 , 5 , 2.75 8.75 ÷ 4 8.75 ÷ 3
1 , 2 , 4 , 5 , 3.00 10.00 ÷ 4 10.00 ÷ 3
1 , 3 , 3 , 4 , 2.75 4.75 ÷ 4 4.75 ÷ 3
1 , 3 , 3 , 5 , 3.00 8.00 ÷ 4 8.00 ÷ 3
1 , 3 , 4 , 5 , 3.25 8.75 ÷ 4 8.75 ÷ 3
1 , 3 , 4 , 5 , 3.25 8.75 ÷ 4 8.75 ÷ 3
2 , 3 , 3 , 4 , 3.00 2.00 ÷ 4 2.00 ÷ 3
2 , 3 , 3 , 5 , 3.25 4.75 ÷ 4 4.75 ÷ 3
2 , 3 , 4 , 5 , 3.50 5.00 ÷ 4 5.00 ÷ 3
2 , 3 , 4 , 5 , 3.50 5.00 ÷ 4 5.00 ÷ 3
3 , 3 , 4 , 5 , 3.75 2.75 ÷ 4 2.75 ÷ 3
Total 15 45.00 90/4=22.5 90/3=30
1ª CONCLUSIÓN
2
Trabajador Salario/hrs X = X - µ X = (X - µ)
(x)
A 1 -2 4
B 2 -1 1
C 3 0 0
D 3 0 0
E 4 1 1
F 5 2 4
18 0 10
2ª CONCLUSIÓN
S2 no es un estimador insesgado de σ2 porque su esperanza matemática es
diferente del valor del parámetro poblacional.
E (S2 ) ≠ σ 2
S 2
=
∑ ( xi − x )
;σ
2
2
=
∑ ( x i − µ) 2
n N
Ε( S ) = 15
2
. pero σ =1.67; luego Ε( S 2 ) ≠ σ 2
2
3a. CONCLUSIÓN
S$ 2 =
∑ ( xi − x)
; σ$
2
2
=
∑ ( xi − µ ) 2
n−1 N −1
$ 2
Ahora bien S también se puede obtener de:
$S 2 = S 2 n ; σ$ 2 = σ 2 N = σ$ 2 ; ∑ i
( x − x) 2 n ( xi − x) 2
* = $
S 2
=
n −1 N −1 n n−1 n−1
EJEM PLO # 2 :
Media Varianza
Muestra Muestral Sesgada Insesgada
1,2 1.50 0.50 ÷ 2 0.50 ÷ 1
1,3 2.00 2.00 ÷ 2 2.00 ÷ 1
2,3 2.50 0.50 ÷ 2 0.50 ÷ 1
3 6 3/2 3/1
En cambio, si σ$ = 2 ∑ ( x i − µ) 2 2
= =1
N −1 2
Luego E ( S$ 2 ) = 1 = σ$ 2
S =
2 ∑ ( xi − x ) 2
;σ =
2 ∑ ( xi − µ ) 2
n N
; tendremos:
n−1
E( S$ 2 )= σ$ 2 =
∑ ( x i − µ) 2
N −1
3.- Cuando N → ∞ y no conocemos a σ2, entonces S$ 2 se hace un estimador
insesgado de σ2 porque si:
S$ =
2 ∑ ( xi − x) 2
; y σ$ =
2 ∑ ( x i − µ) 2
cuando N → ∞, tenemos:
n−1 N −1
N
S$ 2 = σ2 porque =1
N −1
o sea, que S$ 2 estima σ2 cuando N → ∞ y σ$x estima Sx $ ; es decir, cuando no se
S$ σ
conozca σ usaremos S$x = en lugar de: σx = en x ± Zα σ x ; por lo que la
n n
expresión de los limites de confianza se convierte en x ± Zα S$ x .
S
4.- También podemos decir que cuando N > 100, S$ 2 = S 2 , tal que Sx =
n
VII.7 PRÁCTICA X
Problema No. 2 Con los datos del problema 1, suponga que µ es desconocida
y X = $105, encontrar:
a) La estimación de punto
b) La estimación de intervalo
c) Interprete los resultados de los dos tipos de estimaciones. Si µ es conocida e
igual a $ 100, ¿está la verdadera media poblacional dentro del intervalo de
estimación?
Problema No. 4. Con los datos del problema 3, suponga que Π es desconocida
y p = 48%, encontrar:
a) La estimación de punto
b) La estimación del intervalo
c) Interprete los resultados de las dos estimaciones. Si Π es conocida e igual a
45%, ¿Esta la verdadera proporción de la población dentro del intervalo de
estimación?
Antes de de iniciar el tema he creído conveniente señalar que existe dicha relación,
ya que en una prueba de hipótesis , dado un nivel de significación α , se
construye un intervalo de confianza para ξ o nivel de confianza para no rechazar
la hipótesis nula.
Así, por ejemplo, si en una prueba de dos extremos utilizamos Z, con un cierto
nivel de α de que la Ho: µ x = µo , la condición o intervalo para no
rechazar Ho es que la z crítica o valor teórico que se obtiene de tablas sea igual o
mayor que la Z real u observada, que es lo mismo, en el caso del intervalo de
confianza, ya que: la media muestral, más menos, el producto de z teórica por el
error estándar de la media, sea superior a la media hipotética. Ambas
desigualdades son lo mismo y cada una tiene una probabilidad 1- α = ξ si es que
µ x es µ o ; la primera garantiza que la prueba tiene nivel de significación α y
la segunda, garantiza que el intervalo de confianza tiene probabilidad 1- α de
contener µ x
VIII.1 DEFINICIÓN
Por otra parte es importante mencionar que aun cuando no hay un número
universal definido para aceptar o rechazar una hipótesis nula, generalmente se usa
α = 5%, conocida α como nivel de significación, cuya interpretación es :
cuando es grande la diferencia entre el valor de la estadística muestral y el
supuesto valor del parámetro poblacional, una diferencia de esa magnitud
ocurrirá al azar con una probabilidad de 5% o menos cuando el supuesto valor es
en realidad correcto; en esa situación rechazamos la hipótesis nula y se considera
que la diferencia observada es significativa, en otras palabras, que la gra diferencia
no se debe a la selección aleatoria de la muestra, sino que se debe a otras razones.
para aceptar o rechazar la hipótesis nula; en este caso decimos que 0.95 es la
proporción de medias muestrales comprendidas dentro de los límites crítcos
establecidos para rpbar la hipótesis nula, con un nivel de significación del 5%.
Conviene señalar que una hipótesis nula se prueba con unidades originales (
medias muestrales ) y con unidades Z ( número de unidades del error estándar de
la media ); este último procedimiento es el más usual.
X -µ=0
Ello indica que se prueba que no hay diferencia entre µ y X , lo cual es llamado
HIPÓTES IS NULA, ( Ho ).
Cualquier hipótesis diferente de la nula es llamada HIPÓTESIS
ALTERNATIVA, ( Hi ).
Cuando se hace el planteamiento para tomar una decisión estadística, es
factible cometer 2 tipos de errores:
Error 1: Rechazar una hipótesis nula cuando realmente es verdadera; y
Error 2: Es aceptar una hipótesis nula cuando realmente ésta es falsa.
La probabilidad de cometer un error del tipo 1, es usualmente denotada
por α (alfa); y la probabilidad de cometer un error del tipo 2, es denotada por β
(beta).
Veamos gráficamente La prueba de hipótesiscuando se hace con dos
"colas" o extremos:
α α
0
µο
Dos colas
µo = media hipotética
x − µo x − µo
y se hace con: t = = cuando se desconoce σ y n < 30
sx s
n−1
1.- Diferencia de una media muestral y una poblacional conocido σ, tal que:
x − µo σ
Z= ; σx = para una población infinita
σx n
Para una diferencia de proporciones:
p−P PQ
Z= ; σp= para una población infinita
σp n
EJEM PLO 1:
Retomando el ejemplo planteado al principio del tema, cuando lo usamos
para enfatizar el significado de “ las diferencias “, ahora digamos que en la
producción de cierto tipo de anillos se requiere que exista una calidad estándar de
tal manera que su diámetro medio sea de 0.575 centimetros. Se toma una
muestra de 50 anillos, y arrojan un diámetro medio de 0.565 pulgadas. Pruebe la
hipótesis de que la media poblacional es igual ala media muestral, si el nivel de
significación es de 5%, y se hace un ensayo de dos extremos. La desviación
estándar es de 0.50 centimetros.
µ o= 0.575 centimetros
n = 50 anillos industriales
X = 0.565 centimetros
σ = 0.50 centimetros
α=5%
Zα = ± 1.96 = valor critico para aceptar o rechazar Ho.
Ho: X = µ ; Hi: X ≠ µ
0
Zona de aceptación
0
Área de
0
Área de
0
rechazo
0
rechazo
0
0.025 0.025
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
X = 0.565 µo = 0.575
Z α=-1.96 Z= - .1414 Z α=1.96
En donde:
− 0.010
Z= = −.1414
0.0707
x − µo 0.565 − 0.575 σ 0.050
Z= = ; y σx = = = 0.00707
σx 0.0707 n 50
Esta distribución fue elaborada por William S. Gosset, que usaba el nombre de
"Student".
Se utiliza para manejar muestras pequeñas, generalmente menores de 30 y cuando
no se conoce σ .
t - tiende a la normal igual que Z, de tal manera que:
x−µ
t=
Sx
Tiene media 0 y desviación estándar 1, es decir, adopta la forma de la distribución
normal estándar.
S=
∑ (x i − x) 2
n
Así, en el caso de la prueba de hipótesis cuando no se conoce σ, ésta se estima a
partir de S. De esta manera al igual que Z; si: Z ó t son menores o iguales que Z α
ó t α se acepta la hipótesis nula.
tα=-2.06 tα=2.06
0
Region de
0
Región de aceptación Región de
0
rechazo rechazo
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
µ0 − tα sx 0 µ0 + tα sx
$2,458.80 µo=$2,500 $2,541.20
x − µ0 S 100
t= ; donde S x = = = 20
Sx n −1 25
S x = 20
3,000 − 2,500 500
t= = = 25
20 20
EJEM PLO 1:
Se desea estimar la diferencia de medias cuando no se conoce σ y son muestras
pequeñas.
Se desea probar la hipótesis con α= 5%, de que el ingreso medio por trabajador
es el mismo en las colonias Arenal y Tlacotal. Para ello se seleccionan dos
muestras al azar, y se obtienen los siguientes datos:
n1 = 10 familias n2 = 17 familias
x 1 = $6,200.00/mes x 2 = $5,600.00/mes
S1 = 690 S 2 = 600
luego, con n1 +n2 -2 = 10 + 17 - 2 = 25 G.L.
y α = 5% t α = ± 2.06
0 tα=-2.06 tα=2.06
0
0.025 0.025
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
2
(X 1 − X 2 )
S$ = 660
n1 + n2 10 + 17 27
S ( x1 − x 2 ) = S$ = 660 = 660 = 660(0.399) = $263.00
n1 n 2 10(17 ) 170
x1 − x 2 6,200 − 5,600 600
t= = = = 2.28
S ( x1 − x2 ) 263 263
t=2.28
Por otra parte, cuando n - 1 es grande, casi es n, tal que Z puede usarse en
lugar de t. En general cuando n > 30 se usará Z; y cuando n < 30 se usará t.
EJEM PLO 3:
Si deseamos estimar el gasto mensual promedio por familia en ropa en una
región con población homogénea‚ para ello seleccionamos al azar una muestra de
10 familias cuya media aritmética es igual a $838.00 con S = $105.00.
n = 10
X = $ 838.00
S = $ 105.00
luego:
S 105
Sx = = = 105 / 3 = $35.00
n −1 9
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
VIII.4 X CUADRADA (X 2)
( fo − fe) 2
χ =∑
2
fe
Nunca es regular.
Grados de libertad : n - n0 restricciones.
Ejemplo.
En la venta de un producto, el gerente dividió al país en 6 regiones de
venta para obtener pedidos por correo. El gerente espera igual número de
pedidos en cada una de las 6 áreas. Después de un breve período, decide probar
la eficacia de su campaña; en ese momento ha recibido 60 solicitudes. El
establece la hipótesis de que no hay diferencia, que las 6 áreas son iguales,
espera 10 solicitudes de cada área. Los resultados son los siguientes :
Nº de (fo-fe)2
pedidos
Área fo fe fo-fe (fo-fe)2 fe
A 6 10 -4 16 1.6
B 15 10 5 25 2.5
C 7 10 -3 9 0.9
D 4 10 -6 36 3.6
E 17 10 7 49 4.9
F 11 10 1 1 0.1
60 13.6
AREA DE
ACEPTACIÓN
0.05
χ α2 = 11.07
Clase A1 A2 A3
B1 n 11 n 21 n 31
B2 n 12 n 22 n 32
B3 n 13 n 23 n 33
OBSERVADOS ESPERADOS
CUESTIONARIO Respondiero No Total Respondieron No Total
n respondiero respondieron
n
Moneda 77 23 100 65.7 34.3 100
incluida
Moneda no 120 80 200 131.3 68.7 200
incluida
TOTAL 197 103 300 197 103 300
2
(Fo-Fe)
Celda Fo Fe Fo-Fe (Fo-Fe)2 Fe
1 - 1 77 65.7 11.3 127.7 1.9437
1 - 2 23 34.3 -11.3 127.7 3.7230
2 - 1 120 131.3 -11.3 127.7 0.9726
2 - 2 80 68.7 11.3 127.7 1.8588
8.4981
FRECUENCIAS OBSERVADAS
OPERADOR
1 2 3 4 Total
CALIDAD
Excelente 40 44 32 24 140
Marginal 7 5 12 16 40
No aceptable 3 11 6 - 20
Totales 50 60 50 40 200
TABLA DE CONTINGENCIA
Clase A1 A2 A3
B1 n 11 n 21 n 31
B2 n 12 n 22 n 32
B3 n 13 n 23 n 33
X1 X2 X3 X4
5 ÷ 200 * 140 = 35 ; 60 ÷ 200 * 140 = 4 ; 5 ÷ 200 * 140 = 35 ; 40 ÷ 200 * 140 = 28
0 2 0
5 ÷ 200 * 40 = 10 ; 60 ÷ 200 * 40 = 1 ; 5 ÷ 200 * 40 = 10 ; 40 ÷ 200 * 40 = 8
0 2 0
5 ÷ 200 * 20 = 5; 60 ÷ 200 * 20 = 6 ; 5 ÷ 200 * 20 = 5 ; 40 ÷ 200 * 20 = 4
0 0
Región de
rechazo
Área de
aceptación
0.05
χ2=12.595
(Fo-Fe)2
Celda Fo Fe Fo-Fe (Fo-Fe)2 Fe
1 - 1 40 35 5 25 0.7143
1 - 2 44 42 2 4 0.0952
1 - 3 32 35 -3 9 0.2571
1 - 4 24 28 -4 16 0.5714
2 - 1 7 10 -3 9 0.9000
2 - 2 5 12 -7 49 4.0833
2 - 3 12 10 2 4 0.4000
2 - 4 16 8 8 64 8.0000
3 - 1 3 5 -2 4 0.8000
3 - 2 11 6 5 25 4.1667
3 - 3 6 5 1 1 0.2000
3 - 4 0 4 -4 16 4.0000
24.1881
( fo − fe) 2
χ2 = ∑ = 24.17
fe
Como χ 2 = 24.17 > χ α2 = 12.592 , rechazamos la hipótesis de que los cuatro
operadores no difieran en habilidad para producir tornillos.
1.- Introducción
El levantamiento mensual de encuestas requiere de una supervisión
estadística que permanentemente favorezca la confiabilidad de la información.
Para ello es necesaria la aplicación de ciertas técnicas que detecten si existe o no
relación entre el tamaño de la muestra y el valor de los indicadores.
Para ilustrar lo anterior se tomó como referencia una encuesta mensual que
hace el Instituto de la Pequeña y M ediana Empresa.
La periodicidad de la encuesta requiere la aplicación de técnicas fuertes
que permitan eliminar rápidamente los factores irrelevantes y retener los de gran
significación en los resultados. A las medidas estadísticas que permitan
cumplir con estos objetivos se les denominará
COEFICIENTES DE AS OCIACIÓN.
Puesto que el método de muestreo utilizado es el de proporciones
correspondientes a indicadores con distribuciones fuera de cualquier curva
definida por funciones matemáticas, se optó por la aplicación de pruebas de
Phi (φ )
Es una medida de la fuerza de la relación que existe entre las variables
descriptivas, la cuantitativa (muestra) y la cualitativa (opinión de los
empresarios). Phi toma el valor de 0 cuando no hay relación y + 1 cuando las
variables se relacionan a la perfección. Phi hace la corrección en el valor de χ 2
porque éste es directamente proporcional al tamaño de la muestra (n) y por ello
su fórmula es :
1/ 2
χ 2
φ=
n
V de Cramer
PROCEDIMIENTO
TABLA DE CONTINGENCIA
GRUPO
INDUSTRI A1 A2 A3 TOTAL
AL
B1 R11 S21 T31 V1 = R11 + S21 + T13
B2 R12 S22 T32 V2 = R12 + S22 + T32
B3 R13 S23 T33 V3 =
B4 R14 V4 =
B5 R15 V5 =
B6 R16 V6 =
B7 R17 V7 =
B8 R18 S28 V8 =
B9 R19 V9 = R19 + S29 + T39
GRUPO
INDUSTRIAL X1 X2 X3 TOTAL
B1 V1 ( R/V ) = 11 V1 ( S/V ) = 56 V1 ( T/V ) = 17 V1 = 84
B2 V2 ( R/V ) = 4 V2 ( S/V ) = 17 V2 ( T/V ) = 6 V2 = 28
B3 V3 ( R/V ) = 5 V3 ( S/V ) = 27 V3 ( T/V ) = 9 V3 = 40
B4 V4 ( R/V ) = 5 V4 ( S/V ) = 25 V4 ( T/V ) = 7 V4 = 37
B5 V5 ( R/V ) = 2 V5 ( S/V ) = 10 V5 ( T/V ) = 3 V5 = 15
B6 V6 ( R/V ) = 3 V6 ( S/V ) = 14 V6 ( T/V ) = 4 V6 = 21
B7 V7 ( R/V ) = 3 V7 ( S/V ) = 13 V7 ( T/V ) = 4 V7 = 20
B8 V8 ( R/V ) = 2 V8 ( S/V ) = 11 V8 ( T/V ) = 3 V8 = 16
B9 V9 ( R/V ) = 3 V9 ( S/V ) = 17 V9 ( T/V ) = 5 V9 = 25
B10 V10 ( R/V ) = 5 V10 ( S/V ) = 24 V10 ( T/V ) = 7 V10 = 36
B11 V11 ( R/V ) = 1 V11 ( S/V ) = 3 V11 ( T/V ) = 1 V11 = 5
B12 V12 ( R/V ) = 5 V12 ( S/V ) = 28 V12 ( T/V ) = 8 V12 = 41
B13 V13 ( R/V ) = 3 V13 ( S/V ) = 16 V13 ( T/V ) = 5 V13 = 24
B14 V14 ( R/V ) = 1 V14 ( S/V ) = 5 V14 ( T/V ) = 1 V14 = 7
B15 V15 ( R/V ) = 2 V15 ( S/V ) = 9 V15 ( T/V ) = 3 V15 = 14
B16 V16 ( R/V ) = 1 V16 ( S/V ) = 4 V16 ( T/V ) = 1 V16 = 6
TOTAL R=56 S=279 T=84 V=419
fe = frecuencia esperada
Haciendo las comparaciones, entre fr, fe para sustituirlas en la fórmula, se
obtiene:
(fr-fe)2 (fr-fe)2
2 2
(fr-fe) fe (fr-fe) fe
1 0.0909 2 0.1176
25 0.4464 9 1.8000
16 0.9412 4 0.8000
4 0.8000 0 0.0000
25 1.4706 4 0.5714
9 1.5000 1 1.0000
0 0.0000 1 0.3333
0 0.0000 0 0.0000
0 0.0000 9 1.8000
0 0.0000 1 0.0357
0 0.0000 16 2.0000
0 0.0000 36 12.0000
1 0.5000 9 0.5625
1 0.1000 9 1.8000
4 1.3333 1 1.0000
4 1.3333 1 0.2000
9 0.6429 4 4.0000
29 7.2500 1 0.5000
9 3.0000 9 1.0000
0 0.0000 4 1.3333
9 2.2500 1 1.0000
1 0.5000 1 0.2500
0 0.0000 0 0.0000
1 0.3333 Total 53.90
1 0.3333
( fr − fe ) 2
χ =
2
χ 2 = 5390
.
fe
con α = 0.05 y (c-1)(R-1) = (3-1)(16-1) = 30 grados de libertad.
el valor critico de χ α2 = 43.773 tenemos que
Zona de
Zona de rechazo
aceptación
α=0.05
χ α2 =43.773
Como χ 2 = 5390
. > χ α2 = 43.773 se rechaza la hipótesis nula de que no
hay diferencia entre el tamaño de la muestra y la opinión de los empresarios.
Luego se inicia la prueba Phi ( φ ) para cuantificar el grado de
asociación entre las dos variables descriptivas.
1/ 2 1/ 2
χ 2 53.90
φ= = = (012864
. )1 /2 = 0.358
n 419
La interpretación es que hay una relación sensiblemente significativa.
Como la tabla de contingencia es más grande que una de dos por dos, se
aplica la V Cramer para corregir el valor de φ .
1 /2 1/ 2 1/ 2
φ2 ( 0.358) 2 0128164
.
V= = =
C − 1 2 2
1/2
V = (0.064082)
V = 0.25
Antecedentes
Para ella se tomó la muestra aleatoria del mes de junio, la cual fue de 419
empresas distribuidas en 16 grupos industriales de la siguiente manera:
Nº de
Empresas
Concepto (Xi)
Total 419
1 .- Fab. de alimentos 84
2 .- Industria Textil 28
3 .- Fab. de Prendas de Vestir 40
4 .- Fab. de Calzado e Ind. del Cuero 37
5 .- Ind. y Prod. de Madera y Corcho Excepto 15
Muebles
6 .- Fab. y Rep. de Muebles de Madera 21
7 .- Ind. Editorial de Impresión y Conexas 20
8 .- Industria Química 16
9 .- Fab. de Prod. de Hule y Plástico 25
10 .- Fab. de Productos Minerales no 36
Metalicos
11 .- Industrias Metalicas Básicas 5
12 .- Fab. de Prod. Metalicos 41
13 .- Fab. de Maq. y Equipo Excepto los 24
Electricos
14 .- Fab. de Maq. y Equipo y Aparatos 7
Electricos
15 .- Construcción de Equipo de Transporte 14
16 .- Otras Industrias Menufactureras 6
2 Cálculo
Como no se conocen los valores de los parámetros poblacionales µ y σ 2 ,
es necesario estimarlos a partir de las estadísticas x y S 2 de la muestra. Así;
Grupo
Industrial Xi % Xi 2
1 84 20 7,056
2 28 7 784
3 40 10 1,600
4 37 9 1,369
5 15 4 225
6 21 5 441
7 20 5 400
8 16 4 256
9 25 6 625
10 36 9 1,296
11 5 1 25
12 41 10 1,681
13 24 6 576
14 7 2 49
15 14 3 196
16 6 1 36
Suma 419 102 16,615
1 n 1
X= ∑
n i= 1
x i = ( 419) = 26 empresas
16
1 1
S 2 = ∑ xi2 − x 2 = (16,615) − (26) 2 = 1038 − 676 = 362 empresas
n 16
Considerando a K σ x x
como = Ζα (σ x ) este razonamiento para obtener el
tamaño de la muestra se basa en el hecho de que:
P( x − k σ ≤ µ ≤ x + kσ ) = Pk = 1 − α = 95%
α = nivel de significación = 5%
σ
donde σx = ,para una población infinita.
n
Sabiendo que K= Z
σ2 N −n
Cuando la población es finita e = k
n N −1
Como no se conoce σ , la estima S y sabiendo que K=Z
2 2
S2 N −n
e = Zσ x = Z
n N −1
Para obtener el tamaño de la muestra (n), se despeja de la ecuación
anterior elevando al cuadrado ambos miembros.
S2 N −n
e2 = Z 2
n N −1
Z2*S2 *N
Así: n = 2
e N − e2 + Z 2 S 2
Z = ± 1.96
S2 = 362
N = 8,966
Z2 *S2 * N . ) 2 ( 362)(8,966)
(196 12,468,650 12,468,650
n= 2 2 2 = 2 = =
2
e N−e +Z S 2
. ) (8,966) + (362)(196
(156 . ) − (156
. ) 21,820 + 1,391 − 2 23,209
n = 537 empresas.
Comprobación del valor de ( e )
S2 N −n
e2 = Z 2 = (3.84)(0.6741)(0.94)
n N −1
e2 = 2.43 luego e = 1.56 empresas= error permitido= error de muestreo.
Grupo Ni/N
Industrial % n= 537 ni
1
2
3
4
5
Donde i = 1, 2, 3, 4, 5, ......, 16
por lo que n1 + n2 + n3 + ....+n16 = n = 537
B. muestreo estratificado
Tomando como referencia los datos de este diseño muestral que aplicamos en el
inciso en que hablamos de la precisión, donde indicamos que el error de muestreo
se mide con el error estándar, entonces digamos ahora que si el error estándar de
k
N i − ni
σp= ∑W i
2
S i2
N i * ni
1
k k
k
N i − ni
∑ Wi 2 Si2 N i − ni ∑ Wi2 S i2
σ 2p = ∑ Wi 2 S i2 =
1 N i * ni N i * ni
k k
σ 2p (N i * ni ) = N i ∑Wi 2 Si2 − ni ∑Wi 2 Si2
1 1
k k
σ 2p (N i * ni ) + ni ∑Wi2 Si2 = Ni ∑Wi 2 Si2
1 1
Entonces :
k k
ni (σ N i + ∑ Wi Si ) = N i ∑ Wi 2 S i2
2 2 2
p
1 1
k
N i ∑ Wi 2 Si2
ni = k ; comoS 2 = pq
σ 2p N i + ∑ Wi 2 Si2
1
k
N i ∑ Wi 2 pq
ni = k
σ 2p N i + ∑ Wi 2 pq
1
Ejemplo:
Empresas
de
Estratos Ni Wi ni la muestra Pi
muestra que
contestaron
1 7,000 0.7 200 160 160 ÷ 200 = 0.8
2 1,000 0.1 100 40 40 ÷ 100 = 0.4
3 2,000 0.2 100 60 60 ÷ 100 = 0.6
10,000 1 400 260
Con σp = 0.025
k
Como ∑W i
2
S12 =(0.49)(0.16)+(0.01)(0.24)+(0.04)(0.24)=0.0784 + 0.0024 +
1
0.0096 = 0.904
7,000(0.0904)
n1 =
(0.025) 2 7,000 + 0.0904
633
n1 = = 142;
4,465
1,000( 0.0904) 90.4
n2 = = = 126
( 0.000625)1,000 + 0.0904 0.715
2,000(0.0904)
n3 = = 135
(0.000625)2,000 + 0.09041
n1 + n2 + n3 = n = 402
ii) También se puede estimar de la muestra comparando cada una de las ventas
individuales con la media de su grupo, lo cual llamaremos: variación dentro
de los grupos.
Distribución F
Zona de
Zona de rechazo
aceptación
0.05
Así :
1o.-El número de grados de libertad es aditivo, esto es: K - 1
2o.-Para la varianza proveniente de dentro de los grupos, los G.L.= ( T - K )
3o.-Los G.L. de la varianza de las variaciones totales serán =(T-1)
∑ n (x
L= 1
i i − x )2
n2 = ( x 2 − x ) 2 = 4(400-400)2 =0
n3 = (x 3 − x ) 2 = 5(500-400)2 =50,000
k
∑ n (x
L= 1
i i − x ) 2 = 50,000 + 0 + 50,000 = 100,000
∑ ∑ (x
i =1 j =1
ij − x j )2 .
∑ ∑ (x
i =1 j =1
ij − x j ) 2 . = 140,000 + 60,000 + 100,000 = 300,000
_ _ _ _ _ _
2 2
j xij-x (x1j-x) (x2j-x2) (x2j-x) (x3j-x3) (x3j-x3)2
1 0 0 200 40,000 200 40,000
2 100 10,000 -100 10,000 -200 40,000
3 0 0 -100 10,000 -100 10,000
4 200 40,000 0 0 100 10,000
5 -300 90,000 0 0 0 0
∑ ∑( x
i =1 j =1
ij − x )2 = ∑ ( X ij − X ) 2 .
T
j X ij − X ( X ij − X )2 X2 j − X ( X 2 j − X )2 X3 j − X 2
( X3j − X )
50,000
F ( 2, 11 ) = = 183
.
27,273
Con α = 0.05 y ( 2 y 11) G.L. Fα= 3.98
Como F = 1.83 < Fα = 3.98 : concluimos con esta evidencia que hay
homogeneidad entre las medias; no es una evidencia de la cual podemos inferir
que los vendedores difieren en habilidad para hacerlo.
∑
I=
nI xi 2
− Tx 2
1
∑ x ij2 − ∑ ni x i2
T i =1
La variación total:
∑ x ij2 − Tx i2
T
∑ x ij2 ;
T
∑
I=
nI xi 2
Tx 2
1
Así ∑ x ij 2
= 590,000 +700,000 + 1,350,000 = 2,640,000
T
K
∑= nI x i 2
= n1 x12 + n2 x 22 + n 3 x 32 = 5(300)2 + 4(400)2 + 5(500)2 =
I 1
100,000
∑T xij − Tx
2 2
= 2,640,000 - 2,240,000 = 400,000
Con estos datos se prueba la hipótesis nula y se llega a los mismos resultados
que con el método directo.
COMENTARIOS FINALES :
VIII. PRÁCTICA XI
PRUEBA DE HIPÓTESIS
3.- Indique la diferencia entre: a) Una prueba de dos extremos y una prueba de un
extremo; b) Una prueba de extremo izquierdo y una de extremo derecho.
1 2 3
CALIFICACIONES NÚMERO DE
ESTUDIANTES
(Intervalo de clase) Real Teorico
20 - 29 3 1
30 - 39 6 3
40 - 49 5 8
50 - 59 7 13
60 - 69 10 17
70 - 79 29 16
80 - 89 12 12
90 - 99 8 6
99.5 y más 0 4
Total 80 80
S OLUCIÓN PRÁCTICA XI
Solución del problema 1
Datos:
µ = 600 libras de resistencia
σ = 40 libras
n = 64 cuerdas
x = 609 libras
α = 5%
Ho: µ > 600 libras de resistencia
x −µ σ
La prueba se hace con: Z = donde σ x = porque n >30
σx n
Sustituyendo
609 − 600 9 40 40
luego Z = = = 18. así σ x = = =5
5 5 64 8
σx = 5
Como Z=1.8 > Z α=1.645 se toma la decisión de rechazar la hipótesis nula de que
hay un incremento de la resistencia de las cuerdas en la nueva técnica de
fabricación es decir, no mejoro su resistencia.
Zona de
0
rechazo
Zona de aceptación
0
0
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 2
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
- 1
Zα=-1.28 Π=95%
p−Π p*q
La prueba se hace con Z = donde σ p =
σp n
(0.92)( 008
. )
porque n>30 luego σ p = = 00004906
. = 0.022
150
. − 0.95
092
Así tenemos que Z = por lo tanto Z = -1.36
0.022
80 - 89 12 12 0 0 0
90 y más 8 10 -2 4 0.4
Total 80 80 0 X2= 16.9474170
4
(R-T)2
Clases R-T= (R-T)2 T
20 - 29 3 - 1 = 2 4 4
30 - 39 6 - 3 = 3 9 3
40 - 49 5 - 8 = -3 9 1.125
50 - 59 7 - 13 = -6 36 2.7692
60 - 69 10 - 17 = -7 49 2.8824
70 - 79 29 - 16 = 13 169 10.5625
80 - 89 12 - 12 = 0 0 0.0000
90 - 99 8 - 6 = 2 4 0.6667
99.5 y más 0 - 4 = -4 16 4.0000
Total (R-T) = 0
∑ X2= 29.0058
Luego con α = 5%
X2α =15.507
Decisión : se toma la decisión de rechazar la hipótesis nula porque X2α < X2.
Como G.L. = n - 1 = 9 - 1 = 8
Y α= 5% tenemos X2α = 15.507
Decisión: se toma la decisión de rechazar la hipótesis nula de que las
calificaciones reales y las esperadas o teóricos no difieren significativamente,
puesto que X2α = 15.507 < X2 = 29.005
2.- Calculamos:
K
∑ ni x i 2
= n1 x 12 + n2 x22 + n 3 x 32 = 4(70) 2 + 5(75) 2 + 4 (54) 2 = 19,600 + 28,125 +
t
11,664 = 59,389.
∑ ni x i 2
− Tx = 59,389 − 58,357 = 1032
.
t
∑ X 2 IJ − ∑ ni x i2 = 59,465 - 59,389 = 76
t i =1
Variación total:
∑ X 2 IJ − Tx 2 = 59,465 - 58,357 = 1,108
t
Así
Variación Grados de Suma de Varianza
libertad cuadrados
entre grupos K-1=3-2=2 1,032 516
Dentro de
Grupos T - K = 13 - 3 = 10 76 7.6
Total T - 1 = 13 - 1 = 12 1,108 92.3