Estadistica Inferencial
Estadistica Inferencial
Estadistica Inferencial
2
INTRODUCCIÓN AL MATERIAL
DE ESTUDIO
OBJETIVO GENERAL
Al finalizar el curso, el alumno será capaz de inferir las características de
una población con base en la información contenida, así como de
contrastar diversas pruebas para la toma de decisiones.
ESTRUCTURA CONCEPTUAL
UNIDAD 1
INTRODUCCIÓN AL MUESTREO
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno reconocerá los diferentes tipos de
muestreo y sus características.
INTRODUCCIÓN
La teoría del muestreo es útil en numerosas ocasiones y en diferentes
campos de la ciencia, sobre todo cuando no se cuenta con los recursos
necesarios para hacer un censo (tiempo y dinero) o cuando no es
necesario o recomendable hacer un estudio completo de toda la
población de interés. Sin embargo, el no hacer el estudio completo, no
significa de ninguna manera que el estudio no sea importante, pues
extraer una muestra que sea representativa de una población y hacer
inferencias que sean correctas de la población basándose en los datos
arrojados por la muestra, es todo un proceso que debe ser
cuidadosamente diseñado y elaborado; desde el objetivo del muestreo,
tamaño de la muestra, técnica de muestreo a emplear, homogeneidad de
la población, hasta las inferencias obtenidas al termino del estudio
apoyadas en la teoría de la estimación.
15
Cabe aclarar que es imposible que una sola persona logre tal estudio
completo y que una gran cantidad de expertos en diferentes campos se
ve involucrada en tales estudios. Tales expertos incluyen no solo a los
expertos en estadística, en mercados, en el giro mismo al que se esté
dirigiendo el estudio, etc.
LO QUE SÉ
Selecciona si las siguientes aseveraciones son verdaderas (V) o falsas
(F).
Verdadera Falsa
1. El siguiente es un axioma de probabilidad,
“La probabilidad de un hecho existe y es
restringida a la amplitud de cero a uno,
( ) ( )
inclusive. Es decir, si designamos la
probabilidad de un hecho E como
P (E), entonces: 0 P( E)
1 ”.
2. La siguiente es una propiedad de los
logaritmos: ( ) ( )
n
l o g u nl o
g u
a a
3. La siguiente expresión no es
una propiedad de los logaritmos: ( ) ( )
l o g a uv
l o g
a ul o g av
4. La teoría de conjuntos es un instrumento
matemático muy útil para analizar
( ) ( )
un problema, permitiéndonos
enfocar en él lo
que es fundamental de lo que no lo es.
5. El sentido de una desigualdad debe ser
invertido al multiplicar o dividir toda ( ) ( )
la desigualdad por un número
negativo.
6. La derivada de una función es el límite del
incremento de la función al incremento de la
( ) ( )
variable independiente cuando este último
tiende a cero.
7. Una función matemática es una regla que
asigna a cada elemento de un conjunto “A” ( ) ( )
uno y solo un elemento de un conjunto “B”.
TEMARIO DETALLADO
(4 horas)
L(y1,y2,…,yn, a) = P(y1)P(y2)…P(yn)
L(y1,y2,…,yn, a) = f(y1)f(y2)…f(yn)
Segundo paso
Sustituir los valores o datos dados por el problema en la fórmula original,
considerando la teoría de la función de verosimilitud. Los valores
observados son y1=1 e y2=4; por lo tanto, la función de verosimilitud
estará formada por el producto para cada uno de los datos de la fórmula
misma.
Es decir:
22
Tercer paso
Realizar las operaciones algebraicas correspondientes a la reducción de
la fórmula, lo cual quiere decir que finalmente la fórmula anterior se
puede reducir a:
Se escribe una derivada parcial debido a que “L” también depende de: y1,
1
En virtud de que el logaritmo natural es una función creciente, a medida que la
verosimilitud se incrementa hacia su máximo, también lo hace su logaritmo.
Finalmente, si la distribución de “Y” contiene “r” parámetros: a1, a2,...,ar,
entonces en lugar de se tiene las “r” condiciones:
y en lugar de tenemos:
Por lo tanto, continuando con el ejemplo anterior, tenemos que la función de
verosimilitud era:
En donde el valor desconocido es en este caso
De modo que continuando con el proceso, el logaritmo natural de la verosimilitud es:
en donde por leyes de los logaritmos esta ecuación queda de la siguiente
manera:
Continuando con las leyes de los logaritmos, la expresión toma la forma siguiente:
l(1,4, ) = -2+ 5 ln- ln [(1!)(4!)[
Posteriormente, al obtener la primera derivada a esta ecuación, esta cobra la siguiente
forma:
Si a la ecuación anterior le aplicamos las leyes de la derivación matemática, tenemos
que esta expresión se convierte en:
Continuando con el proceso, igualamos a “cero” esta primera derivada, por lo que la
expresión resultante se indica a continuación:
que es lo mismo que:
Resolviendo la última ecuación de primer grado con una incógnita tenemos que:
De modo que la estimación de máximo verosímil o de máxima verosimilitud de es û=2.5.
Del muestreo aleatorio simple puede ser difícil en ciertos casos. Por
ejemplo, suponga que la población que nos interesa consiste de 2000
facturas que se localizan en cajones. Tomar una muestra aleatoria
sencilla requeriría primero numerar las facturas, del 0001 al 1999;
posteriormente, se seleccionaría luego una muestra de, por ejemplo, 100
números utilizando una tabla de números aleatorios; luego, en los
cajones deberá localizarse una factura que concuerde con cada uno de
estos 100 números; en fin, esta tarea puede requerir mucho tiempo. En
lugar de ello, se podría seleccionar una muestra aleatoria sistemática
utilizando el siguiente método: se recorren simplemente los cajones y se
cuentan las facturas; finalmente, se toman las que coincidan con el
número 20 para su estudio. Así, la primera factura debería elegirse
utilizando un proceso aleatorio, por ejemplo, una tabla de números
aleatorios. Si se eligió la décima factura como punto de partida, la
muestra consistiría en las facturas décima, trigésima, quincuagésima,
septuagésima, etcétera.
Debido a que el primer número se elige al azar, todos tienen la misma
probabilidad de seleccionarse para la muestra. Por lo tanto, se trata de
un muestreo cuasi-aleatorio. La ventaja para este tipo de muestreo sería
que es más rápido que un muestreo aleatorio formal y su desventaja es
que puede no reflejar información importante contenida en el conjunto de
datos debido a que no todos los elementos estrictamente hablados,
tienen la misma oportunidad de ser seleccionados.
Ejemplo
Los gastos en mercadotecnia de las 352 empresas mexicanas más
grandes seleccionadas por la revista Fortune. Supóngase que el objetivo
de estudio consiste en determinar si las empresas con altos rendimientos
sobre su inversión (una medición de la rentabilidad) han gastado una
mayor proporción de su presupuesto de ventas en mercadotecnia que
las empresas que tienen un menor rendimiento o incluso un déficit.
Supóngase que las 352 empresas se dividieron en cinco estratos; si
seleccionamos una muestra de 50 empresas, entonces de acuerdo con
el muestreo aleatorio estratificado se deberían incluir:
# #
Estrato Rentabilidad ?
empresas muestreado
1 30% y más 8 1 (8/352)(50)
2 De 20 a 30% 35 5 (35/352)(50)
3 De 10 a 20% 189 27 (189/352)(50)
4 De 0 a 10% 115 16 (115/352)(50)
5 Déficit 5 1 (5/352)(50)
Total 352 50
Tamaño de la muestra
Para la determinación del tamaño de la muestra se requiere tomar en
consideración la mayor cantidad posible de los siguientes elementos.
n M (NP1 P
e2 NQ Q
N
c
2
Variables
Las variables que considera la fórmula son los siguientes:
Variable Descripción
N Tamaño de la muestra
N Tamaño del universo
P Probabilidad de ocurrencia (homogeneidad del fenómeno)
Q Probabilidad de no ocurrencia (1-p))
Me Margen de error o precisión. Expresado como probabilidad.
Nc Nivel de confianza o exactitud. Expresado como valor z que
determina el área de probabilidad buscada.
Ejemplo
Se requiere calcular el tamaño de una muestra para el siguiente caso:
Variable Descripción
N ?
N 3,000,000
P Desconocemos la probabilidad de ocurrencia. Por esta razón
asumimos el mayor punto de incertidumbre, que es de 50%,
que al ser expresada como probabilidad queda como: 0.5
Q 1 – 0.5 = 0.5
Me +/- 5% de margen de error. Que expresado como probabilidad
queda como: 0.05
Nc 95% de nivel de confianza o exactitud. Que expresado como
valor “z” que determina el área de probabilidad buscada
queda como: 1.96
n ( (( 1 (
0 . 3 3 , , )0 0 0 .
0,
0 00
0 0)
0( 0
De donde, al realizar las operaciones indicadas, el valor de “n” obtenido
5 0, . 5
es de 384.1. Finalmente, haciendo un redondeo,
) 0 el tamaño de la muestra
0) (
será de 384 elementos.
00.
5 ) normal estándar y la
El valor de “z” se busca en las tablas de distribución
forma de encontrarlo es la siguiente: 2
(
1.
6
)
2
5
)
(
0
1. El porcentaje deseado entre 2 (debido a la simetría de la curva de
distribución normal), en este caso el resultado sería:.
5
9
)
54 7
.5
2. Este resultado (47.5) se divide
2 entre 100 para convertirlo de
porcentaje a decimal, es decir:
4
0.
7
4
.
7
5
5
3. Este valor de 0.475 se busca1 en el cuerpo de la tabla de la curva de
0 mayoría de los textos de probabilidad y
distribución normal estándar (La
0
estadística contienen esta tabla), donde encontramos el valor
correspondiente de z = 1.96.
RESUMEN DE LA UNIDAD
Como pudimos observar, las técnicas de muestreo son variadas y su
aplicación depende del estado de la población (homogeneidad-
heterogeneidad), sin embargo la metodología de aplicación del proceso
de muestrear es mucho más completa, pues tiene que cuidar de
numerosos detalles tales como el objetivo mismo del muestreo, el
tamaño de la muestra, el nivel de confianza, etc.
El apoyo que brinda la teoría de la estimación es muy importante para
poder obtener inferencias correctas de la población y en consecuencia,
las personas que deban tomar las decisiones correspondientes puedan
hacer su trabajo de manera eficiente teniendo como sustento de tales
decisiones herramientas estadísticas poderosas tales como la Teoría del
muestreo y la Teoría de la estimación.
GLOSARIO DE LA UNIDAD
Aleatorio
Suceso incierto que tiene algún grado de inseguridad de ocurrir (también
es llamado estocástico).
Censo
Es el estudio en el que se incluye a toda la población.
Cuestionario
Instrumento recolector autoadministrable. En él, el cuestionado lee y
contesta por sí mismo las preguntas.
Desviación estándar
Raíz cuadrada de la suma de los cuadrados de las desviaciones de cada
valor que asume la variable en relación a la media. Raíz cuadrada de la
varianza para la muestra “s” para la población (sigma).
Distribución normal
Estudia la concentración de probabilidad en un intervalo cualquiera, que
está contenido en el área bajo la curva de una función de probabilidades
en forma de campana.
Entrevista
Instrumento recolector empleado en una conversación a niveles
profundos o específicos. Puede ser libre o estructurada.
Error sistemático
Error de respuesta o de encuesta que se produce constantemente a lo
largo de la investigación.
Estadística
Es una ciencia relativamente nueva que tiene por objeto la colección e
interpretación de datos.
Estadística inferencial
Estimación de las características de una población, validación de
distribuciones o la toma de decisiones sobre algún factor de la población,
sin conocerla enteramente y basándose en los resultados de un
muestreo, que se manifiestan en la estadística descriptiva de ese
conjunto de datos.
Muestra
Es un conjunto de “n” observaciones extraídas de entre los “N”
elementos de la población.
Muestreo a juicio
Es la selección de “n” elementos de entre los “N” de una población
elegida según el criterio del sujeto que los elige. Se basa en
suposiciones muy amplias acerca de las variables que se van a estudiar
en la población. Generalmente lo realizan expertos en la materia.
Parámetro
Medida que caracteriza a una población.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
CUESTIONARIO DE
REFORZAMIENTO
1. ¿Qué es la teoría del muestreo?
2. ¿En qué situaciones es conveniente recurrir al muestreo?
3. ¿Cuáles son los aportes de la teoría del muestreo?
4. ¿Qué es un muestreo aleatorio simple?
5. ¿Para qué se utiliza la teoría del muestreo?
6. ¿Qué es un muestreo aleatorio sistemático?
7. ¿Qué es un muestreo aleatorio estratificado?
8. ¿Qué es un muestreo por conglomerados?
9. ¿Qué es el nivel de confianza?
10. ¿Qué es el error de muestreo?
EXAMEN DE AUTOEVALUACIÓN
1
Elige la respuesta correcta a las siguientes preguntas, una vez que
concluyas, obtendrás de manera automática tu calificación.
EXAMEN DE AUTOEVALUACIÓN
2
Verdadera Falsa
1. En un muestro aleatorio cada elemento de una ( ) ( )
población tiene la misma posibilidad de ser
seleccionado para integrar la muestra.
2. En un muestreo no aleatorio los elementos tienen ( ) ( )
diferentes posibilidades de ser elegidos para integrar
la muestra.
3. El muestreo por conglomerados consiste en dividir una ( ) ( )
población en subgrupos llamados estratos y se
selecciona una muestra de cada uno de ellos con lo
cual se garantiza la representación de cada subgrupo
o estrato en la muestra final.
4. El muestreo estratificado muchas veces se emplea ( ) ( )
para reducir el costo de realizar un muestreo de una
población dispersa en una gran área geográfica.
5. El error de muestreo es la diferencia que se presenta ( ) ( )
entre los resultados obtenidos en el análisis de las
muestras respecto de los que en realidad
corresponden a la población.
6. El error de muestreo se presenta con mayor intensidad ( ) ( )
cuando las muestras no son representativas de la
población de la cual fueron extraídas.
7. El error de muestreo se presenta de forma azarosa y ( ) ( )
no hay forma de evitarlo, calcularlo o minimizarlo.
LO QUE APRENDÍ
Considera una distribución binomial con n=5, y y=2. Encuentra la
estimación de máxima verosimilitud correspondiente.
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Bibliografía complementaria
Sitio Descripción
http://ocw.upm.es/estadistica-e- Martín Fernández, Susana y Ayuga
investigacion- Téllez, Esperanza. (2008).
operativa/matematicas-y- Introducción al muestreo. Ciencias
estadistica- Ambientales, UPM
aplicada/contenidos/OCW/Tecni
cas-de-
muestreo/Mat_Clase/tec_muestr
eo.pdf
http://aulasvirtuales.wordpress.c Rodríguez, Manuel Luis. (2010).
om/2010/04/30/introduccion-al- “Introducción al muestreo”,
muestreo (30/04/10), Aulas Virtuales [blog]
http://www.itch.edu.mx/academi Torre, Leticia de la. (2003). “Teoría
c/industrial/estadistica1/cap01.h del Muestreo”, Estadística I, Instituto
tml Tecnológico de Chihuahua
http://www.eumed.net/libros/200 Ávila Baray, Héctor Luis. (2006).
6c/203/2l.htm “Introducción a la Teoría del
Muestreo”, Introducción a la
metodología de la investigación.
http://www.ub.edu/aplica_infor/s Alea, V. “Pruebas para dos
pss/cap6-3.htm muestras relacionadas”, SPSS
Análisis de datos, Estadística,
Universidad de Barcelona
UNIDAD 2
DISTRIBUCIONES MUESTRALES
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno identificará e interpretará los diferentes
tipos de distribuciones muestrales.
INTRODUCCIÓN
La distribución de la población de la cual extraemos la muestra con la
que trabajamos en estadística es importante para saber qué tipo de
distribución debemos aplicar en cada una de las situaciones que se nos
presenten en la práctica; en esta unidad veremos algunas de estas
distribuciones que se encuentran relacionadas con la distribución normal,
además de observar la distribución muestral para la media y para la
proporción y su relación con el teorema central del límite.
56
Elige la respuesta correcta a las siguientes preguntas:
La distribución chi-cuadrada2 es útil para analizar la relación:
LO QUE SÉ
a) El investigador lo decide
b) cuando la desviación estándar de la población es desconocida
c) cuando no hay otra alternativa
N
1
( i )2
c) N x
n!
a) n rP
n r!
n!
b) n Cr
r! r)
(n !
nx
c) (X n P
x
F ) P )
(8 horas)
TEMARIO DETALLADO
p
x
n
ará
como
una
normal
con
media P
(la
verdade
ra
proporci
ón
poblacio
nal) y
desviaci
ón
estánda
En el ejemplo de la
comercializadora se tiene que
Pero
suponien
do que el
verdadero parámetro de la de éstas
población es P=0.30; es decir, distribucio
sólo el 30% de la población lo nes
compraría, entonces el muestrale
promedio s radica
_
en el
p que en este
estimará a P poblacional p
hecho de
pero con un error igual a caso
que en
es:
estadístic
a
inferencia
_
p l, las
En muestral tendrá distribución normal con media
este P=0.30 y inferencia
caso s sobre
poblacion
desviación estándar .
es se
hacen
Dado que todas las muestras
utilizando
aleatorias que sean tomadas
estadístic
de una misma población en
as
general serán distintas y
muestrale
tendrán por ende diferentes
s pues
valores para sus estadísticos
con el
tales como la media aritmética
análisis
o la desviación estándar,
de las
entonces resulta importante
distribucio
estudiar la distribución de
nes
todos los valores posibles de
asociadas
un estadístico, lo cual significa
con éstos
estudiar las distribuciones
estadístic
muestrales para diferentes
os se da
estadísticos (véase, Weimer,
la
1996, p. 353). La importancia
2.4. La distribución muestral de la
varianza
La varianza de las muestras sigue un proceso distinto a los de la media y
proporción. La causa es que el promedio de todas las varianzas de las
muestras no coincide con la varianza de la población s2. Se queda un
poco por debajo.
Error estándar
Es la desviación estándar de un estimador puntual.
N
El término n que se usa en las fórmulas de y cuando
x p
n
el factor de corrección para población finita siempre que N
0
.
Muestras pareadas
0
Muestras en las que con cada dato de una muestra se forman parejas
5
con el dato correspondiente.
Parámetro
Es una característica numérica de una población, tal como la media
aritmética poblacional, la desviación estándar poblacional o la proporción
poblacional.
Teorema del límite central
También conocido como teorema central del límite, es un teorema que
permite usar la distribución de probabilidad normal para aproximar la
_ _
distribución de muestra de x y p
cuando el tamaño de la muestra es
grande.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
Verdadera Falsa
1. El enunciado formal del teorema central del límite ( ) ( )
dice que si en cualquier población se seleccionan
muestras de un tamaño específico, la distribución
muestral de las medias de muestras es
aproximadamente una distribución normal y que
esta aproximación mejora con muestras de
mayor tamaño.
2. La conclusión del teorema central del límite es ( ) ( )
una de las conclusiones menos útiles en
estadística pues no permite razonar sobre la
distribución muestral de las medias de muestras
sin contar con información alguna sobre la forma
de la distribución original de la que se toma la
muestra.
3. El teorema central del límite permite aproximar la ( ) ( )
distribución de probabilidad normal a cualquier
distribución de valores medios muestrales,
siempre y cuando se trate de una muestra
suficientemente grande.
4. El teorema central del límite se aplica a la ( ) ( )
distribución muestral de las medias de muestras
y permite utilizar la distribución de probabilidad
normal para crear intervalos de confianza.
5. La media muestral es uno de los estadísticos ( ) ( )
más utilizados en estadística inferencial.
6. Para que un investigador pueda asignar un valor ( ) ( )
probabilístico a una media muestral, es
necesario que conozca la distribución muestral
de las medias.
Bibliografía sugerida
Bibliografía básica
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://recursostic.educacion.es/de García Cebrian, María José.
scartes/web/materiales_didacticos (2001). “Distribuciones
/inferencia_estadistica/distrib_mue muestrales”, Estadística,
strales.htm Descartes 2D, Matemáticas
interactivas.
http://www.ugr.es/~ramongs/labor Gutiérrez Sánchez, Ramón.
ales/tema6.pdf (2007). “Distribuciones
muestrales”, Curso de
Estadística, Diplomatura en
Laborales, Universidad de
Granada.
http://www.uoc.edu/in3/emath/doc Juan, Ángel A.; Sedano, Máximo,
s/Distrib_Muestrales.pdf Vila, Alicia. (2002).
“Distribuciones muestrales”,
Proyecto e-Math, UOC.
http://www.itch.edu.mx/academic/i Torre, Leticia de la. (2003).
ndustrial/estadistica1/cap01.html “Teoría del Muestreo”,
Estadística I, Instituto
Tecnológico de Chihuahua
UNIDAD 3
ESTIMACIÓN DE PARÁMETROS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno aprenderá los métodos de estimación de
parámetros y su interpretación.
INTRODUCCIÓN
En el momento de tomar decisiones el conocimiento de los parámetros
de población es de vital importancia, tal conocimiento generalmente solo
se puede tener al estimar el valor de dichos parámetros, sin embargo, la
estimación es mejor cuando se da un margen de confianza y uno de
error, siendo importante la correcta estimación de dichos parámetros a
través de la construcción de intervalos de confianza que puedan
sustentar la toma de decisiones de manera eficiente.
82
LO QUE SÉ
Elige la respuesta correcta a las siguientes preguntas.
La media de la distribución de las medias de las muestrasx siempre es
mayor que la de la población
menor que la de la población
igual a la de la población
2. La fórmula para la desviación estándar de la distribución de las
medias de las muestras para una población suficientemente grande es:
2 s 1 in
2 (x i x)
a) n1 i 1 2
x
b) n
x
c)
TEMARIO DETALLADO
(10 horas)
2
1 i n x)
s
2 2 ( i
nx -------------(2)
1 i1
Evidentemente, (1) y (2) son estimaciones de los parámetros para
distribuciones en las que tanto la media como la varianza aparecen
explícitamente como parámetros, tales como las distribuciones normal y
de Poisson. Aquí, podemos mencionar que (1) es un caso muy especial
del llamado método de los momentos, en la que los parámetros que van
a estimarse se expresan en términos de los momentos de la distribución
en las fórmulas resultantes (véase, Kreyszig, 2000[2], § 19.8); esos
momentos se reemplazan por los momentos correspondientes de la
muestra, lo cual proporciona las estimaciones deseadas.
Aquí, el k-ésimo momento de una muestra x1, x2,...xn, es:
1i n k
mk ( i)
nx
i1
B( )= - E( )
es el parámetro a
estimar. Existe pues un sesgo que será
ECM( )=
Z= =
superior de
=1
Ejemplo:
1.64 y como entonces el intervalo se deduce de:
Es decir aproximadamente entre el 3% y 17%.
Donde:
N = Total de la población
Z 2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
1 z 1
Como la distribución de las medias de las muestras (con media x y
1 x_x 1
x
Por y x por x
x
Se tiene que:
kz k -------------------------------------1
En términos generales, para encontrar un intervalo de cualquier
porcentaje de confianza, se hace lo siguiente:
6 6
1 x 6 3
69 9 6
.
9 1
6 .
9
6 7 . x 87 0.
1 6
varianza poblacional ( 2) es 3
S 2 ; sin embargo, para estimar un intervalo
3
de confianza para 2 es necesario conocer la distribución del estadístico;
. .
más aún, la metodología implica que es necesario tener un estadístico
5 5
que involucre el parámetro desconocido y que además tenga distribución
36
perfectamente conocida. Por lo cual, en este caso el estadístico es:
Ejemplo:
Considera el caso de estimar si no hay deficiencias en una máquina que
llena envases con capacidad de 500 ml.; para ello, se extrae una
muestra periódicamente; si la muestra indica que hay una variación de
±5 ml. alrededor de los 500 y con un nivel de confianza del 95%,
entonces se puede decir que el proceso está bajo control.
En este caso lo que importa es la variación en el llenado, pues el nivel
promedio de llenado se puede controlar programando la máquina. Por
ello, si la muestra arroja una variación arriba de 5 unidades, entonces el
proceso no estará bajo control.
( n2
X
2 0
.0
1 X
2 0
.9
RESUMEN DE LA UNIDAD
Las inferencias acerca de una población que se obtienen del estudio de
una muestra pueden ser tan buenas como lo sean las estimaciones
obtenidas, aquí, el cuidado va evidentemente sobre la recolección de los
datos, pues existe una gran variedad de estimadores que pueden ser
utilizados dependiendo del contexto pero el éxito de la aplicación de un
estimador (estimación) dependerá necesariamente de la calidad de los
datos mismos, resulta evidente que esto es extensible a los intervalos de
confianza tanto para la media como para proporciones.
Error muestral
Es el valor absoluto de la diferencia entre el valor de un estimador
_
Estimación de intervalo
Estimación de un parámetro de la población que define un intervalo
dentro del que se cree está contenido el valor del parámetro. Tiene la
forma de: Estimación puntual margen de error.
Grados de libertad
Es el número de observaciones independientes para una fuente de
variación menos el número de parámetros independientes estimado al
calcular la variación.
Margen de error
Es el valor sumado y restado a una estimación puntual a fin de
determinar un intervalo de confianza de un parámetro poblacional.
Nivel de confianza
Es la confianza asociada con una estimación de intervalo. Por ejemplo si
en un proceso de estimación de intervalo, el 90% de los intervalos
formados con este procedimiento contienen el valor del parámetro
buscado, se dice que éste es un intervalo de 90% de confianza.
Completa el siguiente cuadro sobre los tipos de estimadores.
ACTIVIDAD 1
ACTIVIDADES DE APRENDIZAJE
Ventajas Desventajas
Estimadores sesgados
Estimadores insesgados
Estimadores consistentes
Estimadores inconsistentes
ACTIVIDAD 2
ACTIVIDAD 3
El día de hoy la bolsa mexicana de valores estimó con una muestra de 20 acciones
que el promedio de las que estuvieron a la alza fue de
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
1. En este estimador su esperanza matemática es igual a parámetro en
cuestión:
a) robusto
b) insesgado
c) sesgado
Bibliografía básica
Sitios de Internet
Sitio Descripción
http://www.itescam.edu.mx/principal/ Fernández, Pita. (1996).
sylabus/fpdb/recursos/r53794.PDF “Determinación del tamaño
muestral”, Cad Aten
Primaria 1996; 3: 138-14,
actualizado 06/03/01
http://www.uv.es/ceaces/tex1t/4%20e Martínez de Lejarza
stimacion/estimacion.html#2.Propied Esparducer, Juan y otros.
ades%20de%20los%20Estimadores (2011). “Inferencia
estadística / Estimación
puntual / propiedades de los
estimadores”, Contenedor
Hipermedia de Estadística
Aplicada a las Ciencias
Económicas y sociales”,
(Proyecto CEACES),
Universidad de Valencia.
http://www.itch.edu.mx/academic/ind Torre, Leticia de la. (2003).
ustrial/estadistica1/cap01.html “Teoría del Muestreo”,
Estadística I, Instituto
Tecnológico de Chihuahua
UNIDAD 4
PRUEBAS DE HIPÓTESIS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno conocerá las pruebas de hipótesis y su
aplicación.
INTRODUCCIÓN
En esta unidad, el alumno investigará y analizará el concepto de prueba
de hipótesis y lo aplicará sobre varianzas, medias, etc.; ello le permitirá
percatarse de la importancia que tienen las pruebas de hipótesis para la
toma de decisiones dentro de las empresas.
118
Sabemos que cuando las personas toman decisiones, inevitablemente lo
hacen con base en las creencias que tienen en relación con el mundo
que los rodea; llevan en la mente una cierta imagen de la realidad,
piensan que algunas cosas son verdaderas y otras falsas y actúan en
consecuencia, así, los ejecutivos de empresas toman todos los días
decisiones de importancia crucial porque tienen ciertas creencias tales
como:
En todos estos casos, y en muchos más, las personas actúan con base
en alguna creencia sobre la realidad, la cual quizá llegó al mundo como
una simple conjetura, como un poco más que una suposición informada;
una proposición adelantada tentativamente como una verdad posible es
llamada hipótesis.
Sin embargo, tarde o temprano, toda hipótesis se enfrenta a la evidencia
que la comprueba o la rechaza y, en esta forma, la imagen de la realidad
cambia de mucha a poca incertidumbre.
Por lo tanto, de una manera sencilla podemos decir que una prueba de
hipótesis es un método sistemático de evaluar creencias tentativas sobre
la realidad, dicho método requiere de la confrontación de tales creencias
con evidencia real y decidir, en vista de esta evidencia, si dichas
creencias se pueden conservar como razonables o deben desecharse
por insostenibles.
xz
2 n
b) 2
zx
c) n
xz
2 n
a)
zx
n
TEMARIO DETALLADO
(10 horas)
Se dice que los valores numéricos del estadístico de prueba para los que
H0 es aceptada están en la región de aceptación y son considerados no
significativos estadísticamente.
Ejemplo
Incurrir en un riesgo α
Un fabricante de varillas de acero especial que son utilizadas en la
construcción de edificios muy altos ha contratado a un estadista para
que pruebe si sus varillas ciertamente tienen un promedio de resistencia
a la tensión de al menos 2000 libras ¿Cuáles son las implicaciones si el
nivel de significancia de la prueba de hipótesis se fija en: α = 0.08?
Solución:
Dadas las hipótesis: H0 :02000y H1 : 02000
Error Tipo II
En una prueba estadística, aceptar la hipótesis nula cuando es falsa se
denomina error tipo II. A la probabilidad de cometer un error de tipo II se
le asigna el símbolo (letra griega beta)
Ejemplo
Incurrir en un riesgo β
0 5
Dadas las hipótesis: H0 : y H1 :
0
0 5
0
Nivel de significancia
El nivel de significancia o significación es la probabilidad de cometer un
error tipo I, es decir, el valor que se le asigna a α.
Potencia de la prueba
Es posible determinar (Weimer, 1996, p. 461) la probabilidad asociada
con tomar una decisión correcta: no rechazar H 0 cuando es verdadera o
rechazarla cuando es falsa. La probabilidad de no rechazar H 0 cuando es
verdadera es igual a 1-.
Como
Pero
como:
P (no rechazar Ho cuando es falsa) =
Tenemos:
P (rechazar Ho cuando es falsa) = 1-
Símbolo de la Definición
probabilidad
Nivel de significancia. Probabilidad de un error tipo I
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
Cociente F
S12
F = ---------
S22
Donde:
S12 = Varianza de la muestra 1
S22 = Varianza de la muestra 2
RESUMEN DE LA UNIDAD
Las pruebas de hipótesis, como herramienta estadística, son importantes
porque nos indican el camino, al aceptar o desechar un hipótesis de
manera tentativa a favor de otra, sin embargo no aportan mayor
información; pero si apoyamos nuestra decisión con un intervalo de
confianza apropiado, podemos obtener datos que pueden ser
transformados en información y utilizarlos como sustento de una decisión
que generalmente en cualquier ámbito representa dinero. Evidentemente
se debe de tomar en consideración todos los errores posibles que se
puedan cometer durante el proceso, de donde nacen los errores tipo i y II
para las pruebas de hipótesis, además de la potencia de una prueba de
hipótesis para que nuestra opinión sea lo más certera posible.
GLOSARIO DE LA UNIDAD
Curva de la potencia de la prueba
Es la gráfica de la probabilidad de rechazar H 0 para todos los valores
posibles del parámetro poblacional que no satisfacen la hipótesis nula.
Error tipo I
Es el error que se comete al rechazar H0 cuando ésta es verdadera.
Error tipo II
Es el error que se comete al aceptar H0 cuando ésta es falsa.
Estadístico de prueba
Es el estadístico cuyo valor se utiliza para determinar si se rechaza una
hipótesis nula.
Potencia de la prueba
Es la probabilidad de rechazar correctamente H 0 cuando es falsa.
Región de rechazo
Es la zona de valores en la cual se rechaza la hipótesis H 0.
Valor crítico
Es un valor contra el cual se compara el obtenido en el estadístico de
prueba para determinar si se debe rechazar o no la hipótesis nula.
Valor p
Es la probabilidad de que, cuando la hipótesis nula sea verdadera, se
obtenga un resultado de una muestra que sea al menos tan improbable
como el que se observa. También se le conoce como nivel observado de
significancia.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
CUESTIONARIO DE
REFORZAMIENTO
LO QUE APRENDÍ
Elige un tipo de empresa comercial. Elabora una propuesta del
procedimiento general que se deberá realizarse para el desarrollo de un
software que lleve el control de sus ventas.
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://www.monografias.com/trabaj Cruz Ramírez, Armando Pedro.
os30/prueba-de-hipotesis/prueba- (2009). “Pruebas de hipótesis para
de-hipotesis.shtml una muestra”. Monografías
http://html.rincondelvago.com/anali Hereas, “Análisis de la varianza”,
sis-de-la-varianza_1.html Rincón del vago
http://www.mitecnologico.com/Main Mitecnológico, “Prueba hipótesis
/PruebaHipotesisParaProporcionYD para proporción y diferencia de
iferenciaDeProporciones proporciones”
http://www.mitecnologico.com/Main Mitecnológico (4.3.2) Prueba de
/PruebaDeHipotesisParaDiferencias hipótesis para diferencias de
DeMedias medias
http://html.rincondelvago.com/contr Muñoz, Gonzalo. (s/f). Contraste
aste-de-hipotesis_1.html de hipótesis. Rincón del vago.
http://www.itch.edu.mx/academic/in Torre, Leticia de la. (2003b). “Uso
dustrial/estadistica1/cap02c.html#u de valores P para la toma de
02usovaloresp decisiones”, Estadística I, Instituto
Tecnológico de Chihuahua
http://es.wikipedia.org/wiki/Contrast Wikipedia: “Contraste de hipótesis”,
e_de_hip%C3%B3tesis actualizado el 13/10/11
lc.fie.umich.mx/~jrincon/pruebas%2 Rincón Pasaye, José Juan. (2008)
0de%20hipotesis.ppt “Pruebas de hipótesis”,
Probabilidad y estadística,
[diapositivas] UMICH
www.cyta.com.ar/biblioteca/bddoc/ Ciencia y Técnica Administrativa.
bdlibros/guia_estadistica/modulo_9 (2005). “Módulo 9. Pruebas de
.htm hipótesis, muestras grandes”, Guía
de Estadísticas
http://www.geociencias.unam.mx/~r Zúñiga, F. Ramón. (2008). “Clase
amon/Estadistica/Clase5b.pdf 5. Pruebas de hipótesis”,
Estadística, Querétaro:
Geociencias, UNAM
http://uvigen.fcien.edu.uy/utem/gen “La prueba de Chi-cuadrado”,
men/06chi2.htm Genética Mendeliana, UVIGEN,
Universidad de la República,
Montevideo. (Traducción de
McClean, Phillip, 2000 *)
UNIDAD 5
INTRODUCCIÓN
En esta unidad, el alumno investigará y analizará el concepto de prueba
de hipótesis y lo aplicará sobre varianzas, medias, etc.; ello le permitirá
percatarse de la importancia que tienen las pruebas de hipótesis para la
toma de decisiones dentro de las empresas.
152
Sabemos que cuando las personas toman decisiones, inevitablemente lo
hacen con base en las creencias que tienen en relación con el mundo
que los rodea; llevan en la mente una cierta imagen de la realidad,
piensan que algunas cosas son verdaderas y otras falsas y actúan en
consecuencia, así, los ejecutivos de empresas toman todos los días
decisiones de importancia crucial porque tienen ciertas creencias tales
como:
En todos estos casos y en muchos más, las personas actúan con base
en alguna creencia sobre la realidad, la cual quizá llegó al mundo como
una simple conjetura, como un poco más que una suposición informada;
una proposición adelantada tentativamente como una verdad posible es
llamada hipótesis.
Sin embargo, tarde o temprano, toda hipótesis se enfrenta a la evidencia
que la comprueba o la rechaza y, en esta forma, la imagen de la realidad
cambia de mucha a poca incertidumbre.
Por lo tanto, de una manera sencilla podemos decir que una prueba de
hipótesis es un método sistemático de evaluar creencias tentativas sobre
la realidad, dicho método requiere de la confrontación de tales creencias
con evidencia real y decidir, en vista de esta evidencia, si dichas
creencias se pueden conservar como razonables o deben desecharse
por insostenibles.
2 s2
(
gl
)
2
2 s2
(n
1)
2
2
La distribución Chi-cuadrada ( ) es en sí toda una familia de
distribuciones por lo que, existe una distribución Chi-cuadrado para cada
grado de libertad.
s
2 2
s2 2 s(
(n 2
1 n1
) )
2 2
/2 1/ 2
Ejemplo
Supóngase que una muestra de 7 pernos especiales utilizados en el
ensamblado de computadoras portátiles arrojó los siguientes resultados:
2.10 mm; 2.00 mm, 1.90 mm, 1.97 mm, 1.98 mm, 2.01 mm, 2.05 mm
X 2 . 0 0
n 1i 1
por lo tanto:
2 1
s ( 0 . 0 2 3
89 )
7 1
00 3
0
4
1
( 71 )
2
59
(n
.
6
s2
2
6
,
5
.9
0
12
0
1 .63 5
0
3 8
4
71 )
2
tenemos que el intervalo de 90%
3
8
3
63
1 .
5
0 2
1
25
( 21
s n
2
.0
1
.0
1/ 2
)
Pasos
1. Arreglar las categorías y las frecuencias observadas.
2. Calcular los valores teóricos esperados para el modelo experimental
o tipo de distribución muestral: normal, binomial y de Poisson.
3. Calcular las diferencias de las frecuencias observadas en el
experimento con respecto a las frecuencias esperadas.
4. Elevar al cuadrado las diferencias y dividirlas entre los valores
esperados de cada categoría.
5. Efectuar la sumatoria de los valores calculados.
6. Calcular los grados de libertad (gl) en función de número de
categorías [K]: gl = K - 1.
7. Comparar el estadístico X2 con los valores de la distribución de ji
cuadrada en la tabla.
8. Decidir si se acepta o rechaza la hipótesis X2c ³ X2t se rechaza Ho.
No. deportista 31 22 53
69 31 100
Error tipo I
Es el error que se comete al rechazar H0 cuando ésta es verdadera.
Error tipo II
Es el error que se comete al aceptar H0 cuando ésta es falsa.
Estadístico de prueba
Es el estadístico cuyo valor se utiliza para determinar si se rechaza una
hipótesis nula.
Nivel de significancia
Es la probabilidad máxima de cometer un error tipo I.
Potencia de la prueba
Es la probabilidad de rechazar correctamente H0 cuando es falsa.
Región de rechazo
Es la zona de valores en la cual se rechaza la hipótesis H0.
Valor crítico
Es un valor contra el cual se compara el obtenido en el estadístico de
prueba para determinar si se debe rechazar o no la hipótesis nula.
Valor p
Es la probabilidad de que, cuando la hipótesis nula sea verdadera, se
obtenga un resultado de una muestra que sea al menos tan improbable
como el que se observa. También se le conoce como nivel observado de
significancia.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
LO QUE APRENDÍ
Elabora un mapa conceptual sobre los tipos de pruebas desarrolladas en
esta unidad.
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Sitios de Internet
Sitio Descripción
http://buzjss.blogspot.com/2008 Buzjss, “Estadística y apuestas
/10/la-distribucin-de-poisson- deportivas”, 16/10/08, [blog]
test-de.html
http://recursostic.educacion.es/ García Cebrian, María José. (2001).
descartes/web/materiales_didac “Distribuciones muestrales”,
ticos/distribuciones_probabilida Estadística y Probabilidad,
d/aplic_normal.htm Descartes 2D, Matemáticas
interactivas.
http://recursostic.educacion.es/ Martín Álvarez, Pablo Antonio.
descartes/web/materiales_didac (2001). “Ajuste de una serie de
ticos/Distribucion_binomial/bin datos a una distribución binomia”,
omial.htm La distribución nominal B (n, p),
Descartes 2D, Matemáticas
interactivas
http://www.mitecnologico.com/ Mitecnológico, “Prueba de hipótesis
Main/PruebaHipotesisParaProp para proporción”
orcion
http://www.mitecnologico.com/ Mitecnológico, “Prueba de bondad
Main/PruebaDeBondadDeAjuste de ajuste”
http://www.mitecnologico.com/ Mitecnológico, “Prueba de
Main/PruebaDeIndependencia independencia”
http://www.monografias.com/tra Pérez Leal, José. (2006). “Prueba
bajos15/prueba-de- de homogeneidad: Prueba de
independencia/prueba-de- independencia”, Monografías
independencia.shtml
http://html.rincondelvago.com/a “Prueba de la varianza con una
nalisis-de-la-varianza_1.html población”, Rincón del vago
UNIDAD 6
INTRODUCCIÓN
El uso de la regresión lineal simple es muy utilizado para observar el tipo
de relación que existe entre dos variables y poder llevar a cabo la toma de
decisiones correspondiente dependiendo de la relación entre dichas
variables, así por ejemplo, pudiera darse el caso en el que después de
aplicar la regresión lineal no exista relación entre las variables
involucradas y en consecuencia la decisión podría ser buscar cuál es la
variable independiente que tiene influencia sobre la dependiente y volver
a realizar el estudio completo; pero si fuera el caso en el cual si existiera
una relación positiva entre las variables involucradas, la obtención del
coeficiente de correlación nos daría más información sobre el porcentaje
de relación existente y pudiendo determinar si es necesario la inclusión de
otra variable independiente en el problema mismo, para lo cual el análisis
de regresión ya sería del tipo múltiple.
186
Elige la respuesta correcta a las siguientes preguntas.
Es una condición para determinar la ecuación de una recta:
conocer la pendiente de la ordenada al origen
LO QUE SÉ
(Barrios, 2005)
6.2. El método de mínimos
cuadrados
Cualquier método estadístico que busque establecer una ecuación que
permita estimar el valor desconocido de una variable, a partir del valor
conocido de una o más variables, se denomina análisis de regresión.
En la que:
xi = es un valor dado de la variable independiente para el cual se
quiere estimar el valor correspondiente de la variable
dependiente
b0 = ordenada al origen de la línea estimada de regresión,
b1 = pendiente de la línea estimada de regresión,
Ŷi = valor estimado de la variable dependiente, para el i-ésimo valor
de la variable independiente
n XY i i
i 1i 1
Xi
n
b1 i
1 Yi n
n
(X )
i
X 2
i 1
2i
i n
1
b0 Y b1
X
Antes de continuar, es necesario advertir que el análisis de regresión no
se puede interpretar como un procedimiento para establecer una relación
de causa a efecto entre variables. Sólo puede indicar cómo o hasta qué
grado las variables están asociadas entre sí. Cualquier conclusión acerca
de causa y efecto se debe basar en el juicio del o los individuos con más
conocimientos sobre la aplicación. Por ejemplo, un estadista puede llegar
a determinar que la relación entre las ventas y el presupuesto asignado a
mercadotecnia es positiva y que se tiene un coeficiente de correlación de
0.96, lo cual prácticamente nos indica que es recomendable incrementar
el presupuesto al departamento de mercadotecnia para obtener mejores
ingresos dentro de la compañía, sin embargo el director de operaciones
puede llegar a determinar que debido a condiciones internas del país en
el que se encuentre la empresa, o bien la aparición de una nueva ley que
regule los medios utilizados por el mencionado departamento de
mercadotecnia, pueden llegar a frenar o incluso generar conflictos dentro
de la empresa si incrementamos el presupuesto al departamento
correspondiente.
6.3. Determinación de la ecuación
de regresión
En estadística la regresión lineal o ajuste lineal es un método
matemático que modeliza la relación entre una variable dependiente Y,
las variables independientes Xi y un término aleatorio ε. Este modelo
puede expresarse como:
t 1 2 t Y = β + β X (2)
Como quiera que las relaciones del tipo anterior raramente son
exactas, sino que más bien son aproximaciones en las que se han
omitido muchas variables de importancia secundaria, debemos
incluir un término de perturbación aleatoria, t u , que refleja todos
los factores – distintos de X -que influyen sobre la variable
endógena, pero que ninguno de ellos es relevante
individualmente. Con ello, la relación quedaría de la siguiente
forma:
(Uriel, 2004, p. 1)
6.5. Inferencias estadísticas sobre
la pendiente de la recta de
regresión
y i
b0 b1 Xi
r (signodeb1 )r
2
GLOSARIO DE LA UNIDAD
Análisis de residuales
Análisis que se aplica para determinar si los supuestos acerca del modelo
de regresión parecen válidos. También se usa para determinar
observaciones extraordinarias o influyentes.
Coeficiente de correlación
Medida de la intensidad de la relación lineal entre dos variables.
Coeficiente de determinación
Medida de la bondad del ajuste de la recta de regresión. Se interpreta
como la parte de la variación de la variable dependiente “y” que explica la
recta de regresión.
Diagrama de dispersión
Gráfica de datos de dos variables en la que la variable independiente está
en el eje horizontal y la variable dependiente en el eje vertical.
yiyi
es minimizar
Observación influyente
Observación que tiene una fuerte influencia sobre el efecto de los
resultados de la regresión.
Recta de regresión
Estimación hecha a partir de datos de una muestra aplicando el método
de mínimos cuadrados para la regresión lineal simple, la ecuación de
b0
Variable dependiente
Es la variable que se predice o se explica. Se representa
matemáticamente por “y”.
Variable independiente
Es la variable que sirve para predecir o explicar. Se representa
matemáticamente por “x”.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24.3 12.5 31.2 28 35.1 10.5 23.2 10 8.5 15.9 14.7 15
Consumo 16.2 8.5 15 17 24.2 11.2 15 7.1 3.5 11.5 10.7 9.2
Sueldo
del 18.0 15.0 19.0 9.2 8.6 12.0 10.7 14.3 17.8 16.0 15.0
cliente
Gastos
del 14.8 10.4 15.7 7.1 5.3 8.0 8.5 10.2 13.0 14.0 11.3
cliente
Nota: tanto el sueldo como los gastos del cliente son mensuales y están
dados en miles de pesos.
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Sitios de Internet
Sitio Descripción
http://recursostic.educacion.es/ Barrios Calmaestra, Luis. (2005).
descartes/web/materiales_didac “Regresión lineal”, Estadísticas II,
ticos/bidimensional_lbarrios/reg Distribuciones bidimensionales.
resion_est.htm Descartes 2D Matemáticas
interactivas.
http://www.uv.es/uriel/material/ Uriel Jiménez, Ezequiel. (2004).
Morelisi.pdf Modelos de regresión lineal
simple, UV.
UNIDAD 7
INTRODUCCIÓN
Una serie de tiempo es el conjunto de datos que se registran a través del
tiempo sobre el comportamiento de una variable de interés, generalmente
los registros se realizan en periodos iguales de tiempo.
210
LO QUE SÉ
De esta manera, el objetivo principal del conocimiento de las series de
nn
n XiYi
i 1i 1
XiYi
b1 i 1 n
n
n
(X ) 2
i
Xi i 1
b) i1 2 n
c) y b0 b 1 Xi
i
regresión es:
a) b0 Yb1 X
nn
n XiYi
i 1i 1
XiYi
b1 i 1 n
n
n i
(X ) 2
Xi i 1
b) i1 2 n
c) y b0 b 1 Xi
i
4. La fórmula para calcular el coeficiente de determinación es:
n_
(YY)2
i 1
a) r n _
( Y i)
i1 Y 2
n_
( YY
b) r 2signo deb 1 n
)
i 12
_
( Y i)
i1 Y 2
n_
( YY
r
2
i 12)
n _
( Y
c) i1
Y i) 2
La fórmula para calcular el coeficiente de correlación es:
r( signo de b ) r2
1
(signo de b ) r2
b) r 0
n_
( YY
c) r 2 signo deb 0 n
)
i 12
_
( Y i)
i1 Y 2
6. ¿Cuál es el rango de los valores que puede tomar el coeficiente de
determinación?
a),
b) 1 1
c)0 , 1
7. ¿Cuál es el rango de los valores que puede tomar el coeficiente de correlación?
a), ,
b) 1 ,1
c)0 , 1
TEMARIO DETALLADO
(8 horas)
Estacionalidad (E)
La componente estacional muestra un comportamiento regular en los
mismos periodos de tiempo, reflejando costumbres o modas que se
repiten regularmente dentro del periodo de observación. En la gráfica la
estacionalidad quedaría representada por ejemplo por las variaciones
semanales en los rendimientos, no visibles por el periodo de información
que se está manejando.
Rendimiento %
14
12
10
0
1 2 3 4 5 6 7 8 9 1 11 1 1 1 15 1 17
Trimestre
En donde:
Yt tasa de rendimiento calculada
X tiempo, en este caso expresado en trimestres
bo valor de Y cuando el valor del tiempo es cero
b1 pendiente de la recta de tendencia
Una vez definido el modelo, se procede a la determinación de los valores
de los coeficientes bo y b1 de la recta de regresión. En nuestro problema
en particular, la ecuación de regresión, que representa a la tendencia del
comportamiento de la tasa de rendimiento de los CETES a 90 días
aplicando las fórmulas correspondientes para el cálculo primero de “b 1”
n n
n XiYi
i1 i1
XiYi
b1 i 1 n
n
n
(X ) 2
i
X
2
i 1
i
i1 n
b0 Y b1
X
es:
Yt = 10.8553676 - 0.44595588 X
(i Y
i )
r2 1 y 2
n
(i
i
1
Y
Y)
2
r ( signodeb1 ) r
2
Tenemos que el valor del coeficiente de correlación es de r = -0.8078, lo
que nos indica que el ajuste logrado con la recta de regresión es
adecuado, recordemos que el coeficiente de correlación es una medida
de la precisión lograda en el ajuste, valores del coeficiente de correlación
iguales a +1 ó -1 son la indicación de un ajuste perfecto, un valor igual a
cero nos dirá que este no existe. (nota: se deja al estudiante corroborar
los valores obtenidos de “b1”, “b0” y “r”)
14
Tendencia de la tasa
Comportamiento realde
derendimiento
12
10
Rendimiento en %
Tasa real
Tendencia
8
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
Supongamos ahora que nos interesa conocer la variación que han tenido
los rendimientos respecto de la tendencia, es decir la componente cíclica,
la cual queda representada en la gráfica (Gráfica de apreciación de la
componente cíclica de los CETES a 90 días) por los valores mayores y
menores respecto de la tendencia. Si deseamos conocer el valor
numérico de este comportamiento debemos proceder como sigue:
150
Componente cíclica
140
Línea de tendencia
130
120
Porcentaje
110
100
90
80
70
60
50
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
( C) ( )E( )
T) ( I
I
( C) ( )E
T
)(
Rendimiento Componentes
Trimestre Real tendencia cíclica temporal Irregular
Yc C E I
1 14.03 10.41 134.78 96.52 103.61
2 10.69 9.96 107.29 100.96 99.05
3 8.63 9.52 90.68 91.46 109.34
4 9.58 9.07 105.60 95.98 104.19
5 7.48 8.63 86.72 96.52 103.61
6 5.98 8.18 73.11 100.96 99.05
7 5.82 7.73 75.26 91.46 109.34
8 6.69 7.29 91.80 95.98 104.19
9 8.12 6.84 118.68 96.52 103.61
10 7.51 6.40 117.42 100.96 99.05
11 5.42 5.95 91.09 91.46 109.34
12 3.45 5.50 62.68 95.98 104.19
13 3.02 5.06 59.71 96.52 103.61
14 4.29 4.61 93.02 100.96 99.05
15 5.51 4.17 132.26 91.46 109.34
16 5.02 3.72 134.94 95.98 104.19
17 5.07 3.27 154.85
Cálculo de la componente irregular
160
Cícli
ca
Irregu
140 lar
Estacio Tenden
nal cia
120
Porcentaje
100
80
60
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
Componente estacional
Componente del modelo de una serie de tiempo que muestra un patrón
periódico de un año o menos.
Componente irregular
Componente del modelo de una serie de tiempo que refleja la variación
aleatoria de los valores de la serie de tiempo, adicionales a los que se
pueden explicar con los componentes de tendencia, cíclico y estacional.
Constante de suavizamiento
Parámetro del modelo de suavizamiento exponencial, con el que se
calcula el factor de ponderación asignado al valor más reciente de la serie
de tiempo en el cálculo del valor del pronóstico.
Elaboración de escenarios
Método cualitativo de pronóstico que consiste en formar un escenario
conceptual del futuro, basado en un conjunto bien definido de supuestos.
Error cuadrático medio
Es un método con el que se mide la precisión de un modelo de
pronóstico. Es el promedio de la suma de las diferencias entre los valores
pronosticados y los valores reales de la serie de tiempo estando elevadas
al cuadrado esas diferencias.
Modelo auto-regresivos
Modelo de serie de tiempo donde se usa una relación de regresión
basada en valores anteriores de la serie para predecir valores futuros de
la misma.
Promedios móviles
Método de pronóstico o suavizamiento de una serie de tiempo, en el que
se promedia cada grupo sucesivo de puntos de datos.
Promedios móviles ponderados
Método de pronóstico o suavizamiento de una serie de tiempo con el que
se calcula un promedio ponderado de los valores de datos en el pasado.
La suma de los factores de ponderación debe ser igual a uno.
Pronóstico
Proyección o predicción de valores futuros de una serie de tiempo.
Serie de tiempo
Es un conjunto de observaciones medidas en puntos sucesivos en el
tiempo, o durante periodos sucesivos en el tiempo.
Suavizamiento exponencial
Técnica de pronóstico que emplea un promedio ponderado de una serie
de tiempo en el pasado para determinar valores de una serie de tiempo
suavizada, que se pueden usar para elaborar pronósticos.
Tendencia
Desplazamiento o movimiento de la serie de tiempo, a largo plazo,
observable a través de varios periodos.
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
Elabora un cuadro comparativo de lo que representa cada una de las
cuatro componentes de una serie de tiempo.
Representa
Componente de
tendencia
Componente cíclica
Componente de
estacionalidad
Componente irregular
ACTIVIDAD 2
Elabora un resumen de la forma en que se separa la componente de
tendencia en una serie de tiempo.
CUESTIONARIO DE
REFORZAMIENTO
y c)
a) i
b0
Y1
c
00
b)
Y
C
TE I
Yt
b1 Xi
4. En el cálculo de la componente cíclica para cada valor real, debemos
auxiliarnos con la ecuación:
a) de la recta de regresión
b) del modelo multiplicativo de una serie de tiempo
c) de tendencia de la serie de tiempo.
( T) ( C) ( ) E( ) I
( E) ()I
6. En la expresión ( T obtenida a partir del
)(
C)
modelo multiplicativo de una serie de tiempo, el resultado contiene:
a) los efectos estacionales, junto con las fluctuaciones irregulares.
b) la tendencia, junto con las fluctuaciones irregulares.
c) solo las fluctuaciones irregulares.
Bibliografía básica
Bibliografía complementaria
240
Garza, Tomás. (1996). Probabilidad y estadística. México:
Iberoamericana.
Sitios de Internet
Sitio Descripción
http://ciberconta.unizar.es/LECC Arellano, M. (2001): "Introducción al
ION/seriest/100.HTM Análisis Clásico de Series de
Tiempo", [en línea] 5campus.com,
Estadística
http://maxsilva.bligoo.com/cont Silva Quiroz, Maximiliano. (2008).
ent/view/186499/Series-de- “Series de tiempo”, Estadística y
Tiempo.html empresa (13/05/08)
http://ciberconta.unizar.es/LECC Arellano, Mireya. (2001).
ION/seriest/inicio.html “Introducción al análisis clásico de
series de tiempo”, 5campus,com.
Estadística
http://www.eumed.net/cursecon/ Ruíz Muñoz, David. (2004). “Series
libreria/drm/1n.htm temporales: Determinación de las
variaciones estacionales”. Manual
de estadística. EUMED.
UNIDAD 8
PRUEBAS ESTADÍSTICAS NO
PARAMÉTRICAS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno identificará las pruebas no paramétricas
más utilizadas.
INTRODUCCIÓN
En esta unidad se revisarán las pruebas no paramétricas y su utilidad
sobre todo cuando no se conoce la distribución de la cual provienen los
datos, lo cual impide hacer una estimación por intervalos de confianza o
una prueba de hipótesis.
243
La prueba de signos y rangos de Wilcoxon utilizada como una alternativa
no paramétrica cuando se trata de comparar los datos de 2 poblaciones o
de una misma población mediante una muestra apareada. Y la prueba de
los rangos con signo que usa los rangos de los valores absolutos de las
diferencias pareadas.
LO QUE SÉ
Elige la respuesta correcta a la siguiente pregunta:
La fórmula del estadístico “z” es:
fk
2
o
i1
a) z n
fe
zx
b)
k
( f
c) z f ) 2 fe
oe
i1
TEMARIO DETALLADO
(6 horas)
n1
Si el número de datos en 2 categorías y son mayores que 20, la
n2
distribución de muestreo para “r” se aproxima a una distribución normal.
n n1 n
Desviación estándar: 1 n2
n 1
2
rr
z n n1
1
Estadístico de prueba: r
rr
z
Estadístico de prueba: r
2 2
1 15 0
r
nn1 1 n2 5
La media es: .
n2 2 4
9
8
2
La desviación estándar:
5
2 1 2 2 5 5 4
24 2
r
n1 n2 2n n12 n n 24 8552 424
8 4.
8 8 81
2 1 1 2
n
n2 n 52
2
n1 2
4
8
2
6 74 .
97
r rr 4 2
z
Por lo tanto: 05 .
0 2
Nivel de significación: 0
zc
por lo que 2 .5 ya que es una
0 .0
. 8
z 1
prueba de 2 colas. Como zc
cae en la zona de
9 aceptación se puede
concluir que no hay evidencia suficiente para rechazar la hipótesis nula,
2
.
9
7
La prueba de los rangos con signo usa los rangos de los valores
absolutos de las diferencias pareadas, asignando el rango 1 a la
diferencia con valor absoluto mínimo, el rango 2 a la siguiente diferencia
con menor valor absoluto y así se procede sucesivamente. Se deben
descartar los rangos con diferencias de cero y en caso de valores
absolutos repetidos, a cada uno de ellos se les otorga el valor promedio
de los rangos ocupados por los valores repetidos. A cada uno de los
rangos positivos o negativos, se les asocia el signo correspondiente.
La suma de los rangos positivos se indica por T , la suma de los rangos
S n
La suma de los rangos es: 2 n1 y deberá ser igual a T
T
Las fórmulas de la media y desviación estándar de la distribución muestral
“T” son las siguientes:
n
Media:
T n
1
4
T
n n1¨
2n
Desviación estándar: 1
TT 2
z
4
y el estadístico de prueba es: T .
Por lo tanto T 2 2 5
.
5
La hipótesis por probar son:
Ho: No hay diferencia significativa debido al tratamiento.
Ha: Hay diferencia significativa por el tratamiento
TT
z
Estadístico de prueba: T
n 2
n1 1
T 2
La media es: 2
4 2
6
.
5
3
4
T
n n12
2 2 3
La desviación estándar: n 1 2
2 0
z T TT
2 3
2 .
Por lo tanto: 1
5. .
0 .0 zc 2 . 3 2
Nivel de significación:
1 por lo que 51
2 3 9
z zc 6
Como cae en la zona de rechazo, se puede concluir que el
.5 3
programa de capacitación de cómputo en esta empresa sí 4 mejoró las
30
3
habilidades del personal. .
24
4
1
RESUMEN DE LA UNIDAD
En esta unidad se revisaron las pruebas no paramétricas más utilizadas,
cuando no se conoce la distribución de la cual provienen los datos, como
se pudo observar, las pruebas no paramétricas resultan más accesibles
de realizar y comprender ya que no requieren mediciones más exactas de
parámetros poblacionales.
Prueba de signo
Prueba estadística no paramétrica que permite identificar diferencias entre
dos poblaciones basándose en el análisis de datos nominales.
LO QUE APRENDÍ
Explica la diferencia entre una prueba estadística paramétrica y una
prueba estadística no paramétrica.
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Sitio Descripción
http://www.itch.edu.mx/academic/indus Torre, Leticia, de la. (2003)
trial/estadistica1/cap04.html “Pruebas chi-cuadrada y
estadística no paramétrica”,
Curso de Estadística I,
Instituto Tecnológico de
Chihuahua.
http://scientific-european-federation- Scientific European
osteopaths.org/es/prueba-estadisticas Federation of Osteopaths.
(2012). “Las pruebas
estadísticas” Metodología de
la investigación científica.
http://www.uclm.es/actividades0708/cur Sánchez Sánchez, Fco.
sos/estadistica/pdf/descargas/SPSS_Pr (2008). “SPSS Pruebas no
uebasNoParametricas.pdf paramétricas”, Curso de
Estadística avanzada, UCLM,
http://scientific-european-federation- Scientific European
osteopaths.org/es/test-estadisticos Federation of Osteopaths.
(2012). “Los test estadísticos”
Metodología de
la
investigación científica.