Estadistica Apli Unam PDF
Estadistica Apli Unam PDF
Estadistica Apli Unam PDF
ESTADÍSTICA II
Plan 2012
Clave: Créditos: 8
Licenciatura: CONTADURÍA Semestre: 3º
Área: Matemáticas Horas asesoría:
Requisitos: Estadística I Horas por semana: 4
Tipo de asignatura: Obligatoria ( X ) Optativa ( )
AUTOR
ELISEO FLORES ALAMILLA
ADAPTACIÓN EN LÍNEA
ELISEO FLORES ALAMILLA
2
INTRODUCCIÓN AL
MATERIAL DE ESTUDIO
Las modalidades abierta y a distancia (SUAYED) son alternativas que
pretenden responder a la demanda creciente de educación superior,
sobre todo, de quienes no pueden estudiar en un sistema presencial.
Actualmente, señala Sandra Rocha (2006):
3
Mantener la motivación y superar las dificultades inherentes a la
licenciatura.
Asumir su nuevo papel de estudiante y compaginarlo con otros
roles familiares o laborales.
Afrontar los cambios que puedan producirse como consecuencia
de las modificaciones de sus actitudes y valores, en la medida
que se adentre en las situaciones y oportunidades propias de su
nueva situación de estudiante.
Desarrollar estrategias de aprendizaje independientes para que
pueda controlar sus avances.
Ser autodidacta. Aunque apoyado en asesorías, su aprendizaje es
individual y requiere dedicación y estudio. Acompañado en todo
momento por su asesor, debe organizar y construir su
aprendizaje.
Administrar el tiempo y distribuirlo adecuadamente entre las
tareas cotidianas y el estudio.
Tener disciplina, perseverancia y orden.
Ser capaz de tomar decisiones y establecer metas y objetivos.
Mostrar interés real por la disciplina que se estudia, estar
motivado para alcanzar las metas y mantener una actitud
dinámica y crítica, pero abierta y flexible.
Aplicar diversas técnicas de estudio. Atender la retroalimentación
del asesor; cultivar al máximo el hábito de lectura; elaborar
resúmenes, mapas conceptuales, cuestionarios, cuadros
sinópticos, etcétera; presentar trabajos escritos de calidad en
contenido, análisis y reflexión; hacer guías de estudio; preparar
exámenes; y aprovechar los diversos recursos de la modalidad.
4
metodología; tener habilidad en la búsqueda de información en
bibliotecas virtuales; y manejar el sistema operativo Windows,
paquetería, correo electrónico, foros de discusión, chats, blogs, wikis,
etcétera.
5
Objetivo específico de la unidad.
Contenidos.
Actividades de aprendizaje y/o evaluación. Tienen como propósito
contribuir en el proceso enseñanza-aprendizaje facilitando el
afianzamiento de los contenidos esenciales. Una función
importante de estas actividades es la retroalimentación: el asesor
no se limita a valorar el trabajo realizado, sino que además
añade comentarios, explicaciones y orientación.
Ejercicios y cuestionarios complementarios o de reforzamiento. Su
finalidad es consolidar el aprendizaje del estudiante.
Ejercicios de autoevaluación. Al término de cada unidad hay
ejercicios de autoevaluación cuya utilidad, al igual que las
actividades de aprendizaje, es afianzar los contenidos
principales. También le permiten al estudiante calificarse él
mismo cotejando su resultado con las respuestas que vienen al
final, y así podrá valorar si ya aprendió lo suficiente para
presentar el examen correspondiente. Para que la
autoevaluación cumpla su objeto, es importante no adelantarse a
revisar las respuestas antes de realizar la autoevaluación; y no
reducir su resolución a una mera actividad mental, sino que debe
registrarse por escrito, labor que facilita aún más el aprendizaje.
Por último, la diferencia entre las actividades de autoevaluación y
las de aprendizaje es que éstas, como son corregidas por el
asesor, fomentan la creatividad, reflexión y valoración crítica, ya
que suponen mayor elaboración y conllevan respuestas abiertas.
3. Resumen por unidad.
4. Glosario de términos.
5. Fuentes de consulta básica y complementaria. Mesografía,
bibliografía, hemerografía, sitios web, entre otros, considerados tanto
en el programa oficial de la asignatura como los sugeridos por los
profesores.
6
Esperamos que este material cumpla con su cometido, te apoye y
oriente en el avance de tu aprendizaje.
Recomendaciones (orientación
para el estudio independiente):
Lee cuidadosamente la introducción a la asignatura, en ella se
explica la importancia del curso.
Revisa detenidamente los objetivos de aprendizaje (general y
específico por unidad), en donde se te indican los conocimientos y
habilidades que deberás adquirir al finalizar el curso.
Estudia cada tema siguiendo los contenidos y lecturas sugeridos
por tu asesor, y desarrolla las actividades de aprendizaje. Así
podrás aplicar la teoría y ejercitarás tu capacidad crítica, reflexiva
y analítica.
Al iniciar la lectura de los temas, identifica las ideas, conceptos,
argumentos, hechos y conclusiones, esto facilitará la comprensión
de los contenidos y la realización de las actividades de
aprendizaje.
Lee de manera atenta los textos y mantén una actitud activa y de
diálogo respecto a su contenido. Elabora una síntesis que te
ayude a fijar los conceptos esenciales de lo que vas aprendiendo.
Debido a que la educación abierta y a distancia está sustentada
en un principio de autoenseñanza (autodisciplina), es
recomendable diseñar desde el inicio un plan de trabajo para
7
puntualizar tiempos, ritmos, horarios, alcance y avance de cada
asignatura, y recursos.
Escribe tus dudas, comentarios u observaciones para aclararlas
en la asesoría presencial o a distancia (foro, chat, correo
electrónico, etcétera).
Consulta al asesor sobre cualquier interrogante por mínima que
sea.
Revisa detenidamente el plan de trabajo elaborado por tu asesor y
sigue las indicaciones del mismo.
8
TEMARIO OFICIAL
(64 HORAS)
Horas
1. Introducción al muestreo 4
2. Distribuciones muestrales 8
3. Estimación de parámetros 10
4. Pruebas de hipótesis 10
5. Pruebas de hipótesis con la distribución ji
8
cuadrada
6. Análisis de regresión lineal simple 10
7. Análisis de series de tiempo 8
8. Pruebas estadísticas no paramétricas 6
9
INTRODUCCIÓN
En esta asignatura el estudiante dará continuación al curso previo de
Estadística I. Observando la importancia que tiene el aprenderla, así:
10
En la unidad 6 investigará el análisis de regresión lineal simple para
averiguar el comportamiento de las variables y sus diferentes relaciones.
11
OBJETIVO GENERAL
El alumno inferirá las características de una población, con base en la
información contenida y contrastará diversas pruebas para la toma de
decisiones.
12
ESTRUCTURA CONCEPTUAL
13
UNIDAD 1
INTRODUCCIÓN AL MUESTREO
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno reconocerá los diferentes tipos de
muestreo y sus características.
15
INTRODUCCIÓN
La teoría del muestreo es útil en numerosas ocasiones y en diferentes
campos de la ciencia, sobre todo cuando no se cuenta con los recursos
necesarios para hacer un censo (tiempo y dinero) o cuando no es
necesario o recomendable hacer un estudio completo de toda la
población de interés. Sin embargo, el no hacer el estudio completo, no
significa de ninguna manera que el estudio no sea importante, pues
extraer una muestra que sea representativa de una población y hacer
inferencias que sean correctas de la población basándose en los datos
arrojados por la muestra, es todo un proceso que debe ser
cuidadosamente diseñado y elaborado; desde el objetivo del muestreo,
tamaño de la muestra, técnica de muestreo a emplear, homogeneidad de
la población, hasta las inferencias obtenidas al termino del estudio
apoyadas en la teoría de la estimación. Cabe aclarar que es imposible
que una sola persona logre tal estudio completo y que una gran cantidad
de expertos en diferentes campos se ve involucrada en tales estudios.
Tales expertos incluyen no solo a los expertos en estadística, en
mercados, en el giro mismo al que se esté dirigiendo el estudio, etc.
16
LO QUE SÉ
Selecciona si las siguientes aseveraciones son verdaderas (V) o falsas
(F).
Verdadera Falsa
1. El siguiente es un axioma de probabilidad, ( ) ( )
“La probabilidad de un hecho existe y es
restringida a la amplitud de cero a uno,
inclusive. Es decir, si designamos la
probabilidad de un hecho E como
P(E), entonces: 0 P( E ) 1 ”.
2. La siguiente es una propiedad de los ( ) ( )
logaritmos:
log a u n n log a u
17
6. La derivada de una función es el límite del ( ) ( )
incremento de la función al incremento de la
variable independiente cuando este último
tiende a cero.
7. Una función matemática es una regla que ( ) ( )
asigna a cada elemento de un conjunto “A”
uno y solo un elemento de un conjunto “B”.
18
TEMARIO DETALLADO
(4 horas)
19
1.1. Parámetros, estadísticos y
estimadores
La teoría del muestreo estudia la relación entre una población y las
muestras tomadas de ella; es decir, se utiliza para estimar magnitudes
desconocidas de una población —tales como valores promedio y de
dispersión, llamadas a menudo parámetros de la población o simplemente
parámetros— a partir del conocimiento de esas magnitudes sobre
muestras, que se llaman estadísticos de la muestra o simplemente
estadísticos.
20
1.2. Estimación de parámetros y
pruebas de hipótesis
Desde un punto de vista práctico, es muy importante ser capaz de inferir
información sobre una población a partir de muestras suyas. Con tal
situación se enfrenta la inferencia estadística, que usa los principios de
la teoría del muestreo.
Hay varias razones por las que se quiere utilizar un estimador de máxima
verosimilitud para un parámetro; aunque dichos estimadores no siempre
son eficientes e insesgados, por lo general son la mejor opción que se
tiene debido a las siguientes propiedades:
21
A medida que se incrementa el tamaño muestral, el sesgo del
estimador de máxima verosimilitud tiende a cero.
Su error estándar se aproxima al mínimo error estándar posible.
Su distribución muestral se aproxima a la normal.
Función de verosimilitud
Si denotamos a la función de verosimilitud con la letra “L” y la definimos
como la probabilidad de observar los datos tomados de manera
independiente de una variable aleatoria cualquiera, entonces dicha
función de verosimilitud tendrá la forma siguiente:
L(y1,y2,…,yn, a) = P(y1)P(y2)…P(yn)
L(y1,y2,…,yn, a) = f(y1)f(y2)…f(yn)
22
cada uno de los datos y multiplicando la función por sí misma para cada
uno de los casos.
Primer paso
Debemos escribir la fórmula básica de la cual se parte y debemos
identificar exhaustivamente todas sus variables; en este caso, la fórmula
corresponde a una distribución de Poisson; por lo tanto, recordando que
la distribución de Poisson es discreta con:
Segundo paso
Sustituir los valores o datos dados por el problema en la fórmula original,
considerando la teoría de la función de verosimilitud. Los valores
observados son y1=1 e y2=4; por lo tanto, la función de verosimilitud
estará formada por el producto para cada uno de los datos de la fórmula
misma.
23
Es decir:
Tercer paso
Realizar las operaciones algebraicas correspondientes a la reducción de
la fórmula, lo cual quiere decir que finalmente la fórmula anterior se
puede reducir a:
24
La idea básica (Kreyszig, 1990 [2], p. 959) del método de máxima
verosimilitud es muy sencilla.
Se escribe una derivada parcial debido a que “L” también depende de:
por:
1
En virtud de que el logaritmo natural es una función creciente, a medida que la
verosimilitud se incrementa hacia su máximo, también lo hace su logaritmo.
25
En principio se debería utilizar el criterio de la segunda derivada para
asegurarse de que lo que se obtiene es un máximo y no un mínimo. No
obstante, es muy claro que la solución de la ecuación correspondiente a la
primera derivada produce un estimador de máxima verosimilitud y no un
mínimo.
y en lugar de tenemos:
26
siguiente manera:
27
tenemos que:
28
Realizar operaciones correspondientes a la
Sexto paso
teoría de derivación.
29
Si quisiéramos estimar el parámetro , entonces debemos calcular el
primer momento poblacional e igualarlo con el primer momento muestral,
a saber:
30
; asimismo se puede calcular la mediana,
moda, varianza, entre otras características.
31
todo ello es esencial para un entendimiento adecuado del desarrollo
riguroso de la teoría del muestreo.
32
agrupada en segmentos de diferentes tamaños, entonces la muestra
puede no ser representativa de la población, debido a que si uno de los
segmentos de la población es muy pequeño entonces cabe la posibilidad
de que ninguno de sus elementos pueda ser incluido en la muestra y en
consecuencia no ser tomado en cuenta.
33
extraemos una muestra de las unidades primarias (para lo cual debemos
tener la lista completa de estas unidades) y en segundo lugar extraemos
aleatoriamente una muestra de unidades secundarias de cada una de
las primarias seleccionadas en la primera extracción.
34
1.6. Tipos de muestreo aleatorio
Muestreo aleatorio sistemático
Aclaremos esto observando que el procedimiento en este tipo de
muestreo: se acomodan los elementos o personas de la población de
forma ascendente de preferencia y se selecciona un punto de partida
aleatorio y luego se toma cada k-esimo miembro para formar la muestra.
Del muestreo aleatorio simple puede ser difícil en ciertos casos. Por
ejemplo, suponga que la población que nos interesa consiste de 2000
facturas que se localizan en cajones. Tomar una muestra aleatoria
sencilla requeriría primero numerar las facturas, del 0001 al 1999;
posteriormente, se seleccionaría luego una muestra de, por ejemplo, 100
números utilizando una tabla de números aleatorios; luego, en los
cajones deberá localizarse una factura que concuerde con cada uno de
estos 100 números; en fin, esta tarea puede requerir mucho tiempo. En
lugar de ello, se podría seleccionar una muestra aleatoria sistemática
utilizando el siguiente método: se recorren simplemente los cajones y se
cuentan las facturas; finalmente, se toman las que coincidan con el
número 20 para su estudio. Así, la primera factura debería elegirse
utilizando un proceso aleatorio, por ejemplo, una tabla de números
aleatorios. Si se eligió la décima factura como punto de partida, la
muestra consistiría en las facturas décima, trigésima, quincuagésima,
septuagésima, etcétera. Debido a que el primer número se elige al azar,
todos tienen la misma probabilidad de seleccionarse para la muestra.
Por lo tanto, se trata de un muestreo cuasi-aleatorio. La ventaja para
35
este tipo de muestreo sería que es más rápido que un muestreo aleatorio
formal y su desventaja es que puede no reflejar información importante
contenida en el conjunto de datos debido a que no todos los elementos
estrictamente hablados, tienen la misma oportunidad de ser
seleccionados.
Ejemplo
Los gastos en mercadotecnia de las 352 empresas mexicanas más
grandes seleccionadas por la revista Fortune. Supóngase que el objetivo
de estudio consiste en determinar si las empresas con altos rendimientos
sobre su inversión (una medición de la rentabilidad) han gastado una
mayor proporción de su presupuesto de ventas en mercadotecnia que
las empresas que tienen un menor rendimiento o incluso un déficit.
36
# #
Estrato Rentabilidad ?
empresas muestreado
2 De 20 a 30% 35 5 (35/352)(50)
5 Déficit 5 1 (5/352)(50)
Total 352 50
37
Muestreo por conglomerados
Otro tipo de muestreo que es común es el muestreo por conglomerados.
Se entiende como conglomerado de elementos de una población, a
cualquier subconjunto de la misma, que se defina como tal, es decir, como
un conglomerado. (Lind, Marchal & Mason, 2004, p. 227)
Tamaño de la muestra
Para la determinación del tamaño de la muestra se requiere tomar en
consideración la mayor cantidad posible de los siguientes elementos.
38
1. Tamaño del universo.
2. Tasa de error esperada.
3. Homogeneidad-heterogeneidad del fenómeno.
4. Precisión o margen de error.
5. Exactitud o nivel de confianza.
6. Número de estratos.
7. Etapas de muestreo.
8. Conglomeración de unidades.
9. Estado del marco muestral.
10. Efectividad de la muestra.
11. Técnica de recolección de datos.
12. Recursos disponibles (véase, Galindo, 1998, pp. 49-62)
Fórmula genérica
Dependiendo del problema mismo, no todos los problemas incluyen la
totalidad de los elementos mencionados. Como es de observarse, dentro
de las teorías del muestreo y probabilidad existen diversos
procedimientos para el cálculo de los tamaños de la muestra; todos ellos
consideran a la mayoría de los elementos que hemos enumerado.
39
Variables
Las variables que considera la fórmula son los siguientes:
Variable Descripción
N Tamaño de la muestra
Ejemplo
Se requiere calcular el tamaño de una muestra para el siguiente caso:
Variable Descripción
N ?
N 3,000,000
Q 1 – 0.5 = 0.5
40
Al sustituir estos valores en la fórmula, tenemos:
(3,000,000)(0.5)(0.5)
n 2
(0.05)
(3,000,000 1) (0.5)(0.5)
(1.96) 2
41
RESUMEN DE LA UNIDAD
Como pudimos observar, las técnicas de muestreo son variadas y su
aplicación depende del estado de la población (homogeneidad-
heterogeneidad), sin embargo la metodología de aplicación del proceso
de muestrear es mucho más completa, pues tiene que cuidar de
numerosos detalles tales como el objetivo mismo del muestreo, el
tamaño de la muestra, el nivel de confianza, etc. El apoyo que brinda la
teoría de la estimación es muy importante para poder obtener inferencias
correctas de la población y en consecuencia, las personas que deban
tomar las decisiones correspondientes puedan hacer su trabajo de
manera eficiente teniendo como sustento de tales decisiones
herramientas estadísticas poderosas tales como la Teoría del muestreo y
la Teoría de la estimación.
42
GLOSARIO DE LA UNIDAD
Aleatorio
Suceso incierto que tiene algún grado de inseguridad de ocurrir (también
es llamado estocástico).
Censo
Es el estudio en el que se incluye a toda la población.
Cuestionario
Instrumento recolector autoadministrable. En él, el cuestionado lee y
contesta por sí mismo las preguntas.
Desviación estándar
Raíz cuadrada de la suma de los cuadrados de las desviaciones de cada
valor que asume la variable en relación a la media. Raíz cuadrada de la
varianza para la muestra “s” para la población (sigma).
Distribución normal
Estudia la concentración de probabilidad en un intervalo cualquiera, que
está contenido en el área bajo la curva de una función de probabilidades
en forma de campana.
43
Entrevista
Instrumento recolector empleado en una conversación a niveles
profundos o específicos. Puede ser libre o estructurada.
Error sistemático
Error de respuesta o de encuesta que se produce constantemente a lo
largo de la investigación.
Estadística
Es una ciencia relativamente nueva que tiene por objeto la colección e
interpretación de datos.
Estadística inferencial
Estimación de las características de una población, validación de
distribuciones o la toma de decisiones sobre algún factor de la población,
sin conocerla enteramente y basándose en los resultados de un
muestreo, que se manifiestan en la estadística descriptiva de ese
conjunto de datos.
Muestra
Es un conjunto de “n” observaciones extraídas de entre los “N”
elementos de la población.
Muestreo a juicio
Es la selección de “n” elementos de entre los “N” de una población
elegida según el criterio del sujeto que los elige. Se basa en
suposiciones muy amplias acerca de las variables que se van a estudiar
en la población. Generalmente lo realizan expertos en la materia.
44
Muestreo aleatorio simple
Requiere de un marco muestral aleatorizado o no, en el que estén
contenidos sin repetición todas las unidades de la población.
Parámetro
Medida que caracteriza a una población.
45
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
46
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
47
EXAMEN DE
AUTOEVALUACIÓN 1
Elige la respuesta correcta a las siguientes preguntas, una vez que
concluyas, obtendrás de manera automática tu calificación.
48
3. Al proceso mediante el cual se obtienen los elementos de una
muestra representativa de la población se le denomina:
a) proceso estadístico
b) procedimiento de muestreo
c) proceso de selección
d) muestreo aleatorio
e) seccionamiento
49
7. El muestreo realizado mediante la aplicación de un criterio personal
de preferencia o aversión hacia determinados elementos constituye un
método:
a) probabilístico
b) aleatorio simple
c) aleatorio directo
d) de conglomerados
e) no probabilístico
50
10. Un auditor va a realizar una prueba donde espera una tasa de error
no mayor al 5%. Si fija una precisión de 3% y un nivel de confianza
de 95% en una población de 15 000 facturas, si la prueba se
realizara en el mes de marzo y si la última factura del mes de febrero
es la No. 28 974, el tamaño de la muestra es de:
a) 15 000
b) 375
c) 7 500
d) 28 974
e) 1 500
51
EXAMEN DE
AUTOEVALUACIÓN 2
Verdadera Falsa
1. En un muestro aleatorio cada elemento de una ( ) ( )
población tiene la misma posibilidad de ser
seleccionado para integrar la muestra.
2. En un muestreo no aleatorio los elementos tienen ( ) ( )
diferentes posibilidades de ser elegidos para
integrar la muestra.
3. El muestreo por conglomerados consiste en ( ) ( )
dividir una población en subgrupos llamados
estratos y se selecciona una muestra de cada
uno de ellos con lo cual se garantiza la
representación de cada subgrupo o estrato en la
muestra final.
4. El muestreo estratificado muchas veces se ( ) ( )
emplea para reducir el costo de realizar un
muestreo de una población dispersa en una gran
área geográfica.
52
5. El error de muestreo es la diferencia que se ( ) ( )
presenta entre los resultados obtenidos en el
análisis de las muestras respecto de los que en
realidad corresponden a la población.
6. El error de muestreo se presenta con mayor ( ) ( )
intensidad cuando las muestras no son
representativas de la población de la cual fueron
extraídas.
7. El error de muestreo se presenta de forma ( ) ( )
azarosa y no hay forma de evitarlo, calcularlo o
minimizarlo.
53
LO QUE APRENDÍ
Considera una distribución binomial con n=5, y y=2. Encuentra la
estimación de máxima verosimilitud correspondiente.
54
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
55
Lind A. Douglas, Marchal G. William, Mason D. Robert. (2004).
Estadística para Administración y Economía. (11ª ed.)
Madrid: Alfaomega.
Bibliografía complementaria
56
Sitios de Internet
Sitio Descripción
http://ocw.upm.es/estadistica-e- Martín Fernández, Susana y Ayuga
investigacion- Téllez, Esperanza. (2008).
operativa/matematicas-y- Introducción al muestreo. Ciencias
estadistica- Ambientales, UPM
aplicada/contenidos/OCW/Tecnica
s-de-
muestreo/Mat_Clase/tec_muestreo
.pdf
http://aulasvirtuales.wordpress.co Rodríguez, Manuel Luis. (2010).
m/2010/04/30/introduccion-al- “Introducción al muestreo”,
muestreo (30/04/10), Aulas Virtuales [blog]
http://www.itch.edu.mx/academic/i Torre, Leticia de la. (2003). “Teoría
ndustrial/estadistica1/cap01.html del Muestreo”, Estadística I, Instituto
Tecnológico de Chihuahua
http://www.eumed.net/libros/2006c/ Ávila Baray, Héctor Luis. (2006).
203/2l.htm “Introducción a la Teoría del
Muestreo”, Introducción a la
metodología de la investigación.
http://www.ub.edu/aplica_infor/sps Alea, V. “Pruebas para dos
s/cap6-3.htm muestras relacionadas”, SPSS
Análisis de datos, Estadística,
Universidad de Barcelona
57
UNIDAD 2
DISTRIBUCIONES MUESTRALES
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno identificará e interpretará los diferentes
tipos de distribuciones muestrales.
59
INTRODUCCIÓN
La distribución de la población de la cual extraemos la muestra con la
que trabajamos en estadística es importante para saber qué tipo de
distribución debemos aplicar en cada una de las situaciones que se nos
presenten en la práctica; en esta unidad veremos algunas de estas
distribuciones que se encuentran relacionadas con la distribución normal,
además de observar la distribución muestral para la media y para la
proporción y su relación con el teorema central del límite.
60
LO QUE SÉ
Elige la respuesta correcta a las siguientes preguntas.
2
1. La distribución chi-cuadrada es útil para analizar la relación:
a) entre la varianza de la muestra y la varianza de la población
b) entre la media de la muestra y la media de la población
c) entre una muestra y otra
2 s 2 ( gl )
2
a)
n
1
X Xi
b) n i 1
s 2 (n 1)
c) 2
1 /2
s 2 (n 1) 2 s 2 (n 1)
2 2
b) /2 1 /2
n
1
s2 (Xi X )2
c) n 1i 1
61
4. La distribución “t” de Student se utiliza cuando:
a) El investigador lo decide
b) cuando la desviación estándar de la población es desconocida
c) cuando no hay otra alternativa
n
1
X Xi
b) n i 1
N
1
( xi )2
c) N 1
n!
a) n Pr
n r!
n!
b) nCr
r!(n r )!
n
c) F( X ) P x (1 P)n x
x
62
8. Las combinaciones se utilizan cuando:
a) no importa el orden
b) si importa el orden
c) no hay otra opción
63
TEMARIO DETALLADO
(8 horas)
64
2.1. La distribución muestral de la
media
El estudio de determinadas características de una población se efectúa a
través de diversas muestras que pueden extraerse de ella.
65
Distribución muestral de medias
Cada muestra de tamaño n que podemos extraer de una población
proporciona una media. Si consideramos cada una de estas medias
como valores de una variable aleatoria podemos estudiar su distribución
que llamaremos distribución muestral de medias.
66
2.2. El teorema central del límite
El enunciado formal del teorema del límite central es el siguiente: si en
cualquier población se seleccionan muestras de un tamaño específico, la
distribución muestral de las medias de muestras es aproximadamente
una distribución normal. Esta aproximación mejora con muestras de
mayor tamaño.
67
2.3. La distribución muestral de la
proporción
Hoy es bien sabido que si la investigación produce datos mensurables
tales como el peso, distancia, tiempo e ingreso, la media muestral es en
ocasiones el estadístico más utilizado, pero, si la investigación resulta en
artículos “contables” como por ejemplo: cuántas personas de una
muestra escogen la marca “Peñafiel” como su refresco, o cuántas
personas de una muestra tienen un horario flexible de trabajo, utilizar la
proporción muestral es generalmente lo mejor.
x
p
n
68
compraría el principal producto que vende para lo cual realiza un estudio
de mercado mediante una encuesta a 30 participantes, lo cual permitirá
saber quiénes lo comprarían y quiénes no; se obtuvieron los siguientes
resultados:
estimar P es:
69
_
desviación estándar .
Dado que todas las muestras aleatorias que sean tomadas de una
misma población en general serán distintas y tendrán por ende
diferentes valores para sus estadísticos tales como la media aritmética o
la desviación estándar, entonces resulta importante estudiar la
distribución de todos los valores posibles de un estadístico, lo cual
significa estudiar las distribuciones muestrales para diferentes
estadísticos (véase, Weimer, 1996, p. 353). La importancia de éstas
distribuciones muestrales radica en el hecho de que en estadística
inferencial, las inferencias sobre poblaciones se hacen utilizando
estadísticas muestrales pues con el análisis de las distribuciones
asociadas con éstos estadísticos se da la confiabilidad del estadístico
muestral como instrumento para hacer inferencias sobre un parámetro
poblacional desconocido.
70
2.4. La distribución muestral de la
varianza
La varianza de las muestras sigue un proceso distinto a los de la media y
proporción. La causa es que el promedio de todas las varianzas de las
muestras no coincide con la varianza de la población s2. Se queda un
poco por debajo.
71
RESUMEN DE LA UNIDAD
El teorema central del límite es útil para entender que la distribución de
las medias de muestras tomadas de una misma población y del mismo
tamaño es aproximadamente normal y que esta aproximación mejora a
medida que se incrementa el tamaño de la muestra; dando pie al estudio
de la distribución muestral para la media y para la proporción y a la
elaboración de “intervalos de confianza” que se analizarán en el
apartado 3.4., la proporción muestral es el mejor estadístico por utilizar
cuando en la investigación se trata de averiguar cuestiones tales como:
¿Cuántos integrantes de la población tienen una característica en
particular o una tendencia similar?
72
GLOSARIO DE LA UNIDAD
Distribución muestral
Es una distribución de probabilidades que consta de todos los valores
posibles de un estadístico de muestra.
Error estándar
Es la desviación estándar de un estimador puntual.
N n
El término N 1 que se usa en las fórmulas de x y p
cuando
se selecciona una muestra de una población finita, no de una población
infinita. La regla fácil que generalmente se acepta es no tomar en cuenta
n
0.05
el factor de corrección para población finita siempre que N
Muestras pareadas
Muestras en las que con cada dato de una muestra se forman parejas
con el dato correspondiente.
Parámetro
Es una característica numérica de una población, tal como la media
aritmética poblacional, la desviación estándar poblacional o la proporción
poblacional.
73
Teorema del límite central
También conocido como teorema central del límite, es un teorema que
permite usar la distribución de probabilidad normal para aproximar la
_ _
74
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
75
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
76
EXAMEN DE
AUTOEVALUACIÓN 1
77
4. El teorema central del límite se aplica a la ( ) ( )
distribución muestral de las medias de muestras
y permite utilizar la distribución de probabilidad
normal para crear intervalos de confianza.
5. La media muestral es uno de los estadísticos más ( ) ( )
utilizados en estadística inferencial.
6. Para que un investigador pueda asignar un valor ( ) ( )
probabilístico a una media muestral, es necesario
que conozca la distribución muestral de las
medias.
( ) ( )
7. x
es la fórmula para calcular la desviación
n
estándar de las medias de las muestras cuando
la población es finita.
N n ( ) ( )
x
8. N 1 es la fórmula para calcular la
media de las medias para una población finita.
9. La media de las medias siempre es igual a la ( ) ( )
media de la población, independientemente de si
la población es finita o infinita.
78
EXAMEN DE
AUTOEVALUACIÓN 2
79
3. Calcular el factor de corrección para la población finita de un
inventario que consta de 250 productos y a la cual se le efectuará un
muestreo de 40%:
a) 0.881
b) 0.918
c) 0.819
d) 0.991
e) 0.989
80
6. Una población se compone de los siguientes cinco números 2, 3, 6, 8,
y 11. Calcula la media de la distribución muestral para tamaños de
muestra 2 con reemplazamiento:
a) 6.2
b) 5.7
c) 6.0
d) 6.1
e) 5.8
81
9. Se tiene una lista de 120 estudiantes, 60 de ellos son de Contaduría y
el resto de Administración. Si se toma una muestra al azar, halla la
probabilidad de que se escojan entre el 40% y el 60% de contadores
del tamaño de la muestra:
a) 98.5%
b) 96.7%
c) 95.8%
d) 97.7%
e) 99.1%
82
LO QUE APRENDÍ
Preocupado por la variabilidad aparente de dos máquinas exactamente
iguales y que fabrican el mismo tipo de botella para agua “ciel”, el dueño
de la fábrica solicita un estudio en el que se muestreen al azar 10
botellas para cada máquina, obteniendo los siguientes resultados:
83
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
84
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://recursostic.educacion.es/de García Cebrian, María José.
scartes/web/materiales_didacticos (2001). “Distribuciones
/inferencia_estadistica/distrib_mue muestrales”, Estadística,
strales.htm Descartes 2D, Matemáticas
interactivas.
http://www.ugr.es/~ramongs/labor Gutiérrez Sánchez, Ramón.
ales/tema6.pdf (2007). “Distribuciones
muestrales”, Curso de
85
Estadística, Diplomatura en
Laborales, Universidad de
Granada.
http://www.uoc.edu/in3/emath/doc Juan, Ángel A.; Sedano, Máximo,
s/Distrib_Muestrales.pdf Vila, Alicia. (2002).
“Distribuciones muestrales”,
Proyecto e-Math, UOC.
http://www.itch.edu.mx/academic/i Torre, Leticia de la. (2003).
ndustrial/estadistica1/cap01.html “Teoría del Muestreo”,
Estadística I, Instituto
Tecnológico de Chihuahua
86
UNIDAD 3
ESTIMACIÓN DE PARÁMETROS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno aprenderá los métodos de estimación de
parámetros y su interpretación.
88
INTRODUCCIÓN
En el momento de tomar decisiones el conocimiento de los parámetros
de población es de vital importancia, tal conocimiento generalmente solo
se puede tener al estimar el valor de dichos parámetros, sin embargo, la
estimación es mejor cuando se da un margen de confianza y uno de
error, siendo importante la correcta estimación de dichos parámetros a
través de la construcción de intervalos de confianza que puedan
sustentar la toma de decisiones de manera eficiente.
89
LO QUE SÉ
Elige la respuesta correcta a las siguientes preguntas.
x
b) n
c) x
90
TEMARIO DETALLADO
(10 horas)
91
3.1. Estimaciones por punto y
estimaciones por intervalo
Una estimación de un parámetro de la población dada por un solo
número se llama una estimación de punto del parámetro. No obstante,
un estimador puntual sólo refiere una parte de la historia. Si bien se
espera que el estimador puntual esté próximo al parámetro de la
población, se desearía expresar qué tan cerca está. Un intervalo de
confianza sirve a este propósito.
92
Existe una distinción técnica entre un estimador como una función de
variables aleatorias y una estimación como un único número. Tal
distinción se refiere al proceso en sí (estimador) y el resultado de dicho
proceso (la estimación.) Lo que en realidad importa de esta definición es
que nosotros sólo podemos definir buenos procesos (estimadores), mas
no garantizar buenos resultados (estimaciones).
93
Evidentemente, (1) y (2) son estimaciones de los parámetros para
distribuciones en las que tanto la media como la varianza aparecen
explícitamente como parámetros, tales como las distribuciones normal y
de Poisson. Aquí, podemos mencionar que (1) es un caso muy especial
del llamado método de los momentos, en la que los parámetros que van
a estimarse se expresan en términos de los momentos de la distribución
en las fórmulas resultantes (véase, Kreyszig, 2000[2], § 19.8); esos
momentos se reemplazan por los momentos correspondientes de la
muestra, lo cual proporciona las estimaciones deseadas.
Aquí, el k-ésimo momento de una muestra x1, x2,...xn, es:
1in
mk ( xi ) k
ni1
94
3.2. Error de muestreo y errores
que no son de muestreo
La desviación estándar de una distribución, en el muestreo de un
estadístico, es frecuentemente llamada el error estándar del estadístico.
Por ejemplo, la desviación estándar de las medias de todas la muestras
posibles del mismo tamaño, extraídas de una población, es llamada el
error estándar de la media. De la misma manera, la desviación estándar
de las proporciones de todas las muestras posibles del mismo tamaño,
extraídas de una población, es llamada el error estándar de la
proporción. La diferencia entre los términos “desviación estándar” y “error
de estándar” es que la primera se refiere a los valores originales,
mientras que la última está relacionada con valores calculados. Un
estadístico es un valor calculado, obtenido con los elementos incluidos
en una muestra.
95
más pequeño es el error de muestras, mayor es la precisión de la
estimación. Deberá hacerse notar que los errores cometidos en una
encuesta por muestreo, tales como respuestas inconsistentes,
incompletas o no determinadas, no son considerados como errores
muéstrales. Los errores no muéstrales pueden también ocurrir en una
encuesta completa de la población.
B( )= - E( )
96
y establecemos como estimador de
es el parámetro a
estimar. Existe pues un sesgo que será
97
asintóticamente insesgado o asintóticamente centrado: podemos
establecer que:
ECM( )=
98
es el único capaz de generar eficiencia.
Z= =
99
Pero como para el intervalo se debe encontrar un intervalo que contenga
la media poblacional, entonces reemplazamos a por y cada uno de
los límites estará dado por:
superior de
100
n = Z2 α S2 / d2
=1
101
Para = -1.96, Tenemos
85 – 1.96
83.04
Para = 1.96, Tenemos
85 + 1.96
86.96
El intervalo de confianza es : 83.04 < < 86.96
Nos indica con el 95% de seguridad, que el promedio de las medias
muéstrales de las cuentas está entre 83.04 y 86.96.
102
; y , entonces automáticamente
tenemos , así que sólo tres de los cuatro valores de
están libremen [sic.] te determinamos 3 grados de libertad.
[Torre, 2003]
103
El cual, de acuerdo con el teorema del límite central, tendrá distribución
normal estándar. En este caso, P es la proporción de la población con
104
Es decir aproximadamente entre el 3% y 17%.
105
donde:
donde:
N = Total de la población
Z 2 = 1.962 (si la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1-0.05 = 0.95)
d = precisión (en este caso deseamos un 3%).
106
Si la seguridad Zα fuese del 95% el coeficiente sería 1.96
Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24
Si la seguridad Zα fuese del 99% el coeficiente sería 2.576.
107
Intervalo para estimar la media
De acuerdo con tablas de la distribución normal estándar el área bajo la
curva entre z=-1 y z=+1 es 0.6826; por consiguiente, y de acuerdo con
la definición de la función normal estándar de probabilidad, las
desigualdades siguientes se cumplen con probabilidad de 0.6826.
1 z 1
Como la distribución de las medias de las muestras (con media x y
x x
1 1
_
x
x por y x por x
se tiene que:
108
68.42 x 69.58
Es decir: aquí, la media aritmética de la población
lleva un acento circunflejo debido a que se trata de una estimación.
k z k -------------------------------------1
En términos generales, para encontrar un intervalo de cualquier
porcentaje de confianza, se hace lo siguiente:
109
(-1.96, +1.96)
es, aproximadamente 0.95 o, en otra forma, las desigualdades:
-1.96 <z<+1.96
se cumplen con probabilidad 0.95;
y puesto que se sabe que la distribución de las medias de las muestras
es normal,
1.96s 1.96s
X X
n y n
110
(media 69, desviación estándar 3.5 y tamaño de muestra 36) en 2 se
tiene que el intervalo con 95% de confianza es:
1.96 3.5 1.96 3.5
69 x 69
36 36
67.8 x 70.1
Ejemplo:
Considera el caso de estimar si no hay deficiencias en una máquina que
llena envases con capacidad de 500 ml.; para ello, se extrae una
muestra periódicamente; si la muestra indica que hay una variación de
±5 ml. alrededor de los 500 y con un nivel de confianza del 95%,
entonces se puede decir que el proceso está bajo control.
111
En este caso lo que importa es la variación en el llenado, pues el nivel
promedio de llenado se puede controlar programando la máquina. Por
ello, si la muestra arroja una variación arriba de 5 unidades, entonces el
proceso no estará bajo control.
2 (n 1) S 2
X 0.025 2
X 20.975
2
Despejando todas las constantes y dejar solo se tiene el intervalo:
112
Obteniendo raíz cuadrada, se tiene:
113
RESUMEN DE LA UNIDAD
Las inferencias acerca de una población que se obtienen del estudio de
una muestra pueden ser tan buenas como lo sean las estimaciones
obtenidas, aquí, el cuidado va evidentemente sobre la recolección de los
datos, pues existe una gran variedad de estimadores que pueden ser
utilizados dependiendo del contexto pero el éxito de la aplicación de un
estimador (estimación) dependerá necesariamente de la calidad de los
datos mismos, resulta evidente que esto es extensible a los intervalos de
confianza tanto para la media como para proporciones.
114
GLOSARIO DE LA UNIDAD
Distribución t
Es en realidad una familia de distribuciones de probabilidad que se
emplea para construir un intervalo de confianza para la media
poblacional, siempre que la desviación estándar se estime mediante
la desviación estándar muestral “s” y la población tenga una distribución
de probabilidad normal o casi normal.
Error muestral
Es el valor absoluto de la diferencia entre el valor de un estimador
_
Estimación de intervalo
Estimación de un parámetro de la población que define un intervalo
dentro del que se cree está contenido el valor del parámetro. Tiene la
forma de: Estimación puntual margen de error.
Grados de libertad
Es el número de observaciones independientes para una fuente de
variación menos el número de parámetros independientes estimado al
calcular la variación.
115
Margen de error
Es el valor sumado y restado a una estimación puntual a fin de
determinar un intervalo de confianza de un parámetro poblacional.
Nivel de confianza
Es la confianza asociada con una estimación de intervalo. Por ejemplo si
en un proceso de estimación de intervalo, el 90% de los intervalos
formados con este procedimiento contienen el valor del parámetro
buscado, se dice que éste es un intervalo de 90% de confianza.
116
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
Ventajas Desventajas
Estimadores sesgados
Estimadores insesgados
Estimadores consistentes
Estimadores inconsistentes
ACTIVIDAD 2
ACTIVIDAD 3
117
en donde S=28.9 l y queremos un nivel de confianza de 95% con un
error en la estimación de B=2 l. Determina el tamaño de la muestra
que debe evaluarse.
118
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
119
4,000. Determina un intervalo con 68% de confianza para la vida
media.
7. Un estudio sobre ciertas acciones comunes permitió conocer que en
una muestra aleatoria de 100 acciones la rentabilidad anual promedio
fue de 4.2%, mientras que su desviación estándar es de 0.6%.
Determina un intervalo, con 95% de confianza, para la rentabilidad
promedio.
8. ¿Cuál es la diferencia entre una estimación y un estimador?
9. ¿Qué es un intervalo de confianza?
10. Señala, ¿por qué son preferibles las estimaciones de intervalo a las
estimaciones puntuales?
120
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
1. En este estimador su esperanza matemática es igual a parámetro en
cuestión:
a) robusto
b) insesgado
c) sesgado
121
5. Este tipo de estimador se aproxima al parámetro poblacional con
probabilidad uno a medida que el tamaño de la muestra tiende a
infinito:
a) consistente
b) robusto
c) inconsistente
122
LO QUE APRENDÍ
Construye un intervalo de confianza de 95% para la vida media de los
neumáticos muestreados en la tabla mostrada a continuación. (Nota. Los
datos están dados en miles de kilómetros.)
123
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
124
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://www.itescam.edu.mx/principal/ Fernández, Pita. (1996).
sylabus/fpdb/recursos/r53794.PDF “Determinación del tamaño
muestral”, Cad Aten
Primaria 1996; 3: 138-14,
actualizado 06/03/01
http://www.uv.es/ceaces/tex1t/4%20e Martínez de Lejarza
stimacion/estimacion.html#2.Propied Esparducer, Juan y otros.
ades%20de%20los%20Estimadores (2011). “Inferencia
estadística / Estimación
125
puntual / propiedades de los
estimadores”, Contenedor
Hipermedia de Estadística
Aplicada a las Ciencias
Económicas y sociales”,
(Proyecto CEACES),
Universidad de Valencia.
http://www.itch.edu.mx/academic/ind Torre, Leticia de la. (2003).
ustrial/estadistica1/cap01.html “Teoría del Muestreo”,
Estadística I, Instituto
Tecnológico de Chihuahua
126
UNIDAD 4
PRUEBAS DE HIPÓTESIS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno conocerá las pruebas de hipótesis y su
aplicación.
128
INTRODUCCIÓN
En esta unidad, el alumno investigará y analizará el concepto de prueba
de hipótesis y lo aplicará sobre varianzas, medias, etc.; ello le permitirá
percatarse de la importancia que tienen las pruebas de hipótesis para la
toma de decisiones dentro de las empresas.
129
De que en un proceso de elaboración de cápsulas éstas
contengan precisamente 250 miligramos de un medicamento.
Que la empresa de transportes de nuestra competencia tiene
tiempos de entrega más rápidos que la nuestra.
De que la producción de las plantas de oriente contiene menos
unidades defectuosas que las de occidente.
En todos estos casos, y en muchos más, las personas actúan con base
en alguna creencia sobre la realidad, la cual quizá llegó al mundo como
una simple conjetura, como un poco más que una suposición informada;
una proposición adelantada tentativamente como una verdad posible es
llamada hipótesis.
Por lo tanto, de una manera sencilla podemos decir que una prueba de
hipótesis es un método sistemático de evaluar creencias tentativas sobre
la realidad, dicho método requiere de la confrontación de tales creencias
con evidencia real y decidir, en vista de esta evidencia, si dichas
creencias se pueden conservar como razonables o deben desecharse
por insostenibles.
130
A continuación estudiaremos la forma en que las creencias de las
personas pueden ser probadas de manera sistemática.
131
LO QUE SÉ
Elige la respuesta correcta a las siguientes preguntas. Envía tus
respuestas en una hoja de Word, para ello, presiona el botón Examinar.
Localiza el archivo, ya seleccionado, presiona Subir este archivo para
guardarlo en la plataforma.
a) x z
2 n
b) 2
x
z
c) n
x z
n
a) 2
b) 2
x
c) z
132
TEMARIO DETALLADO
(10 horas)
133
4.1. Planteamiento de las
hipótesis
1. Formulación de dos hipótesis opuestas
El primer paso para probar una hipótesis es siempre formular dos
hipótesis opuestas, que sean mutuamente excluyentes y, también
colectivamente exhaustivas, del experimento que estemos evaluando.
Cada una de estas hipótesis complementarias es una proposición sobre
un parámetro de la población tal que la verdad de una implique la
falsedad de la otra. La primera hipótesis del conjunto, simbolizada por
H0, se denomina hipótesis nula; la segunda, simbolizada por H1 o bien
por Ha, es la hipótesis alternativa.
134
Una regla de decisión es una regla para prueba de hipótesis que nos
permite determinar si la hipótesis nula debe ser aceptada o si debe ser
rechazada a favor de la alternativa.
Se dice que los valores numéricos del estadístico de prueba para los que
H0 es aceptada están en la región de aceptación y son considerados no
significativos estadísticamente.
135
4.2. Errores tipo I y tipo II
Error tipo I
En una prueba estadística, rechazar la hipótesis nula cuando es
verdadera se denomina error tipo I. Y a la probabilidad de cometer un
error tipo I se le asigna el símbolo (letra griega alfa).
Ejemplo
Incurrir en un riesgo α
Un fabricante de varillas de acero especial que son utilizadas en la
construcción de edificios muy altos ha contratado a un estadista para
que pruebe si sus varillas ciertamente tienen un promedio de resistencia
a la tensión de al menos 2000 libras ¿Cuáles son las implicaciones si el
nivel de significancia de la prueba de hipótesis se fija en: α = 0.08?
136
Solución:
Dadas las hipótesis: H0 : 0 2000 y H1 : 0 2000
Error Tipo II
En una prueba estadística, aceptar la hipótesis nula cuando es falsa se
denomina error tipo II. A la probabilidad de cometer un error de tipo II se
le asigna el símbolo (letra griega beta)
Ejemplo
Incurrir en un riesgo β
137
Solución
0 50
Nivel de significancia
El nivel de significancia o significación es la probabilidad de cometer un
error tipo I, es decir, el valor que se le asigna a α.
Potencia de la prueba
Es posible determinar (Weimer, 1996, p. 461) la probabilidad asociada
con tomar una decisión correcta: no rechazar H0 cuando es verdadera o
rechazarla cuando es falsa. La probabilidad de no rechazar H0 cuando es
verdadera es igual a 1- .
Como
P(rechazar Ho cuando es verdadera) =
tenemos:
P(no rechazar Ho cuando es verdadera) = 1 -
138
Nota que la probabilidad de no rechazar Ho cuando es verdadera es el
nivel de confianza 1-
Símbolo de la Definición
probabilidad
139
4.3. Pruebas de uno y de dos
extremos y regiones de
aceptación y de rechazo
a) Prueba bilateral o de dos extremos: la hipótesis planteada
se formula con la igualdad.
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
140
El valor estadístico z, para muestra grande y desviación estándar
poblacional desconocida se determina por la ecuación:
141
Valor crítico: Es el punto de división entre la región en la que se
rechaza la hipótesis nula y la región en la que no se rechaza la
hipótesis nula.
142
Existen diversos métodos para desarrollar dicho test,
minimizando los errores de tipo I y II, y hallando por tanto con
una determinada potencia, la hipótesis con mayor probabilidad
de ser correcta. Los tipos más importantes son los test
centrados, de hipótesis y alternativa simple, aleatorizados, etc.
Dentro de los tests no paramétricos, el más extendido es
probablemente el test de la U de Mann-Whitney. (Wikipedia:
Contraste de hipótesis)
143
Quienes investigan el mercado de consumo tienen una hipótesis
alternativa o de investigación: el nuevo producto es superior al anterior.
Formalmente, una hipótesis alternativa, denotada con H1, es un
enunciado acerca de la población. La hipótesis nula, denotada con H0, es
la negación de la hipótesis alternativa H1. La estrategia básica en las
pruebas de hipótesis es tratar de apoyar la hipótesis alternativa
“contradiciendo” la hipótesis nula.
144
proporción el estadístico de la prueba es muy simple: se cuenta
el número de éxitos en la muestra para encontrar el estadístico.
145
aproximación se diseña para dar al usuario una alternativa a la
simple conclusión de “rechazo” o “no rechazo”.
146
significación antes de realizar la prueba y no después de obtener
el resultado, al igual que debes valorar seriamente si debes
enunciar el problema de forma bilateral o unilateral antes de
realizar la prueba. Violar el cumplimiento de los supuestos
implica que la prueba pierda potencia, pudiendo no encontrarse
diferencias cuando realmente las hay o lo contrario.
(Mitecnológico, Prueba de hipótesis para proporción)
147
4.8. Pruebas de hipótesis sobre la
diferencia entre dos poblaciones
Las pruebas de hipótesis a partir de proporciones se realizan
casi en la misma forma utilizada cuando nos referimos a las
medias, cuando se cumplen las suposiciones necesarias para
cada caso. Pueden utilizarse pruebas unilaterales o bilaterales
dependiendo de la situación particular.
La proporción de una población
Las hipótesis se enuncian de manera similar al caso de la media.
Ho: p = p0
H1: p ¹ p0
148
El objetivo de la prueba es comparar estas dos proporciones,
como estimadores
H1: p1 ¹ p2
Cociente F
S12
F = ---------
S22
Donde:
S12 = Varianza de la muestra 1
S22 = Varianza de la muestra 2
149
Si parece probable que el cociente F pueda haberse obtenido de
la distribución muestral supuesta, la hipótesis nula no se
rechaza. Si es poco probable que el cociente F se haya obtenido
de la distribución supuesta, la hipótesis nula se rechaza.
150
RESUMEN DE LA UNIDAD
Las pruebas de hipótesis, como herramienta estadística, son importantes
porque nos indican el camino, al aceptar o desechar un hipótesis de
manera tentativa a favor de otra, sin embargo no aportan mayor
información; pero si apoyamos nuestra decisión con un intervalo de
confianza apropiado, podemos obtener datos que pueden ser
transformados en información y utilizarlos como sustento de una decisión
que generalmente en cualquier ámbito representa dinero. Evidentemente
se debe de tomar en consideración todos los errores posibles que se
puedan cometer durante el proceso, de donde nacen los errores tipo i y II
para las pruebas de hipótesis, además de la potencia de una prueba de
hipótesis para que nuestra opinión sea lo más certera posible.
151
GLOSARIO DE LA UNIDAD
Curva de la potencia de la prueba
Es la gráfica de la probabilidad de rechazar H0 para todos los valores
posibles del parámetro poblacional que no satisfacen la hipótesis nula.
Error tipo I
Es el error que se comete al rechazar H0 cuando ésta es verdadera.
Error tipo II
Es el error que se comete al aceptar H0 cuando ésta es falsa.
Estadístico de prueba
Es el estadístico cuyo valor se utiliza para determinar si se rechaza una
hipótesis nula.
Nivel de significancia
Es la probabilidad máxima de cometer un error tipo I.
152
Potencia de la prueba
Es la probabilidad de rechazar correctamente H0 cuando es falsa.
Región de rechazo
Es la zona de valores en la cual se rechaza la hipótesis H0.
Valor crítico
Es un valor contra el cual se compara el obtenido en el estadístico de
prueba para determinar si se debe rechazar o no la hipótesis nula.
Valor p
Es la probabilidad de que, cuando la hipótesis nula sea verdadera, se
obtenga un resultado de una muestra que sea al menos tan improbable
como el que se observa. También se le conoce como nivel observado de
significancia.
153
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
154
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
155
10. En una planta embotelladora de leche se toma una muestra de 500
botellas; 40 de ellas se obtienen con impurezas. Si se supone que el
límite máximo de impurezas es 7%. Establece la regla de decisión
para un nivel de significancia del 4%
156
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
1. Supón que formas parte de un grupo de protección al consumidor, y
estás interesado en determinar si el peso promedio de cierta marca de
arroz, empacado en paquetes de 1 kg, es menor que el peso
anunciado; para ello, eliges una muestra aleatoria de 50 bolsas, de las
cuales obtienes una media de 980 gr. y una desviación estándar de 70
gr. Para un nivel de significancia es del 5%, la hipótesis nula se:
a) acepta
b) es indiferente
c) rechaza
d) debe replantear
157
3. Se sabe que los voltajes de una marca de pilas “AAA” para
calculadora se distribuyen normalmente con un promedio de 1.5 volts;
se probó una muestra aleatoria de 15 y se encontró que la media fue
de 1.3 volts y que la desviación estándar fue de 0.25 volts. Para un
nivel de significancia del 5%, la hipótesis nula se:
a) acepta
b) rechaza
c) es indiferente
d) replantea
158
LO QUE APRENDÍ
Elige un tipo de empresa comercial. Elabora una propuesta del
procedimiento general que se deberá realizarse para el desarrollo de un
software que lleve el control de sus ventas.
159
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
160
Piattini, Mario y Félix García (coords.) (2003). Calidad en el desarrollo y
mantenimiento de software. México: Alfa omega / Ra-Ma.
Bibliografía complementaria
161
Larman Craig (1999). UML y patrones. México: Prentice-Hall.
Sitios de Internet
Sitio Descripción
http://www.monografias.com/trabaj Cruz Ramírez, Armando Pedro.
os30/prueba-de-hipotesis/prueba- (2009). “Pruebas de hipótesis para
de-hipotesis.shtml una muestra”. Monografías
http://html.rincondelvago.com/anali Hereas, “Análisis de la varianza”,
sis-de-la-varianza_1.html Rincón del vago
http://www.mitecnologico.com/Main Mitecnológico, “Prueba hipótesis
/PruebaHipotesisParaProporcionYD para proporción y diferencia de
iferenciaDeProporciones proporciones”
http://www.mitecnologico.com/Main Mitecnológico (4.3.2) Prueba de
/PruebaDeHipotesisParaDiferencias hipótesis para diferencias de
DeMedias medias
http://html.rincondelvago.com/contr Muñoz, Gonzalo. (s/f). Contraste
aste-de-hipotesis_1.html de hipótesis. Rincón del vago.
http://www.itch.edu.mx/academic/in Torre, Leticia de la. (2003b). “Uso
dustrial/estadistica1/cap02c.html#u de valores P para la toma de
02usovaloresp decisiones”, Estadística I, Instituto
Tecnológico de Chihuahua
162
http://es.wikipedia.org/wiki/Contrast Wikipedia: “Contraste de hipótesis”,
e_de_hip%C3%B3tesis actualizado el 13/10/11
lc.fie.umich.mx/~jrincon/pruebas%2 Rincón Pasaye, José Juan. (2008)
0de%20hipotesis.ppt “Pruebas de hipótesis”,
Probabilidad y estadística,
[diapositivas] UMICH
www.cyta.com.ar/biblioteca/bddoc/ Ciencia y Técnica Administrativa.
bdlibros/guia_estadistica/modulo_9 (2005). “Módulo 9. Pruebas de
.htm hipótesis, muestras grandes”, Guía
de Estadísticas
http://www.geociencias.unam.mx/~r Zúñiga, F. Ramón. (2008). “Clase
amon/Estadistica/Clase5b.pdf 5. Pruebas de hipótesis”,
Estadística, Querétaro:
Geociencias, UNAM
http://uvigen.fcien.edu.uy/utem/gen “La prueba de Chi-cuadrado”,
men/06chi2.htm Genética Mendeliana, UVIGEN,
Universidad de la República,
Montevideo. (Traducción de
McClean, Phillip, 2000 *)
163
UNIDAD 5
165
INTRODUCCIÓN
En esta unidad, el alumno investigará y analizará el concepto de prueba
de hipótesis y lo aplicará sobre varianzas, medias, etc.; ello le permitirá
percatarse de la importancia que tienen las pruebas de hipótesis para la
toma de decisiones dentro de las empresas.
166
De que en un proceso de elaboración de cápsulas éstas
contengan precisamente 250 miligramos de un medicamento.
Que la empresa de transportes de nuestra competencia tiene
tiempos de entrega más rápidos que la nuestra.
De que la producción de las plantas de oriente contiene menos
unidades defectuosas que las de occidente.
En todos estos casos y en muchos más, las personas actúan con base
en alguna creencia sobre la realidad, la cual quizá llegó al mundo como
una simple conjetura, como un poco más que una suposición informada;
una proposición adelantada tentativamente como una verdad posible es
llamada hipótesis.
Por lo tanto, de una manera sencilla podemos decir que una prueba de
hipótesis es un método sistemático de evaluar creencias tentativas sobre
la realidad, dicho método requiere de la confrontación de tales creencias
con evidencia real y decidir, en vista de esta evidencia, si dichas
creencias se pueden conservar como razonables o deben desecharse
por insostenibles.
167
A continuación estudiaremos la forma en que las creencias de las
personas pueden probarse de manera sistemática.
168
LO QUE SÉ
Elige la respuesta correcta a las siguientes preguntas.
2
1. La distribución chi-cuadrada es útil para analizar la relación:
a) entre la varianza de la muestra y la varianza de la población
b) entre la media de la muestra y la media de la población
c) entre una muestra y otra
2 s 2 ( gl )
2
a)
n
1
X Xi
b) n i 1
s 2 (n 1)
c) 2
1 /2
s 2 (n 1) 2 s 2 (n 1)
2 2
b) /2 1 /2
n
1
s2 (Xi X )2
c) n 1i 1
169
TEMARIO DETALLADO
(8 horas)
170
5.1. La distribución ji cuadrada, χ2
En ocasiones los investigadores muestran más interés en la varianza
poblacional que en la proporción o media poblacionales y las razones
llegan desde el campo de la calidad total, por ejemplo, donde la
importancia en demostrar una disminución continua en la variabilidad de
las piezas que la industria de la aviación llega a solicitar es de vital
importancia. Por ejemplo, el aterrizaje de un avión depende de una gran
cantidad de variables, entre las que encontramos la velocidad y dirección
del aire, el peso del avión, la pericia del piloto, la altitud, etc.; si en el
caso de la altitud, los altímetros del avión tienen variaciones
considerables, entonces podemos esperar con cierta probabilidad un
aterrizaje algo abrupto, por lo tanto la variabilidad de estos altímetros
debe mostrar un disminución continua; y qué decir de los motores que
impulsan al avión mismo, si las piezas que los conforman son demasiado
grandes, el motor puede incluso no poder armarse y si son demasiado
pequeñas, entonces los motores tendrán demasiada vibración y en
ambos casos las pérdidas de la industria son cuantiosas.
171
poblacional, puede que los resultados no sean correctos dependiendo de
si la población no está normalmente distribuida.
2 s 2 ( gl )
2
2 s 2 (n 1)
2
172
La distribución Chi-cuadrada ( 2) es en sí toda una familia de
distribuciones por lo que, existe una distribución Chi-cuadrado para cada
grado de libertad.
2 s 2 (n 1)
2
Algebraicamente podemos manipular la fórmula anterior
con el objetivo de que nos sea de utilidad para construir intervalos de
confianza para varianzas poblacionales, quedando de la siguiente
manera:
s 2 (n 1) 2 s 2 (n 1)
2 2
/2 1 /2
Ejemplo
Supóngase que una muestra de 7 pernos especiales utilizados en el
ensamblado de computadoras portátiles arrojó los siguientes resultados:
2.10 mm; 2.00 mm, 1.90 mm, 1.97 mm, 1.98 mm, 2.01 mm, 2.05 mm
173
y al efectuar cálculos, el resultado de la media aritmética (redondeado a 2
decimales) es de:
X 2.00
I xi (xi - ) (xi - )2
174
n
(Xi X )2
i 1
por lo tanto:
1
s2 (0.02389)
7 1
175
de Chi-cuadrada obtenido es de:
2
0.05,6 12.5916
s 2 (n 1) 2 s 2 (n 1)
2 2
/2 1 /2
0.0034122(7 1) 2 0.0034122(7 1)
12.5916 1.63538
2
0.0001625 0.0125189
Este intervalo de confianza nos dice que con 90% de confianza, la varianza
176
de la población está entre 0.0001625 y 0.0125189.
Donde:
χ2 = valor estadístico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
177
Cuando la muestra es seleccionada no probabilísticamente.
X2 permite establecer diferencias entre f y se utiliza solo en escala
nominal.
Población > a 5 y < a 20.
Pasos
1. Arreglar las categorías y las frecuencias observadas.
2. Calcular los valores teóricos esperados para el modelo experimental
o tipo de distribución muestral: normal, binomial y de Poisson.
3. Calcular las diferencias de las frecuencias observadas en el
experimento con respecto a las frecuencias esperadas.
4. Elevar al cuadrado las diferencias y dividirlas entre los valores
esperados de cada categoría.
5. Efectuar la sumatoria de los valores calculados.
6. Calcular los grados de libertad (gl) en función de número de
categorías [K]: gl = K - 1.
7. Comparar el estadístico X2 con los valores de la distribución de ji
cuadrada en la tabla.
8. Decidir si se acepta o rechaza la hipótesis X2c ³ X2t se rechaza Ho.
178
5.2. Pruebas de hipótesis para la
varianza de una población
En ocasiones analistas investigan la variabilidad de una población, en
lugar de su media o proporción.
179
Para probar la hipótesis nula, se toma una muestra aleatoria de
elementos de una población que se investiga; y a partir de esos datos,
se calcula el estadístico de prueba.
180
Regla de decisión: se determina de acuerdo a la hipótesis alternativa (si
es bilateral o unilateral), lo cual puedes fácilmente hacerlo auxiliándote
de la tabla 4.4.1.
181
anteriores. Ahora examinaremos el problema de verificar si el conjunto
de datos se puede ajustar o afirmar que proviene de una determinada
distribución. Las pruebas estadísticas que tratan este problema reciben
el nombre general de “Pruebas de Bondad de Ajuste”.
182
a) La naturaleza de los datos a analizar. Por ejemplo, si tratamos de
investigar la distribución que siguen los tiempos de falla de unos
componentes, podríamos pensar en una distribución exponencial, o una
distribución gama o una distribución Weibull, pero en principio no
consideraríamos una distribución normal. Si estamos analizando los
caudales de un río en un determinado sitio, podríamos pensar en una
distribución logarítmica normal, pero no en una distribución normal.
b) Histograma. La forma que tome el histograma de frecuencia es quizás
la mejor indicación del tipo de distribución a considerar. (Mitecnológico,
Prueba de bondad de ajuste)
183
5.4.2 Ajuste a una distribución Poisson
184
Una vez calculada la media, lo que hacemos es determinar los
valores 'Esperados' según una distribución de Poisson con esa
media. Esto lo calculamos multiplicando la probabilidad de
Poisson para cada resultado, por el total de partidos.
185
5.4.3 Ajuste a una distribución binomial
186
5.5. Pruebas sobre la
independencia entre dos
variables
Cuando cada individuo de la población a estudio se puede
clasificar según dos criterios A y B, admitiendo el primero a
posibilidades diferentes y b el segundo, la representación de las
frecuencias observadas en forma de una matriz a x b recibe el
nombre de Tabla de contingencia.
No. deportista 31 22 53
69 31 100
187
El valor que alcanza el estadístico L es 5,8227. Buscando en la
tabla teórica de Chi Cuadrado para 1 grado de libertad se
aprecia Lt = 3,84146 < 5,8227 lo que permite rechazar la
hipótesis de independencia de caracteres con un nivel de
significación del 5%, admitiendo por tanto que la práctica
deportiva disminuye el riesgo de depresión. (Mitecnológico,
Prueba de hipótesis para Proporción)
188
5.6. Pruebas de homogeneidad
Se plantea el problema de la existencia de homogeneidad entre r
poblaciones, para lo cual se realizan muestras independientes en
cada una de ellas. Los datos muestrales vienen clasificados en s
clases y sus frecuencias absolutas se presentan en forma de una
matriz r x s.
Nº niños Nº niños
Comunidad sin con
caries caries
A 38 87 125
B 8 117 125
C 30 95 125
D 44 81 125
E 64 61 125
F 32 93 125
216 534 750
189
La propia tabla hace pensar que la incidencia de la enfermedad
no es igual en todas las poblaciones; basta observar los datos
correspondientes a las comunidades B y E. El contraste arroja un
valor del estadístico L de 65,85, lo que lleva a rechazar la
hipótesis de homogeneidad y aceptar que el diferente contenido
de flúor en el suministro del agua puede ser la causa de la
disparidad en el número de niños con caries. El Lt esperado
según la tabla de la distribución Chi Cuadrado es 11,0705 que es
menor 65,85. (Pérez, 2006)
190
RESUMEN DE LA UNIDAD
En esta unidad, se revisó el concepto de prueba de hipótesis aplicado
sobre varianzas, medias, etc.; lo que nos conlleva a hacer conciencia de
la relevancia de las pruebas de hipótesis en la toma de decisiones de las
empresas.
191
GLOSARIO DE LA UNIDAD
Curva de la potencia de la prueba
Es la gráfica de la probabilidad de rechazar H0 para todos los valores
posibles del parámetro poblacional que no satisfacen la hipótesis nula.
Error tipo I
Es el error que se comete al rechazar H0 cuando ésta es verdadera.
Error tipo II
Es el error que se comete al aceptar H0 cuando ésta es falsa.
Estadístico de prueba
Es el estadístico cuyo valor se utiliza para determinar si se rechaza una
hipótesis nula.
Nivel de significancia
Es la probabilidad máxima de cometer un error tipo I.
Potencia de la prueba
Es la probabilidad de rechazar correctamente H0 cuando es falsa.
192
Prueba no direccional o de dos colas
Prueba de hipótesis en la que la región de rechazo se ubica en ambos
extremos de la distribución muestral.
Región de rechazo
Es la zona de valores en la cual se rechaza la hipótesis H0.
Valor crítico
Es un valor contra el cual se compara el obtenido en el estadístico de
prueba para determinar si se debe rechazar o no la hipótesis nula.
Valor p
Es la probabilidad de que, cuando la hipótesis nula sea verdadera, se
obtenga un resultado de una muestra que sea al menos tan improbable
como el que se observa. También se le conoce como nivel observado de
significancia.
193
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
194
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
195
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
196
3. Es el error que se comete al aceptar H0 cuando ésta es falsa:
a) Tipo I
b) Tipo II
c) Tipo III
d) Estándar
197
LO QUE APRENDÍ
198
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
199
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://buzjss.blogspot.com/2008 Buzjss, “Estadística y apuestas
/10/la-distribucin-de-poisson- deportivas”, 16/10/08, [blog]
test-de.html
http://recursostic.educacion.es/ García Cebrian, María José. (2001).
descartes/web/materiales_didac “Distribuciones muestrales”,
ticos/distribuciones_probabilida Estadística y Probabilidad,
d/aplic_normal.htm Descartes 2D, Matemáticas
interactivas.
http://recursostic.educacion.es/ Martín Álvarez, Pablo Antonio.
descartes/web/materiales_didac (2001). “Ajuste de una serie de
ticos/Distribucion_binomial/bin datos a una distribución binomia”,
omial.htm La distribución nominal B (n, p),
200
Descartes 2D, Matemáticas
interactivas
http://www.mitecnologico.com/ Mitecnológico, “Prueba de hipótesis
Main/PruebaHipotesisParaProp para proporción”
orcion
http://www.mitecnologico.com/ Mitecnológico, “Prueba de bondad
Main/PruebaDeBondadDeAjuste de ajuste”
http://www.mitecnologico.com/ Mitecnológico, “Prueba de
Main/PruebaDeIndependencia independencia”
http://www.monografias.com/tra Pérez Leal, José. (2006). “Prueba
bajos15/prueba-de- de homogeneidad: Prueba de
independencia/prueba-de- independencia”, Monografías
independencia.shtml
http://html.rincondelvago.com/a “Prueba de la varianza con una
nalisis-de-la-varianza_1.html población”, Rincón del vago
201
UNIDAD 6
203
INTRODUCCIÓN
El uso de la regresión lineal simple es muy utilizado para observar el tipo
de relación que existe entre dos variables y poder llevar a cabo la toma de
decisiones correspondiente dependiendo de la relación entre dichas
variables, así por ejemplo, pudiera darse el caso en el que después de
aplicar la regresión lineal no exista relación entre las variables
involucradas y en consecuencia la decisión podría ser buscar cuál es la
variable independiente que tiene influencia sobre la dependiente y volver
a realizar el estudio completo; pero si fuera el caso en el cual si existiera
una relación positiva entre las variables involucradas, la obtención del
coeficiente de correlación nos daría más información sobre el porcentaje
de relación existente y pudiendo determinar si es necesario la inclusión de
otra variable independiente en el problema mismo, para lo cual el análisis
de regresión ya sería del tipo múltiple.
204
LO QUE SÉ
205
5. De las siguientes ecuaciones, cuál representa una línea recta:
a) x 2 y2 1
b) y mx b
c) y mx 2 b
206
TEMARIO DETALLADO
(10 horas)
207
6.1. Ecuación y recta de regresión
Observando el diagrama de dispersión, podemos obtener una
primera idea de si existe relación o no entre las variables
estadísticas. Con el coeficiente de correlación podemos medir la
correlación lineal, en caso de existir. Vamos ahora a calcular las
líneas que mejor se aproximen a la nube de puntos. A estas
líneas se les llama líneas de regresión.
(Barrios, 2005)
208
6.2. El método de mínimos
cuadrados
Cualquier método estadístico que busque establecer una ecuación que
permita estimar el valor desconocido de una variable, a partir del valor
conocido de una o más variables, se denomina análisis de regresión.
209
de regresión, misma que reduce al mínimo los errores cometidos cuando
la ecuación de esa línea se utilice para estimar y a partir de x.
210
En la que:
xi = es un valor dado de la variable independiente para el cual se
quiere estimar el valor correspondiente de la variable
dependiente
b0 = ordenada al origen de la línea estimada de regresión,
b1 = pendiente de la línea estimada de regresión,
Ŷi = valor estimado de la variable dependiente, para el i-ésimo valor
de la variable independiente
n
Xi Yi
i 1 i 1
X iYi
i 1 n
b1 n
n
( X i )2
X i2 i 1
i 1 n
b0 Y b1 X
211
conocimientos sobre la aplicación. Por ejemplo, un estadista puede llegar
a determinar que la relación entre las ventas y el presupuesto asignado a
mercadotecnia es positiva y que se tiene un coeficiente de correlación de
0.96, lo cual prácticamente nos indica que es recomendable incrementar
el presupuesto al departamento de mercadotecnia para obtener mejores
ingresos dentro de la compañía, sin embargo el director de operaciones
puede llegar a determinar que debido a condiciones internas del país en
el que se encuentre la empresa, o bien la aparición de una nueva ley que
regule los medios utilizados por el mencionado departamento de
mercadotecnia, pueden llegar a frenar o incluso generar conflictos dentro
de la empresa si incrementamos el presupuesto al departamento
correspondiente.
212
de parámetros independientes para tener en cuenta en la regresión. La
regresión lineal puede ser contrastada con la regresión no lineal.
t 1 2 t Y = β + β X (2)
Como quiera que las relaciones del tipo anterior raramente son
exactas, sino que más bien son aproximaciones en las que se han
omitido muchas variables de importancia secundaria, debemos
incluir un término de perturbación aleatoria, t u , que refleja todos
los factores – distintos de X -que influyen sobre la variable
endógena, pero que ninguno de ellos es relevante
individualmente. Con ello, la relación quedaría de la siguiente
forma:
(Uriel, 2004, p. 1)
213
6.5. Inferencias estadísticas sobre
la pendiente de la recta de
regresión
y i
b0 b1 X i
Donde b0 es en sí, el punto donde la recta corta al eje de las “x” y b 1 nos
da el grado de inclinación de la recta, de tal forma que cuando la
pendiente de la recta es positiva, se dice que la relación que existe entre
las dos variables dependiente e independiente es de naturaleza positiva,
es decir, que posee una gráfica como la indicada a continuación:
214
Relación positiva entre dos variables en regresión lineal
215
Relación negativa entre dos variables en regresión lineal
216
6.6. Análisis de correlación
Cuando es necesario resumir aún más los datos (de una gráfica por
ejemplo) se utiliza un solo número, que de alguna forma mide la fuerza de
asociación entre dos variables como son el ingreso real y el nivel de
educación escolar en nuestro caso. El análisis de correlación nos ayuda a
obtener dicho número que se conoce como: coeficiente de correlación.
Los valores de coeficiente de correlación siempre están entre –1 y +1 un
valor de +1 indica que las dos variables tienen una relación lineal positiva
perfecta. Esto es, todos los puntos de datos están en una línea recta con
pendiente positiva. Un valor de –1 indica que las variables tienen una
relación lineal negativa perfecta, y que todos los puntos de datos están en
una recta con pendiente negativa. Los valores del coeficiente de
correlación cercanos a cero indican que las variables no tienen relación
línea, (véase, Anderson, Sweeney & Willimas, 1999, p. 555).
r ( signodeb1 ) r2
217
De esta fórmula, resulta claro que el signo del coeficiente de correlación
es positivo si la ecuación de regresión tiene pendiente positiva (b1 > 0), y
negativo si la ecuación de regresión tiene pendiente negativa (b1 < 0).
218
RESUMEN DE LA UNIDAD
En esta unidad se revisó el método de regresión lineal simple así como su
aplicación e interpretación, la importancia de este método radica en que
se utiliza para observar el tipo de relación que existe entre dos variables y
poder llevar a cabo la toma de decisiones correspondiente dependiendo
de la relación entre dichas variables. Si fuera el caso en el cual existiera
una relación positiva entre las variables involucradas, la obtención del
coeficiente de correlación nos daría más información sobre el porcentaje
de relación existente y con esto determinar si es necesario incluir otra
variable independiente en el problema mismo.
219
GLOSARIO DE LA UNIDAD
Análisis de residuales
Análisis que se aplica para determinar si los supuestos acerca del modelo
de regresión parecen válidos. También se usa para determinar
observaciones extraordinarias o influyentes.
Coeficiente de correlación
Medida de la intensidad de la relación lineal entre dos variables.
Coeficiente de determinación
Medida de la bondad del ajuste de la recta de regresión. Se interpreta
como la parte de la variación de la variable dependiente “y” que explica la
recta de regresión.
Diagrama de dispersión
Gráfica de datos de dos variables en la que la variable independiente está
en el eje horizontal y la variable dependiente en el eje vertical.
yi yi
es minimizar
220
Observación influyente
Observación que tiene una fuerte influencia sobre el efecto de los
resultados de la regresión.
Recta de regresión
Estimación hecha a partir de datos de una muestra aplicando el método
de mínimos cuadrados para la regresión lineal simple, la ecuación de
Residual i-ésimo
Diferencia entre el valor observado de la variable dependiente y el valor
predicho usando la recta de regresión; para la i-ésima observación, el
residual es: yi yi
Variable dependiente
Es la variable que se predice o se explica. Se representa
matemáticamente por “y”.
221
Variable independiente
Es la variable que sirve para predecir o explicar. Se representa
matemáticamente por “x”.
222
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
ACTIVIDAD 2
223
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
224
EXAMEN DE AUTOEVALUACIÓN
225
4. ¿Es el símbolo comúnmente utilizado para denotar a la pendiente de la
recta de regresión?:
a) b0
b) b1
c) b2
Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24.3 12.5 31.2 28 35.1 10.5 23.2 10 8.5 15.9 14.7 15
Consumo 16.2 8.5 15 17 24.2 11.2 15 7.1 3.5 11.5 10.7 9.2
b) r 2 -0.844740208
c) r 2 1.844740208
226
LO QUE APRENDÍ
Sueldo
del 18.0 15.0 19.0 9.2 8.6 12.0 10.7 14.3 17.8 16.0 15.0
cliente
Gastos
del 14.8 10.4 15.7 7.1 5.3 8.0 8.5 10.2 13.0 14.0 11.3
cliente
Nota: tanto el sueldo como los gastos del cliente son mensuales y están
dados en miles de pesos.
227
f) el pronóstico de gasto para un cliente que gana $21,000.00
En conclusión, para este problema, entre más ganan los empleados,
más gastan.
228
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
229
Bibliografía complementaria
Sitios de Internet
Sitio Descripción
http://recursostic.educacion.es/ Barrios Calmaestra, Luis. (2005).
descartes/web/materiales_didac “Regresión lineal”, Estadísticas II,
ticos/bidimensional_lbarrios/reg Distribuciones bidimensionales.
resion_est.htm Descartes 2D Matemáticas
interactivas.
http://www.uv.es/uriel/material/ Uriel Jiménez, Ezequiel. (2004).
Morelisi.pdf Modelos de regresión lineal
simple, UV.
230
UNIDAD 7
232
INTRODUCCIÓN
Una serie de tiempo es el conjunto de datos que se registran a través del
tiempo sobre el comportamiento de una variable de interés, generalmente
los registros se realizan en periodos iguales de tiempo.
233
LO QUE SÉ
a) y b0 b1 X 2
i
i
b) y i
b0 b1 X i
i n
c) x i 1
xi
n
a) b0 Y b1 X
n n
n
Xi Yi
i 1 i 1
X iYi
i 1 n
b1 n
n
( X i )2
2 i 1
X i
b) i 1 n
c) y i
b0 b1 X i
234
3. La fórmula para determinar la ordenada al origen de la recta de
regresión es:
a) b0 Y b1 X
n n
n
Xi Yi
i 1 i 1
X iYi
i 1 n
b1 n
n
( X i )2
2 i 1
X i
b) i 1 n
c) y i
b0 b1 X i
n _
(Y Y ) 2
b) r 2 signo de b1 i 1
n _
(Y Y i ) 2
i 1
n _
(Y Y ) 2
r2 i 1
n _
(Y Y i ) 2
c) i 1
235
5. La fórmula para calcular el coeficiente de correlación es:
a) r ( signo de b1 ) r2
b) r ( signo de b0 ) r2
n _
(Y Y )2
c) r 2 signo de b0 i 1
n _
(Y Y i ) 2
i 1
b) 1, 1
c) 0, 1
b) 1, 1
c) 0, 1
236
TEMARIO DETALLADO
(8 horas)
237
7.1. Los cuatro componentes de
una serie de tiempo
La componente cíclica es la fluctuación que puede observarse que ocurre
alrededor de la tendencia. Cualquier patrón regular de variaciones arriba o
debajo de la recta que representa a la tendencia puede atribuirse a la
componente cíclica.
Estacionalidad (E)
La componente estacional muestra un comportamiento regular en los
mismos periodos de tiempo, reflejando costumbres o modas que se
repiten regularmente dentro del periodo de observación. En la gráfica la
estacionalidad quedaría representada por ejemplo por las variaciones
semanales en los rendimientos, no visibles por el periodo de información
que se está manejando.
Ejemplo
Supongamos que tenemos la información siguiente, correspondiente al
comportamiento del rendimiento de los Certificados de la Tesorería,
denominados CETES a 90 días, el tiempo está expresado en trimestres y
238
el valor de la variable en valores de la tasa de interés que ganan en cada
trimestre.
239
Rendimiento de CETES a 90 días
16
14
Rendimiento %
12
10
8
6
4
0
1 2 3 4 5 6 7 8 9 1 11 1 1 1 15 1 17
Trimestre
En donde:
Yt tasa de rendimiento calculada
X tiempo, en este caso expresado en trimestres
bo valor de Y cuando el valor del tiempo es cero
b1 pendiente de la recta de tendencia
240
en particular, la ecuación de regresión, que representa a la tendencia del
comportamiento de la tasa de rendimiento de los CETES a 90 días
aplicando las fórmulas correspondientes para el cálculo primero de “b1”
n n
n
Xi Yi
i 1 i 1
X iYi
i 1 n
b1 n
n
( X i )2
2 i 1
X i
i 1 n
b0 Y b1 X
es:
Yt = 10.8553676 - 0.44595588 X
r ( signodeb1 ) r2
241
cero nos dirá que este no existe. (nota: se deja al estudiante corroborar
los valores obtenidos de “b1”, “b0” y “r”)
242
Rendimiento de CETES a 90 días
Tendencia
16
14
12
10
Rendimiento en %
Tasa real
Tendencia
8
Comportamiento real
de
6 la tasa de rendimiento
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
243
7.3. Tendencia secular
Se denomina tendencia secular o simplemente tendencia a la trayectoria
temporal de crecimiento, decrecimiento o estabilidad que sigue una serie
cronológica a largo plazo. Movimiento unidireccional y persistente que
describe la evolución temporal de una determinada variable, una vez
depurada de sus variaciones estacionales, cíclicas y accidentales. Para
obtener la tendencia secular de una serie temporal se pueden emplear
diferentes métodos, como por ejemplo el de las medias móviles o el de los
mínimos cuadrados.
244
(cuatrimestre). Estas medias representan de forma aislada la
importancia de la componente estacional.
245
• Obtenidos estos índices, podemos desestacionalizar la serie
como en el método anterior. (Ruíz, 2004, §5.4)
Supongamos ahora que nos interesa conocer la variación que han tenido
los rendimientos respecto de la tendencia, es decir la componente cíclica,
la cual queda representada en la gráfica (Gráfica de apreciación de la
componente cíclica de los CETES a 90 días) por los valores mayores y
menores respecto de la tendencia. Si deseamos conocer el valor
numérico de este comportamiento debemos proceder como sigue:
Y
c 100
Yt
246
En donde:
Y representa el rendimiento registrado.
Yt representa el rendimiento calculado con la ecuación de tendencia.
247
15 5.51 4.17 132.26
16 5.02 3.72 134.94
17 5.07 3.27 154.85
150
140
130
Componente cíclica
120
Línea de tendencia
Porcentaje
110
100
90
80
70
60
50
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
248
observar que el rendimiento de estos bajó a continuación y apenas
pudieron igualarse los rendimientos alrededor del trimestre 16,
presentando una alza alrededor del trimestre 17, lo cual puede
representar una pérdida de tiempo y dinero para la persona que bien pudo
invertir algunos otros instrumentos que tuvieran mejores rendimientos.
(T )(C )( E )( I )
I
(T )(C )( E )
Rendimiento Componentes
Trimestre Real tendencia cíclica temporal Irregular
Yc C E I
1 14.03 10.41 134.78 96.52 103.61
2 10.69 9.96 107.29 100.96 99.05
3 8.63 9.52 90.68 91.46 109.34
4 9.58 9.07 105.60 95.98 104.19
249
5 7.48 8.63 86.72 96.52 103.61
6 5.98 8.18 73.11 100.96 99.05
7 5.82 7.73 75.26 91.46 109.34
8 6.69 7.29 91.80 95.98 104.19
9 8.12 6.84 118.68 96.52 103.61
10 7.51 6.40 117.42 100.96 99.05
11 5.42 5.95 91.09 91.46 109.34
12 3.45 5.50 62.68 95.98 104.19
13 3.02 5.06 59.71 96.52 103.61
14 4.29 4.61 93.02 100.96 99.05
15 5.51 4.17 132.26 91.46 109.34
16 5.02 3.72 134.94 95.98 104.19
17 5.07 3.27 154.85
Cálculo de la componente irregular
250
Rendimientos de CETES a 90 días
Componentes de la serie de tiempo
160
140
Cíclica
120
Irregular
Porcentaje
100
80
Tendencia
Estacional
60
40
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Trimestre
251
7.7. Modelos autoregresivos de
promedios móviles
Un proceso estocástico { zt } con índice temporal discreto se dice
estacionario si las distribuciones conjuntas de probabilidad asociadas con
un vector (zt^,z^2,...,z,k) son idénticas a las asociadas con el vector
(zl1+h,z ►Z+h,...,z^,^+h) obtenido por una traslación temporal, y esto
para todo conjunto (tl,t,,...,t^) de índices, para todo k y para todo h. Un
proceso estacionario tiene todos sus momentos invariantes a cambios en
el tiempo. Un proceso se dice "estacionario débil" si sus momentos de
primer y segundo orden (esperanzas matemáticas, varianzas,
covarianzas) son invariantes a cambios en el tiempo.
252
RESUMEN DE LA UNIDAD
Esta unidad es una introducción básica a los métodos elementales de
análisis y pronóstico de series de tiempo; primero se mostró, que para
explicar el comportamiento de una serie de tiempo es conveniente
suponer que la serie está formada por sus cuatro componentes básicos:
tendencia, cíclico, estacional e irregular. Posteriormente separamos cada
uno de estos componentes para medir su efecto, con lo cual logramos
pronosticar valores futuros de la serie de tiempo.
253
GLOSARIO DE LA UNIDAD
Componente cíclico
Componente del modelo de la serie de tiempo que causa una variación
periódica sobre y debajo de la tendencia, y la variación dura más de un
año.
Componente estacional
Componente del modelo de una serie de tiempo que muestra un patrón
periódico de un año o menos.
Componente irregular
Componente del modelo de una serie de tiempo que refleja la variación
aleatoria de los valores de la serie de tiempo, adicionales a los que se
pueden explicar con los componentes de tendencia, cíclico y estacional.
Constante de suavizamiento
Parámetro del modelo de suavizamiento exponencial, con el que se
calcula el factor de ponderación asignado al valor más reciente de la serie
de tiempo en el cálculo del valor del pronóstico.
Elaboración de escenarios
Método cualitativo de pronóstico que consiste en formar un escenario
conceptual del futuro, basado en un conjunto bien definido de supuestos.
254
Error cuadrático medio
Es un método con el que se mide la precisión de un modelo de
pronóstico. Es el promedio de la suma de las diferencias entre los valores
pronosticados y los valores reales de la serie de tiempo estando elevadas
al cuadrado esas diferencias.
Modelo auto-regresivos
Modelo de serie de tiempo donde se usa una relación de regresión
basada en valores anteriores de la serie para predecir valores futuros de
la misma.
Promedios móviles
Método de pronóstico o suavizamiento de una serie de tiempo, en el que
se promedia cada grupo sucesivo de puntos de datos.
255
Promedios móviles ponderados
Método de pronóstico o suavizamiento de una serie de tiempo con el que
se calcula un promedio ponderado de los valores de datos en el pasado.
La suma de los factores de ponderación debe ser igual a uno.
Pronóstico
Proyección o predicción de valores futuros de una serie de tiempo.
Serie de tiempo
Es un conjunto de observaciones medidas en puntos sucesivos en el
tiempo, o durante periodos sucesivos en el tiempo.
Suavizamiento exponencial
Técnica de pronóstico que emplea un promedio ponderado de una serie
de tiempo en el pasado para determinar valores de una serie de tiempo
suavizada, que se pueden usar para elaborar pronósticos.
Tendencia
Desplazamiento o movimiento de la serie de tiempo, a largo plazo,
observable a través de varios periodos.
256
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
Elabora un cuadro comparativo de lo que representa cada una de las
cuatro componentes de una serie de tiempo.
Representa
Componente de
tendencia
Componente cíclica
Componente de
estacionalidad
Componente irregular
ACTIVIDAD 2
Elabora un resumen de la forma en que se separa la componente de
tendencia en una serie de tiempo.
257
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
258
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
a)
y i
b0 b1 X i
Y
c 100
b) Yt
Y
C
T E I
c)
259
4. En el cálculo de la componente cíclica para cada valor real, debemos
auxiliarnos con la ecuación:
a) de la recta de regresión
b) del modelo multiplicativo de una serie de tiempo
c) de tendencia de la serie de tiempo.
(T )(C )( E )( I )
( E )( I )
6. En la expresión (T )(C ) obtenida a partir del
modelo multiplicativo de una serie de tiempo, el resultado contiene:
a) los efectos estacionales, junto con las fluctuaciones irregulares.
b) la tendencia, junto con las fluctuaciones irregulares.
c) solo las fluctuaciones irregulares.
260
LO QUE APRENDÍ
Los siguientes valores corresponden al tipo de cambio del dólar para 17 días
consecutivos. Con estos datos pronostique usted mediante una serie de tiempo
el tipo de cambio correspondiente para el día numero 18.
Día ($)
1
2 13.9058
3 13.9777
4 13.9382
5 13.9145
6 13.9325
7 14.0950
8 13.9342
9 14.1675
10 14.1513
11 14.1975
12 14.3097
13 14.5404
14 14.4667
15 14.2945
16 14.1778
17 14.1392
261
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
Bibliografía complementaria
262
Garza, Tomás. (1996). Probabilidad y estadística. México:
Iberoamericana.
Sitios de Internet
Sitio Descripción
http://ciberconta.unizar.es/LECC Arellano, M. (2001): "Introducción al
ION/seriest/100.HTM Análisis Clásico de Series de
Tiempo", [en línea] 5campus.com,
Estadística
http://maxsilva.bligoo.com/cont Silva Quiroz, Maximiliano. (2008).
ent/view/186499/Series-de- “Series de tiempo”, Estadística y
Tiempo.html empresa (13/05/08)
http://ciberconta.unizar.es/LECC Arellano, Mireya. (2001).
ION/seriest/inicio.html “Introducción al análisis clásico de
series de tiempo”, 5campus,com.
Estadística
http://www.eumed.net/cursecon/ Ruíz Muñoz, David. (2004). “Series
libreria/drm/1n.htm temporales: Determinación de las
variaciones estacionales”. Manual
de estadística. EUMED.
263
UNIDAD 8
PRUEBAS ESTADÍSTICAS NO
PARAMÉTRICAS
OBJETIVO ESPECÍFICO
Al terminar la unidad el alumno identificará las pruebas no paramétricas
más utilizadas.
265
INTRODUCCIÓN
En esta unidad se revisarán las pruebas no paramétricas y su utilidad
sobre todo cuando no se conoce la distribución de la cual provienen los
datos, lo cual impide hacer una estimación por intervalos de confianza o
una prueba de hipótesis.
266
LO QUE SÉ
Elige la respuesta correcta a la siguiente pregunta.
x
z
b)
k
( fo fe )2
c) z
i 1 fe
267
TEMARIO DETALLADO
(6 horas)
268
8.1. Diferencias entre los métodos
estadísticos paramétricos y no
paramétricos
Las pruebas no paramétricas son útiles sobre todo cuando no se conoce
la distribución del cual provienen los datos y, por tanto, no se conoce la
distribución del estadístico para hacer una estimación por intervalos de
confianza o una prueba de hipótesis. Estas pruebas son útiles por ejemplo
cuando el tipo de datos es nominal u ordinal.
La
Ho indica que no hay diferencias significativas entre las frecuencias
269
Paso 2. Elegir un nivel de significación ( ).
2
Paso 3. Elegir y calcular el estadístico de prueba e
270
de mínimos cuadrados en el análisis de regresión. Una propiedad básica
en estos modelos de regresión es que los errores son aleatorios.
2n1 n2 2n1 n2 n1 n2
r 2
n1 n2 n1 n2 1
Desviación estándar:
r r
z
Estadístico de prueba: r
271
H o : La muestra es aleatoria.
H1 : La muestra no es aleatoria.
r r
z
Estadístico de prueba: r
2n1 n2 2 52 48
r 1 1 50.92
La media es: n1 n2 52 48
La desviación estándar:
2n1n2 2n1n2 n1 n2 2 52 48 2 52 48 52 48
r 2 2
24.67 4.97
n1 n2 n1 n2 1 52 48 52 48 1
r r 40 50.92
z 2.20
Por lo tanto: r 4.97
272
8.3. La prueba del signo
En las estadísticas, la prueba de los signos se utiliza para probar la
hipótesis de que “no hay diferencia en las medianas entre las
distribuciones continuas de dos variables aleatorias X y Y, en la situación
en la que podemos extraer muestras de X y Y”.
273
8.4. La prueba de signos y rangos
de Wilcoxon
Se utiliza como una alternativa no paramétrica cuando se trata de
comparar los datos de 2 poblaciones o de una misma población mediante
una muestra apareada en la que cada unidad experimental genera 2
observaciones pareadas o ajustadas, una de la población 1 y una de la
población 2. Las diferencias entre las observaciones pareadas permiten
tener una buena perspectiva respecto de la diferencia entre las 2
poblaciones.
La prueba de los rangos con signo usa los rangos de los valores
absolutos de las diferencias pareadas, asignando el rango 1 a la
diferencia con valor absoluto mínimo, el rango 2 a la siguiente diferencia
con menor valor absoluto y así se procede sucesivamente. Se deben
descartar los rangos con diferencias de cero y en caso de valores
absolutos repetidos, a cada uno de ellos se les otorga el valor promedio
de los rangos ocupados por los valores repetidos. A cada uno de los
rangos positivos o negativos, se les asocia el signo correspondiente.
274
La suma de los rangos positivos se indica por T , la suma de los rangos
n n 1 ¨2n 1
T
Desviación estándar: 24
T T
z
y el estadístico de prueba es: T .
275
Diferencias Rango Rangos
con
Número Puntaje Diferencia absolutas
signos
Antes Después
Empleado b-a ordenadas correctos
(a) (b)
1 18 15 -3 2 1 1
2 60 70 10 3 2 -2
3 81 75 -6 4 3 -3
4 15 20 5 5 4 4.5
5 20 50 30 5 5 4.5
6 17 40 23 6 6 -6
7 26 50 24 8 7 -7.5
8 11 30 19 8 8 7.5
9 20 40 20 9 9 -9
10 38 30 -8 10 10 10.5
11 80 85 5 10 11 10.5
12 59 86 27 11 12 12
13 12 72 60 19 13 13
14 87 98 11 20 14 15
15 88 79 -9 20 15 15
16 64 88 24 20 16 15
17 88 90 2 23 17 17
18 76 96 20 24 18 18.5
19 43 39 -4 24 19 18.5
20 90 98 8 27 20 20
21 40 60 20 30 21 21
22 50 60 10 60 22 22
276
Se obtienen las diferencias de los puntajes antes y después, sus
diferencias, las diferencias absolutas ordenadas, sus rangos y los rangos
con signos correctos.
n n 1 22 22 1
S T T 253.0
Comprobación: 2 2
T T
z
Estadístico de prueba: T
n n 1 22 23
T 126.5
La media es: 4 4
277
n n 1 2n 1 22 23 43
T 30.1
La desviación estándar: 24 24
T T 225.5 126.5
z 3.29
Por lo tanto: T 30.1
Como
z zc cae en la zona de rechazo, se puede concluir que el
278
RESUMEN DE LA UNIDAD
En esta unidad se revisaron las pruebas no paramétricas más utilizadas,
cuando no se conoce la distribución de la cual provienen los datos, como
se pudo observar, las pruebas no paramétricas resultan más accesibles
de realizar y comprender ya que no requieren mediciones más exactas de
parámetros poblacionales.
279
GLOSARIO DE LA UNIDAD
Métodos no paramétricos
Métodos estadísticos que requieren muy pocos o ningún supuesto acerca
de las distribuciones de probabilidad de la población, y acerca del nivel de
medición. Estos métodos se pueden aplicar cuando se dispone de datos
nominales u ordinales.
Prueba de signo
Prueba estadística no paramétrica que permite identificar diferencias entre
dos poblaciones basándose en el análisis de datos nominales.
280
ACTIVIDADES DE APRENDIZAJE
ACTIVIDAD 1
1. Una manufacturera automotriz desea conocer la preferencia de los
clientes por los colores ocre o índigo del modelo de lujo, pues sólo uno
saldrá al mercado. Se invitó a los 20 mejores vendedores para que
opinaran y se encontró que doce prefirieron el color ocre, siete el índigo y
uno indeciso. En un nivel del 10% probar si:
H0: Cualquier color gustará por igual a los clientes
H1: Hay preferencia por alguno de los colores de los clientes
281
CUESTIONARIO DE
REFORZAMIENTO
Contesta el siguiente cuestionario.
282
4. ¿Pueden los vendedores considerarse igualmente efectivos? Prueba
con un nivel de significancia de 0.05.
A,A,B,A,A,B,B,A,A,A,A,B,B,A,A,B
A,B,A,B,B,B,A,B,A,B,B,B,A,B,B,B
283
EXAMEN DE AUTOEVALUACIÓN
Elige la respuesta correcta a las siguientes preguntas.
284
4. Se utiliza como una alternativa no paramétrica cuando se trata de
comparar los datos de 2 poblaciones o de una misma población
mediante una muestra apareada
a) la prueba de signos y rangos de Wilcoxon
b) las pruebas no paramétricas
c) prueba de Mann-Whitney-Wilcoxon
285
LO QUE APRENDÍ
Explica la diferencia entre una prueba estadística paramétrica y una
prueba estadística no paramétrica.
286
MESOGRAFÍA
Bibliografía sugerida
Bibliografía básica
287
Bibliografía complementaria
288
Sitios de Internet
Sitio Descripción
http://www.itch.edu.mx/academic/indus Torre, Leticia, de la. (2003)
trial/estadistica1/cap04.html “Pruebas chi-cuadrada y
estadística no paramétrica”,
Curso de Estadística I,
Instituto Tecnológico de
Chihuahua.
http://scientific-european-federation- Scientific European
osteopaths.org/es/prueba-estadisticas Federation of Osteopaths.
(2012). “Las pruebas
estadísticas” Metodología de
la investigación científica.
http://www.uclm.es/actividades0708/cur Sánchez Sánchez, Fco.
sos/estadistica/pdf/descargas/SPSS_Pr (2008). “SPSS Pruebas no
uebasNoParametricas.pdf paramétricas”, Curso de
Estadística avanzada, UCLM,
http://scientific-european-federation- Scientific European
osteopaths.org/es/test-estadisticos Federation of Osteopaths.
(2012). “Los test estadísticos”
Metodología de la
investigación científica.
289
RESPUESTAS A LOS EXÁMENES
DE AUTOEVALUACIÓN
U1 U2 U3 U4 U5 U6 U7 U8
E1 E2 E1 E2 E1 E1 a E1 E1 E1
1. d v v d b b a a a a
2. c v f b a b a c c c
3. a f v b c c a b b b
4. b f v d b b c a
5. d v v c a a b
6. d v v c c a
7. b f f d b
8. a f b
9. c v d
10. b e
290