Estadística Aplicada A Los Negocios
Estadística Aplicada A Los Negocios
Estadística Aplicada A Los Negocios
Tomar decisiones es una actividad inherente a los gerentes en el contexto actual. El docente en ciencias
administrativas asume la gran responsabilidad de transmitir los conocimientos sustanciales que permita al
estudiante internalizar los conceptos y prácticas más elementales del conocimiento actualizado, en cada
materia curricular que estudia.
El proceso de toma de decisión cae en dos contextos; decisiones programadas y no programadas, éstas a
la vez pueden ser cualitativas y cuantitativas. En caso de la primera se basa en corazonadas, prejuicios,
intuiciones, observaciones, etc. El segundo, requiere procedimientos y técnicas matemáticas, para
recopilar, procesar y analizar los datos para convertirlas en información que precisamente constituye
insumo para la toma de decisión.
De antemano agradecemos las observaciones y sugerencias que nos hagan llegar a nuestro correo
electrónico zeusore@hotmail.com las cuales serán tomadas en cuenta para ir mejorando las próximas
publicaciones.
El autor.
INDICE
INTRODUCCIÓN
INDICE
UNIDAD I: ESTADÍSTICA
Definición
Tipos de estadística
Estadística descriptiva
Estadística inferencial
Estadística y la Investigación Científica
Variables
Población
Muestra
Muesttreo
Métodos de recolección y tabulación de datos
Observación
Encuesta
Entrevista
Cuestionario
Prueba de Hipótesis
Prueba de hipótesis
Establecimiento de hipótesis nula y alterna
Errores tipo I y tipo II
Prueba unilateral sobre la media de una población: muestra grande
Prueba Bilateral sobre la media de una población: muestra grande
Pruebas sobre media de una población: caso n ≤ 30
Pruebas sobre la proporción de una población
Cálculo de probabilidad de errores de tipo II
Determinación de tamaño de muestra para una prueba de hipótesis sobre una media población
BIBLIOGRAFÍA
UNIDAD I
ESTADISTICA
1.1 DEFINICIONES
"La estadística constituye una disciplina con ilimitadas posibilidades de aplicación en diversos
campos de la actividad humana". H. B. Christensen.
El término estadística tiene su raíz en la palabra Estado. Surge cuando se hace necesario para
sus intereses cuantificar conceptos. En la mayoría de los casos esta cuantificación se hará en
función de unos fines económicos o militares. El estado quiere conocer censo de personas, de
infraestructura, de recursos en general, para poder obtener conclusiones de esta información.
De ahí el nombre de estadística descriptiva, ya que el objetivo es, a partir de una muestra de
datos (recogida según una técnica concreta), la descripción de las características más
importantes, entendiendo como características, aquellas cantidades que nos proporcionen
información sobre el tema de interés del cual hacemos el estudio.
Procedimiento estadístico que emplea métodos para organizar, resumir y presentar datos de
manera informativa:
Ejemplo 1: Supongamos que contamos con 500 alumnos en la Escuela de Formación
Profesional de Administración de Empresas y, queremos hacer un estudio
estadístico sobre su altura.
Un método sería pasar clase por clase y medirlos a todos, esto nos podría llevar un
tiempo considerable pero sería la forma más exacta de hacer dicho estudio,
aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y
pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos
todos los datos en nuestro poder los resultados los obtendríamos mediante
Estadística descriptiva.
Otra posibilidad podría ser pasar clase por clase, decirles a los alumnos y alumnas
que anoten su estatura en un papel y recogerlos todos. También así tendríamos un
estudio de Estadística descriptiva, aunque seguramente menos fiable que con el
método anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos
alumnos escriban su estatura a cálculo y otros, con ganas de bromas, muy por
encima o muy por debajo de la realidad.
Ejemplo 2: Sondeo de opinión sobre las preferencias electorales encontró que, de 1,000
electores encuestados; 22% votarán por el candidato A, 19% por candidato B y
11% por el candidato C.
La estadística “22%”, “19%” y “11%” describen el número de cada 1,000
electores votarán por A, B y el C.
Ejemplo 3: Sondeo de opinión arroja que 25% de una población de 2,000 consumidores de un
producto de una empresa, saben sobre la calidad y las bondades alimenticias del
producto que consumen.
Ejemplo 4: Según el Rector de la UNSCH, los decanos de las Facultades reportan 9 problemas
por cada 300 estudiantes relacionados con la deficiencia en el rendimiento
académico de los estudiantes.
Otra posibilidad sería escoger una muestra, es decir un grupo de por ejemplo 50
personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a toda la
Escuela de Formación Profesional de Administración con Estadística inferencial.
En este caso, comprobaríamos por una parte que cuanto mayor sea la muestra más
trabajo tendremos, pero más fiable será el resultado final y por otra, que la
elección de la muestra debe hacerse de manera que permita también fiarnos del
resultado obtenido.
Ejemplo 3: El jefe de control de calidad de una empresa elegirá una muestra (parte) de los
productos para verificar la calidad de todos los productos.
Ejemplo 4: Un gerente de Marketing recaba opiniones, a partir de una muestra de clientes, para
verificar el nivel de satisfacción, con respecto a la calidad y precio del producto.
Ejemplo 5: El gerente de la Cooperativa Santa María Magdalena recaba opinión de una muestra
de los socios que acuden a las ventanillas de atención, para obtener información
sobre la calidad del servicio y atención de los trabajadores que atienden en este
servicio.
1.4 VARIABLES
1.4.1 Variable cualitativa: Son aquellas que toman un número limitado de modalidades. A cada
modalidad corresponde una categoría de individuos; estas categorías forman una partición de la
población. Este tipo de variables representan una cualidad, característica o atributo que clasifica
a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se
clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de
clasificación no es suficiente y se requiere de un mayor número de categorías (color de los ojos,
grupo sanguíneo, profesión, etc.).
Escalas nominales o categóricas: ésta es una forma de observar o medir en la que los datos
se ajustan por categorías que no mantienen una relación de orden entre sí (color de los ojos,
estado civil sexo, rubio, morenos, profesión, presencia o ausencia de un factor de riesgo o
enfermedad, etc.).
Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grado de educación, grado académico, niveles laborales, tiempo de experiencia,
modalidad laboral, etc.).
1.4.2 Variable cuantitativa: Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente: edad, peso, ingreso, rendimiento, nº. de hijos, etc. Esta a su vez la podemos
subdividir en:
a) Variable discreta, una variable que teóricamente puede tomar cualquier valor entre dos
valores dados se denomina variable discreta. Es decir, cuando sólo toma valores que
corresponden con los números naturales, pero no adopta los comprendidos entre dos de
ellos. Se obtiene a través de una operación de conteo y no admite seccionamiento (decimal),
ya que representa solo cantidades exactas. No admiten todos los valores intermedios en un
rango. Suelen tomar solamente valores enteros.
Ejemplos:
b) Variable continúa, se presenta cuando se puede tomar cualquier valor real entre un
intervalo, es decir; son aquellas variables que toman todos los valores comprendidos entre
dos de ellos. Se reconoce cuando elegidos dos valores cualquiera, existe una cantidad
infinita de valores posibles ubicados entre ellos, por más cercanos que sean, que puede
tomar la variable. la que puede tomar los infinitos valores de un intervalo. En muchas
ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan
que puedan existir todos los valores del intervalo.
Ejemplos:
1.4.5 Variable Interviniente: Son los factores que pueden afectar la relación entre variables y la
investigación. Por ejemplo: El horario de clases, el nivel económico, el dominio del tema por
parte del profesor, la capacidad de concentración de los alumnos, los recursos didácticos, entre
otras.
1.5 POBLACIÓN
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una
población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas
(1974).
Ejemplo:
Los miembros del Colegio de Licenciados en Administración, las Instituciones públicas de
Ayacucho, los trabajadores de la UNSCH, cantidad de productos en un lote de producción, cantidad
de libros en una biblioteca, etc.
El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación
estadística, y este tamaño vienen dado por el número de elementos que constituyen la población,
según el número de elementos la población puede ser finita o infinita. Cuando el número de
elementos que integra la población es muy grande, se puede considerar a esta como una población
infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que
está formada por un limitado número de elementos, por ejemplo; el número de estudiante de la
Escuela de Formación Profesional de Administración, cantidad de docentes de la EFPAE, etc.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte
en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se
utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos
son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una
pequeña parte del grupo llamada muestra.
1.6 MUESTRA
"Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murria R.
Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin &
Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se
obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Licenciados en Administración de Ayacucho.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva
menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la
aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel
de calidad.
Una muestra representativa contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer
referencias sobre la población que está representada por la muestra. En consecuencia muestra y
población son conceptos relativos. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
1.7 MUESTREO
GENERALIDADES.- Una empresa cualquiera, sin importar su tamaño y naturaleza, enfrenta una
serie de situaciones de decisión como las siguientes:
Así también, hacer un estudio de todos los elementos en estos casos (población) es casi imposible
(costo, tiempo, procedimiento, etc.), entonces se requiere sistematizar la información para posibilitar
su estudio. La forma de sistematizar es extraer grupos (muestras) representativas de entre todos los
elementos de la población con el objeto de estudiarlas y que los resultados infieran los valores y las
características de toda la población en forma objetiva y racional.
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el
muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se
procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
N
n -p, Pn, sólo estiman los
p estima
(=)
Xn valores y características de la
población, porque (n) sólo
contiene una parte de la
población.
- ¿Qué tan buenos estimadores
(=) Pn podemos ser, entonces? ...
utilizamos procedimientos
PN E Estimación estadísticos.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no
necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de la Escuela de Formación Profesional de
Administración de la UNSCH, determinando por lo menos dos caracteres ser estudiados en dicha
población;
Provenientes de Colegios Estatales
Visión Empresarial.
TIPOS DE MUESTREO:
Existen dos métodos para seleccionar muestras de poblaciones:
a) MUESTREO NO ALEATORIO O DE JUICIO.- Una muestra seleccionada por muestreo de
juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio
se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.
Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad.
Ejemplo: Selección de periodistas a personalidades para que expresen su opinión sobre un suceso
general, “creyendo” que son los más versados para emitir algún juicio u opinión técnica
especializada.
N=X
Población finita
Es este caso, elaborar el perfil general conllevaría estudiar a cada uno de los
trabajadores, no imposible pero costoso en tiempo y dinero. Entonces utilizamos el
proceso muestral; en este caso n = 100.
SOLUCION
640 = 3 dígitos
N
N!
n = n!( N n)!
N=
Población infinita
SOLUCION
Una (n) aleatoria simple de una N = debe satisfacer las siguientes condiciones:
En los estratos se toman una muestra aleatoria simple de cada uno de ellos. El valor del
muestreo aleatorio estratificado depende de cuan homogéneas sean los elementos dentro de los
estratos, por tanto, varianzas pequeñas.
Ejemplo: Se quiere estudiar los niveles de colesterol sérico en personas mayores de 45 años con
cardiopatía isquémica que concurren a determinado centro de salud asistencial. Para ello se
tiene en cuenta la variable sexo como de estratificación, conociendo que el 70% de dicha
población es de sexo masculino.
Se decide tomar una muestra de 120 personas. Proporcional: 70% masculino (84) y 30%
mujeres (36).
Ventajas:
- Aumento de la precisión sobre el estudio
- Estimación separada para cada estrato
- Bajos costos de muestreo
Desventajas:
- Es necesario un marco para cada estrato
Desventajas:
- Las inferencias que se hacen en dicho muestreo no son tan confiables comolas del Muestreo
Aleatorios.
- Menor precisión en las estimaciones.
Ahora veremos el asunto que debe tener la muestra para obtener una estimación de una proporción
poblacional con determinado nivel de precisión.
2
Z P1 P
P1 P
E Z
n = 2 2
2 n E
1.- Usar la proporción muestral de una muestra anterior de las mismas unidades.
2.- Llevar a cabo un estudio piloto para seleccionar una muestra preliminar de unidades. La
proporción muestral a partir de esta muestra se puede usar como valor de planeación para P.
3.- Usar el juicio o un “estimado mejor” del valor de P.
4.- Si no se aplica alguna de las alternativas, usar P = 0.50.
Ejemplo: Tomando los usuarios de ESSALUD – Ayacucho. ¿Qué tan grande debe ser la muestra si
el responsable de la encuesta quiere estimar la proporción poblacional con margen de error
de 0.025 y con nivel de confianza de 95%.
Datos:
n =?
E = 0.025
N. C. = 0.85
P = 0.48
i) = (1 - .095) = 0.05
ii) = 0.025
2
iii)0.5000 – 0.025 = 0.475 (buscar en la tabla Z) = 1.96
iv) n =
1.962 0.481 0.48 = 1,534.18 1,534 usuarios
0.0252
Entonces, el tamaño de la muestra mínimo bebería ser de 1,534 usuarios para llenar el requisito de
margen de error.
Z 2 PQN
n
( N 1)(e) 2 Z 2 PQ
n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimación (5%)
N = Tamaño de la población
p = Probabilidad que salga variable independiente (0.5 ≈ 50%)
q = Probabilidad que salga variable independiente (0.5 ≈ 50%)
Z 2 PQ
n
(e) 2 Z 2 PQ
n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimación (5%)
p = Probabilidad que salga variable independiente (0.5 ≈ 50%)
q = Probabilidad que salga variable independiente (0.5 ≈ 50%)
1.9 MÉTODOS DE RECOLECCIÓN Y TABULACIÓN DE DATOS
Es importante destacar que los métodos de recolección de datos, se puede definir como: al medio a
través del cual el investigador se relaciona con los participantes para obtener la información necesaria
que le permita lograr los objetivos de la investigación.
1.9.1 Observación:
Cuando se decide utilizarla hay que tomar en cuenta ciertas consideraciones. Como método de
recolección de datos, debe ser planificado cuidadosamente para que reúna los requisitos de
validez y confiabilidad. Se le debe conducir de manera hábil y sistemática y tener destreza en el
registro de datos, diferenciando los aspectos significativos de la situación y los que no tienen
importancia.
También se requiere habilidad para establecer las condiciones de manera tal que los hechos
observables se realicen en la forma más natural posible y sin influencia del investigador u otros
factores. Cuando se decide usar este método es requisito fundamental la preparación cuidadosa
de los observadores, asegurándose así la confiabilidad de los datos que se registren y
recolecten.
Posibles errores con el uso del método de observación. Sobre el uso del método de
observación, Quinteros comenta que, “las condiciones de una investigación puede ser
seriamente objetables si el diseño de la misma no se ha tomado en cuenta los posibles errores
de observación”
También se considera que según el papel que ajusta el observador se puede incurrir en mayores
o menores errores; este papel puede ser el de observador no participante o participante.
Los errores referentes al instrumento de observación se relacionan con los desaciertos en que se
incurre en su elaboración y lo que se desea medir. Esto se evita con una definición operacional
y libre de ambigüedades e imprecisiones de las variables en estudio, especificando en el
instrumento los criterios o indicadores de la medición de tales variables.
La especificidad de ese instrumento está relacionada con el problema, objetivos y forma en que
se va a hacer la observación. Una de esas formas es la denominada observación simple, no
regulada o no controlada, en la que solo se tienen unos lineamientos generales para la
observación sobre los aspectos del fenómeno que le investigador tienen interés en conocer. La
otra forma es la sistemática, regulada o controlada, en la que se dispone de un instrumento
estandarizado o estructurado para medir las variables en estudio de una manera uniforme.
El primero se usa mas en estudios exploratorios y el segundo esta dirigido a quienes desean
probar hipótesis en que se debe especificarse claramente qué se observara, cómo se observara y
cómo se hará el registro de datos.
Los errores relacionados con el objeto que se observa se dan cuando los aspectos que deben ser
conocidos de las unidades o fenómenos de observación no se presentan en igualdad de
condiciones para todos ellos, ya sea porque varíen las circunstancias en que se observa el
fenómeno o a la propia variabilidad del sujeto en estudio. A manera de ejemplo, se puede citar
que si existe interés en evaluar el desempeño de un agente de salud en las zonas rurales de las
regiones sanitarias, puede ser que la situación donde labore una gente sea diferente en una u
otra región, ya sea por carencia o disposición de equipos y materiales u otros factores. La
variación de circunstancias de las regiones sanitarias puede conducir a errores de medición, de
análisis o interpretación de los hechos observados. La variabilidad en el sujeto se daría ante la
situación de que unos agentes de salud tengan mayor experiencia que otros o que hayan
egresado recientemente de un programa educativo; estos últimos probablemente tendrán menos
destreza en el desempeño de su labor.
Por lo tanto, es necesario buscar mecanismos para que las unidades en estudio estén en
igualdad de condiciones durante esa medición y que se definan las características del fenómeno
que se pretende observar, procurando que en la muestra esos elementos reúnan características
similares.
1.9.2 La entrevista
Se estima que este método es más eficaz que el cuestionario, ya que permite obtener una
información más completa. A través de ella el investigador puede explicar el propósito del
estudio y especificar claramente la información que necesita, si hay una interpretación errónea
de la pregunta permite aclararla, asegurando una mejor respuesta. Best afirma “es también
posible buscar la misma información por distintos caminos en diversos estadios de la
entrevista”, obteniéndose así una comprobación de la veracidad de las respuestas.
Como técnica de recolección de datos la entrevista tiene muchas ventajas; es aplicable a toda
persona, siendo muy útil con los analfabetas, los niños o con aquellos que tienen limitación
física u orgánica que les dificulte proporcionar una respuesta escrita. También se presta para
usarla en aquellas investigaciones sobre aspectos psicológicos o de otra índole sonde se desee
profundizar en el tema, según la respuesta original del consultado, ya que permite explorar o
indagar en la medida que el investigador estime pertinente.
Este tipo de entrevista es muy útil en los estudios descriptivos y en las fases de exploración
para el diseño del instrumento de recolección de datos.
Aun con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo
investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo
de investigación.
1.9.3 Cuestionario
Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para
proporcionar información sobre un mayor número de personas en un periodo bastante breve y
la facilidad de obtener, cuantificar, analizar e interpretar los datos.
Dentro de las limitaciones de este método figuran las siguientes: es poso flexible, la
información no puede variar ni profundizarse, si el cuestionario es enviado por correo se corre
el riesgo de que no llegue al destinatario o no se obtenga respuesta de los encuestados; además,
resulta difícil obtener una tasa alta de compleción del cuestionario. Debido a esa posible
pérdida de información se recomienda cuando se use este método una muestra más grande de
sujetos de estudio.
En general, en el proceso de recolección de datos para una investigación, estos métodos e
instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus
características propias y la información que se requiera, dan flexibilidad para que el
investigador determine su uso apropiado según el estudio a realizar.
1.9.4 Experimento
Método en el cual las variables pueden ser manipuladas en condiciones que permiten la reunión
de datos, conociendo los efectos de los estímulos recibidos y creados para su apreciación. En el
experimento existe un control directo sobre un factor delos que se va analizar. La
experimentación exige seleccionar grupos pareados de sujetos, someterlos a tratamientos
distintos, controlar las variables y comprobar si las diferencias observadas son significativas.
La finalidad de la investigación experimental es descubrir las relaciones causales, descartando
para ello las explicaciones alternas de los resultados. El método experimental suministra los
datos más convincentes si se aplican los controles adecuados. En la medida en que el diseño y
la ejecución del experimento excluyan otras hipótesis que expliquen los mismos resultados, el
gerente de investigación y el de mercadotecnia estarán seguros de la veracidad de las
conclusiones.
Para aceptar o rechazar una hipótesis nula debemos efectuar una partición adecuada
del dominio de la distribución muestral, en dos regiones mediante un punto C, denominado
punto crítico: la región de rechazo ( R ) y la región de aceptación (A).
A R
C
Reg. de Aceptación Región de Rechazo
Ho : 12.5
HA : 12.5
SOLUCION
H₀ : 640
HA : 640
En general, una prueba de hipótesis referente a los valores de una media de población debe
asumir una de las tres formas siguientes:
H₀ : H₀ : H₀ :
HA : HA : HA :
La hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí. La
hipótesis nula H₀ es verdadera o lo es la hipótesis alternativa HA, pero no ambas. En el caso
ideal, el procedimiento de prueba de hipótesis debe conducir a la aceptación de H₀ cuando sea
verdadera y al rechazo de HA cuando HA sea verdadera. Desgraciadamente no siempre son
posibles las conclusiones correctas. Como las pruebas de hipótesis se basan en información de
muestras, debemos considerar la posibilidad de errores.
Condición de la
población
H₀ HA
Decisión Verdadera Verdadera
Ejemplo: La etiqueta de ½ litro de agua gaseosa dice que ese envase contiene 500 ml. Se
quiere comprobar esa aseveración mediante una prueba de hipótesis. El interés es
detectar botellas incompletas de lo que afirma el fabricante.
SOLUCION
x = x = 5
= 0.71
n 50
= 500
Probar:
H₀ : 500 m. l.
HA : 500 m. l
= 0.01 x = x = 5
= 0.71
n 50
X
= 500
Se rechaza H₀ No se rechaza H₀
Se rechaza H₀ = 500 X
x o
Zc = Nota: Cuando la región de rechazo está sólo
en un lado de distribución de muestreo,
n se dice prueba de hipótesis unilateral.
= 0.01
2.33 0
Se rechaza H₀
498 500
Zc = = - 2.83
5
50
La regla es:
Zc > Zt : Se rechaza H₀ : 500 y se acepta HA : 500
Zt > Zc ; Se rechaza HA : 500 y se acepta la H₀ : 500
-.2.33 0
Se rechaza H₀
a) Empleo de los valores P.- Es otro método empleado para llegar a la conclusión de la
prueba de hipótesis, basada en una probabilidad del valor de P. Se supone que la
hipótesis nula es verdadera, el valor de P es la probabilidad de obtener un resultado de
la muestra que sea al menos tan importante como el que se observa.
-.2.33 0
Se rechaza H₀
iv) Este valor P indica una probabilidad reducida de obtener una media muestral tan
pequeña como X = 498 cuando H₀ es verdadera.
La regla es:
Rechace H₀ si P
x o 499 500
Zc = Zc = = - 1.41 no está en la región de rechazo
5
n 50
(Zc = -1.41) (Zt = - 2.33); se acepta HA: 500 y se rechaza HO: 500
La regla es:
Zc Zt : Se rechaza HA y se acepta H₀
Zc Zt : Se acepta HA y se rechaza H₀
A) USANDO X
SOLUCION
Suponiendo:
0 .0
ii) Región de rechazo bilateral = = 0.005, tal como:
2 2
-.2.57 0 2.57
Se rechaza H₀ Se rechaza H₀
Regla de Rechazo:
X 28 30
Zc = = Zc = = - 2.53
s 5
n 40
B) USANDO P
i) X = 28
Z = -2.53 (buscar en la tabla Z) = 0.4945. Entonces, 0.5000 – 0.4945 = 0.0055 = P
Zt = 2.57
P = 0.0055 x 2 = 0.011
Regla:
Rechazar H₀ si P
2
Aceptar H₀ si P >
2
Si: = 0.01 = 0.005
2
P (0.011) (0.005), por tanto, no se rechaza la H₀
2
C) RELACION ENTRE LA ESTIMACIÓN POR INTERVALO Y LA PRUEBA DE
HIPÓTESIS
x Z
2
n
ii) Cuando no se conoce sino y se estima a partir de S
S
x Z
2 n
iv) La región de no rechazo para H₀ comprende todos los valores de la media X que están
entre los errores estándar - Z y + Z de ₀.
2 2
₀ Z ; ₀ Z
s
2
n 2
n
REGLA:
Si el intervalo contiene el valor ₀ , no rechace
H₀. En caso contrario rechace H₀
Ejemplo:
Datos: H₀ : = 30 i) = 1 – 0.95 = 0.05 (/2 =0.025 0.5000 – 0.025 = 0.475)
Buscando en la tabla, Z = 1.96.
26.45 ₀ 29.55
iii) Conclusión ₀ = 30 no está comprendido en el
intervalo, por tanto, rechazar la H₀
i) Cuando se conoce
X o
Z=
n
X o ( Xi X ) 2
t= Donde S =
S n 1
n
0 No opina
0 Pésimo
1 Regular
2 Bueno
3 Muy bueno
4 Excelente
SOLUCION
X I 4 3 ... 2
i) X = = = 3.05
n 20
( X i X ) 2
S= = 0.99 1.0
n 1
ii) Suponiendo:
= 0.05 (nivel de significancia)
2
H₀ : 3
HA : 3
REGLA DE RECHAZO:
Sí. tc tt. Acepte HA y Rechace H₀
Sí: tt tc: Acepte Ho y Rechace HA
Entonces:
X o
tc = S
tc = 3.051 3 = 0.224
n 20
SOLUCION
i) H₀ : = 350
HA : 350
( X i X ) 2
iii) S = = 0.16
n 1
iv) = 0.05 , = 0.025 (nivel de significancia)
2
v) tn –1, = t9, 0.025 = 2. 262
2
-2.262 0 2.262
Se rechaza H₀ Se rechaza H₀
REGLA DE RECHAZO:
Rechace H₀ sí tc , < tt
Entonces:
X o 350
tc = S
tc = 350.059
16
= 1.17
n 10
Ejemplo:
DATOS:
P = 0.35 de productos buenos
n = 120
Después de una capacitación
P = 0.38
Se desea saber el efecto de la capacitación para mejorar la calidad
Pq .35 x0.65
i) H₀: P P₀ ii) p = = = 0.0435
n 120
Ha: P P₀
P1 P0
Z=
Pq
n
-
- Z 0 0 Z - Z/2 Z/2
Entonces:
118 120
iii) Z = = -1.0 iv) -1.0 (buscar en la tabla Z) = 0.3413
12
36
iv) 0.5000 – 0.3413 = 0.1587 = 15.87% es la probabilidad de cometer error de tipo II.
Si H₀: ₀
Ha: ₀
La parte superior de la figura, es la distribución muestral de X cuando H₀ es verdadera y
= ₀. Observe que el nivel de significancia , especificado por el usuario, determina la
región de rechazo de la prueba. Sea C el valor crítico tal que X < C determina la región
de rechazo para la prueba. Si Z representa el valor de Z que corresponde a un área de
en la cola de la distribución de probabilidad normal estándar, C se calcula mediante la
siguiente ecuación:
C = ₀ - Z para:
n
X cuando
Distribución muestral de
H₀ es verdadera y = ₀
Se rechaza H₀
₀
P =
n
X cuando
Distribución muestral de
H₀ es verdadera y a < ₀
C
C = a + Z para la figura anterior
n
₀ - Z = a + Z
n n
₀ - a =
Z Z
n
Z Z
O a
n=
Z Z 2
2
O a 2
Leyenda:
Datos:
i) H₀: 120
Ha: 115
ii) Aseveraciones:
v) n =
1.645 1.2822 122 = 49
120 1152
EJERCICIOS DE REPASO
1.- Un artículo reciente indica que la edad media de las computadoras es igual o mayor a 10
años, con desviación estándar de 2. Después de contrastar una muestra de 18
computadoras, la media es de 9,98 años. Desarrolle la prueba de hipótesis con nivel de
riesgo 0.01.
2.- Con respecto a la información del problema anterior, se realizó otra prueba estadística con
20 muestras arrojando como resultado; media = 8.89 y desviación estándar 3. Determine la
prueba de hipótesis.
4.- Una cadena de tiendas de descuento expide su propia tarjeta de crédito. El gerente de esta
función desea averiguar si el saldo insoluto (sin pagar) medio mensual es mayor que $ 400.
El nivel de significancia se fija en 0.05. Una revisión aleatoria de 172 saldos insolutos
reveló que la media muestral es $407, y que la desviación estándar de la muestra vale $ 38.
¿Debería concluir el funcionamiento de crédito que la media poblacional es mayor que $
400, o bien es razonable suponer que la diferencia de $7 (obtenida de $407 - $400 = $7) se
debe al azar? ¿Cuál es el valor de P?
7.- Suponga que en la próxima temporada 2 empresas, para seguir en el mercado, deben
absorber al menos 35% de los consumidores. La empresa A está interesada en evaluar la
oportunidad que tiene de lograr posicionarse, y planea la realización de una encuesta que
incluya 2,000 consumidores a nivel regional. ¿Cuál es la probabilidad de posicionamiento
de la empresa A, considerando un nivel de riesgo 0.05 y que en una investigación muestral
760 dijeron ser consumidores de la empresa A? ¿Cuál es el varo de P?
UNIDAD II
Esta distribución tiene la característica de que puede ser usada en aquellos casos en los que el tamaño
de muestra esta limitado, debido a las características del experimento a realizar.
Por ejemplo. En la industria es común encontrarse con productos que debido a los materiales y/o
proceso son sumamente caros y para realizar la prueba es necesario destruirlos.
En estos casos el tamaño de la muestra debe ser pequeño cinco a ocho pares.
Una limitación en la aplicación de este estadístico es que la población de la que se toma la muestra
tiene una distribución normal.
Técnicamente se puede describir la prueba t de Student como aquella que se utiliza en un modelo en
el que una variable explicativa (var. independiente) dicotómica intenta explicar una variable
respuesta (var. dependiente) dicotómica.
La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos
descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A
través de estos estadísticos previos se calcula el estadístico de contraste experimental. Con la ayuda
de unas tablas se obtiene a partir de dicho estadístico el p-valor. Si p<0,05 se concluye que hay
diferencia entre los dos tratamientos
Ejemplo:
Solución
i) Datos:
n = 10
µ = 30
α = 0.01
X=?
S=?
ii) Cálculo de X y S:
X I 28 ... 30
ii) X = = = 29.5
n 10
( X i X ) 2
iii) S = = 1.78
n 1
iv) = 0.01 , = 0.005 (nivel de significancia)
2
iv) Determinación de tc y tt
X o
tc = S
tc = 291.5,78 30 = - 0.84
n 1 9
v) Regla de decisión:
Entonces:
Respuesta al caso:
SOLUCIÓN
i) Datos:
µ = 500
X = 450
S = 100
n = 25
α = 0.05
La prueba es de una sola cola, ya que sólo interesa determinar aceptar o rechazar la
afirmación del fabricante. La desigualdad de la hipótesis alternativa hacia la región de
rechazo en la cola izquierda de la distribución.
iii) Calculando t:
X o 500
tc = S
tc = 450100 = - 2.45
n 1 24
2.0639
tc = -2.45 µ = 500
tt = - 1.711
v) Estrategias de decisión:
Cuando:
Respuesta al caso:
SOLUCIÓN
a)
i) Datos:
na = nb = 20
µa = 60
µb = 68
σa = 10
σb = 8
αa = 0.10
αb = 0.05
La hipótesis alternativa no indica ninguna dirección, por lo que se trata de una prueba
de dos colas.
na nb 20 20
iv) Determinando t tabla:
1.73
tc = -2.794 0
tt = 1.73
v) Estrategias de decisión:
Como tc (-2.794 < tt (2.09) se acepta la H₀ y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluación de desempeño laboral en las
instituciones investigadas.
b)
i) Datos: (Idem)
H₀: 1 = 2; No existe ninguna diferencia de desempeño laboral en las dos instituciones
investigadas
Ha: 1 < 2; En la institución “b” es mayor el rendimiento laboral promedio.
na nb 20 20
iv) Determinando t tabla:
2.09
tc = -2.794 0
tt = 2.09
vi) Estrategias de decisión:
Como tc (-2.794) < tt (2.09) se acepta la H₀ y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluación de desempeño laboral en las
instituciones investigadas.
i) Datos:
n1 = 18
n2 = 15
µ1 = 25
µ2 = 28
σ21 = 3
σ22 = 4
α = 0.01
ii) Planteamiento de hipótesis
H₀: 1 = 2; El tiempo promedio de aprendizaje entre las mujeres y varones es igual
Ha: 1 < 2; El tiempo promedio de aprendizaje de las mujeres es más rápido que de los
varones.
na nb 18 15
2.7440
v) Estrategias de decisión:
tc = -2.40
tt = 2.7440
2.2 CHI CUADRADO TABLA DE CONTINGENCIA O INDEPENDENCIA ( )
La prueba chi-cuadrado es una forma de contrastes de hipótesis que sirve para comprobar
afirmaciones acerca de las funciones de probabilidad (o densidad) de una o dos variables aleatorias.
Se aplica básicamente cuando queremos averiguar si dos variables (o dos vías de clasificación) son
independientes estadísticamente o cuando queremos comprobar la independencia de frecuencias entre
dos variables aleatorias, X e Y.
SOLUCIÓN
a) Sin aplicar la corrección:
i) Planteamiento de hipótesis
O E (O - E) (O - E)² (O - E)²/E
Correctas 60 50 10 100 2
incorrectas 40 50 -10 100 2
4
=4
2
C
t2 (tabla) 0.05
1 3.841
Cuando:
C2 = t2 , Se acepta la Ha
C2 < t2 , Se rechaza la Ha
C2 > t2 , Se acepta la Ha
Respuesta al caso:
Como: C2 > t2 , Se acepta la Ha, y se rechaza la Ho, es decir, el trabajador
contestó sin saber la materia, a un nivel de significancia de
0.05.
b) Aplicando la corrección:
t2 (tabla) 0.05
1 3.841
b) Objetivo
Demostrar la relación de dependencia entre la motivación intrínseca y la remuneración, en
el nivel de desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga.
c) Hipótesis
Existe una relación de dependencia entre la motivación intrínseca y la remuneración, en el
nivel de desempeño laboral de los trabajadores de la Universidad Nacional de San
Cristóbal de Huamanga.
d) El ítem principal podría haber sido de la siguiente forma:
MA A I ED MD
LEYENDA:
HD = Hay dependencia
NHD = No hay dependencia
MA = Muy de acuerdo
A = Acuerdo
I = Indiferente
ED = En desacuerdo
MD = Muy en desacuerdo
SOLUCIÓN
a) Planteamiento de hipótesis
= Existe relación independiente entre la motivación intrínseca y la remuneración, para
buen desempeño laboral de los trabajadores de la Universidad Nacional de San Cristóbal de
Huamanga.
= Existe una relación de dependencia entre la motivación intrínseca y la
remuneración, para buen desempeño laboral de los trabajadores de la Universidad
Nacional de San Cristóbal de Huamanga.
MA A I ED MD
IIIIIIIIII
Hay IIIIIIIIII
IIIIIIIIII IIIIIIIIII -.- IIIIIIIIII
dependencia IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII IIIIIIIIII
IIIIIIIIII
No hay IIIIIIIIII IIIIIIIIII
IIIIIIIIII IIIIIIIIII IIIIIIIIII
dependencia IIIIIIIIII IIIIIIIIII
IIIIIIIIII
IIIIIIIIII IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
MA A I ED MD TOTAL
Hay dependencia 10 20 10 -.- 40 80
No hay dependencia 40 10 10 30 70 160
TOTAL 50 30 20 30 110 240
PRIMERA FILA:
50 x80 30 x80
Celda (1,1) = 16.67 , Celda (1,2) = 10
240 240
20 x80 30 x80
Celda (1.3) = 6.67 , Celda (1.4) = 10
240 240
110 x80
Celda (1.5) = 36.67
240
SEGUNDA FILA:
50 x160 30 x160
Celda (2,1) = 33.33 , Celda (2,2) = 20
240 240
20 x160 30 x160
Celda (2.3) = 13.33 , Celda (2.4) = 20
240 240
110 x160
Celda (2.5) = 73.33
240
O E (O - E) (O - E)² (O - E)²/E
HD – MA 10 16.67 -6.67 44.49 2.67
HD – A 20 10 10 100 10
HD – I 10 6.67 3.33 11.09 1.66
HD – ED 0 10 -10 100 10
HD – MD 40 36.67 3.33 11.09 0.30
NHD –MA 40 33.33 6.67 44.49 1.33
NHD – A 10 20 -10 100 5
NHD – I 10 13.33 -3.33 11.09 0.90
NHD – ED 30 20 10 100 5
NHD – MD 70 73.33 -3.33 11.09 0.15
37.01
C2 = 37.01
CALCULANDO t2 (tabla)
Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4
t2 = 24 , 0.05 = 9.488
e) Resultado y decisión:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488 37.01
i) PLANTEAMIENTO DE HIPÓTESIS:
= La cualidad directiva no influye explícitamente en la integridad
aplicada.
= La cualidad directiva influye explícitamente en la integridad aplicada.
S CS AV MPV N TOTAL
Influye 16 21 91 103 46 277
No influye 8 17 24 17 13 79
TOTAL 24 38 115 120 59 356
LEYENDA:
S = Siempre
CS = Casi siempre
AV = A veces
MPV = Muy pocas veces
N = Nunca
I = Influye
NI = No Influye
PRIMERA FILA:
24 x 277 38 x 277
Celda (1,1) = 18.67 , Celda (1,2) = 29.57
356 356
115 x 277 120 x 277
Celda (1.3) = 89.48 , Celda (1.4) = 93.37
356 356
59 x 277
Celda (1.5) = 45.91
356
SEGUNDA FILA:
24 x79 38 x79
Celda (2,1) = 5.33 , Celda (2,2) = 8.43
356 356
115 x79 120 x79
Celda (2.3) = 25.52 , Celda (2.4) = 26.63
356 356
59 x79
Celda (2.5) = 13.09
356
S CS AV MPV N
Influye 18.67 29.57 89.48 93.37 45.91
No influye 5.33 8.43 25.52 26.63 13.09
O E (O - E) (O - E)² (O - E)²/E
S–I 16 18.67 -2.67 7.13 0.38
CS – I 21 29.57 -8.57 73.44 2.48
AV – I 91 89.48 1.52 2.31 0.03
MPV – I 103 93.37 9.63 92.74 0.99
N–I 46 45.91 0.09 0.01 0.00
S – NI 8 5.33 2.67 7.13 1.34
CS – NI 17 8.43 8.57 73.44 8.71
AV – NI 24 25.52 -1.52 2.31 0.09
MPV – NI 17 26.63 -9.63 92.74 3.48
N – NI 13 13.09 -0.09 0.01 0.00
17.51
: Calculada = 17.51
2
C
CALCULANDO t2 (tabla)
b) t2 = 24 , 0.05 = 9.488
v) RESULTADO Y DECISIÓN:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488 17.51
S CS AV MPV N TOTAL
Influye 14 26 84 102 46 272
No influye 6 19 26 18 15 84
TOTAL 20 45 110 120 61 356
S CS AV MPV N
Influye 15.28 34.38 84.04 91.69 46.61
No influye 4.72 10.62 25.96 28.31 14.39
iv) TABULACIÓN DE O Y E:
O E (O - E) (O - E)² (O - E)²/E
S–I 14 15.28 -1.28 1.64 0.11
CS – I 26 34.38 -8.38 70.22 2.04
AV – I 84 84.04 -0.04 0.00 0.00
MPV – I 102 91.69 10.31 106.30 1.16
N–I 46 46.61 -0.61 0.37 0.01
S – NI 6 4.72 1.28 1.64 0.35
CS – NI 19 10.62 8.38 70.22 6.61
AV – NI 26 25.96 0.04 0.00 0.00
MPV – NI 18 28.31 -10.31 106.30 3.75
N – NI 15 14.39 0.61 0.37 0.03
14.06
C2 : Calculada = 14.06
CALCULANDO t2 (tabla)
b) t2 = 24 , 0.05 = 9.488
v) RESULTADO Y DECISIÓN:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488 14.06
7.519
.488
i) PLANTEAMIENTO DE HIPÓTESIS:
= El trabajo en equipo no influye positivamente en la aptitud emocional.
S CS AV MPV N TOTAL
Influye 11 18 98 120 22 269
No influye 13 14 19 24 17 87
TOTAL 24 32 117 144 39 356
S CS AV MPV N
Influye 18.13 24.18 88.41 108.81 29.47
No influye 5.87 7.82 28.59 35.19 9.53
iv) TABULACIÓN DE O Y E:
O E (O - E) (O - E)² (O - E)²/E
S–I 11 18.13 -7.13 50.84 2.80
CS – I 18 24.18 -6.18 38.19 1.58
AV – I 98 88.41 9.59 91.97 1.04
MPV – I 120 108.81 11.19 125.22 1.15
N–I 22 29.47 -7.47 55.80 1.89
S – NI 13 5.87 7.13 50.84 8.66
CS – NI 14 7.82 6.18 38.19 4.88
AV – NI 19 28.59 -9.59 91.97 3.22
MPV – NI 24 35.19 -11.19 125.22 3.56
N – NI 17 9.53 7.47 55.80 5.86
34.64
C2 : Calculada = 34.64
CALCULANDO t2 (tabla)
b) t2 = 24 , 0.05 = 9.488
v) RESULTADO Y DECISIÓN:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488 34.64
14.06
Cómo ( C2 CALCULADO = 34.64) ( 2 TABLA
>7.519
.488 t
= 9.488)
i) PLANTEAMIENTO DE HIPÓTESIS:
S CS AV MPV N TOTAL
Influye 6 25 75 103 14 223
No influye 17 33 29 36 18 133
TOTAL 23 58 104 139 32 356
S CS AV MPV N
Influye 14.41 36.33 65.15 87.07 20.04
No influye 8.59 21.67 38.85 51.93 11.96
iv) TABULACIÓN DE O Y E:
O E (O – E) (O - E)² (O - E)²/E
S–I 6 14.41 -8.41 70.73 4.91
CS – I 25 36.33 -11.33 128.37 3.53
AV – I 75 65.15 9.85 97.02 1.49
MPV – I 103 87.07 15.93 253.76 2.91
N–I 14 20.04 -6.04 36.48 1.82
S – NI 17 8.59 8.41 70.73 8.23
CS – NI 33 21.67 11.33 128.37 5.92
AV – NI 29 38.85 -9.85 97.02 2.50
MPV – NI 36 51.93 -15.93 253.76 4.89
N – NI 18 11.96 6.04 36.48 3.05
39.26
C2 : Calculada = 39.26
CALCULANDO t2 (tabla)
b) t2 = 24 , 0.005 = 9.488
v) RESULTADO Y DECISIÓN:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488 39.26
34.64
14.06
Cómo ( C2 CALCULADO = 39.26) > ( t TABLA
2
7.519 = 9.488)
.488
i) PLANTEAMIENTO DE HIPÓTESIS:
= Las políticas de prestaciones sociales no influye manifiestamente en
alquimia emocional.
= Las políticas de prestaciones sociales influye manifiestamente en
alquimia emocional.
S CS AV MPV N TOTAL
Influye 22 29 86 98 18 253
No influye 16 27 23 26 11 103
TOTAL 38 56 109 124 29 356
S CS AV MPV N
Influye 27.01 39.80 77.46 88.12 20.61
No influye 10.99 16.20 31.54 35.88 8.39
iv) TABULACIÓN DE O Y E:
O E (O - E) (O - E)² (O - E)²/E
S–I 22 27.01 -5.01 25.10 0.93
CS – I 29 39.8 -10.8 116.64 2.93
AV – I 86 77.46 8.54 72.93 0.94
MPV – I 98 88.12 9.88 97.61 1.11
N–I 18 20.61 -2.61 6.81 0.33
S – NI 16 10.99 5.01 25.10 2.28
CS – NI 27 16.2 10.8 116.64 7.20
AV – NI 23 31.54 -8.54 72.93 2.31
MPV – NI 26 35.88 -9.88 97.61 2.72
N – NI 11 8.39 2.61 6.81 0.81
21.57
C2 : Calculada = 21.57
CALCULANDO t2 (tabla)
a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5 - 1) = 4
b) t2 = 24 , 4, 0.005 = 9.488
v) RESULTADO Y DECISIÓN:
0.05
= = 0.025, 4 grados de libertad
2 2
9.488
21.57
39.26
Cómo ( C CALCULADO = 21.57) > ( t TABLA
2 2 34.64
14.06= 9.488)
7.519
SE ACEPTA LA ; Es decir, las políticas de
.488 prestaciones sociales
influye manifiestamente en alquimia emocional, al nivel de significancia
de 0.05.
Este factor, cuyo posible efecto sobre la variable medida queremos analizar, puede
tener unos niveles fijos, por ejemplo el nivel educativo alcanzado por los sujetos que
intervienen (sin estudios, estudios primarios, secundarios, formación universitaria), y
hablamos entonces de modelo de efectos fijos; o bien puede tratarse de una muestra
procedente de un conjunto de niveles más amplio, como puede ser por ejemplo el
caso de un estudio en el que se seleccionan varios hospitales y se analiza las posibles
diferencias entre hospitales. Entonces lo denominamos modelo de efectos
aleatorios. En el análisis de la varianza de 1 factor es mucho más frecuente el
modelo de efectos fijos.
Ejemplo 1
1 2 3 4 5
37 29 49 40 50
40 33 47 38 46
46 34 42 49
31 39
41
SOLUCIÓN
i) DATOS:
a = Existen 5 tratamientos
N = n1 ≠ n2 ≠ n3 ≠ n4 ≠ n5
i) Procedimientos de cálculo
t=∑y 2
ij : i = 1, 2, 3,… 5. Columnas. J = 1, 2, 3,…5 filas
A = ∑( y12j y 22 j y32 j y 42 j y 52 j )/n; si los datos son completos, caso contrario
dividir cada columna por la cantidad de n.
CF = (∑ yij ) 2 / n
Leyenda:
t = Tratamiento
A = Total tratamiento
CF = Factor de corrección
1 2 3 4 5
37 29 49 40 50
40 33 47 38 46
46 34 42 49
31 39
41
123 127 96 200 145 691
b) Calcular el valor de:
t = ∑ ( 37 2
40 2 46 2 29 2 33 2 34 2 ……+ 49 2 ) = 28,769
2
127 2 96 2 200 2 145 2
A = ∑ ( 123 ) = 28,691.58
3 4 2 5 3
2
CF = (691) = 28,087.12
17
c) Planteamiento de hipótesis
d) Fuente de Varianza:
Grado de Cuadrado F
Suma de cuadrados
libertad medio Calculada
(S:C)
(G.L.) (CM) (Fc)
(a-1) (A-CF) 604.46/4 =
÷ tratamientos (5-1) = 4 28691.58 -28087.12 = 151.115 151.115/6.452 =
604.46
Dentro de (N-a) (T –A) 77.42/12 = 23.42
tratamientos (17-5) = 12 28769 – 28691.58 = 77.42 6.452
f C = 23.42
f t (tabla) = f ( a 1), ( N a )
ft = f 0.05,(514),(17512)
f t (tabla) 4
12 3.26
a) Estrategia de decisión
Ejemplo 2
Se desea comparar a tres médicos en relación con la duración del internado de sus
pacientes que se sometieron a cierto procedimiento quirúrgico menor sin
complicaciones. Se seleccionó una muestra de 8 pacientes para cada médico y se
observaron los tiempos de hospitalización después de la intervención.
Médicos
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
SOLUCIÓN
i) DATOS:
N=8
α = 0.01
a=3
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
Y ij
39 31 29 99
Y ij2 195 125 111 431
(Yij)
2
1521 961 841 3323
iii) Planteamiento de hipótesis
: µ1 = µ2 = µ3
: Existe al menos una diferencia
S.C = T = 431
A = 3323/8 = 415.375
CF = (99)2 /8 x 3 = 408.375
Grado de Suma de F
Cuadrado medio
Fuente de varianza libertad cuadrados Calculada
(CM)
(G.L.) (S:C) (Fc)
÷ tratamientos 2 (A-CF) = 7 7/2 = 3.5
Dentro de 3.5/0.744 = 4.704
21 (T –A) = 15.625 15.625/21 = 0.744
tratamientos
f C = 4.704
ft = f 0.01,(312), 3(8121)
f t (tabla) 2
15 6.36
v) Estrategia de decisión
Dada la muestra aleatoria simple de tamaño n, (x1, x2, ..., xn), extraída de una
población con distribución continua, se quiere contrastar si su mediana es igual a
cierto valor dado de antemano, designado por med.
Es importante insistir en que no se acepta para la realización del test otra hipótesis
que no sea la continuidad de la distribución poblacional. La hipótesis nula que se
contrasta es:
Ejemplo 1
15.5 14.5
9.5 15.0
18.0 14.5
18.6 15.0
16.7 14.5
8.8 14.5
9.5 14.5
14.5 14.5
15.2 15.0
14.4 14.5
11.2 15.0
9.5 15.0
11.8 14.5
12.0 15.0
14.0 14.5
10.5 15.0
8.2 14.5
15.0 15.0
12.0 15.0
13.8 15.0
14.8 15.0
15.0 15.0
17.8 15.0
18.5 15.0
SOLUCIÓN
i) Determinación de signos:
ii) Datos:
n = 24 – (3 ceros) = 21
(+) = 14
(-) = 7
Probabilidad que sea (+) o negativo (-):
p = 0.5
q = 0.5
Xi = q de (+) (-0.5) = 14 – 0.5 = 13.5
np 21x0.5 10.5
npq 21x0.5x0.5 2.29
xi 13.5 10.5
c c 1.31
2.29
t (1 ) / 2 t (10.0) / 2 0.475 1.96
v) Estrategia de decisión
Ejemplo 2
SOLUCIÓN
i) Datos:
n = 17 – (1 cero) = 16
(+) = 6
(-) = 10
p = 0.5
q = 0.5
np 16 x0.5 8.0
npq 16 x0.5x0.5 2.0
xi 5.5. 8
c c 1.25
2.0
t (1 ) / 2 t 0.50.05 0.45 1.65
SOLUCIÓN
i) Prueba de signos:
np 16 x0.5 8.0
npq 16 x0.5x0.5 2.0
xi 9.5. 8
c c 0.75
2.0
t (1 ) / 2 t 0.50.01 0.49 2.33
Estrategia de decisión
Cuando el tipo de medición no cumpla con los requisitos que la prueba t de Student
exige, la de Wilcoxon es una alternativa de aceptable eficacia para contrastar
hipótesis. El método es aplicable a muestras pequeñas, siempre y cuando sean
mayores que 6 y menores que 25. Las muestras grandes deben ser mayores a 25 y
éste se debe transformar en valor de Z, para conocer la probabilidad de que aquella
sea o no significativa.
Dicha prueba estadística consiste en sumar los rangos de signo frecuente; por ello, no
se tiene una ecuación o fórmula, como se observa en otras pruebas estadísticas.
Se utiliza cuando:
Prueba de dos colas: No se sabe en que dirección se pueden dar las diferencias.
Prueba de una cola: Si sabemos en que dirección están las diferencias.
Ejemplo 1
0.1 (1) = 1
0.2 (2) = 2+3 = 5/2 = 2.5
0.5 (1) = 4
1.0 (1) = 5
1.2 (1) = 6
2.2 (1) = 7
2.7 (1) = 8
2.8 (1) = 9
3.0 (2) = 10 +11 =21/2 = 10.5
3.5 (2) = 12+13 = 25/2 = 12.5
3.6 (1) = 14
3.8 (1) = 15
4.5 (1) = 16
5.0 (1) = 17
5.5 (2) = 18+19 = 37/2 = 18.5
5.7 (1) = 20
6.3 (1) = 21
v) Cálculo de indicadores:
n = 21
(-) = 7
(+) = 14
vi) Determinado: tC ; tt
t t = t , n
Tabla: valores críticos
tt = t 0.01, 21 de la prueba de rangos
y signos de Wilcoxon
t t (tabla) 0.01
21 43
t c ET 62.5 115.5
Zc = Zc = = - 1.84 = │1.84│
Gt 28.77
Decisión:
Ejemplo 2
1er. 2do
Examen Examen
72 74
70 72
68 69
67 68
73 72
71 73
72 72
70 74
69 68
70 73
68 69
72 70
69 68
66 69
73 74
71 73
70 70
72 74
70 68
69 71
72 75
73 76
SOLUCIÓN
n = 22
(-) = 5
(+) = 20
iv) Determinado: tC ; tt
t C = ∑(-) = en la parte de rangueo = 35
t t = t , n
Tabla: valores críticos
tt = t 0.01, 20 de la prueba de rangos
y signos de Wilcoxon
t t (tabla) 0.01
20 38
v) Estrategia de decisión
Pasos.
+ -
Muestra I A B
Muestra II C D
Ejemplo 1
Planteamiento de la hipótesis.
Hipótesis alterna (Ha). Existe mayor frecuencia de perder peso al aplicar la nueva
técnica terapéutica, en comparación con lo observado al aplicar una técnica usada
regularmente.
Hipótesis nula (Ho). Las diferencias observadas en las dos técnicas terapéuticas se
deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Decisión.
En virtud de que la probabilidad exacta de Fischer y Yates es menor
que 0.05, cae en el nivel de significación; por lo tanto, se acepta Ha y
se rechaza Ho.
Interpretación.
Ejemplo 2
Se desea comparar a tres médicos en relación con la duración del internado de sus
pacientes que se sometieron a cierto procedimiento quirúrgico menor sin
complicaciones. Se seleccionó una muestra de 8 pacientes para cada médico y se
observaron los tiempos de hospitalización después de la intervención.
Médicos
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
SOLUCIÓN
vi) DATOS:
N=8
α = 0.01
a=3
A B C
4 4 5
5 5 3
5 4 3
4 3 3
6 4 3
6 5 3
4 3 4
5 3 5
Y ij
39 31 29 99
Y ij2 195 125 111 431
(Yij)
2
1521 961 841 3323
f C = 4.704
ft = f 0.01,(312), 3(8121)
f t (tabla) 2
21 5.78
x) Estrategia de decisión
Esta prueba estadística es útil cuando las mediciones se pueden ordenar en escala
ordinal (es decir, cuando los valores tienden a una variable continua, pero no tienen
una distribución normal) y resulta aplicable cuando las muestras son independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t
de Student, en razón de no cumplir con los requisitos que esta prueba exige.
La fórmula es la siguiente:
Donde:
U1 y U2 = valores estadísticos de U Mann-Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
Pasos:
1. Determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se
consideran muestras pequeñas, pero si son mayores que 20, se consideran
muestras grandes.
2. Arreglar los datos en rangos del menor al mayor valor. En caso de que existan
ligas o empates de rangos iguales, se deberán detectar para un ajuste posterior.
3. Calcular los valores de U1 y U2, de modo que se elija el más pequeño para
comparar con los críticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeños como los de U en la prueba de Mann-Whitney.
4. En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se
distribuye normalmente.
5. Decidir si se acepta o rechaza la hipótesis.
Método A 16 18 5 6 12 15 12 14 11
Método B 16 12 15 4 3 11 8 15 14
SOLUCIÓN
i) Planteamiento de hipótesis
3 (1) = 1
4 (1) = 2
5 (1) = 3
6 (1) = 4
8 (1) = 5
11 (2) = 6 +7 = 13/2 = 6.5
12 (3) = 8 +9 +10 = 27/3 = 9
14 (2) = 11 + 12 = 23/2 = 11.5
15 (3) = 13 +14 +15 =42/3 = 14
16 (2) = 16+17 = 33/2 = 16.5
18 (1) = 18
iii)Calculando Uc
n1 (n1 1) 9(9 1)
U1 = n1n2 + R1 = 9*9 + 91.5 = 34.5 (escogido *)
2 2
n2 (n2 1) 9(9 1)
U1 = n1n2 + R2 = 9*9 + 79.5 = 46.5
2 2
(*Para comparar con Ut se escoge el que arroje menor valor como resultado)
v) Estrategia de decisión
Uc ≤ Uα Se acepta la Ha (Para todo valor de probabilidad (α) igual o menor que 0.05, es
decir, se acepta Ha y se rechaza Ho.
Uc > Uα Se acepta la Ho (Para todo valor de probabilidad (α) mayor que 0.05, se
acepta Ho y se rechaza Ha.
Planteamiento de la hipótesis.
De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al
mayor.
Calculamos la U.
De los dos valores de U calculados, se elge el más pequeño (4) y se comparan con
los valores críticos de U Mann-Whitney.
U = n1n2 - U'
Decisión.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente,
corresponde 0.048, el cual es más pequeño que el nivel de significancia; por lo tanto,
se acepta Ha y se rechaza Ho.
Interpretación.
Entre las calificaciones de la ejecución de lectura mediante los dos métodos de
enseñanza existe una diferencia significativa a un nivel de probabilidad de error
menor que 0.05; es decir, aun cuando las muestras son pequeñas, las calificaciones
más altas mediante el método diseñado por el experimentador señalan más
efectividad, con la probabilidad de equivocarse de 0.048 para aceptarlo.
Método A 15 14 15 15 16 14 17 12 15 12
Método B 16 15 15 15 16 14 14
SOLUCIÓN
i) Planteamiento de hipótesis
iii)Calculando Uc
n1 = 7
n2 = 10
n1 (n1 1) 10(10 1)
U1 = n1n2 + R1 = 10*7 + 84 = 41
2 2
n2 (n2 1) 7(7 1)
U1 = n1n2 + R2 = 10*7 + 69 = 29
2 2
Uα,n1,n2 = U0.05,10,7 = 14
v) Estrategia de decisión
Planteamiento de la hipótesis.
Hipótesis alterna (Ha). Las calificaciones aportadas por el método reciente, ideado
por el experimentador, son diferentes y con valores más altos.
Hipótesis nula (Ho). Las diferencias entre las calificaciones dadas por ambos
métodos se deben al azar.
Población de niños de 6 años a los cuales se les aplicó dos métodos de enseñanza.
Calculamos la U.
Tomando en cuanta los pasos, nos menciona que cuando la muestra es mayor que 25,
se distribuye normalmente, por lo cual se determina el valor Z para conocer la
probabilidad. Esto se calcula como sigue:
Donde:
Z = valor estadístico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
= valor promedio de U.
U = desviación estándar de U.
Donde:
U = desviación estándar de U.
n1 y n2 = tamaño de la muestra de los
grupos 1 y 2.
N = tamaño total de la muestra (la suma de
n1 y n2).
Li = sumatoria de las ligas o empates.
Decisión.
A la cifra de Z de 1.95 le corresponde una probabilidad menor que 0.05, por lo cual
se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en valores extremos
como los de 2 en la distribución normal).
Interpretación.
El experimentador, al aumentar su muestra, confirma la investigación preliminar con
una muestra pequeña, con lo cual da a entender que los resultados logrados con el
método ideado por él son diferentes de los obtenidos con el método de enseñanza de
lectura tradicional; además, este último revela calificaciones más bajas y es menos
efectivo que el otro.
Método
1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al menor un
rango de 1, al segundo un 2, y así hasta el n-ésimo. Si existen datos que se repiten,
se asigna el rango promedio a cada uno de ellos (si existen cuatro datos idénticos
que ocupan los rangos 11, 12, 13 y 14, se les asigna un rango de 12,5 a los
cuatro).
o es el promedio de rij.
2
12 Rj
Luego la fórmula general es: HC = 3( N 1)
N ( N 1) n j
3. Se puede realizar una corrección para los valores repetidos dividiendo K por:
Ejemplo 1
Le empresa maravilla siglo XXI, recluta y contrata personal para su equipo gerencial
en tres universidades diferentes.
Copiar la tabla
Universidad A Universidad B Universidad C
12 14 14
12 14 14
14 15 15
14 15 15
15 15 15
15 16 16
15 16 16
15 16
16 17
17 17
17
SOLUCION
i) Planteamiento de hipótesis
: Las tres Universidades no son idénticas en cuanto a las evaluaciones de
desempeño.
: Las tres Universidades son idénticas en cuanto a las evaluaciones de
desempeño.
Cálculo adicional
n1 = 10
n2 = 7
n3 = 11
N = 28
2
12 Rj
Hc = 3( N 1)
N ( N 1) n j
v) Estrategia de decisión:
Rpta:
Como: Hc (3.09) < X 2 (5.99), Se acepta la HO, y se recha la Ha, es decir, que el
promedio de las notas es igual en las 3 Universidades.
X Y
Causa Efecto
m=+
m=-
ESTRATEGIA DE DECISÓN:
Ejemplo 1:
SOLUCIÓN
X Y XY X Y
20 50 1000 400 2500
30 73 2190 900 5329
30 69 2070 900 4761
40 87 3480 1600 7569
50 108 5400 2500 11664
60 128 7680 3600 16384
60 135 8100 3600 18225
60 132 7920 3600 17424
70 148 10360 4900 21904
80 170 13600 6400 28900
ΣX = 500 ΣY = 1100 ΣXY = 61800 ΣX² = 28400 ΣY² = 134660
X i 20 30 30 40 ... 80 500
X 10 (para eje X)
x n 10 10
Y a bx
Entonces: Y a bx
110 a 2(50)
110 100 a
a = 10
Y 10 10 x
180
170
160
150
140
130
120
110
90
80
100
70
60
50
40
30
20
10
10 20 30 40 50 60 70 80 90 100
nxy (x)(y )
r
nx 2
(x) 2 ny 2 (y) 2
(10)(61,800) (500)(1100)
r 0.998 altamente positivo
(10)(28,400) (500) (10)(134,660) (1100)
2 2
Como r ≥ 0.5, entonces existe alta correlación entre las horas de publicidad (X)
y el número de artículos vendidos (Y).
Y 9 10 2(70) 150
Si en la 9na semana se incrementara el tiempo de publicidad en 5 minutos,
entonces, la venta estimada sería:
Ejemplo 2:
Se supone que se puede establecer cierta relación lineal entre las exportaciones de un
país y la producción interna de dicho país. En el caso del Perú, tenemos los datos
anuales (expresados en millones de soles) para tales variables correspondientes al
quinquenio 2005-2009 en la siguiente tabla:
SOLUCIÓN
X Y XY X2 Y2
52.654 10.420 548.654680 2772.443716 108.576400
53,972 11.841 639.082452 2912.976784 140.209281
57.383 14.443 828.782669 3292.808689 208.600249
61.829 16.732 1034.522828 3822.825241 279.959824
65.381 18.760 1226.547560 4274.675161 351.937600
291.219 72.196 4277.532257 17075.72959 1089283354
Y a bx
nxy (y )(x)
b
nx 2 (x) 2
x 2 y (x)(xy )
a
nx 2 (x) 2
(17075.72959)(72.196) (291.219)(4277.532257)
a 12855974.85
5(17075.70604) (291.219) 2
5(4277.532257) (72.196)(291.219)
b 220726.6767
5(17075.72959) (291.219) 2
Entonces:
Y a bx
14.4392 a 220726.6767(58.2438
14.4392 12855960.41 a
a = 12855974.84
Y 12855974.84 220726.6767 x
Y 12855974.84 220726.6767 X
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
10 20 30 40 50 60 70 80 90 100
nxy (x)(y )
r
nx 2
(x) 2 ny 2 (y) 2
(5)(3639146819) (237.301)(72.196)
r noesposiblecalular
(5)(84808.506) (291.219) (5)(1089283354) (72.196)
2 2
Ejemplo 3:
X 10 20 30 40 50 60 70
X 35 28 23 20 18 15 13
Ejemplo 4
2000 1 100,000
2001 2 120,000
2002 3 140,000
2003 4 110,000
2004 5 170,000
2005 6 150,000
2006 7 180,000
2007 8 200,000
2008 9 210,000
2009 10 200,000
Ejemplo 5
Una compañía de seguros considera que el número de vehículos (y) que circulan por
una determinada autopista a más de 120 km/h , puede ponerse en función del número
de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes
resultados:
Accidentes (Xi) 5 7 2 1 9
Número de vehículos (Yi) 15 18 10 8 20
SOLUCIÓN
o ,
o
3. El estadístico viene dado por .
4. El criterio de decisión es
Ejemplo 1:
Planteamiento de la hipótesis.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Escala = 0 - 20
Aplicación de la prueba estadística.
Rango1 = 8
Rango2 = 9
Rango3 =13
Con tres columnas y cinco hileras se compara el valor calculado de X2r de Friedman
con la tabla correspondiente de distribución de probabilidad. Las cifras aproximadas
al estadístico calculado 2.8 = 0.367.
Decisión.
Como el valor de X2r calculado es igual a 2.8, la probabilidad es de 0.367, esto indica
que es menor que el nivel de significancia, por lo cual, se acepta Ha y se rechaza Ho.
Interpretación.
Aceptada Ha, se acepta que entre los tres tratamientos existen distintos grados de
memoria adquirida. Se distingue notoriamente que el tratamiento A es menos eficaz,
con respecto a los otros dos tratamientos. Por otro lado, el tratamiento B ofrece
mayores ventajas para la adquisición de memoria.
UNIDAD III
SOLUCION
a) Distribución de probabilidad
0 15 15/90 = 0.1667
1 8 8/90 = 0.0889
2 12 12/90 = 0.1333
3 30 30/90 = 0.3333
4 15 15/90 = 0.1667
6 10 10/90 = 0.1111
1.0000
Rpta:
2 2
= ( x - ) f(x)
2 2
(X - ) (x-) ( x - ) f(x)
2
= 3.059
SOLUCION
i) Distribución de probabilidad
16 0.1667 2.6672
20 0.2667 5.3340
21 0.3333 6.9993
25 0.2333 5.8325
20.8330
Rpta:
i) 20.8330 socios por atender diariamente
ii) 20.8330 x 30 días mes = 624.99 = 625 socios atendidos
mensualmente
2 2
iii) Varianza. = ( x - ) f(x)
(X - )
2 2
(x - ) ( x - ) f(x)
16 – 20.8330 = -4.8330 23.3579 23.3579 x 0.1667 = 3.8938
20 – 20.8330 = -0.8330 0.6939 0.6939 x 0.2667 = 0.1851
21 – 20.8330 = 0.1670 0.0279 0.0279 x 0.3333 = 0.0093
25 – 20.8330 = 4.1670 17.3639 17.3639 x 0.2333 = 4.0510
8.1392
= 8.1392
2
SOLUCION
i) Distribución de probabilidad
Rpta:
i) La mayor cantidad de cursos que aprobaría el promedio de los
estudiantes de EFPAE es 5 cursos con probabilidad de 30%.
ii) Que apruebe menos de 5 cursos es de 40%.
iii) Que apruebe 5 o más es 60%.
2 2
iii)Varianza. = ( x - ) f(x)
(X - )
2 2
(x-) ( x - ) f(x)
n n
x ( n x )
n!
F(x) = P (1- p) ; =
x x x!(n X )!
a) Propiedades
SOLUCION
SOLUCION
1. Idem
2. Idem
3. La probabilidad de una compra y no compra son iguales para cada
visita, siendo P = 0.30, 1- P = 0.70.
4. Las visitas son independientes, por que las familias se seleccionan
aleatoriamente.
5. Idem la variable aleatoria.
Ejemplo3: Una tienda que vende muebles está preocupado en la decisión de compra
de las 6 personas que ingresan a la tienda. De acuerdo con su experiencia,
el vendedor de la tienda estima que la probabilidad de que cualquier
persona que ingresa a la tienda compre es de 0.15. ¿Cuál es la
probabilidad que 3 de las siguientes 6 personas que ingresen a la tienda
hagan una compra?
n n
x ( n x )
n!
F(x) = x P (1- p) ; =
x x!(n x)!
SOLUCION
0 6
Ningún cliente haga la compra f(x = 0) =
6!
0.15 0.85 = 0.377
0!6!
1 5
Exactamente un cliente haga la compra f(x =1) =
6!
0.15 0.85 = 0.399
1!5!
2 4
Exactamente 2 clientes hagan la compra f(x =2) =
6!
0.15 0.85 = 0.176
2!4!
Datos:
n = 50
X=5
P = 2%
(1-P) = 98%
f(x=5) =
50!
0.025 0.9845 = 0.0027 0.27%
5!45!
r N r
x n x
F(x) = ---------------------------------
N
n
N
n = Representa la cantidad de formas en que se puede seleccionar una
r
r = Exitos
X = Exitos
n – x = Fracasos
N – r = Fracasos
Datos:
n=4
N = 12
r=7
X = 4 mujeres sean seleccionadas.
N =12 n=4
r=7
X=4
n-x = 0
N-r = 5
7 5 7! 5!
4 0 4!3! 5!0!
F(4) = ------------- = ----------------- = 0.071
12 12!
4 4!8!
7 5 7! 5!
4 2 4!3! 2!3!
F(6) = ------------- = ----------------- = 0.38
12 12!
6 6!6!
Datos:
n=5
N = 15
r=7
X = 3 no se alojen
7 8 7! 8!
3 2 3!4! 2!6!
F(3) = ------------- = ----------------- = 0.33
15 15!
5 5!10!
Propiedades:
18 e 18
10
a) F(10) = = 0.015
10!
1815 e 18
b) F(15) = = 0.079 7.86%
15!
18 5 e 18
c) F(5) = = 0.00024 0.024%
5!
La probabilidad que exactamente llegue 10 personas en 60
minutos es de 0.015 1.5%
Ejemplo 2: Un operador de moto taxi está interesado en la cantidad de pasajeros que
suben a su unidad, durante 4 horas de recorrido diario. De acuerdo con
un sondeo empírico suben 15 personas en 1 hora. Desea saber la
probabilidad que exactamente 10 personas ocupen u servicio en 1 hora.
15 e 15
10
Es la probabilidad que exactamente 10
F(10) = = 0.04861 4.86% personas ocupen su servicio en una hora.
10!
a) Función de densidad:
1
x e ( xu ) / 2
2 2
F(x) =
2
99.21%
95.44%
68.26
= media
= desviación estándar
= 3.14159
Desviación
e = 2.71828
Características:
-10 0 20
4. La distribución de probabilidad normal es simétrica, y su forma a la izquierda
de la media es una imagen especular de la forma a la derecha de la media. Las
colas, es decir, los extremos o los lados de la curva se prolongan al infinito en
ambas direcciones y, teóricamente, nunca tocan el eje horizontal.
= 10
6. Las probabilidades para la variable aleatoria normal están dadas por áreas bajo
la curva. El área total bajo la curva para la distribución de probabilidad normal
es 1 ( esto se cumple para todas las distribuciones continuas de probabilidad).
Debido a que la distribución es simétrica, el área total bajo la curva a la
izquierda de la media es 0,50 y el área total bajo la curva a la derecha de la
media es 0.50.
a. 68.26% de los valores de una variable aleatoria normal están dentro de más
o menos una desviación estándar de su media.
b. 95.44% de los valores de una variable aleatoria normal están dentro de más
o menos dos desviaciones estándar de su media.
c. 99.72% de los valores de una variable aleatoria normal están dentro de más
o menos tres desviaciones estándar de su media.
P(0.00 Z 1.00) = ?
Utilizando la tabla Z:
1.0
P(0.00 Z 1.00) = 0.3413
0.00
P(0.00 Z 1.27) = ?
0 1.27
Utilizando la tabla Z:
1.2
P(0.00 Z 1.27) = 0.3980
0.07
Ejemplo 3: P(- 2.5 Z 2.5) = ?
-2.5 0 2.5
Utilizando la tabla Z:
2.5
0.4938; P(-2.5 Z 2.5) = 0.4938 x 2 = 0.9876
0.00
Z Z
-2.75 0 2.75
Utilizando la tabla Z:
2.7
0.4970; P(- 2.75 Z 2.75) = 0.4970 x 2 = 0.9940
0.05
P(Z 1.49) = ?
0 1.49
0.5 0.5
1.00
Utilizando la tabla Z:
1.4
P(Z 1.49) = 0.4319
0.09
P(Z - 0.50) = ?
1 0.5 0 1.49
Utilizando la tabla Z:
0.5
P(Z - 0.50) = 0.1915
0.00
P(1.00 Z 1.58) = ?
0 1 1.58
Utilizando la tabla Z:
1.0
0.3413
0.00
1.5
0.4429
0.08
Entonces: P(1.00 Z 1.58) = 0.4429 - 0.3413 = 0.1016
1.2
Valor aproximado a 0.4000 = 0.3997
P(Z 1.28) 0.08
iii)
P(X 150) = ?
120 150
a. Cuando X = 150
150 120
Z= = 0.6
50
0.6
0.2257
0.00
1
Aplicando A x H f(x) = (b – a) ; para a
ba
X b
Valor esperado:
(a b) (8 11)
Ve = = = = 9.5 horas de viaje
2 2
Varianza:
(b a) 2 (11 8) 2
2 = 2 = 0.75
12 12
Desviación estándar:
(b a) 2 (11 8) 2
0.866 minutos
12 12
1 1
Función densidad =
12 8 4
1 1
ii) P(9 X 10) = 1 ( )= = 0.25
4 4
d) ¿Cuál es la probabilidad que el viaje se haga entre 10 y 12
horas?
1 1
Función densidad =
12 8 4
1 2
ii) P(10 X 12) = 2 ( )= = 0.5
4 4
1 1
ii) P(8 X 9) = 1 ( )= = 0.25
4 4
X
P( X X 0 ) = 1- e
1 . 5
P( X 1.5) = 1- e 2
= 0.5276 (52.76% 53%) es la
probabilidad que la atención a un cliente dure 1.5 minutos.
EJERCICIOS DE REPASO
1.- Identifique Ud. los siguientes enunciados si corresponde a Estadística Descriptiva o
Inferencial:
e. De todos los problemas empresariales, el 80% son generados por la alta dirección,
en cualquiera empresa.
f. De una selección de 100 productos, de una lote 10,000 unidades, 5% resultó con
defectos significativos
2.- Un ofertante de terrenos desea vender 5 lotes en forma sucesiva; es decir, una tras
otra. ¿Cuántos resultados experimentales posible tiene el vendedor?
3.- Un supervisor de obras desea optimizar la ejecución del proyecto. El flujo del
proyecto se divide en 3 etapas: estudio, implementación y ejecución. Los tiempos
promedios históricos en actividades similares arrojan la siguiente información; la
fase de estudio 2,3 meses, 2da. Etapa 5, 6 meses y la 3era. etapa de ejecución 11 y
12 meses. ¿Cuántos resultados experimentales admite el problema? ¿Cuánto es el
tiempo máximo y mínimo de ejecución del proyecto?
4.- La EFPAE desea seleccionar 3 estudiantes de 5 que constituyen del tercio superior
en índice académico, para que puedan asistir al CADE 2006. ¿Cuántas formas de
seleccionar existen sin orden alguna?
ESTIMACIONES
i)
Xi I. A. i) x =
x i
=
n
1.61 1.72 ... 1.80
= 1.71
10
X1 = 1.61 A
X2 = 1.72 D
X3 = 1.79 D
X4 = 1.60 A
X5 = 1.66 D
X6 = 1.69 D
X7 = 1.70 A
X8 = 1.74 D
X9 = 1.79 D
X10 = 1.80 A
X x
2
0.047
ii) S i
= = 0.072
n 1 10 1
NOTA: (n -1) Factor de corrección, cercano a 1; cuando la Población es finita grande y se estudia muestra (n) pequeño
Cálculo previo:
0.047
A = 4
D = 6
4 6
Índice aprobado: p = = 40% Índice desaprobado: p =
10 10
= 60%
NOTA:
X = Promedio muestral estimador puntual de poblacional
S = Desviación estándar muestral puntual estimador de la desviación
poblacional
p = Proporción muestral estimador puntual de la proporción P
poblacional.
4.1 DISTRIBUCIONES MUESTRALES
X = 1.71 X = 1.69
10 X =X 10 10
S = 0.072 S = 0.065
S =Y
p = 40% p = 43%
p = Z
Muestreo X S P
1 1.71 0.072 40%
2 1.69 0.065 43%
3 1.70 0.060 41%
4 1.72 0.059 44%
5 1.69 0.075 59%
Frecuencia
relativa
1.71 1 0.2
1.69 2 0.4
1.70 1 0.2
1.72 1 0.2
5 1.0
Distribución Distribución
Distrib.
Muestral Muestral
Muestral
X S
P
Las distribuciones muestrales puntuales tienen el comportamiento de
distribución normal cuando se aplica distribuciones de frecuencia de X a partir de
muestra de tamaño (ni), por ejemplo; 10 de los 380 alumnos. Porque los extremos se
alejan del promedio general.
i) Valor esperado( X ).- Distintas muestra aleatorias simples dan como resultado
varios valores de la media de la muestra X .
E X = Valor esperado de X
EX = = Media de la población
N n
X = X =
N 1 n n
N n
= Factor de corrección, cercano a 1; cuando la población es
N 1
finita grande y se estudia muestra (n) pequeño
Usar para calcular desviación estándar de X , siempre que:
n
i) Valor esperado de P
EP = Valor esperado de P
EP = P P = Proporción poblacional
N n P(1 P) p(1 P)
P = P =
N 1 n n
np 5
n(1-P) 5
4.4 PROPIEDADES DE LOS ESTIMADORES PUNTUALES
X
n
S
P
UNIDAD IV
ESTIMACIONES ESTADÍSTICAS
Cómo usar una muestra aleatoria simple para obtener una estimación del
intervalo de una media poblacional.
PRIMER CASO: n 30, se conoce poblacional
SOLUCION
1.- ERROR MUESTRAL.- Siempre que se usa media de muestra para inferir un
estimador puntual de una media poblacional, la pregunta es: ¿Qué tan buena es
la estimación? ¿ x ?
Em = x - . Valor absoluto
i) Sí:
n = 100
= 20
x= x Desviación estándar de la distribución muestral x . Promedio de
n
variabilidad de los datos con respecto a su media
Cómo están distribuidos los
valores de x respecto a , esta
x= x= 20
=2 distribución da información
n 100 proporciona la base para un
enunciado de probabilidad acerca
del error de muestreo.
x
CONCLUSIÓN:
1.- Que 95% de las medias muestrales que se pueden obtener mediante un
tamaño de muestra n = 100 estarán dentro de 3.92 de la media
poblacional.
2.- Hay una probabilidad de 0.95 de que la media de una muestra origine un
error muestral de 3,92 o menos.
3.- Este enunciado de probabilidad es una declaración de precisión acerca
del error del muestreo que puede existir para Olva Currier si se usa la
media de una muestra aleatoria simple de n = 100 para estimar la media
poblacional. El valor 3,92, que proporciona un límite superior del error
de muestreo, se conoce como margen de error.
98%
- 4.66 4.66
Si:
n = 100
= 20
x = 82
i) Cómo se puede usar la declaración de precisión para construir una estimación del
valor del intervalo de confianza de una media poblacional.
ii) Una estimación del intervalo de una media poblacional toma la forma siguiente:
x Margen de error
x M.e.
-3,92 3.92
82 3.92
98%
3.92 3.92
Posibilidad aceptada
x
x
Posibilidad no aceptada
x
x Z Z valor de Z que origina un área de en
ii)
2
2 n 2
la cola o extremo superior de la distribución de
probabilidad normal estándar
Ejemplo:
Nivel de confianza = 95%
= (1 - 0.95) = 0,05
0.05
= = 0.025* * 0.5000 – 0.025 = 04750; buscar en la tabla z =
2 2
1.96
ENTONCES: x Z
2
n
20
82 1.96
100
82 3.92
Por tanto:
20
82 1.645 82 3.29; 3.29 margen de error
100
78.71 85.29
S
x Z S = Desviación estándar de la muestra
2
n
21708
i) x = ------------- = 361.8 362
60
ii) S = 6.870
360 364
a). Caso de muestras pequeñas ( n < 30) donde se supone que se conoce el valor
de ().
x Z Ejercicio igual que la anterior
2
n
b). Caso de muestras pequeñas en que () se estima mediante S
0 Z, t
0 t
2
s
x t S = Desviación estándar de la muestra (1- ) = Nivel de
confianza
n
2
t = Valor de t que da un área en el extremo derecho de la
X i 2
2
X = distribución t
n
(n – 1) = Grados de libertad que tiene que ver con el uso de S
X i x
2 como estimador de la poblacional
S=
n 1
SOLUCION
52 44 55 ... 59 1,075
i) X = 53.75 54 Estimación Puntual del
20 20
tiempo promedio de
adiestramiento.
ii) S =
52 54 44 54 55 54 ... 59 54
2 2 2 2
= 6.89 7
20 1
días de desviación estándar muestral
iv) Determinado una estimación del intervalo del promedio poblacional con
95% de confianza (suponiendo que la población de tiempos de
adiestramiento tiene una distribución de probabilidad normal):
Distribución t
n – 1 20 –1 = 19 grados de libertad
Entonces:
= 1 - 0.95 = 0.05 2 = 0.025 (buscar en la tabla t)
0.025
= 2.093
19
s
x t
2
n
7
54 2.093
20
54 3.276
- 50.474 57.276
c). El papel de distribución poblacional: cuando n > 30 y no se conoce la
distribución poblacional:
Si se conoce:
() entonces x Z
2
n
s
(s) entonces x Z
2
n
x Z Donde Z = margen de error
2
n 2
n
Entonces, una vez seleccionada el nivel de confianza (1 - ), y
conociendo el valor de (), podemos determinar el tamaño de (n) que se necesita
para cualquier margen de error:
E = Z
2
n
Z
2
n =
E
2
Z 2
n = 2 2
NOTA: Para usar la fórmula anterior, el valor Ede E es el margen de error que el
usuario está dispuesto a aceptar y el valor de Z es consecuencia directa de
2
nivel de confianza que se usa para determinar la estimación del intervalo.
Aunque se debe tomar en cuenta la preferencia del usuario, lo que se
escoge con más frecuencia es el 95% de confianza, Z 0.025 = 1.96. Además
se requiere un valor de la desviación estándar de la población (). En la
mayoría de los casos se desconoce (). Sin embargo, podemos aplicar esa
ecuación si contamos con el valor preliminar o valor de planeación de ().
En la práctica se puede optar por uso de los siguientes procedimientos:
Datos:
Me = 2
N. C = 95%
= 1- 0.95 = 0.05 2 = 0.025 = 0.5000 – 0.0250 = 0.4750 (buscar en la
tabla) = Z 0.025 = 1.96
= 10
2
Z 2
1.962 102
n = 22 n = = 96.04 96 elementos muestrales
E 22
P1 P
Distribución muestral p donde coeficiente de confianza = (1- )
n
De P
2
Z P P Z P
2 2
P1 P
P Z debe conocerse P
2 n
Z = Valor de Z que origina un área de en la cola extremo
2
2
superior de la distribución de probabilidad normal estándar.
Datos:
n = 480
P = 480 1,000 = 0.48
N. C. = 95%
0.481 0.48
0.48 = 1.96 = 0.033097 3.10%
1,000
margen de error
EJERCICIOS DE REPASO
1.- Se desea conocer el intervalo de confianza al 99%. Los datos provienen de una
distribución normal con una varianza de 144. Se toma una muestra de 15 sujetos en
los que se obtienen una media de 84.3% ¿Cuál es el intervalo de confianza de ?
2.- Se extrajo una muestra aleatoria de 64 estudiantes que sufrían gastritis y se determinó
para cada uno, la duración de la hospitalización. Se encontró que la duración media
de hospitalización fue de 8.25 días. Si se sabe que la duración estándar de la
población es de 3 días. Hallar el intervalo de confianza al 90%, 95%, 99% para .
3.- Se condujo una encuesta con el fin de estudiar las prácticas sanitarias dentales de 300
estudiantes entrevistados, 123 dijeron que regularmente se sometieron a una revisión
dental 2 veces al año. Con 95% de confianza halle el intervalo de confianza para la
proporción en la población de los alumnos que se sometieron a la revisión dental.
4.- 200 pacientes que sufrían cierta enfermedad fueron divididos al azar en dos grupos
iguales. Del primer grupo, quienes recibieron el tratamiento estándar 78 se
recuperaron en un plazo de 3 días. De los otros 100 quienes fueron tratados por medio
de un nuevo método, 90 se recuperaron en 3 días. Los médicos desearon estimar la
diferencia verdadera entre las proporciones de quienes se recuperaron en 3 días.
Hallar el intervalo de confianza al 90% para P1 – P2.
5.- Se ha tomado una muestra aleatoria de n = 18, el valor medio para la característica en
un estudio es 50.15, con desviación estándar 0.4. Obtener un intervalo de confianza
de 0.99 para .
6.- Se hacen 11 mediciones del diámetro de una esfera y dá como media 4.05 y una
desviación estándar de 0.4. Construir un intervalo del 90% para estimar la media
poblacional.
7.- En una encuesta se dice que el valor de planeación para la proporción poblacional P es
de 0.35. ¿De qué tamaño se debe tomar la muestra para obtener un intervalo de
confianza de 95% y con margen de error igual a 0.05?
8.- ¿De qué tamaño se debe tomar una muestra para tener 95% de confianza de que el
margen de error para la estimación de una proporción poblacional sea de 0.03?
Suponga que no dispone de datos históricos para establecer un valor de planeación
para P.
9.- ¿De qué tamaño debe ser la muestra para poder tener 95% en que error muestral es de
0 o menor? Suponga que la desviación estándar de la población es de 25.
UNIDAD IV
INFERENCIA ESTADÍSTICA
N1 = Ayacucho N2 = Huancayo
=? = ?
n1 =? n1 = ?
X =? X =?
E. P. = D1 2 X 1 - X 2
35 36 ... 38
i) X 1 = 35.50
12
S 1 1.883
39 32 ... 33
ii) X 2 = 32.75
12
S 2 2.8324
iii) D 35.50 32.75 2.75 Años. La edad promedio de los consumidores
1 2
n1 muestraaleatoriasimpledeP1
n2 muestraaleatoriasimpledeP2
12 desviaciones tan dardeP1
2 2 desviaciones tan dardeP2
2 2
S1 S
S X1 X 2 2
n1 n2
Ejemplo 2:
n1 12
n2 12
S1 1.883
2
S 2 2.8324
2
(1.883) 2 (2.8324) 2
i) Entonces: S X 1 X 2 = 0.982
12 12
0.825284 1 2 4.67472
d.1 Cuando:
V. E. (X1X 2 )
1 2
12 22 1 1
X 1X2
2( ); como 12 2 2 2 no
n1 n2 n1 n2
necesitamos estimaciones diferentes para 1 y 2
2 2
(n1 1) S1 (n2 1) S2
2 2
S2
n1 n2 2
1 1
S X1 X 2 S2( )
n1 n2
X- X t S X 1 X 2 Grado de libertad = n1 n2 2
2
Coeficiente de confianza = 1- α
SOLUCION
i) n1 12
n2 10
S1 0.58
11 10 ... 11
X2= 10.41
10
S2 0.41
(n 1) S1 (n2 1) S2
2 2
S 12
;
n1 n2 2
(12 1)(0.58)2 (10 1)(0.41)2
S2 0.261
12 10 2
1 1 1 1
S X1 X 2 S2( ) ; S X 1 X 2 (0.261)( ) 0.22
n1 n2 12 10
a) Grado de libertad = n 1 n2 = 12 + 10 – 2 = 20
b) = 1 – 0.09 = 0.10
c) t , 20; t , 20
2 2
n1 50 n2 35
X 13.6 X 11.6
S1 2.2 S 2 3.0
Ejemplo 3: Se cuenta con los datos de la tabla siguiente, que corresponden a dos
muestras aleatorias independientes tomadas de dos poblaciones.
Muestra 1 Muestra 2
10 7 8 7
12 7 8 4
9 9 6 9
1.80 2.29
2.64 2.48
1.97 2.69
2.30 1.78
1.97 2.46
1.69 2.10
2.18 2.36
Ejemplo 1: Como parte de un estudio para evaluar las diferencias en los niveles
educativos entre dos programas de capacitación, se aplicó un examen común.
Las calificaciones del examen son uno de los factores principales para evaluar
diferencias de la calidad entre los programas. Los resultados obtenidos son las
siguientes:
97 83 91 64 66 91
84
90 84 87 85 83 78
85
94 76 73 72 74 87
85
79 82 92 64 70 93
84
78 85 64 74 82 89
59
87 85 74 93 82 79
62
83 91 88 70 75 84
91
89 72 88 79 78 65
83
76 86 74 79 99 78
80
84 70 73 75 57 66
76
i) n1 = 30
97 83 91 ... 73
X = 82. 5
30
2 64
8
ii) n2 = 30
64 66 91 84 ... 76
X = 78 5
40
2 100
10
NOTA: es esta prueba nos interesa determinar si las medias de las dos poblaciones son
distintas.
b) Prueba Estadística
( X X ) ( 1 2 ) (82.5 78)(0)
Z ZC
1 2
2 2
82 102
1 2 30 40
NOTA: Si se desconoce los valores 1 y 2 podemos usar las desviaciones
estándar muestral S1 yS 2 para calcular el estadístico de prueba.
c) Toma de Decisión.
Valor ZT ?
Si 0.05 0.025 Z 0.025 , entonces, 0.5000 – 0.025 = 0.475
2 2
(tabla) = 1.96
REGLA:
RECHACE H 0 Sí: Z < - 1.96 ó Z > 1.96
d) Valor de P
e) Toma de Decisión:
REGLA:
RECHACE H 0 Sí: P <
= 0.05
P < = Se rechaza H 0
P = 0.0366
300 276
280 222
344 310
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265
i) n 1 = 12
300 280 ... 283
X = 325 5
12
S 2 1,600
S 40
iii) n 2 = 12
276 222 ... 265
X = 288 5
12
S 2 1,936
S 44
e) Calculo de t tabla
Sí: 0.05 0.025 Z 0.025 , entonces, 0.5000 – 0.025 = 0.475
2 2
(tabla) = 1.96
Región de Rechazo
0 1.96
REGLA:
RECHACE H 0 Sí: Tc > 1.96
f) Toma de Decisión
Como: 0.05 0.025 Z 0.025 , entonces, 0.5000 – 0.025 =
2 2
0.475 (tabla) = 1.96
Ejemplo: Una empresa manufacturera tiene dos métodos con los que sus obreros
pueden realizar una tarea de producción. Para maximizar la producción,
la empresa desea identificar el método con la menor media del tiempo
de terminación por unidad. Sea 1 la media del tiempo de terminación
para el método 1 y 2 la correspondiente para el método 2.
SOLCUCION
1 2 Diferencia de
tiempos d i
6.0 5.4 0.6
5.0 5.2 - 0.2
7.0 6.5 0.5
6.2 5.9 0.3
6.0 6.0 0.0
6.4 5.8 0.6
H 0 : 1 0
H A : 1 2 0
d) Prueba Estadística
Grados de libertad: n – 1 = 6 –1 = 5
t c t5 , tc t50.025 2.571
2
d d 0.30 0
tc tc 2.194
Sd 0.335
n 6
e) Toma de Decisión
REGLA:
RECHACE H 0 Sí: Tc < - 2.571 ó > 2.571
- 2.571 0 2.571
Sd
d t ( )
2
n
0.335
0.30 2.571( )
6
0.30 0.352
0.052 0.652
- 0.052 0 0.652
HUANTA HUANCAYO
n 1 = 250 n 2 = 300
EE 35 EE 27
SOLUCION
35
P1 0.14
250
27
P2 0.09
300
P1 (1 P1 ) P2 (1 P2 )
P p
N1 N2
Cuando sec onocelaspr oporciones
poblaciona les
p1 (1 p1 ) p 2 (1 p 2 )
SP p
n1 n2
Cuando sec onoce p1 p 2
0.24(0.86) 0.09(0.91)
S P p = 0.0275
250 300
d) Coeficiente de confianza
Cc = 1 - = 1 – 0.95 = 0.05
0.025
2
e) Intervalo de confianza
p1 p2 ( Z )( S p1 p2 )
2
Para : n1 (1 P1 ) yn2 (1 P 2 ) 5
on1 , n2 30
p1 p2 (t g .l ., )( S p1 p2 )
2
cuandon1 (1 p1 ) y (1 p2 5o
n1 , n2 30
ii) p1 p 2 ( Z )(S p1 p z )
2
H 0 P1 P2 0
H a P1 P2 0
b) Prueba estadística
Zt ?
1 0.95 0.05
0.025 0.5000 0.025 0.4750(tabla ) 1.96 Z t
2
Zc = ?
( p1 p 2 ) ( p1 p2 ) ( p1 p 2 ) ( p1 p2 )
Zc Zc
p p
1 2 ó S p1 p 2
1 1
SP p p(1 p)( )
n1 n2
CuandoP1 p2
n1 p1 n2 p 2
p
n1 n2
250(0.14) 300(0.09)
p 0.113 (1 p) 0.887
250 300
1 1
S P p 0.113(0.887)( ) 0.02
250 300
REGLA:
RECHACE H 0 Sí: Zc > Zt
d) Calculando valor de P
REGLA:
RECHACE H 0 Sí: Vp <
BIBLIOGRAFÍA
1. Alea, V.; Maqueda, I.; Muñoz, C.; Viladomiu, N. (2001) Estadística para las
ciencias sociales: cuestiones tipo test, editorial AC, Madrid.
2. Arnaldos García, F. et al. (2003) Estadística descriptiva para economía y
administración de empresas, editorial Thomson-Paraninfo, Madrid.
3. Canavos, G. C. (1995) Probabilidad y Estadística: Aplicaciones y Métodos, editorial
Mc Graw-Hill, Madrid.
4. Carey, P.; Berk, K. N. (2001) Análisis de Datos con Microsoft Excel, editorial
Thomson – Paraninfo, Madrid.
5. Casas Sánchez, J. M. (2000) Estadística I. Probabilidad y distribuciones, Centro de
Estudios Ramón Areces, Madrid.
6. Castillo Manrique, M. I.; Guijarro Garvi, M. (2005) Estadística Descriptiva y cálculo
de probabilidades, editorial Pearson – Alhambra, Madrid.
7. De Groot, M. H. (1988) Probabilidad y Estadística, editorial Addison-Wesley,
México.
8. Esteban García, J. et al. (2006) Estadística descriptiva y nociones de probabilidad,
editorial Thomson – Paraninfo, Madrid.
9. Fernández, H.; Guijarro, M.; Rojo, J.M.; Sanz, J.A. (1994) Cálculo de
Probabilidades y Estadística, editorial Ariel, Barcelona.
10. García Barbancho, A. (1981) Ejercicios de estadística descriptiva para economistas,
editorial Ariel, Barcelona.
11. Garido Yserte, R.; de Lucio Fernández, J.; Mañas Alcón, E.; Peinado Gracia, M. L.
(2003) Análisis del entorno económico de la empresa, editorial Pirámide, Madrid.
12. Llorente Galera, F.; Marín Feria, S.; Torra Porras, S. (2000) Métodos Probabilísticos
para la Empresa, editorial Centro de Estudios Ramón Areces, Madrid.
13. López Ortega, J. (2003) Problemas y ejercicios de probabilidad, editorial Tébar, Madrid.
14. Martín-Pliego López, F. J. (1992) Curso práctico de estadística económica, editorial
AC, Madrid.
15. Martín-Pliego López, F. J. (2004) Introducción a la Estadística Económica y
Empresarial, editorial Thomson-Paraninfo, Madrid.
16. Martín-Pliego López, F. J.; Montero Lorenzo, J. M., Ruiz-Maya Pérez, L. (2006)
Problemas de Probabilidad, 2ª edición, editorial Thomson-Paraninfo, Madrid.
17. Martín-Pliego López, F. J.; Ruiz-Maya Pérez, L. (2006) Fundamentos de
Probabilidad, 2ª edición, editorial Thomson-Paraninfo, Madrid.
18. Martín-Pliego, F. Javier y Ruiz-Maya, Luis: Fundamentos de Probabilidad. Editorial
19. Martín-Pliego, F. Javier, Ruiz-Maya, Luis y Montero, J. María: Problemas de
Probabilidad. Editorial Thomson, 2006.
20. Martín-Pliego, F. Javier: Introducción a la estadística económica y empresarial.
Teoría y práctica. Editorial Thomson, 2004.
21. Montero Lorenzo, J. M. (2007) Estadística Descriptiva, editorial Thomson-
Paraninfo, Madrid.
22. Montero Lorenzo, J.M. (2007) Problemas resueltos de Estadística Descriptiva para
Ciencias Sociales, 6ª edición, editorial Paraninfo CENGAGE Learning
23. Mures Quintana, M. J. (2003) Problemas de estadística descriptiva aplicada a las
ciencias sociales, editorial Pearson – Alambra, Madrid.
24. Newbold, P. (1997) Estadística para los negocios y la Economía, 4ª Edición,
editorial Prentice-Hall, Madrid.
25. Peña, D. (1991) Estadística. Modelo y Métodos, editorial Alianza Universidad,
Madrid. Rohatgi,
26. Peña, D. (2004) Fundamentos de Estadística, editorial Alianza Universidad, Madrid.
27. Pérez López, C. (2003) Estadística. Problemas resueltos y aplicaciones, editorial
Pearson - Prentice-Hall, Madrid.
28. Piñole Villar, R.; Moreno Sanz, A.; Caballero Carbonell, A. (2002) Análisis de datos y
probabilidad: Excel como instrumento de cálculo, editorial Civitas, Madrid.
29. Ruiz-Maya Pérez, L. (1989) Problemas de estadística, editorial AC, Madrid.
30. Sanz Lara, J. A.; Bedate Centeno, A.; González Fernández, J. (1996) Problemas de
estadística descriptiva empresarial, editorial Ariel, Barcelona.
31. Spiegel, M. (2002) Estadística, 3ª edición, colección Schaum, editorial McGraw-Hill,
Madrid.
Thomson, 2006.
32. Torra Porras, S. (2000) Principios de estadística descriptiva aplicada a la empresa,
Centro de Estudios Ramón Areces, Madrid.
33. Uña Juárez, I. (2003) Lecciones de Estadística Descriptiva, editorial Thomson –
Paraninfo, Madrid.
34. Uña Juárez, I.; Tomeo Perucho, V.; San Martín Moreno, J. (2003) Lecciones de
cálculo de probabilidades, editorial Thomson-Paraninfo, Madrid.
35. Uriel, E.; Muñiz, M. (1993) Estadística económica y empresarial. Teoría y problemas,
editorial AC, Madrid.