Parcial 2 Actualizado
Parcial 2 Actualizado
Parcial 2 Actualizado
4.1 un gerente de ventas de una empresa textil dice que en promedio se vende por $50000 al mes. El gerente
general no está de acuerdo. Para ello deciden hacer una prueba de hipótesis ¿Cuál es la hipótesis alternativa?
Η1µ ≠50000
4.1 Al resolver un contraste de hipótesis ¿A qué se denomina como “zona de rechazo de la hipótesis nula”?
Al conjunto de valores posibles del estadístico que son tan extremos que la probabilidad de que ocurran, cuando
Ho es cierta, es muy pequeña.
OM
Dentro de la distribución de muestreo del estimador, el estimador asume un valor poco probable.
4.1 Enuncie cuatro características que posee una hipótesis estadística. Seleccione las 4 (cuatro) opciones correctas
• Muchas veces, la situación de rechazo o aceptación es poco clara
.C
• Permite afirmar que un parámetro de su distribución tiene un valor especifico
• Confirma que una variable aleatoria se distribuye en una forma particular
• En ella se considera el valor de un parámetro correspondiente a la distribución poblacional conocida
DD
4.1 ¿Qué actividades generales comprende el planteamiento de lo que se conoce como pruebas de contraste o
hipótesis?.Seleccione las 3 (tres) opciones correctas.
● Se formula una hipótesis sobre la población.
● Se experimenta (la propia hipótesis nos sugiere como realizar el muestreo)
● Se decide si los resultados obtenidos para la muestra apoyan estadísticamente la hipótesis de partida
LA
4.1 Seleccione entre las siguientes opciones la que define mejor a ¿Qué es la hipótesis estadística?
Una afirmación acerca de la distribución de cierta variable aleatoria
4.1 Seleccione entre las siguientes opciones la que define mejor a ¿Qué es la hipótesis estadística?
Una estimación porcentual de valores
FI
4.1 Enuncie cuales son los pasos que deben seguirse para construir y resolver un contraste de hipótesis. (4
correctas)
● Calcular el estadístico y tomar la decisión – interpretarla.
● Determinar el nivel de significación.
4.1 Seleccione entre las siguientes opciones la que a su juicio define más acertadamente ¿Qué es un error tipo II?
Se comete cuando se decide aceptar la hipótesis nula que en realidad es falsa.
4.1 Seleccione entre las siguientes opciones la que a su juicio define más acertadamente ¿Qué es un error tipo I?
Cuando se decide rechazar la hipótesis nula que en realidad es verdadera.
4.1 ¿Cuál de todas estas opciones es la que mejor define que es: Hipótesis alternativa?
Es la negación de la Hipótesis nula.
4.1 Al realizar una prueba de contraste de hipótesis ¿Qué se debe hacer cuando los resultados obtenidos para la
muestra son poco probables, al suponer que la hipótesis de partida es cierta?
Rechazar dicha hipótesis
4.1 un gerente de ventas de una empresa textil dice que en promedio se vende por $50000 al mes. El gerente
general no está de acuerdo. Para ello deciden hacer una prueba de hipótesis ¿Cuál es la hipótesis nula?
H0=µ=50000
OM
4.2 ¿Cómo se denomina a la probabilidad de rechazar la hipótesis nula cuando es verdadera?
Nivel de significación.
.C
4.2 El error tipo I implica:
Rechazar la hipótesis nula cuando es cierta
DD
4.3.1 Un empresario dice que el paquete de galletas que fabrica tiene un peso promedio 250 gramos. Defensa del
consumidor sostiene que tiene menos. La desviación estándar poblacional es 5 gramos de 40 paquetes y se obtiene
un promedio de 225 gramos. A un 95% de confianza. ¿Cuál es el Z para la muestra?
-31.6227
LA
FI
4.3.1 Un empresario dice que el paquete de galletas que fabrica tiene un peso promedio 250 gramos. Defensa del
consumidor sostiene que tiene menos. La desviación estándar poblacional es 5 gramos de 40 paquetes y se obtiene
un promedio de 225 gramos. A un 95% de confianza. ¿Cuál es el Z crítico que define la zona de rechazo?
-1.6448
4.3.1 ¿Cómo podemos saber si hay diferencia entre las medias de dos poblaciones por medio de pruebas de
hipótesis? 3 correctas
● T de Student
● Normal Z
● ANOVA/ANAVA
4.3.1 Un empresario dice que el paquete de galletas que fabrica tiene un peso promedio 250 gramos. Defensa del
consumidor sostiene que tiene menos. La desviación estándar poblacional es 5 gramos de 40 paquetes y se obtiene
un promedio de 225 gramos. A un 95% de confianza. ¿Cuál es la conclusión?
Se rechaza la hipótesis nula
4.3.1 El verdulero del barrio dice que vende promedio 20kg banana por día… ¿Cuál es la hipótesis alternativa?
H1 µ≠20
4.3.1 Históricamente, la proporción de alumnos aprobados de métodos de análisis de datos es de al menos 0.4.
El director de la carrera sostiene que esa proporción es menor. Luego se tomó la muestra de 200 alumnos y se
obtuvo que es 0.30aprobó dicha materia. ¿Cuál es la condición en esta prueba de hipótesis si trabajamos con 95%
de confianza?
Se rechaza la hipótesis nula
OM
4.3.1 Históricamente, la proporción de alumnos aprobados de métodos de análisis de datos es de al menos 0.4.
El director de la carrera sostiene que esa proporción es menor. Luego se tomó la muestra de 200 alumnos y se
obtuvo que es 0.30aprobó dicha materia. ¿Cuál es la hipótesis alternativa?
H1 P< 0.4
.C
4.3.1 Históricamente, la proporción de alumnos aprobados de métodos de análisis de datos es de al menos 0.4.
El director de la carrera sostiene que esa proporción es menor. Luego se tomó la muestra de 200 alumnos y se
obtuvo que el 0.30 aprobó dicha materia. ¿Cuál es la hipótesis nula?
DD
H0 P>=0.4
4.3.1 Teniendo en cuenta lo visto sobre las pruebas de hipótesis, seleccione entre las siguientes opciones la que a su
juicio define más acertadamente ¿Qué es un procedimiento de prueba?
LA
Una regla con base en datos muéstrales para determinar si se acepta o rechaza una hipótesis nula planteada.
4.3.1 Teniendo en cuenta lo visto sobre las pruebas de hipótesis, seleccione entre las siguientes opciones las que a su
FI
juicio responden más acertadamente a la siguiente pregunta: ¿Qué especifica (que pasos comprende) un
procedimiento de prueba? Seleccione las 2 correctas
● Un estadístico de prueba
● Una región de rechazo
4.3.1 Un recurso para aumentar la potencia del contraste es disminuir ß (probabilidad de error tipo II), por medio de
aumentar el tamaño muestral ¿Qué consecuencia produce dicha acción?
Un incremento de los costos de estudio que se quiere realizar.
4.3.1 Seleccione entre las siguientes opciones la que mejor completa la siguiente afirmación: “En el estudio de dos
poblaciones, en la construcción de intervalos de confianza, las muestras deberán ser independientes, es decir…”
Muestras aleatorias
4.3.1 Seleccione entre las siguientes opciones la que mejor completa la siguiente afirmación: “en el estudio de una
población, si una población es muy grande se extrae un numero finito de muestras entre ellas, se encontraría una
variabilidad entre dichas medias muéstrales, de la misma que se encontraría en…
Las observaciones individuales de una sola muestra
3
4.3.1 Teniendo en cuenta lo visto sobre las pruebas de hipótesis, seleccione entre las siguientes opciones la que a su
juicio explica más acertadamente ¿Qué ocurre cuando en una muestra de tamaño prefijado se trata de disminuir
(por distintas formas) la probabilidad del error tipo I?
Se incrementa la probabilidad de error tipo II
4.3.2 Un nuevo método hacer piercing es probado por 7 personas distintas… Método A (2, 3, 10, 9, 8, 7, 6) y B (5, 1,
OM
1, 5, 2, 3, 4)…
No se rechaza la hipótesis nula
4.3.2 Seleccione las afirmaciones correctas respecto a lo leído sobre “Diferencia de medias poblacionales (dos
poblaciones). Seleccione las 4 (cuatro) opciones correctas
● Sirve para definir un intervalo de valores
.C
● Establece cuales son los valores máximos y mínimos aceptables
● Puede comprender muestras independientes
● Puede comprender muestras dependientes
DD
4.3.2 En el contraste de igualdad (o diferencia) de medias, en el caso que las muestras son pareadas, ¿Qué se hace
en la práctica en lugar de contrastar si las medias son iguales?
Se contrasta si la variable diferencia de estas dos variables tiene media cero.
4.3.2 Una computadora resuelve 6 tareas diferentes. Para resolver esas tareas, se quiere saber cuál de los dos
LA
software disponibles es mejor. Con el software A, se obtiene la siguiente performance para cada tarea
(20,50,10,20,15,21) y para el software B, (10,11,10,10,2,5) tener en cuenta que las tareas fueron resueltas en el
mismo orden ¿Cuál es el valor de SD?
13.0792
FI
4.3.2 Una computadora resuelve 6 tareas diferentes. Para resolver esas tareas, se quiere saber cuál de los dos
software disponibles es mejor. Con el software A, se obtiene la siguiente performance para cada tarea
(20,50,10,20,15,21) y para el software B, (10,11,10,10,2,5) tener en cuenta que las tareas fueron resueltas en el
4.3.2 Al contrastar y ver si dos poblaciones tienen, para la variable objeto de estudio, la misma media ¿Cuáles son
las situaciones que se nos pueden presentar?
1) Si las muestras son pareadas
2) Si las muestras son independientes la una de la otra.
4.3.2 Al contratar 2 poblaciones y verificar si tienen (para la variable objeto de estudio), la misma media, si las
muestras son pareadas, las muestras deben ser del mismo tamaño
VERDADERO
4.3.2 Si dos muestras provienen de poblaciones en las que la variable tiene la misma media, ¿Qué es lo que
normalmente nos interesara contrastar?
La igualdad de medias
OM
4.3.2 Se quiere compara la media de goles por partidos de 2 equipos de futbol. En el equipo A se tomó una muestra
de 8 partidos, con una media de 1,5 goles, desviación estándar 0,1. En el equipo B se tomo una muestra de 10
partidos con una media de 1,2 goles y una desviación estándar de 0,2. Se asume muestras normales 95% nivel de
confianza y varianzas distintas. Selecciones las 4 correctas
●
●
● .C
T de student: 4,14 ,Grado de libertad 13,77
Deferencias de medias 0,3
No se rechaza la H0(nula)
DD
● H0: µ1=µ2 y H1: µ1≠µ2
4.3.2 Se quiere compara la media de puntos promedio por partidos de 2 equipos de futbol. En el equipo A se tomó
una muestra de 8 partidos, con una media de 1,5 goles, desviación estándar 10. En el equipo B se tomo una muestra
LA
de 10 partidos con una media de 60 goles y una desviación estándar de 12. Se asume muestras normales 95% nivel
de confianza y igualdad de varianzas. Selecciones las 4 correctas
4.3.2 Se quiere compara la media de puntos promedio por partidos de 2 equipos de básquet. En el equipo A se
tomó una muestra de 18 partidos, con una media de 65 puntos y una desviación estándar 10. En el equipo B se
tomo una muestra de 10 partidos con una media de 60 puntos y una desviación estándar de 12. Se asume muestras
normales 95% nivel de confianza e igualdad de varianzas. Selecciones las 4 correctas
4.3.3 En el análisis de varianza de dos factores, ¿Cuándo se dice que existe “Interacción”?
OM
Cuando el efecto de un factor (tratamientos) es diferente para todos los niveles del otro factor
4.3.3 En el análisis de varianzas de 2 factores, ¿Con que otro nombre se conoce también “Al diseño de bloques
al azar”?
Diseño de bloques aleatorizados
.C
5 Cuatros medidas de correlación entre variables son: seleccione las 4 (cuatro) respuestas correctas:
● Q de Kendall
● Coeficiente de correlación de Pearson
● Coeficiente de correlación de Spearman
DD
● V de Cramer
5.1.1 ¿cuál de las siguientes opciones es la que mejor define que es una tabla de contingencias?
Tabla bidimensional que permite tabular en forma cruzada las frecuencias observadas de
LA
5.1.1 En las tablas dicotómicas la asociación se suele medir entre las distintas modalidades de los atributos
¿Cuál es principal inconveniente asociación H?
FI
5.1.1 ¿Cuáles son los objetivos que persigue el análisis de las distribuciones de dos o más dimensiones? Señale las 4
(cuatro) opciones correctas
5.1.1 Al estudiar el tema de Relaciones entre variables, vemos que la dependencia estadística observada entre dos
variables puede establecer a tres motivos diferentes. Señale los 3 correctos.
● Al azar
● Una tercera variable influye sobre las dos consideradas
● Una variable influye en la otra
5.1.1 Cuando analizamos la relación de dependencia o independencia entre dos variables cualitativas nominales o
factores ¿Qué resulta necesario estudiar?
Su distribución conjunta o tabla de contingencia.
5.1.1 Cuando hablamos de construir una tabla de contingencia ¿Qué significa clasificación de atributos
“Dicotómica”?
Aquella en la que cada atributo tiene solo dos modalidades posibles
OM
5.1.1 El grado de asociación existente entre dos variables puede medirse mediante las técnicas de
correlación ¿Qué nos proporcionan esas técnicas?
Unos coeficientes que nos cuantifican ese grado de asociación
5.2.1 La V de Cramer asume valores entre 0 y 1 por lo cual, no dice nada sobre la dirección de la
asociación.
Verdadero
.C
DD
5.2.1 Dado que el Chi Cuadrado para determinado fue 25. El tamaño de la muestra fue 100. En la tabla de
contingencia tenemos 3 y 2 columnas. ¿Cuál es el valor V de Cramer?
0.5
LA
5.2.1 Dado que el Chi Cuadrado para determinado fue 35. El tamaño de la muestra fue 150. En la tabla de
FI
5.2.1 Teniendo en cuenta lo visto en correlación y regresión lineal ¿Qué resultara importante para un investigador
que está examinando la relación existente entre dos variables al profundizar su análisis? Señale las 2 opciones
correctas:
● Medir el grado de asociación
● Conocer la forma en que se relacionan
5.2.1 Los coeficientes de la asociación o correlación pueden expresarse en diagramas de dispersión de acuerdo al
valor que posea dicho coeficiente. Señale los… diagramas de dispersión (en función de los respectivos coeficientes
de correlación) dentro de las siguientes opciones:
● De relación lineal directa
● De relación lineal inversa
● De relación curvilínea
5.2.2 ¿Cuál de las siguientes opciones (solo una) es la que precisa más acertadamente para qué sirve el coeficiente
Q de Kendall?
Para medir la asociación entre dos variables a nivel clasificatorio.
5.2.2 ¿Cuál de las siguientes opciones (solo una) es la que precisa más acertadamente cómo se usa el coeficiente
Q de Kendall?
En cuadros de 2 columnas por dos renglones
5.2.2 ¿Cuál de las siguientes opciones (solo una) es la que precisa más acertadamente cómo se usa el coeficiente Q
de Kendall?
OM
Se usan en cuadros de dos columnas por dos renglones.
5.2.2 La Q de Kendall asume valores entre -1 y 1, por lo cual, podemos saber la dirección de la
asociación:
Verdadero
.C
5.2.3 El coeficiente de Spearman es una variedad de coeficiente de Pearson:
Verdadero
DD
5.2.3 El coeficiente de Spearman es uno de los más se aplican, en particular ¿Cuándo se destaca su utilidad?
Cuando el número de pares de puntuaciones (n) que se desea asociar es pequeño (menor que 30)
5.2.3 ¿Con que otra denominación se lo conoce al coeficiente de asociación R de Spearman? Correlación
producto-momento
5.2.3 ¿Con que otra denominación se lo conoce al coeficiente de correlación por rangos de Spearman?
Coeficiente de correlación ordinal
5.2.3 ¿En qué consisten los dos métodos para calcular el coeficiente de correlación de Pearson?
En el primer método se utilizan los resultados del análisis de la varianza y se aplica la formula correspondiente. El
segundo método conduce a la formula producto-momento por medio de determinantes.
5.2.3 Dado el siguiente conjunto de datos x= (1,20,3,5,10) e y= (5,80,20,30,50) ¿Cuál es el coeficiente de correlación
de Pearson?
0,98
OM
5.2.3 ¿Cuál de las siguientes opciones (solo una) es la que define más acertadamente qué es la Distribución Ji
Cuadrado de Pearson?
Es una distribución de probabilidad continua y positiva
.C
5.2.3 ¿Cuál de las siguientes opciones (solo una) es la que define más acertadamente qué es el coeficiente de la
correlación de Pearson?
Es una medida de la relación lineal entre dos variables aleatorias cuantitativas.
DD
5.2.3 ¿Cuál de las siguientes opciones (solo una) es la que precisa más acertadamente de que depende la
Distribución Ji Cuadrado de Pearson?
De un parámetro llamado grados de libertad.
LA
5.2.3 ¿Cuál de las siguientes opciones (solo una) es la que indica más acertadamente que estudia la correlación?
El grado de asociación entre las componentes de la variable estadística.
5.3 ¿Cuál de las siguientes opciones es la que mejor define que es una regresión múltiple?
Es un procedimiento estadístico que permite analizar los efectos simultáneos de dos o más variables
5.3 En el análisis de regresión lineal, cuando el investigador supone una posible relación entre la variable
independiente y la dependiente, establece un modelo específico para obtener la mejor estimación (y) de Y. Con ese
fin…¿Qué se obtiene?
La ecuación de regresión.
5.3 Dado el siguiente conjunto de datos x=(1,20,3,5,10) e y= (5,80,20,30,50) Si hacemos una regresión lineal ¿Cuál es
el valor de la ordenada de origen?
7.53
5.3 Dado el siguiente conjunto de datos x=(1,20,3,5,10) e y= (5,80,20,30,50) Si hacemos una regresión lineal ¿Cuál es
el valor de la pendiente?
3.77
OM
5.3. En la evaluación de ecuación de regresión, dos métodos son los más adecuados para obtener un nivel de
confianza satisfactorio en una ecuación de regresión poblacional estimada ¿Cuáles son esos métodos?
1) Construir intervalos de confianza
2) Realizar las pruebas de hipótesis para la regresión.
.C
5.3 Dado el siguiente conjunto de datos x=(1,20,3,5,10) e y= (5,80,20,30,50) Si hacemos una regresión lineal ¿Cómo
es la ecuación para obtener algún valor de y?
DD
Y=7.53+3.77X
● Coeficiente de Pearson=0.93
● Coeficiente de Spearman=0.94
● Ordenada de origen=-3.33
FI
5.3 ¿Cuáles son los supuestos del análisis de regresión? (Selecciones las 3 correctas?
● Homocedasticidad
● Normalidad
● Independencia de error
5.3 El ingreso de un obrero está dada por las siguiente recta y=15000+100x ¿Cómo se interpreta la ordenada al
origen?
Un ingreso mínimo de 15000.
10
OM
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado artista, según el
sexo. Si trabajamos con un α=0.05. ¿Cuál es el valor que V de Cramer?
0,007
.C
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado artista, según el
DD
sexo. Si trabajamos con un α=0.05. ¿Cuál es el valor de Q de Kendall?
0,02
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado sabor de helado
LA
según el nivel de vejez. Si trabajamos con un α=0.05. ¿Cuál es el valor que V de Cramer?
FI
0,19
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado artista, según el
sexo. Si trabajamos con un α=0.05. Podemos decir que:
✓ Dada la siguiente tabla, en donde podemos ver la cantidad de personas que les gusta determinado sabor de
helado según el nivel de vejez. Si trabajamos con un α=0.05. ¿Cuál es el valor que Q de kendall?
-0,4
11
OM
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado sabor de helado
según el nivel de vejez. Si trabajamos con un α=0.05 ¿Cuál es la hipótesis nula?
.C
H0: La preferencia del sabor de helado y el nivel de vejez son independientes
DD
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado sabor de helado
según el nivel de vejez. Si trabajamos con un α=0.05. ¿Cuál es el valor que Q de Kendall?
LA
-0,19
FI
(4.1) ¿Cuál de todas estas opciones es la que mejor define que es: Estadístico de contraste (o medida de
discrepancia)?
Es cualquier función de los datos muéstrales y del parámetro especificado por la hipótesis nula, cierta
(4.3.1) El verdulero del barrio dice que vende en promedio 20 kg de banana por día. Se observó cuanto vendía
durante 7 días y el promedio observado fue de 18 kg, con una desviación estándar muestral 5 kg. Su hijo sostiene
que el promedio es distinto. ¿Cuál es la conclusión en esta prueba de hipótesis?
✓ Dada la siguiente tabla, en donde vemos la cantidad de personas que le gusta determinado sabor de helado
según el nivel de vejez. Si trabajamos con un α=0.05. ¿Cuál es la hipótesis nula?
Ho
12
(4.1) En un juicio, si tenemos la hipotesis “es inocente hasta que se demuestre lo contrario” entonces en estadistica
es:
La hipotesis es nula
(4.3.2) Se quiere comparar la media de goles por partido de dos equipos de futbol. En el equipo A se tomo una
muestra de 8 partidos, con una media de 1.5 goles y desviacion estandar de 0.1. En el equipo B se tomo una muestra
de 10 partidos, una media de 1.2 goles por partido y una desviacion estandar de 0.2. Se asume muestras normales
95% de nivel de confianza y varianzas distintas. Seleccione las 4 (cuatro) respuestas correctas.
OM
• T de student_4.14 con 13.77 grados de libertad
• Diferencia de las medias: 0.3
• No se rechaza la hipótesis nula
• H0 µ1=µ2 y H1 µ1≠µ2
.C
DD
LA
FI
(5.2.1) Teniendo en cuenta lo visto en correlación y regresión lineal, ¿Cuáles son las técnicas estadísticas que se
diseñan para medir el grado de asociación de variables y para conocer la forma en que se relacionan?
La correlación y la regresión
(4.1) Seleccione entre las siguientes opciones la que a su juicio define más acertadamente ¿Qué es una prueba de
hipótesis?
Es un proceso para determinar la validez de una aservacion hechas sobre la población basándose en evidencia
muestral
(5) Dos medias de correlación entre variables categóricas son: Seleccione las 2 (dos) respuestas correctas
• V de Cramer
• Q de Kendall
13
OM
.C
DD
(5.2.1) Dado que el chi cuadrado para determinado fue 35. El tamaño de la muestra fue 150. En la tabla
LA
0.007
(5.2.1) Teniendo en cuenta lo visto en Correlación y Regresión lineal. ¿Cuál de las siguientes opciones (solo una), es
la que indica más acertadamente de que se encarga la regresión?
De la determinación de aquella estructura de dependencia que mejor exprese el tipo de relación existente entre los
componentes
14
OM
del consumidor sostiene que tiene menos. La desviación estándar (no se lee) gramos. Se toma una muestra de 40
paquetes y se obtiene un promedio de 225 gramos. Aun 95% de confianza. ¿Cuál es el Z crítico que define la zona de
rechazo?
-1.6448
.C
DD
LA
FI
15
OM
● Un análisis exploratorio de los datos
● Evaluar los datos sin ningún prejuicio o parcialidad
● Sobre la ase de ese análisis escoger el método estadístico más apropiado
● Obtener la mayor cantidad de información posible
.C
DD
LA
FI
16