0% encontró este documento útil (0 votos)
96 vistas17 páginas

Trabajo 3 Estadística.

El documento presenta los resultados de un análisis estadístico realizado para comparar el rendimiento académico en matemáticas de estudiantes de escuelas públicas y privadas. Se analizan las medias, varianzas y distribuciones de los puntajes, y se aplican pruebas t y de Kolmogorov-Smirnov para determinar si existen diferencias significativas entre los grupos. Los resultados no muestran diferencias estadísticamente significativas entre las escuelas pública y privada.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
96 vistas17 páginas

Trabajo 3 Estadística.

El documento presenta los resultados de un análisis estadístico realizado para comparar el rendimiento académico en matemáticas de estudiantes de escuelas públicas y privadas. Se analizan las medias, varianzas y distribuciones de los puntajes, y se aplican pruebas t y de Kolmogorov-Smirnov para determinar si existen diferencias significativas entre los grupos. Los resultados no muestran diferencias estadísticamente significativas entre las escuelas pública y privada.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 17

Universidad del Atlántico

Taller 3 unidad 3

FORMACIÓN BÁSICA EN DIDÁCTICA II

Nombre: Johan Manuel Osorio Romero


Cristian Javier Cárdenas Herrera

Profesor: Mr. Kennedy Hurtado

Barranquilla, Atlántico julio 11 del 2021


1.El Rector de una Institución Educativa sospecha que el puntaje
promedio en Matemáticas en las pruebas Saber 11º es igual al promedio
nacional, la cual es de 65 puntos. El Rector selecciona una muestra
aleatoria de 10 estudiantes y obtiene los siguientes resultados: 67, 68,
68, 72, 62, 73, 60, 52, 68 y 59. Después de una investigación el Rector
concluye que los puntajes es una variable aleatoria que se distribuye
normalmente con una varianza conocida de 42,5 puntos. Con base a
esta información, ¿se encuentra apoyada la sospecha del rector con α =
0,05?. ¿Cuál es el valor p?

Resumen Estadístico para puntaje promedio


Recuento 10
Promedio 64,9
Desviación Estándar 6,52261
Coeficiente de Variación 10,0502%
Mínimo 52,0
Máximo 73,0
Rango 21,0
Sesgo Estandarizado -0,973167
Curtosis Estandarizada 0,0550206

A continuación, analizaremos la parte inferencial del caso y de esta manera


saber si el rector tiene la razón, acerca de su afirmación.

Pruebas de Hipótesis

Media muestral = 64,9


Desviación estándar muestral = 6,52
Tamaño de muestra = 10

Intervalos de confianza del 95,0 % para la media: 64,9 +/- 4,66414


[60,2359;69,5641]

Hipótesis Nula: media = 65,0


Alternativa: no igual
Estadístico t calculado = -0,0485012
Valor-P = 0,962376
No rechazar la hipótesis nula para alfa = 0,05.
Este análisis muestra los resultados de realizar una prueba de hipótesis relativa
a la media (mu) de una distribución normal. Las dos hipótesis a ser evaluadas
aquí son:

Hipótesis nula: mu = 65,0


Hipótesis alterna: mu <> 65,0

Dada una muestra de 10 observaciones con una media de 64,9 y una


desviación estándar de 6,52, el estadístico t calculado es igual a -0,0485012.
Puesto que el valor-P para la prueba es mayor o igual que 0,05, no puede
rechazarse la hipótesis nula con un 95,0% de nivel de confianza. El intervalo
de confianza muestra que los valores de mu soportados por los datos caen
entre 60,2359 y 69,5641.

Curva de Potencia
alfa = 0,05, sigma = 6,52

0,8

0,6
otencia(1- beta)

0,4
P

0,2

0
56 59 62 65 68 71 74
Media Verdadera

Podemos observar que el p-valor es mayor que 0.05, lo cual nos lleva a
concluir que el rector tiene la razón, es decir, que el promedio del puntaje de
los alumnos de la institución es de 65 con una confianza del 95%.
2.Probar si el rendimiento en la prueba de aprovechamiento matemático
de los estudiantes de escuela pública y privada es el mismo. Los datos
son como siguen:

Privada 642 767 641 721 625 689

Publica 580 638 704 694 615 617 623 689

Utilice la salida del SPSS


a. Verifique normalidad de los datos.
b. ¿Cuál es la hipótesis nula y alternativa?
c. Omitiendo el punto a, realice una prueba no paramétrica para comparar
medias y varianzas. ¿Cuál es la hipótesis nula y alternativa?
d. Compare con los resultados de un test paramétrico.

 a)

Resumen Estadístico
Escuela Escuela
Privada Pública
Recuento 6 8
Promedio 680,833 645,0
Varianza 3063,37 2037,14
Desviación 55,3477 45,1347
Estándar
Coeficiente de 8,1294% 6,99763%
Variación
Mínimo 625,0 580,0
Máximo 767,0 704,0
Rango 142,0 124,0
Sesgo 0,724195 0,176163
Estandarizado
Curtosis -0,430571 -0,866573
Estandarizada
Pruebas de Normalidad para Escuela Privada y Publica

Media Desviación Estándar


PRIVADA 680,833 55,3477
PUBLICA 641,333 48,496

Correlaciones de muestra
PRIVADA PUBLICA
PRIVADA 1,0 0,222442
PUBLICA 0,222442 1,0

Número de observaciones = 6

Pruebas de Normalidad
Prueba Estadístico Valor-P
W Shapiro-Wilk - PRIVADA 0,908 0,4210
W Shapiro-Wilk - PUBLICA 0,923 0,5286
H de Royston 1,046 0,5932

Debido a que el valor-P más pequeño de las pruebas realizadas es mayor ó


igual a 0,05, no se puede rechazar la idea de que Escuela Pública y Privada
proviene de una distribución normal con 95% de confianza.
 b) Planteamiento de hipótesis
 Hipótesis nula H0= Los puntajes de la escuela pública y privada
son iguales.
 Hipótesis alternativa Ha= Los puntajes de la escuela pública y
privada son diferentes.

Prueba t para comparar medias


Hipótesis nula: media1 = media2
Hipótesis Alt.: media1 <> media2
suponiendo varianzas iguales: t = 1,33647 valor-P = 0,206185
No se rechaza la hipótesis nula para alfa = 0,05.

 c) Test no paramétrico.

Hipótesis nula: media1 = media2


Hipótesis Alt.: media1 <> media2

Prueba de Kolmogórov-Smirnov
Estadístico DN estimado = 0,5
Estadístico K-S bilateral para muestras grandes = 0,92582
Valor P aproximado = 0,361236

Esta opción ejecuta una prueba de Kolmogórov-Smirnov para comparar las


distribuciones de las dos muestras. Esta prueba se realiza calculando la
distancia máxima entre las distribuciones acumuladas de las dos muestras. En
este caso, la distancia máxima es 0,5, que puede verse gráficamente
seleccionando Gráfica de Cuantiles de la lista de Opciones Gráficas. De
particular interés es el valor-P aproximado para la prueba. Debido a que el
valor-P es mayor ó igual que 0,05, no hay diferencia estadísticamente
significativa entre las dos distribuciones con un 95,0%.

Escuela Privada

1
frecuencia

3
570 610 650 690 730 770 810
Escuela Pública
Gráfico Caja y Bigotes

Escuela Privada

Escuela Pública

580 620 660 700 740 780

 d) Test paramétrico.

Comparación de Dos Muestras - Escuela Privada & Escuela Pública


Muestra 1: Escuela Privada (1)
Muestra 2: Escuela Pública (2)

Muestra 1: 6 valores en el rango de 625,0 a 767,0


Muestra 2: 8 valores en el rango de 580,0 a 704,0

Este procedimiento está diseñado para comprar dos muestras de datos.


Calculará varias estadísticas y gráficas para cada muestra, y ejecutará varias
pruebas para determinar si hay diferencias estadísticamente significativas entre
las dos muestras.

Comparación de Medias
Intervalos de confianza del 95,0% para la media de Escuela Privada: 680,833
+/- 58,084 [622,749; 738,917]
Intervalos de confianza del 95,0% para la media de Escuela Pública: 645,0 +/-
37,7337 [607,266; 682,734]
Intervalos de confianza del 95,0% intervalo de confianza para la diferencia de
medias
suponiendo varianzas iguales: 35,8333 +/- 58,4184 [-22,585; 94,2517]

Prueba t para comparar medias


Hipótesis nula: media1 = media2
Hipótesis Alt.: media1 <> media2
suponiendo varianzas iguales: t = 1,33647 valor-P = 0,206185
No se rechaza la hipótesis nula para alfa = 0,05.
Esta opción ejecuta una prueba-t para comparar las medias de las dos
muestras. También construye los intervalos, ó cotas, de confianza para cada
media y para la diferencia entre las medias. De interés particular es el intervalo
de confianza para la diferencia entre las medias, el cual se extiende desde
-22,585 hasta 94,2517. Puesto que el intervalo contiene el valor de 0, no hay
diferencia significativa entre las medias de las dos muestras de datos, con un
nivel de confianza del 95,0%.

También puede usarse una prueba-t para evaluar hipótesis específicas acerca
de la diferencia entre las medias de las poblaciones de las cuales provienen las
dos muestras. En este caso, la prueba se ha construido para determinar si la
diferencia entre las dos medias es igual a 0,0 versus la hipótesis alterna de que
la diferencia no es igual a 0,0. Puesto que el valor-P calculado no es menor
que 0,05, no se puede rechazar la hipótesis nula.

NOTA: estos resultados asumen que las varianzas de las dos muestras son
iguales. En este caso, esa suposición parece razonable, con base en los
resultados de la prueba-F para comparar las desviaciones estándar. Pueden
verse los resultados de esta prueba seleccionando Comparación de
Desviaciones Estándar del menú de Opciones Tabulares.

Escuela Privada

1
frecuencia

3
570 610 650 690 730 770 810
Escuela Pública

Podemos observar que al comparar los dos resultados de los incisos d y


c, se puede observar que hay claras diferencias en cuestión de la
diferencia significativa de las medias entre los dos test. En el inciso c
hay diferencia entre las medias y mientas que en el d no.
3.De la base de dato informe 7º grupo 01 se tienen los puntajes
obtenidos por los alumnos de una Institución Educativa en una prueba.
Se escogió los puntajes de Química y Biología, observando los puntajes
obtenidos:
a. Construya un diagrama de caja para las dos muestras. Obtenga
conclusiones tentativas a partir de estas gráficas.
b. Determine un intervalo de confianza del 95% para las medias de
ambas variables.

 a) Diagrama de cajas y bigotes.

Resumen Estadístico
Química Biología
Recuento 38 38
Promedio 2,18947 3,61579
Varianza 0,211778 0,750014
Desviación 0,460194 0,866034
Estándar
Coeficiente de 21,0185 23,9514%
Variación %
Mínimo 1,0 1,8
Máximo 3,4 4,7
Rango 2,4 2,9
Sesgo 0,700936 -1,27341
Estandarizado
Curtosis 1,43207 -0,941596
Estandarizada

Esta tabla contiene el resumen estadístico para las dos muestras de datos.
Pueden utilizarse otras opciones tabulares, dentro de este análisis, para
evaluar si las diferencias entre los estadísticos de las dos muestras son
estadísticamente significativas. De particular interés son el sesgo
estandarizado y la curtosis estandarizada que pueden usarse para comparar si
las muestras provienen de distribuciones normales. Valores de estos
estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la
normalidad, lo que tendería a invalidar las pruebas que comparan las
desviaciones estándar. En este caso, ambos valores de sesgo estandarizado
se encuentran dentro del rango esperado. Ambas curtosis estandarizadas se
encuentran dentro del rango esperado.

Química

20

10
frecuencia

10

20
0 1 2 3 4 5
Biología
Podemos observar que la media de notas de la asignatura de biología es
mucho mayor que la de química, es decir, estas dos muestras están muy
separadas entre silo cual hace prever que el rendimiento de biología es
muy superior y está a la derecha de la mediana de los datos, mientras
que química está más a la izquierda, por ende, nuca van a coincidir.

Gráfico Caja y Bigotes

Química

Biología

0 1 2 3 4 5

 b) Intervalo de confianza al 95%.

Intervalos de confianza del 95,0%


Media Error Límite Límite
Est. Inferior Superior
Químic 2,1894 0,07465 2,03821 2,34074
a 7 32
Biologí 3,6157 0,14048 3,33113 3,90045
a 9 9
Sigma Límite Límite
Inferior Superior
Químic 0,46019 0,375179 0,595374
a 4
Biologí 0,86603 0,706046 1,12043
a 4

Esta tabla muestra intervalos de confianza del 95,0% para las medias y
desviaciones estándar de cada una de las variables. Podemos observar que al
no estar el cero en nuestro intervalo podemos concluir que hay diferencias
significativas en las medias de las muestras, donde es obvio ver que el
rendimiento de biología es muy superior al de química.

Resumen Estadístico
Química Biología
Recuento 38 38
Promedio 2,18947 3,61579
Varianza 0,21177 0,75001
8 4
Desviación 0,46019 0,86603
Estándar 4 4
Coeficiente de 21,0185 23,9514
Variación % %
Mínimo 1,0 1,8
Máximo 3,4 4,7
Rango 2,4 2,9
Sesgo 0,70093 -
Estandarizado 6 1,27341
Curtosis 1,43207 -
Estandarizada 0,94159
6

4. Los promedios en una prueba de 38 alumnos en una institución


educativa son: (Ver base de datos informe 7º grupo 01)

¿Qué proporción de estos puntajes cae:

 a) ¿Dentro de ±1 desviación estándar de la media?

Resumen Estadístico para PROMEDIO

Recuento 38
Promedio 2,71053
Desviación Estándar 0,399181
Coeficiente de Variación 14,7271%
Mínimo 2,0
Máximo 3,6
Rango 1,6
Sesgo Estandarizado 0,62731
Curtosis Estandarizada -0,73385

x́−s=2,71053−0,399181=2,311349

x́ +s=2,71053−0,399181=3,109711

Dentro de esta proporción, podemos encontrar aproximadamente el 68,42% del


total de promedios obtenidos por los estudiantes de 7° grupo 01. Lo que indica
que si se satisface el teorema de chebychev porque esta cantidad es mayor al
0% de las observaciones.

 b) Dentro de ±2 desviaciones estándar de la media

x́−2 s=2,71053−2(0,399181)=1,912168

x́ +2 s=2,71053−2( 0,399181)=3,508892

Dentro de esta proporción, podemos encontrar aproximadamente el 97,36% del


total de promedios obtenidos por los estudiantes de 7° grupo 01. Lo que indica
que si se satisface el teorema de chebychev porque esta cantidad es mayor al
75% de las observaciones.

 c) dentro de ±3 desviaciones estándar de la media? ¿Si se decide


excluir los estudiantes con puntajes que están fuera del intervalo x́ ±
2s cuál es el porcentaje de estudiantes excluidos? ¿Se verifica la
regla de Tchebychev?

x́−3 s=2,71053−3(0,399181)=1,512987
x́ +3 s=2,71053−3(0,399181)=3,908073

Dentro de esta proporción, podemos encontrar el 100% del total de promedios


obtenidos por los estudiantes de 7° grupo 01. Lo que indica que si se satisface
el teorema de chebychev porque esta cantidad es mayor al 89% de las
observaciones.

Ahora, si se desea excluir a los estudiantes están fuera del intervalo x́ ± 2s, se
tiene que:
100 %−97,36 %=2,64 %
Esto indica, que se excluye el 2,64% de los puntajes obtenidos por los
estudiantes del curso 7° grupo 01.

5.El rector de una Universidad desea comparar el rendimiento


académico de tres programas en la facultad de Ciencias Económicas.
Para ello, presenta la siguiente información acerca de las calificaciones
definitivas, semestre aproximado, créditos y pago del semestre (ver base
de datos adjuntas).

Utilice la salida del SPSS, statgraphic o R para verificar

 a) Normalidad de los datos y plantear las hipótesis de la variable


notas definitivas.

Gráfico Chi-Cuadrada
con 95% límites K-S

1
K-S = 0,115
P-valor > 0.10
Distribuciones Acumuladas

0,8

0,6

0,4

0,2

0
0 3 6 9 12 15
distancia cuadrada
Pruebas de Normalidad

Prueba Estadístico Valor-P


W Shapiro-Wilk - DEF. ECONOMIA 0,889 0,0000
W Shapiro-Wilk - DEF. ADMINISTRACION 0,904 0,0000
W Shapiro-Wilk - DEF. CONTADURIA 0,839 0,0000
H de Royston 82,078 0,0000

En este caso, se puede rechazar la hipótesis de que los datos proceden de una
distribución normal multivariante a un nivel de significación menor del 5%, lo
que indica que los datos no se encuentran normalmente distribuidos.

 b) Considerando los resultados del inciso a), realice una prueba de


comparación de medias y variabilidad.

Resumen Estadístico
Recuento Promedio Desviación Estándar
DEF. ECONOMIA 100 3,085 0,704154
DEF. ADMINISTRACION 100 2,738 1,18814
DEF. CONTADURIA 100 3,296 1,15504
Total 300 3,03967 1,06133

Coeficiente de Variación Mínimo Máximo Rango


DEF. ECONOMIA 22,8251% 0,6 4,5 3,9
DEF. ADMINISTRACION 43,3944% 0,2 4,8 4,6
DEF. CONTADURIA 35,0438% 0,2 4,8 4,6
Total 34,9159% 0,2 4,8 4,6

Sesgo Estandarizado Curtosis Estandarizada


DEF. ECONOMIA -5,14955 5,46745
DEF. ADMINISTRACION -3,17445 -0,905341
DEF. CONTADURIA -5,35076 1,67627
Total -7,65713 2,09989

 c) ¿Cuál sería el análisis y las conclusiones que le entregaría al


rector?

Teniendo en cuenta los valores de la media y coeficiente de variación se puede


establecer que:
 El programa de economía se encuentra por encima de la media de los
programas en general al igual que el programa de contaduría. En
cambio, el programa de administración se encuentra por debajo de la
media.
 El programa de administración presenta una mayor variación lo que
indica un menor rendimiento de este programa en comparación de los
programas de Economía y Contaduría.
Es así, como se concluye que de los tres programas estudiado de la
facultad de ciencias Económicas el de menor rendimiento es el de
administración.

También podría gustarte