Deba u3 Ea Abvd Solu

Descargar como xlsx, pdf o txt
Descargar como xlsx, pdf o txt
Está en la página 1de 80

Universidad Abierta y a Distancia

de México
División de Ciencias Exactas, Ingeniería y
Tecnología
Desarrollo de software

Primer semestre
Estadística básica
Unidad 3. Muestreo, medidas de
tendencia central y de dispersión
Evidencia de aprendizaje
Conclusiones

Nombre del estudiante:


Matrícula:
Grupo:
Figura académica:
Fecha de entrega:

Ciudad de México, agosto del 2024


Diseño: DL-CPL
semestre
ca básica
edidas de
ispersión
rendizaje
clusiones

Diseño: DL-CPL
ÍNDICE

INTRODUCCIÓN.........................................................................3
DESARROLLO DE ACTIVIDAD.................................................4
CONCLUSIÓN.............................................................................7
REFERENCIAS BIBLIOGRÁFICAS...........................................8
INTRODUCCIÓN
0
Datos no agrupados

Características de la tabla de distribución de frecuencias:


1. La variable cualitativa es categórica y no depende de un número específico de datos.
2. La tabla de frecuencias solo contiene frecuencia absoluta, relativa y distribución de porcentaje.
3. En el dato de la variable se nombra en cada celda la variable cualitativa del estudio (categórica).
4. Para determinar la frecuencia absoluta, se pueden utilizar dos tipos de funciones:
a) CONTAR.SI se utiliza cuando son datos cualitativos y la referencia de datos no repetidos.
b) SUMAR.SI se utiliza cuando son datos cualitativos específicos dentro de un rango de valores.
Dónde:
Rango: Es la selección de toda la columna de las variables cualitativas, ejem: "sandía", "piña", "uva", "fresa",
Criterio: Es únicamente la selección de la variable cualitativa que deseas sumar, ejem: "usb", "blusa azul", etc
Rango_Suma: Es la selección de todos los valores correspondientes de las variables cualitativas.
5. Verifica que la suma de las frecuencias absolutas sea igual al número de datos (N).
6. La frecuencia relativa se obtiene a través de la división de la fórmula: frecuencia absoluta entre la sumatoria tot
de la frecuencia absoluta.
7. El resultado de la suma de las frecuencias relativas debe ser 1. No redondear los datos.
8. La distribución de porcentaje se obtiene multiplicando la frecuencia relativa por cien.
9. El resultado de la suma de la distribución de porcentajes debe ser 100. No redondear los datos.

Características de la tabla de distribución de frecuencias:


1. La variable cuantitativa es numérica y se utiliza cuando corresponde a 30 o menos datos.
2. La tabla de frecuencias contiene frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa,
frecuencia relativa acumulada, distribución de porcentaje y distribución de porcentaje acumulados.
3. En el dato de la variable se nombra en cada celda la variable cuantitativa del estudio (numérica)
4. Para determinar la frecuencia absoluta, se pueden utilizar la siguiente función:
a) =Frecuencia (datos, grupos)
Dónde:
Datos: Son todos los valores obtenidos de la variable, ejem de calificaciones: 5,5,6,6,6,7,8,8,8,9, etc.
Grupos: Son todos los valores posibles de la variable sin repetición, ejem de calificaciones: 5,6,7,8,9,10
Nota: Una vez cerrado el paréntesis, se teclea al mismo tiempo: shift+control+enter
5. Verificar que la suma de las frecuencias absolutas sea igual al número de datos (N).
6. La frecuencia relativa se obtiene a través de la fórmula: frecuencia absoluta entre la sumatoria total de
la frecuencia absoluta.
7. El resultado de la suma de las frecuencias relativas debe ser 1. No redondear los datos.
8. La distribución de porcentaje se obtiene multiplicando la frecuencia relativa por cien.
9. El resultado de la suma de la distribución de porcentajes debe ser 100. No redondear los datos.

Datos agrupados

Características de la tabla de distribución de frecuencias:


1. La variable cuantitativa es numérica mayor de 30 datos.
2. La tabla de distribución de frecuencias contiene clase de intervalo, límite inferior, límite superior, marca de clase,
frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa, frecuencia relativa acumulada,

distribución de porcentajes, distribución de porcentajes acumulados.

3. En la clase de intervalo (k) se coloca el número de filas del resultado del intervalo, el cual siempre tiene
que ser impar.

4. El primer intervalo inicia con el límite inferior menos 1 y se suma el valor de la amplitud (redondeado) para obtene
intervalo.

5. La marca de clase se obtiene al sumar el (límite inferior y el límite superior del intervalo) y dividir entre 2.
6. Para determinar la frecuencia absoluta se utiliza la siguiente función:
a) =Frecuencia (datos, grupos)
Dónde:
Datos: Son todos los valores obtenidos de la variable, las celdas que comprendan todo el universo de datos a estu
Grupos: Son cada uno de los valores posibles de la variable, las celdas que comprenden el límite superior de inter
Nota: Una vez cerrado el paréntesis, se teclea al mismo tiempo: shift+control+enter
7. Verificar que la suma de las frecuencias absolutas sea igual al número de datos (N).
8. La frecuencia relativa se obtiene a través de la división de la frecuencia absoluta entre la sumatoria total de la
frecuencia absoluta.
9. El resultado de la suma de las frecuencias relativas debe ser 1. No redondear los datos.
10. La distribución de porcentaje se obtiene multiplicando la frecuencia relativa por cien.
11. El resultado de la suma de la distribución de porcentajes debe ser 100. No redondear los datos.
Variable cualitativa

Tabla de distribución de frecuencias

Frecuencia absoluta Frecuencia relativa


Dato de la variable

(fi) (hi)
Función de Excel:
Nombrar la variable =CONTAR.SI
cualitativa en cada celda o Fórmula:
=SUMAR.SI

Total Σfi Sumatoria de hi = 1

Variable cuantitativa
Tabla de distribución de frecuencias

Frecuencia absoluta
Frecuencia absoluta
Dato de la variable acumulada

(fi) (Fi)
fi 1
fi 1 + fi 2
fi 1 + fi 2 + fi 3
Nombrar la variable
Función de Excel: fi 1 + fi 2 + fi 3 + fi 4
cuantitativa en cada
=FRECUENCIA …
celda

Nombrar la variable
Función de Excel:
cuantitativa en cada
=FRECUENCIA
celda



Total Σfi

Variable cuantitativa
IV. Identificación de parámetros
Parámetro Resultado

Es el conjunto de datos como totales.


Número de datos (N)
Nota. No es la suma de los datos.

Ordena en forma ascendente los datos de la variable


Dato menor (Xm) de estudio, identifica el número más pequeño como
dato menor.

Ordena en forma ascendente los datos de la variable


Dato mayor (XM) de estudio, identifica el número más grande como
dato mayor.

VI. Tabla de distribución de frecuencias

Límites

Clase de intervalo (k) Límite inferior Límite superior

(Li) (Ls)
Límite inicial= Xm -1
Ls fila anterior +1
Se coloca el número de Ls fila anterior +1
filas del resultado del Ls fila anterior +1 Fórmula:
intervalo, el cual siempre Li + A
debe ser impar Ls fila anterior +1
Se coloca el número de
filas del resultado del Fórmula:
intervalo, el cual siempre Li + A
debe ser impar
Ls fila anterior +1
Ls fila anterior +1

Donde:
Xm= Dato menor
Li= Límite inferior
Ls= Límite superior
A= Amplitud
Σfi= Suma de fi

fi= Frecuencia absoluta

hi= Frecuencia relativa


a

Distribución de
porcentaje Donde:

(%)
Σ= Sumatoria
fi= Frecuencia absoluta
Fórmula: hi= Frecuencia relativa
%= Distribución de
porcentaje
Sumatoria de %= 100

va

Distribución de
Frecuencia relativa Distribución de
Frecuencia relativa porcentajes
acumulada porcentaje
acumulados

(hi) (Hi) (%) (%)


hi 1
hi 1 + hi 2
hi 1 + hi 2 + hi 3
Fórmula: hi 1 + hi 2 + hi 3 + hi 4 Fórmula: Porcentaje de la fila
hi= fi / Σfi … % = hi *100 más las anteriores

Fórmula: Fórmula: Porcentaje de la fila
hi= fi / Σfi % = hi *100 más las anteriores



Sumatoria de hi = 1 Sumatoria de %= 100

va
V. Cálculo de parámetros
Resultado Parámetro Sustitución de fórmula

e datos como totales. Fórmula:


Rango (R)
uma de los datos. R = XM - Xm

a ascendente los datos de la variable


Fórmula:
ifica el número más pequeño como Intervalo (k)
k = 1 + 3.322 * Log 1

a ascendente los datos de la variable


Fórmula:
tifica el número más grande como Amplitud (A)
A = R / k (intervalo valo

Frecuencia absoluta
Marca de clase Frecuencia absoluta Frecuencia relativa
acumulada

(Mc) (fi) (Fi) (hi)


fi 1
fi 1 + fi 2
fi 1 + fi 2 + fi 3
Fórmula: Función de Excel: fi 1 + fi 2 + fi 3 + fi 4 Fórmula:
(Li + Ls) / 2 =FRECUENCIA hi = fi / Σfi

Fórmula: Función de Excel: Fórmula:
(Li + Ls) / 2 =FRECUENCIA hi = fi / Σfi



Σfi Sumatoria de hi = 1
Donde:

Σ= Sumatoria
fi= Frecuencia absoluta
Fi= Frecuencia absoluta
acumulada

hi= Frecuencia relativa


Hi= Frecuencia relativa
acumulada
Hi= Frecuencia relativa
acumulada
%= Distribución de
porcentajes

Sustitución de fórmula Resultado Redondeo

Es el resultado de la Se redondea al número


R = XM - Xm fórmula. más cercano a la alza.

Si el redondeo a la baja
En esta celda, cualquier anterior nos da un
resultado de intervalo se número par, debemos
k = 1 + 3.322 * Log 10 (N)
redondea a la baja. redondear a la alza en
esta celda.

El resultado debe
Redondea la amplitud
corresponder al rango entre
hacia el número entero
A = R / k (intervalo valor impar) el intervalo como valor
más cercano.
impar.

Distribución de
Frecuencia relativa Distribución de
porcentajes
acumulada porcentaje
acumulados

(Hi) (%)
hi 1
hi 1 + hi 2
hi 1 + hi 2 + hi 3
hi 1 + hi 2 + hi 3 + hi 4 Fórmula: Porcentaje de la fila más
% = hi *100 anteriores

Fórmula: Porcentaje de la fila más
% = hi *100 anteriores



Sumatoria de %= 100
Muestreo

Tamaño de la muestra

Desconocimiento del tamaño de la población


Fórmula Parámetros a utilizar

𝑍^2
n n = tamaño de la muestra

𝑛=𝑍2𝑝𝑞/𝐸2
Z2 = nivel de confianza
p p = variabilidad positiva
q q = variabilidad negativa
E E = porcentaje de error

Conocimiento del tamaño de la población


Fórmula Parámetros a utilizar

𝑛=𝑍2𝑝𝑞𝑁/ 𝑍^2
n n = tamaño de la muestra

(𝑁𝐸2+𝑍2𝑝𝑞)
Z2 = nivel de confianza
p p = variabilidad positiva
q q = variabilidad negativa
N N = tamaño de la población
E E = porcentaje de error

Datos no agrupados

Medidas de tendencia central

Media en una población

𝜇=(∑_(𝑖
Fórmula Parámetros a utilizar en una población

=1)^𝑁▒
µ µ = media en una población para datos no agru

𝑥_𝑖 )/𝑁
xi xi = suma de valores del grupo
Forma N N = elementos en una población
manual

Media en una muestra


𝑥 ̅=(∑_(𝑖
𝑥 ̅ 𝑥 ̅= media en una muestra para datos no agrup
Fórmula Parámetros a utilizar en una muestra

=1)^𝑛▒𝑥
xi xi = suma de valores del grupo

_𝑖 )/𝑛 n n = elementos en una muestra

Función Uso

=PROMEDIO( ) Devuelve el promedio (media aritmética) de los

Devuelve la mediana o el número central de un


=MEDIANA( )
números
Devuelve el valor más frecuente o repetitivo de
Funciones =MODA.UNO( )
rango de datos
de Excel
Devuelve una matriz vertical de los valores más
=MODA.VARIOS( , )
repetitivos de una matriz o rango de datos.
Ingresa una fórmula como una fórmula matricia
manejar varios valores simultáneamente, así co
CTRL+SHIFT+ENTRAR
puede devolver varios valores a la vez. Se sugi
la fórmula MODA.VARIOS.

Datos agrupados

Medidas de tendencia

Media

𝜇=(∑_(𝑖=1)^
Fórmula
µ

𝑁▒ 〖𝑥 _𝑖 𝑓 〗 _𝑖
xi

)/𝑁
fi
N

𝑥 ̅=(∑_(𝑖=1)^
𝑥 ̅

𝑛▒ 〖𝑥 _𝑖
xi

𝑓 〗 _𝑖 )/𝑛
𝑥 ̅=(∑_(𝑖=1)^
𝑛▒ 〖𝑥 _𝑖
𝑓 〗 _𝑖 )/𝑛
fi

𝜇=(∑_(𝑖=1)^
n

𝑛▒ 〖𝑀𝑐〗 _𝑖
µ

𝑓_𝑖)/𝑁
Mci
fi
N

𝑥 ̅=(∑_(𝑖=1)^
𝑥 ̅

𝑛▒ 〖𝑀𝑐〗 _𝑖
Mci

𝑓_𝑖)/𝑛
fi
n

Mediana

𝑀𝑒=𝐿𝑖+(𝑁/
Fórmula

2−𝐹_(𝑖−1))/𝑓𝑖 𝑎_𝑖

Moda
Fórmula

𝑀𝑜=𝐿𝑖+ 〖𝑓𝑖− 𝑓〗 _(𝑖−1)/( 〖 (𝑓𝑖−


𝑓 〗 _(𝑖−1))+ 〖 (𝑓𝑖− 𝑓 〗 _(𝑖+1))) 𝑎_𝑖
tra Tabla de nivel de confianza

e la población Nivel de confianza % Valor crítico, Z


etros a utilizar 99.9 3.27
la muestra 99.08 3.08
nfianza 99.73 3
positiva 99 2.58
negativa 98 2.33
de error 96 2.05
95.45 2
95 1.96
la población 90 1.64
etros a utilizar 80 1.28
la muestra 68.27 1
nfianza 50 0.67
positiva
negativa
la población
de error

encia central

población Varianza en una p

𝜎^2=(∑_(𝑖=1)
𝜎^2 𝜎^2
os a utilizar en una población Fórmula Parám

^𝑛▒ 〖 (𝑥_𝑖−𝑚)
na población para datos no agrupados
alores del grupo xi

〗 ^2 )/𝑁
en una población m
N

muestra Varianza en una m


𝑠^2=(∑_(𝑖=1)
ros a utilizar en una muestra Fórmula Parám
na muestra para datos no agrupados s 2

^𝑛▒ 〖 (𝑥_𝑖−𝑥 ̅)
alores del grupo xi

〗 ^2 )/(𝑛−1)
𝑥 ̅
en una muestra
n

Uso Función

omedio (media aritmética) de los argumentos.


=VAR.S( )
ediana o el número central de un conjunto de

or más frecuente o repetitivo de una matriz o =VARA( )

matriz vertical de los valores más frecuentes o


=VARP( )
na matriz o rango de datos.
mula como una fórmula matricial. Sirve para
valores simultáneamente, así como también
varios valores a la vez. Se sugiere su uso para
DA.VARIOS.

Medidas de tendencia central

Media
Parámetros a utilizar
µ = media en una población para datos agrupados por frecuencias simples
xi = suma de valores de la variable del grupo
fi = suma del número de veces que se repite cada valor en la serie de datos
N = elementos en una población

𝑥 ̅
= media en una muestra para datos agrupados por frecuencias simples
xi = suma de valores de la variable del grupo
fi = suma del número de veces que se repite cada valor en la serie de datos
n = elementos en una muestra

µ = media en una población


Mci = marca de clase
fi = frecuencia
N = elementos en una población

𝑥 ̅
= media en una muestra
Mci = marca de clase

fi = frecuencia
n = elementos en una muestra

Mediana
Parámetros a utilizar
Me Me = mediana
Li Li = límite inferior del renglón en donde debe estar la mediana
N N = número de datos
fi-1 fi-1 = frecuencia acumulada anterior al renglón de la mediana
fi = frecuencia absoluta del renglón de la mediana
𝑎i 𝑎i= tamaño del intervalo
fi

Moda
Parámetros a utilizar
Mo Mo = moda
Li Li = límite inferior del renglón en donde debe estar la moda
fi fi = frecuencia del renglón de la moda

fi-1 fi-1 = frecuencia anterior al renglón de la moda

𝑎i = tamaño del intervalo


fi+1 fi+1 = frecuencia posterior al renglón de la moda
𝑎i
Funciones de excel para el muestreo aleatorio simple

Función Uso
Devuelve un número aleatorio entre los números que
=ALEATORIO.ENTRE()
especifique.

=JERARQUÍA() Devuelve un número aleatorio entre 0 y 1.

Devuelve el rango de un número en una lista de


=JERARQUÍA.EQV + CONTAR.SI()
números sin regresar registros repetidos

Buscará el “valor buscado” en la primera columna del


rango de celdas (“matriz_tabla”) y devolverá el dato
= BUSCARV( )
de la columna que le indiques en
“indicador_columnas”

Redondea un número a una cantidad de decimales


=REDONDEAR( )
especificado

Medidas de dispersión

Varianza en una población

𝜎=
𝜎^2
Parámetros a utilizar en una población Fórmula

√(𝜎^2 )=√((∑_(
= varianza en una población para datos no agrupados
xi = suma de valores del grupo

▒ 〖 (𝑥_𝑖−𝜇) 〗 ^2
m = media
N = tamaño de la población

Varianza en una muestra


𝑠=
Parámetros a utilizar en una muestra Fórmula

√(𝑠^2 )=√((∑_
s = varianza en una muestra para datos no agrupados
2

^𝑁▒ 〖 (𝑥_𝑖−𝑥 ̅
xi = suma de valores del grupo

𝑥 ̅ = media

n = tamaño de la muestra
)/(𝑛−1))

Uso Función

Calcula la varianza de una muestra. =DESVEST.M( )

Calcula la varianza de una muestra, incluidos números, texto y


=DESVEST.P( )
valores lógicos.

Calcula la varianza en función de toda la población. =DESVESTA( )

Medidas de dispersión

Varianza

𝜎^2=(∑_(𝑖=1)^𝑛▒
𝜎^2= varianza en una población para
Fórmula Parámetros a util

〖𝑓 _𝑖 〖 ( 〖𝑀𝑐〗 _𝑖−𝜇) 〗 𝜇= media


Mci = marca de clase

^2 〗 )/𝑁
fi = frecuencia
N = número de datos

Fórmula Parámetros a ut
𝑠^2=(∑_(𝑖=1)^𝑛▒ 〖𝑓 _𝑖
s2 = varianza en una muestra para da

〖 ( 〖𝑀𝑐〗 _𝑖−𝑥 ̅) 〗 ^2 〗 )/𝑛


𝑥 ̅= media
Mci = marca de clase

fi = frecuencia
n = número de datos

Desviación estándar

𝜎 = desviación estándar en una pobla


Fórmula Parámetros a util

𝜎=
𝜎^2

√(𝜎^2 )=√((∑_(𝑖=1)^𝑛▒
= varianza

〖𝑓 _𝑖 〖 ( 〖𝑀𝑐〗 _𝑖−𝜇) 〗 ^2
𝜇= media
Mci = marca de clase

〗 )/𝑁)
fi = frecuencia
N = número de datos

𝑠=
Fórmula Parámetros a ut
s = desviación estándar en una mues

√(𝑠^2 )=√((∑_(𝑖=1)^𝑛▒ 〖𝑓
s2 = varianza

_𝑖 〖 ( 〖𝑀𝑐〗 _𝑖−𝑥 ̅) 〗 ^2
Mci = marca de clase
𝑥 ̅ = media

〗 )/(𝑛−1))
fi = frecuencia
n = número de datos
e

rio entre los números que


que.

aleatorio entre 0 y 1.

número en una lista de


registros repetidos

en la primera columna del


abla”) y devolverá el dato
e le indiques en
olumnas”

a cantidad de decimales
cado

Medidas de dispersión

Desviación estándar en una población

𝜎=
𝜎
Fórmula Parámetros a utilizar en una población

√(𝜎^2 )=√((∑_(𝑖=1)^𝑁
𝜎 = desviación estándar en una población para datos no agru
𝜎2 𝜎2 = varianza en una población para datos no agrupados

▒ 〖 (𝑥_𝑖−𝜇) 〗 ^2 )/𝑁)
xi xi = suma de valores del grupo
𝜇 𝜇 = media
N N = elementos en una población
Desviación estándar en una muestra
𝑠=
Fórmula Parámetros a utilizar en una muestra

√(𝑠^2 )=√((∑_(𝑖=1)
s s = desviación estándar en una muestra para datos no agrup

^𝑁▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2
s2 s2 = varianza en una muestra para datos no agrupados
xi xi = suma de valores del grupo

)/(𝑛−1))
𝜇 𝜇 = media
n n = elementos en una muestra

Función Uso

=DESVEST.M( ) Calcula la desviación estándar a partir de una muestra.

Calcula la desviación estándar de toda la población


=DESVEST.P( )
proporcionada como argumento.

=DESVESTA( ) Calcula la desviación estándar de una muestra.

dispersión

nza
Parámetros a utilizar en una población
= varianza en una población para datos agrupados
ci = marca de clase
= media
= frecuencia
= número de datos

Parámetros a utilizar en una muestra


= varianza en una muestra para datos agrupados
ci = marca de clase
= media
= frecuencia
= número de datos

estándar
Parámetros a utilizar en una población
= desviación estándar en una población para datos agrupados
= varianza

ci = marca de clase
= media
= frecuencia
= número de datos

Parámetros a utilizar en una muestra


= desviación estándar en una muestra para datos agrupados
= varianza
ci = marca de clase
= media
= frecuencia
= número de datos
ción
os a utilizar en una población
una población para datos no agrupados
ión para datos no agrupados
po

ción
tra
ros a utilizar en una muestra
una muestra para datos no agrupados
a para datos no agrupados
po

tra

una muestra.

población

uestra.
I. Indicaciones de la actividad:
1. Lee detenidamente el problema que a continuación se presenta (II) y la base de datos (III) para realizar el ejercic
2. Visualiza las fórmulas y/o funciones de Excel en la hoja de cálculo "formulario" para datos no agrupados.
3. Calcula el tamaño de la muestra (IV), considerando los valores señalados en los tres casos y desarrolla las oper
resultados correspondientes.

4. Identifica la muestra sin repetición para el caso 1 mediante las funciones ALEATORIO, BUSCARV y JERARQUI

A partir de este momento los calculos los realizaras con datos de la muestra calculada (V)
5. Calcula las medidas de tendencia central (media, mediana y moda) con las funciones de Excel (VI).
6. Calcula las medidas de dispersión (varianza y desviación estándar) con las funciones de Excel (VII).
7. Describe
a.¿Cual fueel el
comportamiento general
comportamiento de losde
del tamaño resultados respondiendo
la muestra (VIII): a las variaciones de nivel de confianz
(IV) con respecto
de error?
b. ¿Cuál es el comportamiento de la distribución de datos (VI) para las tres variables (Edad, años de experiencia
de respuesta de ChatGPT)?
8. Ilustra mediante una gráfica de barras la variable "Nivel de impacto de ChatGPT en la enseñanza" (V) e incluye
gráfica
títulos en ejes, unidad de medida y fuente de referencia (IX).
9. Interpreta los datos respondiendo las preguntas de forma argumentada (X)
a. ¿La percepción generalizada en los docentes encuestados fue que el nivel de impacto de chatGPT en la ense
b. ¿Qué comportamiento observas entre el nivel de impacto de chatGPT en relación con la precisión de respuest
de esta herramienta a consultas de docentes?
c. ¿Se puede considerar que la edad y experiencia del docente son variables que influyen en su percepción
del impacto de chatGPT en la enseñanza?

II. Descripción del problema

El uso de la inteligencia artificial (IA) ha creado una revolución no solo para consulta de información sino también p
extracción de datos, modelados e incluso generación de código. El campo de la educación no ha sido ajeno a esta
en ese sentido investigadores de la Universidad Macquarie (Australia), realizaron un estudio cuyo propósito es b
docentes, gobierno y sociedad en general, una comprensión del impacto potencial de herramientas como ChatG
educación. Para dicho estudio se aplicó una encuesta en linea a 184 docentes respecto a su percepción sobre Ch
influencia en la enseñanza y evaluación. Bower, M. (Owner), Torrington, J. (Contributor), Lai, J. (Contributor), P
(Contributor), Alfano, M. (Contributor) (15 Sept 2023). Public data files containing the data used for the ChatGPT su
and the survey containing variable selection codes (DOCX). Macquarie University. 10.25949/24123306.v

III. Base de datos


Años de
Precisión de respuesta de
ID Edad experiencia
ChatGPT para consultas (%)
docente
1 32 6 62
2 37 12 50
3 52 12 75
4 67 30 25
5 47 19 90
6 42 20 80
7 52 28 90
8 27 6 100
9 57 30 53
10 42 6 67
11 52 15 90
12 62 8 70
13 47 10 100
14 27 7 87
15 57 17 90
16 37 16 80
17 37 12 90
18 72 37 70
19 32 6 70
20 37 6 72
21 42 1 80
22 32 8 60
23 27 4 80
24 37 5 90
25 32 4 70
26 42 15 60
27 32 5 80
28 32 6 90
29 27 3 70
30 27 4 85
31 32 7 80
32 27 3 100
33 37 9 87
34 37 8 95
35 37 8 92
36 37 12 85
37 57 15 60
38 32 6 95
39 37 8 91
40 37 7 93
41 42 20 80
42 57 23 95
43 42 18 40
44 62 35 57
45 32 9 40
46 47 30 60
47 42 22 60
48 47 15 60
49 52 11 40
50 27 4 65
51 47 20 80
52 57 10 90
53 37 13 90
54 62 20 75
55 52 22 85
56 57 10 70
57 32 2 90
58 62 7 85
59 52 19 80
60 42 17 75
61 57 18 70
62 52 25 75
63 47 21 55
64 57 30 60
65 52 31 80
66 42 13 80
67 27 7 95
68 42 14 100
69 52 20 75
70 62 18 65
71 37 13 80
72 62 20 89
73 42 20 75
74 47 22 70
75 57 25 80
76 62 25 85
77 57 34 55
78 52 22 90
79 52 25 90
80 62 40 90
81 62 42 80
82 52 10 75
83 47 23 62
84 42 20 75
85 42 8 75
86 47 14 90
87 52 13 30
88 37 15 70
89 27 5 30
90 47 27 40
91 57 25 60
92 32 8 100
93 47 20 90
94 47 16 80
95 52 20 55
96 57 33 90
97 27 5 75
98 37 16 30
99 32 5 75
100 47 17 75
101 47 20 45
102 42 18 80
103 37 15 80
104 57 10 40
105 52 25 92
106 57 30 55
107 72 20 60
108 37 10 85
109 47 16 90
110 52 12 100
111 37 16 75
112 52 18 90
113 42 15 75
114 32 5 90
115 47 5 85
116 37 7 60
117 32 5 30
118 37 9 70
119 47 23 75
120 57 27 42
121 37 5 62
122 47 15 75
123 42 7 80
124 57 33 50
125 37 9 45
126 42 14 95
127 47 14 95
128 37 5 80
129 42 7 87
130 47 20 85
131 57 8 70
132 62 15 92
133 42 16 67
134 57 7 75
135 52 20 50
136 52 25 70
137 57 38 65
138 57 29 80
139 47 23 75
140 47 15 68
141 37 10 60
142 57 33 70
143 37 10 80
144 32 6 80
145 52 30 70
146 62 23 85
147 67 40 66
148 42 11 60
149 52 30 95
150 37 6 90
151 32 9 75
152 57 34 40
153 57 32 80
154 57 35 71
155 37 14 70
156 47 5 70
157 27 5 65
158 67 41 60
159 62 40 80
160 42 15 40
161 42 8 100
162 62 20 90
163 52 22 82
164 42 20 75
165 52 17 80
166 42 15 70
167 37 15 55
168 52 4 65
169 42 15 80
170 47 20 60
171 57 31 90
172 47 24 70
173 62 36 45
174 52 20 75
175 52 25 90
176 52 26 80
177 57 40 80
178 57 33 62
179 52 10 60
180 42 12 70
181 57 20 75
182 47 23 70
183 57 26 80
184 52 24 70
IV. Procedimiento para calcular el tamaño
nta (II) y la base de datos (III) para realizar el ejercicio.
álculo "formulario" para datos no agrupados. Caso 1
es señalados en los tres casos y desarrolla las operaciones y

as funciones ALEATORIO, BUSCARV y JERARQUIA.EQV (V).


Tamaño de la
s de la muestra calculada (V) muestra

moda) con las funciones de Excel (VI).


tándar) con las funciones de Excel (VII).
)ndiendo (VIII): a las variaciones de nivel de confianza y margen
con respecto

) para las tres variables (Edad, años de experiencia y precisión

mpacto de ChatGPT en la enseñanza" (V) e incluye título de la


Caso 2

gumentada (X)
s fue que el nivel de impacto de chatGPT en la enseñanza es menor?
Tamaño de la
de chatGPT en relación con la precisión de respuestas
muestra

nte son variables que influyen en su percepción

Caso 3
no solo para consulta de información sino también para análisis,
. El campo de la educación no ha sido ajeno a esta herramienta y
Australia), realizaron un estudio cuyo propósito es brindar a los
n del impacto potencial de herramientas como ChatGPT en la
a a 184 docentes respecto a su percepción sobre ChatGPT y su Tamaño de la
r), Torrington, J. (Contributor), Lai, J. (Contributor), Petocz, P. muestra
ata files containing the data used for the ChatGPT survey (XLSX)
DOCX). Macquarie University. 10.25949/24123306.v1

V. Muestra

Nivel de impacto de ChatGPT en la enseñanza ID


Aleatorio
No tiene impacto 0.7343248235 51
Importante 0.2949669972 133
Profundo 0.0630128759 175
Menor 0.8292160727 34
No tiene impacto 0.9270928589 17
Profundo 0.6799766759 61
Profundo 0.648508267 64
No tiene impacto 0.3309644936 118
Menor 0.0245391191 182
Menor 0.6124151521 73
Profundo 0.9432965916 14
Importante 0.4159100381 103
Menor 0.918544352 19
Menor 0.2635005035 140
Profundo 0.8850527468 26
Profundo 0.1945057222 148
Importante 0.5670005606 84
Menor 0.8843225873 27
Importante 0.2912189026 134
Menor 0.0636728124 173
Importante 0.8956298141 25
Menor 0.416495014 102
Importante 0.033129752 180
Menor 0.2700075188 137
Menor 0.9347236916 16
Profundo 0.1529324755 157
Importante 0.2691804738 138
Importante 0.8982228406 24
No tiene impacto 0.6311422255 67
Menor 0.1903129981 149
Menor 0.3226368153 124
Profundo 0.9034462663 23
Importante 0.6703891853 62
Importante 0.7613062814 42
Importante 0.6104169559 75
Importante 0.0278833818 181
Importante 0.4046008076 108
Importante 0.3202981862 125
Menor 0.9655458526 6
Profundo 0.1857169537 150
Importante 0.0660379404 172
No tiene impacto 0.0898972447 169
Menor 0.7443854826 48
Menor 0.3029715614 128
Menor 0.5720128651 80
Menor 0.2192035083 144
Menor 0.4551431931 96
Importante 0.16324794 154
Menor 0.688971117 59
Menor 0.3692404204 113
Profundo 0.2101122995 146
Importante 0.837466513 31
No tiene impacto 0.758676376 43
Importante 0.140328974 160
Importante 0.2990682844 130
Importante 0.9551882232 12
Importante 0.2982330721 131
Profundo 0.3542981451 116
Importante 0.5242415036 90
Profundo 0.7879157308 40
Importante 0.9645778143 7
Importante 0.630996619 68
Importante 0.6317439933 66
Menor 0.716506169 54
Menor 0.4301908151 101
Importante 0.3729700467 112
Importante 0.1406688027 159
Profundo 0.062234198 176
Profundo 0.2443385906 142
Importante 0.5682410351 82
Importante 0.1332506164 163
Menor 0.1385745782 161
Importante 0.4152883131 104
Importante 0.6905708467 57
Importante 0.2958723068 132
Importante 0.500829794 92
Importante 0.5461362198 87
Menor 0.9165491153 20
Importante 0.405280782 106
No tiene impacto 0.0632274557 174
Importante 0.6892219988 58
Profundo 0.6247605203 70
Menor 0.0467071636 179
Importante 0.9525080154 13
Importante 0.109730779 167
Menor 0.3808969455 110
Importante 0.7507870932 45
Menor 0.2546960987 141
Menor 0.3235461882 122
No tiene impacto 0.8787691769 28
Menor 0.4601865806 95
Importante 0.5719278654 81
Importante 0.9065738155 22
Importante 0.1580148256 156
Importante 0.3000168751 129
No tiene impacto 0.3162410019 126
Menor 0.7477676022 46
Menor 0.8330835141 32
Importante 0.5388838068 89
Menor 0.6164089233 72
Menor 0.5917087174 78
Importante 0.6180670691 71
Profundo 0.9661530738 5
Menor 0.5588945125 85
Importante 0.1249287973 164
Menor 0.9801992859 3
Importante 0.2725373776 136
Importante 0.5067665642 91
No tiene impacto 0.6841994591 60
Importante 0.1630183289 155
Profundo 0.6459144624 65
Menor 0.1493995803 158
Profundo 0.3150653058 127
Menor 0.3253112262 119
Menor 0.359984864 114
Menor 0.483395816 93
Menor 0.1105565429 166
Importante 0.0471873095 178
Importante 0.745175254 47
Importante 0.0574584484 177
No tiene impacto 0.7402547928 50
No tiene impacto 0.7141198105 55
No tiene impacto 0.0948190828 168
Importante 0.7008739061 56
Menor 0.1663214486
Importante 0.2663700869
Importante 0.3413330723
Importante 0.7582326596
Menor 0.9164851316
Importante 0.5964415366
Menor 0.9579288408
Menor 0.1767442649
Menor 0.6517590574
Menor 0.8286450492
Menor 0.8271094111
Profundo 0.8465798568
Importante 0.9589358121
Importante 0.2210209912
Importante 0.0152434586
Importante 0.9612465223
Importante 0.935166474
Menor 0.6092210036
Menor 0.0003758243
Profundo 0.9940796506
Menor 0.6118675327
Menor 0.7204751195
No tiene impacto 0.9201217915
Importante 0.3813595398
Importante 0.838785162
Menor 0.9769816288
Importante 0.2129933321
No tiene impacto 0.5406253308
Importante 0.3250200106
Profundo 0.630846301
Menor 0.728443323
Importante 0.4063384587
Profundo 0.0861929703
Profundo 0.9980063547
Profundo 0.1700744894
Menor 0.8240060671
Menor 0.7715120561
Menor 0.3569376086
Importante 0.3252111949
Profundo 0.4327404981
Menor 0.0811817301
Profundo 0.8306064799
Menor 0.1222430919
Menor 0.452279162
Profundo 0.582724142
Menor 0.567944935
Importante 0.9612067927
Menor 0.4481639329
Menor 0.3231674293
Importante 0.3786679629
Importante 0.2064902887
Menor 0.2755304688
Importante 0.7965128826
Importante 0.5520355018
Importante 0.4714890049
Menor 0.8161319183
Profundo 0.4050960885
Importante 0.442242644
Profundo 0.1339139615
Menor 0.7404251762
0.4571548319
Procedimiento para calcular el tamaño de la muestra

o1
Fórmula

𝑛=𝑍2𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞)
Parámetros

z= 1.96
p= 50 %
q= 50 %
E= 5 %
N= 184

o2
Fórmula
Parámetros

𝑛=𝑍2𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞)
z= 1.28
p= 50 %
q= 50 %
E= 3 %
N= 184

o3
Fórmula
Parámetros

𝑛=𝑍2𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞)
z= 3.27
p= 50 %
q= 50 %
E= 7 %
N= 184

Muestra

Edad Años de experiencia docente

47 20
42 16
52 25
37 8
37 12
57 18
57 30
37 9
47 23
42 20
27 7
37 15
32 6
47 15
42 15
42 11
42 20
32 5
57 7
62 36
32 4
42 18
42 12
57 38
37 16
27 5
57 29
37 5
27 7
52 30
57 33
27 4
52 25
57 23
57 25
57 20
37 10
37 9
42 20
37 6
47 24
42 15
47 15
37 5
62 40
32 6
57 33
57 35
52 19
42 15
62 23
32 7
42 18
42 15
47 20
62 8
57 8
37 7
47 27
37 7
52 28
42 14
42 13
62 20
47 20
52 18
62 40
52 26
57 33
52 10
52 22
42 8
57 10
32 2
62 15
32 8
52 13
37 6
57 30
52 20
62 7
62 18
52 10
47 10
37 15
52 12
32 9
37 10
47 15
32 6
52 20
62 42
32 8
47 5
42 7
42 14
47 30
27 3
27 5
62 20
52 22
37 13
47 19
42 8
42 20
52 12
52 25
57 25
42 17
37 14
52 31
67 41
47 14
47 23
32 5
47 20
42 15
57 33
42 22
57 40
27 4
52 22
52 4
57 10
Fórmula Operación

𝑍2𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞)

𝑛=1.962 (0.5*0.5*184)/(184*0.052+1.962
*0.5*0.5)

Fórmula Operación

𝑍2𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞) 𝑛=1.282 (0.5*0.5*184)/(184*0.032+1.282


*0.5*0.5)

Fórmula Operación

2
𝑝𝑞𝑁/(𝑁𝐸2+𝑍2𝑝𝑞) 𝑛=3.272 (0.5*0.5*184)/(184*0.072+3.272
*0.5*0.5)

Precisión de respuesta de ChatGPT para


Nivel de impacto de ChatGPT en la enseñanza
consultas (%)

80 Profundo
67 Menor
90 Importante
95 Importante
90 Importante
70 Importante
60 Menor
70 Importante
70 Importante
75 Importante
87 Menor
80 Profundo
70 Importante
68 Importante
60 Profundo
60 Importante
75 Importante
80 Importante
75 Menor
45 Menor
70 Menor
80 Importante
70 Menor
65 Importante
80 Profundo
65 Profundo
80 Importante
90 Menor
95 Importante
95 Importante
50 Importante
80 Importante
75 Importante
95 No tiene impacto
80 Importante
75 Profundo
85 Importante
45 Menor
80 Profundo
90 Menor
70 Menor
80 Profundo
60 Importante
80 Importante
90 No tiene impacto
80 Profundo
90 No tiene impacto
71 Profundo
80 Importante
75 Profundo
85 Menor
80 Menor
40 Menor
40 Menor
85 Importante
70 Importante
70 Menor
60 Menor
40 No tiene impacto
93 Profundo
90 Profundo
100 Profundo
80 Importante
75 Importante
45 Menor
90 Menor
80 Profundo
80 Menor
70 Menor
75 Profundo
82 Importante
100 Menor
40 Menor
90 Importante
92 Menor
100 Importante
30 Importante
72 Menor
55 Menor
75 Importante
85 Profundo
65 Importante
60 Importante
100 Menor
55 Menor
100 Importante
40 Menor
60 Importante
75 No tiene impacto
90 Importante
55 Importante
80 Importante
60 Menor
70 Importante
87 Menor
95 Importante
60 Menor
100 Profundo
30 Menor
89 Menor
90 Menor
80 Importante
90 No tiene impacto
75 Importante
75 Profundo
75 Profundo
70 Profundo
60 Menor
75 Profundo
70 Menor
80 Menor
60 Profundo
95 Importante
75 Importante
90 Menor
90 Importante
70 Profundo
62 Importante
60 Menor
80 Importante
65 Menor
85 Importante
65 Menor
70 Importante
VI. Medidas de tendencia central
Edad
MTC
ración Resultado Media

Mediana

184*0.05 +1.96
2 2
124.41 Moda

Años de experiencia
MTC
Media
Mediana
Moda
ración Resultado

184*0.032+1.282
Precisión de respuesta de ChatGPT
consultas (%)
131.026425591099
MTC
Media
Mediana
Moda

ración Resultado
VIII. Descripción del comportamien

(184*0.072+3.272
a.¿Cual fue el comportamiento d
variaciones de nive
137.593700390928
* Mayor nivel de confianza (z) aum
confianza requiere más datos para
preciso.
*Mayor margen de error (E)
mayor margen de error, puedes trab
permitiendo más

b. ¿Cuál es el comportamiento de l
(Edad, años de experienci

1. Edad
*La media y la mediana son bastante c
distribución de las edades está relativa
simétrica..La moda (32) es bastante m
indicar que hay un grupo considerable
(9.54) indica una dispersión moderada
razonablemente distribuidas alrededor
2. Años de experiencia
La media (13) es mayor que la median
1. Edad
*La media y la mediana son bastante c
distribución de las edades está relativa
simétrica..La moda (32) es bastante m
indicar que hay un grupo considerable
(9.54) indica una dispersión moderada
razonablemente distribuidas alrededor
2. Años de experiencia
La media (13) es mayor que la median
(sesgo a la derecha). Hay algunos valo
(6) es menor que tanto la media como
de las personas tiene menos años de
desviación estándar (8.08) muestra un
años de experiencia varían de manera
3. Precisión de respuesta de ChatGP
La media, mediana y moda están muy
que la distribución de precisión está ce
desviación estándar es relativamente a
considerable en los datos de precisión
mucho en torno a la media.
idas de tendencia central VII. Medidas de dispersión IX. Gráfica de barras
Edad Edad
Ni
Resultado MD Resultado
Varianza 80
46.11 103.271702072
70
Desviación
10.1622685495
47.00 estándar 60

42.00 50

Frecuencia
40
Años de experiencia Años de experiencia
Resultado MD Resultado 30
16.81 Varianza 96.5262916339
20
15.00 Desviación 15
9.82477946999
20.00 estándar
10

0
n de respuesta de ChatGPT para Precisión de respuesta de No tiene impa
consultas (%) ChatGPT para consultas (%)
Resultado MD Resultado
74.48 Varianza 244.056320483
Percepc
75.00 Desviación Bower, M. (Owner), To
15.6223020225
80.00 estándar

scripción del comportamiento general de datos X. Interpretación de datos


Cual fue el comportamiento del tamaño de la muestra (IV) con respecto a las a. ¿La percepción generaliz
variaciones de nivel de confianza y margen de error?

or nivel de confianza (z) aumenta el tamaño de la muestra: Un mayor nivel de


nza requiere más datos para garantizar que el intervalo de confianza sea más Con bas
La categoría más frecuente es
*Mayor margen de error (E) disminuye el tamaño de la muestra: Si aceptas un impacto de ChatGPT en la e
margen de error, puedes trabajar con una muestra más pequeña, ya que estás
permitiendo más imprecisión en los resultados.

uál es el comportamiento de la distribución de datos (VI) para las tres variables b) ¿Qué comportamiento ob
(Edad, años de experiencia y precisión de respuesta de ChatGPT?

d A medida que la precisión d


edia y la mediana son bastante cercanas (43.33 y 42.00), lo que sugiere que la precisión más bajos tienden a
ución de las edades está relativamente bien equilibrada, pero no perfectamente altas tienden a estar relacion
ca..La moda (32) es bastante menor que la media y la mediana, lo que podría precisión de respuestas de C
que hay un grupo considerable de personas de 32 años.La desviación estándar mayor impacto en la enseña
indica una dispersión moderada, lo que significa que las edades están algunos do
blemente distribuidas alrededor de la media.
s de experiencia
dia (13) es mayor que la mediana (10), lo que sugiere una asimetría positiva
d A medida que la precisión d
edia y la mediana son bastante cercanas (43.33 y 42.00), lo que sugiere que la precisión más bajos tienden a
ución de las edades está relativamente bien equilibrada, pero no perfectamente altas tienden a estar relacion
ca..La moda (32) es bastante menor que la media y la mediana, lo que podría precisión de respuestas de C
que hay un grupo considerable de personas de 32 años.La desviación estándar mayor impacto en la enseña
indica una dispersión moderada, lo que significa que las edades están algunos do
blemente distribuidas alrededor de la media.
s de experiencia
dia (13) es mayor que la mediana (10), lo que sugiere una asimetría positiva
a la derecha). Hay algunos valores altos que están elevando la media.La moda
menor que tanto la media como la mediana, lo que implica que la mayor parte c) ¿Se puede considerar que
personas tiene menos años de experiencia que lo que refleja la media.La
ción estándar (8.08) muestra una dispersión moderada, lo que indica que los *Consideración sobre la ed
e experiencia varían de manera considerable entre los individuos.
cisión de respuesta de ChatGPT para consultas (%)
percepción del impacto de Cha
dia, mediana y moda están muy cercanas (74%, 75%, y 75%), lo que sugiere jóvenes o mayores.
distribución de precisión está centrada y bastante simétrica.Sin embargo, la *Consideración sobre la experi
ción estándar es relativamente alta (16.71), lo que indica que hay una dispersión docente y la percepción del i
erable en los datos de precisión, es decir, las precisiones individuales varían
en torno a la media.
áfica de barras

Nivel de impacto de ChatGPT en la enseñanza

80
75

70
65

60

50
Frecuencia

40

30 29

20
15

10

0
No tiene impacto Menor Importante Profundo
Nivel de Impacto

Percepción sobre ChatGPT y su influencia en la enseñanza y evaluación.


Bower, M. (Owner), Torrington, J. (Contributor), Lai, J. (Contributor), Petocz, P. (Contributor), Alfano, M.
(Contributor) (15 Sept 2023).

erpretación de datos
¿La percepción generalizada en los docentes encuestados fue que el nivel de impacto de chatGPT en la enseñanza es
menor?

Con base en los datos proporcionados, estas son las frecuencias que he contado:
ategoría más frecuente es Importante (75 docentes), seguida por Menor (65 docentes). Podemos conlcuir que el nivel de
pacto de ChatGPT en la enseñanza no es "Menor". El impacto más mencionado fue "Importante" por la mayoría de los
encuestados.

¿Qué comportamiento observas entre el nivel de impacto de chatGPT en relación a la precisión de respuestas de esta
herramienta a consultas de docentes?

medida que la precisión de ChatGPT aumenta, el nivel de impacto percibido también tiende a aumentar. Los niveles de
sión más bajos tienden a estar asociados con un impacto "Menor" o "No tiene impacto", mientras que las precisiones más
s tienden a estar relacionadas con niveles de impacto "Importante" o "Profundo".Existe una correlación positiva entre la
cisión de respuestas de ChatGPT y el nivel de impacto percibido: a mayor precisión, los docentes tienden a percibir un
yor impacto en la enseñanza. Sin embargo, la precisión no es el único factor que determina el nivel de impacto, ya que
algunos docentes no perciben un impacto significativo, incluso con respuestas precisas.
medida que la precisión de ChatGPT aumenta, el nivel de impacto percibido también tiende a aumentar. Los niveles de
sión más bajos tienden a estar asociados con un impacto "Menor" o "No tiene impacto", mientras que las precisiones más
s tienden a estar relacionadas con niveles de impacto "Importante" o "Profundo".Existe una correlación positiva entre la
cisión de respuestas de ChatGPT y el nivel de impacto percibido: a mayor precisión, los docentes tienden a percibir un
yor impacto en la enseñanza. Sin embargo, la precisión no es el único factor que determina el nivel de impacto, ya que
algunos docentes no perciben un impacto significativo, incluso con respuestas precisas.

¿Se puede considerar que la edad y experiencia del docente son variables que influyen en su percepción del impacto de
chatGPT en la enseñanza?
onsideración sobre la edad: No se observa una tendencia clara que relacione directamente la edad del docente con la
pción del impacto de ChatGPT. La percepción del impacto parece variar independientemente de si los docentes son más
venes o mayores.
sideración sobre la experiencia: Al igual que con la edad, no parece haber una relación clara y directa entre la experiencia
ente y la percepción del impacto. Tanto docentes con poca como con mucha experiencia perciben diferentes niveles de
impacto.
Nivel de Impacto

PT en la enseñanza No tiene impacto


Menor

75 Importante

Profundo

29

Importante Profundo
Impacto

a en la enseñanza y evaluación.
Contributor), Petocz, P. (Contributor), Alfano, M.
ept 2023).

fue que el nivel de impacto de chatGPT en la enseñanza es


nor?

stas son las frecuencias que he contado:


da por Menor (65 docentes). Podemos conlcuir que el nivel de
acto más mencionado fue "Importante" por la mayoría de los
tados.

de chatGPT en relación a la precisión de respuestas de esta


ultas de docentes?

impacto percibido también tiende a aumentar. Los niveles de


Menor" o "No tiene impacto", mientras que las precisiones más
portante" o "Profundo".Existe una correlación positiva entre la
rcibido: a mayor precisión, los docentes tienden a percibir un
o es el único factor que determina el nivel de impacto, ya que
gnificativo, incluso con respuestas precisas.
impacto percibido también tiende a aumentar. Los niveles de
Menor" o "No tiene impacto", mientras que las precisiones más
portante" o "Profundo".Existe una correlación positiva entre la
rcibido: a mayor precisión, los docentes tienden a percibir un
o es el único factor que determina el nivel de impacto, ya que
gnificativo, incluso con respuestas precisas.

e son variables que influyen en su percepción del impacto de


a enseñanza?
clara que relacione directamente la edad del docente con la
parece variar independientemente de si los docentes son más

o parece haber una relación clara y directa entre la experiencia


a como con mucha experiencia perciben diferentes niveles de
cto.
Frecuencia
15
65

75

29
I. Indicaciones de la actividad:
1. Lee detenidamente el problema que a continuación se presenta (II) y la base de datos (III) para realizar el ejercic
2. Visualiza las fórmulas y/o funciones de Excel en la hoja de cálculo "formulario" para datos agrupados.
3. Identifica el valor de los parámetros: número de datos, dato menor y dato mayor en la tabla IV.
4. Calcula los parámetros (rango, intervalo y amplitud), incluye la fórmula correspondiente, resultado y redondeo en

5. Calcula la tabla estadística para datos agrupados, respecto a la variable "velocidad promedio de descarga (mbps

6. Calcula las medidas de tendencia central (media, mediana y moda) (VII), coloca la fórmula que le corresponde y
7. Calcula las medidas de dispersión (varianza y desviación estándar) (VIII), coloca la fórmula que le corresponde,
8. Interpreta los resultados obtenidos respondiendo las siguientes preguntas (IX):
a. ¿Por qué es importante la media, mediana y moda en el contexto de la variable de estudio?

b. ¿Qué información proporciona la varianza y desviación estándar en el contexto de la variable de estudio?

9. Argumenta desde tu punto de vista a que atribuirías la diferencia entre los paises de internet con mayor velocida
10. Argumenta tres conclusiones respecto al comportamiento de la variable "Velocidad promedio de descarga (mb

II. Descripción del problema

El internet se ha convertido en una parte fundamental de nuestra vida ya que por medio de él, realizamos distint
trabajo, entre otros aspectos. De tal forma que la disponibilidad de internet y especialmente la velocidad del mism
forma óptima. En ese contexto la empresa Speedtest, con base en las pruebas de velocidad que realizan los usua
importantes de cada país durante mayo de 20
Se requiere analizar la base de datos proporcionada mediante estadistca descripciva con
Kaggle (2024), Internet Download Speed Comparison 2024. https://www.kaggle.com/datasets/chayanonc/internet-d

III. Base de datos

Id Ciudad Pais Continente

1 Ar-Rayyan Qatar Asia


2 Doha Qatar Asia
3 Dubai United Arab Emirates Asia
4 Abu Dhabi United Arab Emirates Asia
5 Copenhagen Denmark Europa
6 Riyadh Saudi Arabia Asia
7 Porto Portugal Europa
8 Oslo Norway Europa
9 Lisbon Portugal Europa
10 Shanghai China Asia
11 Kuwait City Kuwait Asia
12 Beijing China Asia
13 Los Angeles United States América
14 Helsinki Finland Europa
15 Stockholm Sweden Europa
16 Seoul South Korea Asia
17 Gothenburg Sweden Europa
18 Sao Paulo Brazil América
19 New York United States América
20 Antwerp Belgium Europa
21 Jeddah Saudi Arabia Asia
22 Vilnius Lithuania Europa
23 Skopje North Macedonia Europa
24 Zagreb Croatia Europa
25 Paris France Europa
26 Johor Bahru Malaysia Asia
27 Toronto Canada América
28 Sofia Bulgaria Europa
29 Kuala Lumpur Malaysia Asia
30 Riga Latvia Europa
31 Lyon France Europa
32 Montreal Canada América
33 Busan South Korea Asia
34 Prague Czechia Europa
35 Delhi India Asia
36 Rio de Janeiro Brazil América
37 Manama Bahrain Asia
38 Rotterdam Netherlands Europa
39 Zurich Switzerland Europa
40 Melbourne (Greater) Australia Oceania
41 Sydney Australia Oceania
42 Warsaw Poland Europa
43 Thessaloniki Greece Europa
44 Amsterdam Netherlands Europa
45 Vienna Austria Europa
46 Manchester United Kingdom Europa
47 Muscat Oman Asia
48 Montevideo Uruguay América
49 Taipei Taiwan Asia
50 Krakow Poland Europa
51 Dublin Ireland Europa
52 Athens Greece Europa
53 Bucharest Romania Europa
54 Geneva Switzerland Europa
55 Hamburg Germany Europa
56 London United Kingdom Europa
57 Madrid Spain Europa
58 Tel Aviv-Yafo Israel Asia
59 Berlin Germany Europa
60 Barcelona Spain Europa
61 Brussels Belgium Europa
62 Milan Italy Europa
63 New Taipei Taiwan Asia
64 Budapest Hungary Europa
65 Almaty Kazakhstan Asia
66 Auckland New Zealand Oceania
67 Mumbai India Asia
68 Rome Italy Europa
69 Bangkok Thailand Asia
70 Haifa Israel Asia
71 Harare Zimbabwe Africa
72 Belgrade Serbia Europa
73 Guatemala City Guatemala América
74 Johannesburg South Africa Africa
75 Osaka Japan Asia
76 Baku Azerbaijan Asia
77 Rabat Morocco Africa
78 Casablanca Morocco Africa
79 Astana Kazakhstan Asia
80 Santo Domingo Dominican Republic América
81 Manila Philippines Asia
82 Santiago Chile América
83 Cape Town South Africa Africa
84 Ho Chi Minh City Vietnam Asia
85 Buenos Aires Argentina América
86 Chon Buri Thailand Asia
87 Beirut Lebanon Asia
88 Chisinau Moldova Europa
89 Tokyo Japan Asia
90 Addis Ababa Ethiopia Africa
91 Ankara Turkey Asia
92 Bishkek Kyrgyzstan Asia
93 Istanbul Turkey Asia
94 Kampala Uganda Africa
95 Moscow Russia Europa
96 Tbilisi Georgia Asia
97 Lagos Nigeria Africa
98 Nairobi Kenya Africa
99 Hanoi Vietnam Asia
100 Davao City Philippines Asia
101 Guadalajara Mexico América
102 Tashkent Uzbekistan Asia
103 Mandalay Myanmar (Burma) Asia
104 Dar es Salaam Tanzania Africa
105 Yangon Myanmar (Burma) Asia
106 San Pedro Sula Honduras América
107 Colombo Sri Lanka Asia
108 Kharkiv Ukraine Europa
109 Samarkand Uzbekistan Asia
110 Tehran Iran Asia
111 Santiago De Los Caballeros Dominican Republic América
112 Vientiane Laos Asia
113 South Jakarta Indonesia Asia
114 Mosul Iraq Asia
115 Amman Jordan Asia
116 Abidjan Cote d'Ivoire Africa
117 San Jose Costa Rica América
118 Medellin Colombia América
119 Mashhad Iran Asia
120 Chittagong Bangladesh Asia
121 Phnom Penh Cambodia Asia
122 Az-Zarqa Jordan Asia
123 Mexico City Mexico América
124 Saint Petersburg Russia Europa
125 Bekasi Indonesia Asia
126 Baghdad Iraq Asia
127 Dhaka Bangladesh Asia
128 Cordoba Argentina América
129 San Salvador El Salvador América
130 Tunis Tunisia Africa
131 Guayaquil Ecuador América
132 Tegucigalpa Honduras América
133 Yerevan Armenia Asia
134 Lusaka Zambia Africa
135 Algiers Algeria Africa
136 Sfax Tunisia Africa
137 Cairo Egypt Africa
138 Bogota Colombia América
139 Maputo Mozambique Africa
140 Oran Algeria Africa
141 Quito Ecuador América
142 Managua Nicaragua América
143 Minsk Belarus Europa
144 Damascus Syria Asia
145 Lahore Pakistan Asia
146 Alexandria Egypt Africa
147 Lima Peru América
148 Accra Ghana Africa
149 Karachi Pakistan Asia
150 Panama City Panama América
151 Luanda Angola Africa
152 Aleppo Syria Asia
153 Asuncion Paraguay América
154 Tripoli Libya Africa
155 Kiev Ukraine Europa
156 Dushanbe Tajikistan Asia
157 Sana'a Yemen Asia
158 Caracas Venezuela América
159 Arequipa Peru América
160 Misrata Libya Africa
161 Gomel Belarus Europa
162 Ulaanbaatar Mongolia Asia
163 Santa Cruz de la Sierra Bolivia América
164 La Paz Bolivia América
165 Kabul Afghanistan Asia
166 Havana Cuba América
a base de datos (III) para realizar el ejercicio.
mulario" para datos agrupados.
dato mayor en la tabla IV.
a correspondiente, resultado y redondeo en la tabla V.

ble "velocidad promedio de descarga (mbps)", (VI).

VII), coloca la fórmula que le corresponde y resultado.


VIII), coloca la fórmula que le corresponde, operación y resultado.
ntas (IX):
e la variable de estudio?

el contexto de la variable de estudio?

e los paises de internet con mayor velocidad en comparación con los de internet más lento (X).
able "Velocidad promedio de descarga (mbps)" en las distintas regiones (continentes) (X).

a ya que por medio de él, realizamos distintas actividades diarias relacionadas a la comunicación, entretenimiento,
ernet y especialmente la velocidad del mismo es de importancia para que dichas actividades se desarrollen de una
pruebas de velocidad que realizan los usuarios ha promediado la descarga de internet móvil para las ciudades más
portantes de cada país durante mayo de 2024.
onada mediante estadistca descripciva con la finalidad de identiticar tendencias generales.
.kaggle.com/datasets/chayanonc/internet-download-speed-comparison-2024

Velocidad promedio de
descarga (mbps)
460.13
335.37
330.4
325.39
268.65
252.25
231.43
230.46
225.93
225.37
225.3
191.41
186.99
182.11
180.16
176.72
175
170.57
170.48
169.5
165.54
163.59
160.58
154.93
154.54
149.66
138.86
132.8
129.42
129.3
125.22
122.46
122.36
121.63
121.09
120.71
120.22
118.46
114.83
111.47
110.19
107.64
106.06
105.49
102.96
102.5
100.79
100.61
96.75
93.07
93
91.84
91.3
90.46
89.47
89.14
88.59
85.43
85.07
85.06
82.96
82.19
82.1
79.27
77.74
76.26
74.74
71.9
70.89
70.84
66.65
65.05
64.69
63.06
60
59.77
58.51
56.71
55.97
55.56
54.55
54
53.1
53.01
52.84
52.45
51.2
49.15
48.49
48.03
46.39
45.71
45.24
44.62
44.46
44.46
44.1
43.92
43.01
41.61
40.48
39.88
39.58
39.35
39.07
38.49
38.04
37.43
36.78
36.25
36.11
35.81
35.76
34.81
34.79
34.49
34.46
33.62
33.33
33.04
33.02
31.98
31.53
31.28
30.82
30.22
30.2
29.99
29.84
29.46
29.36
29.34
27.96
27.22
27.19
27.01
26.08
25.96
23.93
23.66
23.45
22.83
22.48
21.84
21.41
21.29
20.32
18.93
18.85
18.75
18.48
17.91
16.85
16.82
16.81
15.86
15.77
15.76
14.91
14.19
13.77
13.41
11.78
9.15
7.77
4.12
IV. Identificación de parámetros
Parámetro

Número de datos (N)

Dato menor (Xm)

Dato mayor (XM)

con los de internet más lento (X).


s regiones (continentes) (X).
VI. Tabla estadística

Indicador frecuencia de búsquedas

as relacionadas a la comunicación, entretenimiento, Límite inferior


ia para que dichas actividades se desarrollen de una 4.12
o la descarga de internet móvil para las ciudades más 58.54
ntiticar tendencias generales. 112.96
mparison-2024 167.38
221.8
276.22
330.64
385.06
439.48

VII. Procedimiento para calcular las


MTC

Media
Mediana

Moda

VIII. Procedimiento para calcular las


MD

Varianza

Desviación
estándar
tificación de parámetros V. Cálculo de parámetros
Parámetro Resultado Parámetro Sustitución de fórmul

Número de datos (N) 166 Rango (R) R = 460.13-4.12

Dato menor (Xm) 4.12 Intervalo (k) k = 1 + (3.322 * Log 10 (1

Dato mayor (XM) 460.13 Amplitud (A) A = 456.01 / 8 (intervalo valo

a estadística

dor frecuencia de búsquedas


Xi fi Xi * fi Fi [Xi-]
Límite Superior
58.54 31.33 90 2819.7 90 50.49
112.96 85.75 37 3172.75 127 3.93
167.38 140.17 19 2663.23 146 58.35
221.8 194.59 9 1751.31 155 112.77
276.22 249.01 7 1743.07 162 167.19
330.64 303.43 2 606.86 164 221.61
385.06 357.85 1 357.85 165 276.03
439.48 412.27 0 0 165 330.45
493.9 466.69 1 466.69 166 384.87


166 13581.46 81.8160240964
cedimiento para calcular las medidas de tendencia central
Fórmula Resultado

𝝁=(∑128▒𝑴_(𝑪_𝟏 )
⋅𝑭_𝒊)/𝑵 8
𝑴_𝒆=𝑳_𝒊+(𝑵/𝟐−𝑭_(𝒊−𝟏))/𝒇_𝒊 𝜶

𝑴_𝟎=𝑳_𝒊+((𝒇_𝒊−𝒇_(𝒊−𝟏))/
(𝒇_𝒊−𝒇_(𝒊−𝟏)+𝒇_𝒊−𝒇_𝒊+𝟏)) .α

ocedimiento para calcular las medidas de dispersión


Fórmula Resultado

𝝈^𝟐=(∑128▒ 〖𝒇 _𝒋 (𝑴_𝑪𝒊−𝝁)^𝟐 〗 )/𝑵

𝝈=√(𝝈^𝟐 )=√((𝜮𝒇_𝒊 (𝑴_𝑪𝒊−𝝁)^𝟐)/𝑵)

7
metros IX. Interpretación de las medidas d
Sustitución de fórmula Resultado Redondeo
a. ¿Por qué es importante la media
R = 460.13-4.12 456.01 456.01

La Media permite hacer comparacion


promedio en comparación con la med
= 1 + (3.322 * Log 10 (166)) 8.37519906846906 8.37 mayoría de las ciudades, sin ser influ
velocidad de descarga más común e

456.01 / 8 (intervalo valor impar) 54.4814814814815 54.42


b. ¿Qué información proporciona l

La varianza de 5586.47 y la desviació


las ciudades estudiadas. Esta inform
y puede guiar acciones para mejorar

X. Argumentación de las conclusio


Argumenta desde tu punto de vista
[Xi-]2 [Xi-]2 fi
Los países con mayor velocidad de i
2548.84 229395.48 desarrolladas, 5G y otros sistemas de
15.48 572.62 telecomunicaciones
3405.19 64698.54 Argumenta tres conclusiones resp
12717.97 114461.73
27953.83 195676.78 Conclusión 1
49112.75 98225.51
76194.76 76194.76
109199.83 0.00 Conclusión 2
148127.98 148127.98

927353.39

Conclusión 3
tado

81.8160240963856
54.3073333333333

38.3703496503497

tado

5586.46618057773

74.7426663999735
retación de las medidas de tendencia central y dispersión

r qué es importante la media, mediana y moda en el contexto de la variable de estudio?

permite hacer comparaciones generales entre ciudades o regiones para entender qué tan rápidas o lentas son las velocidades
en comparación con la media global. La mediana nos puede indicar qué velocidad de descarga es más representativa para la
de las ciudades, sin ser influenciada por las ciudades con velocidades extremadamente altas o bajas.La moda Puede revelar la
de descarga más común entre las ciudades del estudio.

é información proporciona la varianza y desviación estándar en el contexto de la variable de estudio?

za de 5586.47 y la desviación estándar de 74.74 Mbps sugieren una considerable variabilidad en las velocidades de descarga
des estudiadas. Esta información es crucial para entender la magnitud de la desigualdad en la calidad de la infraestructura de i
guiar acciones para mejorar la equidad en el acceso a internet de alta velocidad.

mentación de las conclusiones del análisis


nta desde tu punto de vista a que atribuirias el contraste entre los paises de internet con mayor velocidad en comparación con
internet más lento.
es con mayor velocidad de internet suelen tener una infraestructura tecnológica más avanzada, con redes de fibra óptica bien
adas, 5G y otros sistemas de última generación. Estos países han invertido considerablemente en su infraestructura de
nicaciones
enta tres conclusiones respecto al comportamiento de la variable Velocidad promedio de descarga (mbps) en las distintas regi
(continentes).
Desigualdad Esta disparidad puede atribuirse a la diferencia en el nivel de desarrollo económico, la infraestruc
tecnológica y la inversión en telecomunicaciones en cada región. Europa y Asia, en particular, han hecho grandes a
en la implementación de tecnologías de fibra óptica y 5G

Desarrollo Económico:Las economías desarrolladas no solo tienen la capacidad financiera para invertir en tecnol
avanzadas, sino que también cuentan con marcos regulatorios más eficientes y un mercado competitivo que impu
innovación y la mejora continua

Efecto de la Urbanización: Las áreas urbanas en comparación con las rurales suelen ser prioritarias para la instala
redes avanzadas debido a la mayor densidad de población y el mayor retorno de la inversión para los proveedore
servicios de internet.
variable de estudio?

s para entender qué tan rápidas o lentas son las velocidades


ar qué velocidad de descarga es más representativa para la
es extremadamente altas o bajas.La moda Puede revelar la

contexto de la variable de estudio?

a considerable variabilidad en las velocidades de descarga entre


tud de la desigualdad en la calidad de la infraestructura de internet
ta velocidad.

aises de internet con mayor velocidad en comparación con los de


ento.
tecnológica más avanzada, con redes de fibra óptica bien
nvertido considerablemente en su infraestructura de

Velocidad promedio de descarga (mbps) en las distintas regiones


s).
diferencia en el nivel de desarrollo económico, la infraestructura
da región. Europa y Asia, en particular, han hecho grandes avances
de tecnologías de fibra óptica y 5G

no solo tienen la capacidad financiera para invertir en tecnologías


ulatorios más eficientes y un mercado competitivo que impulsa la
n y la mejora continua

aración con las rurales suelen ser prioritarias para la instalación de


ación y el mayor retorno de la inversión para los proveedores de
cios de internet.
CONCLUSIÓN
REFERENCIAS BIBLIOGRÁFICAS

También podría gustarte