Análisis de Datos
Análisis de Datos
Análisis de Datos
Índice
Tablas de Frecuencia
Medidas de Dispersión
Tema Especial
Tema 1 Tablas de Frecuencia
Símbolo
Datos Simples
Nombre Definición
Xi Dato
N Población (Número total de (Número total de datos)
datos)
Fi Frecuencia Absoluta (Número de veces que se repite
el dato)
Fr Frecuencia Relativa ()
% Porcentual ()
F Frecuencia Absoluta Acumulada
F H
Fi Fr
Xi % Frecuencia Frecuencia
Frecuencia Frecuencia
Datos Porcentaje Absoluta Relativa
Absoluta Relativa
Acumulada Acumulada
Pacientes de
Urgencias
15 0.19 19% 15 +19% +
Pacientes de
17 0.21 21% 32 40%
Medicina Interna
+ +
Pacientes de
9 0.11 11% 41 51%
Cirugía
+ +
Pacientes de
30 0.38 38% 71 89%
Medicina Familiar
+ +
Pacientes de
Ginecología y 7 0.08 0.08% 78 100%
Obstetricia
Total
78 ~1 100% 78 100%
N
Tema 1 Tablas de Frecuencia
Símbol Nombre
Datos Agrupados
Definición
o
I Intervalo
Símbolo
Datos Agrupados
Nombre Definición
Xi Marca de Clase
N Población (Número total de (Número total de datos)
datos)
fi Frecuencia Absoluta (Número de veces que se repite
el dato)
h Frecuencia Relativa ()
% Porcentual ()
F Frecuencia Absoluta Acumulada
Datos Xi f F h H h%
Marca de Frecuenci Frecuenci Frecuenci Frecuenci
Clase a a a a
Absoluta Absoluta Relativa Relativa
Acumulad Acumulad
a a
1 Li Ls 21.5 14 14 0.31 0.31 31
16 – 27
2 28 – 38 33 10 24 0.22 0.53 22
3 39 – 49 44 6 30 0.13 0.66 13
Rango
4 50 – 60 55 10 40 0.22 0.88 22
5 61 – 71 66 3 43 0.06 0.94 6
6 71 – 81 76 1 44 0.02 0.96 2
Intervalos Amplitud N= 44 ~1 ~100%
Tema 2 Medidas de Tendencia Central
Datos Simples
Las medidas de posición central
son estadísticas utilizadas para Tipos
describir el punto central o típico
de un conjunto de datos. Son
útiles para resumir la distribución
de los datos y entender dónde se
centran los valores. Estas
medidas proporcionan diferentes Median
perspectivas sobre la tendencia Media Moda
central de los datos y se a
seleccionan según la distribución
y naturaleza de los datos. La
elección entre ellas depende de
varios factores, como la
presencia de valores extremos, la
simetría de la distribución y el
Tema 2 Medidas de Tendencia Central
𝑁
Media Aritmética ∑ 𝑥𝑖
𝑖
𝑁
Usos más comunes
Medida estadística 1) Resumen de Datos La media aritmética es una forma común de resumir un conjunto
que representa el de datos, proporcionando un valor único que representa el
centro del conjunto
valor típico o 2) Comparación Permite comparar conjuntos de datos diferentes, ya que
promedio de un proporciona un punto de referencia común.
conjunto de números. 3) Predicción y Estimación La media aritmética a menudo se utiliza para predecir o estimar
valores futuros en función de los valores anteriores o existentes.
Otorga la misma
4) Análisis de Tendencias Ayuda a identificar tendencias o patrones en los datos al
ponderación a todos observar cómo cambia la media a lo largo del tiempo o entre
los valores diferentes grupos.
5) Cálculo de otras medidas La media aritmética se utiliza en el cálculo de otras medidas
estadísticas estadísticas, como la desviación estándar y el coeficiente de
Tema 2 Medidas de Tendencia Central
Media
Geométrica
La media geométrica es una
medida estadística que se
utiliza para calcular el valor
central de un conjunto de
números positivos. Es Usos más comunes
√ 𝑥1 ∗𝑥2 ∗…∗𝑥𝑛
𝑁
especialmente útil en 1) Productos Constantes Útil cuando se trabaja con productos constantes o relaciones
situaciones donde se está proporcionales.
interesado en el crecimiento o
2) Tasas de Crecimiento Se utiliza en el análisis de tasas de crecimiento, especialmente
la multiplicación acumulativa a cuando se consideran incrementos porcentuales en diferentes
lo largo del tiempo, como en el periodos de tiempo.
caso de inversiones financieras, 3) Índices y Promedios Compuestos Se aplica en la elaboración de índices y promedios compuestos
tasas de crecimiento y análisis
de poblaciones. 4) Promedio de datos logarítmicos Es adecuada para calcular promedios de datos transformados
logarítmicamente, ya que convierte el producto de los datos
Ayuda en el cálculo de logarítmicos nuevamente en el valor original.
Porcentajes, Razones, 5) Datos Positivos no simétricos Cuando los datos no son simétricos y hay valores extremos, la
Proporciones. media geométrica puede ser menos afectada por estos valores
Tema 2 Medidas de Tendencia Central
𝑁
Media Armónica
𝑁
1
Es una medida estadística
utilizada para calcular el valor
∑ 𝑥𝑖
promedio de un conjunto de
𝑖
números. Usos más comunes
Es especialmente útil en 1) Velocidades Promedio Se utiliza comúnmente para calcular la velocidad media cuando
situaciones donde se tienen se trata de diferentes velocidades en distancias iguales.
valores inversamente 2) Análisis de tasas y ratios Se aplica en situaciones donde se buscan promedios ponderados
proporcionales o en situaciones por tasas o ratios.
donde los valores extremos 3) Cálculo de Promedio en Finanzas En finanzas, la media armónica puede utilizarse para calcular el
pueden distorsionar rendimiento promedio de inversiones financieras cuando se
significativamente otros tipos consideran diferentes periodos de tiempo o tasas de interés.
de media, como la media 4) Datos relacionados inversamente La media armónica es útil cuando se analizan datos que tienen
aritmética una relación inversa.
√
𝑁
Media Cuadrática ∑ 𝑥1
𝑖 𝑖
𝑁
Es una medida estadística
Usos más comunes
utilizada para calcular el valor
promedio de un conjunto de 1) Señales y Electrónica Se utiliza en el análisis de señales eléctricas y electrónicas para
números, pero con un énfasis representar la magnitud efectiva o valor eficaz de una señal,
en los valores al cuadrado de que tiene en cuenta tanto los valores positivos como negativos
los datos debido a que estos de la señal.
alternan en (+) y (-). Se utiliza 2) Análisis de datos vibratorios Se utiliza para calcular la amplitud efectiva de vibraciones,
en situaciones donde se quiere sonidos u oscilaciones.
tener en cuenta tanto la 3) Cálculo de Promedios de datos al Es útil cuando se analizan datos que tienen una variación
magnitud como la variabilidad cuadrado significativa y se quiere evitar que los valores extremos dominen
de los valores en el conjunto de el resultado.
datos y cuando se desea tener 4) Aplicaciones en Estadística y Se utiliza en varios contextos estadísticos y físicos, como en el
en cuenta la variabilidad de los Física cálculo de la desviación estándar (que es la raíz cuadrada de la
datos. varianza) o en la representación de la magnitud de fuerzas o
Tema 2 Medidas de Tendencia Central
Porcentaje %Δ
Es una medida que se utiliza para expresar
cuánto cambia una cantidad en relación con
su valor original, en términos de porcentaje.
Es una medida útil para cuantificar y Cuando se desconoce el valor inicial se
comparar cambios relativos en diferentes usa
variables en una amplia gama de contextos,
desde finanzas y economía hasta ciencia y
tecnología. Ayuda a comprender el impacto
de los cambios en relación con los valores
originales.
Tema 2 Medidas de Tendencia Central
Moda 𝑀𝑜 Es el valor de la Fi
que más se repite
Usos
𝑋 𝑁 +1
En donde
X Posición que ocupa el resultado de la ecuación
N Población Total
n Muestra
2 Usos
1) Robustez ante Es menos sensible a valores atípicos o extremos en los datos que la media
valores extremos aritmética. Por lo tanto, se utiliza en conjuntos de datos con valores extremos para
𝑋𝑛+ 𝑋 𝑛
( )
proporcionar una medida más representativa de la tendencia central.
2) Resumen de datos Cuando los datos tienen una distribución sesgada o no siguen una distribución
sesgados normal, la mediana puede ser una medida más representativa de la tendencia
+1 central que la media.
2 2 3) Datos Ordinales o La mediana es útil para resumir datos ordinales o categóricos, donde no tiene
Categóricos sentido calcular una media.
2 4) División de Datos
Agrupados
Se utiliza para dividir datos en dos partes iguales, lo que proporciona una
comprensión equilibrada de la distribución de los datos.
5) Estimación de Se utiliza junto con otras medidas de tendencia central, como la media y la moda,
Tendencia Central para comprender mejor la distribución de los datos y para hacer inferencias sobre la
Tema 2 Medidas de Tendencia Central
Datos Agrupados
Tipos
Media
Media Moda Mediana Ponderad
a
Tema 2 Medidas de Tendencia Central
Media 𝑋 𝑛
Fórmula
Recomendada
∑ ( 𝑥𝑖∗ 𝑓 𝑖)
Media Aritmética 𝑖
𝑛
Media
√(𝑥 ) ∗ (𝑥 ) [ ]
𝑛 𝑓1 𝑓2 𝑓𝑛 ∑ ( 𝑓 ∗ log 𝑥 𝑖)
Geométrica 1 2 ∗…∗ ( 𝑥 𝑛 ) 10
𝑁
𝑁
En donde
Media Armónica ( )
𝑛
𝑓
∑ 𝑥𝑖 Marca de Clase
𝑖 𝑖
√
Frecuencia absoluta
Media Cuadrática 𝑛
∑ ( 𝑥𝑖 2 ∗ 𝑓 𝑖 )
𝑖
𝑁
Tema 2 Medidas de Tendencia Central
𝑀 𝑒 ([ ] )
𝑛
− { 𝐹 −1 }
Mediana 𝐿𝑖 +
2
𝐹
∗𝐴
Moda 𝑀 𝑜 ( (2 ∗ 𝑓
𝐿+ 𝑖
𝑓 𝑚𝑜𝑑𝑎𝑙 − 𝑓 𝑚𝑜𝑑𝑎𝑙 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝑚𝑜𝑑𝑎𝑙 ) − 𝑓 𝑚𝑜𝑑𝑎𝑙 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 − 𝑓 𝑚𝑜𝑑𝑎𝑙 𝑠𝑖𝑔𝑢𝑒𝑛𝑡𝑒
∗𝐴
)
Media 𝑁
En donde
𝑋𝑝
Límite inferior
∑ ( 𝑥 𝑖 ∗ 𝑤 𝑖) n Muestra
Ponderad
𝑖
𝑁 N Población
∑ 𝑤𝑖 F Frecuencia Absoluta Acumulada
𝑖
a
A Amplitud ()
Frecuencia acumulada absoluta anterior
Datos
Peso en % de la correspondencia del valor
Frecuencia de la clase modal (la clase con la
mayor frecuencia)
Frecuencia de la clase anterior a la clase
modal.
Frecuencia de la clase siguiente a la clase
Tema 3 Medidas de Posición No Central
En donde
(
[ )
]
Características
(en Datos Par)
𝐿+
( 𝑚 ∗𝑛
4 )
−( 𝐹 𝑎− 1)
∗𝐴
Q1
(Cuartil
1)
Corresponde al 25% y
son todos los datos
≤Q1
𝑖
𝑓 𝑎
𝑚∗(𝑛+1)
Q2 Corresponde al 50% y
(Cuartil son todos los datos
2) ≤Q2
4 Q3
(Cuartil
Corresponde al 75% y
son todos los datos
3) ≤Q3
Tema 3 Medidas de Posición No Central
En donde
𝑚∗ 𝑛 Amplitud ()
[ (( ) )
]
𝑚 ∗𝑛
−( 𝐹 𝑎− 1)
10 𝐿𝑖 +
10
∗𝐴
𝑓 𝑎
𝑚∗(𝑛+1)
10
Tema 3 Medidas de Posición No Central
En donde
Percentil
es
𝑃𝑚 Percentil por buscar (1, 2, 3, 4, 5, ..., 100)
Número de datos
Límite inferior
Frecuencia Absoluta Acumulada
Datos Datos
Frecuencia Absoluta Acumulada
Simples Agrupados inmediatamente anterior
Amplitud ()
𝑚∗ 𝑛
[ (( ) )
]
𝑚 ∗𝑛
−( 𝐹 𝑎− 1)
100 𝐿𝑖 +
100
∗𝐴
𝑓 𝑎
𝑚∗(𝑛+1)
100
Tema 4 Medidas de Dispersión
Tipos
Coeficiente
Desviación de
Rango Varianza Desviación
Estándar Variación
de Pearson
En donde
Límite
Superior
(Valor)
Límite
Inferior
(Valor)
Rango Intercuartílico (IQR): Consiste en
una estimación estadística de la
dispersión de una distribución de datos.
Se recomienda cuando la medida de
tendencia central es la mediana
Es la diferencia
entre el Cuartil 3 y
1
Suele eliminar
valores extremos.
Tema 4 Medidas de Dispersión
o también Datos
Simples
Datos
Agrupados
N
n
Población
Muestra
o también Datos
Simples
Datos
Agrupados
N
n
Población
Muestra
Propiedades {x ∈ℝ| x >
√ √
𝑁 𝑁 0}
1) Es una medida de dispersión que
indica cuánto varían los valores en ∑ ( 𝑋𝑖− μ) 2
∑ ( 𝑋 𝑖 − μ )2 ∗ 𝑓 𝑖 Media
el conjunto de datos en relación con 𝑖 𝑖 Poblacional
su media. 𝑁 𝑁
Media
2) Cuanto mayor sea la desviación Muestral
√ √
estándar, mayor será la dispersión 𝑛 𝑛
de los datos alrededor de la media. Frecuencia
3) Es sensible a la variabilidad de los
∑ ( 𝑋𝑖− 𝑥) 2
∑ ( 𝑋𝑖− 𝑥) 2
∗𝑓𝑖 Absoluta
𝑖 𝑖
datos, siendo más grande cuando 𝑛− 1 𝑛− 1 Dato
hay más variación entre los valores
y más pequeña cuando los valores
están más cerca de la media.
Tema 4 Medidas de Dispersión
Desviació
Desviación
𝐷 𝑥𝑖=𝑋 𝑖 −𝑋 Relación con la
n Media
Es la Diferencia de un
Desviación
Estándar
valor respecto a su
media
𝑁
∑ ( 𝑋𝑖− 𝑋 )∗ 𝑓 𝑖 Fórmula
𝐷𝑋 =
𝑖
para Datos
𝑁
𝐷|𝑥𝑖|=|𝑋 𝑖 −𝑋|
Agrupados
Desviación
Tipos Absoluta Es la Diferencia
absoluta del valor
respecto a su media
∑ |𝑋 𝑖 − 𝑋|
𝑖
Desviación 𝐷𝑋 =
𝑁
Media
Absoluta Media de los valores
absolutos de la
diferencia de cada valor
de la distribución con la
media aritmética
Tema 4 Medidas de Dispersión
Desviació
n Ejemplo
Desviació A = -10 Hay una diferencia de -10 pts abajo
n Media pts respecto a la
B = 0 pts No hay diferencia
C = 20 pts Hay una diferencia de 20 pts respecto
a la
𝐷 𝑥𝑖
Desviació A = 10 pts Hay una diferencia de 10 pts respecto
𝑋n a la
𝐷 𝑥𝑖 Absoluta B = 0 pts No hay diferencia
C = 20 pts Hay una diferencia de 20 pts respecto
a la
Desviació 10 En promedio hay 10 pts de diferencia
n Media en la muestra respecto a la
Absoluta
Desviació 12.9 Hay un grado de dispersión de 12.9
n pts en la muestra respecto a los
Estándar grupos en promedio
Tema 4 Medidas de Dispersión
Tema Especial
Interpolación
Posición sin
decimales
Decimales de la
posición
Tema 5 Tema Especial
Datos Interpretación
r Coeficiente de
Correlación de Pearson
Xi, Yi Valores individuales
, Media