Notas de Clase. Contenidos Estadística Descriptiva V.3
Notas de Clase. Contenidos Estadística Descriptiva V.3
Notas de Clase. Contenidos Estadística Descriptiva V.3
Estadística I
Julio Reales Caro
Docente
NOTAS DE CLASE: CONTENIDOS DADOS EN EL PRIMER SEGUIMIENTO
Población: conjunto de individuos con propiedades comunes, sobre las que se realiza
una investigación de tipo estadístico.
Un poco de Historia.
NOTAS DE CLASE 1
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
dado que se organizaban a partir de los registros rudimentarios que llevaban de sus
actividades.
En Roma la organización del estado se perfecciona en todos los órdenes y ello influye
en la estadística, cuya base queda establecida en el CENSUS, que era una doble
investigación practicada regularmente sobre los ciudadanos y sus bienes.
TIPOS DE DATOS.
Escala de Medida.
Nominal: la cualidad que se mide no tiene ninguna secuencia lógica (ej. Sexo)
Ordinal: las observaciones pueden ser ordenadas de menor a mayor, pero las
NOTAS DE CLASE 2
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
distancias no tienen sentido (ej. opinión sobre la calidad de un producto)
Intervalo: las distancias tienen sentido, su magnitud es igual a todo lo largo de la escala,
se puede realizar comparaciones; pero el cero es arbitrario, por lo que operaciones
matemáticas no son realizables. (Ej. temperatura, prueba de inteligencia)
Son aquellas en donde cada dato tiene la frecuencia correspondiente. Los datos
organizados en tablas de frecuencias no agrupadas se denominan usualmente datos no
agrupados. (aplican tanto para datos categóricos, como para numéricos)
𝟎 ≤ 𝒏𝒊 ≤ 𝑵, ∑𝒌𝒊=𝟏 𝒏𝒊 = 𝑵
𝑛𝑖
𝑓𝑖 =
𝑁
NOTAS DE CLASE 3
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Se debe cumplir:
∑𝒌𝒊=𝟏 𝒏𝒊
𝟎 ≤ 𝒏𝒊 ≤ 𝑵, ∑𝒌𝒊=𝟏 𝒇𝒊 = =𝟏
𝑵
FRECUENCIA
NOMBRE DE LA FRECUENCIA
ABSOLUTA
VARIABLE (𝑿𝒊 ) RELATIVA (𝒇𝒓 )
(𝒏𝒊 )
𝒙𝟏 𝒏𝟏 𝒇𝟏
𝒙𝟐 𝒏𝟐 𝒇𝟐
. . .
. . .
. . .
𝒙𝒌 𝑛𝑘 𝑓𝑘
NOTAS DE CLASE 4
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Pasos para la construcción de una tabla de frecuencia agrupada.
2. determinar el Rango: R = Dato Mayor – Dato Menor (se trabaja el dato exacto)
𝑅
4. determinar la amplitud de clase: 𝑤 = 𝑐
(se aproxima al entero siguiente)
7. clases
14 21 23 21 16 19 22 25 16 16 24 24 25 19 16 19 18 19 21 12
16 17 18 23 25 20 23 16 20 19 24 28 15 22 24 20 22 24 22 20
1
Es de resaltar que esta regla no es la única forma de estimar el número de clases adecuada para la
tabla, pero al ser la de mayor difusión y dado su fácil procedimiento, se decide trabajar con esta en el
presente documento.
NOTAS DE CLASE 5
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Paso 1: ordenar los datos
12 14 15 16 16 16 16 16 16 17 18
18 19 19 19 19 19
20 20 20 20 21 21 21 22 22 22 22 23 23 23 24 24 24 24 24
25 25 25 28
R = 28 – 12 = 16
𝑐 = (3,3 ∗ log(𝑛)) + 1
𝑐 = (3,3 ∗ log(40)) + 1 = 6,2867 ≈ 6
𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑚𝑒𝑑𝑖𝑑𝑎 1
𝑃𝑢𝑛𝑡𝑜 𝑀𝑒𝑑𝑖𝑜 = = = 0,5
2 2
Pasos 7 y 8.
NOTAS DE CLASE 6
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Primera frontera
Primera frontera
superior estimada
inferior estimada
𝒇𝒓𝒐𝒏𝒕𝒆𝒓𝒂𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓 + 𝒇𝒓𝒐𝒏𝒕𝒆𝒓𝒂𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓
𝑴𝒂𝒓𝒄𝒂 𝒅𝒆 𝑪𝒍𝒂𝒔𝒆 =
𝟐
NOTAS DE CLASE 7
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
12 12
Frecuencia absoluta 10 10 P.F.=marca de
P.I.=marca de 8 8 clase final + w
clase inicial – w 6 6 =28 + 3 = 31
=13 – 3 = 10 4 4
2 2
0 0
10 13 16 19 22 25 28 31
Marca de Clase y Fronteras
Tabla Bivariada.
Tabla descriptiva de las variables (esta es un apoyo, para entender la forma como se
está analizando la información)
NOTAS DE CLASE 8
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
ANÁLISIS EXPLORATORIO DE DATOS UNIVARIADOS
Media aritmética:
∑𝑛1 𝑥𝑖
𝑋̅ =
𝑛
Ej: edades de jóvenes de primer semestre de universidad, 18, 18, 18, 18, 19, 19, 19, 20,
20, 21.
18 + 18 + 18 + 18 + 19 + 19 + 19 + 20 + 20 + 21
𝑋̅ = = 19
10
Media ponderada: «es importante, cuando los datos tienen un peso diferente en
la muestra o población»
∑𝑛1(𝑥𝑖 ∗ 𝑓𝑖 )
̅
𝑋=
∑𝑛1 𝑓𝑖
Ej:
Edades 18 19 20 21
Frecuencia 4 3 2 1
NOTAS DE CLASE 9
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
∑𝑛1(𝑥𝑖 ∗ 𝑓𝑎 )
𝑥̅𝑎 =
∑𝑛1(𝑓𝑎 )
x n2 x n 1
2
Si n es par
Me 2
xn 1 Si n es impar
2
NOTAS DE CLASE 10
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Propiedad de los indicadores (Sensibilidad)
Medidas de Posición
Percentiles:
Dividen la distribución en 100 partes iguales, cada uno representa el 1% de la
población.
Deciles:
Dividen la distribución en 10 partes iguales, cada uno representa el 10% de la
población.
Cuartiles:
Dividen la distribución en 4 partes iguales, cada uno representa el 25% de la
población.
Equivalencias para trabajar sólo con la fórmula del percentil para todas las medidas.
• P10 = D1, P20 = D2, P30 = D3, ..., P50= D5= Me, ..., P90= D9, P100= D10
NOTAS DE CLASE 11
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
El primer cuartil corresponde al percentil 25, por lo cual, se calcula la posición 25 de los
datos:
25*(14 1)
X 25 3.75
100
Según el paso anterior el P25 está entre el tercero y cuarto puesto, que les corresponde
a los siguientes valores:
Multiplicamos esa diferencia (3) por la parte decimal de la posición Xp: 3*0.75=2.25
Medidas de Variabilidad
𝑅 𝐼 = 𝑄3 − 𝑄1
simbolizada por 𝜎 2
∑𝑁
1 (𝑥𝑖 − 𝜇)
2
𝜎2 =
𝑁
Desviación.
∑𝑁
1 (𝑥𝑖 − 𝜇)
2
𝜎=√
𝑁
Simbolizada por 𝑆 2 ,
2
∑𝑛1(𝑥𝑖 − 𝑥̅ )2
𝑠 =
𝑛−1
Desviación:
∑𝑛(𝑥𝑖 − 𝑥̅ )2
𝑆=√ 1
𝑛−1
Coeficiente de Variación.
NOTAS DE CLASE 13
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
𝑠
𝐶𝑉 = ( ) ∗ 100
𝑥̅
Coeficiente de Asimetría.
NOTAS DE CLASE 14
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
∑𝑛 3
1 (𝑥𝑖 −𝑥̅ ) 𝑓𝑖 𝑔𝑙
𝑔𝑙 = ; 𝑔𝑠 =
𝑠3𝑛
√6⁄𝑛
Coeficiente de Curtosis.
NOTAS DE CLASE 15
Universidad Del Magdalena
Estadística I
Julio Reales Caro
Docente
Los diagramas de cajas y bigotes son útiles, entre otros para los siguientes propósitos:
Referencias Bibliográficas.
NOTAS DE CLASE 16