Semana 6

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

REDUCCIÓN DE DATOS

Medidas de Resumen: Son indicadores que pueden ser obtenidos a nivel poblacional o a nivel muestral.
Su función es:
-Describir al conjunto de datos recolectado.
-Facilitar la comparación cuantitativa entre dos o más distribuciones de frecuencias.

Parámetro: Medida de resumen que describe a toda la población (es una constante).

Estadístico ó Estadígrafo: Medida de resumen que describe sólo a la muestra (es variable porque toma
valores diferentes de muestra a muestra).

Clasificación de Medidas de Resumen de Uso frecuente


- Media o Promedio X

Medidas De Tendencia Central - Moda (Mo ó Md)

- Mediana (Me)

Medidas de Posición, de localización - Cuartiles (Qi)


o de tendencia no central - Fractiles o cuantiles - Deciles (Di)
- Percentiles o Centiles(Pi)

- Rango o Recorrido (R)


Medidas De Dispersión - Varianza (S2 ó Var(X))
- Desviación Estándar (S ó DE.)
- Coeficiente de Variación o de Variabilidad (CV%)

Medidas de
Deformación - Coeficiente de Asimetría de Pearson (CAs)
Horizontal

Medidas de
Deformación - Coeficiente de Apuntamiento o Kurtosis (CAp)
Vertical

OBJETIVOS QUE DEBEN CUMPLIRSE AL ESTUDIAR CADA MEDIDA DE RESUMEN:

1. Reconocerlas: preguntándose:
¿Cómo es su notación?
¿Cuál es su función?
2. Saber hallar su Valor:
Preguntándose: ¿Cómo se obtiene?
Para ello, observar la forma de presentar los datos:
Para una variable cuantitativa:

Se presentan 3 casos bien diferenciados:

Datos originales o Datos sin Tabular


Se consideran los datos sin agrupar.
Datos Tabulados o Agrupados sin Intervalos
Datos Tabulados o Agrupados con Intervalos

3. Saber interpretar los resultados obtenidos, según la función que desempeñan éstas, en el análisis
estadístico:
Preguntándose:
¿Cómo se interpreta el resultado obtenido, según el problema que se está analizando?
Para interpretar adecuadamente los resultados obtenidos, sirve de ayuda, identificar previamente los
elementos básicos del problema.

Estos son:
La variable del problema
La unidad estadística, el tamaño de la muestra o de la población
El valor de la medida de resumen obtenida con los datos
La unidad de medida de la variable, et.

Ejemplo:
Media o promedio 𝑿 ̅ = 8 años
Para interpretar se necesita:
Variable: edad, tiempo de servicio,etc
UE : niño , trabajadores , televisores etc
Tamaño de muestra : n=36 n= 96 n = 26
Valor de la medida : 8
Unidad de medida : años

Interpretación :
La edad promedio de 36 niños es de 8 años
El tiempo de servicio promedio de 96 trabajadores es de 8 años
El tiempo de duración promedio de 26 televisores es de 8 años

𝑴𝒅 = 8 años moda
Interpretarción:
La edad más frecuente de los 36 niños es de 8 años
El tiempo de servicio más frecuente de los 96 trabajadores es de 8 años
El tiempo de duración más frecuente de 26 televisores es de 8 años

➢ Los estadígrafos de tendencia central deben su nombre al hecho de que sus valores tienden a ocupar posiciones
centrales o intermedios entre el menor y el mayor valor del conjunto de datos, a partir de la cual se calculan estos
estadígrafos.
Sirven para determinar los valores centrales o medios de la distribución. Brindan de alguna forma, información
sobre el centro de la distribución.

Medidas de tendencia central más usadas son:


• La Media ó Promedio :
✓ Aritmética o simplemente media
✓ Geométrica
✓ Armónica
✓ Cuadrática
• La moda
• La mediana

Ejemplo:
Supongamos que se eligen 3 conjuntos de estudiantes
• Primaria,
• Secundaria
• Superior
La distribución de los estudiantes por edades ha permitido obtener los siguientes histogramas.

Edad Alumnos
fi
28 26
24
20
24
20
18
5-7 12
16
12
14 7-9 26
12
8
8 9-11 24
4
0
11-13 20
5 19 X (E d a d)
13-15 18
15-17 14
17-19 8
Edad Alumnos
fi
10-12 12
28 26
12-14 26
24
24
20
20 14-16 24
16
12
12
16
16-18 20
8
8
4
18-20 16
4
0
10 24
20-22 8
X (E d a d)
22-24 4
Edad Alumno
s
fi 14-16 4
28
24 20
26
16-18 8
20
16
18 18-20 20
12
8
8
12
8
6
20-22 26
4
0
4
22-24 18
14 30 X (E d a d)
24-26 12
26-28 8
28-30 6
Se observa: que hay un desplazamiento de las distribuciones hacia la derecha a medida que avanza el nivel
educativo en cada grupo.

La diferencia entre los 3 histogramas es sólo el cambio de posición o localización a lo largo del eje horizontal o
valor de la Variable (en este caso la edad).
En cada uno de los 3 casos se advierte que los valores observados se agrupan alrededor de "cierto Valor
Central" o "Valor Medio".

Estos valores centrales, por su desplazamiento en el mismo sentido y magnitud, se consideran como números
que describen la posición de la distribución de Frecuencias y se definen como: "Medidas de Posición o de
Tendencia Central".

Conclusión:
Las medidas Tendencia Central son valores que de manera condensada representan en un solo valor, a una
serie de datos, y además describen resumidamente al conjunto de observaciones.

PROMEDIO o MEDIA:

- Es una medida de tendencia central que se utiliza para representar al conjunto de datos.
- Es muy importante en la Teoría Estadística.
- En la obtención del valor del promedio participa el valor de todas las observaciones de la variable
en estudio.
- Su unidad de medida, es la misma que tiene la variable correspondiente.
- Notación: X ó M(X).
PROBLEMA 1: DATOS SIN TABULAR (DATOS ORIGINALES)

X: Tiempo de servicio de 12 empleados de una empresa (años)

Xi : 4 3 5 6 7 4 8 2 2 3 2 2

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12


Los subíndices 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 que acompañan a X, indican orden de los valores
observados.
Por ejemplo
X5 significa el tiempo de servicio del quinto empleado entrevistado.
La unidad de medida de la variable tiempo de servicio, en este caso es el año.

PROMEDIO O MEDIA:

- Fórmula para obtener la media o promedio:

n Donde:
 Xi Xi = cada valor original observado de la
X = ⎯⎯⎯ variable (observar la Base de Datos)
n
n = Total de datos observados (tamaño de la muestra)

Para el problema planteado: n = 12.


12
 Xi
X = ⎯⎯⎯ = 48 años X = 4 años
12 12

Interpretación: El tiempo de servicio promedio de los 12 empleados es de 4 años.

PROBLEMA 2: DATOS TABULADOS SIN INTERVALOS

Promedio:
k
Fórmula X =  Xini donde k : número de clases (en este caso N° de
n valores diferentes).
Xi: cada valor diferente observado de la variable del problema.
ni: frecuencia absoluta simple que corresponde a cada X i.
Xi ni
Tiempo de Servicio(años) Nº de empleados
2 10
4 25
8 12
10 1
11 2
Número de valores diferentes n = 50
k=5
5
X =  Xini = 248 años = 4.96 años
50 50

Xi ni Xini
Tiempo de Servicio(años) Nº de empleados
2 10 20
4 25 100
8 12 96
10 1 10
11 2 22
Número de valores diferentes n = 50 Xini = 248 años
k=5

Interpretación: El tiempo de servicio promedio de los 50 empleados es 4.96 años

PROBLEMA 3: DATOS TABULADOS USANDO INTERVALOS


Promedio:
k
X =  Xini donde: k: N° de clases (en este caso número de intervalo)
n
Xi : cada punto medio o marca de clase.

ni : frecuencia absoluta simple que corresponde a cada punto medio del


intervalo.
Tiempo de servicio N°de Empleados ni
2-5 10
5-8 22
8-11 5
11-14 3
14-17 8
17-20 2
Número de Intervalos k= 6 n = 50

X =  Xini
50

Tiempo de servicio N°de Empleados ni Punto Medio Xi X i ni


2-5 10 3.5 35.0
5-8 22 6.5 143.0
8-11 5 9.5 47.5
11-14 3 12.5 37.5
14-17 8 15.5 124.0
17-20 2 18.5 37.0
Número de Intervalos n = 50 Xini= 424.0años
k= 6

X = 424 años = 8.48 años


50
X = 8.48 años Interpretar: El tiempo de servicio promedio de los 50 empleados es 8.48 años
Propiedades de la media aritmética

1. La suma de las desviaciones de todas las puntuaciones de una distribución


respecto a la media de la misma igual a cero.

La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

= (8 − 7.6) + (3 − 7.6) + (5 − 7.6) + (12 − 7.6) + (10 − 7.6) =


= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número
cualquiera se hace mínima cuando dicho número coincide con la media aritmética.

3. Si a todos los valores de la variable se les suma un mismo número, la media


aritmética queda aumentada en dicho número.

4. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda
multiplicada por dicho número.

Observaciones sobre la media aritmética


1. La media se puede hallar sólo para variables cuantitativas.
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas.
Si tenemos una distribución con los siguientes pesos:
65 kg, 69 kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución.
4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

MEDIA PONDERADA:
La media ponderada o media aritmética ponderada, es una medida de tendencia
central en la cual, a cada valor xi que puede tomar una variable X, se le asigna un
peso pi. Como resultado de ello, al denotar a la media ponderada por 𝑋̅𝑃 ; se tiene:
𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑋𝑖 𝑚𝑢𝑙𝑡𝑖𝑝𝑙𝑖𝑐𝑎𝑑𝑜𝑠 𝑝𝑜𝑟 𝑠𝑢 𝑝𝑒𝑠𝑜
𝑋̅𝑃 = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑝𝑒𝑠𝑜𝑠
Con la notación de sumatoria, la fórmula para la media ponderada es:
𝑋1 𝑝1 +𝑋2 𝑝2 +𝑋3 𝑝3 +⋯….+𝑋𝑛 𝑝𝑛
𝑋̅𝑃 = 𝑝1 +𝑝2 +𝑝3 +⋯..+𝑝𝑛

∑ 𝑋𝑖 𝑝𝑖
𝑋̅𝑃 = ∑ 𝑝𝑖

Donde n representa la cantidad de valores que se escogen de la variable X


El pi, al que también se le llama factor de ponderación, es una medida de la
importancia que el investigador le asigna a cada valor. Dicho factor es
Arbitrario y siempre positivo.
En esto que la media ponderada se diferencia de la media aritmética simple, porque
en esta, cada uno de los valores xn tiene igual significancia.

Sin embargo, en numerosas aplicaciones, el investigador posiblemente considere


que algunos valores son más importantes que otros y les asignará un peso según su
criterio.

Ejemplo:
Supongamos que un estudiante presenta n evaluaciones en una materia y todas
tienen el mismo peso en la nota final.
En tal caso, para calcular la nota definitiva bastará con hacer un promedio simple,
es decir, sumar todas las calificaciones y dividir el resultado entre n.
Pero si cada actividad tiene un peso diferente, porque algunas evalúan contenidos
más importantes o más complejos, entonces será necesario multiplicar cada
evaluación por su respectivo peso, y después sumar los resultados para obtener la
calificación definitiva.

MEDIA ARITMÉTICA, MEDIA GEOMÉTRICA, MEDIA ARMÓNICA Y MEDIA CUADRÁTICA

✓ Aritmética o simplemente media

✓ Geométrica

✓ Armónica

✓ Cuadrática
• La media cuadrática
✓ Es muy útil para calcular la media de variables que toman valores negativos y positivos.
✓ Se suele utilizar cuando el signo de la variable no es importante y lo que interesa es el valor
absoluto del elemento.
✓ Por ejemplo, para calcular la media de errores de medida.
✓ Una aplicación clásica de la media cuadrática es la determinación del valor eficaz de un parámetro
sinusoidal en electricidad, en corriente alterna (tensión en voltios o intensidad en amperios).
✓ Ejemplo: Un profesor pide a sus alumnos que realicen un experimento en el laboratorio. Espera
que los alumnos obtengan 5 litros de ácido clorhídrico. Anota en una tabla una columna con las
cantidades de ácido obtenidos por cada alumno y en la otra el error por falta o exceso de la
cantidad esperada, de la siguiente manera:
Litros de ácido clorhídrico en un
experimento (5 litros esperados)
Alumno Litros Error
Jorge Sánchez 5.68 0.68
Andrea Tacora 4.62 -0.38
Raúl Prieto 3.98 -1.02
María García 6.12 1.12
Amparo Sierra 5.23 0.23
Juan Ravelo 4.28 -0.72

Se representa gráficamente los errores de los seis alumnos.

Al profesor no le importa si el error se produjo por falta o por exceso, sino la cantidad de ácido de
diferencia respecto a la esperada. Para ello, utiliza la media cuadrática:
0.682 +(−0.38)2 +(−1.02)2 +1.122 +0.232 +(−0.72)2
RMS = √ = 0.76
6

La media cuadrática es RMS=0.76


MEDIA GEOMÉTRICA
La media geométrica (MG), de un conjunto de n números positivos se define como la raíz n-ésima del
producto de los n números.
𝑛
Por tanto, la fórmula para la media geométrica es dada por MG = √( 𝑋1 )( 𝑋2 ) … . ( 𝑋𝑛 )

La media geométrica viene a ser la raíz n-ésima de los productos de todos los valores de la variable X.

Existen dos usos principales de la media geométrica:

1. Para promediar porcentajes, índices y cifras relativas

2. Para determinar el incremento porcentual promedio en ventas, producción u otras actividades o series
económicas de un periodo a otro.

Ejemplo:

Supóngase que las utilidades obtenidas por una compañía constructora en cuatro proyectos fueron de 3, 2, 4
y 6%, respectivamente. ¿Cuál es la media geométrica de las ganancias?

En este ejemplo n = 4 y así la media geométrica es determinada por


4 4
MG = √( 𝑋1 )( 𝑋2 )( 𝑋3 )( 𝑋4 ) = √( 3)( 2)( 4)( 6) = 3.464101615

la media geométrica de las utilidades es el 3.46%.

La media aritmética de los valores anteriores es 3.75%.

Aunque el valor 6% no es muy grande, hace que la media aritmética se incline hacia valores elevados.

La media geométrica no se ve tan afectada por valores extremos.


MEDIA GEOMÉTRICA para datos agrupados
La media geométrica en este caso se define como la raíz n-ésima de los productos de los valores xi elevados a
sus correspondientes frecuencias absolutas fi. Donde n es el tamaño de la muestra.

𝑛 𝑓
G = √∐𝑛𝑖=1 𝑋𝑖 𝑖

✓ Presenta problemas de cálculo cuando los valores de la variable y sus frecuencias conduce a que el
radicando sea negativo y coincida que el tamaño de la muestra es par.
✓ También en muchas ocasiones, los valores de la distribución nos impiden poder efectuar los cálculos al
exceder estos la capacidad de la calculadora.
✓ Por ello, en ese caso se suele utilizar los logaritmos:

✓ Se puede observar que el logaritmo de la media geométrica es la media aritmética de los logaritmos de
los valores de la variable.
✓ Suele utilizarse cuando los valores de la variable siguen una progresión geométrica. También para
promediar porcentajes, tasas, nº índices, etc., siempre que nos vengan dados en porcentajes.
Ejemplo: Hallar la media geométrica de la siguiente distribución:
Xi fi
100 10
120 5
125 4
140 3

Para el cálculo es conveniente ampliar la tabla:

Xi fi logXi filog(xi)
100 10 log100 = 2 20
120 5 log120 = 2.079 10.396
125 4 log125 = 2.097 8.387
140 3 log140 = 2.146 6.438
45.221

1
Log( G ) = ∑ 𝑓𝑖 log (𝑥𝑖 )
𝑛
n =22
1
Log( G ) = ∑ 𝑓𝑖 log (𝑥𝑖 )
22

1
Log( G ) = (45.221)
22
Log( G ) = 2.0555
luego tomando antilogaritmos se tiene G = anti log(2.0555) = 113.632

MEDIA ARMÓNICA
La media armónica se define como el recíproco de la media aritmética de los recíprocos:
1
H = MA = 1 1 1 1
( + +⋯…+𝑋 )
𝑛 𝑋1 𝑋2 𝑛

Este valor se emplea para promediar variaciones con respecto al tiempo.

Ejemplo: Supóngase que una familia realiza un viaje en automóvil a una ciudad y cubre los primeros 100 km a
60 km/h, los siguientes 100 km a 70 km/h y los últimos 100 km a 80 km/h. Calcular, en esas condiciones, la
velocidad media realizada.
1
H = MA =1 1 1 1 = 69.041 km/h
( + + )
3 60 70 80

MEDIA ARMÓNICA para datos agrupados :


Es la inversa de la media aritmética de las inversas de los valores de la variable, responde a la siguiente
expresión:
𝑛 𝑛
H = MA = 𝑓 = 𝑓1𝑓 𝑓 𝑓
∑ 𝑖 + 2+ 3 +⋯+𝑥𝑛
𝑥𝑖 𝑥1 𝑥2 𝑥3 𝑛
Se utiliza para promediar velocidades, tiempos, rendimiento, etc. (cuando influyen los valores pequeños).
Su principal inconveniente reside en que cuando algún valor de la variable es 0 o próximo a cero no se puede
calcular.
Ejemplo: calcular la media armónica de la siguiente distribución:

Xi fi
100 10
120 5
125 4
140 3
22

Para poder hallarla, es necesario que calculemos el inverso de x , y el producto del inverso de X multiplicado
por la frecuencia. Los resultados lo expresamos en la siguiente tabla:

Xi fi 1 / Xi fi / Xi Xifi
100 10 1/100 0.1 1000
120 5 1/120 0.042 600
125 4 1/125 0.032 500
140 3 1/140 0.021 420
22 0.195 2520

y por tanto, la media armónica sería:


𝑛 22
H = MA = 𝑓 = = 112.82
∑ 𝑖 0.195
𝑥𝑖

frente a la media aritmética que en este caso sería:


∑ 𝑋𝑖 𝑓𝑖 2520
𝑋̅ = = = 114.545
𝑛 22

Se puede demostrar la siguiente propiedad:


Entre la media aritmética, la media geométrica y media armónica se da siempre la siguiente relación:
H ≤ G ≤ 𝑋̅
OBSERVACIONES SOBRE LA MEDIA GEOMÉTRICA Y LA MEDIA ARITMÉTICA

• El empleo de la media geométrica equivale a una transformación de la variable en LogX


1
• El empleo de la armónica equivale a una transformación de la variable en
𝑋

• El cálculo de la media aritmética de la nueva variable puede ser ventajoso en el empleo de log X en
lugar de X para obtener una distribución más simétrica y que se aproxime más a una distribución
normal.

• La media aritmética de logX es el logaritmo de la media geométrica de X , de forma que la media


empleada es equivalente al empleo de la media geométrica como valor medio de X.

• Por ejemplo, si la variable abarca un campo de variación muy grande, tal como el porcentaje de
impureza de un producto químico, que por lo general toma valores alrededor del 0.1%, pero que en
ocasiones llega incluso al 1% o más.

• Relación entre medias:


Existe una relación de orden entre los cuatro tipos de media.
En esta relación se excluye la media ponderada porque la media ponderada depende de los pesos.
Sean:
H Media armónica
MG Media geométrica
𝑋̅ Media aritmética
RMS Media cuadrática

Entonces: H ≤ MG ≤ 𝑋̅ ≤ RMS

En esta relación, solamente se cumple la igualdad cuando todos los datos sean iguales, es decir
si: x1 = x2 = x3 = … = xn
Se da la siguiente relación, en el caso de distribuciones de solamente dos datos, sean estos los que sean:

MG = √𝑋̅ ∗ 𝐻
Cuando en la distribución hay solamente DOS datos, la media geométrica es la media geométrica entre la
media aritmética y la media armónica.
Esta relación se convierte en una aproximación, cuando, habiendo múltiples valores, estos están muy
agrupados en torno a la media.

MG ~ √𝑋̅ ∗ 𝐻

También podría gustarte