0% encontró este documento útil (0 votos)
3 vistas18 páginas

Medidas

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1/ 18

MEDIDAS DE TENDENCIA CENTRAL, DE VARIABILIDAD Y FORMA

 Tendencia central:
La tendencia central se refiere al punto medio de una distribución.
Las medidas de tendencia central se denominan medidas de posición.
 Variabilidad o dispersión:
La dispersión se refiere a la extensión de los datos, es decir al grado en
que las observaciones se distribuyen (o se separan).
 Forma:
a) Sesgo (skewness): El sesgo es una medida de la asimetría de la curva.
En general es un valor que va de -3 a 3.
Una curva simétrica toma el valor 0.

SESGO POSITIVO SIMÉTRICA (Sesgo 0) SESGO NEGATIVO


b) Curtosis (Kurtosis)
Nos da una idea de la agudeza (o lo plano) de la distribución de frecuencias
Una curva normal (es el patrón con el que se compara la curtosis de otras
curvas) tiene curtosis 0. Esta curva se llama mesocúrtica.

Si la curtosis es mayor que 0, la curva es más empinada que la anterior


y se denomina leptocúrtica (Lepto, del griego, "empinado" o "estrecho").
Si la curtosis es menor que 0, es relativamente plana y se denomina
platicúrtica ( "plano", "ancho")

____ Leptocúrtica ____ Platicúrtica


- - - - Mesocúrtica - - - - Mesocúrtica
MEDIDAS DE TENDENCIA CENTRAL: Moda, mediana y media

MODA: es el valor que más se repite en un conjunto de datos

EJEMPLO: Los siguientes datos representan la cantidad de pedidos diarios


Recibidos en un período de 20 días, ordenados en orden ascendente:

0 0 1 1 2 2 4 4 5 5
6 6 7 7 8 12 15 15 15 19

La cantidad de pedidos
diarios que más veces
se repite es de 15.
Ejemplo: La cantidad de alumnos ausentes por día en un período de 20
ordenados en orden ascendente es

0 0 1 1 1 2 4 4 4 5
6 6 7 8 8 9 9 10 12 12
Esta distribución tiene 2 modas. Se la llama distribución bimodal . Mo = 1 Mo = 4

La cantidad de errores
de facturación diaria que
más veces se repiten son
1 y 4 (bimodal)
Cálculo de la moda para datos agrupados
Edad de los asistentes a Plan Salud, Club XX 2013
Edad fi fri Fi Fri
[47, 52) 4 0,029 4 0,029
 d1  [52, 57) 9 0,066 13 0,095
Mo  LMo   .h [57, 62) 13 0,096 26 0,191
 d1  d 2  [62, 67) 42
42 0,309 68 0,500
Mo Moda [67, 72) 39 0,287 107 0,787
[72, 77) 20 0,147 127 0,934
LMo Límite inferior de la clase modal
[77, 82) 9 0,066 136 1
d1 = fi – fi-1 frecuencia de la clase modal menos Intervalo modal: [62,67)
la frecuencia de la clase anterior a ella LMo = 62 d = 42 – 13 =29
1
d2 = fi – fi+1 frecuencia de la clase modal menos
d2 = 42 – 39 = 3 h =5
la frecuencia de la clase posterior a ella

h amplitud del intervalo de clase  29 


Mo  62   .5  66,53
 29  3 
La edad de los residentes del Complejo XX que más se repite es de 66,53 años
VENTAJAS Y DESVENTAJAS DE LA MODA
Se puede utilizar para datos cualitativos nominales u ordinales y para
datos cuantitativos
No se ve afectada por los valores extremos
Se puede utilizar cuando la distribución de frecuencias tenga clases abiertas
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia,
se dice que no tiene moda
Si un conjunto de datos contiene 2 puntuaciones adyacentes con la misma
frecuencia común (mayor que cualquier otra), la moda es el promedio de las
2 puntuaciones adyacentes Ej. (0,1,1,2,2,2,3,3,3,4,5) tiene Mo=2,5
Si en un conjunto de datos hay dos que no son adyacentes
con la misma frecuencia mayor que las demás, es una
distribución bimodal. Conjuntos muy numerosos se
denominan bimodales cuando presentan un polígono
de frecuencias con 2 lomos, aún cuando las frecuencias
en los 2 picos no sean exactamente iguales. Estas ligeras
distorsiones de la definición están permitidas porque el
término bimodal es muy conveniente y en último término
es descriptivo. Una distinción conveniente puede hacerse
entre la moda mayor y la moda menor.
Por ejemplo en el gráfico la moda mayor es 6 y las menores
son 3,5 y 10
Mediana: es el valor que divide al conjunto ordenado de datos, en dos
subconjuntos con la misma cantidad de elementos.
La mitad de los datos son menores o iguales y la otra mitad
son mayores o iguales que la mediana

En general, vamos a representar un conjunto de n datos como x1 , x 2 , x3 , ... , x n


Si los datos están ordenados, los indicaremos x( 1 ) , x( 2 ) , x( 3 ) , ... , x( n )
donde el subíndice encerrado entre paréntesis indica el orden o ubicación
en el conjunto ordenado
Número impar de datos: La mediana es el dato que está en la posición
22 23 25 26 28 Me  x n 1   x 51   x( 3)  25
x( 1 ) x( 2 ) x( 3 ) x( 4 ) x( 5 )    
 2   2 
La mitad de los datos son menores o iguales a 25 y la otra mitad mayores o iguales

Número par de datos: Es el promedio entre los dos datos centrales.


22 23 25 26 28 29
x( 1 ) x( 2 ) x( 3 ) x( 4 ) x( 5 ) x6 
x 6   x 6 
   1  x( 3)  x31 x3  x4  25  26
2 2 
Me      25,5
2 2 2 2

La mitad de los datos son menores o iguales a 25,5 y la otra mitad mayores o iguales
Cálculo de la mediana para datos agrupados

Edad de los asistentes al Plan Salud, Club XX 2013


 n1  Edad fi fri Fi Fri
  Fi 1 
Me  m x  Lm   2
~~ .h [47, 52) 4 0,029 4 0,029
 f 
 i
 [52, 57) 9 0,066 13 0,095
 
[57, 62) 13 0,096 26 0,191
Me Mediana [62, 67) 42 0,309 68 0,500
107
Lm Límite inferior de la clase [67, 72) 39 0,287 107 0,787
mediana . [72, 77) 20 0,147 127 0,934
n cantidad de datos [77, 82) 9 0,066 136 1
Fi-1 frecuencia acumulada absoluta de la La clase mediana es la que contiene el
elemento en la posición 136  1 = 68,5
clase anterior al intervalo mediana 2
 68,5  68 
fi frecuencia absoluta de la clase mediana Me  67   .5  67,06
h amplitud del intervalo de clase  39 
La mitad de los residentes del
Clase mediana: complejo XX tiene 67,06 años o
debemos determinar la frecuencia acumulada absoluta menos y la otra mitad 67,06 años
que contenga al elemento de la posición (n+1)/2 o más
VENTAJAS Y DESVENTAJAS DE LA MEDIANA

Se puede utilizar para datos cualitativos ordinales y para datos cuantitativos

No se ve afectada por los valores extremos. Esta es la propiedad más


importante que tiene.

Se puede utilizar cuando la distribución de frecuencias tiene clases abiertas,


a menos que la mediana caiga en una de las clases abiertas

Si hay un gran número de datos, el tener que ordenarlos para hallar la


mediana insume esfuerzo y tiempo.
Media o media aritmética: Es el promedio de los datos

Una muestra con n observaciones, tiene una media x (que se denomina estadística)

Una población con N elementos tiene una media  (que se denomina parámetro)

Cálculo de la media para datos no agrupados


 x
x
x
N n

El Departamento de Acción Social ofrece un estímulo especial a aquellas agrupaciones


en las que la edad promedio de los niños que asisten está por debajo de 9 años.
Si los siguientes datos corresponden a las edades de los niños que acuden de manera
regular al Centro ¿calificará éste para el estímulo?
8 5 9 10 9 12 7 12 13 7 8

x
 x 8  5  9  10  9  12  7  12  13  7  8
  9,09
n 11
No calificará porque la edad promedio es mayor de 9 nueve años
Cálculo de la media para datos agrupados
Edad de los asistentes al Plan Salud, Club XX, 2013

x x .f i i
Edad xi fi fri Fi Fri
n
[47, 52) 49,5 4 0,029 4 0,029
mi marca de clase [52, 57) 54,5 9 0,066 13 0,095
fi frecuencia absoluta [57, 62) 59,5 13 0,096 26 0,191
n cantidad de datos [62, 67) 64,5 42 0,309 68 0,5
xi fi mi.fi [67, 72) 69,5 39 0,287 107 0,787
49,5 4 198 [72, 77) 74,5 20 0,147 127 0,934
54,5 9 490,5 [77, 82) 79,5 9 0,066 136 1
59,5 13 773,5
64,5 42 2709
69,5 39 2710,5
9087/136 =66,816
74,5 20 1490
79,5 9 715,5
Suma 9087 La edad promedio de los residentes del
complejo XX es de 66,816 años
Media 66,816
VENTAJAS Y DESVENTAJAS DE LA MEDIA

Se trata de un concepto familiar e intuitivamente claro

Cada conjunto de datos tiene una media y es única

Es útil para llevar a cabo procedimientos estadísticos como la comparación


de medias de varios conjuntos de datos. En estadística inferencial es la
medida de tendencia central que tiene mejores propiedades

Aunque la media es confiable en el sentido de que toma en cuenta todos


los valores del conjunto de datos, puede verse afectada por valores extremos
que no son representativos del resto de los datos.
La media puede malinterpretarse si los datos no forman un conjunto
homogéneo.

No se puede calcular la media si la distribución de frecuencias tiene


clases abiertas
COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA
Las distribuciones simétricas tienen el mismo valor para la media,
la mediana y la moda.
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
distribución, la mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x

En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está
a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir,

x < Me < Mo
Cuando la población tiene una distribución sesgada, con frecuencia la
mediana resulta ser la mejor medida de posición, debido a que está siempre
entre la media y la moda. La mediana no se ve altamente influida por la
frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.

La selección de la media, la mediana o la moda, depende de la aplicación.


Por ejemplo, se habla del salario promedio (media); el precio mediano de una casa
nueva puede ser una estadística más útil para personas que se mudan a un nuevo
vecindario (si hay una o dos crestas que distorsionan la media). Y mientras que la
familia promedio conste de 1,7 niños, tiene más sentido para los diseñadores de
automóviles pensar en la familia modal, con dos niños.
MEDIDAS DE DISPERSIÓN
RANGO: Es la diferencia entre el mayor y el menor de los valores observados
R  x( n )  x( 1 )

El rango es fácil de entender y de encontrar, pero su utilidad como medida


de dispersión es limitada. Como sólo toma en cuenta el valor más alto y el
valor más bajo ignora la naturaleza de la variación entre todas las demás
observaciones, y se ve muy influido por los valores extremos.

Las distribuciones de extremo abierto no tienen rango.

VARIANZA Y DESVIACIÓN ESTÁNDAR

VARIANZA DE LA POBLACIÓN: Es el promedio de las distancias al cuadrado


que van de las observaciones a la media
 x    
2
x2
 2
   2
N N
2 : Varianza de la población x : Elemento u observación

 Media de la población N : Número total de elementos de la población


DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN: Es la raíz cuadrada de la varianza

  x   2
 x2
   2
N N
Aplicación de la desviación estándar poblacional

Para curvas cualesquiera, el teorema de Chebyshev


el 75% de los valores caen dentro de 2 desviaciones estándar a partir de la media

al menos el 89% de los valores caen dentro de 3 desviaciones estándar a partir de la


media
Para curvas simétricas. con forma de campana (regla empírica):

x  1 x  2 x  3
VARIANZA Y DESVIACIÓN ESTÁNDAR MUESTRAL

DATOS SIN AGRUPAR DATOS AGRUPADOS

VARIANZA MUESTRAL:

 x  x 
2
x 2
n.x
2
s 2
  (x  x ). f i
i
s 2
  
n 1 n 1 n 1 n 1
s2 : Varianza de la muestra xi marca de clase
x : Elemento u observación fi frecuencia absoluta
x Media de la muestra
n Número de elementos de la muestra

DESVIACIÓN ESTÁNDAR MUESTRAL: DATOS AGRUPADOS

 x  x 
2
 x2 (x
2

s s  2
 
n.x  x ). f i
n 1 n 1 n 1 s i

n 1
COEFICIENTE DE VARIACIÓN: es una medida relativa de dispersión que
expresa a la desviación estándar como
un porcentaje de la media
 s
CV  .100% en la población CV  .100% en la muestra
 x

Se lo utiliza en la comparación de variación de dos o más grupos.


Ejemplo: Se pretende comparar el desempeño en ventas de 3 atletas. Los resultados
siguientes dan los promedios de puntajes obtenidos en los cinco años pasados por la
concreción de los objetivos
A 88 68 89 92 103
B 76 88 90 86 79
C 104 88 118 88 123
El desempeño de C
parece ser mejor si
analizamos la media,
pero hay que tener en
cuenta que también tiene
la mayor variabilidad en
la concreción de los
objetivos.
Vemos que el atleta C tiene la mayor variabilidad,
mientras que el B tiene la menor.

También podría gustarte