Consulta

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

Medida de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
solo valor a un conjunto de valores. Representan un centro en torno al cual se encuentra
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda. Las medidas de dispersión en cambio miden el grado de
dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión
pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos
de medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran
ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los datos
no están en una tabla hablaremos de datos “no agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas para datos no
agrupados y luego para datos agrupados.

Medidas estadísticas en datos no agrupado


Medidas de tendencia central
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio del
universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra.
Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra
es variable puesto que diferentes muestras extraídas de la misma población tienden a
tener diferentes medias. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc.
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda
observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor
de la i-ésima observación. En este caso el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del


dato y la media:

Una propiedad interesante de la media aritmética es que la suma de las desviaciones es


cero.

Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que
ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el
50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50%
tiene valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos


valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

Moda
La moda de una distribución se define como el valor de la variable que más se repite. En
un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el
punto más alto del gráfico. Una muestra puede tener más de una moda.

Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.

Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de la
variable.

La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la


desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el
universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La
desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma)
cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores
que cambian de muestra en muestra dentro de una misma población. La varianza se
expresa en unidades de variable al cuadrado y la desviación estándar simplemente en
unidades de variable.

Fórmulas
Donde µ es el promedio de la población.
Donde Ȳ es el promedio de la muestra.

Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.

Para casos agrupados de tendencia centrar y de dispersión se utilizarán las siguientes


formulas:

Donde ni representa cada una de las frecuencias correspondientes a los diferentes valores


de Yi.

Moda en datos agrupados


Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga
la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que
este valor de variable corresponde a la mayor frecuencia absoluta =16.

Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y


desviación estándar en datos agrupados con intervalos.
Varianza en datos agrupados
Para el cálculo de varianza en datos agrupados se utiliza la fórmula

Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca de clase
(Yc), de tal modo que la fórmula queda:

Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo

Yc= (Límite inferior del intervalo + limite superior del intervalo)/2.


Los percentiles son valores de la variable que dividen la distribución en 100 partes iguales.
De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa que el 80% de
los casos tiene edad igual o inferior a 35 años.

Su procedimiento de cálculo es relativamente simple en datos agrupados sin intervalos.

El percentil j (Pj) corresponde al valor de la variable (Yi ) cuya frecuencia acumulada


supera inmediatamente al “j” % de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el valor 4.
Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado significa que un
80% de las madres estudiadas han tenido 4 partos o menos.

Si los datos están agrupados en una tabla con intervalos, el procedimiento es levemente
más complejo ya que se hace necesaria la aplicación de una fórmula.

Se aplica a los datos del intervalo cuya frecuencia acumulada ( Ni ) sea inmediatamente
superior al “j” % de los casos (jxn/100).

También podría gustarte