M3L2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

Mediana, moda y rango

1. Mediana
La mediana es otro valor importante entre los valores de posición. A diferencia de la media
aritmética, los valores de las observaciones no la determinan. En el caso de la mediana, lo
relevante es el ordenamiento (generalmente) de menor a mayor. La mediana es el valor que se
encuentra en el centro de una secuencia ordenada de datos. Es importante respetar el
ordenamiento de los datos: de mayor a menor, o de menor a mayor.

A continuación se presenta cómo se realiza el cálculo de la mediana.

Serie simple, sin agrupamiento de datos


De acuerdo con las observaciones ordenadas, la mediana es el valor central si el número de
observaciones es impar. Para calcular este valor central se tendrá en cuenta la posición de la
mediana. El cálculo se realiza de la siguiente manera.

Fórmula (1)

El valor de la mediana es el promedio de los dos valores centrales si el número de observaciones


es par. En ese caso, el cálculo es el siguiente.

Fórmula (2)

Si las observaciones de un grupo de datos son las siguientes (ordenadas de menor a mayor): 2,
5, 7, 8, 9, entonces la mediana será 7; Me = 7. Si el grupo de datos (ordenados de menor a
mayor) es: 2, 5, 6, 7, 8, 9, entonces la mediana será igual a 6,5; Me = (6 + 7) / 2=6,5; Me = 6,5.

Con agrupamiento de datos


Serie de frecuencias

La mediana de una serie de frecuencias es aquella que contiene la frecuencia acumulada = n/2, o
la inmediatamente superior.

A continuación, se presenta el ejemplo de Corcho S.A. y la lista de horas trabajadas por los
empleados de la empresa. Se observa que la frecuencia acumulada que contiene la mediana es
21, por lo tanto, Me = 163.
Tabla 1: Datos de los trabajadores de Corcho S.A. agrupados en frecuencias

X f Xf f’
150 2 300 2
154 1 154 3
155 1 155 4
156 1 156 5
156 1 156 6
157 2 314 8
158 3 474 11
159 2 318 13
160 5 800 18
161 1 161 19
163 2 326 21
164 5 820 26
165 3 495 29
166 2 332 31
167 3 501 34
168 1 168 35
169 2 338 37
170 2 340 39
171 1 171 40
40 6479

Fuente: elaboración propia.


¿Cómo se obtuvo el cálculo de la mediana en este agrupamiento de datos de una serie de
frecuencias?

N = 40, entonces:

n/2 es igual a 20. La frecuencia que contiene a esa observación es 21 y muestra que x = 163. Por
lo tanto, Me ≈ 163. En este caso la frecuencia acumulada no coincide exactamente con n/2. Por
esta razón se considera el valor inmediato siguiente.

​Intervalo de clase

Con un agrupamiento de datos, el procedimiento es reconocer los intervalos que incluyen la


frecuencia acumulada n/2. En la tabla que muestra los valores de Corcho S.A., se identifica la
frecuencia acumulada 20 en el tercer intervalo. Por esta razón la mediana está contenida en ese
intervalo que corresponde a la frecuencia 26.
Tabla 2: Datos de los trabajadores de Corcho S.A. agrupados en intervalos de clase

y1 fi yim fi- yim


(150,154) 3 152 456
(155,159) 10 157 1570
(160,164) 13 162 2106
(165,169) 11 167 1837
(170,174) 3 172 516
N = 40 6585 = Σfi-yim

Fuente: elaboración propia.

En la tabla 2 se puede observar que el intervalo [160,164] es el que contiene la mediana.


Entonces:

n/2 = 40/2 = 20 → f’=26;

160 < Me < 164 → Me ~ 162.

El valor obtenido a través de este procedimiento es aproximado, al igual que lo que ocurre con la
media aritmética en intervalos de clase. Sin embargo, este valor responde a los valores con los
que se realizan los cálculos. Entonces, en el caso ejemplificado, la lectura de la mediana es la
siguiente: la mitad de los trabajadores cumplieron menos de 162 horas, mientras que la otra mitad
sobrepasaron las 162 horas.

Características de la mediana

La mediana se puede calcular sobre todo conjunto de escala medible (variables numéricas),
y se puede obtener para datos dispuestos en escala ordinal (variable categórica).
Existe solo una mediana para un conjunto de datos determinado.
La mediana no se ve afectada por observaciones extremas. Por lo tanto, adquiere
importancia cuando en un conjunto de datos se presentan valores extremos.
Al calcular la mediana, se debe ignorar el hecho de que puede haber valores repetidos en
los datos. Siempre se respeta la posición y el valor obtenido.
A diferencia de la media aritmética, la mediana no tiene propiedades matemáticas
considerables que permitan usarla en otros cálculos.

2. Moda
El modo (o moda) de una distribución es el valor de la variable al que corresponde la mayor
frecuencia. Es decir, es el valor que se presenta más frecuentemente. Esta medida de posición (al
igual que la mediana) tampoco se ve afectada por valores extremos, muy pequeños o muy
grandes. Solo se utiliza con propósitos descriptivos porque varía de una muestra a otra. El valor
modal no tiene propiedades matemáticas considerables, y puede existir más de un valor modal
por conjunto de datos. Es posible incluso que no exista valor modal, independientemente de que
este conjunto esté o no agrupado.

Serie simple, sin agrupamiento de datos


En conjuntos de datos no agrupados, el valor modal Mo se obtiene fácilmente en una clasificación
ordenada de datos: es el valor que se repite más veces. En el caso de Corcho S.A., el valor de
160 y 164 se repiten la misma cantidad de veces: f = 5. Esto se puede observar en la tabla 3.
Tabla 3: Datos de los trabajadores de Corcho S.A. agrupados en frecuencias

x f Xf f’
150 2 300 2
154 1 154 3
155 1 155 4
156 1 156 5
156 1 156 6
157 2 314 8
158 3 474 11
159 2 318 13
160 5 800 18
161 1 161 19
163 2 326 21
164 5 820 26
165 3 495 29
166 2 332 31
167 3 501 34
168 1 168 35
169 2 338 37
170 2 340 39
171 1 171 40
40 6479

Fuente: elaboración propia

La distribución es bimodal porque hay dos variables con la misma frecuencia máxima.

Es necesario hacer una aclaración importante: en distribuciones de variable discreta donde


ningún valor se repite, no es posible calcular la moda porque la frecuencia de cada valor es igual
a la unidad. Esto ocurre también en distribuciones de variable continua. Sin embargo, algunas
distribuciones de variables continuas tienen métodos para calcular la moda (estos métodos
exceden el alcance de este curso).

Con agrupamiento de datos


Existe un cálculo para la moda en los intervalos de clase. Se obtiene a través de la siguiente
ecuación.
Fórmula (3)

Donde:

yi-1 = valor inferior del intervalo modal;


fi = frecuencia del intervalo modal;
fi-1 = frecuencia del intervalo i-1, es decir, el anterior al modal;
fi+1 = frecuencia del intervalo i+1, es decir, el siguiente al modal;
c = amplitud del intervalo, es decir, el valor de restar (yi-1 - yi).​​

El ejemplo de Corcho S.A. se representa en la tabla 4, de distribución en intervalos de clase. El


modo corresponde al intervalo [160, 164]. La máxima frecuencia es igual a 13. Entonces, el valor
modal Mo = 162.
Tabla 4: Datos de los trabajadores de Corcho S.A. agrupados en intervalos de clase

y1 fi yim fi- yim


(150,154) 3 152 456
(155,159) 10 157 1570
(160,164) 13 162 2106
(165,169) 11 167 1837
(170,174) 3 172 516
n=40 6585=Σfi-yim

Fuente: elaboración propia

Características de la moda
Algunos conjuntos de grupos no tienen moda: los casos en que ningún valor se repite.
Otros conjuntos de datos tienen dos valores con la misma frecuencia más alta. Entonces,
ambos valores representan la moda, y el conjunto de datos es bimodal.
En algunos casos se encuentran más de dos valores con la misma frecuencia y esta es la
más alta en todos ellos. En esos casos, todos los valores son modas, y el conjunto de datos
es multimodal.
La moda no tiene propiedades matemáticas útiles en otros cálculos.
La moda es fácil de obtener a partir de un conjunto de datos discretos. En caso de datos
continuos, es difícil que exista un valor modal estrictamente hablando. Por esta razón los
métodos para obtener dicho valor ofrecen una aproximación; muchas veces este depende
del criterio utilizado para armar la distribución.

3. Mitad de rango o rango medio


La mitad del rango, o rango medio, es otra medida de tendencia central. La mitad de rango
constituye el valor que se encuentra a la mitad, entre la puntuación más alta y la más baja, en el
conjunto original de datos.

Mitad del rango =

Mitad del rango =


De acuerdo con el ejemplo de Corcho S.A., en la tabla 3 se observa que el valor máximo es 171 y
el valor mínimo es 150. Entonces:

Mitad del rango =160,5 horas de trabajo.


“El rango medio a menudo es usado como una medición de resumen tanto por analistas
financieros como por reporteros meteorológicos, puesto que puede proporcionar una medición
adecuada, rápida y simple para caracterizar toda una serie de datos” (Jáuregui, 2016,
https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-mediana-moda-
rango-y-eje-medio/).

Características de la mitad de rango

Es fácil de calcular, y simple para usar como resumen.


Ayuda a reforzar la idea importante de que hay varias maneras de definir el centro de un
conjunto de datos.
En ocasiones, se utiliza incorrectamente en vez de la mediana. Esta confusión se reduce si
se define claramente tanto la mitad del rango como la mediana.
Es demasiado sensible a los extremos, por ese motivo se emplea con poca frecuencia.

Regla de redondeo
Cuando se calculan medidas de tendencia central, muchas veces es necesario redondear los
resultados. Por eso se utiliza la siguiente regla:

aumentar una posición decimal a las que hay en el conjunto original de datos.

Los valores de la moda son iguales a alguno (o más) de los datos originales, entonces pueden
permanecer sin redondeo.

Al aplicar esta regla, se debe redondear solo la respuesta final y no los valores intermedios que
aparecen durante los cálculos. La media de 2, 3, 5 es 3,33333…, y se redondea a 3,3: una
posición decimal más que la de los valores originales (2, 3, 5). Para el caso de 80,4 y 80,6, la
media se redondea 80,50 (una posición decimal más que la de los valores originales).

El eje medio
El rango medio se distorsiona como medición de resumen de tendencia central si se presenta una
observación extrema. En ese caso, se vuelve inapropiado. El eje medio es una medición de
resumen similar (en formato) al rango medio, que siempre es apropiada porque no se ve afectada
por observaciones extremas.

El eje medio es el promedio del primer y tercer cuartil de una serie de datos.

Eje medio =
donde:

Q1 = primer cuartil;

Q3= tercer cuartil.


“Es una medición de resumen usada para zanjar problemas potenciales introducidos por los
valores extremos de los datos” (Jáuregui, 2016, https://aprendiendoadministracion.com/medidas-
de-tendencia-central-media-mediana-moda-rango-y-eje-medio/).

Mediciones de ubicación “no central”


Existen mediciones de tendencia central y también se cuenta con algunas mediciones útiles de
ubicación “no central”. Estas sirven para resumir o describir las propiedades de grandes series de
datos numéricos, las más utilizadas son los cuartiles.

Los cuartiles son mediciones descriptivas que dividen en cuatro cuartos los datos ordenados.

El primer cuartil: Q1, es un valor tal que el 25 % de las observaciones son menores que él y el
75 % de las observaciones son mayores que él.

El segundo cuartil: Q2, es el valor que representa la mediana. Es decir, 50 % de las


observaciones son menores que ese valor y 50 % son mayores que ese valor.

El tercer cuartil: Q3, es un valor tal que el 75 % de las observaciones son menores que él y el 25
% son mayores que él.

Para aproximar los cuartiles se emplean las siguientes fórmulas de punto de posicionamiento:

Q1 = valor correspondiente a observación clasificada.

Q2 = mediana, el valor correspondiente a = observación clasificada.

Q3 = valor correspondiente a observación clasificada.

Para obtener los valores de cuartiles se siguen las siguientes reglas:

1. Cuando el punto de posicionamiento resultante es un entero, se escoge la observación


numérica particular correspondiente a ese punto.
2. Cuando el punto de posicionamiento resultante se encuentra a mitad de camino entre dos
enteros, se elige el promedio de sus valores correspondientes.

3. Cuando el punto de posicionamiento resultante no es ninguno de los casos anteriores, se


redondea al punto de posicionamiento más cercano. Se escoge el valor numérico de la
observación correspondiente.

Las mediciones de resumen como el eje medio y la mediana, que no son afectados por
mediciones extremas, se denominan mediciones resistentes.

Referencias
Jáuregui, M. (2016). Medidas de tendencia central: media, mediana, moda, rango y eje medio.
Recuperado de https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-
mediana-moda-rango-y-eje-medio/.

También podría gustarte