Capitulo 3 - Estadígrafos de Posición
Capitulo 3 - Estadígrafos de Posición
Capitulo 3 - Estadígrafos de Posición
PRÓLOGO
El presente trabajo fue realizado tomando como base las notas de las clases que
me correspondió dictar en la Universidad Mayor de San Andrés, Universidad
Católica Boliviana y en el primer Curso de Preparación y Evaluación de
Proyectos (Programa BID-ISAP-CONEPLAN-OEA - Ciudad de La Paz, 1973).
Se han incluido los temas que se consideraron más importantes, tratando de
dejar claras las ideas centrales y sus aplicaciones, sin entrar a muchas
demostraciones matemáticas, de acuerdo al objetivo perseguido. Se recomienda
a los estudiantes ampliar la lectura de cada Capítulo, al menos con uno de los
textos mencionados en la bibliografía.
Deseo resaltar la persona de Don Hugo Javier Ochoa G., Director del Curso de
Preparación y Evaluación de Proyectos, citado anteriormente, de quién surgió la
idea de realizar el presente documento. Para él, mis mejores palabras de elogio
y agradecimiento por su colaboración desinteresada, tolerancia y estímulo
constante de que fui objeto durante el tiempo que duró mi labor.
La Paz - Bolivia 1974
PRÓLOGO
A LA TERCERA EDICIÓN
La aceptación que tuvo el texto y el actual interés manifestado por contar con él,
sobre todo por estudiantes de carrera y muchos egresados, han constituido
motivos suficientes para haber emprendido la tarea de hacer las correcciones
que eran necesarias y de añadir las soluciones de ejercicios seleccionados.
La Paz - Bolivia
Agosto, 1990
CAPITULO 3
ESTADIGRAFOS DE POSICION
3.1
Tipos de Promedio
La distribución de frecuencias, tal como hemos estudiado en el capítulo anterior,
no sólo es un resumen de los datos observados, también ella muestra la forma
en que se distribuye la variable; pero es más, cada uno de los valores incluidos
en la Tabla de Distribución de Frecuencias, proporciona una información
estadística valioza. De manera que se tiene un conjunto de datos estadísticos
descriptivos, ya que cada uno de ellos nos describe la densidad de
observaciones que caen en una clase o varias clases. Sin embargo,
frecuentemente se necesita tener una sola medida que describa la naturaleza de
los datos en su conjunto, es decir, un valor de la variable simple que a su vez
sea “representativo” de todas las observaciones. Ser representativo significa,
que este refleja la tendencia de los valores individuales que están distribuidos
alrededor de cierto valor central. Es obvio que el valor más representativo para
un conjunto de valores normalmente no es el valor más pequeño ni el más
grande, sino que es un valor que está en algún punto intermedio del grupo. Por
esta razón, un valor representativo es aquél que indica una medida de tendencia
central, conocido comúnmente como promedio.
El promedio se emplea con frecuencia como mecanismo para resumir un
conjunto de datos correspondiente a una variable, sobre todo si es grande, a fin
de describir los datos estadísticos. Así por ejemplo, la edad promedio de los
estudiantes de una universidad, el salario promedio mensual de los artesanos en
una ciudad; el promedio de quintales de papa producida por hectárea, el
promedio de gastos en consumo de los trabajadores mineros, etc. Los promedios
también se utilizan para comparar una población con otra; por ejemplo, el
promedio general de calificaciones obtenidas en un colegio comparado con el
promedio de otro colegio; comparar los rendimientos promedios de unidades
producidas por distintas fábricas, etc.
Un promedio se dice también que es una medida de posición, en razón de que
las formas en que están distribuidas las series estadísticas pueden ser iguales,
diferenciándose únicamente en el valor promedio, como se verá en las secciones
que siguen.
Los estadígrafos de tendencia central más utilizados son: la Media Aritmética, la
Media Geométrica, la Media Armónica y la Media Cuadrática, Se incluyen
también en esta categoría a la Mediana y la Moda, que tienen su característica
particular a diferencia de las cuatro primeras. Incluyen también las fractilas como
estadígrafos de posición.
3.2
Media Aritmética
La medida de tendencia central más útil y la más usada, es la “Media Aritmética”,
que algunas veces se la llama simplemente “media”.
x i
x i 1
n
Algunas veces se utilizará un “operador” que indique la operación de calcular la
media aritmética. Así, para la media aritmética, se usará la letra M, de manera
que M(X) representa la media aritmética de la variable X (que es una
característica cualquiera de la población o de una muestra); entonces,
∑ 𝑥𝑖
M(X) = 𝑥̅ = (3.1)
𝑛
x i
M (X ) i 1
=𝜇 (3.2)
N
Las fórmulas (3.1) y (3.2) se utilizan para calcular la media aritmética de una
muestra y de una poblacion, cuando se tiene la información estadística original,
es decir, cuando las observaciones de valores de una variable no se encuentran
agrupados en una tabla de distribución de frecuencias.
Ejemplo 3.1 Suponiendo que se tiene el siguiente conjunto de calificaciones que
obtuvieron 10 alumnos en una prueba de matemáticas: 3, 4, 5, 4, 6, 5, 4, 6, 7, 3.
Entonces, si X es la variable que indica las calificaciones, se tiene
n
x i
xi x2 ... x10
M (X ) x i 1
10 10
3 4 5 4 6 5 4 6 7 3 47
4,7
10 10
Luego 4,7 es la media de las calificaciones de los 10 alumnos.
En el caso de que se tenga una distribución de frecuencias absolutas, la media
aritmética se calculará, como sigue:
∑ 𝑋𝑛 𝑚
M(X) = 𝑋̅ = 1 𝑛 𝑖 𝑖 (3.3)
Ejemplo 3.2 Tomando en cuenta la información del ejemplo 3.1, pero esta vez
se tiene a los datos agrupados en una tabla, tal como sigue:
TABLA 3.1 Distribución de frecuencias de calificaciones de los 10 alumnos.
Calificación Número de alumnos Frecuencia relativa
Xi ni hi
x1 = 3 n1 = 2 h1 = 0,20
x2 = 4 n2 = 3 h2 = 0,30
x3 = 5 n3 = 2 h3 = 0,20
x4 = 6 n4 = 2 h4 = 0,20
x5 = 7 n5 = 1 h5 = 0,10
n = 10 1,00
x n i i
x1n1 x2 n2 ... x5 n5
M (X ) x i 1
10 10
3 2 4 3 5 2 6 2 7 1
10
6 12 10 12 7 47
4,7
10 10
Cuando se tiene la distribución de frecuencias relativas, el cálculo de la media,
es como sigue:
M(X) = 𝑋̅ = ∑𝑚
1 𝑋𝑖 ℎ𝑖 (3.4)
En donde
hi ni
n
=3(0,2)+4(0,3)+5(0,2)+6(0,2)+7(0,1)
= 0,6+1,2+1,0+1,2+0,7 = 4,7
Obsérvese que por los tres métodos el resultado es el mismo.
La expresión (3,3). puede también escribirse
∑𝑚
1 𝑋 𝑖 𝑛𝑖
𝑚
∑ 𝑌𝑛
M(X) = 𝑋̅ = ∑𝑚
; si la variable es Y se tiene: M(Y) = 𝑌̅ = ∑1𝑚 𝑛𝑖 𝑖
1 𝑛𝑖 1 𝑖
x
Como x
n
x nx (3.5)
Por ejemplo, si se sabe que en promedio un vendedor de loterías gana una
comisión de 35$ diarios, entonces, el distribuidor de billetes de loterías, pagará
a sus 120 vendedores, 35 x 120 = 4.200$.
Total poblacional ∑𝑁 ̅
1 𝑌𝑖 = N𝑌 (numero de habitantes de un Municipio); donde 𝑌𝑖
Como una consecuencia lógica de esta última parte tenemos que la media
aritmética de los desvíos es nula, o sea:
∑𝑛
1 𝑑𝑖 0 ∑𝑚
1 𝑑𝑖 𝑛𝑖 0
M(d) = = = 0, y para distribución de frecuencias M(d) = = = 0 (3.8)
𝑛 𝑛 𝑛 𝑛
2. Si todos los valores observados son iguales, naturalmente que su media será
el valor común. Si K representa el valor observado de todas las unidades
elementales, entonces
M (K )
K nK
K (3.9)
n n
𝑋1 +𝑋2+ . . .+ 𝑋𝑛
Demostración: M(X) = ; si 𝑋𝑖 = k para i = 1, 2, 3, . . . , n; entonces:
𝑛
𝑘+𝑘+ . . .+𝑘 𝑘(1+1+ . . .+1) 𝑘∗𝑛
M(k) = = = =k
𝑛 𝑛 𝑛
Esto es lógico. Por ejemplo, si todos los empleados de una oficina ganan 2.000
$, entonces la media de todos los empleados que trabajan es 2.000 $.
La demostración para el caso de distribución de frecuencias es la siguiente:
∑𝑚
1 𝑌 𝑖 𝑛𝑖 𝑌1 𝑛1+𝑌2 𝑛2 + . . .+𝑌𝑚 𝑛𝑚 𝑘𝑛1 +𝑘𝑛2 + . . .+𝑘𝑛𝑚 𝑘 ∑𝑚
1 𝑛𝑖 𝑘∗𝑛
M(Y) = = = = = =k
𝑛 𝑛 𝑛 𝑛 𝑛
Ejemplo. Si los salarios de los 100 trabajadores del ejemplo 3.4 se incrementan
en 5%, entonces el salario medio después del incremento resulta:
Sea Ui = 𝑌𝑖 + 0,05𝑌𝑖 = 1,05𝑌𝑖 el salario incrementado en 5% del i–esimo
trabajador, en donde k = 1,05; entonces M(1,05Y) = (1,05)(𝑌̅ ) = (1,05)(360,85)
= 378,90 $.
4. Si a los valores observados de una variable se adicionan una constante k,
entonces: M(X+K) = M(X) + k = 𝑋̅ + k.
∑𝑛
1 (𝑋𝑖+𝑘) ∑𝑛
1 𝑋𝑖 𝑘∗𝑛
Demostración: M(X+k) = = + = 𝑋̅ + k, y para distribución de
𝑛 𝑛 𝑛
∑𝑚
1 (𝑌𝑖 +𝑘)𝑛𝑖 ∑𝑚
1 𝑌 𝑖 𝑛𝑖 𝑘 ∑𝑚
1 𝑛𝑖 𝑘∗𝑛
frecuencias resulta: M(Y+k) = = + = 𝑌̅ + = 𝑌̅ + k
𝑛 𝑛 𝑛 𝑛
(3.12)
Resultado que se obtiene tomando en cuenta la definición de media aritmética:
𝑛(𝑗)
∑1 𝑋𝑗𝑖
𝑋̅(𝑗) = , y la j toma los siguientes valores: j = 1, 2, 3, . . . , r; de la cual, se
𝑛(𝑗)
(𝑗) 𝑛
tiene la siguiente igualdad: ∑1 𝑋𝑗𝑖 = 𝑛(𝑗) 𝑋̅(𝑗)
En donde 𝑋̅(𝑗) es la media de la submuestra j-ésima; 𝑛(𝑗) es el tamaño de la
submuestra j-ésima y ∑𝑟1 𝑛(𝑖) = n es el tamaño de la muestra general.
Ejemplo 3.5 La media de los salarios en una fábrica A que cuenta con 125
obreros es 875 $; y la media de los salarios de otra fábrica similar B, que tiene
53 obreros es 1.050 $. Calcular el salario medio conjunto de los trabajadores de
ambas fábricas (𝑋̅). La solución es sencilla, tomando la relación (3.12) se tiene:
(125)(875)+(53)(1.050) 165.025
M(X) = = = 927,10$
125+53 178
3.4
Media Geométrica
DEFINICIÓN 3.2 La media geométrica para datos originales, denotada por G(X)
se define como la raíz enésima del producto de n valores observados de una
variable X, o sea,
1
𝑛
G(X) = √𝑋1 ∗ 𝑋2 ∗ 𝑋3 ∗ . . .∗ 𝑋𝑛 = (𝑋1 ∗ 𝑋2 ∗ 𝑋3 ∗ . . .∗ 𝑋𝑛 )𝑛 (3.13)
cuando los datos no están agrupados. Se observa que la media geométrica
existe solo para valores positivos de 𝑋𝑖 y distintos de cero.
Si se tiene una distribución de frecuencias, entonces:
1
𝑛 𝑛𝑖 𝑛 𝑛 𝑛
G(Y) = √∏𝑚
1 𝑌𝑖 = (𝑌1 1 ∗ 𝑌2 2 ∗. . .∗ 𝑌𝑚𝑚 )n (3.14)
de este resultado, además restando uno (1) y multiplicando por 100 se obtiene
la razón o tasa media de incremento decenal del número de habitantes de esa
ciudad; o sea, G (X) = 1,20112, y la razón de incremento decenal resulta: r =
(𝐺 (𝑋) − 1)*100 = 20,112% por década.
TABLA 3.4 Cálculo de la media geométrica, el factor de expansión y el
crecimiento de la población de cierta ciudad para el periodo 1920 - 1970
No. de habitantes Valor relativo
Años log 𝑋𝑖 No. de habitantes estimado
observado 𝑋𝑖
1920 100.000 100.000
1930 (100.000)(1,20112) = 120.112
1940 (120.112)(1,20112) = 144.269
1950 (144.269)(1,20112) = 173.284
1960 (173.284)(1,20112) = 208.121
1970 250.000 2,5 0,39794 (208.121)(1,20112) ≅ 250.000
Totales 0,39794
Utilizando esa función geométrica y los datos del ejemplo 3.7 referido al número
de habitantes de una ciudad, calcular la tasa media decenal de crecimiento a
través de la media geométrica: 250.000 = 100.000(1 + 𝑟)5. Primero se
intercambian los lados, ya que en el lado derecho se encuentra la incógnita (r);
250.000
100.000(1 + 𝑟)5 = 250.000; (1 + 𝑟)5 = 100.000
; aplicando la raíz quinta a ambos
5
lados de la igualdad anterior, se tiene: (1 + 𝑟) = √2,5 ; de donde se obtiene el
valor de (1 + 𝑟) = 1,20112, resultado calculado con la media geométrica en la
Tabla 3.4; la tasa media decenal en este caso se calcula como sigue: (1,20112
– 1)*100 y resulta r = 20,112%. Este es el “incremento medio decenal” del
número de habitantes de la citada ciudad durante el periodo 1920 – 1970.
Si el objetivo fuera obtener la “tasa media anual”, el cálculo es exactamente
igual, solo se cambia el valor de n; el cual, en vez de 5 es igual a 50; o sea:
(1 + 𝑟) = 50√2,5 ; de donde se obtiene el valor de (1 + 𝑟) = 1,01849; la tasa media
anual en este caso resulta: (1,01849 – 1)*100 que arroja aproximadamente r =
1,85%. Este es el “incremento medio anual” del número de habitantes de la
citada ciudad durante el periodo 1920 – 1970.
Media Armónica
DEFINICIÓN 3-3 La media armónica denotada por H de una serie de valores
observados xl, x2 ,... xn, se define como el recíproco de la media aritmética de los
recíprocos de esos valores observados. Así, para datos sin agrupar, se tiene:
1 𝑛
H(X) = 1 1 1 = 1 (3.17)
𝑋1 + 𝑋2 + . . . + 𝑋𝑛 ∑𝑛
1 𝑋𝑖
𝑛
H X
10 10
4,36
2 3 2 2 1 2,293
3 4 5 6 7
De la misma manera que la media aritmética y la media geométrica, la media
armónica es también afectada por los valores de cada elemento observado. La
media aritmética es la más afectada por los valores extremos que la media
geométrica, y esta a su vez más afectada que la media armónica. Las
magnitudes de las tres diferentes medidas para los mismos datos, tienen la
siguiente relación:
M(X) > G (X) > H (X)
Si observamos los resultados de los ejemplos 3.2, 3.6 y 3.8, efectivamente,
M (X) = 4,7 > G (X) = 4,53 > H(X) = 4,36
La media armónica es útil para promediar principalmente razones. Es el caso en
que se trata de promediar velocidades y tiempos medios de trabajo.
Para la aplicación de la media armónica es posible utilizar la siguiente regla
general. Si entre dos variables Y y X, existe una relación de dependencia; de las
cuales, una es la variable dependiente (Y) y la otra es la variable independiente
(X); o sea, Y = f(X), entonces.
CASO I; Si Y varia y X permanece fija entonces se calcula la media aritmética
de Y, esta media es la correcta.
CASO II: Si X varia y Y permanece fija entonces se calcula la media armónica
de X.
Ejemplo 3.9 Durante cuatro años sucesivos un industrial compró fueloil para una
caldera a 20, 22, 25 y 30 bolivianos (promedios) por galón. Hallar el precio medio
por galón para el periodo de esos cuatro años, cuando: a) Compra igual cantidad
de fueloil por año, b) Cada año gasta igual monto de dinero.
Solución.-
La relación es: “bolivianos por galón”; es decir, Monto gastado = f(cantidad de
fueloil adquirida);
a) La cantidad anual es fija y varía el monto anual por la variación del precio;
20+22+25+30 97
por lo que, se utiliza la media aritmética: 𝑌̅ = = =24,25 Bs/galón.
4 4
Comprobación:
Comprobación a) Comprobación b)
Precio
Año Cantidad Gasto Gasto anual Cantidad
medio
adquirida (Gls.) anual (Bs.) (Bs.) adquirida (Gls.)
Bs./Gln.
1 20 1.000 20.000 100.000 5.000,00
2 22 1.000 22.000 100.000 4.545,45
3 25 1.000 25.000 100.000 4.000,00
4 30 1.000 30.000 100.000 3.333,33
TOT 97 4.000 97.000 400.000 16.878,79
Utilizando los datos de la primera parte del cuadro anterior se verifica que la
media aritmética es el promedio correcto; o sea:
𝑀𝑜𝑛𝑡𝑜 𝑇𝑜𝑡𝑎𝑙 𝐺𝑎𝑠𝑡𝑎𝑑𝑜 𝑒𝑛 𝑙𝑜𝑠 4 𝑎ñ𝑜𝑠 97.000
= = 24,25 Bs./Galón.
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝐴𝑑𝑞𝑢𝑖𝑟𝑖𝑑𝑎 𝑒𝑛 𝑙𝑜𝑠 4 𝑎ñ𝑜𝑠 4.000
Bs/galón.
Comprobación:
Utilizando los datos de la segunda parte del cuadro anterior se verifica que la
media armónica es la media correcta; o sea:
𝑀𝑜𝑛𝑡𝑜 𝑇𝑜𝑡𝑎𝑙 𝐺𝑎𝑠𝑡𝑎𝑑𝑜 𝑒𝑛 𝑙𝑜𝑠 4 𝑎ñ𝑜𝑠 400.000 𝐵𝑠.
= = 23,698384 Bs./Galón.
𝐶𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑇𝑜𝑡𝑎𝑙 𝐴𝑑𝑞𝑢𝑖𝑟𝑖𝑑𝑎 𝑒𝑛 𝑙𝑜𝑠 4 𝑎ñ𝑜𝑠 16.878,79 𝑔𝑎𝑙𝑜𝑛𝑒𝑠
ESTADISTICA I 03-09-2022
Ejemplo 3.10 Una fábrica de muebles de madera, designo a cinco de sus
trabajadores para completar una orden de 200 sillas de un cierto tipo. Las
razones de productividad de los cinco trabajadores están dadas en la Tabla 3.5
Se trata de encontrar el promedio de horas por silla (tiempo medio por silla) para
el grupo de trabajadores.
TABLA 3.5
Trabajador Tiempo de Producción
A 5 horas por silla
B 8 horas por silla
C 6 horas por silla
D 12 horas por silla
E 4 horas por silla
H X
5 600
6,0606 horas por silla
1 1 1 1 1 24 15 20 10 30
5 8 6 12 4
Este resultado es correcto solamente si se supone que cada uno de los obreros
ha trabajado el mismo número de horas, o sea, 6,0606 x 200 = 1.212,12 horas
1.212,12
(requeridas para completar la orden), luego, 242,42 horas por
5
trabajador.
Comprobación:
5 5
= 0,209 = 23,9
0,1+0,05+0,033+0,025+0.001
3.6
Media Cuadrática
DEFINICIÓN 3.4 La media cuadrática de n valores observados se define como
la raíz cuadrada de la media aritmética de los cuadrados de esas observaciones.
Para datos sin agrupar, se tiene
n
x 2
i
M c ( x) i 1
(3.20)
n
y para datos agrupados:
∑𝑚 2
1 𝑌𝑖 𝑛𝑖
𝑀𝑐 (𝑌) = √ (3.21)
𝑛
Como ejemplo, se tienen los siguientes valores observados: 40, 50, 80, 20, 70,
20, 30. Previamente se los ordena, o sea, 20, 20, 30, 40, 50, 70, 80; luego, la
mediana es 𝑀𝑒 = 𝑋(7+1) = 𝑋(4) = 40, ya que antes de 40 hay 3 observaciones,
2
Ejemplo 3.11 Supongamos que en las inmediaciones de una carretera hay siete
poblaciones, cuyas distancias en kilómetros son las siguientes:
Poblaciones: P0 P1 P2 P3 P4 P5 P6 P7
Distancias: 10 32 30 22 36 6 14
Por ejemplo, para la población P3, la suma es 314 Kms., para la población P5
es 328 kms. La siguiente Tabla muestra estos cómputos:
TABLA 3.7
Calificación Frecuencias Frec. Absolutas
𝑋𝑖 Absolutas Acumuladas
ni 𝑁𝑖
10 4 4
20 6 10
30=Xj-1 11 21=Nj-1
40=Xj= 𝑀𝑒 12 33=Nj
50 8 41
60 7 48
70 2 50
Totales 50
n
Vemos que 25 es un valor que está comprendido entre 21 y 33 de las
2
frecuencias acumuladas (𝑁𝑖 ), es decir 21 < 25 < 33 (lo que equivale en símbolos
n
a N j 1 Nj)
2
n
Entonces, como 25 > 21, o sea N j 1 , por el inciso a) de la regla (3.22), se
2
tiene Me = 𝑥𝑗 es decir, Me = 40
𝑁𝑗 − 𝑁𝑗−1 = 𝑛𝑗
𝑛
− 𝑁𝑗−1 𝑛𝑗
2
Se tiene: ′ = ; de donde, se obtiene la ecuación del inciso i) para el
𝑀𝑒 − 𝑌𝑗−1 𝑐𝑗
Cuadro 8
Salario semanal Número de Acumulación del
(Intervalo de clase) obreros número de obreros
′
𝑌𝑖−1 − 𝑌𝑖′ 𝑛𝑖 𝑁𝑖
280 – 295 4 4
295 – 310 5 9
310 – 325 10 19
325 – 340 9 28
340 – 355 13 41 = Nj-1
Clase
355 – 370 15 = nj 56 = Nj
mediana
370 – 385 18 74
385 – 400 12 86
400 – 415 8 94
415 – 430 6 100
TOTALES 100
encuentra entre 41 y 56; o sea, la mediana se encuentra entre 355 y 370; la cual,
es la clase j-esima; entonces Nj = 56, Nj-1 = 41, 𝑛𝑗 = 15 y 𝑐𝑗 = 15; luego, el valor
50−41
de la mediana resulta: Me = 355 + 15*( ) = 355 + 9 = 364$. Finalmente el
15
Como hemos visto, cuando se trata de encontrar un valor que divida al número
total de observaciones en dos partes iguales, la medida adecuada para este fin
es la mediana. Pero otras veces puede uno estar interesado en hallar un valor
que esté situado, ya no al centro del número de observaciones, sino por ejemplo,
en la primera cuarta parte o en la tercera cuarta parte. Las medidas para este
fin, se denominan cuartiles. El método para hallar un cuartil, es completamente
n 3n
análogo al caso de la mediana; o sea utilizando para el primer cuartil, y
4 4
para el tercer cuartil. Podemos observar, de inmediato, que el segundo cuartil,
2n n
lógicamente, coincide con la mediana, puesto que .
4 2
Si los porcentajes de división fueran del 10%, entonces las medidas que separen
el número de observaciones en décimas de parte, se llaman deciles. En este
n
caso también, se calcula en forma idéntica al de la Me, con tal que se use
10
2n
para el primer decil, para el segundo decil, etc.
10
n
Finalmente, los centiles se interpretan en forma análoga, utilizando Esto es
100
lo que se llama también percentiles o porcentiles.
𝑟 𝑟
Definición.- Sea la fracción; es decir 0 < <1, luego una fractila es un valor
𝑆 𝑆
𝑟 𝑟
de la variable que supera a no más de de las observaciones (𝑆 ∗ 𝑛) y es
𝑆
𝑟
superado por no más de (1 − 𝑆) de las restantes observaciones, una vez
d) Si S = 100 y r = 1, 2, ... , 25, ... , 50, ... , 75, … , 80, ... ,100; se obtienen las
Centilas; es decir: 𝐶 𝑟 = 𝑋[𝑟(𝑛+1)]
100 100
Ejemplo. La siguiente información corresponde al número de personas de una
muestra de 10 hogares, seleccionados de un determinado Municipio; calcular
algunas fractilas a fin de interpretar sus resultados: 4, 6, 7, 3, 5, 2, 6, 4, 8, 5.
En primer lugar se ordenan las observaciones en forma ascendente: 2, 3, 4, 4,
5, 5, 6, 6, 7, 8
𝑄1 = 𝑋[1(10+1)] = 𝑋(2,75) = 𝑋(2) + (𝑋(3) − 𝑋(2) )(0,75) = 3 + (4 − 3)0,75 = 3,75 ≅ 4
4 4
personas.
No más de un cuarto de los hogares de la muestra tienen hasta 4 personas
(tienen entre 2 y 4 personas), y no más de tres cuartos de los restantes hogares
de la muestra tienen más de 4 personas (tienen entre 5 y 8 personas).
𝑄3 = 𝑋[3(10+1)] = 𝑋(8,25) = 𝑋(8) +(𝑋(9) − 𝑋(8))(0,25) = 6 + (7 − 6)*0,25 = 6,25 ≅ 6
4 4
personas. No más del 80% de los hogares de la muestra tienen hasta 7 personas
(tienen entre 2 y 7 personas), y no más del 20% de los restantes hogares de la
muestra tienen más de 7 personas (tienen 8 personas).
𝑛𝑟 𝑌𝑗−1 + 𝑌𝑗
b) Si = 𝑁𝑗−1 , entonces la r-esima fractila está dada por: 𝐹𝑟 =
𝑆 𝑆 2
225−165
5( ) = 44 años; o sea, no más de tres cuartos de los trabajadores más
75
𝑛𝑟 300∗3
b) = = 180. Esta fracción de frecuencias absolutas se encuentra entre
𝑆 5
180−165
165 y 240 frecuencias absolutas acumuladas; por lo que, 𝑞3 = 40 + 5( )=
5 75
41 años; o sea, no más de tres quintos de los trabajadores más jóvenes tienen
hasta 41 años de edad, y no más de dos quintos de los trabajadores tienen más
de 41 años de edad.
𝑛𝑟 300∗7
c) = = 210. Esta fracción de frecuencias absolutas se encuentra entre
𝑆 10
210−165
165 y 240 frecuencias absolutas acumuladas; por lo que, 𝐷 7 = 40 + 5( )=
10 75
43 años; o sea, no más de siete décimas de los trabajadores más jóvenes tienen
hasta 43 años de edad, y no más de tres décimas de los trabajadores tienen más
de 43 años de edad.
𝑛𝑟 300∗60
d) = = 180. Esta fracción de frecuencias absolutas se encuentra entre
𝑆 100
180−165
165 y 240 frecuencias absolutas acumuladas; por lo que, 𝐶 60 = 40 + 5( )
100 75
= 41 años; o sea, no más del sesenta por ciento de los trabajadores más jóvenes
tienen hasta 41 años de edad, y no más del cuarenta por ciento de los
trabajadores más viejos tienen más de 41 años de edad.
𝑛𝑟 300∗12
e) = = 36. Esta fracción de frecuencias absolutas se encuentra entre 15
𝑆 100
36−15
y 75 frecuencias absolutas acumuladas; por lo que, 𝐶 12 = 30 + 5( ) = 31,75
100 60
años; o sea, no más del 12% de los trabajadores más jóvenes tienen hasta 31,75
años de edad, y no más del 88% de los restantes trabajadores tienen más de
31,75 años de edad. La tabla de distribución de frecuencias para ese 12% de
trabajadores es la que se presenta más abajo; de la cual, se calcula la media
1.046,4
aritmética: 𝑌̅ 12 = = 29,1 años. Luego, la edad media del 12% de
100 36
Marcas de Frecuencias
Edad en Número de
absolutas
años clase trabajadores (𝑌𝑖 )(𝑛𝑖 )
′ acumuladas
(𝑌𝑖−1 -𝑌𝑖′ ) (𝑌𝑖 ) (𝑛𝑖 )
(𝑁𝑖 )
20 – 25 22,5 3 3 67,5
25 – 30 27,5 12 15 330,0
30 – 31,75 30,9 21 36 648,9
TOTALES 36 1.046,4
𝑟 𝑌𝑗−1 + 𝑌𝑗
ii) Si = 𝐻𝑗−1 , la r-esima fractila está dada por: 𝐹𝑟 =
𝑆 𝑆 2
Solución
1
a) En vista de que = 𝐻𝑗−1; es decir, 0,25 = 0,25 entonces 𝑄1 = 35 años; o sea
4 4
44 años; o sea que, no más de tres cuartos de las personas tienen edades
comprendidas entre 20 y 44 años, y no más de un cuarto de las restantes
personas tienen edades con más de 44 hasta 70 años.
3 0,60−0,55
b) En vista de que > 𝐻𝑗−1 ; es decir, 0,60>0,55 entonces 𝑞3 = 40 + 5( )
5 5 0,25
= 41 años; o sea que, no más de tres quintos de las personas tienen edades
comprendidas entre 20 y 41 años, y no más de dos quintos de las restantes
personas tienen edades con más de 41 años hasta 70 años.
7 0,70−0,55
c) Debido a que > 𝐻𝑗−1 ; o sea, 0,70>0,55 entonces 𝐷 7 = 40 + 5( )=
10 10 0,25
43 años; o sea que, no más de siete décimas de las personas tienen edades
comprendidas entre 20 y 43 años, y no más de tres décimas de las restantes
personas tienen edades más de 43 hasta 70 años.
60 0,60−0,55
d) Debido a que 100 > 𝐻𝑗−1 ; o sea, 0,60>0,55 entonces 𝐶 60 = 40 + 5( )=
100 0,25
41 años; o sea que, no más del 60% de las personas tienen edades
comprendidas entre 20 y 41 años, y no más del 40% de las restantes personas
tienen edades con más de 41 hasta 70 años.
𝑟 12
e) = 100 = 0,12. Esta fracción de frecuencias relativas se encuentra entre 0,05
𝑆
0,12−0,05
y 0,25 frecuencias relativas acumuladas; por lo que, 𝐶 12 = 30 + 5( )=
100 0,20
31,75 años; o sea, no más del 12% de los trabajadores más jóvenes tienen hasta
31,75 años de edad, y no más del 88% de los restantes trabajadores tienen más
de 31,75 hasta 70 años de edad.
La tabla de distribución de frecuencias para ese 12% de trabajadores es la que
3,488
se presenta más abajo; de la cual, se calcula la media aritmética: 𝑌̅ 12 = =
100 0,12
29,1 años. Luego, la edad media del 12% de trabajadores más jóvenes es
aproximadamente 29,1 años.
Frecuencias
Edad en Marcas de Frecuencias
relativas
años clase relativas (𝑌𝑖 )(ℎ𝑖 )
′ acumuladas
(𝑌𝑖−1 -𝑌𝑖′ ) (𝑌𝑖 ) (ℎ𝑖 )
(𝐻𝑖 )
20 – 25 22,5 0,01 0,01 0,225
25 – 30 27,5 0,04 0,05 1,100
30 – 31,75 30,9 0,07 0,12 2,163
TOTALES 0,12 3,488
𝑟 60
f) 𝑆 = 100 = 0,60. Esta fracción de frecuencias relativas se encuentra entre 0,55 y
0,60−0,55
0,80 frecuencias relativas acumuladas; por lo que, 𝐶 60 = 40 + 5( ) = 41
100 0,25
años; o sea, no más del 60% de los trabajadores más jóvenes tienen hasta 41
años de edad, y no más del 40% de los restantes trabajadores tienen más de 41
hasta 70 años de edad. La tabla de distribución de frecuencias para ese 40% de
trabajadores es la que se presenta más abajo; de la cual, se calcula la media
19,750
aritmética: 𝑌̅ 40 = = 49,4 años. Luego, la edad media del 40% de
100 0,40
Frecuencias
Edad en Marcas de Frecuencias
relativas
años clase relativas (𝑌𝑖 )(ℎ𝑖 )
′ acumuladas
(𝑌𝑖−1 -𝑌𝑖′ ) (𝑌𝑖 ) (ℎ𝑖 )
(𝐻𝑖∗)
41 – 45 43,0 0,20 0,40 8,600
45 – 50 47,5 0,05 0,20 2,375
50 – 55 52,5 0,05 0,15 2,625
55 – 60 57,5 0,04 0,10 2,300
60 – 65 62,5 0,04 0,06 2,500
65 – 70 67,5 0.02 0,02 1,350
TOTALES - 0,40 - 19,750
3.9
Moda
Otra medida que no necesariamente es de tendencia central, es la moda o modo
o valor modal, que se define como sigue:
DEFINICIÓN 3.6 La moda, denotada por Mo es un valor distinto observado de
una serie estadística que se repite más veces.
De esta manera, el valor modal es el valor más frecuente en una serie de datos.
Es evidente que la moda no siempre estará en el centro, sino que, como ocurre
a menudo, puede ser un valor extremo.
La moda para datos no agrupados de unos pocos valores puede obtenerse por
simple inspección, así por ejemplo, si tenemos las series:
2, 2, 5, 7, 9, 9, 9, 9, 11, 12: la moda es Mo = 9
16, 3, 12, 5, 8, 10, 15: no existe la moda
2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9: tiene dos modas, o sea Mo = 4 y 7
Cuando hay dos modas, se dice bimodal, y en el caso de existir más de dos se
conoce con el nombre de multimodal.
Si se tienen datos agrupados, tal que los valores de la clase son únicos, entonces
la moda, es obvio que sea la que tiene mayor frecuencia, así en el ejemplo 3.2,
la moda es 4.
Cuando se tiene una distribución de frecuencias con intervalos de clase
constante, la moda se determina por interpolación, es decir:
! 𝑑1
𝑀𝑜 = 𝑋𝑗−1 +c(𝑑 ) (3.24)
1 +𝑑2
X! j-1 = 370; d1 = 18 - 15 = 3; d2 = 18 - 12 = 6; c = 15
3
Ahora, aplicando la fórmula (3,22), se tiene: M o 370 15 375$
3 6
Si se tomara directamente la información original (Tabla 2.5), hay valores de los
ingresos que se repiten más veces que 375. Como ejemplo, el 380 se repite 7
veces, mientras que 375 solamente 5. Se deja al estudiante la interpretación y
análisis de este hecho.
3.11 Ejercicios
1. Calcular la media aritmética, la mediana y la moda, tomando la información de
los ejercicios 8, 10, 11 y 12 del Capítulo 2.
2. Calcular la media, la mediana y la moda de las siguientes distribuciones de
frecuencias. ¿Cuál es su opinión sobre los resultados?
2.1 Puntajes No. de alumnos 2.2 Salarios $ No de obreros
40 - 44 2 60 6
45 - 49 2 70 1
50 - 54 7 80 3
55 - 59 7 132 1
60 - 64 9 150 1
65 - 69 11 500 1
70 - 74 6
75 - 79 8
80 - 84 4
85 - 89 2
90 – 94 2
3. En una oficina de empleados públicos hay 35 hombres con una edad media
de 27,5 años y 15 mujeres las que, en promedio representan 22% más jóvenes.
Hallar la edad media de todos los empleados.
Solución
27,5
La edad media de las mujeres es: 𝑋̅𝑀 = 1,22 = 22,54 años, ya que la edad de los
hombres es: (1,22)(22,54) = 27,5 años; luego, la edad media de todos los
𝑛𝐻 ∗𝑋̅𝐻 +𝑛𝑀 ∗𝑋̅𝑀 35∗27,5+15∗22,54
empleados es: 𝑋̅ = = = 26,01 años.
35+15 35+15
4. Un automóvil sube a La Cumbre a 30 Kms. por hora y baja a 60 Kms. por hora.
Cuál es la velocidad media?
Solución
En este ejemplo existe una relación de dependencia entre Y (distancia) y X
(velocidad); o sea Y = f(X). La distancia es fija y la velocidad varia, por lo que se
2 2 120
debe utilizar la media armónica: H(X) = 1 1 = 2+1 = = 40 km/hora.
+ 3
30 60 60
media por km. Este resultado coincide con la media armónica, por lo que la media
armónica es el promedio correcto.
5. La distribución de ingresos de muestras de dos países se presentan en las
tablas adjuntas.
PAIS “A” PAIS “B”
Ing. anual Pob. Ing. anual por Pob.
por hab. (en remun. 𝒀𝒊 (𝒀𝒊 )(𝒏𝒊 ) hab. (en miles remun. 𝒀𝒊 (𝒀𝒊 )(𝒏𝒊 )
miles de $) (ni) de $) (ni)
8 – 10 3.000 9 27.000 6-9 1.000 7,5 7.500
10 – 12 8.000 11 88.000 9 - 12 2.000 10,5 21.000
12 – 14 4.000 13 52.000 12 - 15 5.000 13,5 67.500
14 – 16 1.000 15 15.000 15 - 18 2.000 16,5 33.000
16 – 20 400 18 7.200 18 - 21 1.500 19,5 29.250
20 – 22 100 21 2.100 21 - 24 1.000 22,5 22.500
Totales 16.500 191.300 24 - 27 400 25,5 10.200
Totales 12.500 190.950
PAIS “A” (40% DE INGRESOS ALTOS) PAIS “B” (40% DE INGRESOS ALTOS)
PAIS “A” (50% DE INGRESOS BAJOS) PAIS “B” (50% DE INGRESOS BAJOS)
Ing. Anual Ing. Anual por
Pob. Pob.
por Hab. (en 𝒀𝒊 (𝒀𝒊 )(𝒏𝒊 ) Hab. (en miles 𝒀𝒊 (𝒀𝒊 )(𝒏𝒊 )
Remun. Remun.
miles de $) de $)
8 – 10 3.000 9 27.000 6–9 1.000 7,5 7.500
10 - 11,312 5.250 10,656 55.944 9 – 12 2.000 10,5 21.000
Totales 8.250 82.944 12 - 13,95 3.250 12,975 42.168,756
Totales 6.250 70.668,75
11,725 que permite calcular la marca de clase o punto medio y el ingreso medio
89.348,2
que es 𝑌̅𝐴 = 6.600 = 13,538 miles de $ (ver tabla adjunta).
país B es: (15 − 0,06) = 14,94 que permite calcular la marca de clase o punto
96.447
medio y el ingreso medio que es 𝑌̅𝐵 = = 19,289 miles de $ (ver tabla
5.000
adjunta). Luego, el ingreso medio del país B es mucho mayor al del país A; o sea
19,289 > 13,538.
5.2.2 Calculo para el 50% de la poblacion de ingresos bajos:
Como en el caso anterior el límite superior del intervalo pertinente se determina
aplicando una regla de tres simple, que es equivalente a utilizar la 50 avo centila
correspondiente:
Para el país A se tiene: si para 8.000 frecuencias hay 2 unidades de amplitud
de clase, para 5.250 frecuencias hay X unidades de amplitud de clase; por lo que
(2)(5.250)
X= 8.000
= 1,312; luego el límite superior para el país A es: (10 + 1,312) =
11,312 que permite calcular la marca de clase o punto medio y el ingreso medio
82.944
es 𝑌̅𝐴 = 8.250 = 10,054 miles de $ (ver tabla adjunta).
país B es: (12 + 1,95) = 13,95 que permite calcular la marca de clase o punto
70.668,75
medio y el ingreso medio es 𝑌̅𝐵 = = 11,307 miles de $ (ver tabla adjunta).
6.250
Luego, el ingreso medio del país B es un poco mayor al del país A; o sea 11,307
> 10,054.
Realizada la devaluación por cada uno de los dos países en los porcentajes
señalados, los ingresos medios anuales de ambos países son aproximadamente
iguales.
∑ log 𝑋𝑖 0,08872
Valor b) log G(X) = = =
Año Incremento 𝑛 4
relativo log Xi
t anual (%) 0,02218; G(X) = 1,0524; luego, la
(Xi)
0 tasa media anual de incremento es: i
1 5 1,05 0,02119
= 5,24%.
2 6 1,06 0,02531
3 7 1,07 0,02938 c) El salario mínimo nacional se
4 3 1,03 0,01284 estima con: SMNt = 1.500(1,0524)t
Totales 0,08872
PIB Real de Bolivia a Precios de Mercado (En millones de Bs. a precios de 1990)
Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
PIB REAL 15.443 16.256 16.524 17.230 18.034 18.877 19.701 20.677 21.717 21.809 22.356 22.733 23.298 23.929
Var. Anual (%) 5,3 1,6 4,3 4,7 4,7 4,4 5,0 5,0 0,4 2,5 1,7 2,5 2,7
Índice (%)
100 105,3 107 111,6 116,8 122,2 127,6 133,9 140,6 141,2 144,8 147,2 150,9 155
1990=100
Año 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016
PIB REAL 24.928 26.030 27.279 28.524 30.278 31.294 32.586 34.281 36.037 38.487 40.588 42.560 44.369
Var. Anual (%) 4,2 4,4 4,8 4,6 6,1 3,4 4,1 5,2 5,1 6,8 5,5 4,9 4,3
Índice
161,4 168,6 176,6 184,7 196,1 202,6 211 222 233,4 249,2 262,8 275,6 287,3
(%)1990=100
Solución
a) Los resultados del inciso a) se encuentran incluidos en la tercera fila del cuadro
anterior (Var. anual (%)) que tiene dos partes; la primera parte abarca el periodo 1990
– 2005 y la segunda parte abarca el periodo 2006 – 2016.
Tasa Tasa
Valor Valor
variación variación
Año Tasa/100 relativo log(Xi) Año Tasa/100 relativo log(Xi)
anual anual
(Xi) (Xi)
(%) (%)
1990 2006 4,8 0,048 1,048 0,02036
1991 5,3 0,053 1,053 0,02243 2007 4,6 0,046 1,046 0,01953
1992 1,6 0,016 1,016 0,00689 2008 6,1 0,061 1,061 0,02572
1993 4,3 0,043 1,043 0,01828 2009 3,4 0,034 1,034 0,01452
1994 4,7 0,047 1,047 0,01995 2010 4,1 0,041 1,041 0,01745
1995 4,7 0,047 1,047 0,01995 2011 5,2 0,052 1,052 0,02202
1996 4,4 0,044 1,044 0,01870 2012 5,1 0,051 1,051 0,02160
1997 5,0 0,050 1,050 0,02119 2013 6,8 0,068 1,068 0,02857
1998 5,0 0,050 1,050 0,02119 2014 5,5 0,055 1,055 0,02325
1999 0,4 0,004 1,004 0,00173 2015 4,9 0,049 1,049 0,02078
2000 2,5 0,025 1,025 0,01072 2016 4,3 0,043 1,043 0,01828
2001 1,7 0,017 1,017 0,00732 TOT 0,23208
2002 2,5 0,025 1,025 0,01072
2003 2,7 0,027 1,027 0,01157
2004 4,2 0,042 1,042 0,01787
2005 4,4 0,044 1,044 0,01870
TOTAL 0,22722
∑ log 𝑋𝑖
b) La tasa media anual de variación del primer periodo es: log G(X) = =
𝑛
0,22722
= 0,015148; G(X) = 1,03549; o sea, la tasa media anual de crecimiento del
15
9. Un Club de tenis tiene socios en las villas A(12%), B(15%), C(13%), D(25%),
E(9%), F(11%), G(7%) y H(8%), situadas a lo largo de una carretera. Las
distancias entre las villas son: 6 Km. de A a B; 3 Km. de B a C; 8 Km. de C a D;
7 Km. de D a E; 6 Km. de E a F; 15 Km. de F a G y 9 Km. de G a H. Dónde debe
localizarse el campo deportivo a objeto de minimizar los gastos de transporte si
todos los socios concurrirán habitualmente. Suponga que el gasto de transporte
por cada Km. es constante en toda la región.
Solución
Cuadro: Calculo de la Mediana
Villas A B C D E F G H
Distancias entre villas 0 6 3 8 7 6 15 9
Distancias Acumuladas 0 6 9 17 24 30 45 54
Proporción de socios 0.12 0.15 0.13 0.25 0,09 0.11 0.07 0.08
Prop. de socios acum. 0.12 0.27 0.40 0.65 0.74 0.85 0,92 1.00
Se debe utilizar como medida de tendencia central la Mediana, debido a que esta
medida minimiza la suma de las distancias que tienen que recorrer todos los
socios del Club de Tenis, o sea la mediana se calcula como sigue:
1
0.40 < 0.50 < 0.65; en símbolos 𝐻𝑗−1 < < 𝐻𝑗 entonces la Mediana es igual a:
2
hora.
Comprobación.- La distancia es fija igual a 3 km. Por otra parte, para el primer
1 1
km empleo horas, para el segundo kilometro empleo horas y para el tercer
12 10
1 37
km empleo horas. En total utilizo = 0,30833 horas; entonces:
8 120
𝑇𝑜𝑡𝑎𝑙 𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑖𝑎 𝑟𝑒𝑐𝑜𝑟𝑟𝑖𝑑𝑎 3
= 0,30833 = 9,73 kms por hora. Este resultado coincide con la
𝑇𝑜𝑡𝑎𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑒𝑚𝑝𝑙𝑒𝑎𝑑𝑜