Tema Nº3 Estadisticas ESBA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

1

TEMA Nº3 MEDIDAS DE TENDENCIA CENTRAL

En la clase anterior, hicimos referencia a las medidas estadísticas, y vimos la forma de


organizar los datos en tablas de distribución de frecuencias. Cuando se cuenta con muchísimos
datos (miles), es difícil para la mente humana captar la información que ellos aportan. Por eso
es importante contar con pocos valores (medidas resumen) que de alguna manera deben
describir las características más sobresalientes del conjunto que se está analizando. En este
tema vamos a ver como se calculan esas medidas resumen y otro concepto importante, que es
la simetría de la distribución.
Una medida resumen es un número que permite tener una idea rápida de cómo son los datos;
por eso es importante exponerlas de forma clara para que sean fáciles de interpretar.

Vamos a estudiar ahora, tres “medidas resumen” y vamos a ver la forma de calcularlos.

𝑥̅ : 𝑀𝑒𝑑𝑖𝑎 𝐴𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎
Medidas de Tendencia central o de centralización: { 𝑀𝑒: 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝑀𝑜: 𝑀𝑜𝑑𝑎

**Observe y recuerde la forma de simbolizar cada una de las medidas.

*Las medidas de tendencia central o de centralización: permiten hallar un solo valor numérico
alrededor del cual los datos parecen agruparse de cierta manera, como si fuera el “centro de
gravedad” de los datos. Estas medidas son:

•Media aritmética:(𝑷𝒓𝒐𝒎𝒆𝒅𝒊𝒐) (𝑥̅ ) es un valor representativo del conjunto de datos que se


está estudiando y que caracteriza a toda una distribución. La ventaja de usar la Media
aritmética es que, en su cálculo intervienen todos los valores que se están estudiando. La
media aritmética es “única” y es el mejor de los promedios, pero, su principal inconveniente
es que a veces se ve afectada por los valores extremadamente grandes o pequeños de la
distribución (valores atípicos u outliers, que son los valores que se alejan mucho del resto de
los valores); en estos casos la media aritmética deja de ser la más representativa.

Definición: Si tenemos N datos representados por x1, x2,…….xn, la media aritmética de estos N
datos, está dada por:

∑𝒙 𝒙𝟏 + 𝒙𝟐+⋯ + 𝒙𝒏
̅=
𝒙 = (para datos no agrupados) 𝛴 : símbolo suma
𝑵 𝑵

O sea que, la media aritmética se calcula sumando todos los datos y dividiendo esa suma por la
cantidad de datos que hay en total. Al valor de la variable lo llamaremos X.

Ejemplo 1: Los siguientes datos son las edades de 10 madres que asisten a un centro de salud
en un día: 30, 43, 58, 61, 70, 42, 57, 39, 60, 55. Para calcular la media aritmética, sumamos
todos los valores y a esa suma la dividimos en el total de valores que hay, 10 en este caso.
Vemos que para calcular la media no hace falta ordenar los datos.
2

∑𝒙 30+43+58+61+70+42+57+39+60+55 515
𝑥̅ = = = = 51,5 entonces 𝑥̅ = 51,5
𝑵 10 10
Esto significa que, en promedio, la edad de las madres es de 51,5 años. Dijimos antes que la
variable “edad” es cuantitativa discreta, o sea que se menciona siempre con un nº entero,
pero vamos a dejar el resultado así, como nos dio, porque necesitamos después hacer otras
mediciones.
*Vamos a ver ahora, otro de los promedios llamado MEDIANA (Me).

•Mediana: Es el valor central de la variable, es decir, el valor que divide a la distribución


ordenada en forma creciente, en dos grupos porcentualmente iguales. Es muy importante
“ordenar los valores” de menor a mayor para calcular la mediana. NO SE PUEDE CALCULAR LA
MEDIANA, SI LOS DATOS NO ESTAN ORDENADOS.
Cuando los datos son pocos, para calcular la mediana, procederemos así:

- mediana en datos no agrupados (todos los datos tiene frecuencia absoluta igual a 1).
- se ordenan los datos en forma ascendente.
- si el nº de datos es par, hay dos términos centrales; el valor de la mediana estará dado por:

𝑿𝑵 + 𝑿𝑵
+𝟏 𝑵 𝑵
𝟐 𝟐
Me = donde y +1 indican la posición de los términos.
𝟐 𝟐 𝟐

Ejemplo 2: Si los datos son: 3, 7, 8, 11, 12, 13, 14, 20 (ya ordenados crecientemente)
N = 8 ⇒ N/2 = 8/2 = 4 es la posición del 1° término (4° lugar) y el 5° será el que sigue.

3 7 8 11 12 13 14 20

𝟏𝟏+𝟏𝟐 𝟐𝟑
4° = 11 y 5° =12 Me = 𝟐
= 𝟐 = 11,5 Me = 11,5

-si el nº de datos es impar, el valor de la mediana es el valor del centro.

𝐍+𝟏 𝑵+𝟏
Me = 𝟐
donde 𝟐
es la posición de la mediana.

Ejemplo 3: Si los datos son ahora: 3, 7, 8, 11, 12, 13, 14 (N =7) la mediana será el n° que
𝟕+𝟏 𝟖
ocupe la posición 𝟐
= = 𝟒 (4° lugar).
𝟒

3 7 8 11 12 13 14 Me = 11
Observe que en ambos ejemplos, a ambos lados de los valores sombreados, queda el mismo
nº de datos.

Otra medida de tendencia central es la MODA. (Mo).

•Moda: es el valor de la variable que tiene mayor frecuencia absoluta.


* Si todos los valores de la variable son diferentes, no hay moda.
* En una distribución pueden existir dos o más modas.
3

En los ejemplos vistos anteriormente, no hay moda, porque todos los valores de la variable
están una sola vez. Por ejemplo en la distribución: 3 3 5 3 2 2 1 1 4 3 la Moda sería igual
a 3, ya que es el valor que tiene mayor frecuencia absoluta, porque aparece 4 veces, entonces
la moda es Mo = 3
Vamos a ver ahora, que pasa cuando los datos son muchos y se repiten algunos de ellos o
todos. En este caso, se los agrupa en una tabla de frecuencias como se vio en el tema anterior.

• Media aritmética en datos agrupados en tablas de frecuencias:

∑ 𝑭. 𝒙
̅ =
𝒙 F es la frecuencia absoluta y “x” es el valor de la variable.
𝑵
En este caso, la media aritmética se calculará así: multiplicamos el valor de cada variable por su
respectiva frecuencia absoluta; sumamos todos esos productos y finalmente dividimos esa
suma por la cantidad de datos que tenemos (N).

Veamos un ejemplo: (Ej. 4) en él, están los valores de la variable “x” (1º columna) y sus
respectivas frecuencias absolutas (2º columna); Observe que el valor de N se obtuvo sumando
las Frecuencias Absolutas. Entonces vamos a agregar a la tabla, una 3º columna en la que
colocaremos los productos “x.F” porque así lo pide la formula y vamos a colocar en ella
también, el resultado de la suma de esos productos (2.1=2 3.4=12 4.2=8 5.4=20;
2+12+8+20= 42). Los reemplazamos en la fórmula y dividimos. Así obtenemos la media
aritmética para datos agrupados en frecuencias. Como verá, la fórmula es la misma que antes,
solo que ahora se multiplica el valor de la variable por su respectiva frecuencia absoluta.

Ejemplo 4:

X F x. F
∑𝑥 . 𝐹 42
2 1 2 𝑥̅ = 𝑁
= 11 = 3,81
3 4 12
4 2 8 Entonces 𝑥̅ = 3,81
5 4 20
N = 11 42

Ejemplo 5:

X F x.F
4 5 20
∑𝑥 . 𝐹 310
6 8 48 𝑥̅ = 𝑁
= 40
= 7,75
8 9 72
9 10 90 Entonces 𝑥̅ = 7,75
10 8 80
N = 40 310
4

Así calculamos la media aritmética, cuando los datos están agrupados en frecuencias, esto
quiere decir que tenemos el valor de la variable con su respectiva frecuencia absoluta.

*Mediana en datos agrupados en frecuencias:


Cuando tengamos los valores de la variable y las Frecuencias Absolutas, tendremos que
calcular las Frecuencias Acumuladas y agregarlas en una columna. Ud ya sabe cómo se hace
esto. Veamos un ejemplo, para explicar cómo se calcula la Mediana en estos casos:

Ejemplo 6: En la tabla de distribución dada a continuación, tenemos los valores de la variable y


sus respectivas Frecuencias absolutas. Nosotros agregaremos la columna de las frecuencias
acumuladas. Siempre, para calcular la mediana, necesitaré las Frecuencias acumuladas.

X F Fac
4 5 5
6 8 13
8 9 22
9 10 32
10 8 40
N = 40

Para calcular la Mediana, procederemos de la siguiente manera: ¡¡Preste atención!!

*Primero hacemos N/2 = 40/2 = 20


*Luego buscamos en la columna de las frecuencias acumuladas un valor inmediatamente
mayor a 20 (valor obtenido en el punto anterior) comenzando desde el 1º valor; en nuestro
ejemplo es 22;
*buscamos el valor de x que está en la misma fila que 22. Ese valor es 8; por lo tanto la
mediana es igual a 8.
Me = 8

Entonces, la mediana corresponde al valor de x, cuya frecuencia acumulada sea


inmediatamente mayor al valor que resulte de dividir N en 2 (N/2).

Ejemplo 7: En la distribución siguiente tenemos información acerca del nº de hijos de un grupo


de familias. Variable: nº de hijos; cuantitativa discreta
X F Fac
1 3 3
2 4 7
3 2 9
4 1 10
N =10

*Primero hacemos N/2 = 10/2 = 5


5

*Luego buscamos en la columna de las frecuencias acumuladas un valor inmediatamente


mayor a 5; en nuestro ejemplo es 7.
*buscamos el valor de x que está en la misma fila que 7. Ese valor es 2; por lo tanto la
mediana es igual a 2.
Me = 2

Nota: Cuando hay presencia de datos extremos se recomienda utilizar la mediana como
medida de tendencia central pues esta será más representativa que la media.
*Vamos a ver ahora, la tercera medida de centralización que se llama MODA (Mo).

-- En los ejemplos 1, 2 y 3 no hay moda porque todos los valores de la variable son diferentes,
o sea que no hay ninguno que tenga mayor frecuencia que otro, o lo que es lo mismo, todos
tienen la misma frecuencia que es igual a 1, porque todos están una sola vez. No hay valores
repetidos.
-- En el ejemplo 4, hay dos modas: Mo1 = 3 y Mo2 = 5 (porque ambas tienen igual frecuencia
absoluta que es igual a 4, y es la mayor).

-- En el ejemplo 5, la moda es una sola; Mo = 9 (cuya frecuencia absoluta es igual a 10).

--En el ejemplo 7, la moda es igual a 2. Mo = 2 (cuya frecuencia absoluta es igual a 4).


Como verá, no hacemos, por ahora ningún cálculo para buscar la Moda.

Ahora vamos a practicar, todo lo visto anteriormente. Vaya haciendo usted en su cuaderno,
todos los ejercicios mientras los explico, para que vaya recordando el procedimiento.

Ejemplo 8:
En la siguiente distribución, calcular: a) media aritmética, b) Mediana y c) Moda.
Recuerde que ud va a tener como datos, solamente la 1º columna con los valores de la
variable y la 2º columna, con sus respectivas frecuencias absolutas. Nosotros agregaremos en
la tabla, todo lo que nos haga falta para calcular los promedios pedidos. Comencemos:
a) Vamos a calcular primero la Media Aritmética; para ello agregaremos en la tabla, la columna
de “X. F” y vamos a calcular N, sumando las Frecuencias absolutas.

X F x.F
100 10 1000
120 5 600
125 4 500
140 3 420
N = 22 2520

∑𝑥 . 𝐹 2520
𝑎) ̅𝑥 = = = 114,54 ̅𝑥 = 114,54
𝑁 22
6

b) Ahora vamos a calcular la Mediana. Para ello, necesito agregar en la tabla, la columna de las
Frecuencias acumuladas. Ud puede hacerlo en la tabla anterior; yo lo haré en otra para ir
explicándole paso a paso. (Siempre hacemos una sola tabla para todo).

X F x.F Fac
100 10 1000 10
120 5 600 15
125 4 500 19
140 3 420 22
N = 22 2520

*Primero hacemos N/2 = 22/2 = 11


*Luego buscamos en la columna de las frecuencias acumuladas un valor inmediatamente
mayor a 11; en nuestro ejemplo es 15.
*buscamos el valor de x que está en la misma fila que 15. Ese valor es 120; por lo tanto la
mediana es igual a 120.
Me = 120

c) Ahora vemos cual es la Moda de la distribución. Para ello, buscamos el valor de la variable x,
que tenga mayor frecuencia absoluta y ese valor es x = 100, ya que su frecuencia absoluta es
el mayor valor que es 10. Por lo tanto la Moda es igual a 100.

Mo = 100
Ejemplo 9:
En la siguiente tabla de distribución de frecuencias, se muestran las edades de las personas
que asisten a un centro médico por día, calcular: a) media aritmética, b) Mediana, c) Moda,
d) Indicar cuál es la variable y clasificarla. (Observe que acá se preguntan 2 cosas: primero:
cuál es la variable y segundo: cómo se clasifica; se deben responder las dos cosas).

Edad F x.F Fac


23 7 161 7
28 4 112 11
38 12 456 23
46 10 460 33
50 6 300 39
N = 39 1489

∑𝑥 . 𝐹 1489
𝑎) ̅𝑥 = = = 38,17 ̅𝑥 = 38,17
𝑁 39

b) *Primero hacemos N/2 = 39/2 = 19,5


*Luego buscamos en la columna de las frecuencias acumuladas un valor inmediatamente
mayor a 19,5; en nuestro ejemplo es 23.
*buscamos el valor de x que está en la misma fila que 23. Ese valor es 38; por lo tanto la
mediana es igual a 38.

Me = 38
7

c) La Moda es igual a 38, ya que es el valor de la variable que tiene mayor frecuencia (12).

Mo = 38
d) Variable: edad; cuantitativa discreta.
***Observe que los 3 valores anteriores, son muy próximos o iguales. Siempre tiene que ser
así. Siempre controle que estos valores les den cercanos. Si le da mucha diferencia entre ellos,
controle sus cuentas, porque algo debe estar haciendo mal.

Tipos de distribuciones

Los histogramas y otros gráficos permiten visualizar cómo se distribuyen los valores de una
variable numérica. Muchas veces éstos gráficos tienen la forma de una campana, con una
zona central en la cual los valores de la variable son más frecuentes. A medida que nos
alejamos de esa zona central las frecuencias disminuyen simétricamente. Esta forma de
campana es también llamada campana de Gauss. En ésta distribución, Cuando la media, la
mediana y la moda coinciden, la distribución es simétrica. Cuando no coinciden, la distribución
es asimétrica, dependiendo de los valores de la media, mediana y moda.

-Distribución simétrica: los valores de la media, mediana y moda coinciden.


-Distribución asimétrica a derecha: es más alargada a la derecha. (Mo - Me - 𝒙 ̅ ). La media y la
mediana están siempre a la derecha de la moda.
̅ - Me - Mo). La media y la
-Distribución asimétrica a izquierda: es más alargada a la izquierda. (𝒙
mediana están siempre a la izquierda de la moda.

Para analizar la simetría de una distribución, procederemos así: colocaremos en una recta
numérica los valores de la media, mediana y moda y así podremos concluir, cómo es la
simetría de la distribución, dependiendo de cómo se ubiquen los valores.

Nota: generalmente, la mediana es el valor que está en el medio, pero suele suceder que no
sea así. Lo importante es que tanto la media como la mediana están a la izquierda de la moda,
para poder concluir su asimetría. Hay algunos casos muy especiales, en los que la Moda puede
quedar en el medio, o puede ser igual a los otros promedios. Explicaremos, a continuación,
que pasa en esos casos, con algunos ejemplos.
8

Para explicar la simetría, analizaremos el ejemplo 8:

En una recta numérica, coloque los valores de la media, mediana y moda, obviamente, de
menor a mayor.

Moda ̅
𝒙 Mediana
100 114,54 120

Generalmente, la mediana queda en el medio, pero no siempre es así, como en este ejemplo.
Siempre tomamos como referencia la moda y vemos como se ubican la media y la mediana; en
nuestro ejemplo, como la media y la mediana están a la derecha de la moda, podemos concluir
que la distribución tiene “asimetría positiva” o es “asimétrica a la derecha”.

En el ejemplo 9, la distribución se ubica así:

Moda = Mediana ̅
𝒙
38 38,17

En este caso, la moda y la mediana coinciden, pero como la media está a la derecha de la
moda, la distribución es asimétrica a la derecha.

Supongamos ahora, una distribución en la que el valor de la moda quede en el medio de la


media y la mediana; en ese caso procederemos así, para analizar la simetría: haremos la
diferencia entre la media y la moda.

* 𝑥̅ − 𝑀𝑜 < 0 (Negativa), la distribución es asimétrica a la izquierda.


𝑥̅ − 𝑀𝑜 > 0 (Positiva), la distribución es asimétrica a la derecha.

48 49 50
̅
𝒙 Mo Me

𝑥̅ − 𝑀𝑜 < 0 (Negativa), la distribución es asimétrica a la izquierda.


𝑥̅ − 𝑀𝑜 > 0 (Positiva), la distribución es asimétrica a la derecha.

En nuestro ejemplo: 𝑥̅ − 𝑀𝑜 = 48 − 49 = −1 < 0 la asimetría es negativa.

Autoevaluación

a) ¿Cuáles son las medidas de tendencia central?

b) ¿Cómo define la media aritmética?

c) ¿Cuál es la ventaja y la desventaja de la media aritmética?


9

d) ¿Cómo se define la Mediana?

e) ¿Cómo se define la Moda?

f) ¿Es necesario que los datos estén ordenados para calcular la Mediana?

g) ¿Siempre existe la moda en una distribución de frecuencias?

h) ¿Puede existir más de una Moda?

*nota: recuerde que esta autoevaluación es para que usted fije sus conocimientos y no debe enviarse.

*Con este tema se habilitará el Trabajo Práctico nº1, para que ponga en práctica todo lo que
aprendió hasta ahora. Encontrará este Trabajo Práctico, resuelto en el mosaico Actividades.

También podría gustarte