Apuntes de Clases Parte II MBA 2024

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 68

MAGÍSTER EN GESTIÓN Y DIRECCIÓN DE EMPRESAS-MBA

Métodos Cuantitativos
y Estadísticos Aplicados a la Gestión
Parte II

Profesora: Sara Arancibia Carvajal

1
1.-Resumen de datos: distribuciones de frecuencias y
representaciones gráficas

La primera tarea es describir los datos, valores o puntuaciones obtenidas para cada
variable.

¿Cómo pueden describirse estos datos?

Describiendo la distribución de las puntuaciones o frecuencias

¿Qué es una distribución de frecuencias?

Una distribución de frecuencias es un conjunto de puntuaciones ordenadas en


sus respectivas categorías.

2
Relaves de Chile_ Tablas de frecuencia

Las distribuciones de frecuencias contienen para cada categoría de la variable: la


frecuencia (número de observaciones), porcentajes respecto al total de los casos
del archivo de datos, porcentaje válido correspondiente al total de casos válidos, y
las frecuencias acumuladas. Las frecuencias acumuladas son las que se van
acumulando de acuerdo al porcentaje válido.

3
Relaves de Chile_ Tablas de frecuencia

4
Gráficamente una distribución de frecuencias se puede ver mediante un gráfico de barras
cuando la variable es nominal u ordinal y mediante un histograma cuando la variable es escala

5
6
Tablas de contingencia o Tablas cruzadas: Entrega la frecuencia por cada celda de la
matriz. Por ejemplo en la tabla se observa que existen 3 relaves en Antofagasta cuyo
estado es Abandonado

7
Tablas de contingencia o Tablas cruzadas: También se puede pedir que muestre los
porcentajes respecto a la columna, respecto a la fila y respecto al total de datos
válidos

8
Tablas de contingencia o Tablas cruzadas

9
Tablas de contingencia o Tablas cruzadas

10
2.- Descripción de los datos: Medidas de tendencia central
¿Qué es un promedio?
Valor que representa un conjunto de datos.
Señala un centro de los valores.
Una denominación más precisa que promedio es medida de
tendencia central.

Las medidas de tendencia central, que por lo


común se emplean en administración y economía
son :

• la media aritmética
• la mediana
• la moda
• la media geométrica

11
Media: (Mean) La media ( promedio) es la medida de tendencia central
más utilizada y puede definirse como el promedio aritmético de una
distribución. Es una medida solamente aplicable a mediciones por
intervalos o de razón.
Media de una muestra:

X=
 X
n
donde  X indica la suma de todos las X
n es el número total de valores en la muestra
Media de una población:

=
 X
N
 indica la media poblacional.
N es el número total de observaciones en la población
12
Estadística Descriptiva

Ejemplo:

El ingreso anual (en dólares) de una muestra de varios empleados en una


industria son: 42900, 49100,38300 y 56800.
La media muestral es 187100/4=46775.
¿La media obtenida es un dato estadístico o un parámetro?
Estadístico porque es un valor muestral.

Nota:Cualquier característica medible de una muestra se llama dato


estadístico. Cualquier característica medible de una población, como la
media, se denomina parámetro.

13
La Mediana:(Median) es el valor céntrico en un conjunto de valores
ordenados de menor a mayor o de mayor a menor. Una forma fácil de
localizar la posición del elemento medio para datos no agrupados es por
medio de:

n +1
2
• Es una medida de tendencia central propia de los niveles de una medición
ordinal, por intervalos y de razón.
• No es influenciada por valores extremos.
• 50%de las observaciones son mayores que la mediana.
• No necesita ser uno de los valores del conjunto de datos.
• Es única para un conjunto de observaciones.

14
Ejemplo:

Supóngase que intenta adquirir una casa en un condominio de la comuna de


La Reina. El agente de ventas le indicó que el precio promedio de las casas
disponibles en este momento es de 4225 UF.
Si tuviera un presupuesto máximo de 2800UF, podría pensar que está fuera
de sus posibilidades. Sin embargo, al verificar los precios individuales de las
casas podría cambiar de idea. Los precios son 2300UF, 2600UF, 3500UF y
8500UF.
El precio 8500UF está haciendo que la media se incline hacia arriba, por lo
que es un promedio no representativo. Un precio entre 2600 y 3500 es un
promedio más representativo. En casos como éste la mediana proporciona
una medida más exacta de la tendencia central.

15
La moda: (mode): Valor de la observación que aparece con más
frecuencia.

•La moda es útil en especial al describir los niveles nominal y ordinal de


medición (aunque puede determinarse para todos los niveles de datos)
•Un conjunto de datos puede tener más de una moda

Ejemplo:

Una empresa ha desarrollado cinco lociones para baño. En el diagrama se


muestran los resultados de una investigación de mercado diseñada para
determinar qué loción para baño prefieren los consumidores.

16
Número de entrevistados acerca de lociones
para baño

400 360

Número de respuestas
350
300
250
200 180

150 105
100 70
50
50
0
Cariño Lamoure Extasis Elegancia Nocturna

La mayor cantidad de respuestas favoreció a la llamada Lamoure,


según lo indica la barra más alta. Por tanto, tal producto es la moda.

17
Uso de media, mediana y moda

Datos de la población
La moda puede ser útil como medida descriptiva de un grupo de la
población, aunque sólo si existe una moda claramente perceptible.

La mediana es siempre una medida excelente para representar el nivel


típico de los valores observados, como los índices salariales, de una
población. Esto es así independientemente de la existencia de más de
una moda o de que la distribución de la población sea asimétrica o
simétrica.

La media aritmética es excelente como valor representativo de una


población, aunque sólo si la población es claramente simétrica. En datos
no simétricos, los valores extremos distorsionarán el valor de la media
como valor representativo.

18
Uso de media, mediana y moda

Datos muestrales
La moda: La moda no es una medida aceptable de posición respecto
de datos muestrales, porque su valor puede variar ampliamente de una
muestra a otra.

La mediana: es mejor que la moda, porque su valor es más estable


entre muestra y muestra.

La media: es la más estable de las tres medidas.

19
Ejemplo:

Se han recopilado los índices salariales de los 650 empleados por hora
de una empresa manufacturera. La medida más representativa del índice
salarial típico es la mediana, porque en este caso está implicada una
población y la mediana no se ve relativamente afectada por la posible
falta de simetría de los índices salariales.

Ejemplo:

Una muestra aleatoria de n=100 índices salariales se obtiene en una


compañía con varios miles de empleados por hora El índice salarial más
representativo de estos varios miles de empleados es la media muestral.
Aunque es improbable que la media muestral sea exactamente igual al
índice salarial medio de toda la población, por lo general se hallará mucho
más cerca de la media poblacional que la mediana muestral como
estimador del índice salarial mediano de la población.

20
Nota: Es mejor usar la mediana que la media como medida
de tendencia central, cuando un conjunto de datos contiene
valores extremos. Otra medida que se usa a veces cuando
hay valores extremos es la media recortada al 5%, que se
obtiene eliminando el 5% de los valores mayores y el 5% de
los menores, en un conjunto de datos, procediendo entonces
a calcular el promedio de los valores restantes.

21
Estadística Descriptiva
Media Geométrica

La media geométrica (MG) tiene una amplia aplicación en los negocios y


en la economía.
Hay dos usos principales de la MG:
1)Para promediar porcentajes, índices y cifras relativas
2) Para determinar el incremento porcentual promedio en ventas,
producción u otras actividades o series económicas de un periodo a otro.

La media geométrica (MG) de un conjunto de n números positivos se define


como la raíz n-ésima del producto de los n números. Proporciona una
medida precisa de un cambio porcentual promedio en una serie de
números.

MG = n ( X 1 )( X 2 )( X 3).............(X n )

22
Estadística Descriptiva

Ejemplo:

Para ilustrar el empleo de la media geométrica en promedios de


porcentajes , supóngase que las utilidades obtenidas por una compañía
constructora en cuatro proyectos fueron de 3, 2 , 4 y 6%,
respectivamente. ¿Cuál es la media geométrica de las ganancias?

MG = n ( X 1 )( X 2 )( X 3 )( X 4 )
= 4 (3)(2)(4)(6)
= 4 144
= 3,46
La media geométrica 3,46 da una cifra más conservadora para las
utilidades porque no se ve tan afectada por los valores extremos. En
realidad, será igual o menor que la media aritmética.

23
Estadística Descriptiva

Ejemplo:

Suponga que usted recibe un 5 por ciento de aumento en su salario este año y un 15 por
ciento de aumento el año próximo. El incremento porcentual promedio es 9.886, no 10.0.
Empezamos por calcular la media geométrica. Recuerde, por ejemplo, que un aumento
de 5 por ciento en el salario es 105 o 1.05. Lo escribiremos como 1.05.
Esto se puede verificar suponiendo que su salario mensual sea de $3.000 al empezar y
que usted reciba dos aumentos de 5 por ciento y de 15 por ciento.
Aumento 1 = $3.000 (.05) = $150.00
Aumento 2 = $3.150 (.15) = 472.50
Total $622.50

Su aumento total de salario es $622.50. Esto es equivalente a:


$3.000.00 (.09886) = $296.58
$3.296.58 (0.9886) = $325.90
$622.48 que es aproximadamente $622.50

24
Estadística Descriptiva

Para determinar el incremento porcentual promedio en ventas,


exportaciones, población u otras series se utiliza la siguiente fórmula:

INCREMENTO PORCENTUAL PROMEDIO


EN EL TIEMPO

Valor al final del periodo


GM = n −1
Valor al principio del periodo

25
Estadística Descriptiva

Ejemplo:

La población de Haarlan, Alaska, era de dos personas en 1990, en 2000 fue


de 22. ¿Cuál es la tasa de incremento anual promedio de este periodo?
Solución:
Hay 10 años entre 1990 y 2000 por lo que n = 10. La fórmula (3-6) para la
media geométrica aplicada a este tipo de problema queda:

22
MG = 10 − 1 = 1.271− 1 = 0.271
2
El valor final es .271. La tasa anual de incremento es 27.1 por ciento. Esto
significa que la tasa de crecimiento en Haarlan es 27.1 por ciento por año.

26
Estadística Descriptiva

Ejercicio:

El Director ejecutivo de la empresa Airlines desea determinar la tasa


de crecimiento promedio en los ingresos con base en las cifras
entregadas en la tabla: si la tasa de crecimiento promedio es menor
que el promedio industrial del 10% se asumirá una nueva campaña
publicitaria . Determine la tasa de crecimiento promedio.

Año Ingreso Miles de US$ Porcentaje del año anterior


1992 50
1993 55
1994 66
1995 60
1996 78

27
Año Ingreso Miles de US$ Porcentaje del año anterior
1992 50
1993 55 55/50=1.10
1994 66 65/55=1.20
1995 60 60/66=0.91
1996 78 78/60=1,30

4
(1.10)(1.2)(0.91) 1.3
=1.1179

La tasa de incremento anual promedio (usando media geométrica) es 11.79%

Por otra parte calculando la media aritmética tenemos una tasa del 12,75%

50000x 1,1275= 56375 50000x 1,1179=55895


56375x1,1275=63563 55895x1,1179=62485
63563x 1,1275= 71667 62485x 1,1179=69852
71667x1,1275=80805 69852x1,1179=78087
28
Estadística Descriptiva

Media Ponderada

La media ponderada de un conjunto de números denotados por


X1, X2, X3, ...,Xn, con ponderaciones
w1, w2, w3, ...,wn se calcula como sigue:

w1 X 1 + w2 X 2 + .....+ wn X n
Xw =
w1 + w2 + .....+ wn

29
Estadística Descriptiva

Ejemplo:

Una empresa comercial paga a sus vendedores


$6.50, $7.50, u $8.50 (dólares) por hora.
Podría llegarse a la conclusión de que la media de los sueldos (por hora) es $7.50,
obtenida al calcular: (6.50+7.50+8.50)/3. Esto es cierto sólo si hay el mismo número
de vendedores que perciben $6.50, $7.50, y $8.50.
Sin embargo, supóngase que 14 empleados de ventas ganan $6.50, a 10 se les
paga $7.50,y 2 obtienen $8.50. Para encontrar la media se debe calcular:

14(6.50) + 10(7.50) + 2(8.50)


Xw =
14 + 10 + 2

La media ponderada de los sueldos por hora es $7.04

30
Estadística Descriptiva

3.- Estadísticos de la distribución: Asimetría y curtosis


La asimetría es una estadística necesaria para conocer qué tanto
nuestra distribución se parece a una distribución teórica llamada curva
normal.
El sesgo o asimetría ( Skewness) es la carencia de forma simétrica en
la gráfica de un conjunto de datos.
•Si no existe asimetría o sesgo en los datos, son iguales la media, la
mediana y la moda. La mitad de los valores están por encima de estos
promedios y la mitad por debajo de ellos ( asimetría =0).

Media
mediana
Moda
31
Estadística Descriptiva

Cuando la asimetría es positiva quiere decir que hay más valores


agrupados hacia la izquierda de la curva ( por debajo de la
media).

•La moda es el valor que corresponde al punto más alto


•La media es el mayor de los tres promedios

Moda Media
Mediana

32
Estadística Descriptiva
Cuando la asimetría es negativa significa que los valores
tienden a agruparse hacia la derecha de la curva ( por
encima de la media).

•La moda es el valor que corresponde al punto más alto de la distribución.

•La media es el más pequeño de los tres promedios.

Media Moda
Mediana

Nota: Si la distribución es muy asimétrica, la media no sería un


promedio útil. La mediana y la moda son más representativas.

33
Estadística Descriptiva

Coeficiente de asimetría
Karl Pearson desarrolló una medida para evaluar el sesgo de una distribución,
denominada coeficiente de asimetría (C.A)

3(media − mediana)
C. A =
desviación estándar
Ejemplo:

Las duraciones de estadía en el piso de cancerología de un hospital, se


organizaron en una distribución de frecuencias. La duración media fue 28
días, la mediana 25 días y la duración modal 23 días Se calculó la
desviación estándar de 4,2 días
¿Cuál es el coeficiente de asimetría?
El coeficiente de asimetría por lo general se encuentra entre -3 y 3.
En este caso es 2,4 e indica un grado importante de asimetría con
sesgo positivo.
34
Estadística Descriptiva
Curtosis;(Kurtosis) mide el grado de agudeza de una distribución.
Cuando la curtosis es cero, significa que se trata
de una curva mesocurtica como la normal. Si es
positiva, quiere decir que la curva o distribución es
más levantada. Si es negativa, quiere decir que la
curva es más plana .

Curva leptocúrtica Curva mesocúrtica

Curva plalticúrtica
Nota: La asimetría y la curtosis requieren mínimo un nivel de medición por intervalos.
35
Estadística Descriptiva

4.- Medidas de Posición: Cuantiles


Los cuantiles son valores de la distribución que la dividen en partes iguales,
es decir, en intervalos, que comprenden el mismo número de valores. Los
más usados son los cuartiles, los deciles y los percentiles.

Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto


de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al
15% de las observaciones, y por encima queda el 85%.

Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados
en cuatro partes iguales, son un caso particular de los percentiles.

Deciles: son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales, son también un caso particular de los percentiles.

36
Estadística Descriptiva

La determinación de cuartiles con frecuencia es de utilidad. Por ejemplo


muchas escuelas de posgrados admitirán sólo aquellos estudiantes
que estén en el 25% superior (sobre el tercer cuartil) de los candidatos.
Las empresas, con frecuencia, desean señalar las plantas cuyos
deficientes registros de producción los colocan por debajo del cuartil
inferior.

El lugar del P-ésimo percentil se halla:


P
L p = (n + 1)
100
Donde Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones.
P es el percentil deseado.

La amplitud intercuartil es la diferencia entre el tercer y primer cuartil.


37
Diagrama de Caja
(Box-plot)

El diagrama de caja permite


resumir los datos de una
gráfica.

38
Estadística Descriptiva

5.- Medidas de dispersión

Con frecuencia es conveniente contar con medidas de dispersión


o de la variabilidad de los valores de los datos.
Por ejemplo, suponga que usted es un agente de compras de una
importante empresa manufacturera, y que con regularidad coloca
pedidos con dos proveedores distintos. Ambos le indican que
necesitan alrededor de 10 días hábiles para surtir sus pedidos.
Después de varios meses de trabajar así encuentra usted que el
promedio de días necesarios para surtir los pedidos es realmente,
unos 10 para cada proveedor. Los histogramas que resumen la
cantidad de días hábiles requeridos para surtir los pedidos se ven
en la figura.

39
Estadística Descriptiva

Aunque la cantidad promedio es, más o menos, de 10 en ambos casos


¿tienen éstos el mismo grado de confiabilidad para entregar a tiempo?
¿Qué proveedor prefiere usted?

Proveedor A
.5 Proveedor B
Frecuencia
relativa .4

.3

.2

.1

9 10 11 7 8 9 10 11 12 13 15
Días hábiles Días hábiles

40
Estadística Descriptiva

Examinaremos varias medidas que describirán la dispersión o


variabilidad de los datos; la amplitud total, la varianza, la desviación
estándar, dispersión relativa.

¿Por qué estudiar la dispersión?

1. Al aplicar una medida de dispersión es posible evaluar la confiabilidad


del promedio que se está utilizando.
Una dispersión pequeña indica que los datos se encuentran acumulados
cercanamente, por ejemplo, alrededor de la media aritmética. Por tanto
la media se considera bastante representativa de los datos. Esto es la
media es un promedio confiable.
2. Una medida de dispersión permite apreciar cuán dispersas están dos
o más distribuciones.

41
Estadística Descriptiva

Medidas de dispersión
Amplitud total ( rango)
Se trata de la diferencia entre los valores mayor y menor de un
conjunto de datos.

Amplitud total= Valor más alto- Valor más bajo

Ejercicio: Los costos anuales de viaje para ejecutivos y gerentes


medios en una empresa se organizaron en distribuciones de
frecuencias y se representaron por medio de polígonos de frecuencias.
1. ¿Cuál es la media aritmética de los costos de viaje para ejecutivos?
¿ Par los gerentes de nivel medio?
2. ¿Cuál es la amplitud total para los ejecutivos?¿ Y para los gerentes
de nivel medio?
3. Compare la dispersión de las dos distribuciones y explique lo que
indica.
42
Estadística Descriptiva

Gerencia de nivel medio

Ejecutivos

2000 6000 10000 12000

Nota: Un defecto importante de la amplitud total es que se basa sólo en


dos valores. No toma en consideración todos los datos.

43
Estadística Descriptiva

Varianza y desviación estándar


La varianza y la desviación estándar se basan en las desviaciones con
respecto a la media.
Varianza:( Variance) Media aritmética de las desviaciones cuadráticas con
respecto a la media.
Varianza poblacional

s 2 =
 ( X −  )2 o bien s 2 =
 X2  X
−
2

 N 
N N  
donde
s = es el símbolo para la varianza de una población
2

X es el valor de la observación en la población


 es la media de la población
N es el número total de observaciones en la población

44
Estadística Descriptiva
En general es difícil interpretar el significado del valor de una
varianza, porque las unidades en las que se le expresa son valores
elevados al cuadrado. Es más frecuente el uso de la raíz cuadrada.

Desviación estándar:( Standard deviation) Raíz cuadrada de la varianza.

(X − )  X −   X
2
2 2

s = o bien s = 
N N  N 
 

Una desviación estándar pequeña para un conjunto de valores indica


que éstos se encuentran localizados cerca de la media. Por el
contrario, una desviación estándar grande revela que las
observaciones están muy dispersas con respecto a la media.

45
Estadística Descriptiva
Varianza muestral

La fórmula para la varianza muestral utilizada como estimador de


la varianza poblacional es:

( X ) 2
2  (X − X ) 2 X2 − n
s = o bien s 2 =
n −1 n −1

¿Por qué se hizo al denominador esta modificación?


Puede demostrarse que si se hubiera calculado la varianza
muestral utilizando sólo n en el denominador, el resultado
subestimaría la varianza poblacional. Esto es, la varianza
muestral sería un estimador sesgado de la varianza
poblacional.

46
Estadística Descriptiva

Desviación estándar muestral

La desviación estándar de una muestra se utiliza como un estimador


de la desviación estándar de la población.

(  X ) 2

 ( X − X ) 2  X 2

n
s= o bien s =
n −1 n −1

47
Estadística Descriptiva

Interpretación y usos de la desviación estándar


Por lo común la desviación estándar se emplea como una medida para
comparar la dispersión en dos o más conjuntos de observaciones. Por
ejemplo, la desviación estándar de las cantidades quincenales invertidas
en el plan de participación de las utilidades de una empresa se ha
calculado como 7,51 dólares. Supóngase que tal empresa tiene una rama
en el sur. Si la desviación estándar para otro grupo de empleados en el
oeste es 10,47 dólares y las medias son aproximadamente iguales, esto
indica que las cantidades invertidas por los empleados del sur no se
dispersan tanto como las de los empleados del oeste (porque
7,51<10,47). Ya que las cantidades invertidas por los empleados del sur
se acumulan a la media, el valor medio para estos trabajadores es una
medida más confiable que la media para el grupo del oeste.

48
Estadística Descriptiva

La desviación estándar se interpreta como cuánto se desvía-


en promedio- de la media un conjunto de puntuaciones.

Supóngase que un obtuvo para su muestra una media de


ingreso familiar de $800000 y una desviación estándar de
$100000. La interpretación es que los ingresos familiares de la
muestra se desvían en promedio respecto a la media en cien
mil pesos.

La desviación estándar sólo se utiliza en variables medidas


por intervalos o de razón.

49
Estadística Descriptiva

Teorema de Chebyshev
El matemático ruso Chebyshev desarrolló un teorema que permite
determinar la proporción mínima de los valores que se encuentra
dentro de un número específico de desviaciones estándares con
respecto a la media.
Por ejemplo, con base en el teorema de Chebyshev, al menos tres de
cada cuatro valores, o 75%, deben encontrarse entre la media más
dos desviaciones estándares y la media menos dos desviaciones
estándares.
Esta relación se aplica sin importar la forma de la distribución.
Además, al menos ocho de cada nueve valores, o 89,9%, se
encontrarán entre la media más tres desviaciones estándares y la
media menos tres desviaciones. Al menos 24 de 25 valores, o 96%, se
encontrarán entre la media y menos cinco desviaciones.

50
Estadística Descriptiva

En términos generales, el teorema de Chebyshev establece que; para un


conjunto cualquiera de observaciones (muestra o población), la proporción
mínima de los valores que se encuentran dentro de k desviaciones
estándares desde la media es al menos. 2
1−1/ k
donde k es una constante mayor que 1.
Ejemplo:
suponga que la cantidad media quincenal depositada por los empleados de
una empresa en el plan de participación de utilidades de la empresa fue
$51,04 y se obtuvo una desviación estándar de $7,51. Al menos ¿qué
porcentaje de las contribuciones se encuentran a una distancia de más dos
desviaciones estándares y menos dos desviaciones estándares de la
media?
Solución; Aproximadamente 75%, que se obtiene al calcular

1
1 − 1 / k 2 = 1 − 1 / 22 = 1 − = 0,75
4
51
Estadística Descriptiva

El teorema de Chebyshev se refiere a cualquier conjunto de valores; esto


es, la distribución de los valores puede tomar cualquier forma. Sin embargo,
para una curva de distribución simétrica en forma de campana podemos ser
más precisos al explicar la dispersión.

Para una curva de distribución simétrica en forma de campana, se puede ser


preciso al explicar la dispersión con respecto a la media.

Regla empírica ( regla normal): Para una distribución de frecuencias


simétrica de campana aproximadamente 68% de las observaciones se
encontrará a más y menos una desviación estándar de la media;
aproximadamente 95% de las observaciones se encontrarán a más y menos
dos desviaciones estándares desde la media; y prácticamente todas las
observaciones 99,7% se encontrarán a más y menos tres desviaciones
desde la media.

52
Estadística Descriptiva

Curva simétrica de campana, que muestra las relaciones entre


desviación estándar y media.

-3s -2s -1s X 1s 2s 3s

68%

95%

99,7%

53
Estadística Descriptiva

Ejemplo:

Se observa que las cuentas de energía eléctrica de una zona


residencial correspondiente al mes de junio tienen una
distribución normal. Si se calcula que la media de estas cuentas
es de $84, con una desviación estándar de $24, entonces se
desprende que aproximadamente 68% de las cantidades
facturadas se encuentran entre $60 y $108. Así mismo de
desprende que aproximadamente 95% de las cantidades
facturadas se hallan entre $36 y $132.

54
Estadística Descriptiva

Nota:
El concepto de desviación estándar es muy importante en los negocios y
en la economía. Por ejemplo, en finanzas la desviación estándar se utiliza
como medida de riesgo relacionada con varias oportunidades de
inversión.
Mediante el uso de la desviación estándar para medir la variabilidad en las
tasas de rendimiento ofrecidas por diferentes inversiones, el analista
financiero puede medir el nivel de riesgo que tiene cada activo financiero.

Ejercicio: Markus Boggs es gerente de Inversiones S:A. Markus estaba


interesado en las tasas de rendimiento de los últimos cinco años de dos
diferentes fondos mutuos. Fondo mutuo1 mostró, durante un período de
cinco años, tasas de rendimiento del 12, 10, 13, 9 y 11 % mientras que
Fondo mutuo 2 arrojó 13, 12, 14, 10 y 6%. Un cliente se acercó a Boggs y
expresó su interés en uno de estos fondos mutuos ¿ Cual debería escoger
Boggs para su cliente? Ayuda: Una inversión más segura es la que tiene
un grado menor de riesgo (el riesgo se mide por la desv estándar).

55
Estadística Descriptiva

Dispersión Relativa
El coeficiente de variación (C.V) es una medida muy útil cuando:
1.-Los datos están en unidades diferentes (como dólares y días de
inasistencia).
2.- Los datos están en las mismas unidades, pero las medias muy distantes (
como sucede con los ingresos de los ejecutivos y los ingresos de los
empleados no calificados).
3.- Cuando se desea comparar la variabilidad de dos conjuntos de datos.
Coeficiente de variación: Indica la magnitud relativa de la desviación estándar
en comparación con la media de la distribución, expresada como porcentaje.
s
Población C .V = .100

s
Muestra C .V = .100
X
56
Estadística Descriptiva
Ejemplo:

Se va a comparar la variación en los ingresos anuales de ejecutivos con variación en los


ingresos de trabajadores no calificados.
Para una muestra de ejecutivos, X = $500000 y s = $50000
Para una muestra de trabajadores no calificados, X = $12000 y s = $1200
Uno se ve tentado a afirmar que hay mayor dispersión en los ingresos anuales de los
ejecutivos porque $50000>$1200. Sin embargo, las medias están tan distantes que se
necesitan convertir las estadísticas a coeficientes para efectuar una comparación significativa
de la variación en los ingresos anuales.

Para los ejecutivos; CV= 10%


Para los trabajadores no calificados; CV= 10%
No existe diferencia en la dispersión relativa de los dos grupos. 57
Estadística Descriptiva

Ejemplo:

Un estudio de las calificaciones obtenidas en un curso interno sobre


principios de administración y los años de servicio de los empleados
inscritos en el curso, dio como resultado estas estadísticas:
la calificación media fue 200; la desviación estándar 20. La media del
número de años de servicio fue 18 años, la desviación estándar de 2,16
años. Compare la dispersión relativa de las dos distribuciones.

Para las calificaciones: C.V= 10%.


Para los años de servicio: C.V = 12%

58
6. – Puntuaciones Z ( Medida de localización relativa)

Las puntuaciones “z” son transformaciones que se pueden


hacer a los valores o puntuaciones obtenidas, con el propósito
de analizar su distancia respecto a la media, en unidades de
desviación estándar.

X−X
Z=
s
donde X es la puntuación o valor a transformar
X es la media de la distribución
s la desviación estándar de ésta.
Z es la puntuación transformada en unidades de desviación estándar

Una puntuación “Z” nos indica la dirección y grado en que un valor


individual obtenido se aleja de la media, en una escala de
unidades de desviación estándar.
59
Estadística Descriptiva

Las puntuaciones Z son el método más comúnmente


utilizado para estandarizar la escala de una variable medida
en un nivel por intervalos.

Ejemplo:
Supongamos que en una distribución de frecuencias obtuvimos una
media de 60 y una desviación estándar de 10, y deseamos comparar a
una puntuación de 50 con el resto de la distribución. Entonces,
transformamos esta puntuación o valor en una puntuación Z. Tenemos
que: _
X=50, X=60, s=10
la puntuación Z correspondiente a un valor de 50 es:
Z= (50-60)/10= -1

60
Estadística Descriptiva

Podemos decir que el valor 50 está localizado a una desviación


estándar por debajo de la media de la distribución.
( el valor “30” está a tres desviaciones estándar por debajo de la media)
Estandarizar los valores permite comparar puntuaciones de dos
distribuciones diferentes.
Por ejemplo, podemos comparar una distribución obtenida en una
preprueba con otra obtenida en una postprueba (en un contexto
experimental).

Supongamos que se trata de un estímulo que incrementa la


productividad. Un trabajador obtuvo en la preprueba una productividad
de 130 ( la media del grupo fue de 122,5 y la desviación estándar de
10). Y en la postprueba obtuvo 135
(la media del grupo fue de 140 y la desviación estándar de 9,8).
¿mejoró la productividad del trabajador?
Aparentemente la mejoría no es considerable-

61
Sin transformar las dos calificaciones en puntuaciones Z no podemos
asegurarlo porque los valores no pertenecen a la misma distribución.
Entonces transformamos ambos valores a puntuaciones Z, los
transformamos a una escala común, donde la comparación es válida.

El valor de 130 en productividad es en términos de unidades


de desviación estándar igual a z= (130-122,5)/10=0,75
y el valor de 135 corresponde a una puntuación
Z =(135-140)/9,8= -0,51

Como podemos observar, en términos absolutos 135 es una


mejor puntuación que 130, pero no en términos relativos ( en
relación a sus respectivas distribuciones).

62
Estadística Descriptiva

La variable estandarizada expresa la posición de un elemento


en una distribución dada, tanto en relación a la media como a
la desviación estándar quedando libre de toda ambigüedad.

Ejemplo:

Un alumno obtuvo las siguientes notas:


Historia=5; Francés=4; Matemáticas=4,5; Castellano=6
¿Qué opinión puede dar Ud de estas notas?
Si las compara con la nota 4, que es el promedio de las notas
de 1 a 7 y la que se exige como mínimo para aprobar, puede
concluir que ese alumno tiene una buena nota en Historia y el
mínimo en Francés.
Pero ¿puede decir si el alumno dentro de su curso es de los
mejores?

63
Estadística Descriptiva

Para discernir esto es necesario acudir al promedio y a la


desviación estándar de las notas de esos ramos de todos los
alumnos.

Historia Francés Matemáticas Castellano


Promedio de curso 6,5 4 4,5 5,6
Desviación estándar 1 2 3 2
Var estandarizada Z -1,5 0 0 0,2

Aquí vemos que ha cambiado la faz de las notas, ya que un 5 en


Historia significa que está muy por debajo del resto de sus
compañeros, en cambio el 4 en Francés y el 4,5 en Matemáticas
indican que está dentro del promedio del curso.

64
La distribución de puntuaciones Z no cambia la forma de la
distribución original, pero si modifica las unidades originales a
unidades de desviación estándar. La distribución de
puntuaciones Z tiene una media 0 y una desviación estándar 1.

Las puntuaciones Z son un elemento descriptivo


adicional que podemos agregar para analizar nuestros
datos.

65
Estadística Descriptiva

Detección de valores atípicos


A veces un conjunto de datos tiene uno o más elementos con valores
demasiado grandes o demasiados pequeños. A los valores extremos
como éstos se les llama valores atípicos.
Un valor atípico puede ser un elemento para el cual se haya anotado
su valor en forma errónea. Si es así, puede corregirse antes de
proseguir el análisis. También, un valor atípico puede ser uno que por
error se incluyó en el conjunto de datos y, en estos casos, debe
eliminarse. Puede ser tan sólo un elemento poco común que se haya
anotado en forma correcta y que sí pertenece al conjunto de datos.

66
Estadística Descriptiva

Los valores estandarizados (valores z) pueden emplearse para


identificar los valores atípicos.
Para identificar valores atípicos se recomienda considerar que
cualquier elemento con un valor z inferior a -3 o superior a 3 sea
tratado como un valor atípico. La exactitud de esos elementos se
podrá revisar después para determinar si pertenecen al conjunto
de datos o no.

OBS: Con los diagramas de caja también se pueden identificar los valores
atípicos, pero no necesariamente los mismos valores que aquellos
menores que 3 o mayores que 3 en los valores z. SE puede usar
cualquiera de esos métodos o ambos. Se trata de identificar valores que
podrían no pertenecer al conjunto de datos.

67
Resumen
Tipo de
variable Estadisticos Gráficos Tabla de frecuencias
Nominal Moda Gráfico de barras Frecuencias absolutas

Diagrama de sectores Frecuencias relativas


Ordinal Moda Gráfico de barras Frecuencias absolutas

Mínimo Diagrama de sectores Frecuencias relativas


Diagrama de cajas
Máximo (box-plot) Frecuencias absolutas acumuladas
Amplitud Frecuencias relativas acumuladas
Mediana
Percentiles
Rango intercuartilico

Escala Medidas de tendencia central Histogramas Frecuencias absolutas


Poligonos de
Medidas de dispersión frecuencias Frecuencias relativas
Medidas de forma de la
distribución (Asimetría y Diagrama de cajas
curtosis) (box-plot) Frecuencias absolutas acumuladas
Medida de localización
relativa Frecuencias relativas acumuladas
* Cuando hay muchos valores no
tiene sentido, se agrupan en
intervalos
68

También podría gustarte