Estadistica Basica 2
Estadistica Basica 2
Estadistica Basica 2
=
q
p i
i
x
Ejemplo: Una empresa tiene 500 trabajadores y x
i
representa el
sueldo de cada trabajador. Cmo expresara la cantidad total
que la compaa debera tener a fin de mes para pagar la
planilla de los trabajadores?
Sumatoria simple en el caso de que solo se tiene
un solo criterio para identificar a una observacin
SUMATORIAS
SUMATORIAS
-
-
PROPIEDADES
PROPIEDADES
) 1 ( + =
=
p q k k
q
p i
= =
=
q
p i
q
p i
i i
x k x k *
=
+ + + =
20
1
2
20
2
2
2
1
2
...
i
i
x x x x
2
3 2 1
2
3
1
) ( x x x x
i
i
+ + =
=
SUMAS DE CUADRADO Y SUMAS DE PRODUCTO
SUMAS DE CUADRADO Y SUMAS DE PRODUCTO
= =
2 2 2
) ( x n x x x SCx
2
( ) SCy y y =
= = y x n xy y y x x SPxy ) )( (
x y
2 10
5 12
4 11
6 10
3 15
SUMATORIAS
SUMATORIAS
Sumatoria doble: En el
caso de que se tenga dos
criterios para identificar a
una observacin.
= =
q
p i
s
r j
ij
x
Notacin
puntual
= =
=
=
= =
= =
n
i
m
j
ij
m
j
ij i
n
i
ij j
x X
n i x X
m j x X
1 1
1
1
,..., 1 ;
,..., 1 ;
Se tiene la siguiente
informacin sobre el nmero
de electrodomsticos
vendidos por 5 vendedores
en una semana.
Vendedor (j)
Electrodomstico (i)
1 2 3 4 5
Refrigeradoras (1) 8 7 4 6 4 200
Televisores (2) 5 3 3 2 4 250
Equipos sonido (3) 2 0 3 1 2 500
Precio (i)
Ejemplo
Las variables en estudio son:
X
ij
= Nmero de electrodomsticos del tipo i vendidos por el vendedor j.
P
i
= Precio del electrodomstico del tipo i.
Representar mediante sumatorias y determinar el valor numrico de:
El total de televisores vendidos en la semana.
El total de electrodomsticos vendidos por el vendedor 2.
El valor de venta total del vendedor 4.
El valor de venta total por concepto de refrigeradoras y televisores.
Dadas las siguientes expresiones:
[ ]
=
+ + =
n
i
i i i
x x x x x x A
1
) 2 )( 2 ( 3
=
=
n
i
i
x x B
1
2
) (
n
X
X
.
=
Se puede concluir que A es igual a B?
Ejemplo
donde
MEDIDAS ESTADISTICAS
MEDIDAS ESTADISTICAS
Medidas de tendencia o posicin
Medidas de variabilidad
Objetivos
Describir las medidas de Tendencia Central de los datos.
Describir las medidas de variabilidad de los datos.
Describir las medidas de Posicin de los datos.
Describir la forma de la distribucin.
Introducir el grafico de box-plot como una herramienta para
describir las caractersticas de los datos.
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL
Resumen la informacin recolectada en indicadores que reflejan
la forma en que los datos se agrupan o concentran alrededor de
ciertos valores de una variable en estudio.
Media aritmtica simple
Media aritmtica ponderada
Media geomtrica
Media armnica
Mediana
Moda
Media Aritmtica
La media aritmtica, llamada tambin promedio aritmtico,
se define como el cociente de la suma de los valores
observados de la variable en estudio y el nmero de
observaciones
(Datos no agrupados en intervalos de clase)
1 1
...
n
i
i n
X
X X
X
n n
=
+ +
= =
1 1
...
N
i
i N
X
X X
N N
=
+ +
= =
Ejemplo Ejemplo
Durante 4 aos sucesivos un industrial compr petrleo para una
caldera a 16, 18 , 21 y 25 centavos por galn Cul es el costo
promedio por galn para un periodo de cuatro aos cuando
compra igual cantidad de petrleo por ao?
cos 0.16 0.18 0.21 0.25
0.20 /
4
total de tos
X soles galon
galon
+ + +
= = =
El siguiente cuadro muestra el nmero de trabajadores que se
ausentaron diariamente a una fbrica durante 20 das laborables.
En promedio se tiene que 2.2 trabajadores faltan en un da laborable.
dia faltas
n
f X
X
i i
/ 2 . 2
20
44
20
) 4 ( 2 ) 3 ( 6 ) 2 ( 7 ) 1 ( 4 ) 0 ( 1
= =
+ + + +
= =
X=faltas f
i
Nmero de das
4 2
0 1
1 4
2 7
3 6
Ejemplo
Ejemplo
1) La media aritmtica es un valor representativo debido a que es el centro
de gravedad o punto de equilibrio de un conjunto de datos.
2) Si se sustituye el valor de cada observacin por el valor del promedio
aritmtico no varia la suma de todas las observaciones.
3) La suma de las desviaciones de las observaciones con respecto al
promedio aritmtico es igual a cero.
=
=
n
i
i
x x
1
0 ) (
Propiedades de la media aritm
Propiedades de la media aritm
tica
tica
4) Si a cada observacin de una muestra se le suma una constante, el
promedio de las nuevas observaciones ser igual al promedio de la
muestra original ms la constante.
5) Si a cada observacin de una muestra se le multiplica por una
constante, el promedio de las nuevas observaciones ser igual al
promedio de la muestra original multiplicado por la constante.
, 1,2,...,
i i
Si y x b i n
entonces y x b
= =
=
x a y entonces
n i x a y Si
i i
=
= = ,..., 2 , 1 ,
MEDIA ARITM
MEDIA ARITM
TICA PONDERADA
TICA PONDERADA
La media o promedio ponderado de un conjunto de observaciones
x
1
, x
2
, , x
n
, con pesos o ponderaciones w
1
, w
2
, , w
n
se define
como
n
n n
n
i
i
n
i
i i
p
w w w
x w x w x w
w
x w
X
+ + +
+ + +
= =
=
=
...
...
2 1
2 2 1 1
1
1
Usado para el calculo de nmeros ndices, porcentaje promedio,
costo promedio, etc, es decir en todos aquellos casos donde las
observaciones no tienen la misma importancia.
Precio de Venta
(nuevos soles) Nmero de pasajes Ponderacin
120 60 0.30
140 100 0.50
160 40 0.20
Total 200 1.00
Ejemplo
Ejemplo
En una agencia de viajes se han vendido 200 pasajes a los
precios siguientes:
Calcule el precio promedio de venta?
Suponga que los costos de produccin y las cantidades
producidas por tres sucursales A, B y C de una empresa son:
Sucursal Costo de prod (X
i
) (soles)
Cantidad producida (w
i
)
(numero de unidades)
A 10.5 500
B 15.8 100
C 8.2 800
unid soles
w
x w
X
n
i
i
n
i
i i
p
/ 5643 . 9
1400
13390
800 100 500
800 * 2 . 8 100 * 8 . 15 500 * 5 . 10
1
1
= =
+ +
+ +
= =
=
=
El costo de produccin promedio por unidad producida, para la
empresa en su conjunto, ser de 9.5643 soles.
Ejemplo
Ejemplo
Ejemplo
Ejemplo
Las calificaciones de un estudiante en las 3 asignaturas del
curso fueron 14,2; 15,6 y 17,8.
a) Si los pesos asignados a cada asignatura son 2, 4, y 5
respectivamente. Cul es el promedio adecuado para sus
calificaciones?
b) Cul ser el promedio si todos los pesos fuesen iguales?
MEDIA GEOM
MEDIA GEOM
TRICA
TRICA
Corresponde al valor representativo central de observaciones
secuenciales y estrechamente relacionadas entre s.
La media geomtrica de un conjunto de n observaciones
positivas x
1
, x
2
, , x
n
se define como:
n
n
i
i
n
G
x X
=
= =
1
n 2 1
x , , .x x
Este promedio se usa en la elaboracin de nmeros ndices y
tasas promedios de variacin
Ejemplo:
El Producto Bruto Interno
de un pas durante los
ltimos cinco aos tuvo la
evolucin siguiente: Ao1:
+5%. Ao 2: 0% Ao3: -
1% Ao 4: +2% y Ao5: +
4%. Cul es la tasa de
crecimiento anual
promedio del PBI?
AO
Evolucin del
PBI
Tasa de
crecimiento
0 100
1 105 1.05
2 100 1.00
3 99 0.99
4 102 1.02
5 104 1.04
1.0195
Ejemplo:
Se recibi un prstamo de 1000
soles por 3 meses y al final del
perodo se pag un total
1467.40 soles; Cul fue la
tasa promedio de inters
mensual que se pag?
Mes Saldo
0 1000
Mes 1
Mes 2
Mes 3 1467.40
Suponga que una empresa ha experimentado un aumento en sus
ventas del: 25% en el ao 2003, 15% en el ao 2004 y una
disminucin del 5% en el ao 2005. Hallar el promedio de
crecimiento anual.
Se puede concluir que las ventas se han incrementado
anualmente a un ritmo promedio del 10.95%.
3 3
1,25*1,15*0,95 1,365625 1,1095
G
X = = =
Ejemplo:
NOTA:
Determinar porcentaje promedio en ventas u otros negocios o series
econmicas de un perodo a otro
1 n
G
valor final del periodo
X
valor al iniciodel periodo
=
MEDIA
MEDIA
ARM
ARM
NICA
NICA
La media armnica de un conjunto de n observaciones no
nulas (diferentes de cero) x
1
, x
2
, , x
n
se define como el
reciproco de la media aritmetica de los reciprocos de las
observaciones.
n
n
i
i
n
i
i
A
x x x
n
x
n
x n
X
1 1 1
1 1 1
1
2 1 1 1
+ + +
= = =
= =
Obs: Los valores extremos afectan al promedio armnico con
menor intensidad que al promedio geomtrico y al promedio
aritmtico.
La media armnica es til para promediar razones que tienen
dimensiones fsicas tales como Km/gal, costo/km, km/h
Cuando la unidad del valor constante o unidad de evaluacin
es igual a la unidad del numerador de una razn, se usa el
promedio armnico, y si es igual a la unidad del denominador
se usa el promedio aritmtico.
Ejemplo:
Calcular el rendimiento promedio para el caso de tres
automviles que recorrieron 500 kilmetros y cada auto tuvo el
rendimiento siguiente:
Auto A B C
Rendimiento (Km/galn) 50 62.4 77.6
Suponga que la velocidad de produccin de 3 obreros de son 0.5,
0.625 y 0.4 horas/articulo. Halle el tiempo promedio por articulo
producido durante 6 horas de trabajo.
articulo horas X
A
/ 491803 . 0
1 . 6
3
4 . 0
1
625 . 0
1
5 . 0
1
3
= =
+ +
==
En promedio se necesitara 0.491803 horas para producir un
artculo.
Ejemplo:
Ejemplo
Ejemplo
Durante 4 aos sucesivos un industrial compr petrleo para una
caldera a 16, 18 , 21 y 25 centavos por galn Cul es el costo
promedio por galn para un periodo de cuatro aos cuando cada
ao gasta igual cantidad de dinero?
cos 4
0.194 /
1 1 1 1
0.16 0.18 0.21 0.25
A
total de tos
X soles galon
galon
= = =
+ + +
MEDIANA
MEDIANA
La mediana de un conjunto de observaciones ordenadas de
acuerdo a su magnitud, es el valor de la observacin que
ocupa la posicin central.
M
e
mediana poblacional
m
e
mediana muestral
La mediana divide a un conjunto de observaciones en dos
partes iguales. El 50% con valores mayores a la mediana y
el otro 50% con valores menores.
La mediana es influenciada por el nmero de observaciones
y no por los valores de las observaciones.
Mediana
Mediana
min me max
Para datos no agrupados
par n para
X X
me
impar n para X me
n n
n
2
1
2 2
2
1
+
+
=
=
50% de n 50% de n
EJ EMPLO
EJ EMPLO
En la Granja UNALM, se realiz un
estudio con la finalidad de comparar
el peso en Kg. ( a los dos meses de
nacido), de dos razas de cuyes: Inti y
Andina. Para llevarlo a cabo, se
seleccionaron al azar muestras de
cada una de las razas, obtenindose
los siguientes resultados:
1.Halle e interprete la media, mediana
y la moda para la raza Andina
2.Cuando se considera el cuy para
consumo alimenticio, se debe tener
en cuenta que el 62 % del peso del
cuy de la raza inti es comestible, y
que el precio de venta de la parte
comestible es de 18 soles por
kilogramo. Para mantener la parte
comestible lista para la venta, sta
debe ser refrigerada a un costo
nico de 5 soles(no dependiendo de
la cantidad de cuyes que se desee
refrigerar). Considerando las
condiciones ya mencionadas, cul
es el ingreso neto promedio por la
venta de los cuyes de raza inti?
ANDINA INTI
Cuy Peso Cuy Peso
Stem-and-Leaf Display:
Catimor
1 0,68 9 0.94
Stem-and-leaf of
Catimor N=14
2 0,89 10 0,95 Leaf Unit = 0,010
3 0,89 11 0,99 1 8 3
4 0,89 12 0,99 3 8 58
5 0,89 13 1,04 7 9 1234
6 0,89 14 1,09 (5) 9 56679
7 0,89 15 1,11 3 10 1
8 0,90 16 1,11 2 10 5
1 11
1 11 5
Ejemplo Ejemplo
Se realiz un estudio sobre el
caf en el departamento de San
Martn donde se evaluaron dos
variedades: Caturra y Catimor;
para ambas variedades se
evaluaron 14 parcelas. Los
rendimientos
a) Halle e interprete las medidas de
tendencia central (media,
mediana y moda) de la variedad
Catimor.
b) Calcule la produccin media de
caf para estas dos variedades de
manera conjunta.
c)Si el costo de produccin de la
variedad Caturra es C = 2X + 8.
Halle el costo medio, costo
mediano y costo modal.
VARIEDADES
Caturra Catimor
Parcela Rend. Parcela Rend.
Stem-and-Leaf Display:
Catimor
1 8,5 9 11,4
Stem-and-leaf of Catimor
N=14
2 9,8 10 11,7 Leaf Unit = 0,10
3 9,9 11 11,8 1 9 4
4 10,3 12 12,2 1 9
5 10,7 13 12,4 3 10 12
6 10,9 14 14,9 (5) 10 66689
7 10,9 6 11 34
8 11,2 4 11 67
2 12 0
1 12
1 13 4
MODA
MODA
Es aquel valor, clase o categora que ocurre con mayor
frecuencia.
Nota:
La moda se puede hallar para datos cualitativos como
cuantitativos.
La moda es una medida de tendencia inestable.
Color de cabello frecuencia Tipo de sangre frecuencia
Negro 11 AB 4
Castao 24 O 12
Pelirrojo 6 A 35
Rubio 18 B 16
Cules son los valores de la moda para las siguientes distribuciones?
Ejemplo Ejemplo
PERCENTILES
El percentil q (P
q
), es el valor por debajo del cual se encuentra
el q% de las observaciones y por encima el (100-q)% de las
observaciones
Toma el nombre de percentiles por que dividen a la distribucin
en 100 partes iguales.
Medidas de tendencia:
Posicin
Clculo del percentil
d E q
n
.
100
) 1 (
=
+
) ( *
) ( ) 1 ( ) ( E E E q
X X d X P + =
+
Son 3 y dividen a la distribucin en 4 partes iguales.
Q
1
= Primer cuartil, por debajo de este valor se encuentra el 25% de
las observaciones.
Q
2
= me
Q
3
= Tercer cuartil, por debajo de este valor se encuentra el 75% de
las observaciones.
CUARTILES
Cuartil Q
1
=P
25%
Q
2
=P
50%
Q
3
=P
75%
Posicin 25(n +1)/100 50(n +1)/100 75(n +1)/100
Los Deciles son nueve y dividen a la distribucin en 10 partes iguales
D
3
=P
30
D
5
=P
50
=Q
2
=me D
9
=P
90
DECILES DECILES
Ejemplo Ejemplo
Del ejemplo de caf la
variedad Caturra.
Calcule e interprete los
cuartiles.
Caturra
Parcela Rend. Parcela Rend.
1 8,5 9 11,4
2 9,8 10 11,7
3 9,9 11 11,8
4 10,3 12 12,2
5 10,7 13 12,4
6 10,9 14 14,9
7 10,9
8 11,2
MEDIDAS DE VARIABILIDAD
MEDIDAS DE VARIABILIDAD
Rango
Rango intercuartil
Variancia
Desviacin estndar
Coeficiente de variabilidad
Introducci
Introducci
n
n
Cuando se dispone de
informacin de una variable
es necesario conocer si los
datos recopilados muestran
una variabilidad significativa.
15 10 5
Notas
Di spesi n de l as not as de dos al umnos
Alumno
x
y
Si los datos son muy semejantes entre si (notas del alumno Y), se
observara que no se encuentran muy dispersos con respecto a la
media; sin embargo, cuando los datos presentan diferencias
importantes entre si (notas del alumno X) se apreciara que los
datos son muy dispersos.
En todo anlisis estadstico el grado de variabilidad es importante
pues de esto depende el grado de confiabilidad de las
estimaciones que se realicen.
Rango
Es la diferencia entre el valor mximo de las observaciones y el
valor mnimo de las observaciones.
R= Obs. Mayor Obs. Menor
Nos da una idea muy rpida de dispersin.
Rango intercuartil
RIC=Q
3
-Q
1
tambin nos da idea de dispersin pero en el 50% central de los
datos
Es el promedio de las desviaciones de las observaciones con respeto a
su media, es una medida de variabilidad absoluta
( )
2
2
1
2
2
1 1
u
n
X n X
n
X X
s
n
i
i
=
( )
2
1
2
2
und
N
X
N
i
i
=
=
Varianza
poblacional
Varianza
muestral
VARIANZA
. und Varianza s =
Desviacin estndar
Del ejemplo del caf:
Calcule las medidas de variabilidad (rango, rango intercuartlico,
varianza, desviacin estndar y coeficiente de variabilidad) de la
variedad Caturra.
1) La suma de los cuadrados de las desviaciones de las
observaciones con respecto al promedio aritmtico es menor o
igual que la suma de los cuadrados de las desviaciones de las
observaciones con respecto a cualquier otro valor.
2) Si todas las observaciones son iguales a una constante la
varianza es cero.
3) Si a cada observacin se le suma una constante, la varianza no
cambia.
4) Si a cada observacin se le multiplica por una constante, la
varianza queda multiplicada por dicha constante.
R a a x x x
n
i
n
i
i i
= =
, ) ( ) (
1 1
2 2
Propiedades de la varianza:
Es una medida de dispersin
relativa que es fcilmente
comparable con otro coeficiente de
variacin de otro conjunto de
observaciones. El resultado se
expresa en porcentaje. Mientras
menor es el cv, menor es la
dispersin de los datos
100 . 100 .
x
s
cv CV = =
Coeficiente de Variacin
Del ejemplo de caf
Compare la variabilidad de las dos variedades de caf a travs del
coeficiente de variabilidad y el rango intercuartlico. Qu conclusiones
puede obtener de estos resultados?.
Grado de
variabilidad de
los datos
Coeficiente de
variabilidad
Con variabilidad baja Menos de 10%
Con variabilidad
moderada De 10% a 30%
Con alta variabilidad Ms de 30%
Ejemplo
Sueldo de los
empleados de la
compaa ABC
Sueldo de los
gerentes de la
compaa ABC
Media
2350 1890
Desv Est
655 2050
Coef Var
27.87% 18.82%
MEDIDA DE ASIMETR
MEDIDA DE ASIMETR
A
A
Distribucin simtrica: Cuando su curva de frecuencia es
simtrica con respecto al centro de los datos, en este caso
=Me=Mo.
7 6 5 4 3 2 1
9
8
7
6
5
4
3
2
1
0
X
F
r
e
q
u
e
n
c
y
Distribucion simetrica
Distribucin asimtrica positiva >Me>Mo
6 5 4 3 2 1
8
7
6
5
4
3
2
1
0
X
F
r
e
q
u
e
n
c
y
Distribucion asimetrica positiva
Distribuci
Distribuci
n asim
n asim
trica negativa
trica negativa
<Me<Mo
<Me<Mo
6 5 4 3 2 1
8
7
6
5
4
3
2
1
0
X
F
r
e
q
u
e
n
c
y
Distribucion asimetrica negartiva
Coeficiente de asimetr Coeficiente de asimetr a de a de Pearson Pearson
) ( 3 Me
As
=
s
me x
as
) ( 3
=
Poblacional
Muestral
Grado de Asimetra Valor del Sesgo
Simetra Perfecta Cero. El promedio es igual a la mediana
Sesgo Positivo Positivo. Promedio mayor que la mediana
Sesgo Negativo Negativo. Promedio menor que mediana
Xmnino : Es la observacin de menor valor
Xmximo : Es la observacin de mayor valor
Q1 : Primer Cuartil
Q3 : Tercer Cuartil
Mediana Q
3
Q
1
X
mximo
X
mnimo
BOXPLOT (Diagrama de Cajas)
Hombres
Mujeres
110
100
90
80
70
60
50
F
r
e
c
u
e
n
c
i
a
Peso de un grupode hombres y mujeres
En promedio el peso de los hombres es mayor que el de las mujeres.
La distribucin del peso de las mujeres tiene un valor extremo (outlier).
Hay mayor dispersin en el conjunto de peso de las mujeres que en el conjunto de
pesos de los hombres pues RIC
Muujeres
>RIC
Hombres
(en el 50% central)
Ambas distribuciones son simtricas positivas, observadas en el 50% central de los
datos.
Cuando se considera que una observacin es
un outliers?
Un x
i
es considerado un outliers si no pertenece
al intervalo [A,B], donde
A= Q
1
-1.5 RIC
B= Q
3
+1.5 RIC
Se encuest a 84 congresistas de cierto pas para averiguar el nmero de
viajes internacionales que realizan por ao, obtenindose los siguientes
resultados:
Stem-and-Leaf Display: C1
Stem-and-leaf of C1 N = 84
Leaf Unit = 1.0
(46) 0 6666666666666677777777777777788888889999999999
38 1 000000011111112222233344
14 1 55566667789
3 2 034
1.Calcule las medidas de tendencia central para estos datos
2.Calcule todos los valores numricos involucrados en el diagrama de cajas
Complete el grfico con estos valores. Interprete el rango intercuartil y la
simetra de los datos
3.Hallar e interpretar: Media, Mediana y Moda.
4. Hallar el intervalo del nmero de viajes que realizan el 80% central de estos
congresistas
Ejemplo
Se realizo un estudio en la provincia de Tambo Grande (Piura), luego de la
aplicacin de un nuevo abono en el cultivo de dos variedades de mango:
Kent y Haden. Los rendimientos en la produccin obtenidos luego de la
cosecha en Kg/Ha fueron los siguientes:
Variedades
Variedad Kent Variedad Haden
N de Ha Rend. N de Ha Rend. Stem-and-Leaf Display: x2
1 9 12 13.1
St em- and- l eaf of x2 N = 22
2 11.9 13 13.2
Leaf Uni t = 0. 10
3 12.6 14 13.5
4 12.6 15 13.5
8 10 22388999
5 12.6 16 13.7
( 6) 11 266888
6 12.8 17 13.8
8 12 2233
7 12.8 18 13.8
4 13 344
8 12.8 19 14.1
1 14
9 12.9 20 14.1
1 15
10 12.9 21 14.3
1 16 5
11 13.1 22 15.1
Descriptive Statistics: Variedad Kent
Variable N Mean StDev Minimo Maximo
x1 22 13.100 1.164 9.00 15.10
Descriptive Statistics: Variedad Hadem
Variable N Mean StDev Minimo Maximo
x2 22 11.836 1.422 10.20 16.50
a) Graficar un diagrama mltiple de cajas para los rendimientos de
ambas variedades de mango, completando todos los valores
comprendidos en el diagrama
b) Realice una comparacin acerca de la posicin, variabilidad,
simetra para el 50% central y outliers de ambas variedades.