MD Estadistica y Probabilidades (INGENIERIA - UTP)
MD Estadistica y Probabilidades (INGENIERIA - UTP)
MD Estadistica y Probabilidades (INGENIERIA - UTP)
ESTADSTICA
La estadstica es una ciencia, con su propio campo de estudio, y tambin un instrumento (conjunto
de tcnicas) que utilizan ampliamente otras ciencias. La estadstica como ciencia es una rama de la
matemtica aplicada, cuyo objeto de estudio es el comportamiento de las variables que pueden
asociarse a una o ms poblaciones.
La estadstica es una ciencia que estudia la recoleccin, anlisis e interpretacin de datos, ya sea
para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo
estadstica es ms que eso, en otras palabras es el vehculo que permite llevar a cabo el proceso
relacionado con la investigacin cientfica.
Estadstica descriptiva
Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de
estudio. Los datos pueden ser resumidos numrica o grficamente
Estadstica inferencial
Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en
cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en
los datos y extraer inferencias acerca de la poblacin bajo estudio.
VARIABLES
Una variable es una caracterstica observable que vara entre los diferentes individuos de la
poblacin, dicha caracterstica debe ser susceptible de ser medido. La informacin que disponemos
de cada individuo es resumida en variables.
Ejemplos:
Peso corporal
Condicin econmica
Tiempo de espera
Utilidades de una empresa
..
..
TIPOS DE VARIABLE
Variable cualitativa o categrica.
Cuando la variable est asociada a una caracterstica cualitativa o atributo. Es decir, son variables
cuyos valores son cualidades. Dependiendo del nmero de categoras pueden ser dicotmicas o
politmicas.
Ejemplos:
Condicin econmica
Marca de auto
2
Dicotmica: Es aquella variable que solo puede adoptar dos atributos o caractersticas.
Ejemplos:
Resultado de un encuentro de vley
.
Politmica: Es aquella variable que solo puede adopta ms de dos atributos o caractersticas.
Ejemplos:
Estado civil
..
Variable cuantitativa o numrica
Cuando la variable est asociada a una caracterstica cuantitativa. Es decir, estas surgen cuando se
puede establecer cunto o qu cantidad posee una determinada caracterstica. Pueden ser discretas
o continuas.
Ejemplo:
Peso corporal.
Gasto por consumo de energa elctrica.
.
.
MEDICIN
Es asignar un nmero o smbolo a objetos o sucesos de acuerdo a reglas predeterminadas.
ESCALA DE MEDICIN
Es el grado de precisin como se expresa la medida de la variable.
3
Nominal
Son aquellas que establecen la distincin de los elementos en las categoras sin implicar orden entre
ellas.
Ejemplo:
Sexo: Mujer Hombre.
Servicios Hospitalarios: Medicina - Pediatra Neurologa.
..
Ordinal
Son aquellas que agrupan a los objetos, individuos, en categoras ordenadas, para establecer
relaciones comparativas. Es decir, son susceptibles de ordenacin pero no de medicin cuantitativa.
Ejemplo:
Nivel educativo: Primaria Secundaria Tcnico - Universitario
Estado de salud: Muy saludable Saludable - No saludable
.
Intervalar
Se tiene una escala intervalar, cuando los valores asignados a las unidades estadsticas no solo
permiten ordenarlas sino que adems, las diferencias iguales entre estos indican diferencias iguales
en las cuantas de las propiedades a medir. El inicio de la escala (0) es arbitraria, convencional.
Ejemplo:
Temperatura
Razn
Se tiene una escala razn, cuando los valores asignados a las unidades estadsticas no solo permiten
que estas puedan ser ordenadas, sino que adems, las diferencias iguales entre estos indican
diferencias reales en las cuantas de las propiedades a medir. El valor cero representa ausencia de la
caracterstica que se mide.
Ejemplo:
Edad
Peso
POBLACIN
Es un conjunto de datos que consta de todas las observaciones concebibles (o hipotticamente)
posibles de un fenmeno determinado.
MUESTRA
Es un subconjunto de individuos extrados de la poblacin con el fin de inferir mediante su estudio,
caractersticas de la poblacin.
PARMETRO
Son todas aquellas medidas que describen numricamente las caractersticas de una poblacin.
Tambin se les denomina valor verdadero, ya que una caracterstica poblacional tendr un solo valor
del parmetro. Sin embargo una poblacin puede tener varias caractersticas y, por tanto, varios
parmetros.
ESTADGRAFOS
Es aquella descripcin numrica de una caracterstica correspondiente a los elementos de una
muestra. De una poblacin se pueden obtener M nmeros de muestra posibles y en cada una de
ellas se puede cuantificar la caracterstica, obtenindose por lo general, valores diferentes para cada
muestra.
5
EJERCICIOS
Clasifique las siguientes variables y seale su escala de medicin:
Variable
Nmero de solicitantes que llega a
diario a una agencia de empleos.
Software estadstico.
Bancos comerciales.
Tiempo cronometrado en los 100
metros planos.
Velocidad de un automvil.
Empresas segn el nmero de
trabajadores.
Nivel socioeconmico.
Partidos polticos.
Producto bruto interno del Per.
Nmero de asistentes a clase.
Pases de la Unin Europea.
Puntuacin de un test de
coeficiente intelectual.
Tipo de variable
Escala
yi
ni
Ni
hi
Hi
hi%
Hi%
Y1
n1
N1
h1
H1
h1%
H1%
y2
n2
N2
h2
H2
h2%
H2%
y3
n3
N3
h3
H3
h3%
H3%
y4
n4
N4
h4
H4
h4%
H4%
ym
nm
Nm
hm
Hm
hm%
Hm%
7
Donde:
yi: representa los valores de la variable o el valor asignado a algn atributo de la variable
(caso de variables cualitativas).
ni: frecuencia absoluta del valor yi, representa el nmero de veces que aparece este valor en
el conjunto de observaciones.
hi%: frecuencia relativa porcentual, es decir hi multiplicado por 100%; nos permite observar
la frecuencia absoluta en forma porcentual respecto del total.
25300
CORPORATIVOS
23364
MEDIANAS EMPRESAS
21428
GRANDES EMPRESAS
21170
HIPOTECARIOS
16006
PEQUEAS EMPRESAS
13941
MICROEMPRESAS
7874
Si se quiere obtener una informacin ms detallada que la que se muestra en la tabla, podemos
representar esos valores en forma porcentual. Primero, obtengamos el total
CONSUMO
25300
CORPORATIVOS
23364
MEDIANAS EMPRESAS
21428
GRANDES EMPRESAS
21170
HIPOTECARIOS
16006
PEQUEAS EMPRESAS
13941
MICROEMPRESAS
7874
TOTAL
129083
9
Luego, obtenemos el valor del hi, este se obtiene dividiendo cada valor entre el total. Una vez
calculado el hi multiplicamos por 100% (hi%), el resultado representar el porcentaje respecto al
total.
Interpretaciones:
10
11%
CONSUMO
CORPORATIVOS
MEDIANAS EMPRESAS
12%
GRANDES EMPRESAS
HIPOTECARIOS
18%
PEQUEAS EMPRESAS
MICROEMPRESAS
16%
17%
MICROEMPRESAS
6%
CONSUMO
20%
HIPOTECARIOS
12%
GRANDES
EMPRESAS
16%
CORPORATIVOS
18%
MEDIANAS
EMPRESAS
17%
11
Si los datos no estn contabilizados
Ejemplo:
Se realizo una encuesta en un conjunto habitacional a 45 vecinos, la cual estaba orientada a saber si
estos estaban satisfechos con el servicio de vigilancia y seguridad que brinda una empresa. Se
obtuvieron los siguientes datos.
BBRMMRBRBBMRRMB
BBBRBMBMRBMRMBB
BRBBRMRMBRBBRBB
B: buena
R: regular
M: mala
Luego anotamos las frecuencias absolutas de cada caracterstica de la variable y los valores de las
frecuencias relativas de la misma forma que en el ejemplo anterior.
Interpretaciones:
Casi la mitad de los vecinos consideran que el servicio que se les brinda es bueno.
Un 22% cree que el servicio que se les ofrece es malo.
12
GRFICO DE BARRAS
Es aquel en el cual el fenmeno que se estudia queda representado por una serie de rectngulos,
barras o paraleleppedos, los cuales pueden dibujarse horizontal o verticalmente.
Porcentaje
50,0
40,0
30,0
20,0
10,0
0,0
Buena
Regular
Mala
Mala
Regular
Buena
10
13
22
CUADROS ESTADISTICOS
Se define como el conjunto de datos estadsticos ordenados en filas y columnas, que permiten leer,
comparar e interpretar las caractersticas de una o ms variables. Los datos son el resultado de la
ejecucin de una investigacin estadstica o el aprovechamiento de un registro administrativo con
fines estadsticos.
13
14
EJERCICIOS
1.- Se tiene informacin
(http://www.sbs.gob.pe)
Sistema
de
Privado
de
Pensiones
obtenida
de
la
SBS
Del 30 de julio al
3 de agosto
Del 6 al 10 de
agosto
Del 13 al 17 de
agosto
Del 23 al 27 de
julio
Del 30 de julio al
3 de agosto
Del 6 al 10 de
agosto
Del 13 al 17 de
agosto
Horizonte
Integra
Prima
Profuturo
Total
Cuadro estadstico
Horizonte
Integra
Prima
Profuturo
15
Grfico de Sectores
Del 23 al 27 de
julio
Del 30 de julio al
3 de agosto
Del 23 al 27 de
julio
Del 30 de julio al
3 de agosto
Del 6 al 10 de
agosto
Del 13 al 17 de
agosto
Horizonte
Integra
Prima
Profuturo
Total
Cuadro estadstico
Horizonte
Integra
Prima
Profuturo
Del 6 al 10 de
agosto
Del 13 al 17 de
agosto
16
Grfico de Barras
17
18
Propiedad relacionada con la frecuencia relativa
Ejemplo:
A las familias de una comunidad alto andina se le pregunt por el nmero de hijos, obtenindose los
siguientes resultados
2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Construiremos la tabla de distribucin de frecuencias para luego realizar algunas interpretaciones.
El primer paso es realizar un conteo o registro de valores de la variable que se repiten, es decir
obtener las frecuencias absolutas.
19
En la cuarta columna lo completamos con las frecuencias relativas y a partir de ella todas las dems
columnas.
20
N4 = 16; significa que el nmero de familias que tienen a lo ms 6 hijos es 16 existen 16
familias que a lo mas tienen 6 hijos.
Interpretaciones de las frecuencias porcentuales:
DIAGRAMA DE FRECUENCIAS
Se usa para representar los diferentes tipos de distribuciones de frecuencias de variables
cuantitativas discretas.
Representacin grfica de las distribuciones de frecuencias absolutas y relativas.
Considerando la tabla de distribucin de frecuencias del ejemplo anterior.
Observaciones:
Generalmente los valores de la variable se deben ubicar en el eje horizontal, indicando el
nombre de la variable.
Grficamente los valores estn representados por lneas, esto es debido que se est
trabajando con variables cuantitativas discretas (valores enteros).
21
22
EJERCICIOS
1.- La siguiente informacin muestra la inasistencia a la junta de accionistas de 20 accionistas
principales de una empresa de construccin en el ltimo semestre del 2014.
0
1 2 2 1 3 2 1 4 2 4 3 2 0 0 2 2 3 0 3
2.- El Ministerio de Desarrollo e Inclusin Social encarga a una consultora recabar informacin de una
regin selvtica del pas acerca del nmero de hijos en 50 familias con el fin de brindar apoyo
asistencial por parte del ministerio. Obtenindose los siguientes datos.
2
23
a.
b.
c.
d.
e.
f.
24
3.- En la tabla de frecuencias que se muestra faltan algunos datos. Completarla
yi
ni
Ni
14
hi
Hi
0.7
0.2
4.- Para medir la variable adaptacin sensorial en un trabajo de investigacin se utiliz una prueba
elaborada ad hoc para esta investigacin, donde la puntuacin mxima es 10 (mxima adaptacin) y
la puntuacin mnima 0 (mnima adaptacin). Dicho trabajo se aplic a 36 ingenieros participantes de
un curso de capacitacin de las fuerzas armadas.
9
25
El primer paso a seguir consiste en determinar el mximo y mnimo valor, esto nos llevar a obtener
la amplitud del recorrido.
Amplitud del recorrido o rango ()
= Xmax Xmin
= 96.4 91.6 = 4.8
Nmero de intervalos (m)
Criterios
5 m 20 (Eleccin subjetiva)
m = 1 + 3,3 log n (mtodo de Sturges)
n: nmero de observaciones
Para nuestro ejemplo elegimos m = 5, si en caso se hubiese elegido el mtodo de Sturges m=6.6 la
cual podramos aproximar a 6 a 7
Amplitud del intervalo (C)
26
Al trabajar con este nmero se nos puede hacer complicado la construccin de los intervalos, debido
a que es un nmero decimal, por ello es preferible trabajar con un nmero entero pero este nmero
debe ser ms prximo y superior a 0.96, en este caso el valor elegido es c = 1, al hacer este cambio
de c hace que el rango se modifique.
Rango = c x m = 1 x 5 = 5 4.8
Para ello modificamos la amplitud del recorrido, como la diferencia es de 0.2 entonces corremos 0.1
a la izquierda y 0.1 a la derecha.
Los lmites de clase vienen a ser los extremos de cada intervalo (o clase) con amplitud c, y
para construir los intervalos se comienza con el mnimo valor, que en nuestro ejemplo ser
con el nuevo mnimo 91.5.
27
Se debe tener en cuenta que los intervalos que se construyan deben ser semi-abiertos, es decir en un
extremo abierto y en otro cerrado (o viceversa).
Una vez construido los intervalos se procede a hacer el conteo de cuntos de estos datos pertenecen
a cada intervalo. De esta manera se obtendrn las frecuencias absolutas.
HISTOGRAMA DE FRECUENCIAS
Se usa para representar grficamente las distribuciones de frecuencias absolutas o relativas de datos
cuantitativos continuos agrupados en clases. Estos estn representados mediantes rectngulos cuya
base es la amplitud de la clase.
28
Histograma de frecuencias: Peso de cincuenta lingotes de acero
POLGONO DE FRECUENCIAS
Los polgonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las
bases superiores de los rectngulos en el histograma de frecuencias absolutas o relativas,
respectivamente.
Polgono de frecuencias: Peso de cincuenta lingotes de acero
29
30
EJERCICIOS
1.- Los sueldos mensuales (en dlares) de 60 operarios de la empresa TELCOM S.A. fueron los
siguientes:
440 560 335 587 613 400 424 466 565 393
453 650 407 376 470 560 321 500 528 526
570 430 618 537 409 600 550 432 591 428
440 340 558 460 560 607 382 667 512 492
450 530 501 471 660 470 364 634 580 450
574 500 462 380 518 480 625 507 645 382
Construya la tabla de frecuencia para estos datos y realice los grficos respectivos.
31
2.- Dada la siguiente distribucin de frecuencias que muestra las utilidades netas (en miles de nuevos
soles) de 200 pequeas empresas del rubro de telecomunicaciones.
Li Ls
ni
12
Ni
- 270
- 300
30
90
126
330 -
50
3.- La siguiente tabla muestra las puntuaciones obtenidas mediante una prueba a 36 ingenieros de
una empresa minera luego de recibir una capacitacin, las puntuaciones van de 0 a 80 puntos.
69
55
68
30
38
24
50
47
57
21
33
23
30
68
38
60
39
70
22
31
20
28
37
46
62
50
35
48
41
37
50
35
43
42
19
17
Organice los datos en una tabla de distribucin de frecuencias y realizar el histograma de frecuencias.
32
4.- En el artculo Determination of representative Subdivision (J. of Energy Engr, 1993: 43-55) se
muestran los datos de varias caractersticas de subdivisiones que se podran usar para decidir si se
suministra energa elctrica por medio de lneas areas o subterrneas. A continuacin se dan los
valores de la variable x = longitud total de calles dentro de una subdivisin:
1280 5320 4390 2100 1240 3060 4770 1050 360 3330 3380 340 1000 960 1320
530 3350 540 3870 1250 2400 960 1120 2120 450 2250 2320 2400 3150 5700
5220 500 1850 2460 5850 2700 2730 1670 100 5770 3150 1890 510 240 396
1419 2109
Organice los datos en una tabla de distribucin de frecuencias y realizar el histograma de frecuencias.
33
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.
1 2 0 5 3 5 7 1 2 1 3 4 3 3 2
Interpretacin: En todo el ciclo los alumnos llegaron en promedio 2,8 das tarde.
MEDIANA
Se define como aquel valor de la variable que supera a no ms de la mitad de las observaciones y al
mismo tiempo es superado por no ms de la mitad de las observaciones. La mediana es el valor
central.
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.
Primero: Ordenamos los valores de las observaciones de menor a mayor
34
En el ejemplo anterior el nmero de observaciones era 15, un nmero impar. Pero que sucede si el
nmero de observaciones es un nmero par, como por ejemplo:
1 2 0 5 3 5 7 1 2 1 3 4 3 3 2 0
En este caso se tiene 16 observaciones.
Ordenando los valores de las observaciones de menor a mayor
Interpretacin: El valor central del nmero tardanzas de los alumnos es de 2,5 das.
MODA
Es aquel valor de la variable que se presenta con mayor frecuencia; es decir es el valor que ms se
repite.
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.
1 2 0 5 3 5 7 1 2 1 3 4 3 3 2
Como se puede observar el valor que ms se repite es de 3 das, entonces el valor modal (Mo) es 3.
En este caso se conoce como unimodal.
Presentamos otra situacin
Ejemplo:
El curso de estadstica tiene 15 alumnos y se han registrado el nmero de das que llegaron tarde en
todo el ciclo.
1 2 0 5 3 5 7 2 2 1 3 4 3 3 2
En este caso se tiene dos modas: 2 y 3, se conoce como bimodal. En el caso que haya ms de dos
modas se conocen como multimodal.
A continuacin se presenta las ventajas y desventajas que cada medida de medida de tendencia
central tiene una respecto a otra.
35
MEDIA
VENTAJAS
DESVENTAJAS
MEDIANA
VENTAJAS
La mediana es fcil de entender y
puede ser calculada a partir de
cualquier tipo de datos.
La mediana est afectada por el
nmero de observaciones y no por la
magnitud de cualquier valor extremo.
Ejemplo:
0 0 1 2 2 2 3 Me(x) = 2
0 0 1 2 2 2 24 Me(x) = 2
DESVENTAJAS
Se debe organizar los datos antes de
realizar algn clculo para obtener la
mediana, esto puede consumir
mucho tiempo.
Ciertos procedimientos estadsticos
que usan a la mediana son mucho
ms complejos que si se usara la
media
MODA
VENTAJAS
Se puede usar como una localizacin
tanto para datos de variable
cualitativas como cuantitativas.
No est afectada por valores
extremos.
DESVENTAJAS
A menudo no hay un valor modal,
porque el conjunto de datos no
contiene valores que se repiten ms
de una vez.
Cuando el conjunto de observaciones
contiene dos, tres o ms modas,
stas son difciles de interpretar y
comparar.
36
Ejemplo:
A las familias de una comunidad alto andina se le pregunt por el nmero de hijos, obtenindose los
siguientes resultados
2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Interpretacin: El nmero promedio de hijos de las familias de una comunidad alto andina es 4,3
Ejemplo:
La informacin que se muestra a continuacin es referida 50 observaciones referentes a los pesos de
50 lingotes de acero producidos por una empresa minera. La muestra fue obtenida de la produccin
semanal, las unidades estn dadas en Kg.
37
Interpretacin: En promedio el peso de un lingote de acero es de 94,04 Kg.
PROPIEDADES
Propiedad 1
Si todos los valores observados
Ejemplo:
Propiedad 2
Si a cada valor de las observaciones
aritmtica del nuevo conjunto transformado
ms (o menos) la constante.
Ejemplo:
Propiedad 3
Si a cada valor de las observaciones
se le multiplica por una constante diferente de cero,
la media aritmtica del nuevo conjunto transformado
, es la media aritmtica del conjunto
original multiplicado por la constante.
Ejemplo:
38
Propiedad 4
De una poblacin de n observaciones se obtiene dos muestras de tamao n1 y n2 respectivamente.
Sean
las medias aritmticas de las muestras, entonces la media asociada a las n
observaciones est dada por:
Donde n = n1 y n2
Ejemplo:
En general
Sean
respectivamente.
Donde:
39
EJERCICIOS
1.- Calcular la media, mediana y moda para los siguientes datos:
11
8
6
7
7
5
9
11
10
3
4
8
3
2
8
40
3.- Calcule la media a partir del siguiente histograma:
4.- El precio medio de un centenar de artculos escolares es de S/. 8 570, los artculos se dividen en
dos grupos, con medias S/. 7 580 y S/. 9 780 Cuntos artculos hay en cada grupo?
41
5.- Un grupo de 100 atletas viaja en dos aviones. El primero lleva 40 atletas y el segundo los
restantes. Se sabe que el peso promedio de los 100 atletas es de 186,3 libras y los del segundo grupo
es de 10 libras menos que el de los atletas del primer avin. Cul es el peso medio de los atletas en
cada avin?
6.- Las notas del examen parcial del curso de estadstica de 20 alumnos son:
11 13 09 13 15 13 14 10 12 16 11 08 10 11 14 12 16 17 09 10
Siendo el promedio de 12,2. Debido a los trabajados presentados por los alumnos el profesor decide
aumentarle 3 puntos a cada alumno. Cul ser el nuevo promedio?
42
CUANTILES
Como una consecuencia del estudio de la mediana, es fcil ampliar este concepto a otros
estadgrafos que dividen a los datos en otras proporciones y no solo en el valor central como lo hace
la mediana.
CUARTILES
Los cuartiles son valores que divide a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales.
PRIMER CUARTIL: Q1
Es el valor que deja 25% de las observaciones menores o iguales a l y el 75% superiores a l.
Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas (en miles de nuevos soles) que se
adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
Primero se ordenan los datos en forma ascendente
En este caso se tiene 11 observaciones (n=11) luego realizamos el siguiente clculo para obtener la
posicin de primer cuartil.
43
Interpretacin: La deuda que es superada por el 75% de todas las deudas es de 7 mil soles, que
corresponde al primer cuartil.
TERCER CUARTIL: Q3
Es el valor que deja 75% de las observaciones menores o iguales a l y el 25% superiores a l.
En este caso se tiene 11 observaciones (n=11) luego realizamos el siguiente clculo para
obtener la posicin de tercer cuartil.
es un nmero entero, entonces
Interpretacin: La deuda que supera al 75% de todas las deudas es de 18 mil soles, que corresponde
al tercer cuartil.
Nota:
El cuartil Q2 coincide con la mediana la cual ya conocemos el mtodo para obtenerlo.
En el ejemplo anterior, para el clculo de Q1 y Q3
En este caso se tiene 12 observaciones (n=12) luego realizamos el siguiente clculo para obtener la
posicin de primer cuartil.
44
No es un nmero entero, entonces Q1 = 7 + (9-7)(0.25) = 7 + 0.5= 7.5 asistencias
Interpretacin: El nmero de asistencias que es superado por el 75% de todas las asistencias es de
7.5 asistencias, que corresponde al primer cuartil.
En este caso se tiene 12 observaciones (n=12) luego realizamos el siguiente clculo para obtener la
posicin de tercer cuartil.
Interpretacin: El nmero de asistencias que supera al 75% de todas las asistencias es de 11.75
asistencias, que corresponde al tercer cuartil.
Nota:
DECILES: Son valores que dividen a un conjunto de datos ordenados en forma ascendente (o
descendente) en diez partes iguales.
PERCENTILES: Son valores que dividen a un conjunto de datos ordenados en forma
ascendente (o descendente) en cien partes iguales.
MEDIDAS DE DISPERSIN
Son cantidades que miden el grado en que los datos numricos tienden a extenderse alrededor de
un valor medio.
La importancia que tienen es porque proporcionan ms informacin que permite juzgar la
confiabilidad de las medidas de tendencia central. Si los datos estn muy dispersos, las medidas de
tendencia central son menos representativas de los datos que cuando estn ms agrupadas
alrededor de la media.
Utilidad
Para medir el grado de variacin de los datos del conjunto; as por ejemplo, si existe poca dispersin
en la productividad de los obreros de una compaa, esto quiere decir, que los obreros tienen un
rendimiento muy homogneo, es decir, que existe poca variabilidad en el rendimiento; pero si la
dispersin es alta, esto quiere decir, que el rendimiento es heterogneo o que existe gran
variabilidad en el rendimiento.
45
Para complementar un promedio; es decir, entre ms baja sea la dispersin de un conjunto de datos,
ms altamente representativo ser el promedio de ese conjunto. Si se tiene el conjunto 10, 12, 68, 9,
40, 97, 33, 14, 15 y 8, la media aritmtica de este ser 30.6, que no es un promedio representativo,
pues como vemos los datos son muy variables. En ste caso, el clculo de la dispersin nos dara alto,
significando con ello, que existe alta variabilidad entre los datos.
Para comparar dos o ms conjuntos referentes a un mismo fenmeno. Si por ejemplo, tanto el
ingreso promedio mensual de un barrio A como el de un barrio B de una cierta ciudad es $370.000,
pero se sabe adems que existe ms variabilidad de los ingresos en el barrio A que en el barrio B,
entonces podemos afirmar que el promedio de los ingresos en el barrio A es menos representativo
que en el barrio B., es decir que existe peor distribucin del ingreso en el barrio A que en el B.
Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
46
Desviacin Media
Es la media aritmtica de los valores absolutos de las desviaciones de los valores observados
respecto a la media aritmtica de stas.
Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
En este caso los datos estn sin tabular, primero debemos calcular la media
DM = 6.04
Varianza
Se define como la media aritmtica del cuadrado de las desviaciones de las observaciones con
respecto a su media.
Ejemplo:
Al examinar los registros de facturacin mensual de una empresa que vende al crdito, el auditor
toma una muestra de 11 de las facturas no pagadas. Las sumas que se adeudan a la empresa son:
4 18 11 7 7 10 21 5 33 9 12
47
Ejemplo:
A las familias de una comunidad alto andina se le pregunto por el nmero de hijos, obtenindose los
siguientes resultados 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7
Se tiene la tabla de distribucin de frecuencias, ya realizada anteriormente, de la cual slo nos
interesa las dos primeras columnas
Desviacin estndar
Se define como la raz cuadrada de la varianza.
48
Ejemplo:
Se tomaron dos exmenes a estudiantes del primer ciclo en los cursos de matemtica y economa,
las notas estn sobre 100 puntos. En el curso de matemtica la media fue de 72 puntos y una
desviacin estndar de 9 puntos; en el curso de economa se obtuvo una media de 80 puntos y
desviacin estndar 6 En cul de los cursos hay mayor dispersin?
Ejemplo:
Propiedad 2
Si a cada valor de las observaciones
nuevo conjunto transformado
Ejemplo:
49
Propiedad 3
Si a cada valor de las observaciones
se le multiplica por una constante diferente de cero,
la varianza del nuevo conjunto transformado
, es la varianza del conjunto original
multiplicado por la constante elevada al cuadrado, es decir
Ejemplo:
50
EJERCICIOS
1.- De los siguientes datos calcule los cuartiles y el coeficiente de variacin.
4
8
3
11
8
6
5
9
11
2
10
7
7
8
3
2.- Establezca, con base estadstica, en cul de las siguientes empresas el salario (en cientos de
nuevos soles) est repartido de forma menos dispersa.
51
y que
52
4.- Se cuenta con datos del peso y la estatura de un grupo de 20 nios entre 8 y 10 aos, y se desea
saber cul de las dos variables tiene mayor variabilidad.
5.- Los salarios de los obreros en una empresa presentaban en el ao 2013 una media de $412 y
desviacin estndar de $62 y para el ao 2014 la empresa decret para cada obrero un aumento de
$41, entonces Podramos decir que la empresa propone una distribucin ms equitativa de los
salarios de sus trabajadores para este ao? Sustente su respuesta.
53
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA
Nos indica la asimetra de una que presenta un conjunto de datos (o distribucin). Este coeficiente
caracteriza el grado de asimetra de una distribucin con respecto a su media.
54
= 4,3
S = 2,71
n = 20
55
TCNICAS DE CONTEO
Las tcnicas de conteo son usadas para enumerar eventos difciles de cuantificar. Comprende un
conjunto de procedimientos que permite determinar el nmero de resultados de un evento o
experimento aleatorio sin necesidad de utilizar una enumeracin e identificacin directa de todos los
posibles resultados de dicho evento o experimento.
PRINCIPIO DE ADICIN
Si una accin puede realizarse de n1 maneras diferentes y una segunda accin puede realizarse de n2
maneras diferentes, pero no es posible realizar ambas acciones conjuntamente, entonces n1 o n2
pueden realizarse alternativamente de n1 + n2 maneras diferentes.
Ejemplo:
Claudio va a comprar el repuesto de su automvil que se venden en 3 tiendas de La Victoria y 5
tiendas del Rmac. De cuntas maneras diferentes puede adquirir el repuesto?
PRINCIPIO DE MULTIPLICACIN
El principio multiplicativo es aplicable cuando el experimento se puede descomponer en un conjunto
de acciones secuenciales o independientes, de modo que cada resultado del experimento se
conforma con una posibilidad de cada una de esas acciones.
Si una accin puede realizarse de n1 maneras diferentes y una segunda accin puede realizarse de n2
maneras diferentes, entonces ambas acciones pueden realizarse secuencialmente de n1 x n2 maneras
diferentes.
56
Ejemplo:
Si Lorena tiene 2 blusas y 3 faldas diferentes, De cuntas maneras se puede vestir de manera
adecuada?
Este principio multiplicativo se generaliza para cualquier nmero de acciones a realizar, esto es, si
una primera accin se puede realizar de n1 maneras diferentes, una segunda accin se puede
realizar de n2 maneras diferentes,..., y una r-sima accin se puede realizar de nr maneras diferentes,
entonces las r acciones se pueden realizar de n1 x n2 x...x nr maneras diferentes.
Ejemplos:
Aplicando el principio de multiplicacin, tenemos 10 personas que pueden recibir el primer premio.
Una vez que ste ha sido entregado, restan 9 personas para recibir el segundo, y posteriormente
quedarn 8 personas para el tercer premio. De ah que el nmero de maneras distintas de repartir
los tres premios.
Cuntas placas de automvil se pueden hacer utilizando dos letras seguidas de tres cifras?
No se admiten repeticiones.
26 x 25 x 10 x 9 x 8 = 468 000
57
Ejemplo:
Se tienen en un estante de 3 libros; uno de lgebra, uno de Contabilidad y otro de Biologa. De
cuntas formas distintas se pueden ordenar los libros?
58
Ejemplo:
Un hombre tiene tiempo para jugar ruleta cinco veces a lo sumo. En cada juego gana o pierde un
dlar. El hombre empieza con un dlar y dejar de jugar si antes de la quinta vez pierde todo su
dinero o si gana tres dlares, esto es, si tiene cuatro dlares. Realizar un diagrama de rbol para
dicho experimento aleatorio.
PERMUTACIN
Las permutaciones son los diferentes arreglos u ordenamientos que se pueden realizar con una parte
o con todos los elementos de un conjunto.
Permutacin lineal.- Son los diferentes arreglos que se hacen en una lnea referencial.
Ejemplo:
De cuntas maneras diferentes se ordenan A, B, C y D tomados de dos en dos?
Se tienen cuatro elementos: A, B, C y D
59
En general
Factorial de un nmero.- Es el producto de todos los nmeros enteros positivos y consecutivos des
de la unidad hasta n. Se denota n!
n! = 1 x 2 x 3 x 4 xx (n-1) x n
Ejemplos:
4! = 1 x 2 x 3 x 4
7! = 1 x 2 x 3 x 4 x 5 x 6 x 7
Nota: Por convencin se asume que 0! = 1
Ejemplo:
De cuntas maneras diferentes se pueden sentar 4 personas alrededor de una mesa circular?
Sean A, B, C y D las personas que se van a ubicar alrededor de la mesa.
Se tiene 6 maneras.
En general
Ejemplo:
De cuntas maneras diferentes se pueden ordenar en una fila dos fichas iguales de color negro y
dos fichas iguales de color blanco?
60
Sean las fichas N, N, B y B
En general
Ejemplo:
Cuntas palabras diferentes se pueden formar con las letras de la palabra CASACA?
61
Es una combinacin de 4 elementos que se toman de 2 en 2 y se obtiene:
En general
Ejemplo:
Un grupo de 7 estudiantes se desea conformar dos comisiones. La primera comisin debe estar
integrada por 4 estudiantes y la segunda comisin por 3 estudiantes. De cuntas maneras diferentes
se puede elegir a los alumnos que deben conformar la primera comisin?
El grupo tiene 7 estudiantes, entonces n = 7
La primera comisin est conformada por 4 estudiantes, entonces k = 4.
62
EJERCICIOS
1.- Un artculo de computo se vende en tres galeras; en el primero se tienen disponibles 4 tiendas,
en el segundo 7 y en el tercero 6 tiendas. De cuntas maneras se puede elegir una tienda para
comprar dicho artculo?
2.- De cuantas maneras pueden ubicarse 8 personas en una banca de capacidad para 5 personas?
3.- Un entrenador de ftbol tiene 16 jugadores a su cargo, de los cuales uno est lesionado y no
puede jugar. De cuntas maneras podr formar su equipo, si cualquiera de los jugadores puede
desempearse en cualquier puesto?
63
5.- De cuntas maneras distribuiramos 3 monedas de S/.5 y 4 monedas de S/. 2 en una misma
lnea?
6.- En el comedor de la ciudad universitaria se ofrece un men que consiste en una sopa, un
segundo, un postre y una bebida. Cuntos almuerzos son posibles, si podemos elegir 4 tipos de
sopas, 3 tipos de segundo, 5 postres y 4 bebidas?
7.- Se debe formar una comisin de tres ingenieros: uno de sistemas, uno de electrnica y otro de
industrial Cuntas posibilidades de formar dicha comisin hay? Si se cuentan con tres de sistemas,
cuatro de electrnica y seis industriales.
64
PROBABILIDADES
El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan preguntas
como las que se mencionan a continuacin:
Estas preguntas en el lenguaje coloquial esperan como respuesta una medida de confianza
representativa o prctica de que ocurra un evento futuro, o bien una forma sencilla de interpretar la
probabilidad. En este tema lo que se quiere es entender con claridad su contexto, como se mide y
como se utiliza al hacer inferencias.
El conocimiento de la probabilidad es de suma importancia en todo estudio estadstico. El clculo de
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de azar, que
constituyen la base para la estadstica inferencial.
Experimento determinstico
Experimento no determinstico
Uno de estas es que cada experimento tiene varios resultados posibles que pueden
especificarse de antemano.
La segunda propiedad es que estamos inciertos acerca del resultado de cada experimento.
65
Ejemplos:
Conocer el nmero de alumnos que faltaran a clases, la prxima semana.
Preguntar a un profesor de secundaria la especialidad que tiene (Matemtica, Qumica,
Biologa, etc.)
Verificar la legalidad de un billete de $100 (legal o falso).
ESPACIO MUESTRAL
El espacio muestral asociado a un experimento aleatorio, es el conjunto de todos los resultados
posibles de dicho experimento aleatorio.
Lanzar una moneda y observar la cara superior (cara o sello)
1 = {C, S}
Lanzar un dado y observar el nmero que aparece en la cara superior.
2 = {1, 2, 3, 4, 5, 6}
Tiempo de espera hasta ser atendido en el banco.
3 = { t / 0 t}
EVENTOS
Un evento es un subconjunto del espacio muestral de un experimento aleatorio y lo denotaremos
por A, B, C, D, etc.
SUCESO
Un suceso es todo elemento del espacio muestral y lo designaremos por w, x, y, etc.
Ejemplos:
Consideremos el experimento aleatorio de lanzar un dado
= {1, 2, 3, 4, 5, 6}
Un evento podra ser:
Evento imposible
Evento que no ocurre nunca en un experimento aleatorio. Algunos eventos nunca pueden ocurrir en
el experimento aleatorio, y por eso se llama imposible. Se simboliza con .
66
Ejemplo:
Sea el evento
Evento seguro
Evento que siempre ocurre en un experimento aleatorio.
Ejemplo:
Sea el evento
B: Sacar una bola roja, de una urna que contiene 6 bolas rojas
B = Sacar una bola roja es un evento seguro, pues todas son rojas.
Evento D
Entonces:
Interseccin de eventos
Dado dos eventos A y B, se llama interseccin de A con B A B al evento formado por todos los
sucesos favorables a A y a B. Es decir ambos eventos ocurren.
AB = A B = {w / w A w B}
Evento B
67
Evento D
Entonces:
Evento D
68
DEFINICIN DE PROBABILIDAD
ENFOQUE CLSICO DE PROBABILIDAD
La probabilidad de un evento es la razn entre el nmero de casos (sucesos) favorables y el nmero
total de casos (sucesos) posibles, siempre que nada obligue a creer que algunos de estos sucesos
debe tener preferencia a los dems, lo que hace que sean igualmente posibles.
La probabilidad de un evento A: P(A), es un nmero, que mide el grado de certeza en el que un
evento A ocurre, y se obtiene con la frmula conocida como regla de Laplace.
Ejemplo:
En una urna se tienen tres bolas blancas y siete bolas rojas. Cul es la probabilidad de que cuando se
extraiga una bola este sea de color rojo?
69
Observacin:
La frecuencia relativa de un evento, est comprendido entre 0 y 1, por lo tanto 0 P(A) 1
ENFOQUE SUBJETIVO DE PROBABILIDAD
Este enfoque nos dice que la probabilidad de ocurrencia de un evento es el grado de creencia por
parte de un individuo de que un evento ocurra, basado en toda la evidencia a su disposicin. Bajo
esta premisa se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de
ocurrencia del evento. Es decir, que el evento ocurrir o no ocurrir esa sola vez. El valor de
probabilidad bajo este enfoque es un juicio personal.
Ejemplo:
La probabilidad que apruebe el curso es de 0,86
La probabilidad que mi equipo de futbol gane el campeonato es de 60%
AXIOMAS DE PROBABILIDADES
Independientemente de la forma como definimos la probabilidad, esta cumple los siguientes
axiomas.
Axioma 1
Axioma 2
P() = 1
TEOREMA DE PROBABILIDADES
Teorema 1
Teorema 2
70
P[] = 1 P[A]
Teorema 3
P[A] = 1 - P[]
Teorema 4
Teorema 5
Ejemplo:
De acuerdo con la tabla cul es la probabilidad de que una familia escogida al azar tenga un ingreso
familiar a) Entre $20 000 y $40 000, b) menor que $40 000, c) en cada uno de los extremos, o sea
menor que $20 000 o cuanto menos de $100 000?
De la tabla, podemos decir que los eventos (categoras) son mutuamente excluyentes.
Ejemplo:
De 300 estudiantes de la facultad de ingeniera, 100 se encuentran inscritos en matemtica y 80
estn inscritos en estadstica aplicada. Estas cifras incluyen a 30 estudiantes que estn inscritos en
ambos cursos. Cul es la probabilidad de que un estudiante elegido de manera aleatoria est
inscrito en matemtica (A) o en estadstica aplicada (B)?
Por lo descrito, podemos concluir que los eventos no son mutuamente excluyentes. Lo pedido se
puede expresar como P(A U B).
P(A U B) = P(A) + P(B) P(A B)
71
EJERCICIOS
1.- Se extraen dos bolas de una urna que se compone de una bola azul, una roja, una verde y otra
negra. Escribir el espacio muestral cuando:
a. La primera bola extrada se devuelve a la urna antes de sacar la segunda (con reposicin).
b. La primera bola extrada NO se devuelve a la urna antes de sacar la segunda (sin reposicin).
2.- En una urna que tiene 10 bolas enumeradas del 0 al 9, se extrae una bola al azar.
a. Cul es el espacio muestral?
b. Describe los eventos:
A: "Mayor que 6" B: "No obtener 6" C: "Menor que 6" escribiendo todos sus elementos.
c. Hallar la probabilidad de los eventos: AUB, AB y B'A'.
3.- Se lanzan dos dados y se suman los puntos obtenidos. Calcular la probabilidad de que la suma sea:
a. par
b. mltiplo de 3
c. mltiplo de 5
d. mayor que 6
72
4.- Dos amigos juegan con dos dados. Uno apuesta a obtener suma igual a 6 y el otro apuesta a
obtener suma igual a 7. Te parece el juego justo?
5.- Dos personas eligen al azar, cada una de ellas, un nmero del 1 al 5. Cul es la probabilidad de
que las dos elijan el mismo nmero?
P[A' B] = 0,4
P[A B] = 0,1
73
7.- En una clase en la que todos practican algn deporte, el 60% de los alumnos juega al ftbol o al
baloncesto y el 10% practica ambos deportes. Si adems hay un 60% que no juega al ftbol, cul ser
la probabilidad de que escogido al azar un alumno de la clase:
a. juegue slo ftbol
b. juegue slo baloncesto
c. Practique uno solo de los deportes
d. No juegue ni al ftbol ni al baloncesto.
8.- En un viaje organizado por Europa para 120 personas, 48 de los que van saben hablar ingls, 36
saben hablar francs, y 12 de ellos hablan los dos idiomas.
Escogemos uno de los viajeros al azar.
a. Cul es la probabilidad de que hable alguno de los dos idiomas?
b. Cul es la probabilidad de que hable francs, sabiendo que habla ingls?
c. Cul es la probabilidad de que solo hable francs?
74
9.- Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la
televisin. Los resultados son:
-
75
10.- Considere elegir al azar un alumno de cierta universidad, y sea A el evento de que el individuo
seleccionado tenga una tarjeta de crdito Visa y B el evento anlogo para una MasterCard. Suponga
que P(A)=0.5, P(B)=0.4 y P(AB)=0.25
a. Calcule la probabilidad de que el individuo seleccionado tenga al menos una de las dos
tarjetas (es decir, la probabilidad del evento A U B)
b. Cul es la probabilidad de que el individuo elegido no tenga ninguna de esas tarjetas?
c. Describa, en trminos de A y B, el evento de que el alumno seleccionado tenga una tarjeta
Visa, pero no una MasterCard, y luego calcule la probabilidad de este evento.
76
PROBABILIDAD CONDICIONAL
Cuando se defini las probabilidades, en cualquiera de sus enfoques, se relacion a todo el espacio
muestral y utilizamos el smbolo P(A) para denotar la probabilidad de estos eventos; podramos
haber usado el smbolo P(A/), que se lee probabilidad del evento A dado que ha ocurrido .
De la misma manera como se hubiera expresado la P(A) como una probabilidad condicional.
Ejemplo:
Si se lanza un dado, cul es la probabilidad de que se observe un nmero impar, dado que el
nmero que ha salido es mayor que 3?
A: se observa un nmero impar
A = {1, 3, 5}
B: se observa un nmero mayor que 3
B = {4, 5, 6}
77
Del grfico adjunto se calculan algunas probabilidades
P(AB) = 1/6 y P(B) = 3/6
Reemplazando en:
Ejemplo:
Una revista especializada en asuntos polticos realiz una encuesta sociolgica acerca de la actitud
poltica (progresista o conservadora), realizada a 375 universitarios de ambos sexos, las cuales estn
registradas en la siguiente tabla.
Cul es la probabilidad de que al seleccionar a uno de los universitarios sea progresista dado que se
sabe que es varn?
REGLA DE MULTIPLICACIN
De la definicin de probabilidad condicional, obtenemos una frmula para hallar la probabilidad de
la interseccin de dos eventos.
Ejemplo:
Una urna contiene 5 bolas rojas y 6 negras; se extraen al azar sucesivamente y sin reposicin dos
bolas, cul es la probabilidad de que las dos resulten rojas?
78
E = AB
79
Ejemplo:
En un criadero de aves se tienen palomas de color blanco y negro, adems se tienen tres jaulas. En la
jaula 1 hay dos palomas negras y tres blancas, en la jaula 2 cuatro palomas negras y dos blancas y en
la jaula 3 cinco negras y cinco blancas. Se selecciona al azar una jaula y se saca una paloma al azar de
esta jaula. Cul es la probabilidad que la paloma escogida sea blanca?
El espacio muestral est dado por las palomas de las tres jaulas y estas forman una particin del
espacio muestral.
= B 1 U B 2 U B3
Adems A = B1A U B2A U B3A, entonces por el teorema de probabilidad total
P(A) = P(B1)P(A/B1) + P(B2)P(A/B2) + P(B3)P(A/B3)
Como se tiene que escoger una jaula al azar, las tres jaulas tienen la misma posibilidad de ser
seleccionadas, entonces P(B1) = P(B2) = P(B3) = 1/3
80
Para responder a ello debemos calcular P(B1/A)
TEOREMA DE BAYES
Si los eventos B1, B2, B3,BK forman una particin del espacio muestral y A es un evento cualquiera
de , entonces:
para r = 1, 2, 3 k
Ejemplo:
La probabilidad de que un autobs que va del Callao a Chosica sufra un accidente en un da lluvioso
es del 9% y en da seco del 0.5%. Durante un perodo de 10 das ha habido 7 das secos y 3 lluviosos.
Sabiendo que se ha producido un accidente en esos das cul ser la probabilidad de que haya
ocurrido un accidente: a) en da lluvioso, b) en da soleado?
a) En da lluvioso
81
b) En da soleado
EVENTOS INDEPENDIENTES
En los ejemplos, sola suceder que P(A/B) era distinta a la probabilidad P(A), indicacin de que la
informacin ocurri B produjo un cambio en la probabilidad de la ocurrencia de A. Sin embargo,
hay otras situaciones en las que la probabilidad de que ocurra, o ya haya ocurrido, A no resulta
afectada si se sabe que ocurri B, as que P(A/B) = P(A). Entonces es natural pensar en A y B como
eventos independientes, lo que significa que la ocurrencia o no ocurrencia de un evento no tiene
nada que ver con la probabilidad de que ocurra el otro.
En conclusin:
P(A|B) = P(A)
Ejemplo
Se sabe que 30% de las lavadoras de cierta compaa requieren servicio mientras est vigente la
garanta, en tanto que slo 10% de sus secadoras necesitan este servicio. Si alguien compra una
lavadora y una secadora de esta compaa, cul es la probabilidad de que ambas mquinas
requieran servicio de garanta?
Sea A el evento en el cual la lavadora necesite servicio mientras est vigente la garanta y sea B el
evento definido de manera anloga para la secadora. Entonces, P(A) = 0.30 y P(B) = 0.10. Suponiendo
que las dos mquinas funcionan de modo independiente, la probabilidad deseada es
P(A B) = P(A) P(B) = (0.30) (0.10) = 0.03
La probabilidad de que ninguna mquina requiera servicio es
P(A B) = P(A) P(B) = (0.70) (0.90) = 0.63
82
EJERCICIOS
1.- Un gato persigue a un ratn. Este puede entrar en uno de los callejones A, B o C. La probabilidad
de que elija cada uno de ellos es del 30%, 50% y 20%, respectivamente. Y de que sea cazado en cada
uno de ellos del 40%, 60% y 10% respectivamente. Calcula la probabilidad de que el gato cace al
ratn. (prob total)
2.- Supongamos, siguiendo con el ejercicio anterior, que vemos al gato perseguir al ratn. Al poco
rato llega con l en la boca, en cul de los tres caminos es ms probable que lo haya cazado?
(bayes)
3.- Una comercializadora de ventas de automviles usados ofrece tres tipos de marca de autos. De
las ventas el 50% son de la marca 1, 30% son de la marca 2 y 20% de la marca 3. Cada fabricante
ofrece un ao de garanta en los repuestos y servicio tcnico. Se sabe que 25% de los autos de la
marca 1 requieren garanta, en tanto que los porcentajes correspondientes para las marcas 2 y 3 son
20% y 10% respectivamente. Cul es la probabilidad de que un comprador elegido al azar tenga un
auto que requiera reparacin mientras est en garanta? (prob total)
83
4.- El 20 % de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de
los ingenieros ocupan un puesto directivo y el 50 % de los economistas tambin, mientras que de los
no ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. Cul es la
probabilidad de que un directivo elegido al azar sea ingeniero? (bayes)
5.- Un jugador de baloncesto suele acertar el 75 % de sus tiros desde el punto de lanzamiento de
personales. Si acierta el primer tiro, puede tirar de nuevo a canasta. Calcula la probabilidad de que:
a) haga dos puntos b) haga un punto c) no haga ningn punto (princ de multiplicac)
6.- En una empresa hay 200 empleados: 100 hombres y 100 mujeres. Los fumadores son 40 hombres
y 35 mujeres. Determina las probabilidades P(Mujer/Fumador) y P(Fumador/Mujer) (prob. condic)
84
7.- Una compaa de prospeccin petrolera tiene dos proyectos activos, uno en Asia y otro en
Europa. Sea A el evento donde el proyecto asitico tiene xito y B el evento donde el proyecto
europeo sea exitoso. Suponga que A y B son eventos independientes con P(A) = 0.4 y P(B) = 0.7.
a. Si fracasa el proyecto asitico, cul es la probabilidad de que tambin fracase el proyecto
europeo? Explique su razonamiento.
b. Cul es la probabilidad de que por lo menos uno de los proyectos tenga xito?
c. Dado que por lo menos uno de los dos proyectos es exitoso, Cul es la probabilidad de que
slo el proyecto asitico tenga xito?
85
DISTRIBUCIN DE PROBABILIDADES
Una distribucin de probabilidades muestra los posibles resultados de un experimento y la
probabilidad de que cada uno se presente.
Ejemplo:
Suponga que le interesa el nmero de caras que aparecen en tres lanzamientos de una moneda.
Los posibles resultados son:
86
87
Variable aleatoria continua.- Estas pueden tomar una infinidad de valores, con ciertas limitaciones.
Por ejemplo
Si se mide algo, como la anchura de una pizarra, la estatura de una persona o la presin de la
llanta de un automvil.
Los tiempos de vuelos comerciales de Lima al Cusco pueden ser 1.02 horas, 0.987 horas,
1.012 horas, etc. La variable aleatoria es la cantidad de horas.
Media
Constituye un valor tpico para representar la localizacin central de una distribucin de
probabilidad. Alternativamente se podra decir que es un valor promedio de la larga duracin de una
variable aleatoria. Es tambin conocida como valor esperado.
Se trata del promedio ponderado en el que los posibles valores de una variable aleatoria se ponderan
con sus correspondientes probabilidades de ocurrir.
88
Varianza y desviacin estndar
Describe el grado de dispersin en una distribucin de probabilidades.
= E(x2) [E(x)]2
Ejemplo:
Luis Snchez vende automviles en Maquinarias S.A. Luis sabe que el da de mayores ventas son los
das sbados. Con la experiencia en ventas que tiene llega a elaborar la distribucin de
probabilidades de la cantidad de automviles que espera vender un sbado determinado.
Interpretaciones:
Este valor indica que, a lo largo de una gran cantidad de sbados, Luis espera vender un
promedio de 2.1 automviles un sbado cualquiera.
Si Luis trabaja 50 sbados en un ao, puede esperar vender (50)(2.1) 105 automviles solo
los sbados.
89
La desviacin estndar:
Interpretacin:
Si su compaero Jos ngeles tiene el mismo promedio de venta los das sbados (2.1) y una
desviacin estndar de 1.830 automviles, concluiramos que hay ms variabilidad en las
ventas sabatinas de Jos que en las ventas de Luis (1.830 > 1.136).
90
EJERCICIOS
1.- Dada una variable aleatoria donde su distribucin de probabilidades est dada por la siguiente
tabla:
x
P(x)
0,25
3
0,50
6
0,25
9
Calcule el valor esperado, la varianza y la desviacin estndar de x, es decir E(x), 2 y .
P(x)
0,20
0,15
0,25
0,40
91
3.- Una prestigiosa universidad realiz un estudio acerca de la cantidad de veces que postularon sus
alumnos hasta ingresar a la universidad. Dicho estudio se realiz el 2013 y la universidad contaba con
4000 alumnos. La informacin se muestra en la siguiente tabla.
Nmero de Nmero de
veces
estudiantes
309
1
1203
2
2017
3
348
4
123
5
a. Sea X una variable aleatoria de indica el nmero de veces que postul el estudiante hasta
ingresar a la universidad. Muestre la distribucin de probabilidades de esta variable
aleatoria.
b. Cul es la probabilidad de que el alumno haya ingresado luego de 4 intentos?
c. Calcule el valor esperado e interprete, luego obtenga el coeficiente de variacin.
92
DISTRIBUCIN BINOMIAL
En el mbito profesional tenemos muchas situaciones donde se espera que ocurra o no un evento
especfico. ste puede ser de xito o fracaso sin dar paso a un punto medio. Por ejemplo, en la
produccin de un artculo, ste puede salir bueno o malo. Casi bueno no es un resultado de inters.
Para situaciones como stas se utiliza la distribucin binomial.
ENSAYO DE BERNOULLI
Es cualquier ensayo de algn experimento que conduce slo a uno de dos resultados mutuamente
excluyentes.
Ejemplo:
Vivo o muerto
Enfermo o saludable
Positivo o negativo
Ganar o perder
.
.
Donde:
93
k: nmero de xitos. k = 0, 1, 2, 3,,n
Esperanza: E(X) = np
Varianza: Var(X) = npq
EJERCICIO
Erick y Jos se ponen a apostar jugando con dados. Erick dice que si al lanzar el dado 10 veces y
obtiene 3 veces el nmero 5, Jos le pagara S/. 50, caso contrario Erick pagar la misma cantidad a
Jos Cul es la probabilidad que gane Erick?
Resolucin
Primero, en cada lanzamiento la probabilidad de que Erick obtenga un 5 es 1/6 la cual podramos
representar con p = 1/6 como la probabilidad de xito.
Los lanzamientos que se realizan son independientes y adems la probabilidad de xito permanece
constante. Con esas caractersticas del experimento aleatorio podramos decir que cumple las
condiciones de la distribucin de probabilidades binomial.
Tenemos:
p=1/6 (probabilidad de xito)
n= 10 (nmero de lanzamientos)
k=3 (nmero de xitos requeridos para ganar el juego)
EJERCICIO
Un estudiante, que no asiste frecuentemente a clase, queda sorprendido y muy preocupado al
enterarse que ese da es el examen parcial. El examen consta de 8 preguntas y cada pregunta tiene 3
alternativas de opcin mltiple. Lo nico que le queda a este estudiante es adivinar la alternativa
correcta en cada pregunta. Si para aprobar el examen tiene que responder 5 ms preguntas
correctamente. Cul es la probabilidad de que este estudiante apruebe el examen?
Resolucin
La probabilidad de xito en cada pregunta es: p = 1/3 Dado que son ocho preguntas, entonces n=8 y
para aprobar el examen se necesita como mnimo responder correctamente 5 preguntas de las 8,
entonces se tiene que k = 5, 6, 7 y 8.
94
Nos piden:
95
EJERCICIOS
1.- Un jugador de tenis tiene 2/3 de probabilidad de ganar. Si se jug 4 partidos. Hallar la
probabilidad que gane 2 partidos.
2.- El gerente de produccin de la compaa record se encuentra realizando una revisin mensual de
la produccin de ollas. Se eligi 10 ollas y se observa si tiene defectos de fabricacin. Se conoce que
el 2% de la produccin de ollas tiene defectos.
a. Cul es la probabilidad de que en la muestra contenga ms de 2 ollas en defectos de
fbrica?
b. Cul es la probabilidad que ninguna olla en la muestra tenga defectos de fbrica?
3.- En una oficina de servicio al cliente se atienden a 100 personas diarias. Por lo general 10 personas
se van sin recibir bien el servicio. Determine la probabilidad de que en una encuesta a 15 clientes 3
no hayan recibido un buen servicio.
96
4.- El 70% de los ejecutivos que asisten a una reunin de directorio llevan una laptop. Si en un
directorio se renen 10 ejecutivos.
a. Calcule la probabilidad de que al menos tres ejecutivos no lleven su laptop.
b. Cul es el nmero esperado de laptops que llevaran los ejecutivos a la reunin.
5.- Una empresa cuando postula a un contrato tiene 1/4 de probabilidad de ganar. Si la empresa
postula a 6 contratos.
a. Cul es la probabilidad que gane ms de 3 contratos?
b. Calcule cuantos contratos espera ganar.
97
DISTRIBUCIN DE POISSON
La distribucin de Poisson debe su nombre al matemtico francs Simen Denis Poisson (1781-1840),
aunque ya haba sido introducida en 1718 por Abraham De Moivre (1667-1754) como una forma
lmite de la distribucin binomial que surge cuando se observa un evento raro despus de un nmero
grande de repeticiones. Ms adelante se detallar dicho lmite o aproximacin a la distribucin
binomial.
La distribucin de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente
en el espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un
intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros
no negativos (0, 1, 2,...)
El concepto de evento raro o poco frecuente debe ser entendido en el sentido de que la
probabilidad de observar k eventos decrece rpidamente a medida que k aumenta.
UTILIDAD
1. La distribucin de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de
ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.
2. Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.
3. Es muy til cuando la muestra o segmento n es grande y la probabilidad de xitos p es
pequea.
4. Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un
segmento n dado como por ejemplo: distancia, rea, volumen o tiempo definido.
Ejemplos:
CONDICIONES
Para que una variable siga una distribucin de Poisson deben cumplir las siguientes condiciones:
1. En un intervalo muy pequeo (p. e. de un milisegundo) la probabilidad de que ocurra un
evento es proporcional al tamao del intervalo.
2. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es tan
reducida que, a efectos prcticos, se puede considerar nula.
3. El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier
otro intervalo pequeo que no se solape con aqul.
Estas propiedades pueden resumirse en que el proceso que genera una distribucin de Poisson es
estable (produce, a largo plazo, un nmero medio de sucesos constante por unidad de observacin) y
98
no tiene memoria (conocer el nmero de sucesos en un intervalo no ayuda a predecir el nmero de
sucesos en el siguiente).
FUNCIN DE PROBABILIDAD DE LA DISTRIBUCIN DE POISSON
Donde:
Esperanza: E(x) =
Varianza: Var (x) =
99
Para calcular dicha probabilidad se tendra que calcular el nuevo valor de , esto se podra hacer
mediante una regla de tres simples.
En este caso el nmero promedio de personas que llegan al cajero en un periodo de 3 minutos es 2,
es decir = 2.
A la pregunta Cul es la probabilidad que llegue al cajero una persona en un periodo de 3 minutos?
Se tiene que k = 1 y = 2.
En este caso el nmero de defectos en la autopista por cada kilmetro es de 2/5, es decir = 2/5.
Entonces la probabilidad de no encontrar ningn defecto en un kilmetro de autopista se calcula con
k = 0 y = 2/5
EJERCICIO
La probabilidad de que haya un accidente en una compaa de manufactura es de 0,02 por cada da
de trabajo. Si se trabajan 300 das al ao. Cul es la probabilidad de tener 3 accidentes al ao?
Resolucin
En este caso dicha probabilidad se puede calcular con la distribucin binomial con parmetros p =
0,02 y n = 300 como nos piden 3 accidentes al ao, entonces k = 3.
100
Para hacer uso de la aproximacin Poisson-binomial se debe verificar ciertas condiciones: p=0,02
0,05 y n=300 20 podramos decir que la aproximacin ser buena.
Calculamos la probabilidad mediante la distribucin Poisson, para ello el parmetro lo calculamos
como = n*p = 300*0,02 = 6
101
EJERCICIOS
1.- Al departamento de reservaciones de cierta Aerolnea llegan en promedio 30 llamadas por hora.
a. Cul es la probabilidad de recibir 3 llamadas en un intervalo de 5 minutos?
b. Cul es la probabilidad de no recibir llamada alguna en un intervalo de 2 minutos?
2.- En una academia, las llamadas entran con una frecuencia de una cada dos minutos. Cul es la
probabilidad de recibir 3 llamadas en 5 minutos? y Cuntas llamadas se espera recibir en 30
minutos?
102
3.- El nmero promedio de camiones que transporta azcar que llegan a un puerto del norte del pas
es de 3 por hora. Las instalaciones del puerto pueden atender cuando mucho a 4 camiones por hora.
Cul es la probabilidad de que en una hora determinada se tenga que regresar los camiones?
4.- Se supone que el nmero de defectos en tela de una determinada fbrica de produccin es de
0,15 por metro cuadrado:
a. Calcular la probabilidad de tener 3 defectos en un metro cuadrado.
b. Calcular la probabilidad de tener 1 defecto en cinco metros cuadrados.
c. Calcular la probabilidad de que no haya defectos en 8 metros cuadrados.
103
5.- Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica,
inspecciona una muestra al azar de 200 alternadores de un lote. Si el 2% de los alternadores del lote
estn defectuosos. Cul es la probabilidad de que en la muestra, menos de tres estn con defectos?
104
DISTRIBUCIN HIPERGEOMTRICA
La distribucin Hipergeomtrica surge en situaciones en donde el modelo aproximado de
probabilidad se corresponde con muestreo sin reemplazamiento de una poblacin dicotmica (xito
y Fracaso) finita. Concretamente, las suposiciones que llevan a considerar esta distribucin son:
La poblacin o conjunto de donde deba hacerse el muestreo consta de N individuos o
elementos a seleccionar.
Cada individuo puede ser caracterizado como un xito (E) o fracaso (F).
Se selecciona una muestra de n individuos entre los r individuos marcados como xito y los
(N r) restantes marcados como fracaso.
Para k = 0, 1, 2,. . . , n
k r
nk N-r
Esperanza:
Varianza:
105
EJERCICIO
Un fabricante de dispositivos elctricos para automviles los empaqueta en lotes de 25. El
comprador los inspecciona tomando 3 dispositivos y acepta un lote si encuentra menos de dos
dispositivos defectuosos.
a. Calcular la probabilidad de que el comprador acepte un lote con 6 dispositivos defectuosos.
b. Cul es el nmero esperado y la varianza de los dispositivos defectuosos en los 3 inspeccionados?
Resolucin
Se tiene un conjunto de N = 25 dispositivos, en los que hay r = 6 defectuosos, y N r = 19 no
defectuosos. Extraemos n = 3 sin reemplazo. Considerando la variable aleatoria: X = numero de
dispositivos defectuosos en los 3 seleccionados
(N = 25, r = 6, n = 3)
106
EJERCICIOS
1.- Como parte de un estudio de la contaminacin del aire, un inspector decide examinar la emisin
de gases de seis de los 24 camiones de carga de una compaa. Si cuatro de los camiones de la
compaa emiten cantidades excesivas de contaminantes, Cul es la probabilidad de que ninguno
de ellos sea incluido en la muestra del inspector?
2.- Entre los 120 aspirantes para ocupar un empleo, slo 80 estn realmente calificados para hacerlo.
Si se selecciona al azar cinco de estos aspirantes para realizar una entrevista a fondo, determine la
probabilidad de que dos de los cinco estn para el trabajo.
3.- Un ingeniero de control de calidad inspecciona una muestra tomada al azar de dos bateras para
laptops de cada lote de 18 unidades que llega y acepta el lote si ambas estn en buenas condiciones
de funcionamiento; en caso contrario, se inspecciona todo el lote y el costo se carga al distribuidor.
Cules son las probabilidades de que este lote sea aceptado sin mayor inspeccin si contiene
a.- tres bateras que no estn en buenas condiciones de funcionamiento.
b.- Once de las bateras en malas condiciones de funcionamiento?
107
4.- Cul es la probabilidad de que un auditor fiscal halle slo dos declaraciones de impuestos sobre
la renta con deducciones ilegtimas, si selecciona al azar cinco declaraciones de entre 15 de las cuales
nueve contienen deducciones ilegtimas?
108
PROPIEDAD
Si x es una variable aleatoria continua, adems a y b son dos constantes reales con a b, entonces
EJEMPLO APLICATIVO
El desgaste del dibujo (en miles de kilmetros) de los neumticos
de cierto tipo es una variable aleatoria cuya funcin de densidad
de probabilidad est dada por
Obtenga la probabilidad de que uno de estos neumticos se desgastar cuando mucho a 19 000 km.
Resolucin
Lo que nos piden es: P (0 < x 19)
109
EJERCICIOS
1.- La funcin de densidad de probabilidad de la variable aleatoria x est dada por
Determine k y P (0.5 x 1)
110
2.- El retraso o adelanto (en minutos) de un vuelo de AeroLand a Lima es una variable aleatoria cuya
densidad de probabilidad est dada por
donde los valores negativos son indicativos de que el vuelo llega adelantado y los valores positivos
sealan que el vuelo llega retrasado. Determine las probabilidades de que uno de estos vuelos
llegar
a)
b)
c)
d)
e)
111
Caractersticas fisiolgicas, por ejemplo: efecto de una misma dosis de frmaco a distintos
pacientes, prdida de peso por alguna dieta.
112
FUNCIN DE DENSIDAD DE PROBABILIDAD NORMAL
Esperanza:
Varianza:
Si la variable aleatoria est asociada a una distribucin normal, se denota de la siguiente manera
X ~ N(, )
Para calcular las probabilidades se tiene que integrar la funcin de densidad en un intervalo del
recorrido de la variable aleatoria.
113
TABLA DE DISTRIBUCIN NORMAL ESTNDAR
Si
(0,1)
Ejemplos:
Cmo hacemos si se quiere calcular probabilidades de una variable aleatoria que sigue una
distribucin normal con media y varianza ?
Es decir, cuando la variable aleatoria tiene la siguiente funcin de densidad
114
En este caso a partir de la funcin de distribucin normal realizamos un artificio para que este se
pueda calcular mediante una funcin de distribucin normal estndar como ya sabemos. A este
artificio se le conoce como estandarizacin.
Ejemplo:
Sea X una variable aleatoria asociada a una distribucin normal con media 2 y varianza 9, es decir X
N(2 ; 9). Calcular la probabilidad de que la variable aleatoria sea menor o igual a 2.5 sea P(x 2,5)
EJERCICIO
El peso en Kg de los habitantes de una determinada poblacin sigue una distribucin normal de
media 72 y varianza 7. Calcule la probabilidad de que un individuo de la poblacin pese menos de 80
kg.
Resolucin: Considerando la variable aleatoria X como el peso en Kg de los habitantes de una
poblacin
Piden:
EJERCICIO
Las calificaciones del examen de ingreso a una universidad, estn distribuidos normalmente con una
media de 75 puntos y una desviacin estndar de 5 puntos. Calcular la probabilidad de que al elegir a
un alumno al azar, este haya obtenido un puntaje
a. Mayor a 82 puntos.
b. Menor a 73 puntos.
c. Entre 68 y 81 puntos.
Resolucin:
Parte a
115
Parte b
Nos piden: P(x < 73)
Parte c
116
EJERCICIOS
1.- Una empresa paga a sus empleados una remuneracin promedio de 800 nuevos soles mensuales
con una desviacin estndar de 90 nuevos soles, se sabe que las remuneraciones sigue una
distribucin normal.
a. Qu porcentaje de los trabajadores reciben salarios entre 750 a menos de 900 nuevos
soles?
b. Si se llegase a seleccionar al 5% de trabajadores con mayores salarios de la empresa, de ese
grupo cul sera el menor valor salarial?
2.- Una compaa de refrescos est determinando el nivel de llenado para las nuevas mquinas
automticas. El nmero de onzas de llenado sigue una distribucin normal con una desviacin
estndar de 0.2 onzas. Cul debe ser el valor de la media que se establezca para que los envases de
ocho onzas se sobrellenen una vez en mil?
117
3.- Una empresa que fabrica focos indica a sus clientes que la duracin de focos para interiores del
hogar tiene una distribucin normal con una media de 2400 horas y desviacin estndar 100 horas. Si
una tienda comercializadora compro 2000 de estos focos. Calcule e interprete:
a. Cuntos focos duraran menos de 2000 horas?
b. Cuntos focos duraran entre 2350 y 2500 horas?
4.- La venta de gasolina de un grifo ubicado en la Av. Arequipa sigue una distribucin normal con un
promedio de 40 galones en una hora y con una desviacin estndar de 5,4 galones. Cul es la
probabilidad que en una hora se venda ms de 42 galones?
118
5.- Los promedio de las calificaciones de los alumnos de secundaria sigue una distribucin normal
con un promedio de 12 y una desviacin estndar de 1,2.
a. Calcule la probabilidad que al seleccionar un alumno tenga menos de 13 de nota.
b. Cual debe de ser la mnima calificacin aprobatoria si solamente se desea que el 60% de los
estudiantes pruebe.
6.- Se sabe que los gastos semanales efectuados por las familias sigue una distribucin normal con
una media de 350 nuevos soles y una desviacin estndar de 75.
a. Cuntas familias gastan menos de 300 nuevos soles?
b. Cuntas familias gastan entre 380 y 400 nuevos soles?
c. Si una familia presupuesto para la siguiente semana de 330 nuevos soles Cul es la
probabilidad de que los gastos reales sean mayores a los presupuestados?
119
DISTRIBUCION LOG-NORMAL
Muchas variables no se distribuyan de manera normal (gaussiana), sin embargo, aplicando alguna
transformacin es posible convertir los datos a una forma que est distribuida de esa manera.
La transformacin logartmica se aplica en muchos casos, en especial cuando el rango de las
observaciones abarca varios rdenes de magnitud.
Una variable aleatoria X cuyos logaritmos Y = ln(X) estn distribuidos de manera normal, se dice que
X sigue una distribucin log normal.
Es decir, si
) entonces
o -Normal
Donde:
Esperanza o media de Y:
Varianza de Y:
120
Ejemplo
En una empresa comercializadora de artculos de ferretera se cometen errores en el 10% de las
facturaciones realizadas, debido a la rotacin exagerada de su personal. Se tomo una muestra de
100 facturas y se quiere calcular la probabilidad de que 12 contengan errores. Es decir, se desea
determinar la probabilidad binomial de 12 xitos en 100 ensayos.
Al aplicar la aproximacin normal en este caso, se establece
Como sabemos la distribucin normal est asociada a una variable aleatoria continua y la binomial a
una discreta. Por tanto, para aproximar la probabilidad binomial de 12 xitos, se calcula el rea bajo
la curva normal correspondiente entre 11.5 y 12.5. El 0.5 que se resta y suma del 12 se llama factor
de correccin de continuidad.
El factor de correccin se debe porque se est utilizando una distribucin continua para aproximar
una distribucin discreta.
Por tanto, P(x = 12) para la distribucin binomial discreta se aproxima por P(11.5 x 12.5) para una
distribucin normal continua.
121
EJERCICIO
1.- Un hotel de un centro vacacional en Mncora tiene 150 habitaciones. En los meses de verano, la
ocupacin del hotel es de aproximadamente 75%.
a. Cul es la probabilidad de que por lo menos la mitad de las habitaciones est ocupada en un
da determinado?
b. Cul es la probabilidad de que 120 o ms habitaciones estn ocupadas en un da
determinado?
c. Cul es la probabilidad de que 70 o menos estn ocupadas en tal da?
122
MUESTREO
El muestreo es una herramienta de la investigacin cientfica, cuya funcin bsica es determinar que
parte de una poblacin debe examinarse, con la finalidad de hacer inferencias sobre dicha poblacin.
Se denomina censo al recuento de individuos que conforman una poblacin estadstica, definida
como un conjunto de elementos de referencia sobre el que se realizan las observaciones.
123
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general
pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de
muestreo no probabilsticos.
124
MUESTREO PROBABILISTICO
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamao n tienen la misma probabilidad de ser seleccionadas.
La ventaja del muestreo probabilstico estriba en que, por lo general, se identifica la distribucin de
muestreo del estadstico muestral correspondiente. La distribucin de muestreo permite plantear
afirmaciones probabilsticas acerca del error asociado con el uso de los resultados muestrales al
hacer inferencias de la poblacin.
125
2.- A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios,
nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como
sea necesario para completar el tamao de muestra requerido.
Ejemplo
A manera de ejemplo, seleccionemos una muestra a partir del listado de alumnos matriculados en el
curso.
Como se tiene la informacin de todos los alumnos del aula, podemos seleccionar a ocho estudiantes
(muestra de tamao 8) mediante MAS. Haremos uso del Excel para generar los nmeros aleatorios.
126
MUESTREO SISTEMTICO
En el muestreo sistemtico, los elementos son seleccionados de la poblacin dentro de un intervalo
uniforme que se mide con respecto al tiempo, al ordeno o al espacio.
Aun cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrn
secuencial, este mtodo puede requerir menos tiempo y, algunas veces, tiene como resultado un
costo menor que el mtodo de muestreo aleatorio simple.
La obtencin de una muestra sistemtica de tamao n de una poblacin de N elementos se consigue
mediante el siguiente procedimiento.
Listado de N = 30 alumnos
Tamao de la muestra n = 6
Tamao del salto sistemtico k = 30/6 = 5
Eleccin del arranque aleatorio (entre 1 y 5, usando el MAS) = 2
127
Luego se tiene los alumnos que conforman la muestra de tamao 6.
MUESTREO ESTRATIFICADO
En el muestreo estratificado los elementos de la poblacin primero se dividen en grupos, a los que se
les llama estratos, de manera que cada elemento pertenezca a uno y slo un estrato. La base para la
formacin de los estratos, que pueden ser departamento, edad, tipo de industria etc., est a
discrecin de las personas que disea la muestra. Sin embargo, se obtienen mejores resultados
cuando los elementos que lo forman son lo ms parecido posible (homogeneidad dentro de los
estratos).
Una vez formado los estratos utilizamos uno de los dos planteamientos:
o
o
Supongamos que los pacientes de un mdico estn divididos en cuatro grupos de acuerdo con su
edad, como indica la tabla.
El mdico desea averiguar cuantas horas duermen sus pacientes. Para obtener una estimacin de
esta caracterstica de la poblacin, podra tomar una muestra aleatoria de cada uno de los cuatro
grupos de edades y ponderar las muestras de acuerdo con el porcentaje de pacientes en ese grupo.
Nota:
La ventaja de las muestras estratificadas es que, cuando se disean adecuadamente, reflejan de
manera ms precisa las caractersticas de la poblacin de la cual fueron elegidas, en comparacin con
otro tipo de muestras.
MUESTREO POR CONGLOMERADOS
En el muestreo por conglomerado (o clusters) los elementos de la poblacin primero se dividen en
grupos separados, llamados conglomerados o clusters. Cada elemento pertenece a uno y slo un
conglomerado. Se toma una muestra aleatoria simple de los conglomerados. Todos los elementos en
cada conglomerado muestreado forman la muestra.
128
Este muestreo tiende a proporcionar mejores resultados cuando los elementos dentro de los
conglomerados no son semejantes. Lo ideal es que cada conglomerado sea una representacin, a
pequea escala, de la poblacin completa. Si todos son semejantes en este aspecto, tomando en la
muestra un nmero pequeo de conglomerados, se obtendr una buena estimacin de los
parmetros poblacionales.
Una de las principales aplicaciones del muestreo por conglomerados es el muestreo de reas, en el
que los conglomerados son las manzanas de una ciudad u otras zonas bien definidas.
129
EJERCICIOS
1.- Una empresa proveedora de servicio de cable desea seleccionar una muestra de tamao 10 de
toda una manzana de la urbanizacin Miramar del distrito de San miguel, para posteriormente hacer
un estudio de mercadeo. En la tabla adjunta se tiene la informacin del nmero de televisores que
poseen en cada vivienda de la manzana.
Si usted es el encargado de esta seleccin, obtenga los vecinos que compondrn la muestra
mediante la tcnica de muestreo aleatorio simple y el sistemtico.
130
2.- Se tiene el registro de notas de los alumnos del curso de Estadstica Aplicada. Seleccione
mediante el MAS y el sistemtico una muestra de tamao 6 para luego obtener el promedio de notas
de la muestra seleccionada con ambos mtodos.
131
3.- El encargado de recursos humanos de un empresa est interesado en saber el nmero promedio
de hijos que tienen sus empleado que laboran en tres turnos (1er turno: 6am a 2pm, 2do turno: 2pm
a 10pm y 3er turno: 10pm a 6am). Mediante el muestreo estratificado, calcule dicho promedio.
132
Se observa que los valores de cada muestra difieren del valor poblacional. Y adems solo hemos
obtenido tres muestras, imaginemos obtener 100 muestras y calculamos sus medias, es de hecho
que la gran mayora de estos difieren del valor verdadero del parmetro. Si a las medias de estas 100
muestras las organizamos en una tabla de distribucin de frecuencias para luego graficarlas
mediante un Histograma de frecuencias relativas podramos sacar algunas conclusiones.
Recordemos que en distintas muestras aleatorias simples se obtuvieron valores diferentes para cada
media muestral , como cada variable aleatoria puede tener muchos valores, suele ser de inters
conocer la media de todos los valores de
que se obtiene con las diferentes muestras aleatorias. A
la media de la variable aleatoria se conoce como valor esperado de cuya notacin es: E( ) =
la cual se nos indica que: Se espera que el valor esperado de sea igual a la media poblacional
133
La varianza de la media muestral :
NOTA:
En el caso de que la poblacin sea finita la varianza estar dada por:
A la desviacin estndar de la media muestral tambin se le conoce como error estndar.
Es de hecho que cada caracterstica acerca de la media muestral merece una demostracin, pero
para facilitar el anlisis mostraremos un ejemplo donde se pueda verificar lo planteado.
Ejemplo:
Se tiene registro del nmero de meses que dura una llanta de bicicleta hasta antes de su primera
refaccin a cinco nios (N=5).
Donde:
: varianza poblacional.
n : tamao de la muestra.
N : tamao de la poblacin.
Los resultados anteriores respecto al valor esperado y la varianza en la distribucin de muestreo de
son aplicables a cualquier poblacin. Lo que queda ahora es identificar las caractersticas de la
distribucin de muestreo, para ello consideraremos dos casos.
134
La poblacin tiene distribucin normal
En muchas situaciones es razonable suponer que la poblacin de la que se selecciona la muestra
aleatoria simple tiene una distribucin normal o casi normal. Cuando esto ocurre, la distribucin de
muestreo de est distribuida normalmente cualquiera que sea el tamao de la muestra.
Cuando la poblacin de la que se tom la muestra aleatoria simple no tiene distribucin normal, el
teorema del lmite central ayuda a determinar la forma de la distribucin de muestreo de .
TEOREMA DE LMITE CENTRAL
Cuando se selecciona una muestra aleatoria simple de tamao n de una poblacin, la distribucin de
muestreo de la media muestral puede aproximarse a una distribucin normal a medida que el
tamao de la muestra se hace grande (n 30).
Ejemplo:
En Lima el precio promedio del kilo de arroz es de S/. 3,2 con una desviacin estndar de S/. 0,4. Si
se selecciona una muestra de 100 tiendas comercializadoras de arroz. Cul es la probabilidad de que
el precio medio muestral del arroz sea menor a S/. 3,3?
135
EJERCICIOS
1.- En una muestra de 25 observaciones a partir de una distribucin normal con media 98.6 y
desviacin estndar 17.2,
a) Determine el valor de P ( < 95)
b) Calcule P (92< <102)
c) Halle el valor de P( > 100)
136
2.- Sofa Lerner, auditora de una compaa de tarjetas de crdito, sabe que el saldo promedio
mensual de un cliente dado es S/. 152 y la desviacin estndar de S/. 66. Si Sofa audita 50 cuentas
seleccionadas al azar, encuentre la probabilidad de que el saldo promedio mensual de la muestra sea
a) Menor que S/. 140
b) Entre S/. 150 y S/. 160
3.- El costo promedio de un departamento, segn una revista inmobiliaria, es de $ 58 000 con una
desviacin estndar de $ 4 800. Cul es la probabilidad de que un departamento elegido al azar
cueste igual o menos de $ 60 000?
137
4.- En una distribucin normal con media de 375 y desviacin estndar de 48, de qu tamao debe
tomarse una muestra para que la probabilidad sea un 0.95 de que la media de la muestra caiga entre
370 y 380?
138
ESTIMACIN
CONCEPTOS PREVIOS
PARMETRO
Son todas aquellas medidas que describen numricamente las caractersticas de una poblacin.
Tambin se les denomina valor verdadero, ya que una caracterstica poblacional tendr un solo valor
del parmetro. Sin embargo una poblacin puede tener varias caractersticas y, por tanto, varios
parmetros.
Ejemplo:
139
Por ejemplo; Como se tiene la informacin de todos los alumnos del aula, podemos seleccionar a
ocho estudiantes (muestra de tamao 8) de forma aleatoria, de esta manera calcular el estimador
puntual de la media y la proporcin poblacional.
140
El estimador de la media poblacional es .
Siempre que se seleccione una muestra aleatoria simple y se use el valor de la media muestral para
estimar el valor de la media poblacional , no se podr esperar que la media muestral sea
exactamente igual a la media poblacional. La razn prctica por la que interesa la distribucin de
muestreo de estriba en que se puede usar para proporcionar informacin probabilstica acerca de
la diferencia entre la media muestral y la media poblacional.
Nos podemos dar cuenta que existe una relacin entre el tamao de la muestra y la distribucin de
muestreo de .
Observamos que E( ) = es independientemente del tamao de la muestra, entonces la media de
todos los valores posibles de es igual a la media poblacional independientemente del tamao de
la muestra n. No obstante, el error estndar de la media
, est relacionado con la raz
cuadrada del tamao de la muestra. Siempre que este tamao aumente el error estndar de la media
disminuir.
ESTIMACIN POR INTERVALOS
Hasta ahora sabemos que un estimador puntual es un estadstico muestral que se usa para estimar
un parmetro poblacional. Como no se puede esperar que dicho estadstico muestral suministre el
valor exacto del parmetro poblacional, se suele calcular una estimacin por intervalo al sumar y
restar a la estimacin puntual una cantidad conocida como margen de error.
La forma general de una estimacin por intervalo es:
El objetivo de la estimacin por intervalo es aportar informacin sobre qu tan cerca se encuentra la
estimacin puntual obtenida de la muestra, del valor del parmetro poblacional.
ESTIMACIN POR INTERVALOS PARA LA MEDIA POBLACIONAL
Para obtener una estimacin por intervalo para la media poblacional se necesita la desviacin
estndar poblacional o la desviacin estndar muestral s a efecto de calcular el margen de error.
En la mayora de los casos no se conoce , y para calcular el margen de error se calcula s.
141
Observacin
En la tabla de probabilidad normal estndar se encuentra que 95% de los valores de cualquier
variable aleatoria distribuida normalmente aparecen dentro del 1.96 desviacin estndar de la
media.
Para nuestro ejemplo
95 de estos contendran
intervalos contengan a .
142
143
DETERMINACIN DEL TAMAO DE LA MUESTRA
Si se desea elegir un tamao suficientemente grande para obtener un margen de error deseado,
usaremos la estimacin por intervalo dada anteriormente
Donde:
Ejemplo
Halle el tamao de muestra para un nivel de confianza de 90% y margen de error de ____
Cuando se calcula una estimacin por intervalo para la media poblacional, a veces no se cuenta con
el valor de la desviacin estndar poblacional o no se puede hallar un buen estimador de sta,
entonces se utiliza s para estimar . El margen de error y la estimacin por intervalo de la media
poblacional se basan en una distribucin de probabilidad conocida como distribucin t.
144
Para ilustrar lo explicado volvamos a nuestro ejemplo
Para luego verificar mediante la informacin muestral correspondiente, si puede ocurrir una de las
siguientes situaciones:
Donde:
145
Se podra decir que ambas poblaciones tienen en promedio la misma estatura, para un nivel de
confianza del 99%?
146
EJERCICIOS
1.- Se toma una muestra de 49 observaciones de una poblacin normal con una desviacin estndar
poblacional de 10. La media de la muestra es de 55. Determine el intervalo de confianza de 99% para
la media poblacional.
2.- Se toma una muestra de 81 observaciones de una poblacin normal con una desviacin estndar
poblacional de 5. La media de la muestra es de 40. Determine el intervalo de confianza de 95% para
la media poblacional.
147
3.- Se desea estimar la media del tiempo empleado por un nadador en una prueba olmpica, para lo
cual se cronometran 10 pruebas, obtenindose una media de 41,5 minutos. Sabiendo por otras
pruebas que la desviacin tpica poblacional de esta variable para este nadador es de 0,3 minutos,
obtener un intervalo de confianza con un 95% de confianza. Cuntas pruebas habra que
cronometrar para que el margen de error en la estimacin de la media fuese tres segundos.
(Suponemos siempre que la variable que mide el tiempo del nadador sigue una distribucin normal.)
4.- Un estudiante de administracin pblica desea determinar la cantidad media que gana al mes los
miembros de los concejos ciudadanos de las grandes ciudades. El error (o margen de error) al calcular
la media debe ser inferior a S/. 100, con un nivel de confianza de 95% y adems a partir de un
informe del Ministerio de Trabajo el estudiante encontr que la desviacin estndar es de S/. 1000.
a.- Cul es el tamao de muestra que se requiere?
b.- Si el estudiante incrementar el nivel de confianza al 99% cunto sera el tamao de muestra?
148
5.- El propietario de AVINCA desea calcular la cantidad media de huevos que pone cada gallina. Una
muestra de 25 gallinas indica que ponen un promedio de 20 huevos al mes, con una desviacin
estndar de 2 huevos al mes.
a. Construya un intervalo de confianza del 95% para la medio poblacional.
b. Es razonable concluir que la media poblacional es de 22 huevos? Y de 27 huevos?
6.- La empresa COSTA S.A. contempla ofrecer un servicio de guardera para sus empleados. Como
parte del estudio de la viabilidad del proyecto, desean calcular el costo medio semanal por el cuidado
de nios de los empleados. Una muestra de 10 empleados que recurren al servicio de guardera
revela las siguientes cantidades gastadas la semana pasada (en nuevos soles).
92 108 100 96 120 98 99 80 104 102
Construya un intervalo de confianza de 90% para la media poblacional.
149
7.- El salario medio semanal en una muestra de n=30 empleados de una empresa grande es $280 y la
desviacin estndar muestral es $14. En otra empresa grande en una muestra aleatoria de n=40
empleados el salario medio semanal es $270 y la desviacin estndar muestral es $10. Construya el
intervalo de estimacin para diferencia entre los niveles de los salarios medios semanales en las dos
empresas con un nivel de confianza de 95%.
8.- Un fabricante de ordenadores est desarrollando un nuevo modelo de monitor, para lo cual
puede utilizar dos tipos de esquemas transistorizados. El fabricante selecciona una muestra de
esquema transistorizados del primer tipo, de tamao 12, y otra del segundo de tamao 11. Los datos
muestrales respecto a la vida de cada esquema son los siguientes:
150
9.- Una muestra aleatoria de 50 familias de la comunidad A tiene un ingreso medio familiar de $44
600 y la desviacin estndar es s = $2200. Una muestra aleatoria de 50 familias de la comunidad B
tiene un ingreso medio familiar de $43 800 y la desviacin estndar es s = $2800. Estime la diferencia
entre los ingresos medios familiares de las dos comunidades mediante un intervalo de 90% de
confianza.
151
PROPORCIN POBLACIONAL
Para la estimacin por intervalo de la proporcin poblacional p, se usar:
La distribucin de
152
Para nuestro ejemplo
Conocemos p =
, pero nuestro tamao de muestra es muy pequeo n=8, imaginemos un tamao
de muestra ms grande n = 15 y que =
Con esta informacin se podra construir un intervalo de estimacin para la proporcin poblacional,
con un nivel de confianza de 90%.
es un estimador
Si se desea construir una estimacin por intervalo para la diferencia de proporciones, los tamaos de
muestra deben ser suficientemente grandes para que
puede ser
153
Donde:
Se podra decir que ambas poblaciones tienen la misma proporcin de alumnos procedentes de
colegios particulares, para un nivel de confianza del 95%?
154
EJERCICIOS
1.- Una empresa de investigacin de mercado establece contacto con una muestra aleatoria de 100
hombres de una comunidad muy grande y encuentra que una proporcin muestral de 0.40 prefiere
las hojas de afeitar fabricada por la empresa cliente que a las otras marcas. Construir un intervalo de
estimacin para la proporcin de los hombres que prefieren la hoja de afeitar del cliente, para un
nivel de confianza del 99%.
2.- El director acadmico de la facultad de administracin rene una muestra aleatoria a nivel
nacional, datos de 250 estudiantes inscritos en programas de maestra en administracin de
negocios, y encuentra que 54 de ellos tiene licenciatura en negocios. Estime la proporcin en la
poblacin a nivel nacional de estos estudiantes que tienen licenciatura en negocios, use un intervalo
de 95% de confianza.
155
3.- En una muestra aleatoria de 500 familias que tienen televisores en una cierta ciudad, se
encuentra que 340 estn suscritas a un cierto canal de cable. Encuentre un intervalo de confianza de
99% para la proporcin real de familias en esta ciudad suscritas al canal de cable. Determine tambin
el tamao de muestra necesario si queremos tener una confianza de al menos 90% de que nuestra
estimacin de p esta dentro de 0.02 (margen de error) asumiendo la muestra anterior como una
muestra preliminar que nos proporciona una primera estimacin de p.
4.- Una empresa que se dedica a elaborar declaraciones de impuestos desea comprobar la calidad
del trabajo que se realiza en dos de sus oficinas regionales. Con muestras aleatorias de declaraciones
de impuestos elaboradas en dichas oficinas y verificando la exactitud de los reportes, la empresa
podr estimar la proporcin de declaraciones con errores en que incurri cada una de estas oficinas.
Para ello se selecciona una muestra y se obtienen los siguientes datos.
Obtenga un intervalo de
poblacionales.
156
5.- En una prueba de calidad de dos comerciales en televisin, cada anuncio se transmiti en areas
separadas de prueba, seis veces en una semana. A la semana siguiente se realiz una encuesta
telefnica para identificar a individuos que vieron los comerciales. A estas personas se les pidi su
opinin sobre cul era el principal mensaje de los anuncios. Se obtuvieron los siguientes resultados.
Obtenga un intervalo de
poblacionales.