Estadísticas I
Estadísticas I
Estadísticas I
FACULTAD DE _________
LICENCIATURA EN _______________________________
PARTICIPANTES:
__________________ X-XXX-XXXX
PROFESOR:
JOS ALMANZA
CUATRIMESTRE
II-2017
FECHA DE ENTREGA
21 DE AGOSTO DE 2017
1
NDICE
INTRODUCCIN .................................................................................................... 3
CAPTULO 1. MEDIDAS DE DISPERSIN ............................................................ 4
1. IMPORTANCIA DE LA MEDIDA DE DISPERSIN DE UNA DISTRIBUCION. .. 4
1.1 EL RANGO ........................................................................................................ 4
1.2 EL RANGO INTERFRACTIL ............................................................................. 5
1.3 EL RANGO INTERCUARTIL ............................................................................. 6
1.4 VARIANZA. ....................................................................................................... 8
1.5 DESVIACIN ESTNDAR. ............................................................................... 9
1. 6 RESULTADO ESTNDAR. ............................................................................ 10
1.7 EJERCICIOS PROPUESTOS. ........................................................................ 11
CAPTULO 2. MEDIDAS DE POSICIN: .............................................................. 13
2.1 CUARTILES Y PERCENTILES. .........................Error! Bookmark not defined.
2.2. DIAGRAMA DE CAJA Y BIGOTES. ............................................................... 14
2.3 EJERCICIOS PROPUESTOS. ........................................................................ 16
CAPTULO 3. COEFICIENTE DE VARIACIN DE PEARSON: ........................... 17
3.1 CONCEPTO: ................................................................................................... 17
3.2 EJEMPLO:....................................................................................................... 18
CAPTULO 4. MEDIDAS DE FORMA DE DISTRIBUCIN DE LOS DATOS: ..... 18
4.1 COEFICIENTE DE ASIMETRA...25
4.2 CURTOSIS. ..................................................................................................... 21
4.3 EJERCICIOS PROPUESTOS. ........................................................................ 22
CONCLUSIONES.................................................................................................. 24
INFOGRAFA ........................................................................................................ 26
2
INTRODUCCIN
A consideracin del profesor, presentamos el desarrollo de cuatro temas centrales
indispensables para introducirnos a la ciencia de la estadstica. Abordaremos las
medidas de dispersin, que desglosa entre ellas el rango, el rango interfractil, el
rango intercuartil, la varianza y la desviacin estndar. Por otro lado, veremos las
medidas de posicin, entre ellas las siguientes: moda, mediana, media aritmtica,
cuartiles y percentiles, diagrama de caja y bigotes. Veremos el coeficiente de
variacin de Pearson y por ltimo las medidas de forma de distribucin de los datos,
veremos entre ellas la curtosis y asimetra.
3
CAPTULO 1. MEDIDAS DE DISPERSIN
1. IMPORTANCIA DE LA MEDIDA DE DISPERSIN DE UNA
DISTRIBUCION.
1. Nos proporciona informacin adicional que nos permite juzgar la confiabilidad de
nuestra medida de tendencia central. Si los datos se encuentran muy dispersos,
como los que representa la curva C de la siguiente figura, la posicin central es
menos representativa de los datos, como un todo, que cuando stos se agrupan
ms cerca alrededor de la media, como en la curva A de la misma figura.
1.1 EL RANGO
CONCEPTO:
El rango es la diferencia entre el ms alto y el ms pequeo de los valores
observados.
4
Ignora la naturaleza de la variacin entre todas las dems observaciones, y
tiene una gran influencia de los valores extremos como resultado de lo
anterior.
Debido a que slo mide dos valores, el rango tiene muchas posibilidades de
cambiar drsticamente de una muestra a la siguiente en una poblacin dada,
aunque los valores que caen entre el ms alto y el ms bajo sean bastante
parecidos.
Las distribuciones de extremo abierto no tienen rango, pues no existe un
valor ms alto o ms bajo en la clase de extremo abierto.
EJEMPLO:
La siguiente tabla representa los pagos anuales hechos por la asociacin Blue
Cross-Blue Shield a dos hospitales, Cumberland y Valley Falls:
Los pagos hechos al hospital Cumberland fueron 12. Dividimos entonces estos
datos en tercios, como 12 / 4 = 3, obtenemos de manera exacta, 4 pagos por cada
tercio.
6
Para calcular este rango, dividimos nuestros datos en cuatro partes, cada
una de las cuales contiene 25% de los elementos de la distribucin.
Los cuartiles son, entonces, los valores ms altos de cada una de estas
cuatro partes, y el rango intercuartil es la diferencia entre los valores del
primer y tercer cuartil.
Rango intercuartil
En la siguiente figura, otra presentacin de cuartiles donde stos dividen el rea
bajo la distribucin en cuatro partes iguales, cada una contiene 25% del rea.
Cuartiles.
EJEMPLO:
La compaa Casual Life Insurance estudia la compra de una nueva flota de autos.
El director del Departamento de Finanzas, Tom Dawkins, obtuvo una muestra de 40
7
empleados para determinar el nmero de millas que cada uno maneja en un ao.
Los resultados del estudio son los siguientes. Calcule el rango intercuartil.
Solucin:
Tenemos 40 datos, dividimos estos datos en cuatro partes, 40/4 = 10.
El valor ms alto del primer cuartil es = 8100
El valor ms alto del segundo cuartil es = 10000
El valor ms alto del tercer cuartil es = 12700
Rango intercuartil = Q3 - Q1 = 12,700 - 8,100 = 4,600 millas.
1.4 VARIANZA.
CONCEPTO:
Cada poblacin tiene una varianza. Para calcular la varianza de una poblacin, la
suma de los cuadrados de las distancias entre la media y cada elemento de la
poblacin se divide entre el nmero total de observaciones en poblacin. Al elevar
al cuadrado cada distancia, logramos que todos los nmeros sean positivos y, al
mismo tiempo, asignamos ms peso a las desviaciones ms grandes (desviacin
es la distancia entre la media y un valor).
FRMULA:
Donde:
8
1.5 DESVIACIN ESTNDAR.
CONCEPTO:
La desviacin estndar de la poblacin es simplemente la raz cuadrada de la
varianza de la poblacin. Como la varianza es el promedio de los cuadrados de las
distancias de las observaciones a la media, la desviacin estndar es la raz
cuadrada del promedio de los cuadrados de las distancias entre las observaciones
y la media.
FRMULA:
Donde:
EJEMPLO:
10
Donde:
EJEMPLO:
Suponga que observamos un frasco de compuesto que tiene 0.108% de impureza.
Como nuestra poblacin tiene una media de 0.166 y una desviacin estndar de
0.058, una observacin de 0.108 tendra un resultado estndar de 1:
Solucin:
Rango = 1.20 0.10 = 1.1
2. Se presentan las calificaciones de un examen de historia. Encuentre el percentil
80.
Solucin:
Primero, se ordenan los datos en orden ascendente.
11
El dato 16 (es decir 93) es el percentil 80.
3. Talent, Ltd., una compaa en Hollywood de seleccin de elenco, est en proceso
de elegir un grupo de extras para una pelcula. Las edades de los 20 hombres que
se entrevistaron primero son:
12
a) Calcule la varianza y la desviacin estndar.
13
La forma de calcular los cuartiles es igual a la ya vista para la mediana, pero
sustituyendo N/2 por N/4 y3 N/4 para Q1/4 y Q 3/4 respectivamente.
EJEMPLO:
De la misma forma podemos definir los decirles como aquellos valores de la variable
que dividen la muestra, ordenada, en 10 partes iguales. Estos valores, denotados
por Dk, con k = 1, 2,, 9, tienen entonces un valor tal que el decil kesimo deja por
debajo de el al 10xk por ciento de los datos de la muestra.
De la misma manera se definen los percentiles, tambin llamados percentiles, como
aquellos valores Pk (con k = 1, 2, 99) que dividen la muestra en 100 partes iguales.
Es decir, el percentil Pk deja por debajo de l al k por ciento de la muestra ordenada.
La forma de calcular deciles y percentiles es igual a la de la mediana y los cuartiles,
sustituyendo N/2 por la fraccin del nmero total de datos correspondiente.
Evidentemente algunos valores de cuartiles, deciles y centiles coinciden,
cumplindose, por ejemplo:
TRES VARIABLES
16
Observamos que el desplazamiento de las grficas de caja hacia la izquierda indica
que el entrenamiento ha dado resultado, ya que se tardan menos segundos en
recorrer la misma distancia, siendo la diferencia entre el mximo y el mnimo menor,
como as tambin la diferencia intercuartlica.
2. Se presentan las calificaciones de un examen de historia. Encuentre el percentil
80.
95 81 159 68 100 92 75 67 85 79 71 88 100 94 187 65 93 72 83 91
Primero, se ordenan los datos en orden ascendente.
59 65 67 68 71 72 75 79 81 83 85 87 88 91 92 93 94 95 100 100
El dato 16 (es decir 93) es el percentil 80.
17
3.2 EJEMPLO:
De un conjunto de edades de unos nios, su desviacin tpica sera 2.16 aos, hallar
el coeficiente de variacin.
lo que nos indica que la dispersin relativa de este conjunto de valores sera del
43%; la desviacin es el 43% del valor de la media.
18
Ejemplo:
Para los datos de tiempo de procesado en una CPU de 25 tareas, el coeficiente de
asimetra de Fisher es 0.91, lo que, como habamos visto y comentado con
anterioridad, pone de manifiesto que la distribucin es asimtrica a la derecha,
debido a la presencia de tiempos de procesado bastante altos en relacin al resto.
Ejemplo 2:
A modo de ejemplo, se analiza la asimetra de la distribucin de los precios (en
euros) por habitacin en los hoteles ubicados en una determinada zona turstica.
19
Con la informacin que proporciona dicha tabla, se obtienen los siguientes
resultados:
20
4.2 CURTOSIS.
CONCEPTO:
Las medidas de curtosis se aplican a distribuciones campaniformes; es decir,
unimodales y simtricas, o con una ligera asimetra. Tomando como referencia la
curva normal, que se ha descrito en este epgrafe, la curtosis es el mayor o menor
apuntamiento con respecto a ella. Se dice que una curva es muy apuntada, si es
ms alta y estrecha que la normal y si es ms plana y ancha que la normal, se dice
que es poco apuntada.
La curva normal de referencia es mesocrtica, mientras que se llaman
leptocrticas las curvas ms apuntadas que la normal y platicrticas las
menos apuntadas que la normal.
Como criterio de apuntamiento se elige el de las distancias de cada valor de la
variable respecto a su media elevadas a la cuarta potencia, de tal manera que, para
medir el grado de apuntamiento de una distribucin, se utiliza el denominado
coeficiente de exceso, al que se denota como g.
21
mayor que cero, la distribucin es ms apuntada que una normal de igual media y
varianza; es decir, es leptocrtica. Si el coeficiente de exceso es menor que cero, la
distribucin es menos apuntada que una normal de igual media y varianza; es decir,
es platicrtica.
EJEMPLO:
Partiendo de los datos del ejemplo anterior, que se refieren a los precios (en euros)
por habitacin de los hoteles ubicados en una determinada zona turstica, se
procede a la obtencin del coeficiente de exceso, para lo cual se elabora la Tabla
2.30, que contiene los correspondientes clculos intermedios.
SOLUCIN:
22
23
CONCLUSIONES
Finalmente podemos desarrollar las siguientes conclusiones:
El rango es la diferencia entre el ms alto y el ms pequeo de los valores
observados. El rango interfractil es una medida de la dispersin entre dos fractiles
de una distribucin de frecuencias, es decir, la diferencia entre los valores de los
dos fractiles.El rango intercuartil mide aproximadamente qu tan lejos de la mediana
debemos ir en cualquiera de las dos direcciones antes de recorrer una mitad de los
valores del conjunto de datos.Con el coeficiente de Pearson intentamos saber el
nmero de veces que la desviacin tpica, S, es ms grande o ms pequea que la
media.
La moda ser el valor de la variable que tenga una mayor frecuencia absoluta, es
decir, ser el valor ms frecuente.Para calcula la media aritmtica con datos no
agrupados se procede a realizar la sumatoria de cada valor de la variable,
multiplicando por su frecuencia absoluta y dividiendo por el nmero total de
variables.La mediana divide en dos grupos iguales al conjunto de los valores
considerados.
La curtosis es el mayor o menor apuntamiento con respecto a la curva normal. Tanto
mayor sea el coeficiente en valor absoluto, ms asimtricos sern los datos.
En general hemos resumido toda la base de estadstica descriptiva que nos
permitirn evaluar series de datos ya sea que se encuentren agrupados o no por
una frecuencia respectiva.
24
BIBLIOGRAFA
lvares, . J. (2010). Estadstica empresarial. Firmas Press.
Castillo, A. J. (2010). Apuntes de estadsticas para ingenieros. Univseridad de
Jan.
Garca Ramos, J. A. (2016). Estadstica empresarial. Servicio de Publicaciones de
la Universidad de Cdiz.
Garca, J. G. (s.f.). Estadsticas bsicas para estudiantes de ciencias. Madrid:
Universidad Complutense de Madrid.
graa, C. r. (2007). Introduccin a la estadstica descriptiva. Madrid: Netbiblo.
Levin, R. (2004). Estadstica para administracin y economa (7ma ed.). Mxico
D.F.: Pearson.
25
INFOGRAFA
http://inst-mat.utalca.cl/tem/sitiolmde/primero/guias-
liceo/recuperacion/Diagrama_de_Caja_y_Bigotes-2.pdf
26