Estadística, Ingeniería Química USC - Beatriz Pateiro López
Estadística, Ingeniería Química USC - Beatriz Pateiro López
Estadística, Ingeniería Química USC - Beatriz Pateiro López
ESTADÍSTICA
ingeniería química USC
APUNTES DE TEORÍA
Tema 1: ESTADÍSTICA DESCRIPTIVA
Tema 2: DESCRIPCIÓN ESTADÍSTICA DE DOS VARIABLES
Tema 3: PROBABILIDAD
Tema 4: VARIABLES ALEATORIAS UNIDIMENSIONALES
Tema 5: VECTORES ALEATORIOS: VECTORES BIDIMENSIONALES
Tema 6: MODELOS DE DISTRIBUCIÓN DE PROBABILIDAD
Tema 7: INFERENCIA ESTADÍSTICA: ESTIMACIÓN PUNTUAL E INTERVALOS DE CONFIANZA
Tema 8: CONTRASTE DE HIPÓTESIS
BOLETINES DE EJERCICIOS
Boletín 1: ESTADÍSTICA DESCRIPTIVA
Boletín 2: DESCRIPCIÓN ESTADÍSTICA DE DOS VARIABLES
Boletín 3: PROBABILIDAD
Boletín 4: VARIABLES ALEATORIAS UNIDIMENSIONALES
Boletín 5: INFERENCIA ESTADÍSTICA: ESTIMACIÓN PUNTUAL E INTERVALOS DE CONFIANZA,
CONTRASTE DE HIPÓTESIS
Índice
1. Introducción a la Estadística 2
2. Tipos de variables 3
3. Distribución de frecuencias 3
3.1. Descripción de variables cualitativas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2. Descripción de variables cuantitativas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4. Representaciones gráficas 6
4.1. Representaciones gráficas de variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 7
4.2. Representaciones gráficas de variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . 8
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción a la Estadística
estadística.
(Del al. Statistik).
1. f. Estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico
o de cualquier otra manifestación de las sociedades humanas.
2. f. Conjunto de estos datos.
3. f. Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias
basadas en el cálculo de probabilidades.
Diccionario de la lengua española. Real Academia Española
La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de
datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las
ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas de negocios
e instituciones gubernamentales.
Wikipedia
El campo de la estadística tiene que ver con la recopilación, presentación, análisis y uso de datos para tomar
decisiones y resolver problemas. Cualquier persona, tanto en su carrera profesional como en la vida cotidiana
recibe información en forma de datos a través de periódicos, de la televisión y de otros medios. De manera
específica, el conocimiento de la estadística y la probabilidad puede constituirse en una herramienta poderosa
para ayudar a los científicos e ingenieros a diseñar nuevos productos y sistemas, a perfeccionar los existentes y
a diseñar, desarrollar y mejorar los procesos de producción. Esta sección consiste en una breve introducción a
las actividades propias de la Estadística, sus objetivos y las herramientas y argumentos que utiliza. Pretendemos
distinguir con claridad las labores de recolección y tratamiento de datos, el cálculo de probabilidades y los
razonamientos de inferencia estadística. A continuación exponemos algunos conceptos básicos:
Muestra: Subconjunto de la población cuyos valores de la variable que se pretende analizar son conocidos.
Por tanto, nuestro objetivo es el conocimiento de la población. Podríamos pensar en analizar a todos los
individuos de la misma. Sin embargo, esto puede ser inviable por su coste o por el tiempo que requiere. Entonces
nos conformamos con extraer una muestra. La muestra proporciona información sobre el objeto de estudio. Lo
habitual en nuestro contexto es que en el procedimiento de extracción intervenga el azar.
Ejemplo 1: Se quiere analizar el número de horas de estudio semanal que dedican los estudiantes de la Titulación
de Ingeniería Química de esta Universidad. Para ello se pregunta a 50 alumnos de esta titulación.
Población: Todos los estudiantes de Ingeniería Química de esta Universidad.
Variable: Número de horas de estudio semanal.
Muestra: 50 alumnos encuestados.
Ejemplo 2: Se desea estimar el porcentaje de albúmina en el suero proteico de personas sanas. Para ello se
analizan muestras de 40 personas, entre 2 y 40 años de edad.
Población: Todas las personas sanas.
Página 2 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Cálculo de Probabilidades. Es una parte de la matemática teórica que estudia las leyes que rigen los mecan-
ismos aleatorios.
Inferencia Estadística. Pretende extraer conclusiones para la población a partir del resultado observado en la
muestra.
La Inferencia Estadística tiene un objetivo más ambicioso que el de la mera descripción de la muestra (Estadística
Descriptiva). Dado que la muestra se obtiene mediante procedimientos aleatorios, el Cálculo de Probabilidades
es una herramienta esencial de la Inferencia Estadística.
2 Tipos de variables
Variables cualitativas: No aparecen en forma numérica, sino como categorías o atributos. Ejemplos: sexo,
color de los ojos, profesión, potabilidad del agua, tipo de carburante, origen animal de la leche, etc. Se
clasifican a su vez en:
Cualitativas nominales: Miden características que no toman valores numéricos. A estas características
se les llama modalidades. Ejemplo: Si se desea examinar el origen animal de una serie de productos lácteos
considerados para un estudio, las modalidades podrían ser: Vaca, Oveja, Cabra,...
Cualitativas ordinales: Miden características que no toman valores numéricos pero sí presentan entre sus
posibles valores una relación de orden. Ejemplos: nivel de estudios: sin estudios, primaria, secundaria, etc.
Variables cuantitativas: Toman valores numéricos porque son frecuentemente el resultado de una medición.
Ejemplos: peso (kg.) de una persona, altura (m.) de edificios, temperatura (co ) corporal, concentración (g
100 ml−1 ) de inmunoglobina en suero sanguíneo, porcentaje (0−100 %) de agua recuperada al centrifugar
piedra arsénica, nivel (mg Kg−1 ) de cromo en hierba de centeno, etc. Se clasifican a su vez en:
Cuantitativas discretas: Toman un número discreto de valores (en el conjunto de números naturales).
Ejemplos: número de hijos de una familia, número de átomos que constituyen una molécula gaseosa, etc.
Cuantitativas continuas: Toman valores numéricos dentro de un intervalo real. Ejemplos: altura, peso,
concentración de un elemento, tiempo de reaccion de un compuesto quimico, etc.
3 Distribución de frecuencias
La primera forma de recoger y resumir la información contenida en la muestra es efectuar un recuento del número
de veces que se ha observado cada uno de los distintos valores que puede tomar la variable. A eso le llamamos
frecuencia. Daremos definiciones precisas del concepto de frecuencia en sus distintas formas de presentación.
Definimos previamente el tamaño muestral, al que denotamos por n, como el número de observaciones en la
muestra.
Página 3 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Frecuencia absoluta: Se denota por ni y representa el número de veces que ocurre el resultado ci .
Frecuencia relativa: Se denota por fi y representa la proporción de datos en cada una de las clases,
ni
fi = .
n
La frecuencia relativa es igual a la frecuencia absoluta dividida por el tamaño muestral.
Frecuencia absoluta acumulada. Es el número de veces que se ha observado el resultado ci o valores anteri-
P
ores. La denotamos por Ni = cj ≤ci nj .
Frecuencia relativa acumulada. Es la frecuencia absoluta acumulada dividida por el tamaño muestral. La
denotamos por
Ni X
Fi = = fj .
n
cj ≤ci
Debemos observar que las frecuencias acumuladas sólo tienen sentido cuando es posible establecer una relación
de orden entre los valores de la variable, esto es, cuando la variable es ordinal.
Las frecuencias se pueden escribir ordenadamente mediante una tabla de frecuencias, que adopta esta forma:
ci ni fi Ni Fi
c1 n1 f1 N1 F1
c2 n2 f2 N2 F2
.. .. .. .. ..
. . . . .
cm nm fm Nm Fm
Propiedades:
Pm
Frecuencias absolutas 0 ≤ ni ≤ n Pi=1 ni = n
m
Frecuencias relativas 0 ≤ fi ≤ 1 i=1 fi = 1
Frecuencias absolutas acumuladas 0 ≤ Ni ≤ n Nm = n
Frecuencias relativas acumuladas 0 ≤ Fi ≤ 1 Fm = 1
Claramente, la suma de las frecuencias absolutas es el número total de datos, n, y la suma de las frecuencias
relativas es 1. Observar que el último valor de la distribución de frecuencias absolutas acumuladas coincide con
el número de observaciones y que los valores no decrecen. Análogamente, el último valor de la distribución de
frecuencias relativas acumuladas es uno.
La información que proporcionan la distribución de frecuencias relativas y la distribución de frecuencias relativas
acumuladas es equivalente, pues cada una de ellas puede obtenerse a partir de la otra.
La distribución de frecuencias acumuladas permite conocer la proporción de valores por debajo de cierto valor
de la variable, o entre dos valores especificados, o por encima de cierta cantidad.
Ejemplo 3: Dentro de los procesos industriales de gran importancia para el Ingeniero Químico, están los procesos
de tratamiento de aguas. Un laboratorio determinó la dureza del agua de 10 muestras obteniendo los siguientes
Página 4 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
resultados.
Muestra Dureza
1 Agua blanda
2 Agua blanda
3 Agua dura
4 Agua muy dura
5 Agua muy dura
6 Agua extremadamente dura
7 Agua blanda
8 Agua blanda
9 Agua dura
10 Agua muy dura
Construir la tabla de distribución de frecuencias relativas para la variable X =”Dureza del agua”.
Aunque no hay unanimidad al respecto, un criterio bastante extendido consiste en tomar como número
√
de intervalos el entero más próximo a n.
Amplitud de cada intervalo: Lo más común, salvo justificación en su contra, es tomar todos los intervalos
de igual longitud. Una amplitud variable de los intervalos podría justificarse por la búsqueda de una
descripción más precisa en ciertas zonas de valores. A dichas zonas dedicaríamos más intervalos, con una
consiguiente menor longitud.
Posición de los intervalos: Los intervalos deben situarse allí donde se encuentran las observaciones y de
forma contigua. Por lo demás, es aconsejable que los restos de intervalos en los extremos derecho e
izquierdo del conjunto de observaciones sean similares.
Página 5 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Debemos añadir que para una variable cuantitativa discreta que pueda tomar demasiados valores distintos puede
ser conveniente una agrupación por intervalos como en el caso continuo.
A continuación veremos un ejemplo práctico de cómo se construyen los intervalos y la tabla de frecuencias para
variables cuantitativas. En la resolución de los ejemplos será útil ordenar la muestra de observaciones y después
calcular el recorrido o rango, que definimos como la diferencia entre el dato más grande y el más pequeño de
la muestra. El recorrido se usa para obtener la amplitud de los intervalos. La ordenación facilita mucho también
el recuento de las frecuencias en cada intervalo.
Ejemplo 4: Consideremos una muestra de 200 familias en las que contamos el número de hijos. Supongamos
que se han observado 50 familias sin hijos, 80 familias con un hijo, 40 familias con dos hijos, 20 familias con
tres hijos y 10 familias con cuatro hijos.
Tamaño muestral: n = 200.
Número de hijos ni fi Ni Fi
0 50 0,25 50 0,25
1 80 0,40 130 0,65
2 40 0,20 170 0,85
3 20 0,10 190 0,95
4 10 0,05 200 1
Ejemplo 5: Con la finalidad de conocer el comportamiento de algunas variables químicas del suelo y las corre-
spondientes del sedimento provocado por el proceso de erosión hídrica, se analizaron las pérdidas de suelo por
escurrimiento de 10 muestras de suelo. Los valores de pérdida de agua (cm3 ) de cada muestra son:
4 Representaciones gráficas
La representación gráfica de la información contenida en una tabla estadística es una manera de obtener una
información visual clara y evidente de los valores asignados a la variable estadística. Existen multitud de gráficos
adecuados a cada situación. Unos se emplean con variables cualitativas y otros con variables cuantitativas.
Página 6 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Página 7 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
% Datos
ci=[0 1 2 3 4];
% Guardamos en el vector ni las frecuencias absolutas
ni=[50 80 40 20 10];
5 % Guardamos en el vector Ni las frecuencias absolutas acumuladas
Ni=cumsum(ni);
% Diagrama de barras con las frecuencias absolutas
s u b p l o t (1,2,1), bar(ci,ni)
% Diagrama de frecuencias acumuladas
10 s u b p l o t (1,2,2), bar(ci,Ni)
Histograma: Es un gráfico para la distribución de una variable cuantitativa continua que representa frecuencias
mediante áreas. El histograma se construye colocando en el eje de abscisas los intervalos de clase, como
trozos de la recta real, y levantando sobre ellos rectángulos con área proporcional a la frecuencia. Una
vez más, aquí resulta irrelevante trabajar con frecuencias absolutas o relativas.
Destacamos que es el área y no la altura de los rectángulos lo que debe ser proporcional a la frecuencia. Así,
el eje de ordenadas no refleja la frecuencia, sino que la altura de cada rectángulo representa la densidad
Página 8 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
frecuencia
Densidad de frecuencia =
Amplitud
Sólo si se toman clases de la misma longitud, las frecuencias son proporcionales a las alturas del histograma
de modo que, donde hay más altura hay más datos y donde hay menos altura menos datos. Vamos a
dibujar el histograma correspondiente a la distribución de frecuencias obtenida en el Ejemplo 5.
Figura 3: Histograma.
x=[22 23 28 29 31 47 51 52 53 64];
extremos=[20; 35; 50; 65];
mihist3([22 23 28 29 31 47 51 52 53 64],[20; 35; 50; 65]);
El aspecto del histograma cambia variando el número de clases y el punto donde empieza la primera clase.
El polígono de frecuencias: Se obtiene uniendo mediante segmentos los centros de las bases superiores de los
rectángulos del histograma. Proporcionan una representación más suavizada que el histograma.
Página 9 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Diagrama de tallo y hojas: Los datos se redondean a dos o tres cifras significativas, tomándose como tallo
la primera o dos primeras cifras y como hojas las ultimas cifras. El tallo se separa de las hojas por una
línea vertical. Así, cada tallo se representa una sola vez y el número de hojas representa la frecuencia. La
impresión resultante es la de acostar un histograma.
Ejemplo 7: El DDT es un potente insecticida que fue muy empleado a comienzo de los 80. La mezcla técnica de
DDT está compuesta básicamente por tres compuestos, entre ellos el pp-DDT. Se tienen los siguientes niveles
de pp-DDT en 30 muestras de judías blancas (mg Kg−1 ).
0.03 0.05 0.08 0.08 0.10 0.11 0.18 0.19 0.20 0.20
0.22 0.22 0.23 0.29 0.30 0.32 0.34 0.40 0.47 0.48
0.55 0.56 0.58 0.64 0.66 0.78 0.78 0.86 0.89 0.96
A continuación se muestra el diagrama de tallo y hojas correspondiente. El punto decimal se situa un dígito a
la izquierda de |.
0 | 3588
1 | 0189
2 | 002239
3 | 024
4 | 078
5 | 568
6 | 46
7 | 88
8 | 69
9 | 6
Página 10 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
que se calcula sobre la muestra y que refleja cierta cualidad de la misma. Parece claro que el cálculo de estas
medidas requiere la posibilidad de efecutar operaciones con los valores que toma la variable. Por este motivo,
en lo que resta del tema tratamos sólo con variables cuantitativas.
donde la primera expresión corresponde a tener todos los datos cuantitativos y la segunda corresponde a
datos agrupados. Así, en el caso de una variable continua, tenemos dos opciones: o calculamos la media
con todos los datos (los sumamos y dividimos por el tamaño muestral), o usamos la tabla de frecuencias
considerando las marcas de clase y las frecuencias en cada clase. Los resultados serán diferentes, siendo
la segunda opción una aproximación de la primera, con la ventaja de una mayor sencillez de cálculo.
La media aritmética tiene interesantes propiedades:
Propiedades:
1. mı́n(xi ) ≤ x̄ ≤ máx(xi ) y tiene las mismas unidades que los datos originales.
2. EsP el centro de gravedad de los datos:
n
i=1 (xi − x̄) = 0,
Pn 2
Pn 2
i=1 (xi − x̄) = mı́n i=1 (xi − a) .
a∈R
3. Si yi = a + bxi ⇒ ȳ = a + bx̄. (las transformaciones lineales se comportan bien con la media).
Mediana: Una vez ordenados los datos de menor a mayor, se define la mediana como el valor de la variable
que deja a su izquierda el mismo número de valores que a su derecha. Si hay un número impar de datos,
la mediana es el valor central. Si hay un número par de datos, la mediana es la media de los dos valores
centrales. Si la variable está agrupada en intervalos de clase, se calcula la clase mediana (aquel intervalo
donde la frecuencia relativa acumulada es menor o igual que 0,5 en su extremo inferior y mayor que 0,5
en su extremo superior) para a continuación elegir un representante de este intervalo como mediana (la
marca de clase, el valor obtenido por interpolación lineal, etc.).
Propiedades:
1. La mediana es la medida de posición central más robusta (i .e. más insensible a datos anómalos).
2. LaPmediana verifica:
n Pn
i=1 |xi − Me | = mı́n i=1 |xi − a|.
a∈R
Observa que la media y la mediana tendrán valores similares, salvo cuando haya valores atípicos o cuando
la distribución sea muy asimétrica.
Página 11 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Moda: Es el valor de la variable que se presenta con mayor frecuencia. A diferencia de las otras medidas, la
moda también se puede calcular para variables cualitativas. Pero, al mismo tiempo, al estar tan vinculada
a la frecuencia, no se puede calcular para variables continuas sin agrupación por intervalos de clase. Al
intervalo con mayor frecuencia le llamamos clase modal.
Puede ocurrir que haya una única moda, en cuyo caso hablamos de distribución de frecuencias unimodal.
Si hay más de una moda, diremos que la distribución es multimodal.
Cuantiles: Sea p ∈ (0, 1). Se define el cuantil p como el número que deja a su izquierda una frecuencia relativa
p. Lo que es lo mismo, la frecuencia relativa acumulada hasta el cuantil p es p. Claro está que los cuantiles
sólo se podrán calcular con variables ordinales. Nótese que la mediana es el cuantil 00 5. Para calcular los
cuantiles seguiremos las siguientes indicaciones.
p · n − Ni−1
Cuantil p = Li + (Li+1 − Li )
ni
Algunos órdenes de los cuantiles tienen nombres específicos. Así los cuartiles son los cuantiles de orden
(0.25, 0.5, 0.75) y se representan por Q1 , Q2 , Q3 . Los deciles son los cuantiles de orden (0.1, 0.2,...,
0.9). Los percentiles son los cuantiles de orden j/100 donde j=1,2,...,99.
Recorrido intercuartílico: se define como la diferencia entre el cuartil tercero y el cuartil primero, es decir,
RI = Q3 − Q1 .
Varianza: Si hemos empleado la media como medida de posición, parece razonable tomar como medida de
dispersión algún criterio de discrepancia de los puntos respecto a la media. Según hemos visto, la simple
diferencia de los puntos y la media, al ponderarla, da cero. Por tanto, elevamos esas diferencias al cuadrado
para que no se cancelen los sumandos positivos con los negativos. El resultado es la varianza, cuya
definición se da a continuación. La primera expresión corresponde a tener todos los datos cuantitativos y
la segunda corresponde a datos agrupados.
n m
1X X
s2 = (xi − x̄)2 ; s2 = (ci − x̄)2 fi .
n
i=1 i
Página 12 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Propiedades:
2
1. sa+X = sX2 . La varianza no se ve afectada por cambios de localización.
2
2. sb·X = b2 · sX2 . La varianza se mide en el cuadrado de la escala de la variable
Que una medida de dispersión no se vea afectada por cambios de localización, como ocurre con la
varianza (propiedad 1), es una condición casi indispensable para admitirla como tal medida de dispersión.
La dispersión de un conjunto de datos no se ve alterada por una mera traslación de los mismos.
Desviación típica: La propiedad 2 de la varianza nos da pie a calcular la raíz cuadrada de la varianza, obteniendo
así una medida de dispersión que se expresa en la mismas unidades de la variable. Esta medida es la
desviación típica, que en coherencia denotamos por s.
Coeficiente de variación: Si queremos una medida de dispersión que no dependa de la escala y que, por tanto,
permita una comparación de las dispersiones relativas de varias muestras, podemos utilizar el coeficiente
de variación, que se define así:
s
CV = .
x̄
Por supuesto, para que se pueda definir esta medida es preciso que la media no sea cero. Es más, el
coeficiente de variación sólo tiene sentido para variables que sólo tomen valores positivos y que no sean
susceptibles de cambios de localización.
La interpretación de este coeficiente es la siguiente: Si su valor es prácticamente cero se dice que los datos
son simétricos. Si toma valores significativamente mayores que cero diremos que los datos son asimétricos
a la derecha y si toma valores significativamente menores que cero diremos que son asimétricos a la
izquierda.
Coeficiente de apuntamiento de Fisher: Mide el grado de concentración de una variable respecto a su medida
de centralización usual (media). Se define como:
Pn
(xi − x̄)4
KF = i=1 4 .
ns
Puesto que en Estadística el modelo de distribución habitual de referencia es el gausiano o normal y este
presenta teóricamente un coeficiente de apuntamiento de 3, se suele tomar este valor como referencia.
Así, si este coeficiente es menor que 3 diremos que los datos presentan una forma platicúrtica, si es mayor
que 3 diremos que son leptocúrticos y si son aproximadamente 3 diremos que son mesocúrticos.
Página 13 de 14
Beatriz Pateiro López Estadística. Ingeniería Química
Varias de las medidas vistas anteriormente utilizan desviaciones de los datos respecto a la media elevadas a
distintos órdenes. Este tipo de coeficientes se denominan momentos.
6,59 7,37 7,15 7,08 5,75 5,83 7,12 7,23 7,13 5,60
5,60 5,75 5,83 6,59 7,08 7,12 7,13 7,15 7,23 7,37
Página 14 de 14
Estadística
Tema 2: DESCRIPCIÓN ESTADÍSTICA DE DOS
VARIABLES
Curso 2008/2009
Índice
2. Distribuciones de frecuencias 2
2.1. Distribución de frecuencia conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Distribuciones marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3. Distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3. Representaciones gráficas 5
4. Medidas características 5
4.1. Vector de medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.2. Matriz de varianzas-covarianzas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1
Beatriz Pateiro López Estadística. Ingeniería Química
X 47 62 65 70 70 78 95 100 114 118 124 127 140 140 140 150 152 164 198 221
Y 38 62 53 67 84 79 93 106 117 116 127 114 134 139 142 170 149 154 200 215
Representaremos por (X, Y ) la variable bidimensional estudiada, donde X e Y son las variables unidimensionales
correspondientes a las primera y segunda características, respectivamente, medidas para cada individuo. Es claro
que el estudio de cada variable bidimensional particular (X, Y ) variará según las variables unidimensionales X e
Y sean cuantitativas o cualitativas y, de ser cuantitativas, según sean continuas o discretas.
2 Distribuciones de frecuencias
Como en el caso unidimensional, con la obtención de las distribuciones de frecuencias para variables bidimen-
sionales se pretende organizar la información contenida en las observaciones muestrales de la variable (X, Y ) de
manera que sea más sencilla de interpretar en la práctica.
Frecuencia absoluta: Sea nij el número de individuos de la muestra que presentan la modalidad ci de X y la
dj de Y . Este número se conoce como la frecuencia absoluta del par (ci ,dj ).
Frecuencia relativa: Al igual que para variables unidimensionales, las frecuencias relativas se calculan como
nij
fij = .
n
Las propiedades de estos números son idénticas al caso unidimensional. La distribución de frecuencias conjunta
de la variable bidimensional (X, Y ) es el resultado de organizar en una tabla de doble entrada las modalidades
de las variables unidimensionales X e Y junto con las correspondientes frecuencias absolutas (relativas).
Página 2 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
Propiedades:
Pm Pk
Frecuencias absolutas 0 ≤ nij ≤ n, (i = 1, . . . , m, j = 1, . . . , k) j=1 nij = n
Pi=1
m Pk
Frecuencias relativas 0 ≤ fij ≤ 1, (i = 1, . . . , m, j = 1, . . . , k) i=1 j=1 fij = 1
X\Y d1 . . . dj . . . dk
c1 n11 (f11 ) . . . n1j (f1j ) . . . n1k (f1k )
.. .. .. ..
. . . .
ci ni1 (fi1 ) . . . nij (fij ) . . . nik (fik )
.. .. .. ..
. . . .
cm nm1 (fm1 ). . . nmj (fmj ). . . nmk (fmk )
Ejemplo 2: Distribución de frecuencias absolutas del color de ojos (X) de 100 personas y de sus madres (Y )
Ejemplo 3: Distribución de frecuencias relativas de asistencia mensual al cine (X) y al teatro (Y ) de una
muestra de 200 estudiantes universitarios.
X\Y 0 1 2
1 0.41 0.05 0
2 0.19 0.06 0.02
3 0.10 0.05 0.02
4 0.02 0.07 0.01
Ejemplo 4: Distribución de frecuencias relativas del volumen de ventas (X) y el número de trabajadores (Y )
para un grupo de 100 empresas pequeñas y medianas.
Página 3 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
márgenes de la tabla la suma de las frecuencias de las filas o columnas. Normalmente se denotaran por
k
X k
X
ni· = nij y fi· = fij
j=1 j=1
X\Y d1 . . . dj . . . dk X
c1 n11 (f11 ) . . . n1j (f1j ) . . . n1k (f1k ) n1· (f1· )
.. .. .. ..
. . . .
ci ni1 (fi1 ) . . . nij (fij ) . . . nik (fik ) ni· (fi· )
.. .. .. ..
. . . .
cm nm1 (fm1 ). . . nmj (fmj ). . . nmk (fmk ) nm· (fm· )
Y n·1 (f·1 ) . . . n·j (f·j ) . . . n·k (f·k ) n
Ejemplo 6: Asistencia mensual al cine (X) y al teatro (Y ) de una muestra de 200 estudiantes universitarios.
X\Y 0 1 2 X
1 0.41 0.05 0 0.46
2 0.19 0.06 0.02 0.27
3 0.10 0.05 0.02 0.17
4 0.02 0.07 0.01 0.1
Y 0.72 0.23 0.05
Ejemplo 7: Volumen de ventas (X) y el número de trabajadores (Y ) para un grupo de 100 empresas pequeñas
y medianas.
X\Y 1-24 25-59 50-74 75-99 X
1-100 28/100 7/100 1/100 0 36/100
101-200 10/100 15/100 6/100 2/100 33/100
201-300 4/100 10/100 8/100 9/100 31/100
Y 42/100 32/100 15/100 11/100
Página 4 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
nij fij
fi/j = = (i = 1, . . . , m).
n·j f·j
Esto corresponde a dividir la columna de frecuencias absolutas (relativas) de la modalidad dj por la suma de
todos los valores de la columna.
Análogamente se define la distribución de Y condicionada a X = ci .
Ejemplo 8: Distribución de frecuencias (absolutas) condicionadas del color de ojos (X) de 100 personas con
madres de ojos claros (Y )
X\Y = Claros Claros Oscuros
28 20
Ejemplo 9: Distribución de frecuencias (relativas) condicionadas del número de asistencias al cine para los
estudiantes que no han ido al teatro.
X\Y = 0 1 2 3 4
0,41/0,72 0,19/0,72 0,10/0,72 0,02/0,72
3 Representaciones gráficas
La representación gráfica más útil de dos variables continuas sin agrupar es el diagrama de dispersión. Consiste
en representar en un eje de coordenadas los pares de observaciones (xi ,yi ). La nube así dibujada (a este gráfico
también se le llama nube de puntos) refleja la posible relación entre las variables. A mayor relación entre las
variables más estrecha y alargada será la nube.
Para los datos del Ejemplo 1, se obtiene el diagrama de dispersión de la Figura 3.
x=[47 62 65 70 70 78 95 100 114 118 124 127 140 140 140 150 152 164 198 221];
y=[38 62 53 67 84 79 93 106 117 116 127 114 134 139 142 170 149 154 200 215];
p l o t (x,y,’o’);
x l a b e l (’X=Concentración de hidrógeno con un método de cromatografiía de gases’);
5 y l a b e l (’Y=Concentración de hidrógeno con un nuevo método de sensor’);
t i t l e (’Diagrama de dispersión’)
4 Medidas características
La mayoría de las medidas características estudiadas en el caso unidimensional pueden extenderse al caso
bidimensional (multidimensional). Consideremos (x1 , y1 ),. . . , (xn , yn ) una muestra de n observaciones de una
variable bidimensional cuantitativa (X, Y ).
Página 5 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
donde sx2 , sy2 son las varianzas de las variables X e Y , respectivamente. El término sxy es la covarianza, que se
define a continuación.
n n
1X 1X
Cov(X, Y ) = sxy = (xi − x̄)(yi − ȳ ) = xi yi − x̄ ȳ .
n n
i=1 i=1
La covarianza puede interpretarse como una medida de relación lineal entre las variables X e Y .
Propiedades:
Página 6 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
La covarianza cambia si modificamos las unidades de medida de las variables. Esto es un inconveniente porque no
nos permite comparar la relación entre distintos pares de variables medidas en diferentes unidades. La solución
es utilizar el coeficiente de correlación lineal muestral, que consiste en tipificar la covarianza dividiéndola por las
desviaciones típicas de ambas variables, y se calcula mediante,
sxy
r (X, Y ) = rxy = .
sx sy
La correlación lineal toma valores entre −1 y 1 y sirve para investigar la relación lineal entre las variables. Así,
si toma valores cercanos a −1 diremos que tenemos una relación inversa entre X e Y (esto es, cuando una
variable toma valores altos la otra toma valores bajos). Si toma valores cercanos a +1 diremos que tenemos una
relación directa (valores altos de una variable en un individuo, asegura valores altos de la otra variable). Si toma
valores cercanos a cero diremos que no existe relación lineal entre las variables. Cuando el valor de la correlación
lineal sea exactamente 1 o −1 diremos que existe una dependencia exacta entre las variables mientras que si
toma el valor cero diremos que son incorreladas.
Propiedades:
Y = a + bX + ε.
Dada una muestra (x1 ,y1 ),. . . ,(xn ,yn ), el objetivo es determinar los valores de los parámetros desconocidos a y
b de manera que la recta definida ajuste de la mejor forma posible a los datos. Aunque existen muchos métodos,
el más clásico es el conocido como método de mínimos cuadrados que consiste en encontrar los valores de los
parámetros que, dada la muestra de partida, minimizan la suma de los errores al cuadrado. Los coeficientes a y
b se determinan minimizando las distancias verticales entre los puntos observados, yi , y las ordenadas previstas
por la recta para dichos puntos (ŷi = a + bxi ). Es decir, el criterio será minimizar
n n
1X 2 1X
M(a, b) = εi = (yi − (a + bxi ))2 .
n n
i=1 i=1
Página 7 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
Los valores de los parámetros se obtienen, por tanto, derivando e igualando a cero obteniéndose la solución
sxy
b=
sx2
y
a = ȳ − bx̄
que serán llamados coeficientes de la regresión. De esta manera obtendremos la ecuación de una recta:
sxy
y = a + bx = ȳ − bx̄ + bx = ȳ + b(x − x̄) = ȳ + (x − x̄)
sx2
que llamaremos recta de regresión de Y sobre X para resaltar que se ha obtenido suponiendo que Y es la
variable respuesta y que X es la variable explicativa.
Intercambiando los papeles de X e Y obtendremos una recta de regresión llamada recta de regresión de X
sobre Y que representada en el mismo eje de coordenadas será en general distinta de la anterior. Solamente
coincidirán en el caso de que la relación entre X e Y sea exacta.
Ejemplo 10: Volvamos al Ejemplo 1, donce se recogían datos de la concentración de hidrógeno determinada
con un método de cromatografía de gases (X), y la concentración determinada con un nuevo método de sensor
(Y ). El diagrama de dispersión muestra la recta de regresión de ecuación y = a + bx = −0,9625 + 1,0014x
Haciendo uso de la recta de regresión anterior, si la concentración de hidrógeno determinado con un método
de cromatografía de gases es 112 unidades, entonces por el nuevo método será y = 111,15 unidades.
m= p o l y f i t (x,y,1);
yest= p o l y v a l (m,x);
p l o t (x,y,’o’,x,yest,’r’)
x l a b e l (’X=Concentración de hidrógeno con un método de cromatografiía de gases’);
Página 8 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
Una vez resuelto el problema de estimar los parámetros surge la pregunta de si la recta estimada es o no
representativa para los datos. Esto se resuelve mediante el coeficiente de determinación (R2 ) que se define
como el cuadrado del coeficiente de correlación lineal. El coeficiente de determinación toma valores entre 0 y 1
y representa el porcentaje de variabilidad de la variable dependiente que es explicada por la regresión.
Ejemplo 11: Para los datos del Ejemplo 1 se puede observar que la recta de regresión no pasa por todos los
puntos observados (ver Figura 10). Sin embargo, están muy próximos a ella, el grado de ajuste viene determinado
por el coeficiente de determinación R2 = 0,985222 = 0,9707 (el cuadrado del coeficiente de correlación), es
decir, con el modelo de regresión lineal simple hallado, la variable X es capaz de explicar el 97,07 % de la
variación de Y .
Página 9 de 9
Estadística
Tema 3: PROBABILIDAD
Curso 2008/2009
Índice
1. Introducción histórica 2
2. Conceptos básicos 2
2.1. Experimento aleatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Espacio muestral. Sucesos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3. Definiciones de probabilidad 4
3.1. Definición clásica o de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.2. Definición frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3. Definición axiomática (Kolmogorov 1933) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4. Probabilidad condicionada 5
5. Independencia de sucesos 6
6. Teoremas clásicos: Regla del producto, ley de probabilidades totales y teorema de Bayes 6
6.1. Regla del producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.2. Ley de las probabilidades totales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.3. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción histórica
El objetivo de la Estadística es utilizar los datos para inferir sobre las características de una población a la que no
podemos acceder de manera completa. Es decir, a partir de la muestra inferir sobre la población. En los temas
anteriores, hemos visto como realizar un análisis descriptivo de una muestra de datos y hemos comenzado a intuir
que en las distribuciones de frecuencias se repiten ciertos patrones o formas. Esto indica que las observaciones
corresponden a un modelo. La Probabilidad es la disciplina científica que proporciona y estudia modelos para
fenómenos aleatorios en los que interviene el azar y sirve de soporte teórico para la Estadística.
La Teoría de la Probabilidad surgió de los estudios realizados sobre los juegos de azar, y estos se remontan
miles de años atrás. Como primeros trabajos con cierto formalismo cabe destacar los realizados por Cardano y
Galilei (siglo XVI), aunque las bases de esta teoría fueron desarrolladas por Pascal y Fermat en el siglo XVII.
De ahí en adelante grandes científicos han contribuido al desarrollo de la Probabilidad, como Bernouilli, Bayes,
Euler, Gauss,... en los siglos XVIII y XIX. Será a finales del siglo XIX y principios del XX cuando la Probabilidad
adquiera una mayor formalización matemática, debida en gran medida a la llamada Escuela de San Petesburgo
en la que cabe destacar los estudios de Tchebychev, Markov y Liapunov.
2 Conceptos básicos
Ejemplo 1: Ejemplos de experimentos aleatorios son: E1 =Lanzar una moneda al aire, E2 =Lanzar dos veces
una moneda, E3 =Lanzar dos monedas a la vez, E4 = Medir en mg · kg −1 la concentración de halofuginona en
hígado de pollo, E5 =Determinar la solubilidad del sulfato de bario en gramos por 100 ml de agua.
Suceso elemental: Es un suceso unitario. Está constituido por un solo resultado del experimento aleatorio.
Ejemplo: Si lanzamos un dado, Ω = {1, 2, 3, 4, 5, 6}, los sucesos elementales son A ="que salga un
1"= {1}, B ="que salga un 2"= {2},...,F ="que salga un 6"= {6}.
Página 2 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Suceso: Cualquier subconjunto del espacio muestral. Ejemplo: Si lanzamos un dado, Ω = {1, 2, 3, 4, 5, 6},
podemos considerar muchos sucesos, entre ellos: A ="que salga par"= {2, 4, 6}.
Decimos que ha ocurrido un suceso cuando se ha obtenido alguno de los resultados que lo forman. El objetivo
de la Teoría de la Probabilidad es estudiar con rigor los sucesos, que como vemos se pueden enunciar desde el
lenguaje común, asignarles probabilidades y efectuar cálculos sobre dichas probabilidades. Observamos que los
sucesos no son otra cosa que conjuntos y por tanto, serán tratados desde la Teoría de Conjuntos. Recordamos
las operaciones básicas y las dotamos de interpretación para el caso de sucesos.
Diferencia de sucesos: Ocurre A\B si ocurre A, pero no ocurre B. Por tanto, A\B = A ∩ B c .
Sucesos incompatibles: Dos sucesos A y B se dicen incompatibles si no pueden ocurrir a la vez. Dicho de otro
modo, que ocurra A y B es imposible. Escrito en notación conjuntista, resulta A ∩ B = ∅.
Suceso contenido en otro: Diremos que A está contenido en B, y lo denotamos por A ⊂ B, si siempre que
ocurra A también sucede B.
Propiedades
Asociativa A ∪ (B ∪ C) = (A ∪ B) ∪ C A ∩ (B ∩ C) = (A ∩ B) ∩ C
Conmutativa A∪B =B∪A A∩B =B∩A
Distributiva A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
Neutro ∅ para la unión A∪∅=A
Ω para la intersección A∩Ω=A
Complementario A ∪ Ac = Ω A ∩ Ac = ∅
Leyes de de Morgan (A ∪ B)c = Ac ∩ B c (A ∩ B)c = Ac ∪ B c
Página 3 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Ejemplo 4: Indicar en los experimentos E1 , E2 y E3 del Ejemplo 3 cuáles son los sucesos A ∪ B, A ∩ B. ¿son los
sucesos A y B incompatibles?, ¿son los sucesos A y Ac incompatibles?
3 Definiciones de probabilidad
El principal objetivo de un experimento aleatorio suele ser determinar con qué probabilidad ocurre cada uno de
los sucesos elementales. A continuación citamos las tres definiciones más manejadas para asignar probabilidades
a los sucesos.
casos f av or ables
P (A) =
casos posi bles
Ejemplo 5: Lanzamos dos dados y sumamos sus puntuaciones. ¿Cuál es la probabilidad de obtener un 2?, ¿y
de obtener un 7?
Página 4 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Esta definición presenta ciertos problemas. Aparte de serias dificultades formales, en la práctica quizás podamos
realizar el experimento muchas veces, pero nos será imposible repetirlo indefinidamente.
P (Ω) = 1
La probabilidad del suceso seguro es 1.
A ∩ B = ∅ ⇒ P (A ∪ B) = P (A) + P (B)
Si A y B son sucesos incompatibles, entonces la probabilidad de su unión es la suma de sus probabilidades.
1. P (∅) = 0
3. P (Ac ) = 1 − P (A)
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
4 Probabilidad condicionada
Supongamos que en el estudio de un experimento aleatorio nos interesa conocer la probabilidad de que ocurra
un cierto suceso A. Pero puede ser que dispongamos de información previa sobre el experimento: supongamos
que sabemos que el suceso B ha ocurrido. Está claro que ahora la probabilidad de A ya no es la misma que
cuando no sabíamos nada sobre B. Por ejemplo, si lanzamos un dado, la probabilidad de que salga 1 es 1/6,
pero si disponemos de la información adicional de que el resultado es impar reducimos los casos posibles de 6 a
3 (sólo puede ser un 1, un 3 o un 5), con lo cual la probabilidad es 1/3.
Estamos ahora en condiciones de entender la siguiente definición:
La probabilidad del suceso A condicionada al suceso B se define:
P (A ∩ B)
P (A/B) = , siendo P (B) 6= 0
P (B)
Página 5 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Ejemplo 6: Se ha realizado una encuesta en Santiago para determinar el número de lectores de La Voz y de El
Correo. Los resultados fueron que el 25 % lee solamente La Voz, el 20 % sólo El Correo, y el 5 % lee los dos.
Si se selecciona al azar un lector de El Correo, ¿cuál es la probabilidad de que lea también La Voz? Y si se ha
elegido un lector de La Voz, ¿cuál es la probabilidad de que no lea El Correo?
5 Independencia de sucesos
Dos sucesos A y B son independientes si
P (A ∩ B) = P (A) · P (B)
Comentarios:
Si P (B) > 0, A y B son independientes si y sólo si P (A/B) = P (A), esto es, el conocimiento de la
ocurrencia de B no modifica la probabilidad de ocurrencia de A.
Si P (A) > 0, A y B son independientes si y sólo si P (B/A) = P (B), esto es, el conocimiento de la
ocurrencia de A no modifica la probabilidad de ocurrencia de B.
No debemos confundir sucesos independientes con sucesos incompatibles: los sucesos incompatibles son
los más dependientes que puede haber. Por ejemplo, si en el lanzamiento de una moneda consideramos
los sucesos incompatibles ‘salir cara’ y ‘salir cruz’, el conocimiento de que ha salido cara nos da el
máximo de información sobre el otro suceso: ya que ha salido cara es imposible que haya salido cruz.
Ejercicio: Demostrar que si dos sucesos con probabilidades no nulas son incompatibles, entonces no son
independientes.
Si los sucesos A y B son independientes, también lo son los sucesos A y B c ; los sucesos Ac y B; y los
sucesos Ac y B c .
Página 6 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Se utiliza en experimentos aleatorios que están formados por etapas consecutivas (de la 1 a la n) y nos permite
calcular la probabilidad de que ocurra una concatenación (intersección) de sucesos a lo largo de las etapas (A1
en la primera etapa y A2 en la segunda etapa y . . . y An en la etapa n). Esta probabilidad queda expresada
como el producto de la probabilidad inicial P (A1 ) y las probabilidades en cada etapa condicionadas a las etapas
anteriores, conocidas como probabilidades de transición.
Ejemplo 8: La primera aplicación de un insecticida mata al 80 % de los mosquitos. Los supervivientes desarrollan
resistencia y en cada aplicación posterior el porcentaje de muertos se reduce a la mitad del verificado en la
aplicación inmediatamente anterior: así en la segunda aplicación muere el 40 % de los supervivientes de la
primera aplicación, en la tercera aplicación muere el 20 %, etc.
Ejemplo 9: Se sabe que una enfermedad es padecida por el 7 % de los fumadores y por el 2′ 5 % de los no
fumadores. Si en una población de 5.000 habitantes hay 600 fumadores, ¿cuál es la probabilidad de que una
persona elegida al azar sufra la enfermedad referida?
Página 7 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
P (Ai ) · P (B/Ai )
P (Ai /B) =
P (A1 ) · P (B/A1 ) + P (A2 ) · P (B/A2 ) + · · · + P (An ) · P (B/An )
Este teorema resulta de aplicar en el numerador la regla del producto y en el denominador la ley de probabilidades
totales.
Página 8 de 8
Estadística
Tema 4: VARIABLES ALEATORIAS
UNIDIMENSIONALES
Curso 2008/2009
Índice
1. Introducción 2
2. Variable aleatoria 2
2.1. Variables aleatorias discretas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.2. Variables aleatorias continuas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
4. Desigualdad de Chebychev. 8
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción
En el tema de Estadística Descriptiva hemos estudiado variables, entendiéndolas como mediciones que se efec-
túan sobre los individuos de una muestra. Así, la Estadística Descriptiva nos permitía analizar los distintos
valores que tomaban las variables sobre una muestra ya observada. Se trataba, pues, de un estudio posterior a
la realización del experimento aleatorio.
En este tema trataremos las variables situándonos antes de la realización del experimento aleatorio. Por tanto,
haremos uso de los conceptos del tema anterior (Probabilidad), mientras que algunos desarrollos serán análogos
a los del tema de Estadística Descriptiva.
2 Variable aleatoria
De manera informal, una variable aleatoria es un valor numérico que corresponde al resultado de un experimento
aleatorio. Por ejemplo, una variable X como resultado de lanzar una moneda al aire puede tomar el valor 1 si
el resultado es cara y 0 si es cruz. De este modo, escribiremos, por ejemplo, P (X = 1) = 0.5. Otro ejemplo de
variable aleatoria, Y, puede ser el resultado de medir en mg Kg−1 la concentración de halofuginona en hígado de
pollo. Cuando se han tomado muchísimas observaciones (infinitas), se puede llegar a la conclusión por ejemplo
que la probabilidad de que la concentración sea inferior a 0.25 mg Kg−1 es igual a 0.8, lo que escribimos con
P (Y < 0.25) = 0.8.
Definición 1. Llamamos variable aleatoria a una aplicación del espacio muestral asociado a un experimento
aleatorio en R, que a cada resultado de dicho experimento le asigna un número real, obtenido por la medición
de cierta característica.
X : Ω −→ R
ω −→ X(ω)
Denotamos la variable aleatoria por una letra mayúscula. El conjunto imagen de esa aplicación es el conjunto
de valores que puede tomar la variable aleatoria, que serán denotados por letras minúsculas.
Las variables aleatorias son equivalentes a las variables que analizábamos en el tema de Estadística Descriptiva.
La diferencia es que en el tema de Estadística Descriptiva se trabajaba sobre una muestra de datos y ahora
vamos a considerar que disponemos de toda la población (lo cual es casi siempre imposible en la práctica). Ahora
vamos a suponer que podemos calcular las probabilidades de todos los sucesos resultantes de un experimento
aleatorio.
De modo idéntico a lo dicho en el tema de Descriptiva, podemos clasificar las variables aleatorias en discretas
y continuas en función del conjunto de valores que pueden tomar. Así, una variable aleatoria será discreta si
dichos valores se encuentran separados entre sí. Por tanto será representable por conjuntos discretos, como Z
o N. Una variable aleatoria será continua cuando el conjunto de valores que puede tomar es un intervalo.
Página 2 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
p1 = P (X = x1 ) ,
p2 = P (X = x2 ) ,
..
.
pn = P (X = xn ) .
constituyen la distribución de X.
xi 0 1 2 3 4 5 6 7
pi 0.230 0.322 0.177 0.155 0.067 0.024 0.015 0.01
F : R −→ R
x0 −→ F (x0 ) = P (X ≤ x0 )
El diagrama de barras de frecuencias acumuladas para variables discretas del tema 1 se puede reinterpretar en
términos de probabilidades y da lugar a lo que recibe el nombre de función de distribución, F (x) , definida
para cada punto x0 como la probabilidad de que la variable aleatoria tome un valor menor o igual que x0 ,
F (x0 ) = P (X ≤ x0 ) .
F (−∞) = 0,
F (+∞) = 1.
Suponiendo que la variable X toma los valores x1 < x2 < . . . < xn , los puntos de salto de la función de
distribución vienen determinados por:
F (x1 ) = P (X ≤ x1 ) = P (X = x1 )
F (x2 ) = P (X ≤ x2 ) = P (X = x1 ) + P (X = x2 )
..
.
F (xn ) = P (X ≤ xn ) = P (X = x1 ) + ... + P (X = xn ) = 1
Obsérvese que siempre la función de distribución en el máximo de todos los valores posibles es igual a uno.
Ejemplo 3: Calcular la función de distribución de la variable X en el Ejemplo 1.
Página 3 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Figura 1: Histograma del diamétro (en mm.) de n = 100, n = 500 y n = 1000 ejes producidos por una empresa.
Tomando más observaciones y haciendo más finas las clases, el histograma tiende a estabilizarse en una curva
suave (en rojo) que describe la distribución de la variable.
Definición 4. Llamamos función de densidad de una variable aleatoria continua X a una aplicación f : R → R
no negativa y tal que Z x0
P (X ≤ x0 ) = f (x) dx
−∞
1. f (x) ≥ 0 ∀x ∈ R
R∞
2. −∞ f (x) dx = 1.
Cualquier función que verifique estas dos propiedades es una función de densidad. La función de densidad se
interpreta como el histograma. Sus valores más altos corresponden a las zonas más probables y viceversa. Por
Página 4 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
ejemplo, la densidad de la variable X = “Diámetro de un eje” de la Figura 1 indica que lo más probable es que el
diámetro tome valores en el intervalo [4, 6] . Con menos probabilidad el diámetro estará en los intervalos [2, 4]
y [6, 8] y será prácticamente imposible que el diámetro supere los 8 mm. o que sea menor de 2 mm.
Del mismo modo que el histograma representa frecuencias mediante áreas, análogamente, la función de densidad
expresa probabilidades por áreas. La probabilidad de que una variable X sea menor que un determinado valor x0
se obtiene calculando el área de la función de densidad hasta el punto x0 , es decir,
Z x0
P (X ≤ x0 ) = f (x) dx,
−∞
Es erróneo entender la función de densidad como la probabilidad de que la variable tome un valor específico,
pues esta siempre es cero para cualquier variable continua ya que el área que queda encima de un punto es
siempre cero. Por ejemplo, la probabilidad de que el diámetro de un eje sea exactamente un 5.2 mm. es cero.
Sin embargo, la probabilidad de que el diámetro de un eje esté en el intervalo [5.1, 5.3] , es el área encerrada
por la función de densidad en ese intervalo. De esto deducimos que, para variables continuas,
Ejemplo 7: Se sabe que la proporción de paracetamol en un lote de pastillas es una variable aleatoria continua
que tiene como función de densidad,
(
kx, 0 < x < 100,
f (x) =
0, en otro caso.
La función de distribución para una variable aleatoria continua se define como en el caso discreto por,
F (x0 ) = P (X ≤ x0 ) ,
y por tanto, Z x0
F (x0 ) = P (X ≤ x0 ) = f (x) dx,
−∞
F (−∞) = 0,
F (+∞) = 1.
Página 5 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
f (x) = F 0 (x) .
Análogamente, la media poblacional o esperanza de una variable aleatoria continua viene dada por,
Z ∞
µ = E(X) = xf (x) dx.
−∞
Ejemplo 10: Calcula la proporción media de paracetamol en un lote de pastillas del Ejemplo 7.
La interpretación de la media o esperanza es el valor esperado al realizar el experimento con la variable aleatoria.
Además, la media puede verse también como el valor central de la distribución de probabilidad.
3.2 Varianza.
Se define la varianza poblacional de una variable aleatoria discreta con valores x1 , x2 , ..., xk como la media
ponderada de las desviaciones a la media al cuadrado,
k
X
2
σ = Var(X) = (xi − µ)2 pi .
i=1
Ejemplo 11: Calcula la varianza de pacientes con enfermedades articulares del Ejemplo 2.
Página 6 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Ejemplo 12: Calcula la varianza de la proporción de paracetamol en un lote de pastillas del Ejemplo 7.
La interpretación de la varianza es la misma que para un conjunto de datos: es un valor no negativo que expresa la
dispersión de la distribución alrededor de la media. Además, se puede calcular la desviación típica poblacional
σ como la raíz cuadrada de la varianza. Los valores pequeños de σ indican concentración de la distribución
alrededor de la esperanza y valores grandes corresponden a distribuciones más dispersas.
3.3 Momentos
Al igual que en el tema 1, podremos definir a nivel poblacional los momentos respecto al origen de orden r y
los momentos centrales respecto a la media de orden r . Para ello será de gran utilidad la siguiente propiedad,
que se verifica tanto para variables discretas como continuas.
Propiedad.
Sea X una variable aleatoria discreta con valores x1 , x2 , ..., xk . Entonces:
k
X k
X
E(g(X)) = g(xi )P (X = xi ) = g(xi )pi .
i=1 i=1
Sea X una variable aleatoria continua con función de densidad f (x). Entonces:
Z ∞
E(g(X)) = g(x)f (x)dx.
−∞
De la anterior propiedad podemos deducir facilmente que, tanto si X es una variable discreta como continua,
Se define el momento respecto al origen de orden r de una variable aleatoria discreta con valores x1 , x2 , ..., xk como
k
X
E(X r ) = xir pi .
i=1
Análogamente, el momento respecto al origen de orden r de una variable aleatoria continua viene dada por,
Z ∞
E(X r ) = x r f (x) dx.
−∞
Se define el momento central o respecto a la media de orden r de una variable aleatoria discreta con valores
x1 , x2 , ..., xk como
Xk
E((X − µ)r ) = (xi − µ)r pi .
i=1
Página 7 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Análogamente, el momento central o respecto a la media de orden r de una variable aleatoria continua viene
dada por, Z ∞
r
E((X − µ) ) = (x − µ)r f (x) dx.
−∞
4 Desigualdad de Chebychev.
El teorema de Chebychev dice que para cualquier variable aleatoria, la probabilidad de que un valor diste de la
media menos de k desviaciones típicas es como mínimo 1 − 1/k 2 , es decir,
1
P (−kσ ≤ X − µ ≤ kσ) ≥ 1 − .
k2
Ejemplo 13: Después de medir los diámetros de muchísimos ejes, se llega a la conclusión de que la media
poblacional de los diámetros es 5.12 mm. y la desviación típica 0.64 mm. Determinar entre qué valores se
encontrará el diámetro de un nuevo eje fabricado con una probabilidad mayor de 0.75
Página 8 de 8
Estadística
Tema 5: VECTORES ALEATORIOS: VECTORES
BIDIMENSIONALES
Curso 2008/2009
Índice
1
Beatriz Pateiro López Estadística. Ingeniería Química
(X, Y ) : Ω −→ R2
F : R2 −→ R
(x, y ) −→ F (x, y ) = P (X ≤ x, Y ≤ y )
Propiedades.
La función de distribución de cualquier vector aleatorio verifica las siguientes propiedades, que extienden las ya
conocidas para una variable aleatoria.
1. 0 ≤ F (x, y ) ≤ 1 ∀(x, y ) ∈ R2 .
2. lı́m F (x, y ) = 1
x → +∞
y → +∞
Ejemplo 1: Consideremos el vector aleatorio (X, Y ) que toma los valores (2, 0), (0, 2) y (4, 2) con igual
probabilidad. Calcula F (1, 1), F (2, 2), F (4, 1), F (2, 4), F (4, 2).
Tras definir la función de distribución y estudiar sus propiedades de forma general, trataremos los conceptos fun-
damentales de vectores aleatorios separando los casos discreto y continuo, que por lo demás sólo se distinguirán
en los sumatorios frente a las integrales y las probabilidades frente a las densidades.
Página 2 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
probabilidades conjuntas y a la tabla siguiente la llamaremos distribución de probabilidad conjunta del vector
aleatorio (X, Y ).
X\Y y1 . . . yj . . . ys
x1 p11 · · · p1j · · · p1s p1•
.. .. .. .. ..
. . . . .
xi pi1 · · · pij · · · pis pi•
.. .. .. .. ..
. . . . .
xr pr 1 ··· pr j ··· pr s pr •
p•1 ··· p•j ··· p•s 1
Nótese que a esta tabla le hemos añadido una última columna a la derecha y una última fila en la base.
Representan las distribuciones marginales de las variables X e Y , respectivamente. La distribución marginal de
X es la distribución de probabilidad que tiene la variable X sin tener en cuenta la variable Y . Por eso se obtiene
de sumar la fila correspondiente.
Xs
pi• = P (X = xi ) = pij
j=1
P (X = xi , Y = yj ) pij
P (Y = yj /X = xi ) = =
P (X = xi ) pi•
2.2 Independencia
Diremos que las variables aleatorias X e Y son independientes si cualesquiera dos sucesos relativos respectiva-
mente a X e Y son independientes. Esta definición es aplicable a cualquier vector aleatorio (X, Y ). En el caso
discreto es equivalente a que la distribución conjunta resulte del producto de las marginales, esto es:
P (X = xi , Y = yj ) = P (X = xi ) · P (Y = yj ) ∀i ∈ {1, . . . , r } ∀j ∈ {1, . . . , s}
[pij = pi• · p•j ]
Ejemplo 2: Calcula la distribución de probabilidad conjunta del ejemplo 1, las distribuciones marginales y la
distribución de X condicionada a Y = 2. ¿Son X e Y independientes?
Ejemplo 3: Considérense las siguientes distribuciones de probabilidad conjunta:
Página 3 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
También podemos estudiar momentos que involucran a dos o más variables del vector aleatorio. Así, por ejemplo,
sea (X, Y ) el vector aleatorio discreto considerado hasta ahora. La variable aleatoria unidimensional X · Y toma
los valores xi · yj 1 ≤ i ≤ r 1 ≤ j ≤ s con probabilidades pij , y por tanto su media será
r X
X s
E(X · Y ) = xi · yj · pij
i=1 j=1
Es una medida de la relación lineal entre las dos variables, de tal forma que cuando es positiva interpretamos que
existe una relación lineal creciente entre ellas y cuando es negativa que dicha relación es decreciente. Además
verifica las siguientes propiedades.
3. Cov(a + bX, c + d Y ) = b · d · Cov(X, Y ). Por tanto, la covarianza no se ve afectada por los cambios de
localización, pero sí por los de escala.
Página 4 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
El coeficiente de correlación hereda muchas propiedades de la covarianza. Sigue teniendo el mismo signo de
la covarianza y la misma interpretación como medida de dependencia lineal. Al haber eliminado el efecto de la
escala verifica además:
−1 ≤ ρ(X, Y ) ≤ 1
Así, sobre ese rango de valores entre -1 y 1 podemos evaluar la cuantía de la relación lineal. Si la correlación
está próxima a 1 hay mucha relación creciente, y si está próxima a -1 hay mucha relación decreciente. Cuando
está próxima a cero hay poca dependencia lineal, y cuando vale cero diremos que las variables X e Y están
incorrelacionadas.
Podemos hacer un desarrollo análogo al realizado para el caso discreto. Los conceptos son los mismos y única-
mente reemplazamos las probabilidades por las densidades y los sumatorios por las integrales. Así, X e Y serán
variables continuas y sus densidades marginales se obtienen así:
Z Z
fX (x0 ) = f (x0 , y ) dy ∀x0 ∈ R fY (y0 ) = f (x, y0 ) dx ∀y0 ∈ R
R R
f (x0 , y ) f (x, y0 )
f (y /X = x0 ) = f (x/Y = y0 ) =
fX (x0 ) fY (y0 )
Las variables X e Y serán independientes si y sólo si las distribuciones condicionadas coinciden con las marginales
o, equivalentemente:
f (x, y ) = fX (x) · fY (y ) ∀(x, y ) ∈ R2
Por último, las medidas se definen de modo natural también para variables continuas y verifican las mismas
Página 5 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
Ejemplo 4: Sea (X, Y ) un vector aleatorio con distribución uniforme en el triángulo de vértices (0,0), (1,0) y
(1,1).
(e) Calcular P Y ≥ 21 /X ≥ 12 .
(f) Calcular P Y ≥ 12 /X = 78 y P Y ≥ 21 /X = 14 .
Página 6 de 6
Estadística
Tema 6: MODELOS DE DISTRIBUCIÓN DE
PROBABILIDAD
Curso 2008/2009
Índice
1. Introducción 2
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción
En este tema estudiaremos distribuciones de variables aleatorias que han adquirido una especial relevancia por
ser adecuadas para modelizar una gran cantidad de situaciones. Presentaremos en primer lugar los modelos de
variables discretas y después los continuos. Caracterizaremos estas distribuciones mediante la distribución de
probabilidad en el caso discreto y mediante su función de densidad en el caso continuo. Calcularemos también
los momentos (media y varianza) y destacaremos las propiedades de mayor utilidad.
Definición 1. Una variable aleatoria X tiene una distribución uniforme discreta y se conoce como variable
aleatoria uniforme discreta si y sólo si X toma los valores x1 < x2 < . . . < xn y su función de probabilidad está
dada por:
1
pi = P (X = xi ) = , i = 1, . . . , n.
n
La media y la varianza de esta variable aleatoria son:
µ = n1 ni=1 xi .
P
Ejemplo 1: Se lanza un dado ordinario. Para i = 1, . . . , 6 definimos la variable aleatoria X = xi como la cara
del dado que cae hacia arriba. Obtén la distribución de probabilidad de esta variable aleatoria, su media y su
desviación típica.
Figura 1: Función de masa de uniforme discreta que toma los valores {1,2,3,4,5,6}.
Página 2 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Lo único que hay que conocer es la probabilidad de éxito, p, ya que los valores de X son siempre los mismos y
la probabilidad de fracaso es q = 1 − p.
Definición 2. Si denotamos por p a la probabilidad de éxito, entonces diremos que la variable X tiene distribu-
ción de Bernoulli de parámetro p, y lo denotamos X ∈ Ber noulli(p). La distribución de probabilidad de X ∈
Bernoulli(p) viene dada por
X 0 1
P (X = xi ) 1 − p p
Por tanto, la probabilidad de éxito p determina plenamente la distribución de Bernoulli. La media y la varianza
de una Ber noulli (p) son:
µ = p.
σ 2 = p · (1 − p).
Como ejemplo, la Figura 2 muestra la función de masa de una variable con distribución de Bernoulli para p = 0.8.
Página 3 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Ejemplo 2: Supongamos que lanzamos un dado normal 5 veces y queremos determinar la probabilidad de que
exactamente en 3 de esos 5 lanzamientos salga el 6.
Cada lanzamiento es independiente de los demás y podemos considerarlo como un ensayo de Bernoulli, donde
el éxito es sacar un 6 (p = 1/6). Lo que hacemos es repetir el experimento 5 veces y queremos calcular la
probabilidad de que el número de éxitos sea igual a 3 (es decir, obtener 3 éxitos y 2 fracasos)
Empezando con una prueba de Bernoulli con probabilidad de éxito p, vamos a construir una nueva variable
aleatoria al repetir n veces la prueba de Bernoulli. La variable aleatoria binomial X es el número de éxitos en n
repeticiones de una prueba de Bernoulli con probabilidad de éxito p. Debe cumplirse:
Las pruebas son independientes. El resultado de una prueba no tiene influencia sobre los resultados sigu-
ientes.
Definición 3. La variable aleatoria X que representa el número de éxitos en n intentos independientes, siendo
la probabilidad de éxito en cada intento p, diremos que tiene distribución Binomial de parámetros n y p.Lo
denotamos X ∈ Bi nomi al(n, p). La distribución binomial es discreta y toma los valores 0, 1, 2, 3, . . . , n con
probabilidades
n k
P (X = k) = p (1 − p)n−k si k ∈ {0, 1, 2, . . . , n}
k
donde el coeficiente binomial !
n n!
=
k k!(n − k)!
representa el número de subconjuntos diferentes de k elementos que se pueden definir a partir de un total de n
elementos (combinaciones de n elementos tomados de k en k).
µ = n · p.
σ 2 = n · p · (1 − p).
Como ejemplo, la Figura 3 muestra las funciones de masa de una variable con distribución binomial de parámetros
n = 5 y p = 1/6 y una variable con distribución binomial de parámetros n = 60 y p = 1/6.
Página 4 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Figura 3: En la izquierda, función de masa de una Binomial(5,1/6). En la derecha, función de masa de una
Binomial(60,1/6).
λk
P (X = k) = e −λ si k ∈ {0, 1, 2, 3, . . .}
k!
La media y la varianza de la Poisson de parámetro λ son:
µ=λ
σ2 = λ
Como ejemplo, la Figura 4 muestra las funciones de masa de una variable con distribución de Poisson de
parámetro λ = 2 y una variable con distribución de Poisson de parámetro λ = 15.
Página 5 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Figura 4: En la izquierda, función de masa de una Poisson(2). En la derecha, función de masa de una Poisson(15).
a x i s ([-1 15 0 0.4])
5
En la práctica usaremos la distribución de Poisson como aproximación de la distribución binomial cuando n sea
grande y p pequeño, en base al límite que hemos visto. Usaremos el siguiente criterio:
Si n > 50, p < 0.1 entonces la Binomial de parámetros n y p puede ser aproximada por una Poisson de
parámetro λ = np.
Ejemplo 3: La probabilidad de que una persona se desmaye en un concierto es p = 0.005. ¿Cuál es la probabilidad
de que en un concierto al que asisten 3000 personas se desmayen 18?
La variable X =Número de personas que se desmayan en el concierto sigue una distribución Bi n(3000, 0.005).
Queremos calcular !
3000
P (X = 18) = · 0.00518 · 0.9952982 .
18
Estos valores están fuera de las tablas de la binomial y son difíciles de calcular, por eso es preferible aproximar
por una Poisson de parámetro λ = np = 3000 · 0.005 = 15. Entonces:
1518
P (X = 18) ≈ P (P oi sson(15) = 18) = e −15 = 0.07061.
18!
Ejemplo 4: Se sabe que la probabilidad de que un individuo reaccione desfavorablemente tras la inyección de
una vacuna es de 0.002. Determina la probabilidad de que en un grupo de 2000 personas vacunadas haya como
mucho tres que reaccionen desfavorablemente.
Página 6 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Aunque la distribución de Poisson se ha obtenido como forma límite de una distribución Binomial, tiene muchas
aplicaciones sin conexión directa con las distribuciones binomiales. Por ejemplo, la distribución de Poisson puede
servir como modelo del número de éxitos que ocurren durante un intervalo de tiempo o en una región específica.
Definimos el proceso de Poisson como un experimento aleatorio que consiste en contar el número de ocurrencias
de determinado suceso en un intervalo de tiempo, verificando:
El número medio de sucesos por unidad de tiempo es constante. A esa constante la llamamos intensidad
del proceso.
P (X ≥ 3) = 1 − P (X < 3) = 1 − [P (X = 0) + P (X = 1) + P (X = 2)]
210 211 212
= 1 − e −21 + e −21 + e −21 .
0! 1! 2!
Definición 5. Sea X =número de individuos con la característica en la muestra obtenida sin reemplazamiento.
Diremos que la variable aleatoria X tiene distribución Hipergeométrica de parámetros N, n, p, y lo denotamos
X ∈ Hipergeométrica(N, n, p). La distribución de probabilidad de la Hipergeométrica viene dada por:
R N−R
k n−k
P (X = k) = N
si k ∈ {0, 1, 2, . . . , n} , k ≤ R , n − k ≤ N − R.
n
µ = np
σ 2 = np(1 − p) N−n
N−1
Ejemplo 6: En una urna hay 3 bolas blancas y 5 bolas negras. Extraemos de la urna 6 bolas sin reeemplazamiento.
¿Cuál es la probabilidad de que el número de bolas blancas extraídas sea igual a 2?
La población está formada por N = 8 individuos, de los cuales R = 3 presentan cierta característica (bola
blanca). Extraemos de esa población una muestra sin reemplazamiento de n = 6 individuos y contamos el
Página 7 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Definición 6. Una variable aleatoria se dice uniforme en el intervalo [a,b], y lo denotamos X ∈ Uniforme[a, b],
si su función de densidad es
1
f (x) = si x ∈ [a, b]
b−a
La media y la varianza de una Uniforme[a,b] son:
a+b
La media será el punto medio del intervalo: µ = 2 .
(b−a)2
La varianza es: σ 2 = 12 .
Como ejemplo, la Figura 5 muestra la función de densidad de una variable uniforme en el intervalo [5,10]
Página 8 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Definición 7. Una variable aleatoria X tiene distribución exponencial de parámetro λ, λ ∈ (0, +∞), y lo
denotamos X ∈ Exponencial(λ), si su función de densidad viene dada por:
µ = λ1 .
1
σ2 = λ2 .
Como ejemplo, la Figura 6 muestra la función de densidad de una variable exponencial de parámetro λ = 1 y la
función de densidad de una variable exponencial de parámetro λ = 1/3.
x= l i n s p a c e (0,20,1000);
% Densidad de una exponencial de parámetro lambda=1
exponencial=exppdf(x,1);
s u b p l o t (1,2,1), p l o t (x,exponencial,’r’,’LineWidth’,2)
5
Página 9 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Además, la distribución exponencial rige los tiempos de espera entre acontecimientos consecutivos de Poisson.
El parámetro λ se toma como el número (o fracción) de acontecimientos de Poisson que ocurren por unidad
de tiempo.
Ejemplo 7: Una secretaria recibe un promedio de 6 llamadas telefónicas por hora durante una jornada de trabajo
ordinaria. Expresa el número de llamadas por hora como sucessos de Poisson y expresa el tiempo transcurrido
entre 2 llamadas consecutivas que recibe (en horas) como una distribución exponencial.
Una de las propiedades más importantes que caracteriza a la distribución exponencial es la llamada falta de
memoria, que se expresa así:
P (X ≥ x + δ/X ≥ x) = P (X ≥ δ).
Significa que la probabilidad de “duración” un tiempo adicional δ es independiente del tiempo transcurrido x y
sólo depende de la “cuantía” de ese tiempo adicional.
Definición 8. Una variable aleatoria continua Z se dice que tiene distribución normal estándar, y lo denotamos
Z ∈ N(0, 1), si su función de densidad viene dada por:
1 1 2
f (z) = √ e − 2 z si z ∈ R
2π
Página 10 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
La probabilidad inducida vendrá dada por el área bajo la densidad, ver Figura 8.
Como no existe una expresión explícita para el área existen tablas con algunas probabilidades ya calculadas.
Las tablas que nosotros utilizaremos proporcionan el valor de la función de distribución, Φ(z) = P (Z ≤ z),
de la normal estándar para valores positivos de z, donde z está aproximado hasta el segundo decimal.
Por lo tanto, para calcular P (Z ≤ 1.03), en el eje de las x marcamos el valor de Z (en este caso z = 1.03) e
indicamos la probabilidad como el área que queda debajo de la campana de Gauss. (ver Figura 8). Buscaremos
P (Z ≤ 1.03) en la tabla en el cruce entre la fila correspondiente a 1.0 y la columna correspondiente a 0.03. Así
obtenemos P (Z ≤ 1.03) = 0.8465.
Ejemplo 9: Supongamos que Z ∈ N(0, 1). Calcula usando las tablas de la normal estándar:
Página 11 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
P (Z ≤ 1.64).
P (Z > 1).
P (Z > −1.23).
P (Z ≤ −0.53).
P (−1.96 ≤ Z ≤ 1.96).
P (−1 ≤ Z ≤ 2).
Ejemplo 10: Sea Z una variable aleatoria con distribución normal estándar. Halla los valores z0 tales que
P (Z ≤ z0 ) = 0.87.
P (Z > z0 ) = 0.05.
P (Z > z0 ) = 0.975.
Efectuando un cambio de localización y escala sobre la normal estándar, podemos obtener una distribución con
la misma forma pero con la media y desviación típica que queramos.
X = µ + σ Z ∈ N(µ, σ 2 )
Así, la función de densidad de X tendrá la misma forma de campana, será simétrica en torno a la media µ y
sus puntos de inflexión serán µ − σ y µ + σ. La forma más sencilla de calcular la función de densidad de una
N(µ, σ 2 ) es calculando su función de distribución y después derivandor. La función de distribución de X viene
dada por
x −µ x −µ
F (x) = P (X ≤ x) = P (µ + σZ ≤ x) = P Z≤ =Φ ,
σ σ
donde Φ(·) es la función de distribución de la Normal estándar.
La función de densidad de una N(µ, σ 2 ) (ver Figura 9) es entonces
x −µ 1 (x−µ)2
0
f (x) = F (x) = Φ 0
=√ e− 2σ2 , x ∈ R.
σ 2πσ 2
% Densidad de
% a)N(0,1)
% b)N(2,1)
% c)N(-1,0.5)
5 % d)N(0,2)
x= l i n s p a c e (-5,5,1000);
normal_a=normpdf(x,0,1);
normal_b=normpdf(x,2,1);
normal_c=normpdf(x,-1,0.5);
10 normal_d=normpdf(x,0,2);
Página 12 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Figura 9: Funciones de densidad de variables normales con distintas medias y varianzas. En rojo densidad de
una N(0, 1).
p l o t (x,normal_a,’r’,’LineWidth’,2)
hold on;
p l o t (x,normal_b,’b’,’LineWidth’,2)
p l o t (x,normal_c,’k’,’LineWidth’,2)
15 p l o t (x,normal_d,’g’,’LineWidth’,2)
En la práctica sólo disponemos de la tabla de la distribución normal estándar. Para efectuar cálculos sobre
cualquier distribución normal hacemos la transformación inversa, esto es, le restamos la media y dividimos por
la desviación típica. A este proceso le llamamos estandarización de una variable aleatoria.
X−µ
Si X ∈ N(µ, σ 2 ) entonces Z = ∈ N(0, 1).
σ
Debemos observar que la estandarización se puede aplicar a cualquier variable aleatoria, tenga o no distribución
normal. Al estandarizar una variable aleatoria, obtendremos otra (variable estandarizada) con media cero y
desviación típica uno.
Ejemplo 11: Supongamos que X ∈ N(5, 4). ¿Cómo calcularías P (X ≤ 1)?
X−5 1−5
P (X ≤ 1) = P ≤ = P (Z ≤ −2)
2 2
X−5
donde Z = 2 ∈ N(0, 1).
Página 13 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Teorema 1 (Teorema de De Moivre-Laplace). Tomemos una probabilidad de éxito fija p. Consideremos una
sucesión de variables aleatorias Xn ∈ Bi nomi al(n, p), n ∈ {1, 2, 3, . . .} y Z ∈ N(0, 1). Entonces
!
Xn − np
lı́m P p ≤ z = P (Z ≤ z) ∀ z ∈ R.
n→∞ np(1 − p)
es aproximadamente normal con media nµ y varianza nσ 2 donde µ y σ 2 son la media y varianza de la variable
X. Formalmente:
Página 14 de 15
Beatriz Pateiro López Estadística. Ingeniería Química
Teorema 2 (Teorema central del límite). Sea X1 , X2 , . . . , Xn , . . . una sucesión de variables aleatorias indepen-
dientes y con la misma distribución. Denotamos Sn = X1 + X2 + . . . + Xn a la suma, y sea Z ∈ N(0, 1).
Entonces
Sn − E (Sn ) d
p −→ Z
Var (Sn )
Si λ ≥ 10 entonces la Poisson de parámetro λ puede ser aproximada por una normal de media µ = λ y
varianza σ 2 = λ.
Como la Poisson es discreta y la normal continua, recurriremos al elemento de corrección por continuidad.
Si X1 ∈ Binomial(n1 , p), X2 ∈ Binomial(n2 , p) y son independientes entonces X1 +X2 ∈ Binomial (n1 + n2 , p).
Página 15 de 15
Estadística
Tema 7: INFERENCIA ESTADÍSTICA: ESTIMACIÓN
PUNTUAL E INTERVALOS DE CONFIANZA
Curso 2008/2009
Índice
1. Introducción 2
2. Conceptos básicos. 2
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción
En el tema 1 hemos estudiado la Estadística Descriptiva, que se dedica al análisis y tratamiento de datos. A partir
de ellos, resume, ordena y extrae los aspectos más relevantes de la información que contienen. Sin embargo,
los objetivos de la Estadística son más ambiciosos. No nos conformamos con describir unos datos contenidos
en una muestra sino que pretendemos extraer conclusiones para la población de la que fueron extraídos. A
esta última tarea la llamamos Inferencia Estadística. Obtendremos las muestras de forma aleatoria y por
tanto necesitaremos la Teoría de la Probabilidad vista en el tema 3 para elaborar nuestros argumentos. En los
temas 4-6, vimos algunos modelos de variables discretas y continuas para una población y sus características
más importantes, como la media y varianza poblacionales y otros parámetros. En este tema vamos a construir
estimadores de los parámetros de interés a partir de una muestra y además, vamos a estudiar qué propiedades
tienen que tener los estimadores para obtener buenas estimaciones.
2 Conceptos básicos.
Veamos algunas definiciones básicas en Inferencia Estadística, algunas de ellas ya las hemos introducido en los
temas anteriores.
Población. Es el conjunto homogéneo de individuos sobre los que se estudian una o varias características
observables. Por ejemplo, la población de un país cuya intención de voto nos interesa. En otros casos (como por
ejemplo, al estudiar la probabilidad de explosión en una reacción química), no está tan clara la existencia de una
población, entendida como conjunto de individuos. En cualquier caso, el objetivo de la Inferencia Estadística es
obtener información sobre una población.
Muestra. Es un subconjunto extraído de la población, al que podemos observar. Múltiples razones nos imposi-
bilitan observar toda la población. Por ese motivo, extraemos una muestra y con ella obtenemos información
sobre toda la población.
Tamaño de la población o de la muestra. Es el número de individuos que los forman, en cada caso.
Debemos hacer una primera distinción, al hablar de Inferencia, según la naturaleza del problema que se plantee:
1. Inferencia paramétrica: cuando se conoce la forma de la distribución de probabilidad e interesa averiguar
el parámetro o parámetros de los que depende. Por ejemplo, sabemos que la población es Normal e
interesa conocer la media µ y la desviación típica σ. A su vez, dentro de la Inferencia Paramétrica vamos
a distinguir distintos problemas:
a) Estimación Puntual. Consiste en aventurar un valor, calculado a partir de la muestra, que esté lo
más próximo posible al verdadero parámetro. Por ejemplo, la media muestral puede ser un estimador
razonable de la media poblacional y la proporción muestral de la proporción poblacional.
b) Intervalos de Confianza. Dado que la estimación puntual conlleva un cierto error, construímos un
intervalo que con alta probabilidad contenga al parámetro. La amplitud del intervalo nos da idea del
margen de error de nuestra estimación.
c) Contrastes de Hipótesis. Se trata de responder a preguntas muy concretas sobre la población, y se
reducen a un problema de decisión sobre la veracidad de ciertas hipótesis. Por ejemplo, nos podemos
preguntar si nuestra proporción de votantes superará el 40 %, umbral que nos otorga la mayoría
absoluta en el parlamento.
Página 2 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
Suponemos que la distribución de X, aún siendo desconocida, sigue un modelo como los del tema anterior. En
el caso del calor desprendido en la reacción del Ejemplo 1, podría ser normal, y en el caso de la proporción del
Ejemplo 2, es claramente de Bernoulli. Así, el problema se reduce a averiguar los parámetros.
Para hacer inferencia, repetimos el experimento n veces en idénticas condiciones y de forma independiente. Una
muestra aleatoria simple de tamaño n está formada por n variables
X1 , X2 , · · · , Xn
Página 3 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
proporción muestral
Por tanto, p̂ es un estimador insesgado de p. Si un estimador presenta sesgo, nos sentimos tentados a efectuar
un cambio de localización sobre dicho estimador.
Ahora que sabemos que p̂ está centrado en torno a p, nos interesa que su dispersión sea pequeña. Lo ideal sería
que E(p̂) = p y V ar (p̂) = 0. En ese caso p̂ sólo tomaría un valor, que sería p y nunca habría error. En nuestro
caso
p(1 − p)
Var (p̂) =
n
que es distinta de cero, pero lı́mn→∞ V ar (p̂) = 0. Esto significa que al aumentar el tamaño muestral el estimador
se aproxima al parámetro poblacional, lo cual constituye una justificación fundamental del método estadístico.
Definición 2. Definimos el error cuadrático medio de un estimador θ̂ para un parámetro poblacional θ como
2
E (θ̂ − θ)2 = Sesgo(θ̂) + Var(θ̂)
y diremos que dicho estimador es consistente si lı́mn→∞ E (θ̂ − θ)2 = 0.
Definición 3. Un intervalo de confianza es un intervalo construido en base a la muestra y, por tanto, aleatorio,
que contiene al parámetro con una cierta probabilidad, conocida como nivel de confianza.
Sea θ el parámetro desconocido y L1 y L2 los extremos del intervalo (que son estadísticos por estar el intervalo
de confianza construido en base a la muestra). Se dice que [L1 , L2 ] tiene un nivel de confianza 1 − α, siendo
α ∈ [0, 1], si P (L1 ≤ θ ≤ L2 ) ≥ 1 − α.
El nivel de confianza con frecuencia se expresa en porcentaje. Así, un intervalo de confianza del 95 % es un
intervalo de extremos aleatorios que contiene al parámetro con una probabilidad de 00 95.
Construimos ahora un intervalo de confianza para p. Nos basamos en la proporción muestral, p̂. Recordamos
que la distribución binomial se puede aproximar por la normal cuando n es suficientemente grande, manteniendo
p fija. Pero en nuestro caso p está fija y, como en cualquier problema de inferencia, el tamaño muestral n debe
Página 4 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
ser moderado o grande. Dado que p̂ sólo consiste en dividir a la binomial por un número real, n, su distribución
también se puede aproximar por la normal, con su misma media y desviación típica. Por tanto,
p̂ − p
q ∼ N(0, 1)
p (1−p)
n
A ese estadístico le llamamos estadístico pivote y al método que estamos usando para construir el intervalo
de confianza método pivotal.
Denotemos zα/2 al número real tal que P (Z > zα/2 ) = α/2, siendo Z ∈ N(0, 1), ver Figura 1. El valor de zα/2
se obtiene de las tablas de la normal. Entonces
! r r !
|p̂ − p| (1 − p) (1 − p)
1−α=P p < zα/2 = P p̂ − zα/2 p < p < p̂ + zα/2 p
p (1 − p)/n n n
De la expresión anterior se deduce un intervalo de confianza para p con nivel de confianza 1 − α, que estaría
p p
centrado en p̂ y tendría radio zα/2 p (1 − p)/n. Sin embargo, la desviación típica de p̂ es p (1 − p)/n que,
p
por depender de la proporción poblacional p, es desconocida. Por este motivo, tenemos que tomar p̂ (1 − p̂)/n
como estimador de la desviación típica de p̂, y usarlo para construir el intervalo de confianza:
r r !
p̂ (1 − p̂) p̂ (1 − p̂)
p̂ − zα/2 , p̂ + zα/2
n n
1−α
zα/2
Figura 1: Denotamos zα/2 el número real tal que P (Z > zα/2 ) = α/2, siendo Z ∈ N(0, 1).
Página 5 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
formada por n variables aleatorias independientes y con la misma distribución N(µ, σ 2 ). El problema de inferencia
consiste en averiguar los parámetros µ, media poblacional, y σ, desviación típica poblacional.
1X
X̄ = Xi .
n
La media de X̄ es E(X̄) = µ.
σ2
La varianza de X̄ es Var(X̄) = n .
Por la propiedad de aditividad de la distribución normal y dado que X̄, la media muestral, es la suma de
n variables independientes, entonces la media muestral tiene distribución normal X̄ ∈ N(µ, σ 2 /n).
De esto se deduce que la media muestral es un estimador insesgado de la media poblacional y que su varianza
es la poblacional dividida por n. Por tanto, la dispersión será tanto mayor cuanto mayor sea la de la población
y decrece tendiendo a cero cuando el tamaño muestral aumenta. De este modo vemos también que la media
muestral es un estimador consistente de la media.
1X
Sµ2 = (Xi − µ)2 .
n
Se puede comprobar que E(Sµ2 ) = σ 2 y, por lo tanto, la varianza muestral es un estimador insesgado de la
varianza.
Página 6 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
X̄ − µ
√ ∈ N(0, 1)
σ/ n
y extraer de este pivote un intervalo de confianza para la media cuando la varianza es conocida, de la forma:
σ σ
X̄ − zα/2 √ , X̄ + zα/2 √
n n
donde zα/2 denota el número real tal que P (Z > zα/2 ) = α/2, siendo Z ∈ N(0, 1).
X̄ − µ
√ ∈ Tn−1 .
Sc / n
Figura 2: En verde densidad de una T de Student con 2 grados de libertad, en rojo densidad de una N(0,1) y
en negro densidad de una T de Student con 20 grados de libertad
Propiedades:
1. La variable T de Student toma valores en toda la recta real.
Página 7 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
siendo tα/2 el valor que deja una probabilidad α/2 a su derecha en la distribución Tn−1 , ver Figura 3.
1−α
tα/2
Figura 3: Denotamos tα/2 el número real tal que P (Tk > tα/2 ) = α/2, siendo Tk una variable T de Student
con k grados de libertad.
El precio que tenemos que pagar por no conocer la varianza es que, como tα/2 > zα/2 , el intervalo de confianza
para la media con varianza desconocida suele resultar más amplio que el construido con varianza conocida.
nSµ2
∈ χ2n
σ2
Página 8 de 9
Beatriz Pateiro López Estadística. Ingeniería Química
Propiedades:
Del pivote anterior se deduce un intervalo de confianza para la varianza cuando la media es conocida, de la
forma:
!
nSµ2 nSµ2
,
χ2α/2 χ21−α/2
siendo χ2α/2 χ21−α/2 los valores que dejan probabilidades respectivas α/2 y 1 −α/2 a la derecha en la distribución
χ2n , ver Figura 5.
1−α
α/2 α/2
χ21−α/2 χ2α/2
Figura 5: Denotamos χ2α/2 y χ21−α/2 los valores que dejan probabilidades respectivas α/2 y 1 − α/2 a su derecha
en la distribución χ2n .
siendo χ2α/2 y χ21−α/2 los valores que dejan probabilidades respectivas α/2 y 1−α/2 a su derecha en la distribución
χ2n−1 .
Página 9 de 9
Estadística
Tema 8: CONTRASTE DE HIPÓTESIS
Curso 2008/2009
Índice
1. Introducción 2
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Introducción
Los procedimientos de inferencia que hemos realizado hasta ahora se resumen en dos: la estimación puntual y los
intervalos de confianza. Con la estimación puntual se obtienen valores concretos que sirven de estimaciones de
los parámetros poblacionales de interés, por ejemplo, estimamos la media poblacional, µ, con la media muestral,
x̄. Con los intervalos de confianza se obtienen regiones aleatorias que contienen a los parámetros de interés
con cierta probabilidad, por ejemplo, el intervalo de confianza con nivel de confianza 1 − α para la media µ de
una población normal es x̄ ± zα/2 √σn , cuando la desviación σ es conocida. La otra gran tarea de la Inferencia
Estadística consiste en responder a preguntas muy concretas sobre la población. Por ejemplo, ¿hay la misma
proporción de vehículos diésel que de gasolina? Como veremos se plantean en términos de unas hipótesis que
debemos aceptar o rechazar. Y esta decisión la tomaremos en base a una realización muestral. Cuando los datos
muestrales discrepen mucho de la hipótesis (en nuestro ejemplo, cuando la proporción muestral de vehículos
diésel sea muy distinta de la proporción de vehículos de gasolina) rechazaremos la hipótesis.
Observamos que se puede tomar una decisión correcta o errónea. Llamamos error de tipo I al que cometemos
cuando rechazamos la hipótesis nula, siendo cierta. Error de tipo II es el que cometemos cuando aceptamos
la hipótesis nula, siendo falsa.
Nivel de significación: Es la probabilidad del error de tipo I. Lo denotamos por α:
Página 2 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
Debemos adoptar un criterio que, en base a la muestra, nos permita decidir si aceptamos o rechazamos la
hipótesis nula. Obviamente, queremos minimizar las probabilidades de los errores de tipo I y II. Pues bien, la
forma de minimizar la probabilidad del error de tipo I (el nivel de significación) es mediante un criterio que
acepte H0 la mayor parte de las veces. Sin embargo, así se incrementa la probabilidad del error de tipo II, esto
es, disminuye la potencia del test. Una forma de proceder ante un problema con dos objetivos como es éste,
consiste en fijar el nivel de significación y escoger el criterio que nos proporcione la mayor potencia posible.
Al fijar un nivel de significación, α, se obtiene implícitamente una división en dos regiones del conjunto de
posibles valores del estadístico de contraste: La región de rechazo o región crítica que tiene probabilidad α
(bajo H0 ) y la región de aceptación que tiene probabilidad 1 − α (bajo H0 ).
Si el valor del estadístico cae en la región de aceptación, no existen razones suficientes para rechazar la
hipótesis nula con un nivel de significación α, y el contraste se dice estadísticamente no significativo,
es decir no existe evidencia a favor de Ha .
Si el valor del estadístico cae en la región de rechazo, los datos no son compatibles con H0 y la rec-
hazamos. Entonces se dice que el contraste es estadísticamente significativo, es decir existe evidencia
estadísticamente significativa a favor de Ha .
2. Elegir un estadístico de contraste apropiado, T (X1 , ..., Xn ) , que sea una medida de la discrepancia entre
la hipótesis y la muestra.
3. Fijar el nivel de significación α en base a cómo de importante se considere rechazar H0 cuando realmente
es cierta.
4. Prefijado y elegido T (X1 , ..., Xn ), construir las regiones de aceptación y rechazo, según se trate de un
contraste uni o bilateral.
Rechazaremos la hipótesis simple H0 : p = p0 si la proporción muestral discrepa mucho de p0 , tanto por ser
mucho mayor como por ser mucho menor. Estandarizando p̂ obtenemos un estadístico con distribución conocida
y tabulada. Sobre este estadístico construimos la región de aceptación y la región de rechazo (o región crítica).
Página 3 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
Pues bien, hemos dicho que fijamos el nivel de significación y escogemos el criterio que maximiza la potencia.
Supongamos entonces que hemos determinado ya α. Si la hipótesis fuera cierta, esto es, p = p0 entonces el
estadístico tiene distribución dependiente del parámetro p0 (conocido). Podemos buscar entonces zα/2 en las
tablas de la normal de forma que la región crítica tenga probabilidad α, pues ésta sería la probabilidad de que,
siendo p = p0 , el estadístico cayera en esa región y en consecuencia se rechazara la hipótesis. El criterio final
sería (ver Figura 1):
|p̂ − p0 |
Rechazamos H0 : p = p0 si q > zα/2
p0 (1−p0 )
n
En este caso de hipótesis nula simple, la región crítica se descompone en dos trozos y, por ello, hablamos de
contraste bilateral. Si la hipótesis nula fuera compuesta, por ejemplo H0 : p ≤ p0 , sólo rechazaríamos cuando
p̂ fuera mucho mayor que p0 , y la región crítica tendría un único trozo. En esta ocasión diremos que se trata
de un contraste de hipótesis unilateral. El criterio sería (ver Figura 1):
p̂ − p0
Rechazamos H0 : p ≤ p0 si q > zα
p0 (1−p0 )
n
zα/2 zα z1−α
Figura 1: Función de densidad de una N(0,1). (a) Región de aceptación y rechazo para el estadístico del
contraste H0 : p = p0 . (b) Región de aceptación y rechazo para el estadístico del contraste H0 : p ≤ p0 . (c)
Región de aceptación y rechazo para el estadístico del contraste H0 : p ≥ p0 .
Por último, en muchas ocasiones, en lugar de fijar el nivel de significación, se proporciona la probabilidad que
contendría una región crítica limitada por el valor observado del estadístico. A esta probabilidad le llamamos
nivel crítico y viene a representar el mayor nivel de significación que permite aceptar la hipótesis nula.
Ejemplo 1: Una empresa farmacéutica quiere comercializar un medicamento que cura cierta dolencia. Se sabe
que el 40 % de los pacientes se curan sin tomar este medicamento. La empresa debe probar que su medicamento
es eficaz y para ello administra el medicamento a 100 pacientes, de los cuales se curan 50.
Ejemplo 2: En un ecosistema dos especies de aves A y B se encuentran en equilibrio, con igual proporción
de ambas. Se teme que los últimos acontecimientos hayan alterado el equilibrio, y para comprobarlo, se toma
una muestra de 1600 aves, de las cuales 720 son de la especie A. ¿Podemos concluir que se ha alterado el
equilibrio?
Ejemplo 3: Las normas de calidad no permiten que la proporción de unidades defectuosas supere el 5 %. Una
inspección toma una muestra de 400 unidades y encuentra 16 defectuosas. ¿Constituye este resultado una
prueba significativa de que no se respeta la norma de calidad?
Página 4 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
Como comentario general, debemos ser conscientes de que cuando rechazamos la hipótesis nula en base a una
muestra es porque nos ha aportado pruebas significativas a un nivel α de que esa hipótesis no es cierta. Por
pruebas significativas a un nivel α entendemos que si la hipótesis fuera cierta, la probabilidad de que el resultado
muestral discrepara tanto de ella sería tan pequeña como α. Sin embargo, cuando aceptamos una hipótesis nula
no es porque haya pruebas a su favor, sino porque no las hubo en su contra.
X11 + . . . + X1n1
p̂1 =
n1
X21 + . . . + X2n2
p̂2 =
n2
Pensemos en el contraste de la hipótesis nula de que las dos proporciones poblacionales son iguales. Si dicha
hipótesis nula H0 : p1 = p2 es cierta, entonces
p̂1 − p̂2
q ∼ N(0, 1)
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2
Rechazaremos la hipótesis nula de igualdad de las proporciones cuando las proporciones muestrales sean muy
distintas, y si a eso añadimos un nivel de significación α prefijado, debemos actuar así:
|p̂1 − p̂2 |
Rechazar H0 : p1 = p2 si q > zα/2
p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
n1 + n2
X1 , . . . , Xn ∈ N(µ, σ 2 ) independientes
Página 5 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
Supongamos que la varianza σ 2 es conocida, y se desea contrastar una hipótesis relativa a la media, µ, por
ejemplo, que la media toma cierto valor conocido H0 : µ = µ0 . Si dicha hipótesis nula H0 : µ = µ0 es cierta,
entonces
X̄ − µ0
√ ∈ N(0, 1)
σ/ n
El sentido común nos aconseja rechazar la hipótesis nula de que la media poblacional es µ0 cuando la media
muestral sea muy distinta de µ0 . Si además debemos respetar un nivel de significación α prefijado, debemos
actuar así:
X̄ − µ0
Rechazar H0 : µ = µ0 si √ > zα/2
σ/ n
El contraste unilateral consistiría en:
X̄ − µ0
Rechazar H0 : µ ≥ µ0 si √ < −zα
σ/ n
Podemos repetir toda la argumentación anterior, con la salvedad de que, cuando la varianza es desconocida,
no podemos usar σ y en su lugar debemos emplear un estimador adecuado, por ejemplo, Sc . Sabemos que este
cambio afecta a la distribución, que pasa a ser T de Student. Así, si H0 : µ = µ0 es cierta, entonces
X̄ − µ0
√ ∈ Tn−1
Sc / n
X̄ − µ0
Rechazar H0 : µ ≥ µ0 si √ < −tα
Sc / n
En la Figura 2 se muestran las regiones de aceptación y rechazo de los contrastes sobre la media de una
población con varianza desconocida.
nSµ2
∈ χ2n
σ02
nSµ2 nSµ2
Rechazar H0 : σ 2 = σ02 si > χ2
α/2 o < χ21−α/2
σ02 σ02
Página 6 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
tα/2 tα t1−α
Figura 2: Función de densidad de una Tn−1 . (a) Región de aceptación y rechazo para el estadístico del contraste
H0 : µ = µ0 . (b) Región de aceptación y rechazo para el estadístico del contraste H0 : µ ≤ µ0 . (c) Región de
aceptación y rechazo para el estadístico del contraste H0 : µ ≥ µ0 .
nSµ2
Rechazar H0 : σ 2 ≤ σ02 si > χ2α
σ02
En la Figura 3 se muestran las regiones de aceptación y rechazo de los contrastes sobre la varianza de una
población con media conocida.
Figura 3: Función de densidad de una χ2n . (a) Región de aceptación y rechazo para el estadístico del contraste
H0 : σ 2 = σ02 . (b) Región de aceptación y rechazo para el estadístico del contraste H0 : σ 2 ≤ σ02 . (c) Región de
aceptación y rechazo para el estadístico del contraste H0 : σ 2 ≥ σ02 .
(n − 1)Sc2
∈ χ2n−1
σ02
Página 7 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
(n − 1)Sc2 (n − 1)Sc2
Rechazar H0 : σ 2 = σ02 si 2 > χ2α/2 o < χ21−α/2
σ0 σ02
(n − 1)Sc2
Rechazar H0 : σ 2 ≤ σ02 si > χ2α
σ02
X1 10 15 18 23 12 16
X2 15 10 19 9 14 12 18
Admitiendo normalidad y sabiendo que ambas variables tienen la misma desviación típica, ¿se puede aceptar la
igualdad de medias?.
La situación descrita en el Ejemplo 4 responde al siguiente modelo general. Pensemos en dos poblaciones
normales, con sus respectivas medias y varianzas: N(µ1 , σ12 ) y N(µ2 , σ22 ). Queremos contrastar hipótesis que
comparen sus medias, µ1 y µ2 .
Extraemos una muestra aleatoria simple en cada población
Supongamos que conocemos las varianzas de ambas poblaciones σ12 y σ22 y que queremos contrastar la hipótesis
H0 : µ1 = µ2 . Fijamos el nivel de significación y escogemos el criterio que maximiza la potencia. Supongamos
entonces que hemos determinado ya α. Si dicha hipótesis nula H0 : µ1 = µ2 es cierta, entonces
X̄ − X̄2
q12 ∈ N(0, 1).
σ1 σ22
n1 + n2
Página 8 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
El sentido común nos aconseja rechazar la hipótesis nula de que las medias son iguales cuando X̄1 − X̄2 sea
muy distinta de cero. Por tanto, rechazaremos H0 : µ1 = µ2 (ver Figura 4) si
X̄1 − X̄2
q 2 > zα/2
σ1 σ22
n1 + n2
1−α
zα/2
Figura 4: Función de densidad de una N(0,1). Región de aceptación y rechazo para el estadístico del contraste
H0 : µ1 = µ2 en el caso de dos poblaciones normales basados en muestras independientes con varianzas
conocidas.
6.1.2 Contraste sobre la igualdad de medias con varianzas desconocidas pero iguales
Supongamos ahora que desconocemos las varianzas de ambas poblaciones pero que podemos asumir que dichas
varianzas son iguales. Queremos contrastar la hipótesis H0 : µ1 = µ2 . Si suponemos que las varianzas de las
dos poblaciones son iguales el mejor estimador de la varianza será:
2 2
(n1 − 1)Sc1 + (n2 − 1)Sc2
ST2 = ,
n1 + n2 − 2
que no es más que una adecuada ponderación de los mejores estimadores de cada población (en la ecuación
2 2
anterior, Sc1 y Sc2 denotan la cuasivarianza muestral de primera y segunda población, respectivamente). Se
puede demostrar que
X̄1 − X̄2
q ∈ Tn1 +n2 −2 .
ST n11 + n12
Por los mismos argumentos que en casos anteriores, rechazaremos H0 : µ1 = µ2 (ver Figura 5) si
X̄1 − X̄2
q > tα/2
ST n11 + n12
donde tα/2 es el valor que deja una probabilidad α/2 a su derecha en la distribución Tn1 +n2 −2 .
Supongamos ahora que desconocemos las varianzas de ambas poblaciones y que no podemos asumir que dichas
varianzas son iguales. Queremos contrastar la hipótesis H0 : µ1 = µ2 . Si las varianzas de ambas poblaciones no
Página 9 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
1−α
tα/2
Figura 5: Función de densidad de una Tn1 +n2 −2 . Región de aceptación y rechazo para el estadístico del contraste
H0 : µ1 = µ2 en el caso de dos poblaciones normales basados en muestras independientes con varianzas
desconocidas pero iguales.
pueden suponerse iguales, entonces el estadístico de contraste que debemos utilizar es de la forma:
X̄ − X̄2
q 12 2
∼ N(0, 1)
Sc1 Sc2
n1 + n2
siendo válida esta aproximación cuando las dos muestras son grandes (Criterio: n1 > 30 y n2 > 30). Por lo
tanto, rechazaremos H0 : µ1 = µ2 si
X̄1 − X̄2
q 2 2
> zα/2
Sc1 Sc2
n1 + n2
donde de nuevo zα/2 es el valor que deja una probabilidad α/2 a su derecha en la distribución N(0,1).
Observación: En la práctica, cuando las varianzas teóricas no se conocen, antes de contrastar la igualdad
de medias, se deberá realizar un contraste de igualdad de varianzas. Si éste resulta significativo, entonces se
resolverá el contraste de igualdad de medias considerando varianzas iguales y viceversa.
Página 10 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
Espectroscopía de reflectancia
Lote Ensayo espectométrico UV
en el infrarojo cercano
1 84.63 83.15
2 84.38 83.72
3 84.08 83.84
4 84.41 84.20
5 83.82 83.92
6 83.55 84.16
7 83.92 84.02
8 83.69 83.60
9 84.06 84.13
10 84.03 84.24
Nos gustaría contrastar si existe diferencia significativa entre los resultados obtenidos con los dos métodos.
La situación descrita en el Ejemplo 5 es ligeramente diferente a lo visto hasta este momento. En este caso se
tienen dos muestras:
observadas en los mismos individuos 1, ..., n, es decir, cada par de observaciones (X1i , X2i ) , se toma del
mismo i -ésimo individuo, para i = 1, ..., n.
Se supone que las muestras se han obtenido de poblaciones normales, X1 ∈ N µ1 , σ12 e X2 ∈ N µ2 , σ22 , pero
teniendo en cuenta que ahora X1 y X2 no son independientes. A las muestras obtenidas de esta manera se les
denomina muestras apareadas.
Para abordar contrastes para comparar dos medias en esta situación se considera la variable, D = X1 − X2 , que
sigue una distribución normal (puesto que es una combinación lineal de variables normales).
µD = E (X1 − X2 ) = µ1 − µ2
2
V ar (D) = σD = V ar (X1 − X2 )
µD mediante D̄
2 2
σD mediante ScD
Página 11 de 12
Beatriz Pateiro López Estadística. Ingeniería Química
El sentido común nos aconseja rechazar la hipótesis nula de que las medias son iguales cuando D̄ sea muy
distinta de cero. Como siempre, rechazaremos H0 : µ1 = µ2 si
D̄
√ > tα/2
ScD / n
donde tα/2 es el valor que deja una probabilidad α/2 a su derecha en la distribución Tn−1 .
Página 12 de 12
Estadística
Boletín 1: ESTADÍSTICA DESCRIPTIVA
Curso 2008/2009
Ej. 1 — Se midió el tiempo en segundos que tarda en consumirse cierto combustible, con los siguientes resul-
tados:
11, 14, 7, 18, 12, 8, 10, 16, 12, 6
Obtén la tabla de frecuencias resultante de agrupar esos 10 datos en los intervalos [5, 10), [10, 15) y [15, 20).
Calcula la mediana con los 10 datos y con la tabla de frecuencias obtenida anteriormente.
Ej. 3 — Se han medido los pesos y las alturas de diez personas, obteniéndose los resultados siguientes (los
pesos vienen expresados en kilogramos y las alturas en centímetros):
Peso: 68 65 75 84 81 62 88 70 72 78
Altura: 161 165 168 178 185 158 182 163 172 176
Ej. 4 — De un total de n números la fracción p son unos y la fracción 1 − p son ceros. Hallar los tres primeros
momentos respecto a la media de estos números.
Ej. 5 — Las longitudes, medidas en metros, en una muestra de varillas de acero, han sido:
Obtén la tabla de frecuencias resultante de agrupar estos datos en los intervalos [4, 8), [8, 12) y [12, 20).
Representa el histograma de frecuencias. Sobre la tabla de frecuencias, calcula la media, la desviación típica y
el coeficiente de variación. ¿Qué valores habrían tomado estas tres medidas si la longitud hubiera sido medida
en centímetros?
Ej. 6 — Se han medido mediante pruebas adecuadas los coeficientes intelectuales de un grupo de 20 alumnos,
viniendo los resultados agrupados en seis intervalos de amplitud variable. Estas amplitudes son C1 = 12, C2 = 12,
C3 = 4, C4 = 4, C5 = 12, C6 = 20. Si las frecuencias relativas acumuladas correspondientes a cada uno de los
intervalos son: F1 = 0,15, F2 = 0,15, F3 = 0,55, F4 = 0,8, F5 = 0,95, F6 = 1. Se pide:
1. Formar la tabla de distribución de frecuencias (absolutas, relativas, absolutas acumuladas, relativas acu-
muladas), sabiendo que el extremo inferior del primer intervalo es 70.
2. Dibujar el histograma y el polígono de frecuencias. Calcular las medidas de posición central.
3. ¿Entre que dos percentiles está comprendido un coeficiente intelectual de 98.4? Encontrar el valor de
ambos percentiles. ¿De qué tipo de medida se trata?
1
Ej. 7 — Se considera el número de materias suspensas que constan en el expediente de un grupo de alumnos.
Con estos datos se construyó la siguiente distribución de frecuencias:
2
Estadística
Boletín 2: DESCRIPCIÓN ESTADÍSTICA DE DOS VARIABLES
Curso 2008/2009
Profundidad en m. 15 20 30 40 50 60 70
Contenido oxígeno en mg/l 6.5 5.6 5.4 6 4.6 1.4 0.1
Ej. 2 — La siguiente tabla contiene 6 lecturas del colorímetro (X) efectuadas sobre 6 disoluciones y sus 6
concentraciones de resina correspondientes (Y ) determinadas por análisis químico (medidas en mg/100ml):
X Y
8 0.12
50 0.71
81 1.09
102 1.38
140 1.95
181 2.50
1. Obtener la ecuación de la recta ajustada a la muestra bidimensional por el método de mínimos cuadrados.
2. Estudiar el grado de asociación lineal de la muestra anterior.
3. Supongamos que sobre una séptima disolución sabemos que la lectura del colorímetro fue 95, pero
hemos extraviado su correspondiente medida de la concentración de resina. Haz una predicción de dicha
concentración.
Ej. 3 — Se han examinado una serie de soluciones estándar de fluoresceína en un fluorímetro lo que condujo
a las siguientes intensidades de fluorescencia (en unidades arbitrarias ):
1
1. Halla la covarianza y la varianza de Y .
2. Si x̄ = 2, determina ȳ y el momento respecto al origen de orden 2 de Y .
Ej. 5 — La siguiente tabla muestra la distribución conjunta de frecuencias relativas de la variable X, que
representa el número de tarjetas de crédito que posee una persona, y la variable Y , que refleja el número de
compras semanales pagadas con tarjeta de crédito.
X\Y 0 1 2 3 4
1 0.08 0.13 0.09 0.06 0.03
2 0.03 0.08 0.08 0.09 0.07
3 0.01 0.03 0.06 0.08 0.08
1. Si se sabe que en el estudio han participado 300 personas, hallar la distribución conjunta de frecuencias
absolutas.
2. Hallar la distibución marginal de Y . ¿Cuál es el número medio y la desviación típica del número de
compras semanales pagadas con tarjeta de crédito?
3. Obtener la distibución del número de tarjetas de crédito que poseen las personas de dicho estudio. ¿Cuál
es el número más frecuente de tarjetas de crédito que posee una de estas personas?
4. Calcular la distribución del número de compras semanales pagadas con tarjetas de crédito que realizan
las personas que poseen tres tarjetas. ¿Cuál es la media de esta distribución?
Ej. 6 — Se han estudiado el cociente intelectual de 100 niños (X) y sus calificaciones en Matemáticas (Y )
obteniéndose los siguientes resultados:
2
Estadística
Boletín 3: PROBABILIDAD
Curso 2008/2009
Ej. 3 — A un congreso asisten cien personas, de las cuales 60 hablan sólo inglés, 30 sólo francés y los 10
restantes ambos idiomas. Calcular la probabilidad de que se entiendan dos congresistas elegidos al azar.
Ej. 4 — Sean A, B y C sucesos arbitrarios de un experimento aleatorio. Se consideran los siguientes sucesos:
E1 = al menos dos de los sucesos A, B, C ocurren.
E2 = exactamente dos de los sucesos A, B, C ocurren.
E3 = al menos uno de los sucesos A, B, C ocurre.
E4 = exactamente uno de los sucesos A, B, C ocurre.
E5 = no más de dos sucesos A, B, C ocurren.
1. Expresar E1 , E2 , E3 , E4 y E5 en función de A, B y C.
2. Suponiendo que los sucesos A, B y C son independientes y sus probabilidades son 0.5, 0.2 y 0.3, respec-
tivamente, calcula la probabilidad de E5 .
Ej. 5 — La probabilidad de que un chico acuda a una fiesta el sábado es 1/4, y la probabilidad de que su novia
acuda a la fiesta es 1/3. Hallar la probabilidad de que:
1. Ambos acudan a la fiesta.
2. Al menos uno acuda a la fiesta.
3. Ninguno vaya a la fiesta.
4. Solamente la chica acuda a la fiesta.
Ej. 6 — En una urna hay dos bolas blancas y una negra. Dos individuos han de sacar sucesivamente y sin
reemplazamiento una bola de la urna. ¿Cuál de los dos tiene mayor probabilidad de sacar la bola negra?
1
Ej. 7 — Tenemos dos urnas. La urna U1 contiene 3 bolas blancas y 2 negras, y la urna U2 contiene 1 bola
blanca y 3 negras. Con probabilidad 1/3, extraeremos una bola al azar de la urna U1 y con probabilidad 2/3
extraeremos una bola al azar de la urna U2 . Si al final nos comunican que la bola obtenida es blanca, ¿cuál es
la probabilidad de que provenga de la urna U1 ?, ¿y de que provenga de la urna U2 ?
Ej. 8 — Se lanzan dos monedas y, a continuación, se lanza un dado tantas veces como caras se hayan obtenido.
Hallar la probabilidad de que la suma de puntuaciones sea 6.
Ej. 9 — Una población está formada por tres grupos étnicos: A (30 %), B (10 %) y C (60 %). Los porcentajes
del carácter “ojos claros” son, respectivamente, 20 %, 40 % y 5 %. Calcular:
1. La probabilidad de que un individuo elegido al azar tenga ojos claros.
2. La probabilidad de que un individuo de ojos oscuros sea de A.
3. Si un individuo, elegido al azar, tiene los ojos claros, ¿a qué grupo es más probable que pertenezca?
Ej. 10 — En un laboratorio se toman 200 medidas del contenido de mercurio en muestras de polvo utilizando
un polarógrafo a varias distancias. Los resultados se clasifican por nivel de mercurio en cuatro clases (bajo,
medio-bajo, medio-alto y alto) y por distancia al polarógrafo en tres clases (cerca, intermedio, lejos). El número
de observaciones en cada grupo se clasifican en la tabla siguiente:
Ej. 11 — Un ladrón en la plaza Roja, al huir de un policía, puede hacerlo por la calle Fray Rosendo Salvado,
República del Salvador o San Pedro de Mezonzo, con probabilidades 0.25 , 0.6 y 0.15, respectivamente. La
probabilidad de ser alcanzado si huye por la calle Fray Rosendo Salvado es 0.4 , si huye por la calle República
del Salvador es 0.5 y si huye por la calle San Pedro de Mezonzo es 0.6.
1. Calcula la probabilidad de que la policía alcance al ladrón
2. Si el ladrón ha sido alcanzado, ¿cuál es la probabilidad de que haya sido en la calle Fray Rosendo Salvado?
Ej. 12 — De una urna que contiene 8 bolas blancas y 7 negras, hacemos una extracción de 2 bolas, sin
reemplazamiento. En el supuesto de que hayamos visto que una de estas bolas es negra ¿Cuál es la probabilidad
de que la otra también lo sea?.
2
Ej. 13 — Se lanzan dos dados, A y B. A es un dado corriente, mientras que B tiene en sus caras {1, 1, 1, 2,
2, 3}. Calcula la probabilidad de los siguientes sucesos,
1. La suma de los puntos obtenidos es 3.
2. En ambos dados se obtiene el mismo resultado.
3. Obtener un 1 con el dado A, sabiendo que el resultado de B ha sido distinto del obtenido en A.
3
Estadística
Boletín 4: VARIABLES ALEATORIAS UNIDIMENSIONALES
Curso 2008/2009
Ej. 1 — Se lanza un dado. A continuación se lanza una moneda y si sale cara se suma uno a la puntuación del
dado, y si sale cruz se deja igual la puntuación del dado. Sea X la variable aleatoria resultante de esa operación.
1. Determinar la distribución de probabilidad de X.
2. Calcular la media, la varianza y la desviación típica de X.
3. Determinar la probabilidad de que a lo sumo se obtenga un tres.
Ej. 2 — Sea X el tiempo de supervivencia de cierto tipo de resistencias. La función de densidad de X viene
dada por:
x
f (x) = − + 1 si 0 ≤ x ≤ 2
2
1. Comprueba que f es una función de densidad y represéntala gráficamente.
2. Halla la probabilidad de supervivencia más allá de 1.
3. Determina la función de distribución correspondiente.
Ej. 3 — Una máquina fabrica discos cuyos radios se distribuyen con densidad
1
Ej. 6 — Para establecer el precio a pagar por cada litro de leche, una central lechera ha dividido, atendiendo
al contenido de materia grasa por litro, la leche recibida en su factoría en tres categorías:
Categoría ligera: contenido de materia grasa inferior al 4 %
Categoría media: contenido de materia grasa entre el 4 % y el 5 %
Categoría extra: contenido de materia grasa superior al 5 %
El porcentaje de materia grasa por litro de leche recibido es una variable aleatoria con función de densidad:
(
2
f (x) = 9 (6 − x) si x ∈ [3, 6]
0 si x 6∈ [3, 6]
Esta empresa paga el litro de leche a 30 pesetas para la categoría ligera, 35 pesetas para la categoría media y
40 pesetas para la categoría extra. Obténgase el precio medio del litro de leche pagado por esta empresa.
1. Hallar la constante k.
2. Hallar la probabilidad de que X esté comprendida entre 1 y 2.
3. Hallar la probabilidad de que X sea menor que 1.
2
Estadística
Boletín 5: MODELOS DE DISTRIBUCIÓN DE PROBABILIDAD
Curso 2008/2009
Ej. 1 — En un examen entran 10 temas, se preguntan tres y para aprobar hay que contestar correctamente
al menos dos. Un estudiante sabe 7 temas. ¿Qué probabilidad tiene de aprobar?
Ej. 2 — El tiempo de espera de un cliente hasta recibir el producto que ha solicitado sigue una distribución
exponencial de media 40 días. Se pide:
1. La probabilidad de que tenga que esperar más de 40 días.
2. Lleva 40 días esperando, ¿cuál es la probabilidad de que llegue en los próximos 5 días? Calcula la misma
probabilidad si llevase sólo 10 días esperando.
Ej. 3 — Una caja de cincuenta cerillas contiene diez defectuosas. Para inspeccionar la calidad de la caja, se
toman siete cerillas de la misma.
1. ¿Cuál es la probabilidad de que no haya ninguna cerilla defectuosa entre las siete inspeccionadas?
2. Calcula la media y la varianza del número de cerillas defectuosas entre las siete inspeccionadas.
Ej. 4 — Una compañía de explotación petrolífera va a perforar 10 pozos, y cada uno de ellos tiene una
probabilidad 0.1 de producir petróleo en forma comercial. A la compañía le cuesta 1 millón de euros perforar
cada pozo. Un pozo comercial saca petróleo por valor de 50 millones de euros.
1. Calcular la media de la ganancia que obtendrá la compañía por los 10 pozos, así como su desviación
típica.
2. Calcular la probabilidad de que la compañía pierda dinero con la operación.
Ej. 5 — Los errores en un aparato que transmite información, constituyen un proceso de Poisson con intensidad
de 0.1 errores por minuto. ¿Cuál es la probabilidad de que en una hora haya como mucho un error?
Ej. 6 — El departamento de investigación de un fabricante de acero cree que una de las máquinas de rolado
de la compañía está produciendo láminas de metal con espesores variables. El espesor es una variable aleatoria
uniforme con valores entre 150 y 200 mm. Cualquier lámina que tenga menos de 160 mm. de espesor deberá
desecharse, pues resulta inaceptable para los compradores.
1. Calcula la media y la desviación típica del espesor de las láminas producidas por esta máquina.
2. Calcula la función de densidad y represéntala.
3. Calcula la fracción de las láminas de acero producidas por esta máquina que se desechan.
Ej. 7 — Los empleados de cierto laboratorio tienen un horario oficial establecido de 7 horas y media al día,
aunque trabajan entre 7 horas y 7 horas y 45 minutos al día dependiendo de diversos factores.
1. Calcula el tiempo que se puede esperar que trabaje al día un empleado.
2. ¿Cuál es la probabilidad de que un día cualquiera un empleado incumpla su horario?
1
3. En un departamento de ese laboratorio trabajan 5 empleados de forma independiente, ¿cuál es la prob-
abilidad de que un día cualquiera sólo uno de esos empleados incumpla su horario?
Ej. 8 — Los errores en el peso proporcionado por la báscula de un laboratorio son normales de media 0 y
desviación 1 kg. Calcula la probabilidad de que la diferencia entre el peso real de un material y el proporcionado
por la báscula no supere los 500 gr. (bien por exceso o bien por defecto).
Ej. 9 — El consumo diario de carburante de cierta maquinaria sigue una distribución normal de media 7.31 y
desviación 2.36 litros.
1. Calcula el porcentaje de días que el consumo supera los 9 litros.
2. ¿Cuántos litros consume como mínimo el 5 % de los días de mayor gasto?
Ej. 10 — Según recomendaciones de un estudio de salud laboral, no se deberían pasar más de 2 horas seguidas
trabajando con el ordenador. Una gran empresa sabe que el tiempo máximo diario que están sus empleados
trabajando con el ordenador sin realizar ninguna pausa es normal con una media de 3 horas y media y una
desviación de 48 minutos, ¿qué porcentaje de empleados incumple esa recomendación?
Ej. 11 — En una universidad se ha observado que el 60 % de los estudiantes que se matriculan lo hacen en
una carrera de Ciencias, mientras que el otro 40 % lo hacen en carreras de Humanidades. Si un determinado
día se realizan 20 matrículas, calcular la probabilidad de que:
1. Haya igual número de matrículas en Ciencias y en Humanidades.
2. El número de matrículas en Ciencias sea menor que en Humanidades.
3. Haya al menos 8 matrículas en Ciencias.
4. No haya más de 12 matrículas en Ciencias.
Ej. 12 — Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de
0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes
1. ¿Cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas?
2. ¿Y de que a lo sumo dos se encuentren defectuosas?
3. ¿Cuál es la probabilidad de que por lo menos una se encuentre defectuosa?
Ej. 13 — Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100
horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho,
1. ¿Cuál es la probabilidad de que falle un componente en 25 horas?
2. ¿Y de que fallen no más de dos componentes en 50 horas?
Ej. 14 — Supóngase que X se distribuye como N(µ, σ 2 ), de manera que P (X ≤ 0) = 1/3 y P (X ≤ 1) = 2/3.
1. ¿Cuáles son los valores de µ y σ 2 ?
2. ¿Y si P (X ≤ 1) = 3/4?
2
Estadística
Boletín 6: INFERENCIA ESTADÍSTICA: ESTIMACIÓN PUNTUAL,
INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS
Curso 2008/2009
Ej. 1 — En 20 días lectivos y a la misma hora se ha observado el número de terminales de una universidad
conectados a Internet. Los resultados son:
1027, 1023, 1369, 950, 1436, 957, 634, 821, 882, 942,
904, 984, 1067, 570, 1063, 1307, 1212, 1045, 1047, 1178.
Se pide:
1. Calcular el intervalo de confianza al 95 % para el número medio de terminales conectados a Internet.
2. Calcular el intervalo de confianza al 90 % para la varianza del número de terminales conectados a Internet.
Ej. 2 — Una compañía asegura que sus tornillos miden por término medio tres centímetros. Se sabe que el
proceso de producción sigue una distribución normal y padece una desviación típica de 0.1 cm. ¿Se puede dudar
de la veracidad de ese tamaño medio si en una muestra de 25 tornillos la media fue de 3.5 cm?
Ej. 4 — Una empresa desea conocer la proporción de clientes dispuestos a demandar el producto que ofrece.
Para ello consultó, al azar, a cien de ellos, obteniendo los siguientes resultados: 30 estarían dispuestos a demandar
y el resto no.
1. Obtener la estimación puntual de la proporción poblacional de demandantes.
2. Calcular la probabilidad de que la proporción muestral de demandantes difiera de la correspondiente
proporción poblacional en menos de 0.15.
Ej. 5 — Se toma una muestra aleatoria de diez alumnos de una población escolar. Se considera, por experiencias
anteriores, que la estatura de un alumno tiene distribución normal de media 167 cm y desviación típica 3.2 cm.
Se pide:
1. Probabilidad de que la media muestral de las alturas de los diez alumnos sea inferior a 165 cm.
2. Probabilidad de que la cuasivarianza muestral de las alturas de los 10 alumnos sea superior a 16.50 cm2 .
Ej. 6 — Cierta empresa se ha propuesto comercializar un aparato para analizar la concentración en sangre de
una sustancia. Los fabricantes son conocedores de que su método presenta un error de medición cuya desviación
típica es de 2.4 mg/l. Sin embargo, dado que desconocen la media, se han decidido a tomar una muestra que
les permita estimarla. A continuación consta tal muestra de los errores de medición (en mg/l):
0.51, -2.75, 1.83, 2.97, -0.82, 2.32, -0.69, -2.19,
1.47, -1.54, 0.30, -1.25, 0.18, -0.21, -1.95, -3.67.
1
Elabora una estimación de la media y construye un intervalo de confianza a un nivel del 99 % para dicha
estimación, suponiendo que los errores siguen una distribución normal.
Ej. 7 — Los siguientes datos representan los tiempos (en minutos) de montaje para 20 unidades seleccionadas
aleatoriamente:
9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2
10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7
Supóngase que el tiempo necesario para montar una unidad es una variable aleatoria normal. A partir de esta
muestra, ¿existe alguna razón para creer, a un nivel de 0.05, que la media del tiempo de montaje es mayor de
10 minutos?
Ej. 8 — La cantidad de horas que duermen los escolares cada noche varía mucho. Consideremos la siguiente
muestra de las horas que duermen cada noche 16 alumnos de un instituto.
6.9, 7.6, 6.5, 6.2, 7.8, 7.0, 5.5, 7.6,
7.3, 6.6, 7.1, 6.9, 6.8, 6.5, 7.2, 5.8
1. Calcula una estimación puntual para la media de horas que se duerme cada noche y para la desviación
típica. ¿Qué estimadores utilizas? ¿Por qué?
2. Suponer que la población sigue una distribución normal.
a) Determinar un intervalo de confianza del 80 % para la media de horas que se duerme cada noche.
b) Determinar un intervalo de confianza del 90 % para la varianza.
Ej. 9 — Se pretende conocer la media y la varianza del tiempo de eliminación de un medicamento. Para ello,
se han observado los tiempos en una muestra de pacientes, obteniéndose los siguientes datos (en horas):
5.64, 7.83, 6.92, 5.31, 8.85, 7.94, 6.04, 5.19,
7.33, 8.24, 7.68, 6.47, 6.09, 8.75, 5.87, 7.28.
Supón que los datos proceden de una distribución normal y, en base a ello, confecciona estimaciones para la
media y la varianza, así como intervalos de confianza a un nivel del 90 % para las mismas.
Ej. 10 — En una región han registrado las profundidades que tuvieron que alcanzar los pozos hasta obtener
agua (en metros): 21, 19, 29, 30, 28, 22, 26, 25, 28, 22. Proporciona una estimación de la media. Suponiendo
que la profundidad tiene distribución normal, construye un intervalo de confianza a un nivel del 95 % para esa
estimación de dos formas: sabiendo que la desviación típica es de 4 metros y sin conocer la desviación típica.
Ej. 11 — El responsable del control de calidad de una factoría está interesado en determinar si la distribución
de la tensión de ruptura (en K/cm2 ) de cierto metal cumple los requisitos para ser empleado en la construcción
de buques. Estos requisitos se traducen en que la media de la tensión debe ser de 454 K/cm2 , con una desviación
de 9 K/cm2 . Para ver si se cumplen dichos requisitos, se seleccionan de forma aleatoria 21 muestras del metal
sometiéndolas a presión hasta su ruptura. Las tensiones obtenidas dan lugar a una media muestral de 443.81
K/cm2 y a una cuasidesviación típica muestral igual a 9.4 K/cm2 . Suponiendo normalidad,
1. Realizar los test de hipótesis pertinentes (α = 0.1) para verificar si se cumplen los requisitos.
2. Determinar un intervalo de confianza de nivel 0.90 para la tensión media y otro para su desviación típica.
Explicar cómo se podrían haber resuelto los contrastes del apartado anterior a partir de estos intervalos.
2
Ej. 12 — Se cree que los jóvenes adolescentes que fuman comienzan a hacerlo a una edad más temprana que
las chicas adolescentes fumadoras. ¿Los siguientes datos apoyan esta suposición?. (Suponer que la distribución
de la variable edad a la que empiezan a fumar hombres y mujeres, es normal).
Hombres Mujeres
n = 31 m = 13
x̄ = 11.3 años ȳ = 12.6 años
sx2 = 4 años2 sy2 = 3.5 años2
Ej. 13 — Para estudiar el efecto del ejercicio físico sobre el nivel de triglicérido, se ha realizado el siguiente
experimento con 11 individuos: previo al ejercicio, se tomaron muestras de sangre para determinar el nivel de
triglicérido por 100 mililitros de sangre, de cada sujeto. Después los individuos fueron sometidos a un programa
de ejercicios que se centraba diariamente en carreras y marchas. Al final del periodo de ejercicios, se tomaron
nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de triglicérido. De este modo, se
dispone de dos conjuntos de observaciones del nivel de triglicérido por 100 mililitros de sangre de los sujetos:
(suponer normalidad),
Sujeto 1 2 3 4 5 6 7 8 9 10 11
Previo 68 77 94 73 37 131 77 24 99 629 116
Posterior 95 90 86 58 47 121 136 65 131 630 104
¿Hay pruebas suficientes para afirmar que el ejercicio físico produce cambios en el nivel de triglicérido?
Ej. 14 — Hallar un intervalo de confianza del 99 % para µ, número medio de microgramos de partículas en
suspensión por metro cúbico de aire, en base a los valores de una muestra aleatoria simple de tamaño n = 5,
dada por {58, 70, 57, 61, 59}, en los siguientes casos:
1. X, número de microgramos de partículas en suspensión por metro cúbico de aire, está normalmente
distribuida con varianza 9.
2. X, número de microgramos de partículas en suspensión por metro cúbico de aire, está normalmente
distribuida con varianza desconocida.
Ej. 15 — Una empresa de metalurgia está interesada en la temperatura media que alcanza cierta máquina
utilizada en el proceso de fabricación. Para su estimación se obtienen 10 mediciones en grados centígrados:
41.60, 41.84, 42.34, 41.95, 41.86, 42.18, 41.72, 42.26, 41.81, 42.04.
1. Obtener el intervalo de confianza al 95 % para la temperatura media supuesto que σ = 0.30 grados.
2. Deducir el tamaño muestral necesario para conseguir un intervalo de confianza al 95 % con una longitud
menor o igual que 0.1 grados.
3. Determinar el intervalo de confianza al 95 % para la temperatura media supuesto que desconocemos el
valor de σ.
3
Estadística
Práctica 1: INTRODUCCIÓN A MATLAB
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
2. Introducción 2
3. El escritorio de MATLAB 2
4. Fundamentos de MATLAB 3
4.1. Operaciones elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4.2. Estructuras de datos: vectores y matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
4.3. Operadores relacionales y lógicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
El objetivo de esta práctica es familiarizarse con el funcionamiento y terminología básicas en MATLAB. Repasare-
mos:
Representaciones gráficas.
2 Introducción
MATLAB es un lenguaje de computación técnica de alto nivel y un entorno interactivo para desarrollo de
algoritmos, visualización de datos, análisis de datos y cálculo numérico. MATLAB cuenta con una amplia gama
de aplicaciones que incluyen procesamiento de señales e imágenes, comunicaciones, diseño de sistemas de
control, sistemas de prueba y medición, modelado y análisis financiero y biología computacional. Los conjuntos
de herramientas complementarios (colecciones de funciones de MATLAB para propósitos especiales, que están
disponibles por separado) amplían el entorno de MATLAB permitiendo resolver problemas especiales en estas
áreas de aplicación.
Además, MATLAB contiene una serie de funciones para documentar y compartir el trabajo. Se puede integrar
código de MATLAB con otros lenguajes y aplicaciones, y distribuir los algoritmos y aplicaciones que desarrollo
usando MATLAB.
Características principales:
Funciones matemáticas para álgebra lineal, estadística, análisis de Fourier, filtraje, optimización e inte-
gración numérica
Funciones para integrar los algoritmos basados en MATLAB con aplicaciones y lenguajes externos, tales
como C/C++, FORTRAN, Java, COM y Microsoft Excel.
3 El escritorio de MATLAB
En general, cuando se inicia MATLAB, aparece el escritorio de trabajo junto con una serie de herramientas
que nos permiten manejar los ficheros, variables y aplicaciones asociadas a MATLAB. En la Figura 2 aparece
un ejemplo del escritorio de MATLAB. Se puede cambiar la visualización del escritorio según las necesidades
abriendo o cerrando nuevas ventanas, redistribuyendo las herramientas, etc. Consulta la ayuda del programa
para adaptar el escritorio a tus necesidades.
Página 2 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
El paquete de ayuda de MATLAB: Para acceder al paquete de ayuda de MATLAB pulsa en el menú
superior el botón Help. Una vez desplegada la ayuda selecciona en la pestaña de Contenidos el
tema que deseas consultar. Además, si tienes dudas sobre los argumentos de una función o sobre su
funcionamiento puedes utilizar el comando help en la consola de comandos. Por ejemplo, escribe
help mean. ¿Qué hace la función mean? ¿Qué argumentos toma?
Figura 1: Vista del escritorio de MATLAB con ventana de comandos, navegador de ficheros, historia de coman-
dos, editor, etc.
4 Fundamentos de MATLAB
Página 3 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Si no se asigna el resultado a ninguna variable, MATLAB lo asigna por defecto a la variable ans (answer):
>> 3-8
ans =
-5
En ocasiones, es interesante no presentar el resultado en la pantalla (por ejemplo, cuando se trata de una lista
de datos muy larga). Eso se consigue poniendo un punto y coma al final de la instrucción.
>> y=3+5;
>>
Edición de la línea de comandos: Con las flechas del teclado se pueden recuperar las órdenes anteriores,
sin tener que volver a teclearlas. Así, en el caso de una equivocación en un comando complicado en
vez de volver a teclear todo, puede recuperarse la instrucción pulsando la tecla “flecha hacia arriba”,
desplazarse hasta el error y arreglarlo.
» v=[sqrt(3) 0 -2]
v =
1.7321 0 -2.0000
Para definir un vector columna, se separan las filas por puntos y comas:
» w=[1;0;1/3]
w =
1.0000
0
0.3333
» w’
ans =
1.0000 0 0.3333
Página 4 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
» v*w
ans =
1.0654
» v+w’
ans =
2.7321 0 -1.6667
» x=4:2:10
x =
4 6 8 10
Vectores de ceros y unos: Con la función zeros se puede crear un vector en el que todas las
componentes sean ceros. La función ones sirve para crear vectores en los que todas las componentes
sean unos. Consulta la ayuda y utiliza dichas funciones para crear vectores de ceros y unos. ¿Cómo
aprovecharías dichas funciones para crear el vector v = (5, 5, 5, 5, 5)? Consulta la ayuda de la función
linspace para obtener el mismo resultado.
» M = [1 2 3 ;4 5 6 ;7 8 9]
M =
1 2 3
4 5 6
7 8 9
» M(3,1)
ans =
7
Para referirse a toda una fila o a toda una columna se emplean los dos puntos. Por ejemplo, la segunda columna
de la matriz se obtiene así:
» v1=M(:,2)
v1 =
2
5
8
>> M(1,:)
ans =
1 2 3
Con las matrices también funcionan las operaciones matemáticas elementales. Así
Página 5 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
» M^2
ans =
30 36 42
66 81 96
102 126 150
Si se quiere operar en los elementos de la matriz, uno por uno, se pone un punto antes del operador. Si se quiere
elevar al cuadrado cada uno de los elementos de M, entonces
» M.^2
ans =
1 4 9
16 25 36
49 64 81
Longitud de un vector y dimensión de una matriz: Consulta la ayuda de las funciones length, size
y numel y aplícalas a diferentes vectores y matrices. ¿Qué calcula cada una de ellas?
== igual
∼= distinto
> mayor
>= mayor o igual
< menor
<= menor o igual
& y
| o
∼ no
>> v=[4 5 7 2 1 6]
v =
4 5 7 2 1 6
>> v==4
ans =
1 0 0 0 0 0
>> v~=4
Página 6 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
ans =
0 1 1 1 1 1
>> ~(v==4)
ans =
0 1 1 1 1 1
>> v>4
ans =
0 1 1 0 0 1
>> v>=4
ans =
1 1 1 0 0 1
>> v>2&v<6
ans =
1 1 0 0 0 0
>> w=[4 6 7 1 5 7]
w =
4 6 7 1 5 7
>> v==w
ans =
1 0 1 0 0 0
>> x=[2 4]
x =
2 4
>> v==x
??? Error using ==> eq
Matrix dimensions must agree.
>> v(v>4)
ans =
5 7 6
Representaciones gráficas con MATLAB: Para más información sobre todas las posibilidades que
ofrece MATLAB a la hora de hacer representaciones gráficas consulta en la ayuda el capítulo dedicado
a este tema. También puedes consultar la ayuda de la función graph2d.
Veamos cómo se puede representar la función seno entre 0 y 10. Para empezar creamos una variable x que va
de cero a 10.
» x=0:0.1:10;
» y=sin(x);
Página 7 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
» plot(x,y)
Otras funciones para cambiar el aspecto del gráfico: Consulta la ayuda de la función plot y utiliza las
funciones a las que se hace referencia en dicha ayuda para cambiar el aspecto de tu gráfico, añadiendo
un título, nombre a los ejes, cambiando el aspecto de los puntos, etc.
Densidades Normales
0.8
N(0,1)
0.7 N(0,0.25)
0.6
Eje de Ordenadas
0.5
0.4
0.3
0.2
0.1
0
−3 −2 −1 0 1 2 3
Eje de Abscisas
−x 2
Figura 2: Intenta reproducir este gráfico. En azul se representa la función f (x) = √1 e 2 . En verde se representa
2π
−x2
la función f (x) = √ 1 e 0,5 .
0,5π
Página 8 de 8
Estadística
Práctica 2: ESTADÍSTICA DESCRIPTIVA CON MATLAB
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
2. Importando datos 2
6. Medidas características 6
6.1. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
6.2. Medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.3. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
6.4. El diagrama de caja o boxplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
7. Ejercicios 8
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
El principal objetivo de esta práctica es conocer los procedimientos de estadística descriptiva que nos ofrece
MATLAB y aplicarlos a un conjunto de datos. Repasaremos:
Representaciones gráficas.
Medidas características
2 Importando datos
La forma más sencilla de importar datos desde MATLAB es mediante el menú de importar datos (File->Import
Data). Utilizando dicho menú podemos leer automáticamente datos numéricos almacenados en cualquier fichero
de texto. Como ejemplo, el fichero altura.txt contiene las alturas de los alumnos de Ingeniería Química del curso
2008/2009. Guarda dichos datos en una variable llamada altura .
Los datos recogidos en clase (sexo, altura, peso, número de hermanos y equipo de los alumnos de Ingeniería
Química del curso 2008/2009) se encuentran guardados en el archivo IQ0809.csv.
Ficheros CSV: Los ficheros CSV (del inglés comma-separated values) son un tipo de documento
sencillo para representar datos en forma de tabla, en los que las columnas se separan por un carácter
delimitador (coma, punto y coma,...) y las filas se separan por saltos de línea.
Abre el fichero IQ0809.csv con un editor de texto y comprueba su estructura. Si intentas importar los datos de
IQ0809.csv en MATLAB a través del menú de importar datos, verás que no es posible. Si el fichero de datos
que queremos importar contiene una mezcla de datos numéricos y alfanuméricos, la opción más simple para
importar dichos datos es la función textscan. Previamente tendrás que abrir el fichero IQ0809.csv mediante
la función fopen para acceder a su lectura.
» fid=fopen(’IQ0809.csv’)
Ahora, para leer el contenido del fichero IQ0809.csv, utiliza la función textscan. Debes especificar el identi-
ficador del fichero fid y los formatos de las columnas de datos (%s para variables carácter, %f para formato
double, %d para formato entero, ...). Además si se utiliza un carácter distinto del espacio en blanco como delim-
itador de columnas, utiliza el parámetro ’delimiter’ para especificar dicho delimitador. Por último, usando
el parámetro ’headerlines’ podemos especificar el número de líneas de cabecera que debemos ignorar.
Completa el siguiente comando con los argumentos necesarios para importar los datos de IQ0809.csv.
» IQ=textscan(fid, ...
Cell array: El resultado de importar los datos del fichero IQ0809.csv es un objeto de tipo cell. Para
acceder a los elementos de dicho objeto utiliza { }.
Una vez importado el fichero, guarda en sexo, altura, peso, nher y equipo los datos de las variables.
Guarda en nind y nvar el número de individuos (tamaño muestral) y el número de variables recogidas.
Página 2 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
>> equipo=nominal(equipo);
>> neq=getlabels(equipo);
>> tabulate(equipo);
Value Count Percent
Atletico 2 2.82%
Barcelona 24 33.80%
Betis 1 1.41%
Celta 5 7.04%
Depor 20 28.17%
Madrid 15 21.13%
Numancia 1 1.41%
Sporting 1 1.41%
Valencia 1 1.41%
nc 1 1.41%
Comenta los resultados. ¿Qué representan las columnas Count y Percent? ¿Cómo calcularías las frecuencias
relativas a partir de dichas columnas? Comprueba que se verifican las propiedades de frecuencias relativas y
absolutas.
Suma de los elementos de un vector: El comando sum permite obtener la suma a lo largo de un vector
columna o un vector fila.
Una vez calculadas las frecuencias absolutas y relativas de cada uno de los equipos de la muestra, podemos
empezar a hacer resúmenes gráficos. Por ejemplo, para hacer un diagrama de barras utilizaremos la función
bar.
Por ejemplo, si guardamos en el vector frel las frecuencias relativas de los equipos de fútbol de la muestra,
>> bar(frel)
>> set(gca,’XTickLabel’,neq)
representará el diagrama de barras que aparece en la Figura 1. El último comando nos permite situar en el eje
de abcisas los nombres de los equipos.
Ejercicio: Realiza un estudio similar con el resto de variables cualitativas recogidas.
Página 3 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
Atletico Barcelona Betis Celta Depor Madrid NumanciaSporting Valencia nc
25
20
15
10
0
Atletico Barcelona Betis Celta Depor Madrid Numancia Sporting Valencia nc
>> tabulate(nher)
Página 4 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Además ahora tiene sentido calcular las frecuencias acumuladas (tanto absolutas como relativas). Utiliza la
función cumsum para calcularlas. Comprueba que se verifican las propiedades de frecuencias relativas y absolutas
acumuladas. Utiliza la función bar para realizar las representaciones gráficas correspondientes, entre ellas un
diagrama de frecuencias acumuladas como el que se muestra en la Figura 3.
70
60
50
40
30
20
10
0
0 1 2 3
>> ninter=round(sqrt(nind));
>> aumento=range(altura)*0.15;
>> extremos=linspace(min(altura)-aumento,max(altura)+aumento,ninter+1)
Una vez determinados los intervalos que tendremos en cuenta, ¿cómo determinarías el intervalo al que pertenece
cada observación?
>> intervalo=zeros(nind,1);
>> for i=1:ninter
intervalo(extremos(i)<=altura&altura<extremos(i+1))=i;
end
Página 5 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
>> tabulate(intervalo)
Value Count Percent
1 2 2.82%
2 12 16.90%
3 16 22.54%
4 13 18.31%
5 17 23.94%
6 7 9.86%
7 3 4.23%
8 1 1.41%
La función histc: MATLAB ofrece el comando histc para construir la agrupación en intervalos de
clase y calcular las frecuencias. Se utiliza así
ni = histc(y,ext): para el vector y cuenta el número de valores de y que caen entre los elementos
del vector ext.
El histograma: MATLAB ofrece el comando hist para construir la agrupación en intervalos de clase,
calcular las frecuencias y representarlas mediante un histograma. Presenta las siguientes posibilidades:
hist(y): Sin argumentos de salida, produce la figura con el histograma. Ojo! las alturas que
representa son frecuencias absolutas
Ejercicio: Programa una función histograma que represente el histograma de una variable cuantitativa con-
tinua de forma que las alturas de los rectángulos representen las densidades de frecuencias.
6 Medidas características
Datos agrupados: Si deseamos ponderar por las frecuencias, en lugar de la función mean, debemos
efectuar el producto escalar del vector de valores distintos por el vector de frecuencias.
Página 6 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
Respecto a la mediana, MATLAB ofrece la función median, que permite calcular la mediana de un vector
de observaciones como el valor central o la media de los dos centrales (según proceda) en las observaciones
ordenadas. Al igual que la función mean, no tiene en cuenta frecuencias y por tanto es aplicable sólo cuando
disponemos de todos los datos de una muestra de una variable continua.
Para calcular la moda, MATLAB no ofrece ninguna función. Sin embargo, podemos obtener la moda solicitando
el máximo de las frecuencias, mediante la función max, que devuelve el máximo valor a lo largo de un vector.
Por ejemplo, calcula la moda para la variable “Número de hermanos”.
MATLAB ofrece la posibilidad de calcular los percentiles de un vector de valores mediante la función prctile.
La sintaxis sería:
>> prctile(x,p)
y devuelve un valor que sería mayor que el p % de los valores del vector x. Por ejemplo, si p = 50, estamos
pidiendo la mediana de x.
Utiliza la función prctile para calcular los cuartiles de las variable “Altura” y “Peso”.
La función std: El lenguaje MATLAB ofrece la funcion std para el cálculo de la desviación tipica
de un vector de datos. Igual que en casos anteriores, no tiene en cuenta frecuencias y maneja como
antes las matrices y vectores. Compara el resultado obtenido con la función que has programado y
con la función std. Ambos resultados no coinciden porque la función std devuelve
v
u n
u 1 X
s=t (xi − x̄)2 .
n−1
i=1
El origen de esta medida (conocida como cuasidesviacion tipica y su cuadrado como cuasivarianza)
se verá justificado en el Tema 7 de Inferencia Estadistica.
Página 7 de 8
Beatriz Pateiro López Estadística. Ingeniería Química
datos atípicos y se representan individualmente. La función para obtener esta representación en MATLAB es
boxplot.
>> boxplot(altura)
1.9
1.85
1.8
Values
1.75
1.7
1.65
1.6
1.55
1
Column Number
7 Ejercicios
Calcula la altura media y peso medio de los chicos y de las chicas de la clase.
1.9
1.85
1.8
Values
1.75
1.7
1.65
1.6
1.55
H M
Página 8 de 8
Estadística
Práctica 3: DESCRIPCIÓN ESTADÍSTICA DE DOS
VARIABLES
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
2. Grácos de dispersión 2
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
El objetivo de esta práctica es aprender a utilizar MATLAB como herramienta para la estimación y discusión
de modelos de regresión. Repasaremos:
Grácos de dispersión.
Funciones para ajustar un modelo de regresión lineal simple.
Covarianza, coeciente de correlación lineal, coeciente de determinación.
2 Grácos de dispersión
La situación general es la siguiente. Disponemos de una variable aleatoria respuesta Y , que supondremos relacio-
nada con otra variable X , que llamaremos explicativa o independiente. A partir de una muestra de n individuos
para los que se dispone de los valores de ambas variables, f(X ; Y ); i = 1; : : : ; ng, podemos visualizar gráca-
i i
mente la relación existente entre ambas. Así, utilizando la función plot de MATLAB podemos realizar un gráco
de dispersión, en el que los valores de la variable X se disponen en el eje horizontal y los de Y en el vertical. En
la Figura 2 se muestran ejemplos de grácos de dispersión.
8 7
7
6
6
5
3
3
2
2
1 1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
25 3
20 2
15 1
10 0
5 −1
0 −2
−5 −3
−10 −4
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Página 2 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
¾Qué conclusiones podrías sacar a partir de las grácas sobre la relación entre las variables X e Y en cada
ejemplo?
Los puntos (X ; Y ) de la gráca inferior izquierda han sido generados a partir del modelo lineal Y =
i i i
a + bX + " . ¾A qué crees que se debe que casi no se aprecie la relación lineal?
i i
¾Existe relación lineal entre las variables X e Y representadas en la gráca superior derecha? ¾Qué tipo
de relación crees que existe?
En la primera y última gráca, los puntos (X ; Y ) han sido generados a partir del modelo lineal Y = i i i
¾Podrías determinar ejemplos reales en los que la relación entre variables se ajuste a alguna de las grácas
mostradas?
Consideremos ahora el siguiente ejemplo real, que ya hemos comentado en clase de teoría.
Se han obtenido veinte mediciones de la concentración de hidrógeno determinada con un método de cromato-
grafía de gases (X ), y la concentración determinada con un nuevo método de sensor (Y ):
X 47 62 65 70 70 78 95 100 114 118 124 127 140 140 140 150 152 164 198 221
Y 38 62 53 67 84 79 93 106 117 116 127 114 134 139 142 170 149 154 200 215
Diagrama de dispersión
Y=Concentración de hidrógeno con un nuevo método de sensor
220
200
180
160
140
120
100
80
60
40
20
40 60 80 100 120 140 160 180 200 220 240
X=Concentración de hidrógeno con un método de cromatografiía de gases
Página 3 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
s2
!
s
S= x xy
s
xy s2
y
donde s 2 , s 2 son las varianzas de las variables X e Y , respectivamente. El término s es la covarianza, que se
x y xy
dene como
1X 1X
n n
i =1 i =1
Calcula la covarianza entre las variables X e Y del ejemplo que estamos tratando. La función
» cov(X,Y)
devuelve la matriz de varianzas-covarianzas, lo que nos permite conocer que la covarianza entre X e Y calculada
por la función cov para esta muestra es 2.1569. ¾Es el mismo resultado que has obtenido programando
directamente la fórmula de la covarianza?
La función cov: El lenguaje MATLAB ofrece la funcion cov para el cálculo de la matriz de varianzas-
covarianzas de una variable bidimensional. La función cov devuelve entre otros la covarianza entre
dos variables calculada como:
1 X
n
(x x)(y y):
n 1
i i
=1 i
s s
xy
x y
que devuelve la matriz de correlación entre ambas variables. En este caso el coeciente es 0.9852, próximo a 1
lo que indica una fuerte relación lineal creciente entre ambos métodos de medición.
Para obtener la recta de regresión realizaremos un ajuste por el método de mínimos cuadrados.
» m=polyfit(X,Y,1)
s2
x
y
a = y bx:
Página 4 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
A partir de la recta de regresión se pueden obtener las predicciones para la variable Y a partir de los valores
conocidos de la variable X , sustituyendo convenientemente o bien utilizando el comando polyval de MATLAB.
Por ejemplo, si la concentración de hidrógeno determinada con un método de cromatografía de gases es 112
unidades, entonces por el nuevo método será
>> polyval(m,112)
ans =
111.1908
Almacena en un vector yest las predicciones para todos los valores de la variable X y representa grácamente
los valores reales y los valores pronosticados como se muestra en la Figura 3
250
Y=Concentración de hidrógeno con un nuevo método de sensor
200
150
100
50
0
40 60 80 100 120 140 160 180 200 220 240
X=Concentración de hidrógeno con un método de cromatografiía de gases
Representa la recta de regresión y demuestra que dicha recta pasa por la media muestral.
Página 5 de 5
Estadística
Práctica 4: VARIABLES ALEATORIAS
UNIDIMENSIONALES
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
2. Distribución de Bernoulli 2
3. Distribución binomial 3
5. Ejercicios 6
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
Hasta ahora hemos supuesto que disponíamos de un conjunto de datos que nos venía dado, pero hemos ree-
xionado muy poco acerca de cómo se obtienen estos datos. Se denomina experimento al proceso por el que
obtenemos observaciones. Notar que podemos distinguir entre dos tipos diferentes de experimentos: determi-
nistas y aleatorios.
1. Los experimentos deterministas son aquellos tales que siempre que se repitan bajo condiciones análogas,
2. Los experimentos aleatorios son aquellos tales que siempre que se repitan bajo condiciones análogas,
se obtienen resultados diferentes, pero que se conocen previamente. Es decir, dentro de los posibles
Los experimentos que nos interesan son los que producen resultados impredecibles, es decir, los experimentos
aleatorios. ¾Cúal es el tiempo de reacción de un determinado proceso químico (por ejemplo, tiempo de reacción
del cloro en agua)? Dicho tiempo depende de multitud de factores que ocasionan que tengamos un amplio rango
de valores posibles, pero antes de realizar el proceso es imposible de determinar con exactitud. Una variable
aleatoria se dene entonces como el resultado de realizar un experimento aleatorio. En el ejemplo, podemos
denir la variable aleatoria X ="Tiempo de reacción del cloro en agua". Este experimento se puede repetir
tantas veces como se quiera. Si realizamos este experimento 100 veces y tomamos los tiempos de reacción,
obtenemos una muestra de valores de la variable aleatoria de tamaño muestral 100. La población correspondería
a todas las posibles veces que podemos intentar medir el tiempo de reacción del cloro en agua que, en principio,
son innitas.
1. Variables aleatorias discretas son las que toman valores de un conjunto de valores discretos. Por ejemplo,
2. Variables aleatorias continuas son las que toman valores de la recta real. Por ejemplo, el tiempo de reacción
del cloro en agua o el índice de masa corporal son variables aleatorias continuas.
Pero gracias a nuestra experiencia sabemos que los valores de ciertos experimentos se repiten unos más que
otros. Por ejemplo, sabemos que es más frecuente tener 7 aciertos en la quiniela que 14. Esto ya lo sabemos ya
que hemos visto como obtener frecuencias absolutas y relativas. El concepto de probabilidad procede de estas
frecuencias. Gracias a la probabilidad, podemos relacionar los conceptos de población y muestra e inferir si los
El objetivo de esta práctica es simular, con la ayuda de MATLAB, algunos experimentos aleatorios sencillos y
2 Distribución de Bernoulli
Vamos a comprobar los resultados del lanzamiento de una moneda. Sólo tenemos dos posibles resultados
para cada lanzamiento: cara o cruz. El ejercicio es el siguiente. Vamos a escribir una función que simule los
lanzamientos de una moneda. Para ello, utilizamos la siguiente función, donde los valores C corresponden a
Página 2 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
f u n c t i o n [res] = moneda(n)
% moneda(n)
% Esta función simula n lanzamientos de una moneda
Esta función proporciona n resultados del lanzamiento de una moneda al aire. Probamos los resultados para 1
y 5 lanzamientos.
>> moneda(1)
ans =
X
>> moneda(5)
ans =
CCXXX
>> moneda(5)
ans =
XCXXX
Aumentando el número de lanzamientos: Simula 10 lanzamientos de una moneda y calcula las frecuen-
cias absolutas y relativas del número de caras y número de cruces obtenido. Representa el diagrama
de barras correspondiente para las frecuencias relativas. ¾Qué ocurre si realizas 100 lanzamientos?
Parece ser que, cuanto mayor es el número de intentos, más se acerca la frecuencia relativa del número de
caras a 0.5. Este valor corresponde a lo que llamamos probabilidad de obtener cara. Claro está, la probabilidad
de obtener cruz es 0.5. Por lo tanto, podemos decir que la variable aleatoria X =Resultado de lanzar una
moneda al aire toma el valor C (cara) con probabilidad 0.5 y el valor X (cruz) con probabilidad 0.5. Se
3 Distribución binomial
Como hemos visto, una variable aleatoria Bernoulli toma dos posibles valores con probabilidades p y 1 p,
variable aleatoria Bernoulli. Para ello, consideramos el siguiente ejemplo. Suponemos que una empresa se dedica
a la fabricación de condensadores. Cada condensador consta de 60 tubos metálicos que deben soportar la
circulación de agua a 310K. Se sabe que la probabilidad de que un tubo sea defectuosos es 0.04. ¾Cuál es la
probabilidad de que un condensador no contenga ningún tubo defectuoso? Recuerda que para una distribución
Página 3 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
n=10 n=100
0.8 0.7
0.7 0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1 0.1
0 0
C X C X
n=1000 n=10000
0.7 0.7
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0 0
C X C X
n k n k
P (X = k) = p (1 p) ; k = 0; 1; : : : ; n
k
la función combnk
Así, en el ejemplo anterior, la probabilidad de que un condensador no contenga ningún tubo defectuoso es:
>> nchoosek(60,0)*0.04^0*(1-0.04)^60
ans =
0.0864
Supongamos ahora que la empresa consigue mejorar el sistema de fabricación de tubos reduciendo la probabilidad
Página 4 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
de que un tubo sea defectuoso a 0.01. Calcula la probabilidad de que un condensador no tenga tubos defectuosos
La empresa decide sacar a mercado una segunda gama de condensadores más baratos (aquellos en los que
el número de tubos defectuosos es mayor que 0 y menor o igual que 10). ¾Cuál es la probabilidad de que un
variable binomial Bi n (n; p ) en k , es decir P (X = k ). Además, k puede ser un vector. Esta función se
tablero de Galton (ver Figura 2) es un curioso aparato diseñado por el cientíco inglés Sir Francis Galton en el
que una colección de bolitas van bajando de manera aleatoria. Cada vez que una bola llega a un piso lanza una
moneda y si sale cara se desvía hacia la derecha y si sale cruz hacia la izquierda. Las bolitas se van acumulando
en la parte inferior en unas cajas que representarían el número de caras obtenidas. El proceso da lugar, por lo
tanto, a una distribución binomial donde el número de intentos n viene determinado por el número de las del
tablero.
Existen varias páginas en internet con aplicaciones que simulan el funcionamiento de un tablero de Galton.
Programa una función que simule un tablero de Galton. Los argumentos de entrada serán el número de las del
tablero y el número de bolas que vamos a lanzar. Debes contar cuántas bolas caen en cada caja y representar
Página 5 de 6
Beatriz Pateiro López Estadística. Ingeniería Química
n=1 n=2
0.7 0.5
0.6
0.4
0.5
0.3
0.4
0.3
0.2
0.2
0.1
0.1
0 0
0 1 0 1 2
n=20 n=100
0.2 0.08
0.15 0.06
0.1 0.04
0.05 0.02
0 0
0 5 10 15 20 0 20 40 60 80
Figura 3: Diagrama de barras para las frecuencias relativas tras lanzar 10000 bolas un tablero de Galton con 1,
2, 20 y 100 las.
5 Ejercicios
1. Construye una función en MATLAB que simule el siguiente experimento aleatorio. En una urna hay dos
bolas negras y una bola blanca. Un jugador saca de la urna una bola al azar y gana el juego si la bola
que ha sacado es blanca. Representa los correspondientes diagramas de barras para n = 10, n = 100,
n = 1000 y n = 10000 repeticiones del juego. (Te puede ser de ayuda la función unifrnd).
se espera sacar y cuál será la desviación típica si el experimento se realiza muchas veces?
fabricar un tubo defectuoso p = 0;01. Repite el proceso 1000 veces simulando la fabricación de 1000
Página 6 de 6
Estadística
Práctica 5: VARIABLES ALEATORIAS
UNIDIMENSIONALES II
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
3. Distribución exponencial 2
4. Distribución normal 3
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
El objetivo de esta práctica es repasar, con la ayuda de MATLAB, algunos modelos de probabilidad conocidos
para variables aleatorias continuas.
1
f (x) = si x ∈ [a, b]
b−a
(b−a)2
La varianza es: σ 2 = 12 .
3 Distribución exponencial
La distribución exponencial tiene especial utilidad para representar tiempos de vida: duración de una pieza hasta
que se avería, longevidad de una persona, etc. Por ello, es una variable continua que toma valores en el intervalo
[0, +∞). La definimos a través de su función de densidad.
Una variable aleatoria X tiene distribución exponencial de parámetro λ, λ ∈ (0, +∞), y lo denotamos
X ∈ Exponencial(λ), si su función de densidad viene dada por:
Página 2 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
4 Distribución normal
La distribución normal es la más importante y de mayor uso de todas las distribuciones continuas de probabilidad.
Por múltiples razones se viene considerando la más idónea para modelizar una gran diversidad de mediciones de
la Física, Química o Biología.
La normal es una familia de variables que depende de dos parámetros, la media y la varianza. Dado que todas
están relacionadas entre si mediante una transformación muy sencilla, empezaremos estudiando la denominada
normal estándar para luego definir la familia completa.
Una variable aleatoria continua Z se dice que tiene distribución normal estándar, y lo denotamos Z ∈ N(0, 1),
si su función de densidad viene dada por:
1 1 2
f (z) = √ e − 2 z si z ∈ R
2π
Página 3 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
P (Z ≤ 1,64).
P (Z > 1).
P (Z > −1,23).
P (Z ≤ −0,53).
P (−1,96 ≤ Z ≤ 1,96).
P (−1 ≤ Z ≤ 2).
P (Z > 4,2)
Ejemplo 2: Supongamos que Z ∈ N(0, 1). Calcula los valores de z para los cuales:
P (Z ≤ z) = 0,5.
P (Z < z) = 0,95.
P (Z > z) = 0,95
P (Z ≤ z) = 0,775.
P (Z ≤ z) = 0.
P (Z ≤ z) = 1.
Efectuando un cambio de localización y escala sobre la normal estándar, podemos obtener una distribución con
la misma forma pero con la media y desviación típica que queramos.
Si Z ∈ N(0, 1) entonces
X = µ + σ Z ∈ N(µ, σ 2 )
Página 4 de 5
Beatriz Pateiro López Estadística. Ingeniería Química
Utiliza de nuevo la función normpdf para representar la función de densidad de variables normales con diferentes
valores de µ y σ, como en la Figura 4.
Figura 4: Funciones de densidad de variables normales con distintas medias y varianzas. En rojo densidad de
una N(0, 1).
Si λ ≥ 10 entonces la Poisson de parámetro λ puede ser aproximada por una normal de media µ = λ y
varianza σ 2 = λ.
Si n > 50 y p < 0,1 entonces la Binomial de parámetros n y p puede ser aproximada por una Poisson de
parámetro λ = np.
Página 5 de 5
Estadística
Práctica 6: INFERENCIA ESTADÍSTICA: ESTIMACIÓN
PUNTUAL E INTERVALOS DE CONFIANZA
Curso 2008/2009
Índice
1. Objetivos de la práctica 2
4. Ejercicios 4
1
Beatriz Pateiro López Estadística. Ingeniería Química
1 Objetivos de la práctica
El objetivo de esta práctica es repasar, con la ayuda de MATLAB, algunos conceptos básicos de la inferencia
estadística. Veremos cómo estimar puntualmente un parámetro desconocido. También repasaremos el concepto
de intervalo de confianza y veremos como construirlos dependiendo del parámetro a estimar y de la información
de la que dispongamos.
X1 , X2 , · · · , Xn
Llamamos realización muestral a los valores concretos que tomaron las n variables aleatorias después de
la obtención de la muestra.
Un estadístico es una función de la muestra aleatoria, y por tanto nace como resultado de cualquier
operación efectuada sobre la muestra. Es también una variable aleatoria y por ello tendrá una cierta
distribución, que se denomina distribución del estadístico en el muestreo.
Para resolver el problema de estimación puntual, esto es, para aventurar un valor del parámetro pobla-
cional desconocido, escogemos el valor que ha tomado un estadístico calculado sobre nuestra realización
muestral. Al estadístico escogido para tal fin le llamamos estimador del parámetro. Al valor obtenido con
una realización muestral concreta se le llama estimación.
El problema radica en elegir un “buen estimador”, es decir, una función de la muestra con buenas propiedades.
Existe una vieja historia sobre el Caballero de Mèré, un famoso jugador francés del siglo XVII. El
Caballero de Mèré iba de camino al estado de Poitou cuando conoció a Blaise Pascal, uno de los
matemáticos más famosos del siglo. De Mère le planteó dos problemas a Pascal, ambos relacionados
con juegos de azar. En 1654 Pascal le propuso estas paradojas a Pierre Fermat, otro gran científico de
la época con quien mantenía contacto por correspondencia. Ambos llegaron a la misma conclusión,
lo cual alegró a Pascal, quien escribe en una de sus cartas: “Ya veo que la verdad es la misma en
Toulouse y en Paris”.
La primera paradoja está relacionada con un juego de dados. Aunque no está claro cuanto hay de
cierto en la historia, se cree que el Caballero de Mèré era muy aficionado al juego y que, basándose
en su propia experiencia, proponía la siguiente apuesta: Él ganaba si al tirar cuatro dados salía al
menos un 6.
Página 2 de 4
Beatriz Pateiro López Estadística. Ingeniería Química
Empezaremos por plantear el problema. El parámetro desconocido para el Caballero de Mèré es p, donde
Jugando a ser Mèré con MATLAB: Simula con MATLAB una apuesta del Caballero de Mèré y
decide si has ganado la apuesta o no. Simula 1000 apuestas, ¿cuántas veces has ganado? ¿cuál es la
probabilidad estimada de ganar p̂ a partir de esas 1000 apuestas? Juega otras 1000 partidas. ¿Cuánto
vale ahora p̂?
La media de p̂ es E(p̂) = p
p(1−p)
La varianza de p̂ es Var(p̂) = n
p̂ − p
q ∼ N(0, 1).
p (1−p)
n
Además de la estimación puntual, podemos calcular un intervalo de confianza para p. Hemos visto que
r r !
p̂ (1 − p̂) p̂ (1 − p̂)
p̂ − zα/2 , p̂ + zα/2
n n
es el intervalo de confianza para p con nivel de confianza 1 − α. En la expresión anterior, zα/2 denota el número
real tal que P (Z > zα/2 ) = α/2, siendo Z ∈ N(0, 1), ver Figura 1.
Intervalo de confianza para p con MATLAB: Calcula el intervalo de confianza para p con nivel de
confianza 0.95 a partir de p̂. ¿Cuál es le intervalo de confianza al 90 %?
Distribución en el muestreo de p̂: Cada día el caballero de Mèré realiza 1000 apuestas y apunta en una
libreta (de la época) la proporción de partidas ganadas. En los últimos 5 años tiene 1500 anotaciones.
Simula la situación descrita. ¿Cómo se distribuyen los valores de p̂?
Página 3 de 4
Beatriz Pateiro López Estadística. Ingeniería Química
Figura 1: zα/2 denota el número real tal que P (Z > zα/2 ) = α/2, siendo Z ∈ N(0, 1).
Y con la teoría de la probabilidad llegó la solución al problema. ¿Sabrías calcular exactamente el valor
de p? A la vista del resultado, ¿hacía bien el caballero de de Mèré en apostar su dinero a este juego?
Ahora que sabemos cuál es el verdadero valor de p podemos entender el significado que tiene el nivel de confianza.
r r !
p̂ (1 − p̂) p̂ (1 − p̂)
1 − α = P p̂ − zα/2 < p < p̂ + zα/2
n n
Interpretación del nivel de confianza. Construye los diferentes intervalos de confianza construidos
en base a las 1500 anotaciones de p̂ que has generado. ¿Cuántos de esos intervalos contienen al
verdadero valor de p?
Cansado de este juego, el Caballero de Mèré propuso una nueva apuesta: el caballero de Mèré
gana si al tirar 24 veces 2 dados le sale al menos un 6 doble. ¿Qué dirías de esta nueva apuesta?
4 Ejercicios
Importa de nuevo a MATLAB los datos del fichero IQ0809.csv utilizado en la Práctica 2. Podemos
considerar dichos datos como una muestra representativa de los estudiantes universitarios de primer curso.
¿Cómo estimarías la media y la varianza de la variable altura?
Suponiendo que la variable altura sigue una distribución normal, construye un intervalo de confianza para
la altura media basándote en los datos de la muestra con un nivel de confianza del 95 %. Consulta la
ayuda de las funciones tpdf, tcdf, tinv.
De igual modo, construye el intervalo de confianza para la varianza de la altura basándote en los datos
de la muestra. Consulta la ayuda de las funciones chi2pdf, chi2cdf, chi2inv.
Página 4 de 4