Estadistica Resumen General
Estadistica Resumen General
Estadistica Resumen General
cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos, así como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso realizar predicciones
Estadística describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y
Clasificación descriptiva representan la información contenida en ellos.
Estadística apoyándose en los cálculos de probabilidades y a partir de datos muestrales, efectúa estimaciones,
inferencial decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos (población
CONCEPTOS BASICOS
Individuo o elemento: persona o elemento que contiene cierta información que se desea estudiar.
Población: conjunto de todos los individuos o elementos que cumplen con ciertas propiedades comunes. Puede ser finito o infinito.
Muestra: subconjunto representativo de la población.
Parámetro: función definida sobre los valores numéricos de características medibles de una población.
Estadístico: función definida sobre los valores numéricos de una muestra
Caracteres: propiedades o rasgos de los elementos. Pueden ser cualitativos o cuantitativos.
Modalidades: diferentes situaciones posibles de un carácter. Deben ser exhaustivas y a la vez mutuamente excluyentes.
Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a una y sólo una de las clases.
Una variable estadística hace referencia a un carácter y puede tomar cualquier modalidad de un conjunto determinado que llamaremos
dominio o rango. Las variables estadísticas se denotan con letras mayúsculas ( X, Y, A, Z …) y según el tipo de dominio se clasifican en:
Variables cualitativas: las modalidades posibles son de tipo nominal.
Variables cuasicuantitativas: es posible establecer orden entre ellas aunque sean de tipo nominal.
Variables cuantitativas: tienen cantidades numéricas con las que podemos hacer operaciones aritméticas. A su vez se clasifican en:
discretas (sus modalidades son valores enteros) o continuas (sus modalidades son valores reales).
Frecuencias
Frecuencia absoluta de la clase xi : es el número ni de observaciones de la clase xi . ENTERO CANTIDAD
Frecuencia relativa de la clase xi (fi): cociente entre la frecuencia absoluta y el número total de observaciones (N) PROPORCION O %
Fi = ni
N
En el caso de variables cuantitativas o cuasicuantitativas también se puede calcular:
Frecuencia absoluta acumulada de la clase xi (Ni): es el número total de observaciones cuya modalidad es inferior o igual a la clase x i :
𝑁𝑖= 𝑛1+𝑛2 + ⋯ + 𝑛i.
Frecuencia relativa acumulada de la clase xi (Fi ): es el cociente entre la frecuencia absoluta acumulada y el total de observaciones
𝐹𝑖= 𝑁i = 𝑛1+𝑛2 + ⋯ + 𝑛i
𝑁 𝑁
Clases
En el caso de variables cualitativas o cuasi cuantitativas las clases están formadas por las diferentes modalidades que toma la variable. En el
caso de variables cuantitativas existen dos posibilidades:
Discretas: las clases pueden ser los valores numéricos que toma la variable. Pero si los valores son muchos pueden ser
agrupados en intervalos. (Valores enteros)
Continuas: las clases se definen mediante intervalos
Intervalos
[ 𝑙𝑖−1 - 𝑙𝑖 ] = { x : 𝑙𝑖−1≤ x < 𝑙𝑖 }
Donde 𝑙𝑖−1es el límite inferior del intervalo i, y 𝑙𝑖 es el límite superior del intervalo i
Amplitud del intervalo, 𝑎𝑖 :longitud del intervalo 𝑎𝑖=𝑙𝑖 − 𝑙𝑖−1
Marca de clase, 𝑥𝑖 , al punto medio de intervalo i 𝑥𝑖= 𝑙𝑖 + 𝑙𝑖−1
2
Graficos y diagramas
Para variables Para variables Para variables cuantitativas continuas
cualitativas cuantitativas
discretas
Gráfico de Gráfico de Histogramas: Permiten reconocer y analizar patrones de comportamiento en la
barras barras: En información recolectada. Se construyen a partir de una tabla estadística,
eje x valores representando sobre cada intervalo un rectángulo que tiene como base este
Gráfico de de variable, segmento y como altura, si los intervalos son todos iguales, la frecuencia relativa o
sectores nos muestra la absoluta de cada intervalo. En el caso de intervalos de distinta longitud la altura
sobre cada se calcula dividiendo la frecuencia por la amplitud (frecuencia rectificada). Para
uno de los frecuencia absoluta acumulada e intervalos.
valores de Una caracterización de la forma general se relaciona con el número de "picos" o
la variable "modos". Se dice que un histograma es "unimodal" si tiene un único pico, "bimodal"
Gráfico de
un si tiene dos picos y "multimodal" si tiene más de dos picos.
Pareto: se rectángulo Histogramas unimodales simétricos:
suelen de la altura
utilizar en equivalente
el campo a la
de la frecuencia
economía y absoluta de
de la ese valor Histogramas unimodales asimétricos. Si la cola superior del histograma se prolonga
empresa. (Representa mucho más que la cola inferior, la distribución de los valores es asimétrica positiva.
Diagrama da en eje y), Si la cola inferior es mucho mayor que la cola superior la distribución es asimétrica
de barras es decir a la negativa.
pero las cantidad de
barras se veces que se
presentan observó ese
en orden valor.
descendent Rectángulos
es deben ser Polígono de frecuencias: Se construyen a partir del histograma uniendo con líneas
de igual rectas los puntos superiores de los rectángulos que corresponde a la marca de case
ancho. o punto medio del intervalo. Para representar el primer y último intervalo se
supone que adyacentes a ellos existen otros intervalos de la misma longitud y
frecuencia nula. Un polígono es una figura plana que encierra una región del plano
por lo tanto se deben unir los extremos.El área del polígono es igual al área de la
suma de los rectángulos
- Poligonal de frecuencias acumuladas u ojiva: Es una línea poligonal obtenida
uniendo los puntos que tienen por abscisa el límite superior del intervalo y
como ordenada la respectiva frecuencia acumulada. Si me pide esclarecer
datos en base a grafico, los intervalos son las divisiones del eje x (Tal como
aparezcan). Eje y aparecen las frecuencias relativas acumuladas
- Para saber frecuencia relativa, voy viendo la diferencia entre las acumuladas.
Para saber frecuencia absoluta, uso el % especifica de frecuencia relativa
sobre el total de frecuencias absolutas (N)
Diagrama tallo y hoja (Tukey): forma efectiva y compacta de resumir info numérica y obtener una repesentacion visual de los mismos. Cada
numero en el conjunto de datos se divide en 2 partes:
Tallo: primer parte del numero, consiste en el primer o primeros digitos. En gral deben tener entre 5 y 20 tallos.
Hoja: ultima parte del numero, consiste de el o los digitos finales
Se usan los tallos y hojas resultantes para construir el diagrama.
Variante: dividiendo las hojas en un tallo determinado en dos grupos: las que comienzan con 0,1,2,3 o 4 ("low"), y las que comienzan con
5,6,7,8 o 9 ("high"). Luego, cada tallo se lista dos veces cuando se construye el diagrama. Se escribe el tallo y L o H según corresponda.
Análisis de una variable: Por un lado una medida que indique el valor en torno al cuál se agrupen los datos, y por otro, una medida que indique
la variabilidad. Dado un grupo de datos, estudiaremos:
La tendencia central :
Media aritmética:
Si los datos no están agrupados, la media aritmética es la suma de todas las observaciones divida la cantidad de
observaciones. O (valor variable 1 * frecuencia absoluta 1 + x2 * f2 + … ) / N (suma total frecuencia absoluta) Sumo números
que me den/ cantidad de números que sean.
Si los datos están agrupados en una tabla de frecuencias: La media aritmética ( ) de una variable estadísticas es la suma de
los productos entre la marca de clase de cada intervalo (Lim inf+ Lim sup)/2 y su frecuencia absoluta dividido la cantidad de
observaciones. Habrá una pérdida de precisión que será mayor cuanto mayor sea la longitud del intervalo
La suma de las desviaciones de los valores de la variable respecto de la media es cero . Es única y fácil de calcular pero
cuando se trabaja con intervalos la longitud de los mismos influye en el valor resultante de la media. Toma en consideración todos
los valores de la distribución, por ello es muy sensible a valores extremos o anómalos. Puede no coincidir con uno de los valores
posibles de la variable.
Mediana: Es un valor que divide a la muestra en dos partes iguales. Los valores deben estar ordenados de menor a mayor
(inclusive los repetidos). La mediana, deja a un lado y al otro de la distribución el mismo número de observaciones. Ventaja:
no esta afectada por las observaciones extremas, tiene propiedades matemáticas complicadas lo que dificulta su uso en
inferencia estadística
Datos no agrupados:
Si el número de observaciones es impar la mediana es el valor central. Es decir si son N observaciones, la mediana
es la (𝑁+1)/2-ésima observación. Siendo N el número total de observaciones (suma columna frecuencia absoluta).
El resultado es la observación numero… Busco posición (n+1)/2 en frecuencia absoluta acumulada (sino me voy
para arriba a mayor)
Si el número de observaciones es par, entonces la mediana se calcula como el promedio de las dos observaciones
centrales, esto es:
El resultado es la observación numero …
Datos agrupados: Hay que identificar el intervalo que tiene la observación (𝑁/2) – é𝑠𝑖𝑚𝑎 (dentro de columna frecuencia
absoluta acumulada, si no esta busco el siguiente para arriba) , denominado intervalo mediano, dentro de él la mediana
se obtiene como:
[𝑙𝑖−1; 𝑙𝑖) es el intervalo mediano (donde arranca)
𝑎𝑖 es la amplitud del intrevalo mediano (Lim sup intervalo-Lim inferior intervalo)
𝑛𝑖 es la frecuencia del intervalo mediano (Frecuencia absoluta de ese intervalo)
N𝑖−1 es la frecuencia acumulada antes del intervalo mediano
Datos agrupados el intervalo modal es aquel que tiene mayor frecuencia absoluta, la moda será un punto del mismo cuyo
cálculo se realiza con las siguientes fórmulas:
Si los intervalos son iguales:
𝑙𝑖−1: valor inferior de intervalo con mayor frec absoluta
ni= frecuencia absoluta de ese intervalo
ni-1 = frecuencia absoluta intervalo anterior
ni+1=frecuencia absoluta de intervalo posterior
Si los intervalos son distintos, se utilizan las frecuencias rectificadas ( 𝑛′𝑖 = 𝑛𝑖 / ) para identificar el intervalo
modal, ya que miramos el que tenga mayor frecuencia rectificada modal. Y aplico formula usando frecuencias
rectificadas en vez de frecuencias absolutas.
Cuando los valores de una variable están ordenados de menor a mayor, otras medidas de localización utilizadas son:
Cuartiles: dividen el conjunto de datos en cuatro partes iguales. El cuartil numero 2 es la mediana. Se necesita tener datos
ordenados de menor a mayor, frecuencias absolutas y absolutas acumuladas. EL intervalo que contiene el cuartil 2 sera el
que contenga a la mediana (son = ) (N/2), el que contenga esa observación, lo veo en frecuencia absoluta acumulada.
DATOS NO AGRUPADOS DATOS AGRUPADOS
en intervalos de igual longitud, primero debemos localizar
el intervalo que contiene el cuartil a calcular, luego
utilizamos la siguiente fórmula
Deciles: dividen el conjunto de datos en diez partes iguales. Para datos agrupados
Percentiles: dividen el conjunto de datos en cien partes iguales. Para datos agrupados
La dispersión o variación con respecto a ese centro:
Medidas de variabilidad o dispersión: Las medidas de tendencia central proporcionan información parcial acerca de un
conjunto de datos.
Rango o recorrido: puede verse afectado por observaciones extremas y sólo usa dos de las observaciones
Re = xmax – xmin
Cuarta dispersión fs O RANGO INTERCUARTILITICO: es la diferencia entre el tercer y primer cuartil: Contiene
el 50% de los datos y no se ve alterado por posibles valores extremos. fs = 𝑄3 − 𝑄1
Varianza: se define como la media de las diferencias cuadráticas de N observaciones en relación a su media
aritmética. siempre es mayor o igual que cero
Varianza muestral: la teoría matemática dice que si se pretende aproximar la varianza de una población a partir
de la varianza de una muestra el error cometido es menor si en lugar de dividir por N dividimos por N-1:
La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza.
Coeficiente de variación Es la medida de dispersión más usada. Para comparar dos poblaciones. Es el cociente
entre la desviación típica o estándar y la media. Sólo se debe calcular para variables con todos los valores
positivos. No es invariante ante cambios de origen, pero es invariante ante cambio de escala.
CRITERIO ASIMETRIAS
ASIMETRICA POSITIVA ASIMETRICA NEGATIVA
cuando las frecuencias más altas se cuando la cola se
encuentran al lado izquierdo de la mediana, encuentra del lado
mientras que a la derecha hay frecuencias izquierdo.
más pequeñas (cola)
Valores atípicos: Fs = cuarta dispersión = Q3 – Q 1
Cualquier observación más allá de 1,5fs del cuartil más cercano es un valor atípico.
Es extremo si está más allá de 3fs del cuartil más cercano
Es moderado si está más allá de 1,5.fs y a menos de 3fs del cuartil más cercano
Ejemplo: Una balanza registra el peso de las personas que se pesaron cierta mañana en una farmacia. 58 51 39 49 59 58 57 59 68 54 42 54 40
63 58 66 70 72 71 69 70 HISTORIGRAMA, abajo POLIGONO DE FRECUENCIA Y DE FRECUENCIA ACUMULADA
Ejemplo de diagrama variables cuantitativa discreta: Ej: En una clínica se anoto pasos q dio cada nene sin caerse. Datos:
224544656633432347665445346336345343523766
Variable a analizar: cantidad de pasos que da un niño sin caerse en un dia.
Tipo: cuantitativa discreta
a- Realizar distribución de frecuencias y graficos
b- ¿Qué proporción de niños dio 3 pasos o menos? 35,71%
c- Cuantos niños se observaron que dieron entre 5 y 3 pasos inclusive? 31-4=27
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA
Grafico en escalera, llega hasta total de observaciones, rectángulos
van pegados. Se llama histograma
Ejemplo variable cuantitativa continua: se registran metros caminados x los niños. 2,3 2,1 1,2 5,3 3,7 3,6 1,2 2,8 2,5 5,2 3,4 3,2 2,1 2,9 1,6 3,2
3,6 2,9 5,5 3,2 3,2 2,5 3 2 5,2 3,5 3,8 2,4 3 3,8 2,6 3,2 3 3,1 3,2 1,4 5,1 2,6 3,7 2,6 2 1,9
Variable a analizar: metros caminados por los niños sin caerse
Tipo: cuantitativa continua
a- Hacer diagrama tallo hoja, luego agrupar datos observados en intervalos de amplitud uno comenzando con el [1;2) y realiza la
distribución de frecuencias y los gráficos correspondientes
UNIDAD 2
Espacio muestral: conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E.
TIPOS DE EXPERIMENTOS
Deterministas: experimentos de los que podemos predecir el resultado antes de que se realicen.
Aleatorios: aquellos en los que no se puede predecir el resultado, ya que éste depende del azar, pero conocemos el conjunto de
resultados posibles. Es aleatorio si se verifican: Se puede repetir indefinidamente, siempre en las mismas condiciones; no se puede
predecir el resultado y el resultado que se obtenga pertenece a un conjunto de resultados posibles conocidos previamente.
Teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el
fin de cuantificar dichos resultados y saber si un suceso es más probable que otro. El cálculo de probabilidades suministra las reglas para el
estudio de los experimentos aleatorios o de azar, siendo la base para la estadística inferencial.
Técnicas de conteo
Regla del producto: Supongamos una colección ordenada de k elementos (k-tupla) y que hay n 1 opciones posibles para el primer elemento, n 2
para el segundo, …, nk para el k-ésimo elemento, entonces, hay n1*n2 . … *nk k-tuplas posibles
Permutaciones Cualquier secuencia ordenada de los elementos de un conjunto de n elementos distintos, se llama
permutación de n elementos y se denota P𝑛. El número de permutaciones es P𝑛 = 𝑛!.
USO TODOS Permutaciones con repetición Llamamos a las permutaciones con repetición de n elementos tomados de a en a, de b en
LOS b, de c en c, etc., cuando entre los n elementos existen elementos repetidos (un elemento aparece a veces, otro b veces,
ELEMENTOS E otro c veces, etc) verificándose que a+b+c+...=n. El número de estas permutaciones será:
IMPORTA EL PR𝑛 𝑎,, = 𝑛!
ORDEN 𝑎! * 𝑏! * 𝑐!
*En palabra tomo en cuenta como n a la sumatoria de la cantidad de letras que sean (contando hasta las repetidas); como a, b u c las
letras repetidas (el número de veces que aparezcan).
USA IMPORTA Variaciones Cualquier secuencia ordenada de k elementos de un conjunto de n elementos distintos, se llama
ALGUNOS EL ORDEN variación de n elementos tomados de a k. *maneras distintas. Número de variaciones es:
ELEMENTOS 𝑉𝑛 𝑘 = 𝑛!
(𝑛−𝑘)!
Variaciones con repetición Sea A un conjunto con n elementos. Llamamos variaciones con repetición de n
elementos tomados de k en k a todas las agrupaciones que podemos hacer con k elementos de A
independientemente de que se repita alguno. El número de variaciones con repetición viene dado por:
V𝑅𝑛 𝑘 = 𝑛 k
*Si tengo por ej en patentes 3 números y 3 letras hago VR letras* VR patentes para saber posibles resultados.
NO Combinaciones Dado un conjunto de n elementos distintos, cualquier subconjunto no ordenado de tamaño k
IMPORTA de los elementos se llama combinación de n elementos tomados de a k. *Maneras iguales. NO IMPORTA EL
EL ORDEN ORDEN. El número de combinaciones es:
C𝑛 𝑘 = 𝑛!
𝑘!( 𝑛−𝑘 )!
*En casos donde me pida calcular probabilidad ej de bolas color rojo dentro de un conjunto de bolas de 3 colores, hago
combinatoria de bolas rojas (tomando como n a la cantidad total de bolas rojas) / combinatoria cantidad total. Si luego
me pide dos de un color ej, hago combinatoria de colores multiplicados (en k pongo cantidad que debería aparecer de
cada color), divididos por combinatoria total. Si luego me pide que salgan en orden, hago la combinatoria
correspondiente multiplicado por (1/n!).
Combinaciones con repetición Sea A un conjunto con n elementos. Las combinaciones con repetición de n
elementos tomados de a k (n ≥k), son los distintos grupos formados por k elementos de manera que: no
entran todos los elementos, no importa el orden y elementos pueden repetirse. Las combinaciones con
repetición son :
CR𝑛 𝑘 =(𝑛 + 𝑘 – 1) = (n + k – 1)!
𝑘 k!* (n – 1) !
*n = todos los elementos posibles mientras que k=los elementos que usamos.
*Factorial n! = n*(n-1)*(n-2)… hasta llegar al numero mínimo 1. Sino en calculadora coloco el numero, shift x -1
*Para saber problema de que es:
1. Si se toman todos los elementos o algunos
2. Importa el orden? Si importa es VARIACION. Si no importa el orden es COMBINACION
3. Hay repetición? Cálculos sin repetición se pueden hacer con calculadora.
- VARIACION: escribo el numero n, aprieto tecla shift y nPr, escribo numero k, =.
- COMBINACION: escribo el numero n, aprieto tecla nCr, escribo numero k, =.
*EXCEL:
FACTORIAL: escribo en una fila/columna el numero x. En otra fila/columna, donde quiero x! voy a formulas, fact, y selecciono como numero la celda x
COMBINACIONES: en celda nCr voy a formulas, COMBINAT, y selecciono como numero la celda n (numero total de elementos) y como tamaño la
celda k o r.
VARIACIONES: en celda nPr voy a formulas, PERMUTACIONES, y selecciono como numero la celda n (numero total de elementos) y como tamaño la
celda k o r.
Regla de Laplace Sea un experimento aleatorio con un número finito de resultados posibles, y todos equiprobables, entonces la probabilidad
de que un suceso aleatorio A, ocurra, se calcula como el cociente entre el número de casos favorables en A y el número de todos los resultados
posibles del experimento
P (A) = número de casos favorables en A
números de casos posibles
Para aplicarlo todos los sucesos elementales deben tener la misma probabilidad (deben ser sucesos equiprobables). No se puede aplicar en
instrumentos irregulares, cuando los sucesos no son equiprobables.
*Ej con las bolas de diferente color. (C31 * C172) / C203 = probabilidad de que una de las tres bolas sea blanca (de las tres blancas disponibles uso 1 y de las 17
restantes de otros colores uso solo 2). Si a esto le sumo la probabilidad de que 2 bolas sean blancas y 1 de otro color(C 32 * C171) / C203 ) y luego de que 3 lo sean
(C33 * C170) / C203. La suma de todos estos casos son los casos favorables para A, en caso que me pregunte que AL MENOS UNA sea blanca
*Si me pide una o mas de un color y otras de otro en numerador multiplico la combinatoria de lo que use de c/color / denominador C 203 totales
*Casos posibles multiplico el total de cada cajón (si es que tengo dos); casos favorables (multiplico cantidades de cada color correspondiente y sumo R en caso
de tener mas de un color).
AXIOMAS DE LA PROBABILIDAD
1- La probabilidad para cualquier suceso A es mayor o igual que 0 y menor o igual que 1. 0 ≤ P(A) ≤ 1
2- La probabilidad del suceso seguro es 1. P(E) = 1
3- Si A y B son incompatibles, es decir AՈB = Ø entonces: P(A Ս B) = P(A) + P(B)
Propiedades de la probabilidad
La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso contrario es: P (Â) = 1 − P (A)
Probabilidad del suceso imposible es cero.P ∅ = 0
La probabilidad de la unión de dos sucesos es la suma de sus probabilidades restándole la probabilidad de su intersección. P (A ∪ B)
= P (A) + P (B) − P (A ∩ B)
PROBABILIDAD CONDICIONAL: Para dos eventos cualesquiera A y B con P(B)>0, la probabilidad condicional de A dado que ocurrió B P(A/B), se
define con la ecuación:
P (A/ B) = P (AՈ B)
P (B)
Suceso elemental: Es cada uno de los elementos que forman parte del espacio muestral.
Suceso compuesto: Cualquier subconjunto de E con más de un resultado
Suceso seguro, S: está formado por todos los posibles resultados (es decir, por el espacio muestral). P(E)=1
Suceso imposible, Ø: es el que no tiene ningún elemento. Su probabilidad es 0
Sucesos compatibles: Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.
Sucesos incompatibles: Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común
Sucesos mutuamente excluyentes: cuando no pueden suceder al mismo tiempo, y la suma de sus probabilidades individuales es la posibilidad
de que ocurra.
Suceso contrario o complementario: suceso contrario a A es otro suceso q se realiza cuando no se realiza A. Se denota por A′ o Â.
Sucesos independientes A ∩ B = P(A)* P(B) cuando A y B ocurren simultáneamente
P(A/B) = P(A) o P(B/A) = P(B)
P (complemento de ambos A ∪ B ) Si no ocurre ninguno de los dos eventos
P (A ∪ B) = 1- P(complemento de ambos A∪ B)
Si A y B son dos sucesos independientes, también lo son Ᾱ y B
Sucesos dependientes P(A/B) = [ P(A ∩ B)] / P(B) ) (A-B) cuando ocurre A y no B (A – A ∩ B)
P (A Ո B) = P (A/B) * P(B) (si surge de P(A/B) o P (B/A) * P(A) (Si surge de P(B/A) REGLA PRODUCTO
Suceso complementario P (Â) = 1 − P (A)
Sucesos incompatibles, A∩B=Φ
mutuamente excluyentes A ∪ B = P(A) + P(B)
P(A/B) = [ P(A ∩ B)] / P(B) = [ P(B/A) * P(A) ] / [P(B/A) * P(A)] BAYES
Denominador A cambiante, B mantiene; numerador P(a)*P(B) en cuestión).
Sucesos compatibles A ∪ B = P(A) + P(B) – P(A∩ B) ocurre A u ocurre B o ambos ocurren simultáneamente. Uno u otro. No excluyent
P (A – B)= (A∩ complemento de B)= P(A) – P(A∩ B) ocurre cuando ocurre A y no ocurre B.
LEYES MORGAN:
A ∪ B (complemento de todo) = Ᾱ ∩ Ḃ El complementario de la unión es la intersección de los complementarios.
A ∩ B (complemento de ambos) = Ᾱ ∪ Ḃ El complemento de la intersección es la unión de los complementarios.
Diagramas de árbol útiles cuando el experimento de interés consiste en una secuencia de varias etapas. Para su
construcción se partirá poniendo una rama para cada una de las posibilidades, acompañada de su probabilidad (%
que representa del total, valor probabilidad/valor total). El final de cada rama parcial se constituye a su vez, en un
nudo del cual parten nuevas ramas, según las posibilidades del siguiente paso (-1 denominador siempre, -1
numerador en rama igual a la inicial y cantidad total posibilidad dos en numerador rama alternativa), salvo si el
nudo representa un posible final del experimento (nudo final) e inverso en rama opuesta. Hay que tener en cuenta:
que la suma de probabilidades de las ramas de cada nudo ha de dar 1. Ej 10 niños, 6 niñas.
Teorema de Bayes El cálculo de probabilidades condicionales y probabilidades posteriores a partir de la ocurrencia de un suceso, ocupan un
lugar central en la probabilidad elemental; es una aplicación del teorema de la multiplicación y el teorema de la probabilidad total. Sean 𝐴1,
𝐴2, … , 𝐴𝑘 eventos mutuamente excluyentes y exhaustivos. Entonces para cualquier otro evento B para el cual P(B)>0,
*Aplico como Aj al elemento en denominador cambiante, B se mantiene. El diferencial es invertido al
planteado inicialmente (A/B) se convierte en P(B/A) PROBABILIDAD TOTAL.
*En numerador hago P(A)*P(B) PROBABILIDAD CONDICIONADA, MIRO EL ARBOL.
*Sabiendo que… (es mujer) calcule probabilidad de… (Sea fumador) P(F/M)
Independencia El cálculo de probabilidad condicional permite comparar la probabilidad que en principio se asigna al suceso A con la que luego
se asigna cuando se sabe que ocurrió el suceso B. El algunos casos la probabilidad de que ocurra A no se ve afectada si se sabe que ocurrió B. En
estos casos es natural pensar que los sucesos son independientes.
Dos sucesos A y B son independientes si: P(A/B)=P(A)
Si dos sucesos A y B son independientes si y sólo si la probabilidad de su intersección es: P(A∩B)=P(A)*P(B) Este concepto se puede
ampliar a colecciones de más de dos sucesos, es decir Los sucesos 𝐴1, … , 𝐴𝑛 son mutuamente independientes si para todo k con k=2,
3, …, n y todo subconjunto de índices 𝑖1, 𝑖2, … , 𝑖𝑘:
𝑃 (𝐴𝑖1 ∩ 𝐴𝑖2 ∩ ⋯ ∩ )= 𝑃 (𝐴𝑖1 )* 𝑃 (𝐴𝑖2 )…* 𝑃 (𝐴𝑖𝑘)
De lo contrario son dependientes.
UNIDAD 3
VARIABLE ALEATORIA (v.a.) es cualquier regla que atribuye un único número real a cada suceso elemental de E. Es una función cuyo dominio es
el espacio muestral y su codominio el conjunto de los número reales; se representa con letras mayúsculas X, Y, Z y se dejan letras minúsculas
para valores que puede tomar esa variable. 𝑋: 𝐸 → 𝐼𝑅,𝑡𝑎𝑙 𝑞𝑢𝑒 𝑋 𝑒 = 𝑥𝑒
Es una función real medible que asocia un valor numérico a cada resultado del espacio muestral asociado a un experimento aleatorio.
Herramienta matemática que permite pasar del estudio de sucesos aislados al estudio de las distribuciones de probabilidad; permite la
aplicación del análisis matemático y de otras herramientas para el estudio de situaciones de incertidumbre y es una pieza básica para el
desarrollo de los métodos y técnicas inferenciales.
*Sucesos elementales importa el orden (para calcular fmp considero todas las posibilidades), sucesos compuesto no importa orden.
VARIABLE ALEATORIA DISCRETA: sus valores posibles constituyen un conjunto discreto (si los valores posibles se ordenan, hay
Clasificaci una separación entre cada valor y el próximo).El conjunto de valores posibles podría ser infinito. Valores enteros. Número finito
ón de valores o infinito numerable.
distribución de probabilidad o función masa de probabilidad (fmp ), mediante: → [0,1] ∶ 𝑝 (𝑥) = 𝑃 (𝑋 = 𝑥) = 𝑃 ({∀𝑒 ∈
𝐸, ∶ 𝑋 (𝑒) = 𝑥}) Es una función que a cada elemento de E, le asigna un número +o=0 y –o=1. Condiciones Si 𝑥1; 𝑥2; … ; 𝑥𝑘
son todos los valores posibles que puede toma la v.a. X, entonces para que sea una fmp legitima debe:
1. 𝑝 (𝑥𝑖 ) ≥ 0 ∀𝑖 = 1,2, … , 𝑘 “todos los valores asignados deben ser positivos”
2. ∑ k i=1 𝑝 (𝑥𝑖 ) = 1 “y sumados deben dar 1”
*En numerador va la cantidad de posibles resultados (ordenados que pueden surgir que de ese valor de x) y en denominador el
número total de posibles resultados que figura en el espacio muestral.
*Para armar valores X= debo considerar cantidad del valor considerado como x que aparece en cada opción (Agrupo opciones que
tengan iguales valores de X, sin importar el orden).
Ej: lanzan tres monedas normales y definen: X= “cantidad de caras en el tiro” e Y=“cantidad de caras menos cantidad de secas” 𝑋: 𝐸
→ 𝐼𝑁 𝑌: 𝐸 → 𝑍.𝐸spacio muestral = {𝐶𝐶𝐶; 𝐶𝐶𝑅; 𝑅𝑅𝐶; 𝐶𝑅𝐶; 𝐶𝑅𝑅; 𝑅𝑅𝑅; 𝑅𝐶𝑅; 𝑅𝐶𝐶}. Importa el orden en el espacio muestral.
X (𝐶𝐶𝐶 )= 3 𝑌 (𝐶𝐶𝐶) = 3
𝑋 (𝐶𝐶𝑅) = 𝑋 (𝐶𝑅𝐶) = 𝑋 (𝑅𝐶𝐶 )=2 𝑌 (𝐶𝐶𝑅) = 𝑌 (𝐶𝑅𝐶) = 𝑌 (𝑅𝐶𝐶) =1
𝑋 (𝑅𝑅𝐶) = 𝑋 (𝑅𝐶𝑅) = 𝑋 (𝑋𝑅𝑅) = 1 𝑌 (𝑅𝑅𝐶) = 𝑌 (𝑅𝐶𝑅) = 𝑌 (𝐶𝑅𝑅) = −1
𝑋 (𝑅𝑅𝑅) = 0 𝑌 (𝑅𝑅𝑅) = −3
𝑅𝑥 ={ 0; 1; 2; 3}. Fmp será: 𝑅𝑌 = {−3; −1; 1; 3}
x 0 1 2 3 Y -3 -1 1 3
P(x) 1/8 3/8 3/8 1/8 P(y) 1/8 3/8 3/8 1/8
función de distribución acumulada (fda) o cdf para una v.a discreta X con fmp p(x) se define para todo número x
mediante:
F :𝑅→ [0,1] ∶𝐹(𝑥) = 𝑃 (𝑋 ≤ 𝑥) = 𝑃 ({∀𝑒 ∈ 𝐸, ∶ 𝑋(𝑒) ≤ 𝑥})
Propiedades:
Es una función creciente: 𝑥1 < 𝑥2 ⟹ 𝐹 (𝑥1 ) < 𝐹 (𝑥2 )
F es continua a derecha, esto es: lim 𝑥→𝑎+ 𝐹 (𝑥) = F (𝑎)
Lim 𝑥→−ꚙ 𝐹 (𝑥) = 0
Lim 𝑥→+ꚙ 𝐹 (𝑥) = 1
Si a<b entonces P(a<𝑥 ≤ 𝑏) = F (𝑏) − 𝐹 (𝑎)
𝑃 x > a = 1 − 𝐹 (a)
*Para sacar función de frecuencia acumulada de una fmp, armo función a trozos con los valores correspondientes
de la tabla, y voy sumando las respectivas frecuencias (Arranco desde valor 0 y el ultimo debe ser 1). Tener en
cuenta que siempre pongo ≤ (como primer signo), el segundo es <. A lo ultimo x≥…
*Si me pide calcular en base a fda una probabilidad puntual P(X=…) debo hacerla restando las frecuencias
anteriores, es decir f(x) – f(x-1)…
Ej: En una droguería se vende ácido sulfúrico en bidones de 20, 30 y 50 litros. X= “tamaño del bidón que compra el
cliente”. función de probabilidad puntual de X es :
X 20 30 50
P(x) 0,1 0,5 0,4
precio de un bidón (Y) en función de su tamaño está dado por la siguiente fórmula: Y = h(X)= 10 X – 40. ¿Cuál es el
precio esperad E(Y)?
𝑥∈𝑅 ∑ h(x) * p(X) = 𝑥∈𝑅 ∑(10 x– 40). 𝑝(𝑥) = (10*20-40)*0,1+(10*30-40)*0,5+(1-*50-40)*0,4= 330
Propiedades:
o Una función de interés es una función lineal, h(X)) =a*X+b donde a y b son constantes reales, entonces: E(a*X
+ b) = a * E(X ) + b
o 𝐸 (𝑎*𝑋) = 𝑎* E(𝑋) Si a cada valor posible de X o multiplicamos por una constante, su valor esperado se ve
multiplicado por la misma constante.
o E (a+X) = a + E (X)
o 𝐸 (𝑏) = 𝑏 El valor esperado de una constante es la constante.
o La esperanza de la suma de esperanzas de x es igual a la suma de las esperanzas
o La experanza no puede ser menor que el minimo valor que toma x ni mayor que su valor máximo. Si a<=x <=b
entonces a<= E(x) <=b
2
VARIANZA 𝑉 (𝑋) ó 𝜎𝑋 : medida de la variabilidad de una variable aleatoria alrededor de su esperanza. Sea X una v.a.
discreta con función de probabilidad puntual p(x) y esperanza μX , la varianza de X es:
=
DESVIO ESTANDAR de X: 𝜎𝑋 = √ V (x)
Propiedades:
𝑉 (𝑎*𝑋 + 𝑏) = 𝑎 2 *𝑉 (X)
𝑉 (𝑎*𝑋) = 𝑎 2 *𝑉 (X) Si a los valores que toma una v.a. los multiplicamos por una contante, su varianza se ve
multiplicada por la constante al cuadrado
V (b) = 0 La varianza de una constante es =0
𝜎 (𝑎*𝑋+𝑏) = │ 𝑎 │* 𝜎𝑋
Parametro de fmp: Suponga que p(x) depende de una cantidad a la que se le puede asignar cualquiera de varios valores posibles,
donde cada valor diferente determina una distribución de probabilidades distinta. A esa cantidad se le llama parámetro de la
distribución. La colección de las distribuciones de probabilidad para diferentes valores del parámetro se llama familia de
distribuciones de probabilidad
Distribución binominal: el experimento aleatorio se llamara binominal si satisface los siguientes requerimientos y es la
suma de n v.a. independientes de Bernoulli. Requerimientos:
- El experimento consiste de n pruebas, siendo n un número fijo.
- Las pruebas son idénticas, y en cada prueba hay sólo dos resultados posibles (siempre los mismos), éxito (E) y
fracaso (F)
- Las pruebas son independientes (resultado de una prueba no influye sobre el de las otras)
- La probabilidad de éxito (P(E)=p) se mantiene constante en todas las pruebas
Si X=“número de éxitos en las n repeticiones” decimos que X tiene una distribución binomial de parámetros n y p y se
denota: 𝑋~(𝑛, 𝑝) Donde n es el número de ensayos y p la probabilidad de éxito.
FMP
EXCEL: Me paro en celda probabilidad y busco en fx (DISTRI. BINOM), aceptar. Se me abre ventana y selecciono en
probabilidad de éxito celda (x), en cantidad de ensayos celda (n), en probabilidad de éxito (p) y en acumulado
(acumulado). Aceptar. Arme calculador ahí.
*Si en ejercicio me aparece X< (debo sacar la probabilidad acumulada por lo que en celda donde dice acumulada pongo
el numero 1, donde Excel entiende que debe darme la frecuencia acumulada de probabilidad.
*Si en ejercicio me aparece X> (debo sacar la probabilidad acumulada) y se calcula haciendo 1- Frec acumulada (X-1)
por lo que en celda donde dice acumulada pongo el numero 1, donde Excel entiende que debe darme la frecuencia
acumulada de probabilidad y en X pongo el valor de (X-1) para saberlo y aplicarlo a la formula de 1-frec(x-1).
*Si aparece X= (debo sacar probabilidad puntual), dejo vacia la celda de acumulada o pongo el numero 0.
*Para armar calculador con valores generales de X me paro en celda P(X=x) y en primer fila busco fx DIST. BINOM y
selecciono como numero de éxitos a la x de mi fila, como ensayos a la n superior (y aprieto fn+F4 para que siempre
tome esa tecla), probabilidad de éxito es p superior (fn+F4 para fijarla) y en acumulado pongo 0.
*Para armar calculador con valores generales de X me paro en celda P(X ≤x) FREC ACUMULADA: selecciono primer celda
y pongo = (celda anterior en la fila), la celda debajo de esa misma columna va a ser = a la anterior + la nueva.
*SI ESTA B en mayúscula me pide la probabilidad binomial ACUMULADA.
Puedo ver frecuencias también en tablas donde n esta en columna lateral izquierda y el valor de p esta en filas a lo
largo de la hoja.
- X<= miro frecuencia acumulada (cambia si lo incluye=, o no lo hace)
- X> a miro frecuencia acumulada y hago 1-(FREC ACUMULADA HASTA A), en caso de incluirlo (>=) hago 1- FREC
ACUMULADA (A-1)
- X= a miro frecuencia acumulada y calculo FREC ACUMULADA A – FRECUANCIA ACUMULADA (A-1).
Percentiles de una distribución continua : Sea X una v.a. continua con función de densidad 𝑓 (𝑥) y función de
distribución acumulada F(𝑥) y sea 0 < 𝑝 < 1, el percentil 100 p-ésimo de la distribución de X es el valor x p tal que:
F (xp) = P (X ≤ xp) = -ꚙ ∫ x(sub p) f(t) dt = p
Facumulada (x p ) = p Planteo y luego despejo xp
es el valor de la variable que deja a su izquierda un área p, y a su derecha un área 1-p
*Uso como base la función de distribución acumulada F(x) y reemplazo p por el percentil que me solicite encontrar, una
vez planteado todo despejo x para saber el valor (el percentil que me pida lo escribo como 0,… ya que son porcentajes y
el valor obtenido es el valor de distribución que deja a su izquierda una probabilidad del o,…% pedido en el ejercicio y a
su derecha el importe restante para llegar a 1).
*Si me pide calcular percentil de distribución normal estándar puede hacerlo de dos maneras:
Con tabla y busco el numero entre todos los posibles resultados que me marque el percentil solicitado (o el
mas cercano tomo).Y el resultado buscado será el numero de esa fila encontrada que figura en la columna
izquierda (Valor de z) y el decimal que se encuentre en la parte superior de esa columna seleccionada.
Con Excel: en celda busc fx “DISTR.NORM.ESTAND.INV”, me pide probabilidad y escribo percentil buscado 0,…
*Tener en cuenta si es percentil 91 escribo 0,91; si es percentil 9 escribo 0,09
Varianza:
V (X) = 𝜎2X = -ꚙ ∫ +ꚙ (x – 𝝁𝒙) 2 * f(x) dx = E [ (X - 𝝁𝒙) 2 = E (X2) – [ E (X) ] 2
V (x) = -ꚙ ∫ +ꚙ x2 * f(x) dx – 𝝁2 𝝁2 resto solo una vez a lo ultimo
DESVIO ESTANDAR 𝜎X = √V ( X )
Propiedades:
𝑉 (𝑎*𝑋 + 𝑏) = 𝑎 2 *𝑉 (X)
𝑉 (𝑎*𝑋) = 𝑎 2 *𝑉 (X) Si a los valores que toma una v.a. los multiplicamos por una contante, su varianza se ve
multiplicada por la constante al cuadrado
V (b) = 0 La varianza de una constante es =0
𝜎 (𝑎*𝑋+𝑏) = │ 𝑎 │* 𝜎𝑋
Principales leyes de distribución v.a discretas
Distribución Uniforme: Se dice que X , tiene distribución Uniforme en el intervalo, [𝑎; 𝑏] , 𝑋~𝑈 (𝑎, 𝑏), si su función de
densidad es (la densidad es constante sobre el intervalo [ 𝑎; 𝑏] y 0 fuera de él. a y b son los parámetros de la
distribución):
o E (X) = (a + b) /2
o V (X) = (a- b) 2 / 12
Distribución Normal: X ~ N (𝜇 , 𝜎2 ) Se dice que X tiene distribución Normal de parámetros 𝜇 y 𝜎 2 (𝜇∈R y 𝜎 > 0 ) si su
función de densidad es
* 𝑓 (𝑥, 𝜇, 𝜎) ≥ 0
*-ꚙ ∫ +ꚙ f (𝑥, 𝜇, 𝜎) dx = 1
o E(X) = -ꚙ ∫ +ꚙ x * f(𝑥, 𝜇, 𝜎) dx = 𝝁
o V (X) = -ꚙ ∫ +ꚙ (x – 𝝁x) 2 * f (𝑥, 𝜇, 𝜎) dx = 𝜎2
los parámetros de la distribución son la media y la varianza
Distribucion normal estándar Z~𝑁 (0; 1): distribución normal con parámetros 𝜇 = 0 y 𝜎 2 = 1.
Función de densidad función de distribución de probabilidad
Zα , denota el valor en el eje de medición para el cual el área bajo la curva de z que se encuentra a la derecha de Zα
vale α
P (Z≤z) siempre que z dado sea positivo, uso tabla de distribución normal (z lo busco en columna
izquierda, entero + 1 decimal) y en demás columnas busco los demás 0,0… decimales, para que me de
el resultado del area de la integral ya. Tabla puedo usarla siempre que distribución normal sea (0,1)
P (Z> z) area por encima de un valor positivo = 1 - P (Z≤z)
P(Z> -z) area por encima de un valor negativo = P (Z≤z) Para calcular cambio signo y símbolo a opuestos.
P (Z≤ -z) area por debajo de un valor negativo = P (Z> z) cambie signo y símbolo opuesto= 1 - P (Z≤z)
P ( z1 < Z ≤ z2 ) = P (Z≤z2) - P (Z≤z1)
*Si me pide buscar el Z de Ⴛ (Dandome el valor de Ⴛ) hago: 1- Ⴛ= A.
Con tabla: Busco A en los resultados de la tabla de distribución normal y el resultado buscado será el numero
que se encuentre en la columna izquierda (Z) de la fila con el resultado seleccionado + el decimal que figura
en la parte superior de la columna donde esta el resultado seleccionado.
Con Excel: uso calculador de percentiles de distribución normal estándar, y escribo el resultado de 1- Ⴛ como
si buscara ese percentil.
Distribución normal no estándar: Cuando X ~ N (media , desviaicion tipica𝜎 2 ) no son (0,1), las probabilidades se
calculan mediante “estandarización”. La variable estandarizada es
Z = X – 𝝁 (media) transformo en distirbucion normal estandar→ 𝑍~𝑁 (0,1)
𝜎 (Desviacion típica)
Al restar 𝝁 se desplaza la media a cero y al dividir por 𝝈 se modifica la escala de la variable de modo que la desviación
estándar es 1. Así, 𝑃 𝑎 < 𝑋 < 𝑏 = Φ (𝑏 – 𝝁 ) – Φ (𝑎 – 𝜇)
𝜎 𝜎
*Debo TIPIFICAR: transformar la variable de nuestro ejercicio en su equivalente en una distribución N(0,1)
estándar, para poder usar la tabla para su resolución. Aplico fórmula para calcular z ((x de mi ejercicio – media)/
desviación típica)
P (Z≤z) siempre que z dado sea positivo, uso tabla de distribución normal (z lo busco en columna
izquierda, entero + 1 decimal) y en demás columnas busco los demás 0,0… decimales, para que me de
el resultado del area de la integral ya. Tabla puedo usarla siempre que distribución normal sea (0,1)
P (Z> z) area por encima de un valor positivo = 1 - P (Z≤z)
P(Z> -z) area por encima de un valor negativo = P (Z≤z) Para calcular cambio signo y símbolo a opuestos.
P (Z≤ -z) area por debajo de un valor negativo = P (Z> z) cambie signo y símbolo opuesto= 1 - P (Z≤z)
P ( z1 < Z ≤ z2 ) = P (Z≤z2) - P (Z≤z1) (Tipifico los dos valores).
*Si por el contrario me da el valor del porcentaje ya calculado debo destipificar: busco en tabla de distribución normal el resultado de
ese porcentaje 0,… o lo mas aproximado y de ahí obtengo el valor de Z (enteros mas decimales), aplico la formula con el valor de z y
esta vez despejo x.*Media y mediana coinciden
Distribucion chi-cuadrado: se usa para calcular V(X) de una población normalmente distribuida. Su forma depende de
un solo parámetro que se llama “grados de libertad” (v) (nu). Toma valores del 0 a + ꚙ (a medida que ↑v (se hace mas
simetrica, aunque no lo es). X ~X2v (siendo v los grados de libertad).
E(X) = v (grados de libertad)
V (X) = 2*v (grados de libertad)
X2 a;v = me pide el numero sobre el eje de medición que deja a su derecha y debajo de la curva x2 con v grados de
libertad, una superficie de valor Ⴛ. Superficie de izquieda la calculo como 1-Ⴛ
En Excel: fx y busco “INV.CHICUAD.CD”, en probabilidad va Ⴛ y en otro cuadrante los grados de libertad
*En tabla chi cuadrado veo el resultado que me solicitan al pedirme X2 a;v , debo buscar el v (grados de libertad) en la
columna izquierda y el Ⴛ en la fila superior (ya aparecen como 0,….); de esta forma la matriz me dara el resultado
correspondiente.
P (a ≤ X ≤ b ) siendo V=c :
Primero miro en tabla chi cuadrado y focalizo en la fila que tenga el valor de v que me da el ejercicio (c en
este caso). Busco en esa misma fila el valor “b” y el dato que saco es Ⴛ correspondiente a esa columna.
Luego busco en la misma fila el valor a y saco el dato correspondiente a Ⴛ de esa nueva columna. Y planteo
Ⴛ (recoelctado en a) - Ⴛ (Recolectado en b) = …
Excel: fx y busco “distr.chi” en probabilidad pongo valor de a y en grados de libertad el valor de v. Hago el
mismo procedimiento con los valores de b y luego hago el alfa obtenido en a – el ala obtenido en b.
Distribucion t-student: usada para estimar la media de una población normalmente distribuida cuando el tamaño de la
muestra es pequeño. Su forma depende del parámetro “grados de libertad” (v) T~t v
E(X) = 0
V (X) = v grados de libertad / (v -2)
Propiedades: su curva tiene forma de campana simetrica con su eje de simetría en 0; cuando aumentan los v disminuye
la dispersión de tv; a medida que aumentan los v la secuencia de campanas tiende a la de la curva normal estándar (por
eso a menudo la curva z se llama t con grado de libertad tendiendo a ꚙ)
t a;v = numero sobre el eje de medición que deja a su derecha y debajo de la curva t con v grados de libertad, una
superficie de valor Ⴛ.
- Si me pide calcular t que contenga el area central (z) con v= (c): toda el area bajo la curva debe darme 1,
sumatoria de los extremos del area central= 1-z
Cada extremo mide: sumatoria de extremos del area central/2
Miro tabla de t-student: en columna izquierda encuentro n, que son los grados de libertad v, fijo esa fila y busco en
margen superior el valor que obtuve en calculo anterior de lo que mide cada extremo.
Extremo superior = que extremo inferior → 1- (ext superior+ext inferior) = area central
Puedo hacerlo en Excel!
Distribución exponencial 𝑋~ 𝐸𝑥𝑝 (ʎ) : X tiene una distribución exponencial con parámetro 𝜆 (𝜆 > 0) si la fdp de X es:
E(X) = 1/ 𝜆 fdp
V (X) = 1/ 𝜆2
Fda
*Si me dan como dato la esperanza, media. Planteo la formula y despejo ʎ
*alpha e en calculadora.
* P (X> x) = 1- P (X<x) = 1 – Facum(x) = 1- [1-e -ʎ*x]
*P ( a < X < b) = Facum (b) – Facum (a) = [1-e -ʎ*b] - [1-e -ʎ*a]
* Probabilidad de que dure b horas más dado que ya estuvo funcionando a horas, debe darme igual que P (x≥b)=
P (x≥ a + b/x ≥ a) = P (x≥ (a+b) Ո x≥a)
P (x≥a)
= P (x≥ (a+b) ) = 1 – F (a+b) = alpha e -ʎ*(a+b) = alpha e -ʎ*b
P (x≥a) 1- F(a) alpha e -ʎ*(a)
* falta de memoria “la duración que se espera tenga un objeto, no cambia influye en nada el tiempo que en la
actualidad se lleva usando”.
PROPIEDADES: se usa para modelar el tiempo entre la ocurrencia de dos eventos sucesivos, tal como llamadas en un
conmutador o llegada de clientes a un servicio; estén fuertemente relacionada con Poisson. Supongamos que la
ocurrencia de un evento sigue un proceso de Poisson con parámetro 𝜆. Entonces la distribución del tiempo transcurrido
entre dos eventos sucesivos, es una exponencial de parámetro . (Una variable aleatoria de Poisson cuenta el número
de éxitos en un intervalo de longitud t y una v. a. exponencial cuenta el tiempo transcurrido entre dos éxitos sucesivos).
Variable aleatoria geométrica: En un experimento binomial se satisfacen condiciones:
- El experimento consiste en n repeticiones de pruebas independientes, con n fijo.
- La probabilidad de éxito es constante en cada una de las pruebas.
- Cada prueba tiene dos resultados posibles.
Supongamos que ahora el experimento se repite en forma independiente y que el mismo se detiene cuando se logra el primer
éxito. En este caso el número de repeticiones no es fijo. Se dice entonces que X es una variable geométrica de parámetro p, y se
nota: X ~ G (p)
Si X es una v.a geométrica, cumple con las siguientes propiedades:
Rx = N
PROBABILIDAD CONDICIONAL:
P (A/ B) = P (AՈ B) = P (A<x<B)
P (B) P (B)
*Ver donde coinciden para la intersección, si me hace calcular valores mayores a (b) dado que B=x, el numerador ira P(x>A)
*Si aparece una “O” entre probabilidades (a<x<b) y el numero a>b hago P( Ⴛ=b) – P( Ⴛ=a) = 1-(resultado de cuenta anterior).
UNIDAD 4
VARIABLE DISCRETA
Análisis Conjunto de Variables aleatorias discretas: Variables aleatorias con distribución conjunta: interesarse + de1 v.a de un mismo espacio
muestral. La fmp conjunta de dos v.a. discretas X e Y describe cuánta probabilidad se coloca en cada par posible de valores (x; y)
Función de masa de probabilidad conjunta para dos v.a. discretas: Sean X e Y dos v.a. definidas en el mismo espacio muestral E de
un experimento. p(x; y) para cada par de números (x;y) viene dada por:
𝑝 (𝑥; 𝑦) = 𝑃 (𝑋 = 𝑥 𝑦 𝑌 =y)
Debe darse:
𝑝(𝑥; 𝑦) ≥ 0 para toda x;y tomar valores positivos o cero
∑𝑥 ∑𝑦 p(x;y) = 1 la suma de las probabilidades para todos los pares posibles deben ser 1
Tablas de doble entrada: si X toma los valores 𝑥1, 𝑥2, … , 𝑥𝑘 e Y toma los valores 𝑦1, 𝑦2, … , 𝑦m
X
Y
𝑦1 𝑦2 … 𝑦j … 𝑦m
𝑥1 𝑝(𝑥1; 𝑦1) 𝑝(𝑥1; 𝑦2) 𝑝(𝑥1; 𝑦j) 𝑝(𝑥1; 𝑦m)
𝑥2 𝑝(𝑥2; 𝑦1) 𝑝(𝑥2; 𝑦2) 𝑝(𝑥2; 𝑦j) 𝑝(𝑥2; 𝑦m)
…
𝑥I 𝑝(𝑥i; 𝑦j)
…
Se llaman marginales xq se obtienen a los márgenes de la tabla de doble entrada (se plantea una fila como x donde iran los posibles
valores que toma la variable y la de abajo como p(x) donde ira en cada columna el valor correspondiente a la suma de la
columna/fila que le corresponda).
Independencia: Dos v.a. son independientes si su fmp conjunta se obtiene con el producto de sus marginales; si para cada par de
valores x e y
𝑝 (𝑥; 𝑦) = 𝑝𝑥 (𝑥) * 𝑝𝑦 (𝑦)
Si esto no se satisface para todo par (𝑥; 𝑦) , entonces se dice que X e Y son dependientes.
Distribuciones condicionales: Sean X e Y, dos v.a. discretas con fmp conjunta 𝑝(𝑥; 𝑦) y fdp marginales 𝑝𝑋 (𝑥) y 𝑝𝑌 (𝑥) , entonces para
cualquier valor x, de X para el cual 𝑝𝑋 (𝑥) > 0, la función de masa de probabilidad condicional de Y dado que 𝑿 = 𝒙 es:
Siendo ni el valor de la frecuencia con que aparece ese par (1 vez, dos veces, etc).
Si (𝑋; 𝑌) > 0 hay dependencia directa (covarianza positiva): a grandes valores de 𝑥 corresponden grandes valores de 𝑦.
Si (𝑋; 𝑌) = 0 no existencia de una relación lineal entre las dos variables estudiadas.
Si (𝑋; 𝑌) < 0 hay dependencia inversa (covarianza negativa), a grandes valores de 𝑥 corresponden pequeños valores de y.
Propiedades: Sean X e Y vs.as. y 𝑎, 𝑏 ∈ R
o 𝐶𝑜𝑣 (𝑋; 𝑎) = 0
o 𝐶𝑜𝑣 (𝑋; 𝑋) = 𝑉𝑎𝑟 (𝑋)
o 𝐶𝑜𝑣 (𝑎𝑋; 𝑏𝑌) = 𝑎. 𝑏. 𝐶𝑜𝑣 (𝑋; 𝑌)
o 𝐶𝑜𝑣 (𝑋 + 𝑎; 𝑌 + 𝑏) = 𝐶𝑜𝑣 (𝑋; 𝑌)
o Si X e Y son independientes 𝐶𝑜𝑣 (𝑋; 𝑌) = 0
o 𝐶𝑜𝑣 (𝑋; 𝑌) = 𝐸 (𝑋. 𝑌) − 𝐸 (𝑋)* 𝐸 (Y)
o Cov (X ; y1 + y 2) = Cov (X; y1) + Cov (X; y2)
VARIANZA: Siendo ni la cantidad de veces que aparece ese valor, y N la cantidad de valores totales
para de la muestra x ; ẋ la media de x. De la misma manera puedo calcular la varianza de y, reemplazando cada valor de x por una y.
o Varianza de la suma de dos v.a: 𝑉 (𝑋 + 𝑌) = 𝑉 ( x)+ 𝑉 (𝑌) + 2. 𝑐𝑜𝑣(𝑋; 𝑌)
o Varianza de la resta de dos v.a: 𝑉 (𝑋 - 𝑌) = 𝑉 ( x)+ 𝑉 (𝑌) - 2. 𝑐𝑜𝑣(𝑋; 𝑌)
o Varianza de la suma o resta de v.a. independientes, cov=0: 𝑉 (𝑋 - +𝑌) = 𝑉 (𝑋 )+ 𝑉 (𝑌)
*Si las variables son independientes, para saber la varianza total sumo los valores, si las variables NO son independientes (son dependientes)
debo usar la formula (en caso que sean 3 variables) =
V(x) = V(x1) + V (x2; x3) + 2 * Cov (x1 ; x2 + x3)
V(x) = V(x1) + [ V (x2) + V (x3) + 2 * Cov (x2;x3) ] + [ 2 * [ Cov (x1 ; x2) + Cov (x1; x3) ]
√r
COEFICIENTE DE CORRELACION: 2
o Covarianza en numerador y desviación típica debajo.
VARIABLE CONTINUA
Función de masa de probabilidad conjunta para dos v.a. continuas : Sean X e Y dos v.a. continuas, entonces f(x, y) es la función de
densidad de probabilidad conjunta de X e Y, si para cualquier conjunto bidimensional A:
P [ ( x; y ) ∈ A] = ∫∫ f (x;y) dx dy
Debe darse:
f(𝑥; 𝑦) ≥ 0 para toda x;y tomar valores positivos o cero
-ꚙ∫+ꚙ -ꚙ∫+ꚙ f (x;y) dx dy) = 1 la suma de las probabilidades para todos los pares posibles deben ser 1
Independencia: dos v.a. continua son independientes, si su fdp conjunta se obtiene con el producto de sus marginales.
𝑓(𝑥; 𝑦) = 𝑓𝑥 (𝑥) * 𝑓𝑦 (𝑦)
Valores esperados de dos v.a.: Si X e Y son dos v.a. independientes y la (𝑋) y la (𝑌) existen, entonces: 𝐸 (𝑋. 𝑌) = 𝐸 (𝑋) . 𝐸 (Y)
Modelo probabilístico líneal: da por hecho que el valor esperado de Y es una función lineal de X, pero que para una x fija la variable Y difiere de
su valor esperado por una cantidad aleatoria. Esto es:
𝑌 = 𝛼 + β𝑥 + ε
Donde ε=error aleatorio y se supone que 𝜀~(0; 𝜎 2) Sin 𝜀,
cualquier par observado caería sobre la recta de
regresión “verdadera” o poblacional.
Estimación de los parámetros del modelo (𝜶 𝒚 𝜷):
investigador nunca conocerá valores de 𝛼, 𝛽 𝑦 𝜎 2 , sólo
dispondrá de n observaciones muestrales. A partir de
ellas deberá estimar los parámetros y con ellos la recta
de regresión verdadera. Si se considera que las
observaciones se obtuvieron de manera independiente el
valor “y” observado es una v.a., y de acuerdo con el
modelo los puntos observados se distribuirán respecto a
la recta verdadera de manera aleatoria
Principio de los mínimos cuadrados: la recta tendrá un “buen ajuste” si minimiza el error entre los puntos estimados en la recta y los
puntos observados reales que se utilizaron para trazarla. Principio:
o La diferencia vertical entre el punto observado y la recta viene dado por: 𝑒𝑖 = 𝑦𝑖 – (𝐴 + 𝐵𝑥𝑖 )
o La suma de los errores elevados al cuadrado: 𝑓 (𝐴; 𝐵) = 𝑖=1 𝑛 ∑ [𝑦𝑖 –( 𝐴 + 𝐵𝑥𝑖)] 2
o Las estimaciones puntuales de 𝛼 y 𝛽, que se denotan â= 𝐴, y 𝛽^ = 𝐵 serán los valores que minimizan 𝑓 (𝐴; 𝐵) . Entonces la
recta de regresión de mínimos cuadrados será:
Ŷ = â + 𝛽^𝑥 = 𝐴 + 𝐵𝑥
El ^ indica que se trata de un valor estimado
Para minimizar a 𝑓 (𝐴; 𝐵) debemos cacular las derivadas parciales e igualarlas a cero:
Desarrollando este sistema se obtienen las siguientes ecuaciones conocidas como ecuaciones normales
Error estándar de la estimación (Se)Para medir la confiabilidad de la ecuación de estimación.
Similar a la desviación estándar, ambas son medidas de dispersión. El error estándar de la estimación, mide la variabilidad, o
dispersión, de los valores observados alrededor de la recta de regresión.
Coeficiente de determinación: Una vez ajustada la recta de regresión a la nube de observaciones; disponer de una medida que mida
la bondad del ajuste realizado, y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como
medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como
*Si me pide proporción de variación de variable que es explicada por modelo de regresión, hago r 2 x100 para sacar porcentaje.
*Si me pide desvio estándar (de tres variables) para un dia particular , calculo varianza general = (precio*desvio estándar X 1 + p*Ⴛ X2 +..) y hago raiz
Desvío estándar = √ VARIANZA → Varianza = Desvio estándar 2
EXCEL: DATOS→ ANALISIS DE DATOS → REGRESION → ENTRO DATOS COLUMNA Y, Y EN OTRA DATOS COLUMNA X, RANGO DE SALIDA SELECCIONO CELDA
DONDE QUIERO INFO. Me calcula coeficiente de correlacion, determinación, error típico (Estandar)
UNIDAD 5
Muestra aleatoria simple Se dice que las vs.as. 𝑋1, 𝑋2, … , 𝑋𝑛 forman una muestra aleatoria simple de tamaño n si:
Las 𝑋𝑖 son v. a. independientes.
Toda 𝑋𝑖 tienen la misma distribución de probabilidad
Suele anotarse que 𝑋1, 𝑋2, … , 𝑋𝑛 son iid (independientes e idénticamente distribuidas) Si el muestro es con reemplazo o a partir de una
población infinita, se cumplen estas condiciones.
Principios del muestreo aleatorio simple son la base de la inferencia estadística (del proceso de hacer inferencias acerca de poblaciones a partir
de información contenida en muestras).
Estadístico: cualquier cantidad cuyo valor se calcula a partir de los datos de la muestra; es una característica de una muestra; es una variable
aleatoria y se denota con una letra mayúscula. Se emplea la letra minúscula para representar el valor calculado u observado del estadístico. Ej
de estadístico: varianza muestral, varianza muestral, desviación estándar muestral, etc. Tiene asociada una distribución de probabilidades
“distribución de muestreo” que depende de la distribución de la población, tamaño de la muestra ymétodo de muestreo. Para obtener la
distribución de muestreo de un estadístico (nos dice como varia el estadístico en la muestra):
Recurrir a reglas de probabilidad (siempre que estadístico sea una función simple de las X) o
llevar a cabo experimentos de simulación: se utiliza cuando es difícil obtener algo utilizando las reglas de probabilidad; c/ayuda d pc;
se debe tener en cuenta: El estadístico de interés, la distribución poblacional, tamaño de la muestra (n), número de repeticiones (k).
Se simulan k muestras de tamaño n a partir de la distribución poblacional. Para cada muestra se calcula el valor del estadístico
deseado y se construye el histograma de los k valores calculados. El histograma proporciona la distribución de muestreo aproximada
del estadístico seleccionado. Cuanto más grande sea el valor de k, mejor será la aproximación.
Valor esperado del promedio = valor esperado de la distribución de la cual provienen las observaciones.
Varianza del promedio = varianza de la distribución de la cual provienen las observaciones sobre 2
Valor esperado de la varianza = varianza de la distribución de la cual provienen las observaciones
X1 X2 P (X1; X2) Ẋ (MEDIA MUESTRAL)
Armo todos los posibles Como se supone que son (X1 + X2 ) / 2
pares que puedan surgir variables independientes,
de ambas combinaciones la probabilidad conjunta
de valores, importa el es el producto de sus
orden marginales.
Ley débil de los grandes números: si S es una v.a. con valor esperado E(S) = μ y Varaianza (S) = 𝞼2 < ꚙ, entonces para ϵ > 0
P ( | S – μ | > ϵ ) ≤ (𝞼2 / ϵ 2) Sea Sn = (1/n) * ni=1 ∑ Xi P ( | 1/n * ni=1 ∑ Xi – μ | > ϵ ) ≤ (𝞼2 / n*ϵ 2) → 0
E (Sn) = μ → Es decir que
Var (Sn) = (𝞼2 / n ) (1/n) * * ni=1 ∑ Xi posibilidadn→ꚙ = μ
Teorema central del limite (TCL): asegura que la distribución de muestreo de la media se aproxima a la normal al incrementarse el
tamaño de la muestra; permite usar estadísticas de muestras para hacer inferencias con respecto a los parámetros de población, sin
saber sobre la forma de la distribución de esa población más que lo que podamos obtener de la muestra.
Sean 𝑋1, 𝑋2, … , 𝑋𝑛 v.a. iid con E(X) = μ y V(X) = σ2 ambas finitas, entonces si n>30. El tamaño
de muestra requerido para que la aproximación sea buena depende de la forma de la
distribución de las Xi. Mientras más simétrica y acampanada sea, más rápidamente se obtiene
una buena aproximación.
Ⴛ = desvio estándar poblacional Ẋ = media muestral
Suma de variables aleatorias: T= 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 donde 𝑋1, 𝑋2, … , 𝑋𝑛 son v.a. iid con E(X) = μ y
V(X) = σ2 ambas finitas, entonces si n es suficientemente grande
T = total de varibles aleatorias (X1 + X2 + …Xn)
La suma de n variables aleatorias de media μ y varianza 𝞼2, con la misma distribución, es aprox
igual (si n>30) a una distribución normal con media = n* μ y Varianza = n* 𝞼2
Ẋ = (𝑋1 + 𝑋2,+ … + 𝑋𝑛) / n
La media de n variables aleatorias de media μ y varianza 𝞼2, con la misma distribución, es aprox igual (si n>30) a una distribución
normal con media = m y Varianza = 𝞼2 / n
Aprox normal a distribución binomial: TLC puede usarse para justificar la aprox normal a la distribución binomial. 𝑋~𝐵 (𝑛, 𝑝) cuenta
el número de éxitos en n ensayos de éxito o fracaso independientes, y donde la probabilidad de éxito es p. TLC: si n es grande tanto la
suma (T) como el promedio (T/n) de las 𝑋𝑖 (que son iid) tienen distribuciones más o menos normales. Usando la aproximación cuando
𝒏. 𝒑 ≥ 𝟏𝟎 𝑦 𝒏. 𝟏 − 𝒑 ≥ 𝟏𝟎 se asegura que n es lo suficientemente grande para que sea buena
Aproximar T con Estandarizando
distribución normal
Distribucion de la varianza muestral: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria iid de una distribución con media μ y varianza σ 2
(*3)
varianza muestral tiene distribución chi-cuadrada si la muestra proviene
de una población normal.
Distribución de Ẋ si la población es normal: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de una distribución normalmente
distribuida con media μ y desviación estándar σ. Entonces para cualquier n, Ẋ tiene una distribución normal con media μ y
desviación estándar 𝜎 /√ n . El prom muestral de una población normal, tiene distribución normal con esos parámetros
sin importar el tamaño de la muestra
*Si me pide calcular n = (𝜎 dado * Z) 2 Siendo Z el valor de la tabla correspondiente a buscar el % q deba resultar.
a- μ Y a= importe que deba superar la media muestral
Suficiencia Un estimador es suficiente si utiliza toda la info acerca de θ que está contenida en la muestra. Dada X1 ,X2 , ...,Xn ,
una muestra aleatoria de una distribución f(x;θ), entonces T(X1 ,X2 ,...,Xn ), sin ser función de θ es un estadístico
suficiente para θ, si la distribución condicional de las Xi dado el valor de T, no depende de θ .
Se tienen n intentos de Bernoulli donde, p=probabilidad de éxito y T=número de éxitos en los 𝒏 intentos. Una vez
que conocemos T ⇒ 𝒑ˆ = 𝑻/ , no es posible obtener más información acerca de p, la otra info disponible es el orden
en que se dan los éxitos y fracasos.
‸
(arriba del signo) indica que se trata de un valor estimado; proporción d muestra se puede utilizar como estimador de la proporción de la población
Se calcula como probabilidad (numerador va la cantidad de números favorables en la muestra)/ (Denominador va la cantidad total de la población)
Si me pide estimación puntual de media o varianza es calcular la media o varianza muestral.
√ √
Error estándar de un estimado, ej de la media 𝜃ˆ es su desviación estándar 𝜎𝜃ˆ = V (θˆ )= σ 2/n Si el error estándar implica
parámetros desconocidos cuyos valores pueden ser estimados, la sustitución de estas estimaciones en 𝜎𝜃ˆ da el error o desvio
estándar estimado del estimador 𝜎ˆ𝜃ˆ o por 𝑠𝜃ˆ
Estimación por intervalo: es un rango de valores que se utiliza para estimar un parámetro de la población desconocido con un nivel
de confianza (grado de confiabilidad del intervalo). A +nivel de confianza +creencia de q el valor del parámetro que se está estimando
queda dentro del intervalo. Ancho del intervalo da info sobre precisión de una estimación de intervalo (nivel de confianza alto e
intervalo angosto= conocimiento del valor del parámetro es razonablemente preciso; amplio intervalo de confianza =existe
incertidumbre sobre el valor de lo que se está estimando)
Intervalo de confianza para μ: Se trata de encontrar dos
valores simetricos respecto de la media que abarquen entre
medio el % de nivel de confianza deseado. Se supone que las
observaciones muestrales reales x1 , x2 , . . . , xn son el
resultado de una muestra aleatoria X1 , . . . , Xn tomada de
una distribución normal con valor medio μ y desviación
estándar σ conocida. Como se trata de n observaciones
independientes la distribución de la media muestral es: 𝑋
~𝑁 (𝜇, 𝜎2/n)
α = nivel de significación (probabilidad de quedar fuera del
intervalo)
1-α = probabilidad de estar dentro del intervalo de confianza, % nivel de confianza (parte sombreada)
Z = (Ẋ - μ)/ (σ/√ n) para poder usar tabla de distribución normal estándar.
CASO 1
Si quiere construir intervalo tal que me den solo el % resultante (0,..).
P (a < (Ẋ - μ)/ (σ/√ n) < b) = 0,…
1- Planteo el % dado (0,…) como area central y hago 1-(0,…)= valor de ambos extremos/2 = valor de cada extremo alrededor
del area central.
2- Busco en tabla distribucion normal el resultado obtenido de hacer (Area central + extremo izq) y saco el respectivo Z y sus
decimales. Planteo (Extremos a y b seran = valor, signos opuestos), si es distribucion normal estandar (media=0, desvio
estandar =1) me queda formulado el intervalo de confianza entre las dos Z halladas). Si no es distribucion normal estandar
debo destipificar ambos extremos por separado (el + y el -) ya que puedo calcular la Z pero no la x, planteo:
Z= (x – μ) / σ → Despejo x = Z * σ + μ
P (-valor dado en tabla < (Ẋ - μ)/ (σ/√ n) < +valor dado en tabla) = 0,…
P (Ẋ -valor dado en tabla *(σ/√ n) < μ < Ẋ + valor dado en tabla * (σ/√ n)) = 0,…
Si me pide el intervalo que incluya la media de la poblacion un determinado %
1- 1-α = 0,… (% dado en ejercicio) → Despejo α = 0,… (% dado ejercicio) + 1
2- Z (α/2) = nivel de confianza. busco resultado obtenido de (α/2) en tabla distr. normal estandar (siempre lo tomo como valor
positivo) y obtengo Z con sus respectivos decimales.
3- Intervalo de confianza del 100(1 − 𝛼)% para la media μ población cuando se conoce el valor de σ viene dado por:
Armo intervalo con valores de media muestral, Z hallado y desvio estandar
muestral
Intervalo de Confianza = (Ẋ - ERROR ; Ẋ + ERROR)
Z (α/2) * (σ/√ n) = ERROR
(Si me pide lo mismo pero con proporcion es = formula pero en vez de Ẋ va p (casos favorables/proporcion total) y en vez de σ /√ n
Para un n fijo a mayor precisión (mayor nivel de confianza) mayor longitud del intervalo. Para un nivel de confianza fijo, podemos
“achicar” la longitud del intervalo aumentando el tamaño de la muestra (n). Entonces para garantizar un ancho de intervalo w con un
determinado nivel de confianza, despejamos n 𝑛 = (2*𝑧 (𝛼 /2) * (𝜎 /𝑤) )2
Los altos niveles de confianza producen intervalos amplios, de manera que sacrificamos la precisión para ganar en confianza. Los
intervalos estrechos tienen como resultado niveles de confianza bajos, de modo que sacrificamos confianza para ganar precisión
*Si me pide valor de n dándome el desvio estándar, el % del nivel de confianza y la media, planteo:
1- 1-α = 0,… (% dado en ejercicio) → Despejo α = 0,… (% dado ejercicio) + 1→ Z (α/2) = nivel de confianza. busco resultado
obtenido de (α/2) en tabla distr. normal estandar
2- Planteo n = (𝜎 * Z / μ)2
*Puede solicitarmelo tambien con la proporcion, y en ese caso en vez de desvio estandar pongo la proporcion.
CASO 2
Se supone que las observaciones muestrales reales x1 , x2 , . . . , xn son el resultado de una muestra aleatoria X1 , . . . , Xn tomada de
una distribución con valor medio μ y desviación estándar σ. Siempre que n sea grande el TLC nos dice que la distribución de la media
muestral es aproximadamente: 𝑋 ~𝑁 (𝜇, 𝜎2/ 𝑛). Para un n suficientemente grande el intervalo de confianza dado anteriormente
permanece válido
CASO 3
Sean las observaciones muestrales reales x1 , x2 , . . . , xn el resultado de una muestra aleatoria X1 , . . . , Xn tomada de una distr con
valor medio μ y desviación estándar σ desconocida. Siempre que n sea grande el TLC nos dice que la distribución de la media
muestral es aproximadamente: 𝑋 ~𝑁 (𝜇, 𝜎2/ 𝑛). La proposición que nos permite reemplazar σ con s (desviación estándar) para n
suficientemente grande
Si n es suficientemente grande, la variable estandarizada 𝑍 = (Ẋ − 𝜇)/ (𝑠/√ n ) Tiene
aproximadamente una distribución normal estándar. Esto implica que
Es un intervalo de confianza de muestra grande para μ con un nivel de confianza
aproximadamente igual a 100(1 − 𝛼)%. Esta fórmula es válida sin importar la forma
de la distribución de la población En general n>40 será suficiente.
Intervalos de confianza unilaterales:los intervalos de confianza unilaterales para un nivel de confianza 1 − 𝛼 se obtienen reemplazando 𝒛𝜶 /𝟐 por
𝒛𝜶 ó 𝒕𝜶/𝟐,𝒏−𝟏 por 𝒕𝜶;𝒏−𝟏 según sea el caso.
Un límite de confianza superior de una Un límite de confianza inferior de una
muestra grande para 𝝁 es: muestra grande para 𝝁
Test de hipótesis
Procedimiento basado en la evidencia muestral y en la teoría de prob que se emplea para determinar si la hipótesis es un enunciado racional y
no debe rechazarse o si es irracional y debe rechazarse. En un trabajo de investigación se emplean 2 hipotesis mutuamente excluyentes; la
hipótesis nula y la alternativa o de investigación. Objetivo d investigación es decidir cuál de dos pretensiones contradictorias sobre el parámetro
es la correcta. Los métodos para lograrlo comprenden la parte de la inferencia estadística llamada prueba de hipótesis, donde se consideran
dos hipótesis contradictoria y el objetivo es decidir, con base en información muestral, cuál de las dos hipótesis es la correcta.Al probar
hipótesis estadísticas, el problema se formulará de modo que una de las pretensiones sea inicialmente favorecida. Esta pretensión inicialmente
favorecida no será rechazada a favor de la pretensión alternativa, a menos que la evidencia muestral la contradiga y apoye fuertemente la
aseveración alternativa.
Hipotesis: elemento que coincide condiciona el diseño de investigación y responde provisionalmente al problema.
Prueba Hipótesis nula 𝑯𝟎 = pretensión que inicialmente se supone cierta, (creencia previa).
(Test) Hipótesis alternativa 𝑯𝟏 = aseveración contradictoria de 𝑯𝟎.
de Hipótesis nula será rechazada a favor de la alternativa si la evidencia muestral sugiere que 𝑯𝟎 es falsa. Las dos posibles
hipótesi conclusiones de una prueba de hipótesis son rechazar o no rechazar 𝑯𝟎
s Plantearemos 3 casos:
1- 2- 3-
*Cuando mucho → Planteo H0 : μ= x y la contradictoria seria H1:: μ> x
Errores en test d hipótesis (objetivo seleccionar una estadística del test y región crítica q minimicen la probabilidad de cometer los 2 errores):
Error tipo I (eI ):rechazar hipótesis nula cuando es V. Como H0 , especifica un valor único del parámetro, existe un solo valor de 𝜶 .
α = máxima cantidad del error que estamos dispuestos a aceptar para dar como valida la hipótesis del investigador.
P (rechazar H0 cuando es verdadera) = P (eI) = α
Error tipo II (eII) no rechazar la hipótesis nula cuando es falsa. Existe un valor ≠ de 𝜷 x c/valor del parámetro compatible c/ H1
P (no rechazar H0 cuando es falsa) = P (eII) = β
Errores Supóngase experimento y tamaño fijos; se selecciona un estadístico de prueba. Si se reduce tamaño d región de rechazo
y para obtener valor +pequeño de 𝜶 se obtiene un valor +grande de 𝜷 con cualquier valor de parámetro particular
tamaño compatible con H1 . Como en H0 siempre se plantea la hipótesis que se supone cierta, es más grave cometer error de tipo I,
muestr (rechazarla cuando es verdadera) que cometer error de tipo II (aceptarla cuando es falsa)
a Especificar valor +grande de 𝜶 que pueda ser tolerado y encontrar una región de rechazo que tenga ese valor de 𝜶. Esto
hace a 𝜷 tan pequeño como sea posible sujeto al límite en . El valor resultante de 𝜶 se conoce como nivel de significación
de la prueba. Niveles tradicionales de significación son 0,10; 0,05 y 0,01. Nivel de confianza dependerá d error de tipo I
(+serio error, +pequeño deberá ser el nivel de significación).
Prueb Población normal 𝝈 conocida: Sean 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de tamaño n de una población normal. Entonces 𝑋 ~(𝝁𝟎;
as 𝝈𝟐/𝒏) Considerando el estadístico estandarizado con la suposición de que 𝐻0 es verdadera. Si se reduce el tamaño de la región de
sobre rechazo para obtener valor +pequeño de 𝜶 se obtiene valor +grande de 𝜷 con cualquier valor de parámetro particular compatible con
la H1.Fijar 𝜶 porque se considera más grave cometer error de tipo I. Fijado el 𝜶 si se considera que el valor de 𝜷 obtenido es muy grande
media podría reducirse ↑tamaño de la muestra.
de Tipificamos y obtenemos el valor del estadístico de prueba: Z = (X muestral - 𝝁𝟎) / (𝝈/√ 𝒏)
una Siendo la hipótesis nula 𝐻0: 𝜇 = 𝜇0 se pueden dar las siguientes situaciones:
pobla Hipótesis alternativa Región rechazo para test nivel α Hipótesis alternativa Región rechazo para test nivel α
ción H1 : μ > μ0 Z ≥ Zα (prueba de cola superior) H 1 : μ < μ0 Z ≤ - Zα (prueba de cola inferior)
*contradicen los datos la afirmación del fabricante a un nivel de significación 𝛼 = ..? Uso dos colas.
Muestras grandes (n>30) 𝝈 desconocida: cuando n es grande, sin suponer distribución normal y desconociendo , 𝑋muestral también
tiene una distribución aproximadamente normal. Estimando 𝝈𝟐 con 𝒔2 formamos el estadístico estandarizado con la suposición de que
Ho es verdadero. Tendrá las mismas regiones de rechazo del caso anterior
Tipificamos y obtenemos el valor del estadístico de prueba: Z = (X muestral - 𝝁𝟎) / (S/√ 𝒏)
Siendo s=desviación estándar muestral
Muestras chicas (n≤30) 𝝈 desconocida: si las observaciones provienen de una muestra aleatoria tomada de una distribución normal
con valor medio μ y desviación estándar σ desconocida y si n es pequeño, tiene distribución de prob t student con n-1 grados de
libertad.
Tipificamos y obtenemos el valor del estadístico de prueba: T = (X muestral - 𝝁) / (s/√ 𝒏)
El conocimiento de la distribución del estadístico de prueba cuando H o es verdadera, nos permite construir una región de rechazo con
el tipo de error de
tipo I Hipótesis alternativa Región rechazo para test nivel α deseado.
𝐻0: 𝜇 = 𝜇0 H1 : μ > μ0 t ≥ t α , n-1 (prueba de cola superior)
H1 : μ < μ 0 t ≤ - t α , n-1 (prueba de cola inferior)
H 1 : μ ≠ μ0 t ≥ t α/2 , n-1 o - t ≤ t α/2 , n-1 (prueba de 2 colas)
Prueb En las pruebas de hipótesis se debe comprobar, con base en R obtenidos en una muestra, si el valor verdadero de una proporción es
as igual a la constante determinada o si las proporciones de 2 o + poblaciones son iguales. Prueba con muestras grandes: ṗ ~N ( 𝑝; (𝑝
para *(1−𝑝))/ 𝑛) , si n es grande y p chica el reemplazo en la varianza de 𝑝 por p implica un error desestimable, estandarizando
propr Z = (ṗ - p) / √ ¿ ¿] ~ N (0;1)
ocion Bajo H0 el estadístico toma el valor: Z = (ṗ - p0) / √ ¿ ¿] o
PASOS A PLANTEAR:
1- Planteamiento hipótesis nula y alternativa. Siempre la nula será H 0: μmuestral = μ poblacion. La alternativa H1 puede ser > < o ≠ a μ
2- Elegir nivel de significancia α = 0,05 si no me lo especifica.
3- Determinacion zona de aceptación y rechazo de la hipótesis nula
4- Determinacion de función pivotal:
ZC = (X muestral - 𝝁𝟎) / (𝝈/√ 𝒏) n>30, población normal y 𝞼 conocido.
TC = (X muestral - 𝝁) / (s/√ 𝒏) con n-1 grados de libertad n≤ 30, t student 𝞼 desconocido.
√
ZC = (P muestral– p poblacionl) / ( p∗q/n ) p = probabilidad que ocurra q= 1-p = probabilidad que no ocurra.
5- Calculo función pivotal elegida. Reemplazo valores. ZC o tC obtenido es el valor final a ubicar dentro de regiones.
6- Ubicar el valor obtenido en el calculo de función pivotal en la región de rechazo (RR) o de aceptación (RA)de la H 0
Criterio de aceptación o rechazo:
Zona de rechazo = α Zona de aceptación = 1- α Zt = Z1-α
Prueba de 1 cola si H1 : μ > μ0
Prueba de 1 cola si H1 : μ < μ0 Si |Zc| > |Zt| se rechaza H0 y acepta H1
Prueba de 1 cola si H1 : μ ≠ μ0 Si |Zc| ≤ |Zt| se mantiene H0
I C para la pendiente de la recta de regresión La pendiente β de la recta de regresión de la población es el cambio promedio verdadero en la
variable dependiente y asociada con un incremento de una unidad en la variable independiente x. La pendiente b hallada por el método de
mínimos cuadrados es una estimación puntual de 𝜷 (β = 𝒃). Las inferencias adicionales sobre 𝜷 están basadas en considerar a β como un
estadístico e investigar su distribución de muestreo
Se puede mostrar que b tiene distri. Normal con Reemplazando 𝞼 por
E(b) = β y V(b) = 𝞼2b = 𝞼2/ sxx su estimación Se:
Sxx= ∑ x2i – (∑xi)2/n Sb = se / √ sxx
Bajo supuestos del modelo la variable Un intervalo de confianza del 100(1-α)% para la verdadera pendiente β de la recta de
regresión es:
b +- tα/2 ; n-2 * Sb