Estadistica Resumen General

Estadística: se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y
cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos, así como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso realizar predicciones
Estadística describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y
Clasificación descriptiva representan la información contenida en ellos.
Estadística apoyándose en los cálculos de probabilidades y a partir de datos muestrales, efectúa estimaciones,
inferencial decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos (población
UNIDAD 1 ESTADISTICA DESCRIPTIVA

Se subdivide en dos areas:
 Representar un conjunto de datos por medio de técnicas visuales.
 Calcular e interpretar medidas de resumen numéricas (números que puedan servir para caracterizar el conjunto de datos y mostrar
sus propiedades sobresalientes)
CONCEPTOS BASICOS
 Individuo o elemento: persona o elemento que contiene cierta información que se desea estudiar.
 Población: conjunto de todos los individuos o elementos que cumplen con ciertas propiedades comunes. Puede ser finito o infinito.
 Muestra: subconjunto representativo de la población.
 Parámetro: función definida sobre los valores numéricos de características medibles de una población.
 Estadístico: función definida sobre los valores numéricos de una muestra
 Caracteres: propiedades o rasgos de los elementos. Pueden ser cualitativos o cuantitativos.
 Modalidades: diferentes situaciones posibles de un carácter. Deben ser exhaustivas y a la vez mutuamente excluyentes.
 Clases: conjunto de una o más modalidades en el que se verifica que cada modalidad pertenece a una y sólo una de las clases.
Una variable estadística hace referencia a un carácter y puede tomar cualquier modalidad de un conjunto determinado que llamaremos
dominio o rango. Las variables estadísticas se denotan con letras mayúsculas ( X, Y, A, Z …) y según el tipo de dominio se clasifican en:
 Variables cualitativas: las modalidades posibles son de tipo nominal.
 Variables cuasicuantitativas: es posible establecer orden entre ellas aunque sean de tipo nominal.
 Variables cuantitativas: tienen cantidades numéricas con las que podemos hacer operaciones aritméticas. A su vez se clasifican en:
 discretas (sus modalidades son valores enteros) o continuas (sus modalidades son valores reales).
Frecuencias
 Frecuencia absoluta de la clase xi : es el número ni de observaciones de la clase xi . ENTERO CANTIDAD
 Frecuencia relativa de la clase xi (fi): cociente entre la frecuencia absoluta y el número total de observaciones (N) PROPORCION O %
Fi = ni
N
En el caso de variables cuantitativas o cuasicuantitativas también se puede calcular:
 Frecuencia absoluta acumulada de la clase xi (Ni): es el número total de observaciones cuya modalidad es inferior o igual a la clase x i :
𝑁𝑖= 𝑛1+𝑛2 + ⋯ + 𝑛i.
 Frecuencia relativa acumulada de la clase xi (Fi ): es el cociente entre la frecuencia absoluta acumulada y el total de observaciones
𝐹𝑖= 𝑁i = 𝑛1+𝑛2 + ⋯ + 𝑛i
𝑁 𝑁
Clases
En el caso de variables cualitativas o cuasi cuantitativas las clases están formadas por las diferentes modalidades que toma la variable. En el
caso de variables cuantitativas existen dos posibilidades:
 Discretas: las clases pueden ser los valores numéricos que toma la variable. Pero si los valores son muchos pueden ser
agrupados en intervalos. (Valores enteros)
 Continuas: las clases se definen mediante intervalos
Intervalos
[ 𝑙𝑖−1 - 𝑙𝑖 ] = { x : 𝑙𝑖−1≤ x < 𝑙𝑖 }
Donde 𝑙𝑖−1es el límite inferior del intervalo i, y 𝑙𝑖 es el límite superior del intervalo i
 Amplitud del intervalo, 𝑎𝑖 :longitud del intervalo 𝑎𝑖=𝑙𝑖 − 𝑙𝑖−1
 Marca de clase, 𝑥𝑖 , al punto medio de intervalo i 𝑥𝑖= 𝑙𝑖 + 𝑙𝑖−1
2
Graficos y diagramas
Para variables Para variables Para variables cuantitativas continuas
cualitativas cuantitativas
discretas
 Gráfico de  Gráfico de  Histogramas: Permiten reconocer y analizar patrones de comportamiento en la
barras barras: En información recolectada. Se construyen a partir de una tabla estadística,
eje x valores representando sobre cada intervalo un rectángulo que tiene como base este
 Gráfico de de variable, segmento y como altura, si los intervalos son todos iguales, la frecuencia relativa o
sectores nos muestra la absoluta de cada intervalo. En el caso de intervalos de distinta longitud la altura
sobre cada se calcula dividiendo la frecuencia por la amplitud (frecuencia rectificada). Para
uno de los frecuencia absoluta acumulada e intervalos.
valores de Una caracterización de la forma general se relaciona con el número de "picos" o
la variable "modos". Se dice que un histograma es "unimodal" si tiene un único pico, "bimodal"
 Gráfico de
un si tiene dos picos y "multimodal" si tiene más de dos picos.
Pareto: se rectángulo Histogramas unimodales simétricos:
suelen de la altura
utilizar en equivalente
el campo a la
de la frecuencia
economía y absoluta de
de la ese valor Histogramas unimodales asimétricos. Si la cola superior del histograma se prolonga
empresa. (Representa mucho más que la cola inferior, la distribución de los valores es asimétrica positiva.
Diagrama da en eje y), Si la cola inferior es mucho mayor que la cola superior la distribución es asimétrica
de barras es decir a la negativa.
pero las cantidad de
barras se veces que se
presentan observó ese
en orden valor.
descendent Rectángulos
es deben ser  Polígono de frecuencias: Se construyen a partir del histograma uniendo con líneas
de igual rectas los puntos superiores de los rectángulos que corresponde a la marca de case
ancho. o punto medio del intervalo. Para representar el primer y último intervalo se
supone que adyacentes a ellos existen otros intervalos de la misma longitud y
frecuencia nula. Un polígono es una figura plana que encierra una región del plano
por lo tanto se deben unir los extremos.El área del polígono es igual al área de la
suma de los rectángulos
- Poligonal de frecuencias acumuladas u ojiva: Es una línea poligonal obtenida
uniendo los puntos que tienen por abscisa el límite superior del intervalo y
como ordenada la respectiva frecuencia acumulada. Si me pide esclarecer
datos en base a grafico, los intervalos son las divisiones del eje x (Tal como
aparezcan). Eje y aparecen las frecuencias relativas acumuladas
- Para saber frecuencia relativa, voy viendo la diferencia entre las acumuladas.
Para saber frecuencia absoluta, uso el % especifica de frecuencia relativa
sobre el total de frecuencias absolutas (N)
Diagrama tallo y hoja (Tukey): forma efectiva y compacta de resumir info numérica y obtener una repesentacion visual de los mismos. Cada
numero en el conjunto de datos se divide en 2 partes:
 Tallo: primer parte del numero, consiste en el primer o primeros digitos. En gral deben tener entre 5 y 20 tallos.
 Hoja: ultima parte del numero, consiste de el o los digitos finales
Se usan los tallos y hojas resultantes para construir el diagrama.
Variante: dividiendo las hojas en un tallo determinado en dos grupos: las que comienzan con 0,1,2,3 o 4 ("low"), y las que comienzan con
5,6,7,8 o 9 ("high"). Luego, cada tallo se lista dos veces cuando se construye el diagrama. Se escribe el tallo y L o H según corresponda.
Análisis de una variable: Por un lado una medida que indique el valor en torno al cuál se agrupen los datos, y por otro, una medida que indique
la variabilidad. Dado un grupo de datos, estudiaremos:
 La tendencia central :
Media aritmética:
Si los datos no están agrupados, la media aritmética es la suma de todas las observaciones divida la cantidad de
observaciones. O (valor variable 1 * frecuencia absoluta 1 + x2 * f2 + … ) / N (suma total frecuencia absoluta) Sumo números
que me den/ cantidad de números que sean.
Si los datos están agrupados en una tabla de frecuencias: La media aritmética ( ) de una variable estadísticas es la suma de
los productos entre la marca de clase de cada intervalo (Lim inf+ Lim sup)/2 y su frecuencia absoluta dividido la cantidad de
observaciones. Habrá una pérdida de precisión que será mayor cuanto mayor sea la longitud del intervalo
La suma de las desviaciones de los valores de la variable respecto de la media es cero . Es única y fácil de calcular pero
cuando se trabaja con intervalos la longitud de los mismos influye en el valor resultante de la media. Toma en consideración todos
los valores de la distribución, por ello es muy sensible a valores extremos o anómalos. Puede no coincidir con uno de los valores
posibles de la variable.
Mediana: Es un valor que divide a la muestra en dos partes iguales. Los valores deben estar ordenados de menor a mayor
(inclusive los repetidos). La mediana, deja a un lado y al otro de la distribución el mismo número de observaciones. Ventaja:
no esta afectada por las observaciones extremas, tiene propiedades matemáticas complicadas lo que dificulta su uso en
inferencia estadística
Datos no agrupados:
Si el número de observaciones es impar la mediana es el valor central. Es decir si son N observaciones, la mediana
es la (𝑁+1)/2-ésima observación. Siendo N el número total de observaciones (suma columna frecuencia absoluta).
El resultado es la observación numero… Busco posición (n+1)/2 en frecuencia absoluta acumulada (sino me voy
para arriba a mayor)
Si el número de observaciones es par, entonces la mediana se calcula como el promedio de las dos observaciones
centrales, esto es:
El resultado es la observación numero …
Datos agrupados: Hay que identificar el intervalo que tiene la observación (𝑁/2) – é𝑠𝑖𝑚𝑎 (dentro de columna frecuencia
absoluta acumulada, si no esta busco el siguiente para arriba) , denominado intervalo mediano, dentro de él la mediana
se obtiene como:
[𝑙𝑖−1; 𝑙𝑖) es el intervalo mediano (donde arranca)
𝑎𝑖 es la amplitud del intrevalo mediano (Lim sup intervalo-Lim inferior intervalo)
𝑛𝑖 es la frecuencia del intervalo mediano (Frecuencia absoluta de ese intervalo)
N𝑖−1 es la frecuencia acumulada antes del intervalo mediano
Moda: Es el valor más frecuente de la distribución. Puede no ser única.

Datos no agrupados basta con establecer él o los valores que más se repiten en el conjunto de datos.
Datos agrupados el intervalo modal es aquel que tiene mayor frecuencia absoluta, la moda será un punto del mismo cuyo
cálculo se realiza con las siguientes fórmulas:
Si los intervalos son iguales:
𝑙𝑖−1: valor inferior de intervalo con mayor frec absoluta
ni= frecuencia absoluta de ese intervalo
ni-1 = frecuencia absoluta intervalo anterior
ni+1=frecuencia absoluta de intervalo posterior
Si los intervalos son distintos, se utilizan las frecuencias rectificadas ( 𝑛′𝑖 = 𝑛𝑖 / ) para identificar el intervalo
modal, ya que miramos el que tenga mayor frecuencia rectificada modal. Y aplico formula usando frecuencias
rectificadas en vez de frecuencias absolutas.
Cuando los valores de una variable están ordenados de menor a mayor, otras medidas de localización utilizadas son:
 Cuartiles: dividen el conjunto de datos en cuatro partes iguales. El cuartil numero 2 es la mediana. Se necesita tener datos
ordenados de menor a mayor, frecuencias absolutas y absolutas acumuladas. EL intervalo que contiene el cuartil 2 sera el
que contenga a la mediana (son = ) (N/2), el que contenga esa observación, lo veo en frecuencia absoluta acumulada.
DATOS NO AGRUPADOS DATOS AGRUPADOS
en intervalos de igual longitud, primero debemos localizar
el intervalo que contiene el cuartil a calcular, luego
utilizamos la siguiente fórmula
Cuando s=2 la fórmula es coincidente con la que

dimos para la mediana
Para hallar que intervalo contiene observación veo en Ni
(Frecuencia absoluta acumulada, que intervalo la
contiene)
Q1 = N/4 encuentro el numero de la observación
Q2 = N/2 encuentro el numero de la observación
Q3 = N * (3/4) encuentro el numero de la observación
Q4= N encuentro el numero de la observación
Luego aplico formula
 Deciles: dividen el conjunto de datos en diez partes iguales. Para datos agrupados
 Percentiles: dividen el conjunto de datos en cien partes iguales. Para datos agrupados
 La dispersión o variación con respecto a ese centro:
 Medidas de variabilidad o dispersión: Las medidas de tendencia central proporcionan información parcial acerca de un
conjunto de datos.
 Rango o recorrido: puede verse afectado por observaciones extremas y sólo usa dos de las observaciones
Re = xmax – xmin
 Cuarta dispersión fs O RANGO INTERCUARTILITICO: es la diferencia entre el tercer y primer cuartil: Contiene
el 50% de los datos y no se ve alterado por posibles valores extremos. fs = 𝑄3 − 𝑄1
 Varianza: se define como la media de las diferencias cuadráticas de N observaciones en relación a su media
aritmética. siempre es mayor o igual que cero
 Varianza muestral: la teoría matemática dice que si se pretende aproximar la varianza de una población a partir
de la varianza de una muestra el error cometido es menor si en lugar de dividir por N dividimos por N-1:
Si los datos están agrupados

 Desviación típica: la varianza no tiene la misma unidad de medida que las observaciones. Si queremos que la
medida de dispersión sea de la misma dimensionalidad que las observaciones bastará con tomar su raíz cuadrada
La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza.
 Coeficiente de variación Es la medida de dispersión más usada. Para comparar dos poblaciones. Es el cociente
entre la desviación típica o estándar y la media. Sólo se debe calcular para variables con todos los valores
positivos. No es invariante ante cambios de origen, pero es invariante ante cambio de escala.
 La forma o simetría de la distribución

Simetrías: Una distribución de frecuencias es simétrica si el lado derecho de la gráfica a partir de la mediana es la
imagen especular de la izquierda.
CRITERIO ASIMETRIAS
ASIMETRICA POSITIVA ASIMETRICA NEGATIVA
cuando las frecuencias más altas se cuando la cola se
encuentran al lado izquierdo de la mediana, encuentra del lado
mientras que a la derecha hay frecuencias izquierdo.
más pequeñas (cola)
Valores atípicos: Fs = cuarta dispersión = Q3 – Q 1
Cualquier observación más allá de 1,5fs del cuartil más cercano es un valor atípico.
 Es extremo si está más allá de 3fs del cuartil más cercano
 Es moderado si está más allá de 1,5.fs y a menos de 3fs del cuartil más cercano
Ejemplo: Una balanza registra el peso de las personas que se pesaron cierta mañana en una farmacia. 58 51 39 49 59 58 57 59 68 54 42 54 40
63 58 66 70 72 71 69 70 HISTORIGRAMA, abajo POLIGONO DE FRECUENCIA Y DE FRECUENCIA ACUMULADA
Ejemplo de diagrama variables cuantitativa discreta: Ej: En una clínica se anoto pasos q dio cada nene sin caerse. Datos:
224544656633432347665445346336345343523766
 Variable a analizar: cantidad de pasos que da un niño sin caerse en un dia.
 Tipo: cuantitativa discreta
a- Realizar distribución de frecuencias y graficos
b- ¿Qué proporción de niños dio 3 pasos o menos? 35,71%
c- Cuantos niños se observaron que dieron entre 5 y 3 pasos inclusive? 31-4=27
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA ACUMULADA
Grafico en escalera, llega hasta total de observaciones, rectángulos
van pegados. Se llama histograma
Ejemplo variable cuantitativa continua: se registran metros caminados x los niños. 2,3 2,1 1,2 5,3 3,7 3,6 1,2 2,8 2,5 5,2 3,4 3,2 2,1 2,9 1,6 3,2
3,6 2,9 5,5 3,2 3,2 2,5 3 2 5,2 3,5 3,8 2,4 3 3,8 2,6 3,2 3 3,1 3,2 1,4 5,1 2,6 3,7 2,6 2 1,9
 Variable a analizar: metros caminados por los niños sin caerse
 Tipo: cuantitativa continua
a- Hacer diagrama tallo hoja, luego agrupar datos observados en intervalos de amplitud uno comenzando con el [1;2) y realiza la
distribución de frecuencias y los gráficos correspondientes
FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA

Sobre eje x pongo intervalos, ACUMULADA
sobre eje y rectángulos de Histograma que va en
altura igual a diferencia crecimiento.
absoluta, nos queda un
histograma porque al
terminar un intervalo
comienza el siguiente.
Cálculos estadísticos básicos en calculadora:

 Datos agrupados x frecuencia: se utilizan cuando el tamaño de la muestra es es grande, se agrupan informando en una tabla el
número de veces q se re-pita c/valor (frecuencias absolutas). La agrupación x frecuencias se puede realizar a través de algún
programa estadístico o hoja de calculo (Excel)
En calculadora [S-SUM] (1) ; [S-VAR] (2) ; Y (`)

Datos no agrupados: se corresponden con los datos obtenidos originalmente (aun sin manipular). Los datos están desordenados y no
tabulados, esta forma de presentar info suele utilizarse cuando el tamaño de la muestra es pequeña
1- Cambiar modo calculadora estadística: tecla MODE selecciono 2 “SD”
2- Limpio calculadora: shift, clear, 1, = . Corroboro haciendo Shift, 1, 3 = (n debe ser 0)
3- Para introducir datos (no importa orden): escribo numero, aprieto tecla DT (sin shift antes), y continuo con los demás
4- Para visualizar datos, para saber si me equivoque: tecla REPLAY (flecha arriba) y veo ultimo dato introducido, si me equivoque escribo
ahí numero correcto e = y me lo modifica.
5- Shift + 1 ([S-SUM]), dentro tengo opción ∑x2 (1), ∑x (2), n (3)
√
6- Shift + 2 ([S-VAR]),dentro tengo opciones MEDIA (1), DESVIACION TIPICA o de varianza(2) que elevado al cuadrado me da
VARIANZA, CUASIDESVIACION TIPICA √ de cuasivarianza (3) que elevada al cuadrado me da la CUASIVARIANZA
Excel
Variable cuantitativa discreta (números enteros):
 Ingreso en una fila datos (observaciones, todas). Ingreso en otra las clases (posibles valores de variable sin repetir, en orden – a +)
 Histograma frecuencia absoluta: “Datos” – “Analisis de datos” – “Histograma” – dentro ingresar, celdas en las que se encuentran los
datos, debajo las celdas en las que se encuentran las clases o intervalos de clases, lugar donde se devuelve la info (en caso de ser
rango de salida especificar cela) y seleccionar “crear grafico”. Para personalizar el gráfico con el botón derecho sobre las partes del
mismo, en presentación puedo personalizar rotulos. Click derecho – formato- sin intervalo para unirlos en histograma
Sobre las barras del gráfico hacemos click con el botón derecho del mousse, clickeamos en seleccionar datos, aparecerá ventana, en
la que vamos a editar las marcas de clase de los intervalos. Apretamos editar, y elegimos desde la tabla de frecuencias, las celdas
donde se encuentran las marcas de clase. Aceptamos y esto nos cambiará la leyenda sobre el eje x. Luego con la herramienta de
gráficos lo ensanchamos las barras y mejoramos a gusto
 Para hacer histograma de frecuencia relativa: selecciono datos en la tabla, insertar, columna en 2-D
 Poligono de frecuencia:
A partir de un histograma realizado: hacemos click con el botón derecho sobre las barras del histograma anterior y seleccionamos
cambiar tipo de gráficos de series, luego en la ventana que se abre elegimos, líneas o líneas con marcadores.
 Ojiva o polígonal de frecuencias acumuladas: Datos - Análisis de datos – Histograma y elegimos Cumulative porcentaje,además de
grafico. Sacar color a contorno e relleno de barras.
 Varianza: para datos no agrupados dos opciones:
- Utilizando opción de estadística descriptiva
- Utilizando las fórmulas estadísticas, copiamos y pegamos la tabla con los datos en la planilla de Excel; parados en la celda donde
queremos la info, vamos a Fórmulas, Mas funciones, Estadísticas y elegimos VAR o VARA. Donde dice Valor 1, seleccionamos
todas las celdas que contienen los datos, luego aceptamos.
 Desviacion típica: Utilizando las fórmulas estadísticas, copiamos y pegamos la tabla con los datos en la planilla de Excel; parados en
la celda donde queremos la info, vamos a Fórmulas, Mas funciones, Estadísticas y elegimos DEVEST.M. Donde dice Valor 1,
seleccionamos todas las celdas que contienen los datos, luego aceptamos.
 Q1 para datos no agrupados: en celda escribo =CUARTIL(selecciono datos,;1)
 Paso datos de tabla histograma de frecuencia absoluta a calculador de absoluta acumulada, relativa, relativa acumulda.
 Para grafico en escalera: para obtener el diagrama escalera pintar en la tabla de frecuencias los valores en la columna “frecuencia
absoluta acumulada” luego en la pestaña Insertar – Columna – Columna en 2-D, elegimos la opción 1.
 Agrupar por intervalos de amplitud 2 los valores de la variable, calcule su distribución de frecuencias y represente el histograma
correspondiente: Excel construye las tablas de frecuencias utilizando intervalos de la forma ( 𝑙𝑖−1; ] y para lo cual debemos informarle el
límite superior del intervalo; 𝑙𝑖 . Como se trata de intervalos de amplitud 2 y de una variable aleatoria discreta¸ podemos indicarle
como rango de clases (o bin range) la marca de clase : punto medio del intervalo . Agrupe por intervalos de amplitud 2 los valores de
la variable: dejo fila de datos igual pero cambio clases en intervalos de 2 en 2 (que incluya valores, desde 1 y + aunque se pase).
 Diagrama tallo y hoja: para elegir tallo y hoja, es necesario saber el rango de valores que tienen los datos. Para esto una vez
cargados los datos en la planilla, todos en una fila o en una columna, poner ordenar de menor a mayor, vamos a “Data analysis” y
seleccionamos la opción “Descriptive Statistics” y nos pide: indicar celdas en las cual se encuentran los datos, si es fila o columna,
lugar donde se devuelve la información (Seleccionar celda), información requerida “sumar y estadistics”. Obtenemos media, error
estándar, mediana, moda, desviación estándar, varianza muestral, kurtosis, asimetría, rango, valor mínimo, valor máximo, suma de
los datos y cantidad de datos
- Para buscar máximo (sin datos ordenados): selecciono en barra blanca fx y escribo MAX, seleccióno datos donde buscar.
- Para buscar minimo (sin datos ordenados): selecciono en barra blanca fx y escribo MIN, seleccióno datos donde buscar.
*Los números enteros del max y minimos nos indican los tallos que debemos colocar.
*Para hacer Hojas: fx “REPETIR”, en texto coloco el numero que quiero evaluar en principio de menor a mayor, comienzo por 0, en
“veces” escribo Contar.si, abro paréntesis, selecciono datos donde buscar, aprieto F4, punto y coma y selecciono tallo actual, enter.
Luego agrego a formula anterior signo “and” “&” y copio y pego todo lo anterior cambiando el numero 0 por el 1 y en tallo agrego +
0,1 y asi sucesivamente. Una vez terminado desplegamos formula a demás tallos inferiores.
Para armar intervalos en datos no agrupados:
1- uso formula para calcular amplitud de intervalo: Eleccion del intervalo: para elegir el número k de intervalos en los que dividir el
√
rango que toma la variable es: 𝑘 = N . Donde N es el número de observaciones y el rango o recorrido Re, la diferencia entre la
observación más grande y la más pequeña. → Re = XMAX – XMIN. En el caso de elegir intervalos todos de la misma longitud, se cumple
que la amplitud: a = Re/ 𝑘
2- Armo columa con Lim inf y otra Lim superior, escribo el minimo en primer celda Lim inf y en Lim superior =(Selecciono celda lim
inferior+amplitudcalculada) y arrastro a resto columna, en columna Lim inf debajo del escrito =(Selecciono celda Lim sup anterior) y
arrastro.
3- Escribo en otra columna los intervalos (me sirven para graficar, sino no serán necesarios).
4- Luego para sacar frecuencia absoluta busco en formulas FRECUENCIA , seleciono los datos y como clase el límite superior del
intervalo, selecciono todo, F2 (mantengo apretado fn y F2), y a la vez control+shif+ctrlpara activarlo como matriz.
 Para sacar frecuencia absoluta de variable cualitativa: me paro en primer celda de primer fila, FUNCIONES –CONTAR SI- Rango
(Datos), criterio (selecciono variable). Lo hago con cada variable, o si quiero despliegar formulas para abajo en la columna debo
colocar antes de cada numero/letra de celda un signo $ para fijar datos.
UNIDAD 2
Espacio muestral: conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E.
TIPOS DE EXPERIMENTOS
 Deterministas: experimentos de los que podemos predecir el resultado antes de que se realicen.
 Aleatorios: aquellos en los que no se puede predecir el resultado, ya que éste depende del azar, pero conocemos el conjunto de
resultados posibles. Es aleatorio si se verifican: Se puede repetir indefinidamente, siempre en las mismas condiciones; no se puede
predecir el resultado y el resultado que se obtenga pertenece a un conjunto de resultados posibles conocidos previamente.
Teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el
fin de cuantificar dichos resultados y saber si un suceso es más probable que otro. El cálculo de probabilidades suministra las reglas para el
estudio de los experimentos aleatorios o de azar, siendo la base para la estadística inferencial.
Técnicas de conteo
Regla del producto: Supongamos una colección ordenada de k elementos (k-tupla) y que hay n 1 opciones posibles para el primer elemento, n 2
para el segundo, …, nk para el k-ésimo elemento, entonces, hay n1*n2 . … *nk k-tuplas posibles
Permutaciones Cualquier secuencia ordenada de los elementos de un conjunto de n elementos distintos, se llama
permutación de n elementos y se denota P𝑛. El número de permutaciones es P𝑛 = 𝑛!.
USO TODOS Permutaciones con repetición Llamamos a las permutaciones con repetición de n elementos tomados de a en a, de b en
LOS b, de c en c, etc., cuando entre los n elementos existen elementos repetidos (un elemento aparece a veces, otro b veces,
ELEMENTOS E otro c veces, etc) verificándose que a+b+c+...=n. El número de estas permutaciones será:
IMPORTA EL PR𝑛 𝑎,, = 𝑛!
ORDEN 𝑎! * 𝑏! * 𝑐!
*En palabra tomo en cuenta como n a la sumatoria de la cantidad de letras que sean (contando hasta las repetidas); como a, b u c las
letras repetidas (el número de veces que aparezcan).
USA IMPORTA Variaciones Cualquier secuencia ordenada de k elementos de un conjunto de n elementos distintos, se llama
ALGUNOS EL ORDEN variación de n elementos tomados de a k. *maneras distintas. Número de variaciones es:
ELEMENTOS 𝑉𝑛 𝑘 = 𝑛!
(𝑛−𝑘)!
Variaciones con repetición Sea A un conjunto con n elementos. Llamamos variaciones con repetición de n
elementos tomados de k en k a todas las agrupaciones que podemos hacer con k elementos de A
independientemente de que se repita alguno. El número de variaciones con repetición viene dado por:
V𝑅𝑛 𝑘 = 𝑛 k
*Si tengo por ej en patentes 3 números y 3 letras hago VR letras* VR patentes para saber posibles resultados.
NO Combinaciones Dado un conjunto de n elementos distintos, cualquier subconjunto no ordenado de tamaño k
IMPORTA de los elementos se llama combinación de n elementos tomados de a k. *Maneras iguales. NO IMPORTA EL
EL ORDEN ORDEN. El número de combinaciones es:
C𝑛 𝑘 = 𝑛!
𝑘!( 𝑛−𝑘 )!
*En casos donde me pida calcular probabilidad ej de bolas color rojo dentro de un conjunto de bolas de 3 colores, hago
combinatoria de bolas rojas (tomando como n a la cantidad total de bolas rojas) / combinatoria cantidad total. Si luego
me pide dos de un color ej, hago combinatoria de colores multiplicados (en k pongo cantidad que debería aparecer de
cada color), divididos por combinatoria total. Si luego me pide que salgan en orden, hago la combinatoria
correspondiente multiplicado por (1/n!).
Combinaciones con repetición Sea A un conjunto con n elementos. Las combinaciones con repetición de n
elementos tomados de a k (n ≥k), son los distintos grupos formados por k elementos de manera que: no
entran todos los elementos, no importa el orden y elementos pueden repetirse. Las combinaciones con
repetición son :
CR𝑛 𝑘 =(𝑛 + 𝑘 – 1) = (n + k – 1)!
𝑘 k!* (n – 1) !
*n = todos los elementos posibles mientras que k=los elementos que usamos.
*Factorial n! = n*(n-1)*(n-2)… hasta llegar al numero mínimo 1. Sino en calculadora coloco el numero, shift x -1
*Para saber problema de que es:
1. Si se toman todos los elementos o algunos
2. Importa el orden? Si importa es VARIACION. Si no importa el orden es COMBINACION
3. Hay repetición? Cálculos sin repetición se pueden hacer con calculadora.
- VARIACION: escribo el numero n, aprieto tecla shift y nPr, escribo numero k, =.
- COMBINACION: escribo el numero n, aprieto tecla nCr, escribo numero k, =.
*EXCEL:
 FACTORIAL: escribo en una fila/columna el numero x. En otra fila/columna, donde quiero x! voy a formulas, fact, y selecciono como numero la celda x
 COMBINACIONES: en celda nCr voy a formulas, COMBINAT, y selecciono como numero la celda n (numero total de elementos) y como tamaño la
celda k o r.
 VARIACIONES: en celda nPr voy a formulas, PERMUTACIONES, y selecciono como numero la celda n (numero total de elementos) y como tamaño la
celda k o r.
Regla de Laplace Sea un experimento aleatorio con un número finito de resultados posibles, y todos equiprobables, entonces la probabilidad
de que un suceso aleatorio A, ocurra, se calcula como el cociente entre el número de casos favorables en A y el número de todos los resultados
posibles del experimento
P (A) = número de casos favorables en A
números de casos posibles
Para aplicarlo todos los sucesos elementales deben tener la misma probabilidad (deben ser sucesos equiprobables). No se puede aplicar en
instrumentos irregulares, cuando los sucesos no son equiprobables.
*Ej con las bolas de diferente color. (C31 * C172) / C203 = probabilidad de que una de las tres bolas sea blanca (de las tres blancas disponibles uso 1 y de las 17
restantes de otros colores uso solo 2). Si a esto le sumo la probabilidad de que 2 bolas sean blancas y 1 de otro color(C 32 * C171) / C203 ) y luego de que 3 lo sean
(C33 * C170) / C203. La suma de todos estos casos son los casos favorables para A, en caso que me pregunte que AL MENOS UNA sea blanca
*Si me pide una o mas de un color y otras de otro en numerador multiplico la combinatoria de lo que use de c/color / denominador C 203 totales
*Casos posibles multiplico el total de cada cajón (si es que tengo dos); casos favorables (multiplico cantidades de cada color correspondiente y sumo R en caso
de tener mas de un color).
AXIOMAS DE LA PROBABILIDAD
1- La probabilidad para cualquier suceso A es mayor o igual que 0 y menor o igual que 1. 0 ≤ P(A) ≤ 1
2- La probabilidad del suceso seguro es 1. P(E) = 1
3- Si A y B son incompatibles, es decir AՈB = Ø entonces: P(A Ս B) = P(A) + P(B)
Propiedades de la probabilidad
 La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso contrario es: P (Â) = 1 − P (A)
 Probabilidad del suceso imposible es cero.P ∅ = 0
 La probabilidad de la unión de dos sucesos es la suma de sus probabilidades restándole la probabilidad de su intersección. P (A ∪ B)
= P (A) + P (B) − P (A ∩ B)
PROBABILIDAD CONDICIONAL: Para dos eventos cualesquiera A y B con P(B)>0, la probabilidad condicional de A dado que ocurrió B P(A/B), se
define con la ecuación:
P (A/ B) = P (AՈ B)
P (B)
Regla de la multiplicación De la definición de probabilidad condicional se obtiene el siguiente resultado

P (A/ B) = P (AՈ B) → P (AՈ B) = P (A/B) * P(B) P (B/ A) = P (A Ո B) → P (AՈ B) = P (B/A) * P(A)
P (B) P (A)
*NI uno ni otro, uso regla producto
Suceso elemental: Es cada uno de los elementos que forman parte del espacio muestral.
Suceso compuesto: Cualquier subconjunto de E con más de un resultado
Suceso seguro, S: está formado por todos los posibles resultados (es decir, por el espacio muestral). P(E)=1
Suceso imposible, Ø: es el que no tiene ningún elemento. Su probabilidad es 0
Sucesos compatibles: Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común.
Sucesos incompatibles: Dos sucesos, A y B, son incompatibles cuando no tienen ningún elemento en común
Sucesos mutuamente excluyentes: cuando no pueden suceder al mismo tiempo, y la suma de sus probabilidades individuales es la posibilidad
de que ocurra.
Suceso contrario o complementario: suceso contrario a A es otro suceso q se realiza cuando no se realiza A. Se denota por A′ o Â.
Sucesos independientes A ∩ B = P(A)* P(B) cuando A y B ocurren simultáneamente
P(A/B) = P(A) o P(B/A) = P(B)
P (complemento de ambos A ∪ B ) Si no ocurre ninguno de los dos eventos
P (A ∪ B) = 1- P(complemento de ambos A∪ B)
Si A y B son dos sucesos independientes, también lo son Ᾱ y B
Sucesos dependientes P(A/B) = [ P(A ∩ B)] / P(B) ) (A-B) cuando ocurre A y no B (A – A ∩ B)
P (A Ո B) = P (A/B) * P(B) (si surge de P(A/B) o P (B/A) * P(A) (Si surge de P(B/A) REGLA PRODUCTO
Suceso complementario P (Â) = 1 − P (A)
Sucesos incompatibles, A∩B=Φ
mutuamente excluyentes A ∪ B = P(A) + P(B)
P(A/B) = [ P(A ∩ B)] / P(B) = [ P(B/A) * P(A) ] / [P(B/A) * P(A)] BAYES
Denominador A cambiante, B mantiene; numerador P(a)*P(B) en cuestión).
Sucesos compatibles A ∪ B = P(A) + P(B) – P(A∩ B) ocurre A u ocurre B o ambos ocurren simultáneamente. Uno u otro. No excluyent
 P (A – B)= (A∩ complemento de B)= P(A) – P(A∩ B) ocurre cuando ocurre A y no ocurre B.
LEYES MORGAN:
A ∪ B (complemento de todo) = Ᾱ ∩ Ḃ El complementario de la unión es la intersección de los complementarios.
A ∩ B (complemento de ambos) = Ᾱ ∪ Ḃ El complemento de la intersección es la unión de los complementarios.
Diagramas de árbol útiles cuando el experimento de interés consiste en una secuencia de varias etapas. Para su
construcción se partirá poniendo una rama para cada una de las posibilidades, acompañada de su probabilidad (%
que representa del total, valor probabilidad/valor total). El final de cada rama parcial se constituye a su vez, en un
nudo del cual parten nuevas ramas, según las posibilidades del siguiente paso (-1 denominador siempre, -1
numerador en rama igual a la inicial y cantidad total posibilidad dos en numerador rama alternativa), salvo si el
nudo representa un posible final del experimento (nudo final) e inverso en rama opuesta. Hay que tener en cuenta:
que la suma de probabilidades de las ramas de cada nudo ha de dar 1. Ej 10 niños, 6 niñas.
Ley de la probabilidad total Sean 𝐴1, 𝐴2, … , 𝐴𝑘 eventos mutuamente excluyentes y

exhaustivos, incompatibles, entonces para cualquier otro evento B se cumple que:
P(B) = PROBABILIDAD TOTAL
Armo diagrama de árbol y hago la sumatoria de las probabilidades. Ej (que sea mujer
fumadora y no fumadora = P(F) * P(M/F) + P(Fcomplemento)* P(M/F complemento).
*Cuando me pide probabilidad de algo que se integre por muchos rubros (ej que haya
termino la carrera y sean muchas carreras) hago, la sumatoria de todas las
probabilidad que serian →∑ P (F/carrera) * P(carrera)
Teorema de Bayes El cálculo de probabilidades condicionales y probabilidades posteriores a partir de la ocurrencia de un suceso, ocupan un
lugar central en la probabilidad elemental; es una aplicación del teorema de la multiplicación y el teorema de la probabilidad total. Sean 𝐴1,
𝐴2, … , 𝐴𝑘 eventos mutuamente excluyentes y exhaustivos. Entonces para cualquier otro evento B para el cual P(B)>0,
*Aplico como Aj al elemento en denominador cambiante, B se mantiene. El diferencial es invertido al
planteado inicialmente (A/B) se convierte en P(B/A) PROBABILIDAD TOTAL.
*En numerador hago P(A)*P(B) PROBABILIDAD CONDICIONADA, MIRO EL ARBOL.
*Sabiendo que… (es mujer) calcule probabilidad de… (Sea fumador) P(F/M)
Independencia El cálculo de probabilidad condicional permite comparar la probabilidad que en principio se asigna al suceso A con la que luego
se asigna cuando se sabe que ocurrió el suceso B. El algunos casos la probabilidad de que ocurra A no se ve afectada si se sabe que ocurrió B. En
estos casos es natural pensar que los sucesos son independientes.
 Dos sucesos A y B son independientes si: P(A/B)=P(A)
Si dos sucesos A y B son independientes si y sólo si la probabilidad de su intersección es: P(A∩B)=P(A)*P(B) Este concepto se puede
ampliar a colecciones de más de dos sucesos, es decir Los sucesos 𝐴1, … , 𝐴𝑛 son mutuamente independientes si para todo k con k=2,
3, …, n y todo subconjunto de índices 𝑖1, 𝑖2, … , 𝑖𝑘:
𝑃 (𝐴𝑖1 ∩ 𝐴𝑖2 ∩ ⋯ ∩ )= 𝑃 (𝐴𝑖1 )* 𝑃 (𝐴𝑖2 )…* 𝑃 (𝐴𝑖𝑘)
 De lo contrario son dependientes.
UNIDAD 3
VARIABLE ALEATORIA (v.a.) es cualquier regla que atribuye un único número real a cada suceso elemental de E. Es una función cuyo dominio es
el espacio muestral y su codominio el conjunto de los número reales; se representa con letras mayúsculas X, Y, Z y se dejan letras minúsculas
para valores que puede tomar esa variable. 𝑋: 𝐸 → 𝐼𝑅,𝑡𝑎𝑙 𝑞𝑢𝑒 𝑋 𝑒 = 𝑥𝑒
Es una función real medible que asocia un valor numérico a cada resultado del espacio muestral asociado a un experimento aleatorio.
Herramienta matemática que permite pasar del estudio de sucesos aislados al estudio de las distribuciones de probabilidad; permite la
aplicación del análisis matemático y de otras herramientas para el estudio de situaciones de incertidumbre y es una pieza básica para el
desarrollo de los métodos y técnicas inferenciales.
*Sucesos elementales importa el orden (para calcular fmp considero todas las posibilidades), sucesos compuesto no importa orden.
VARIABLE ALEATORIA DISCRETA: sus valores posibles constituyen un conjunto discreto (si los valores posibles se ordenan, hay
Clasificaci una separación entre cada valor y el próximo).El conjunto de valores posibles podría ser infinito. Valores enteros. Número finito
ón de valores o infinito numerable.
 distribución de probabilidad o función masa de probabilidad (fmp ), mediante: → [0,1] ∶ 𝑝 (𝑥) = 𝑃 (𝑋 = 𝑥) = 𝑃 ({∀𝑒 ∈
𝐸, ∶ 𝑋 (𝑒) = 𝑥}) Es una función que a cada elemento de E, le asigna un número +o=0 y –o=1. Condiciones Si 𝑥1; 𝑥2; … ; 𝑥𝑘
son todos los valores posibles que puede toma la v.a. X, entonces para que sea una fmp legitima debe:
1. 𝑝 (𝑥𝑖 ) ≥ 0 ∀𝑖 = 1,2, … , 𝑘 “todos los valores asignados deben ser positivos”
2. ∑ k i=1 𝑝 (𝑥𝑖 ) = 1 “y sumados deben dar 1”
*En numerador va la cantidad de posibles resultados (ordenados que pueden surgir que de ese valor de x) y en denominador el
número total de posibles resultados que figura en el espacio muestral.
*Para armar valores X= debo considerar cantidad del valor considerado como x que aparece en cada opción (Agrupo opciones que
tengan iguales valores de X, sin importar el orden).
Ej: lanzan tres monedas normales y definen: X= “cantidad de caras en el tiro” e Y=“cantidad de caras menos cantidad de secas” 𝑋: 𝐸
→ 𝐼𝑁 𝑌: 𝐸 → 𝑍.𝐸spacio muestral = {𝐶𝐶𝐶; 𝐶𝐶𝑅; 𝑅𝑅𝐶; 𝐶𝑅𝐶; 𝐶𝑅𝑅; 𝑅𝑅𝑅; 𝑅𝐶𝑅; 𝑅𝐶𝐶}. Importa el orden en el espacio muestral.
X (𝐶𝐶𝐶 )= 3 𝑌 (𝐶𝐶𝐶) = 3
𝑋 (𝐶𝐶𝑅) = 𝑋 (𝐶𝑅𝐶) = 𝑋 (𝑅𝐶𝐶 )=2 𝑌 (𝐶𝐶𝑅) = 𝑌 (𝐶𝑅𝐶) = 𝑌 (𝑅𝐶𝐶) =1
𝑋 (𝑅𝑅𝐶) = 𝑋 (𝑅𝐶𝑅) = 𝑋 (𝑋𝑅𝑅) = 1 𝑌 (𝑅𝑅𝐶) = 𝑌 (𝑅𝐶𝑅) = 𝑌 (𝐶𝑅𝑅) = −1
𝑋 (𝑅𝑅𝑅) = 0 𝑌 (𝑅𝑅𝑅) = −3
𝑅𝑥 ={ 0; 1; 2; 3}. Fmp será: 𝑅𝑌 = {−3; −1; 1; 3}
x 0 1 2 3 Y -3 -1 1 3
P(x) 1/8 3/8 3/8 1/8 P(y) 1/8 3/8 3/8 1/8
 función de distribución acumulada (fda) o cdf para una v.a discreta X con fmp p(x) se define para todo número x
mediante:
F :𝑅→ [0,1] ∶𝐹(𝑥) = 𝑃 (𝑋 ≤ 𝑥) = 𝑃 ({∀𝑒 ∈ 𝐸, ∶ 𝑋(𝑒) ≤ 𝑥})
Propiedades:
 Es una función creciente: 𝑥1 < 𝑥2 ⟹ 𝐹 (𝑥1 ) < 𝐹 (𝑥2 )
 F es continua a derecha, esto es: lim 𝑥→𝑎+ 𝐹 (𝑥) = F (𝑎)
 Lim 𝑥→−ꚙ 𝐹 (𝑥) = 0
 Lim 𝑥→+ꚙ 𝐹 (𝑥) = 1
 Si a<b entonces P(a<𝑥 ≤ 𝑏) = F (𝑏) − 𝐹 (𝑎)
 𝑃 x > a = 1 − 𝐹 (a)
*Para sacar función de frecuencia acumulada de una fmp, armo función a trozos con los valores correspondientes
de la tabla, y voy sumando las respectivas frecuencias (Arranco desde valor 0 y el ultimo debe ser 1). Tener en
cuenta que siempre pongo ≤ (como primer signo), el segundo es <. A lo ultimo x≥…
*Si me pide calcular en base a fda una probabilidad puntual P(X=…) debo hacerla restando las frecuencias
anteriores, es decir f(x) – f(x-1)…
 Valor esperado, valor medio o esperanza de X E(X) ó 𝝁𝒙: es el centro de gravedad de

la función de probabilidad puntual, el punto de equilibrio del sistema; es una medida del
centro de la distribución; al tratarse de un promedio, el valor esperado puede tomar un
valor que la variable no. Sea X una v. a. discreta con un conjunto D de valores posibles y una fmp p(x). Se trata de un
promedio ponderado de los valores posibles de la variable donde las ponderaciones son las probabilidades de que tome
esos valores. Puede ocurrir que la suma no exista, entonces diremos que 𝐸 𝑋 no es finita. Es un indicador de la posición
de la distribución de la probabilidad.
En ejemplo anterior 𝜇𝑥 = 3 x=0 ∑ x * 𝑝 (𝑥)=0 = 0*1/8 +1*3/8 + 2*3/8 + 3*1/8 = 9
 Si la variable aleatoria X es discreta y toma valores 𝑥1;2; … entonces h(X) es discreta y toma valores 𝑦1;𝑦2; …
siendo 𝑦𝑖 = ℎ(𝑥𝑖) para al menos un valor de i.
 Si la v.a. X tiene función de probabilidad puntual p(x) para todo x ∈ RX , entonces la esperanza de cualquier
función real h(X), está dada, si la suma existe por:
Ej: En una droguería se vende ácido sulfúrico en bidones de 20, 30 y 50 litros. X= “tamaño del bidón que compra el
cliente”. función de probabilidad puntual de X es :
X 20 30 50
P(x) 0,1 0,5 0,4
precio de un bidón (Y) en función de su tamaño está dado por la siguiente fórmula: Y = h(X)= 10 X – 40. ¿Cuál es el
precio esperad E(Y)?
𝑥∈𝑅 ∑ h(x) * p(X) = 𝑥∈𝑅 ∑(10 x– 40). 𝑝(𝑥) = (10*20-40)*0,1+(10*30-40)*0,5+(1-*50-40)*0,4= 330
Propiedades:
o Una función de interés es una función lineal, h(X)) =a*X+b donde a y b son constantes reales, entonces: E(a*X
+ b) = a * E(X ) + b
o 𝐸 (𝑎*𝑋) = 𝑎* E(𝑋) Si a cada valor posible de X o multiplicamos por una constante, su valor esperado se ve
multiplicado por la misma constante.
o E (a+X) = a + E (X)
o 𝐸 (𝑏) = 𝑏 El valor esperado de una constante es la constante.
o La esperanza de la suma de esperanzas de x es igual a la suma de las esperanzas
o La experanza no puede ser menor que el minimo valor que toma x ni mayor que su valor máximo. Si a<=x <=b
entonces a<= E(x) <=b
2
 VARIANZA 𝑉 (𝑋) ó 𝜎𝑋 : medida de la variabilidad de una variable aleatoria alrededor de su esperanza. Sea X una v.a.
discreta con función de probabilidad puntual p(x) y esperanza μX , la varianza de X es:
=
 DESVIO ESTANDAR de X: 𝜎𝑋 = √ V (x)
Propiedades:
 𝑉 (𝑎*𝑋 + 𝑏) = 𝑎 2 *𝑉 (X)
 𝑉 (𝑎*𝑋) = 𝑎 2 *𝑉 (X) Si a los valores que toma una v.a. los multiplicamos por una contante, su varianza se ve
multiplicada por la constante al cuadrado
 V (b) = 0 La varianza de una constante es =0
 𝜎 (𝑎*𝑋+𝑏) = │ 𝑎 │* 𝜎𝑋
Parametro de fmp: Suponga que p(x) depende de una cantidad a la que se le puede asignar cualquiera de varios valores posibles,
donde cada valor diferente determina una distribución de probabilidades distinta. A esa cantidad se le llama parámetro de la
distribución. La colección de las distribuciones de probabilidad para diferentes valores del parámetro se llama familia de
distribuciones de probabilidad
𝑝𝑋(𝑥) = P(Ᾱ ∩ ⋯ ∩ Ᾱ ∩ A) = 𝑃 (Ᾱ) 𝑥−1 * 𝑃 (A) = (1 – 𝑝) 𝑥−1 * 𝑝

La cantidad 𝑝 es parámetro de la función de distribución. Así 𝑝 (𝑥) depende del valor considerado para 𝑝.
Principales leyes de distribución v.a discretas:
 Distribución Bernoulli: Se realiza un experimento una vez y se observa si cierto suceso ocurre o no, siendo 𝒑 la
probabilidad de que ocurra (éxito) y (𝟏 − 𝒑) la probabilidad de que no ocurra (fracaso). Este experimento puede ser
descrito por una variable aleatoria discreta (llamada de Bernoulli) que toma valores: 1 si el suceso ocurre y 0 si no
ocurre y que se denota 𝑋~(𝑝). Su fmp viene dada por:
el valor esperado de X es
justo la probabilidad de que
X tome el valor 1
 Distribución binominal: el experimento aleatorio se llamara binominal si satisface los siguientes requerimientos y es la
suma de n v.a. independientes de Bernoulli. Requerimientos:
- El experimento consiste de n pruebas, siendo n un número fijo.
- Las pruebas son idénticas, y en cada prueba hay sólo dos resultados posibles (siempre los mismos), éxito (E) y
fracaso (F)
- Las pruebas son independientes (resultado de una prueba no influye sobre el de las otras)
- La probabilidad de éxito (P(E)=p) se mantiene constante en todas las pruebas
Si X=“número de éxitos en las n repeticiones” decimos que X tiene una distribución binomial de parámetros n y p y se
denota: 𝑋~(𝑛, 𝑝) Donde n es el número de ensayos y p la probabilidad de éxito.
FMP
Se puede comprobar que k=0 n ∑ p (X) (k) = 1

FDA
[x] es la parte entera de x
𝑅𝑋 = 0; 1; 2; … ; 𝑛 𝐸 (𝑋) = 𝑛 *𝑝 𝑉 (𝑋) = 𝑛*𝑝* (1 –p)
EXCEL: Me paro en celda probabilidad y busco en fx (DISTRI. BINOM), aceptar. Se me abre ventana y selecciono en
probabilidad de éxito celda (x), en cantidad de ensayos celda (n), en probabilidad de éxito (p) y en acumulado
(acumulado). Aceptar. Arme calculador ahí.
*Si en ejercicio me aparece X< (debo sacar la probabilidad acumulada por lo que en celda donde dice acumulada pongo
el numero 1, donde Excel entiende que debe darme la frecuencia acumulada de probabilidad.
*Si en ejercicio me aparece X> (debo sacar la probabilidad acumulada) y se calcula haciendo 1- Frec acumulada (X-1)
por lo que en celda donde dice acumulada pongo el numero 1, donde Excel entiende que debe darme la frecuencia
acumulada de probabilidad y en X pongo el valor de (X-1) para saberlo y aplicarlo a la formula de 1-frec(x-1).
*Si aparece X= (debo sacar probabilidad puntual), dejo vacia la celda de acumulada o pongo el numero 0.
*Para armar calculador con valores generales de X me paro en celda P(X=x) y en primer fila busco fx DIST. BINOM y
selecciono como numero de éxitos a la x de mi fila, como ensayos a la n superior (y aprieto fn+F4 para que siempre
tome esa tecla), probabilidad de éxito es p superior (fn+F4 para fijarla) y en acumulado pongo 0.
*Para armar calculador con valores generales de X me paro en celda P(X ≤x) FREC ACUMULADA: selecciono primer celda
y pongo = (celda anterior en la fila), la celda debajo de esa misma columna va a ser = a la anterior + la nueva.
*SI ESTA B en mayúscula me pide la probabilidad binomial ACUMULADA.
Puedo ver frecuencias también en tablas donde n esta en columna lateral izquierda y el valor de p esta en filas a lo
largo de la hoja.
- X<= miro frecuencia acumulada (cambia si lo incluye=, o no lo hace)
- X> a miro frecuencia acumulada y hago 1-(FREC ACUMULADA HASTA A), en caso de incluirlo (>=) hago 1- FREC
ACUMULADA (A-1)
- X= a miro frecuencia acumulada y calculo FREC ACUMULADA A – FRECUANCIA ACUMULADA (A-1).
 Distribución de Poisson: Una v.a. X tiene una distribución de

Poisson de parámetro 𝝀, si su función de probabilidad puntual es:
Y se denota como 𝑋~𝑃 (𝝀). Donde parámetro 𝝀 representa la tasa
de ocurrencia o intensidad del proceso de algún fenómeno por
unidad de área o unidad de tiempo.
E (X) = 𝝀 V(x) = 𝝀
Este tipo de distribución se aplica a sucesos con probabilidad muy baja de ocurrir, y puede considerarse como la
distribución límite de una sucesión de variables binomiales donde 𝜆 = 𝑛. 𝑝 𝑦 𝑛 → ∞ y por lo tanto 𝑝 → 0. Cuando p es
pequeño y n grande se obtienen buenas aproximaciones utilizando la distribución de Poisson en lugar de la binomial.
Como regla empírica podemos utilizar: 𝑛 > 30, 𝑝 ≤ 0,01 y 𝑛*𝑝 ≤ 20 ⟹ 𝐵 𝑛; 𝑝 ⇁≅ 𝑃 (𝑛. 𝑝)
Proceso de Poisson: Bajo ciertas suposiciones, el número de eventos que tiene lugar durante un intervalo de longitud
fija 𝑡, tiene una distribución de Poisson con parámetro 𝛼𝑡. Cualquier proceso que tiene esta distribución se llama
proceso de Poisson, 𝛼 es la tasa del proceso. De forma que:
*En aplicación posibility distribution pongo, valor de landa, valor de x y el signo si es ≤ = o ≥

*Para x=n utilizo formula puntual [alpha e(=2,71)-ʎ * ʎx ] / x!
*Para x≤n = P (x=0) + P(x=1) + … P(x=n)
*Para x≥n = 1- [ P(x=0) + P (x=1) + … P (x= n-1)
*Para aproximación con binomial calculo ʎ= x*p. Y luego resuelvo con Poisson
*En proceso Poisson 𝛼 es la cantidad de u por intervalo 𝑡 de tiempo (Si me da hora la tomo como entero 1).
Variable aleatoria continua: los valores posibles siempre están contenidos en un intervalo de la recta real; son todos los puntos
entre 2números. Número infinito no numerable de valores, intervalo.
 función de densidad (fdp) f(x) o de densidad de probabilidad de X (𝑓𝑋 ) , verifica que para todo a y b, y 𝑎 ≤ 𝑏:
P ( a≤ X ≤ b ) = a ∫ b 𝑓𝑋 (x) dx
Propiedades Para que una función f (x) sea una función de densidad, debe satisfacer:
1. 𝑓(𝑋 )≥ 0 xR Que la imagen no proporcione imágenes negativas
2. -ꚙ ∫ +ꚙ 𝑓𝑋 (x) dx = 1 Area por debajo de la curva y encima de eje x debe ser igual a la unidad.
*𝑓 (𝑥𝑖) no es una probabilidad, de hecho puede ser mayor que 1. Es simplemente el valor de una función en un punto.
*P(X=a) = P ( a≤ X ≤ a ) = a ∫ a 𝑓𝑋 (x) dx = F(a) – F (a) = 0 aR
*la probabilidad de q X tome un valor en el intervalo [a, b] es el área bajo la curva f (x) entre a y b, su integral definida
*Si me da P(x≥a) planteo la integral desde a hasta infinito (veo si la x esta restringida entre dos números sera desde a hasta el numero
del extremo superior según el rango de la función a trozos planteada.
*Si me pide P(x<a) planteo integral en base al rango definido en la función a trozos, si ocupa dos funciones (porque esta dentro de dos
rangos el intervalo que me solicita hago la sumatoria de las integrales), cada una definida partiendo desde - ꚙ la primera hasta que
finaliza el primer rango, y la segunda partiendo desde el primer rango (donde finalice la anterior) hasta donde me lo solicita.
*Si me pide hallar valor de a para que sea fdp hago la integral definida en el rango dado y debe darme 1, resuelvo tratando a “a”
como una constante, extrayéndola de la integral.
 función de distribución acumulada (fda) F(x) : se define xR, como:

F (x) = P (X≤ x) = -ꚙ ∫ x f (t) dt
Propiedades:
1- aR, FX (x)  [0,1]
2- FX (x) es monótona no decreciente, es decir que si x1 < x2 → FX (x1) ≤ FX (x2)
3- FX (x) es continua en todo punto
4- Lim x→ -ꚙ F(x) = 0 y Lim x→ +ꚙ F(x) = 1
5- sean a y b tales que a ≤ b , entonces:
 P(a ≤ X ≤ b) = P(a < X ≤ b) = P (a ≤ X < b) = P (a < X < b) = F (b) – F (a)
 P (X ≥ a) = 1 – P (X ≤ a) = 1 – F(a) (se usa tambien cuando P (X>a))
En todo punto donde (𝑥) “acumulada” es derivable 𝐹´ 𝑥 (De la acumulada) = (𝑥) (fdp), mismo rango.
*Si me da función a trozos con rango de x entre dos variables hago la integral definida desde a (extremo inferior) hasta
x de la función dada con variable t * dt, es decir, a∫ x f (t) dt, (si rango es de 0 a 1, hago integral desde o hasta 1);
resuelvo y planteo función a trozos donde sera 0 si x<a (puede ser ≤ en caso que en rango de enunciado no lo incluya) ,
el resultado obtenido si a≤x≤b, (si en rango de enunciado incluye los números uso el signo ≤) y 1 si x>b (si lo incluyo en
rango de enunciado uso asi, si no lo incluye uso ≥)
* mediana de una variable continua, X, como el punto x˜ tal que Facum(x) = 0.5. Planteo y despejo x.
 Percentiles de una distribución continua : Sea X una v.a. continua con función de densidad 𝑓 (𝑥) y función de
distribución acumulada F(𝑥) y sea 0 < 𝑝 < 1, el percentil 100 p-ésimo de la distribución de X es el valor x p tal que:
F (xp) = P (X ≤ xp) = -ꚙ ∫ x(sub p) f(t) dt = p
Facumulada (x p ) = p Planteo y luego despejo xp
es el valor de la variable que deja a su izquierda un área p, y a su derecha un área 1-p
*Uso como base la función de distribución acumulada F(x) y reemplazo p por el percentil que me solicite encontrar, una
vez planteado todo despejo x para saber el valor (el percentil que me pida lo escribo como 0,… ya que son porcentajes y
el valor obtenido es el valor de distribución que deja a su izquierda una probabilidad del o,…% pedido en el ejercicio y a
su derecha el importe restante para llegar a 1).
*Si me pide calcular percentil de distribución normal estándar puede hacerlo de dos maneras:
 Con tabla y busco el numero entre todos los posibles resultados que me marque el percentil solicitado (o el
mas cercano tomo).Y el resultado buscado será el numero de esa fila encontrada que figura en la columna
izquierda (Valor de z) y el decimal que se encuentre en la parte superior de esa columna seleccionada.
 Con Excel: en celda busc fx “DISTR.NORM.ESTAND.INV”, me pide probabilidad y escribo percentil buscado 0,…
*Tener en cuenta si es percentil 91 escribo 0,91; si es percentil 9 escribo 0,09
 Esperanza o valor esperado o valor medio E(X) o 𝝁𝒙 :

E(X) = 𝝁𝒙 = -ꚙ ∫ +ꚙ x * f(x) dx
*Si integral es ꚙ, la esperanza no puede definirse y decimos 𝐸 (𝑋) no existe.
*Recorrido de la integral viene dado por el intervalo de la variable.
*Aplico formula y sumo integral definida en todos los rangos que me aparezcan en función a trozos.
Proposición: Si la v.a. continua X tiene función de densidad f(x), la E(X) de cualquier función real h(X), está dada por:
E( h (X) ) -ꚙ ∫ +ꚙ h (x) * f(x) dx
Propiedades:
o Si a y b son constantes reales, entonces: E(a*X + b) = a * E(X ) + b
o 𝐸 (𝑎*𝑋) = 𝑎* E(𝑋) Si a cada valor posible de X o multiplicamos por una constante, su valor esperado se ve
multiplicado por la misma constante.
o E (a+X) = a + E (X)
o 𝐸 (𝑏) = 𝑏 El valor esperado de una constante es la constante.
o La esperanza de la suma de esperanzas de x es igual a la suma de las esperanzas
o La esperanza no puede ser menor que el mínimo valor que toma x ni mayor que su valor máximo. Si a<=x <=b
entonces a<= E(x) <=b
 Varianza:
V (X) = 𝜎2X = -ꚙ ∫ +ꚙ (x – 𝝁𝒙) 2 * f(x) dx = E [ (X - 𝝁𝒙) 2 = E (X2) – [ E (X) ] 2
V (x) = -ꚙ ∫ +ꚙ x2 * f(x) dx – 𝝁2 𝝁2 resto solo una vez a lo ultimo
DESVIO ESTANDAR 𝜎X = √V ( X )
Propiedades:
 𝑉 (𝑎*𝑋 + 𝑏) = 𝑎 2 *𝑉 (X)
 𝑉 (𝑎*𝑋) = 𝑎 2 *𝑉 (X) Si a los valores que toma una v.a. los multiplicamos por una contante, su varianza se ve
multiplicada por la constante al cuadrado
 V (b) = 0 La varianza de una constante es =0
 𝜎 (𝑎*𝑋+𝑏) = │ 𝑎 │* 𝜎𝑋
Principales leyes de distribución v.a discretas
 Distribución Uniforme: Se dice que X , tiene distribución Uniforme en el intervalo, [𝑎; 𝑏] , 𝑋~𝑈 (𝑎, 𝑏), si su función de
densidad es (la densidad es constante sobre el intervalo [ 𝑎; 𝑏] y 0 fuera de él. a y b son los parámetros de la
distribución):
o función de distribución acumulada, fda:
o E (X) = (a + b) /2
o V (X) = (a- b) 2 / 12
 Distribución Normal: X ~ N (𝜇 , 𝜎2 ) Se dice que X tiene distribución Normal de parámetros 𝜇 y 𝜎 2 (𝜇∈R y 𝜎 > 0 ) si su
función de densidad es
* 𝑓 (𝑥, 𝜇, 𝜎) ≥ 0
*-ꚙ ∫ +ꚙ f (𝑥, 𝜇, 𝜎) dx = 1
o E(X) = -ꚙ ∫ +ꚙ x * f(𝑥, 𝜇, 𝜎) dx = 𝝁
o V (X) = -ꚙ ∫ +ꚙ (x – 𝝁x) 2 * f (𝑥, 𝜇, 𝜎) dx = 𝜎2
los parámetros de la distribución son la media y la varianza
 Distribucion normal estándar Z~𝑁 (0; 1): distribución normal con parámetros 𝜇 = 0 y 𝜎 2 = 1.
Función de densidad función de distribución de probabilidad
Zα , denota el valor en el eje de medición para el cual el área bajo la curva de z que se encuentra a la derecha de Zα
vale α
 P (Z≤z) siempre que z dado sea positivo, uso tabla de distribución normal (z lo busco en columna
izquierda, entero + 1 decimal) y en demás columnas busco los demás 0,0… decimales, para que me de
el resultado del area de la integral ya. Tabla puedo usarla siempre que distribución normal sea (0,1)
 P (Z> z) area por encima de un valor positivo = 1 - P (Z≤z)
 P(Z> -z) area por encima de un valor negativo = P (Z≤z) Para calcular cambio signo y símbolo a opuestos.
 P (Z≤ -z) area por debajo de un valor negativo = P (Z> z) cambie signo y símbolo opuesto= 1 - P (Z≤z)
 P ( z1 < Z ≤ z2 ) = P (Z≤z2) - P (Z≤z1)
*Si me pide buscar el Z de Ⴛ (Dandome el valor de Ⴛ) hago: 1- Ⴛ= A.
 Con tabla: Busco A en los resultados de la tabla de distribución normal y el resultado buscado será el numero
que se encuentre en la columna izquierda (Z) de la fila con el resultado seleccionado + el decimal que figura
en la parte superior de la columna donde esta el resultado seleccionado.
 Con Excel: uso calculador de percentiles de distribución normal estándar, y escribo el resultado de 1- Ⴛ como
si buscara ese percentil.
 Distribución normal no estándar: Cuando X ~ N (media , desviaicion tipica𝜎 2 ) no son (0,1), las probabilidades se
calculan mediante “estandarización”. La variable estandarizada es
Z = X – 𝝁 (media) transformo en distirbucion normal estandar→ 𝑍~𝑁 (0,1)
𝜎 (Desviacion típica)
Al restar 𝝁 se desplaza la media a cero y al dividir por 𝝈 se modifica la escala de la variable de modo que la desviación
estándar es 1. Así, 𝑃 𝑎 < 𝑋 < 𝑏 = Φ (𝑏 – 𝝁 ) – Φ (𝑎 – 𝜇)
𝜎 𝜎
*Debo TIPIFICAR: transformar la variable de nuestro ejercicio en su equivalente en una distribución N(0,1)
estándar, para poder usar la tabla para su resolución. Aplico fórmula para calcular z ((x de mi ejercicio – media)/
desviación típica)
 P (Z≤z) siempre que z dado sea positivo, uso tabla de distribución normal (z lo busco en columna
izquierda, entero + 1 decimal) y en demás columnas busco los demás 0,0… decimales, para que me de
el resultado del area de la integral ya. Tabla puedo usarla siempre que distribución normal sea (0,1)
 P (Z> z) area por encima de un valor positivo = 1 - P (Z≤z)
 P(Z> -z) area por encima de un valor negativo = P (Z≤z) Para calcular cambio signo y símbolo a opuestos.
 P (Z≤ -z) area por debajo de un valor negativo = P (Z> z) cambie signo y símbolo opuesto= 1 - P (Z≤z)
 P ( z1 < Z ≤ z2 ) = P (Z≤z2) - P (Z≤z1) (Tipifico los dos valores).
*Si por el contrario me da el valor del porcentaje ya calculado debo destipificar: busco en tabla de distribución normal el resultado de
ese porcentaje 0,… o lo mas aproximado y de ahí obtengo el valor de Z (enteros mas decimales), aplico la formula con el valor de z y
esta vez despejo x.*Media y mediana coinciden
 Distribucion chi-cuadrado: se usa para calcular V(X) de una población normalmente distribuida. Su forma depende de
un solo parámetro que se llama “grados de libertad” (v) (nu). Toma valores del 0 a + ꚙ (a medida que ↑v (se hace mas
simetrica, aunque no lo es). X ~X2v (siendo v los grados de libertad).
E(X) = v (grados de libertad)
V (X) = 2*v (grados de libertad)
X2 a;v = me pide el numero sobre el eje de medición que deja a su derecha y debajo de la curva x2 con v grados de
libertad, una superficie de valor Ⴛ. Superficie de izquieda la calculo como 1-Ⴛ
 En Excel: fx y busco “INV.CHICUAD.CD”, en probabilidad va Ⴛ y en otro cuadrante los grados de libertad
*En tabla chi cuadrado veo el resultado que me solicitan al pedirme X2 a;v , debo buscar el v (grados de libertad) en la
columna izquierda y el Ⴛ en la fila superior (ya aparecen como 0,….); de esta forma la matriz me dara el resultado
correspondiente.
P (a ≤ X ≤ b ) siendo V=c :
 Primero miro en tabla chi cuadrado y focalizo en la fila que tenga el valor de v que me da el ejercicio (c en
este caso). Busco en esa misma fila el valor “b” y el dato que saco es Ⴛ correspondiente a esa columna.
Luego busco en la misma fila el valor a y saco el dato correspondiente a Ⴛ de esa nueva columna. Y planteo
Ⴛ (recoelctado en a) - Ⴛ (Recolectado en b) = …
 Excel: fx y busco “distr.chi” en probabilidad pongo valor de a y en grados de libertad el valor de v. Hago el
mismo procedimiento con los valores de b y luego hago el alfa obtenido en a – el ala obtenido en b.
 Distribucion t-student: usada para estimar la media de una población normalmente distribuida cuando el tamaño de la
muestra es pequeño. Su forma depende del parámetro “grados de libertad” (v) T~t v
E(X) = 0
V (X) = v grados de libertad / (v -2)
Propiedades: su curva tiene forma de campana simetrica con su eje de simetría en 0; cuando aumentan los v disminuye
la dispersión de tv; a medida que aumentan los v la secuencia de campanas tiende a la de la curva normal estándar (por
eso a menudo la curva z se llama t con grado de libertad tendiendo a ꚙ)
t a;v = numero sobre el eje de medición que deja a su derecha y debajo de la curva t con v grados de libertad, una
superficie de valor Ⴛ.
- Si me pide calcular t que contenga el area central (z) con v= (c): toda el area bajo la curva debe darme 1,
sumatoria de los extremos del area central= 1-z
Cada extremo mide: sumatoria de extremos del area central/2
Miro tabla de t-student: en columna izquierda encuentro n, que son los grados de libertad v, fijo esa fila y busco en
margen superior el valor que obtuve en calculo anterior de lo que mide cada extremo.
Extremo superior = que extremo inferior → 1- (ext superior+ext inferior) = area central
Puedo hacerlo en Excel!
 Distribución exponencial 𝑋~ 𝐸𝑥𝑝 (ʎ) : X tiene una distribución exponencial con parámetro 𝜆 (𝜆 > 0) si la fdp de X es:
E(X) = 1/ 𝜆 fdp
V (X) = 1/ 𝜆2
Fda
*Si me dan como dato la esperanza, media. Planteo la formula y despejo ʎ
*alpha e en calculadora.
* P (X> x) = 1- P (X<x) = 1 – Facum(x) = 1- [1-e -ʎ*x]
*P ( a < X < b) = Facum (b) – Facum (a) = [1-e -ʎ*b] - [1-e -ʎ*a]
* Probabilidad de que dure b horas más dado que ya estuvo funcionando a horas, debe darme igual que P (x≥b)=
P (x≥ a + b/x ≥ a) = P (x≥ (a+b) Ո x≥a)
P (x≥a)
= P (x≥ (a+b) ) = 1 – F (a+b) = alpha e -ʎ*(a+b) = alpha e -ʎ*b
P (x≥a) 1- F(a) alpha e -ʎ*(a)
* falta de memoria “la duración que se espera tenga un objeto, no cambia influye en nada el tiempo que en la
actualidad se lleva usando”.
PROPIEDADES: se usa para modelar el tiempo entre la ocurrencia de dos eventos sucesivos, tal como llamadas en un
conmutador o llegada de clientes a un servicio; estén fuertemente relacionada con Poisson. Supongamos que la
ocurrencia de un evento sigue un proceso de Poisson con parámetro 𝜆. Entonces la distribución del tiempo transcurrido
entre dos eventos sucesivos, es una exponencial de parámetro . (Una variable aleatoria de Poisson cuenta el número
de éxitos en un intervalo de longitud t y una v. a. exponencial cuenta el tiempo transcurrido entre dos éxitos sucesivos).
Variable aleatoria geométrica: En un experimento binomial se satisfacen condiciones:
- El experimento consiste en n repeticiones de pruebas independientes, con n fijo.
- La probabilidad de éxito es constante en cada una de las pruebas.
- Cada prueba tiene dos resultados posibles.
Supongamos que ahora el experimento se repite en forma independiente y que el mismo se detiene cuando se logra el primer
éxito. En este caso el número de repeticiones no es fijo. Se dice entonces que X es una variable geométrica de parámetro p, y se
nota: X ~ G (p)
Si X es una v.a geométrica, cumple con las siguientes propiedades:
 Rx = N
 La función de probabilidad puntual es:
 La función de probabilidad acumulada es:

Para verificar que 𝑝𝑋𝑝 𝑥 es una fmp se puede demostrar que
 𝑝 ꚙ (x) ≥ 0 ∀𝑥 ∈ ℕ
 x=1 ꚙ ∑ 𝑝(X) = 1
E (X) = (1/p)
V (X) = (1-p)/p2
*𝑅𝑥 rango de la variable X: conjunto de todos los valores posibles de la v.a. X.
PROBABILIDAD CONDICIONAL:
P (A/ B) = P (AՈ B) = P (A<x<B)
P (B) P (B)
*Ver donde coinciden para la intersección, si me hace calcular valores mayores a (b) dado que B=x, el numerador ira P(x>A)
*Si aparece una “O” entre probabilidades (a<x<b) y el numero a>b hago P( Ⴛ=b) – P( Ⴛ=a) = 1-(resultado de cuenta anterior).
UNIDAD 4
VARIABLE DISCRETA
Análisis Conjunto de Variables aleatorias discretas: Variables aleatorias con distribución conjunta: interesarse + de1 v.a de un mismo espacio
muestral. La fmp conjunta de dos v.a. discretas X e Y describe cuánta probabilidad se coloca en cada par posible de valores (x; y)
 Función de masa de probabilidad conjunta para dos v.a. discretas: Sean X e Y dos v.a. definidas en el mismo espacio muestral E de
un experimento. p(x; y) para cada par de números (x;y) viene dada por:
𝑝 (𝑥; 𝑦) = 𝑃 (𝑋 = 𝑥 𝑦 𝑌 =y)
Debe darse:
 𝑝(𝑥; 𝑦) ≥ 0 para toda x;y tomar valores positivos o cero
 ∑𝑥 ∑𝑦 p(x;y) = 1 la suma de las probabilidades para todos los pares posibles deben ser 1
Tablas de doble entrada: si X toma los valores 𝑥1, 𝑥2, … , 𝑥𝑘 e Y toma los valores 𝑦1, 𝑦2, … , 𝑦m
X
Y
𝑦1 𝑦2 … 𝑦j … 𝑦m
𝑥1 𝑝(𝑥1; 𝑦1) 𝑝(𝑥1; 𝑦2) 𝑝(𝑥1; 𝑦j) 𝑝(𝑥1; 𝑦m)
𝑥2 𝑝(𝑥2; 𝑦1) 𝑝(𝑥2; 𝑦2) 𝑝(𝑥2; 𝑦j) 𝑝(𝑥2; 𝑦m)
…
𝑥I 𝑝(𝑥i; 𝑦j)
…
𝑥K 𝑝(𝑥k; 𝑦1) 𝑝(𝑥k; 𝑦m)

Hago casos favorables sobre casos totales. Si quiero saber el total de casos veo si es Combinación, Varciacion o permutación.
 Funciones masa de probabilidad marginal: Conocida la fmp conjunta de X e Y , puedo conocer las función de distribución marginal
de X y también la de Y. La fmp de una variable se obtiene de sumar p(x,y) en los valores de la otra variable y se representan:
Se llaman marginales xq se obtienen a los márgenes de la tabla de doble entrada (se plantea una fila como x donde iran los posibles
valores que toma la variable y la de abajo como p(x) donde ira en cada columna el valor correspondiente a la suma de la
columna/fila que le corresponda).
 Independencia: Dos v.a. son independientes si su fmp conjunta se obtiene con el producto de sus marginales; si para cada par de
valores x e y
𝑝 (𝑥; 𝑦) = 𝑝𝑥 (𝑥) * 𝑝𝑦 (𝑦)
Si esto no se satisface para todo par (𝑥; 𝑦) , entonces se dice que X e Y son dependientes.
 Distribuciones condicionales: Sean X e Y, dos v.a. discretas con fmp conjunta 𝑝(𝑥; 𝑦) y fdp marginales 𝑝𝑋 (𝑥) y 𝑝𝑌 (𝑥) , entonces para
cualquier valor x, de X para el cual 𝑝𝑋 (𝑥) > 0, la función de masa de probabilidad condicional de Y dado que 𝑿 = 𝒙 es:
 Valores esperados de dos v.a. discretas:

𝐸 (ℎ (𝑋; 𝑌)) = ∑𝑥∈𝑅𝑥 ∑𝑦∈𝑅𝑦 ℎ (𝑥; 𝑦) * 𝑝(𝑥; 𝑦) si X e Y son discretas
*Si me pide calcular esperanza de X hago: ∑x * P(x;y) y voy reemplazando la x por cada valor (y su correspondiente fila/columna de
valores de y).
Propiedad:
 𝐸 (𝑋 + 𝑌) = 𝐸 (𝑋) + 𝐸 (Y)
 Si X e Y son dos v.a. independientes y la (𝑋) y la (𝑌) existen, entonces: 𝐸 (𝑋. 𝑌) = 𝐸 (𝑋) . 𝐸 (Y)
 Covarianza: Cuando dos v.a. no son independientes, suele interesar evaluar cuán estrecha es la relación entre sí. En forma análoga a
la definición de varianza para una v.a. Se define la covarianza para dos v.a. X e Y.
Cov (X;Y) = 𝜎 xy = E [ (X – 𝜇X ) (Y – 𝜇Y )] = ∑∑ (X – 𝜇X ) (y – 𝜇Y ) p(x;y)
Donde 𝜇X = E(X) 𝜇Y = E(Y)
Siendo ni el valor de la frecuencia con que aparece ese par (1 vez, dos veces, etc).
 Si (𝑋; 𝑌) > 0 hay dependencia directa (covarianza positiva): a grandes valores de 𝑥 corresponden grandes valores de 𝑦.
 Si (𝑋; 𝑌) = 0 no existencia de una relación lineal entre las dos variables estudiadas.
 Si (𝑋; 𝑌) < 0 hay dependencia inversa (covarianza negativa), a grandes valores de 𝑥 corresponden pequeños valores de y.
Propiedades: Sean X e Y vs.as. y 𝑎, 𝑏 ∈ R
o 𝐶𝑜𝑣 (𝑋; 𝑎) = 0
o 𝐶𝑜𝑣 (𝑋; 𝑋) = 𝑉𝑎𝑟 (𝑋)
o 𝐶𝑜𝑣 (𝑎𝑋; 𝑏𝑌) = 𝑎. 𝑏. 𝐶𝑜𝑣 (𝑋; 𝑌)
o 𝐶𝑜𝑣 (𝑋 + 𝑎; 𝑌 + 𝑏) = 𝐶𝑜𝑣 (𝑋; 𝑌)
o Si X e Y son independientes 𝐶𝑜𝑣 (𝑋; 𝑌) = 0
o 𝐶𝑜𝑣 (𝑋; 𝑌) = 𝐸 (𝑋. 𝑌) − 𝐸 (𝑋)* 𝐸 (Y)
o Cov (X ; y1 + y 2) = Cov (X; y1) + Cov (X; y2)
 VARIANZA: Siendo ni la cantidad de veces que aparece ese valor, y N la cantidad de valores totales
para de la muestra x ; ẋ la media de x. De la misma manera puedo calcular la varianza de y, reemplazando cada valor de x por una y.
o Varianza de la suma de dos v.a: 𝑉 (𝑋 + 𝑌) = 𝑉 ( x)+ 𝑉 (𝑌) + 2. 𝑐𝑜𝑣(𝑋; 𝑌)
o Varianza de la resta de dos v.a: 𝑉 (𝑋 - 𝑌) = 𝑉 ( x)+ 𝑉 (𝑌) - 2. 𝑐𝑜𝑣(𝑋; 𝑌)
o Varianza de la suma o resta de v.a. independientes, cov=0: 𝑉 (𝑋 - +𝑌) = 𝑉 (𝑋 )+ 𝑉 (𝑌)
*Si las variables son independientes, para saber la varianza total sumo los valores, si las variables NO son independientes (son dependientes)
debo usar la formula (en caso que sean 3 variables) =
V(x) = V(x1) + V (x2; x3) + 2 * Cov (x1 ; x2 + x3)
V(x) = V(x1) + [ V (x2) + V (x3) + 2 * Cov (x2;x3) ] + [ 2 * [ Cov (x1 ; x2) + Cov (x1; x3) ]
 Coeficiente de correlación de Pearson entre dos v.a. X e Y:
Propiedades del p(x;y)

o Para dos vs.as. cualesquiera X e Y −1 ≤ 𝜌 (𝑋; 𝑌) ≤1
o Si X e Y son vs.as. Independientes, 𝜌 = 0, pero 𝜌 = 0 no implica independencia.
o 𝜌 =1 ó 𝜌= − 1 sí y sólo sí, 𝑌 = 𝑎𝑋 + 𝑏 para algunos números a y b con a ≠0
o ρ es una medida del grado de relación lineal entre X e Y.
• Un |ρ|=1 indica una relación lineal perfecta.
• Un |ρ|<1 indica que la relación no es completamente lineal
• Cuando p=0 variables no estan correlacionadas.
√r
COEFICIENTE DE CORRELACION: 2
o Covarianza en numerador y desviación típica debajo.
VARIABLE CONTINUA
 Función de masa de probabilidad conjunta para dos v.a. continuas : Sean X e Y dos v.a. continuas, entonces f(x, y) es la función de
densidad de probabilidad conjunta de X e Y, si para cualquier conjunto bidimensional A:
P [ ( x; y ) ∈ A] = ∫∫ f (x;y) dx dy
Debe darse:
 f(𝑥; 𝑦) ≥ 0 para toda x;y tomar valores positivos o cero
 -ꚙ∫+ꚙ -ꚙ∫+ꚙ f (x;y) dx dy) = 1 la suma de las probabilidades para todos los pares posibles deben ser 1
 Independencia: dos v.a. continua son independientes, si su fdp conjunta se obtiene con el producto de sus marginales.
𝑓(𝑥; 𝑦) = 𝑓𝑥 (𝑥) * 𝑓𝑦 (𝑦)
 Valores esperados de dos v.a.: Si X e Y son dos v.a. independientes y la (𝑋) y la (𝑌) existen, entonces: 𝐸 (𝑋. 𝑌) = 𝐸 (𝑋) . 𝐸 (Y)
Regresion lineal simple:

1- Realizar grafica de dispersión (nube de puntos) de los datos observados. Para cada par ( 𝑥; 𝑦)observado se representa un punto en el
sistema cartesiano. El valor de la variable independiente X (variable regresora) , lo determina el investigador en función de su
problemática, y la variable dependiente Y es una v.a. que se quiere investigar.
o ↑X ↑Y o ↓X↓Y relación directa para dos variables dependientes (sigue determinada línea)
o ↑X↓Y o ↓X↑Y relación inversa para dos variables dependientes (sigue determinada línea)
o Si hay nube dispersa y no se puede seguir correlación, no hay relación.
o En Excell, inserto datos, pongo una columa de x y otra de y, los selecciono y pongo insertar grafico de dispersión. Selecciono
algún punto del grafico, Click derecho, agregar línea de tendencia tipo LINEAL, selecciono presentar ecuación en el grafico y
directamente me da la recta de regresión correspondiente.
2- Busco el punto medio (la media) de x(sumatoria de todos los valores de x/ cantidad de valores que puede tomar x) y la media de y
(sumatoria de todos los valores de y/cantidad de valores que puede tomar y), uno ambos puntos y obtengo el “punto de gravedad”.
Rectas de regresión (Requisitos):
o Pasan por el centro de gravedad G(ẋ;ẏ) (media de x y media de y)
o La suma de los cuadrados de las distancias (Verticales u horizontales) a los puntos es minima.
3- Ecuación de la recta de regresión:
o Parte de ecuación punto pendiente: y – p y = m * ( x – p x ) Siendo (px, py ) las coordenadas de un punto que pasa por la
recta, y m seria la pendiente. (Si calculo centro de gravedad ya puedo ponerlo dentro de formula. Entonces: y – ẏ= m * ( x –
ẋ).
m = 𝜎 xy (covarianza) Reemplazo por m en formula y obtengo la formula de la RECTA DE y – ẏ= 𝜎 xy * ( x – ẋ)
𝜎 x2 (varianza de x) REGRESION DE Y SOBRE X→ 𝜎 x2
Se calculan distancias (minimiza) verticales de c/punto a recta
RECTA DE REGRESION DE X SOBRE Y→ x – ẋ= 𝜎 xy * ( y – ẏ)
Despejo x . 𝜎 y2
Calculadora para regresión lineal:
o Borro todo lo que este almacenado. Shift + CLR + 3 (All) + =
o Mode + 3 (Reg) + 1 (Lin)
o Ya puedo ingresar el valor de cada uno de los pares ordenados (Primero los valores de la variable
independiente X, aprieto la coma, y luego los valores de la variable dependiente y). Aperito M+ después
de cada par que ingreso, cuando termino aprieto AC.
o Shift 2 (me da opción de calcular el promedio de los valores de x (la media de x), el desvio estándar de x
si trabajo con población, y el desvio estándar de x si trabajo con una muestra, si me muevo a la derecha
me aparecen las mismas opciones de y, mas a la derecha me aparece el valor de la ordenada de origen
de la recta de regresión de Y sobre X “A”, el valor de la pendiente de la recta de regresión de Y sobre X
“B” y el valor del coeficiente de correlacion “r”) Selecciono el numero que quiera y aprieto =.
Uso Calculador para sacar covarianza y poder hacer la recta de regresión de x sobre y
Para obtener recta de regresión Y sobre X, ingreso datos al revés en calculadora.
Modelo probabilístico líneal: da por hecho que el valor esperado de Y es una función lineal de X, pero que para una x fija la variable Y difiere de
su valor esperado por una cantidad aleatoria. Esto es:
𝑌 = 𝛼 + β𝑥 + ε
Donde ε=error aleatorio y se supone que 𝜀~(0; 𝜎 2) Sin 𝜀,
cualquier par observado caería sobre la recta de
regresión “verdadera” o poblacional.
Estimación de los parámetros del modelo (𝜶 𝒚 𝜷):
investigador nunca conocerá valores de 𝛼, 𝛽 𝑦 𝜎 2 , sólo
dispondrá de n observaciones muestrales. A partir de
ellas deberá estimar los parámetros y con ellos la recta
de regresión verdadera. Si se considera que las
observaciones se obtuvieron de manera independiente el
valor “y” observado es una v.a., y de acuerdo con el
modelo los puntos observados se distribuirán respecto a
la recta verdadera de manera aleatoria
Principio de los mínimos cuadrados: la recta tendrá un “buen ajuste” si minimiza el error entre los puntos estimados en la recta y los
puntos observados reales que se utilizaron para trazarla. Principio:
o La diferencia vertical entre el punto observado y la recta viene dado por: 𝑒𝑖 = 𝑦𝑖 – (𝐴 + 𝐵𝑥𝑖 )
o La suma de los errores elevados al cuadrado: 𝑓 (𝐴; 𝐵) = 𝑖=1 𝑛 ∑ [𝑦𝑖 –( 𝐴 + 𝐵𝑥𝑖)] 2
o Las estimaciones puntuales de 𝛼 y 𝛽, que se denotan â= 𝐴, y 𝛽^ = 𝐵 serán los valores que minimizan 𝑓 (𝐴; 𝐵) . Entonces la
recta de regresión de mínimos cuadrados será:
Ŷ = â + 𝛽^𝑥 = 𝐴 + 𝐵𝑥
El ^ indica que se trata de un valor estimado
Para minimizar a 𝑓 (𝐴; 𝐵) debemos cacular las derivadas parciales e igualarlas a cero:
Desarrollando este sistema se obtienen las siguientes ecuaciones conocidas como ecuaciones normales
Error estándar de la estimación (Se)Para medir la confiabilidad de la ecuación de estimación.
Similar a la desviación estándar, ambas son medidas de dispersión. El error estándar de la estimación, mide la variabilidad, o
dispersión, de los valores observados alrededor de la recta de regresión.
Coeficiente de determinación: Una vez ajustada la recta de regresión a la nube de observaciones; disponer de una medida que mida
la bondad del ajuste realizado, y que permita decidir si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como
medida de bondad del ajuste se utiliza el coeficiente de determinación, definido como
o No tiene unidades, es coeficiente

o -1 ≤ r ≤1
SI r esta próximo a 1, significa que tiene una correlacion directa fuerte
SI r esta próximo a -1, significa que tiene una correlacion inversa fuerte
Si r= 1 o r=-1 tiene una correlacion funcional.
Si r es cercano a 0 no existe correlacion lineal
mide la proporción de variabilidad total de la variable dependiente ( 𝒚) respecto a su media que es explicada por el modelo de
regresión. Cuanto mayor sea el valor de 𝑟2 , más exitoso es el modelo de regresión lineal simple en explicar la variación de y. Es usual
expresar esta medida %. En el caso particular de un modelo de regresión lineal entre dos variables, es numéricamente igual al
coeficiente de correlación muestral elevado al cuadrado:
*Si me pide proporción de variación de variable que es explicada por modelo de regresión, hago r 2 x100 para sacar porcentaje.
*Si me pide desvio estándar (de tres variables) para un dia particular , calculo varianza general = (precio*desvio estándar X 1 + p*Ⴛ X2 +..) y hago raiz
Desvío estándar = √ VARIANZA → Varianza = Desvio estándar 2
EXCEL: DATOS→ ANALISIS DE DATOS → REGRESION → ENTRO DATOS COLUMNA Y, Y EN OTRA DATOS COLUMNA X, RANGO DE SALIDA SELECCIONO CELDA
DONDE QUIERO INFO. Me calcula coeficiente de correlacion, determinación, error típico (Estandar)
UNIDAD 5
Muestra aleatoria simple Se dice que las vs.as. 𝑋1, 𝑋2, … , 𝑋𝑛 forman una muestra aleatoria simple de tamaño n si:
 Las 𝑋𝑖 son v. a. independientes.
 Toda 𝑋𝑖 tienen la misma distribución de probabilidad
Suele anotarse que 𝑋1, 𝑋2, … , 𝑋𝑛 son iid (independientes e idénticamente distribuidas) Si el muestro es con reemplazo o a partir de una
población infinita, se cumplen estas condiciones.
Principios del muestreo aleatorio simple son la base de la inferencia estadística (del proceso de hacer inferencias acerca de poblaciones a partir
de información contenida en muestras).
Estadístico: cualquier cantidad cuyo valor se calcula a partir de los datos de la muestra; es una característica de una muestra; es una variable
aleatoria y se denota con una letra mayúscula. Se emplea la letra minúscula para representar el valor calculado u observado del estadístico. Ej
de estadístico: varianza muestral, varianza muestral, desviación estándar muestral, etc. Tiene asociada una distribución de probabilidades
“distribución de muestreo” que depende de la distribución de la población, tamaño de la muestra ymétodo de muestreo. Para obtener la
distribución de muestreo de un estadístico (nos dice como varia el estadístico en la muestra):
 Recurrir a reglas de probabilidad (siempre que estadístico sea una función simple de las X) o
 llevar a cabo experimentos de simulación: se utiliza cuando es difícil obtener algo utilizando las reglas de probabilidad; c/ayuda d pc;
se debe tener en cuenta: El estadístico de interés, la distribución poblacional, tamaño de la muestra (n), número de repeticiones (k).
Se simulan k muestras de tamaño n a partir de la distribución poblacional. Para cada muestra se calcula el valor del estadístico
deseado y se construye el histograma de los k valores calculados. El histograma proporciona la distribución de muestreo aproximada
del estadístico seleccionado. Cuanto más grande sea el valor de k, mejor será la aproximación.
 Valor esperado del promedio = valor esperado de la distribución de la cual provienen las observaciones.
 Varianza del promedio = varianza de la distribución de la cual provienen las observaciones sobre 2
 Valor esperado de la varianza = varianza de la distribución de la cual provienen las observaciones
X1 X2 P (X1; X2) Ẋ (MEDIA MUESTRAL)
Armo todos los posibles Como se supone que son (X1 + X2 ) / 2
pares que puedan surgir variables independientes,
de ambas combinaciones la probabilidad conjunta
de valores, importa el es el producto de sus
orden marginales.
Parámetro es una característica de una población.

Ley de los grandes números: teoremas que describen el comportamiento del promedio de una sucesión de variables aleatorias conforme
aumenta su número de ensayos. Prescriben condiciones para garantizar que dicho promedio converge al promedio de las esperanzas de las
variables aleatorias involucradas (valor esperado FINITO). Especifican la convergencia de formas distintas:
 Ley fuerte de los grandes números “Ley fuerte de Kolmogorov”: cuando más grande sea la muestra, el promedio muestral más se
acercará al valor de promedio poblacional. Sean 𝑋1,2, … , 𝑋𝑛 vs.as. con: E(Xi ) = μi , V(Xi ) = σi 2 todas finitas, y 𝑐𝑜𝑣 (𝑋𝑖 ; 𝑋𝑗) = 0 ∀ 𝑖 ≠ 𝑗
𝑖,𝑗𝜖𝑁
O si μi = μ (media poblacional, valor medio, esperado) ∀ 𝑖=1,…,n
Ctp= convergencia en caso todo punto
Ẋ= media muestral
 Ley débil de los grandes números: si S es una v.a. con valor esperado E(S) = μ y Varaianza (S) = 𝞼2 < ꚙ, entonces para ϵ > 0
P ( | S – μ | > ϵ ) ≤ (𝞼2 / ϵ 2) Sea Sn = (1/n) * ni=1 ∑ Xi P ( | 1/n * ni=1 ∑ Xi – μ | > ϵ ) ≤ (𝞼2 / n*ϵ 2) → 0
E (Sn) = μ → Es decir que
Var (Sn) = (𝞼2 / n ) (1/n) * * ni=1 ∑ Xi posibilidadn→ꚙ = μ
 Teorema central del limite (TCL): asegura que la distribución de muestreo de la media se aproxima a la normal al incrementarse el
tamaño de la muestra; permite usar estadísticas de muestras para hacer inferencias con respecto a los parámetros de población, sin
saber sobre la forma de la distribución de esa población más que lo que podamos obtener de la muestra.
Sean 𝑋1, 𝑋2, … , 𝑋𝑛 v.a. iid con E(X) = μ y V(X) = σ2 ambas finitas, entonces si n>30. El tamaño
de muestra requerido para que la aproximación sea buena depende de la forma de la
distribución de las Xi. Mientras más simétrica y acampanada sea, más rápidamente se obtiene
una buena aproximación.
Ⴛ = desvio estándar poblacional Ẋ = media muestral
Suma de variables aleatorias: T= 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 donde 𝑋1, 𝑋2, … , 𝑋𝑛 son v.a. iid con E(X) = μ y
V(X) = σ2 ambas finitas, entonces si n es suficientemente grande
T = total de varibles aleatorias (X1 + X2 + …Xn)
La suma de n variables aleatorias de media μ y varianza 𝞼2, con la misma distribución, es aprox
igual (si n>30) a una distribución normal con media = n* μ y Varianza = n* 𝞼2
Ẋ = (𝑋1 + 𝑋2,+ … + 𝑋𝑛) / n
La media de n variables aleatorias de media μ y varianza 𝞼2, con la misma distribución, es aprox igual (si n>30) a una distribución
normal con media = m y Varianza = 𝞼2 / n
Aprox normal a distribución binomial: TLC puede usarse para justificar la aprox normal a la distribución binomial. 𝑋~𝐵 (𝑛, 𝑝) cuenta
el número de éxitos en n ensayos de éxito o fracaso independientes, y donde la probabilidad de éxito es p. TLC: si n es grande tanto la
suma (T) como el promedio (T/n) de las 𝑋𝑖 (que son iid) tienen distribuciones más o menos normales. Usando la aproximación cuando
𝒏. 𝒑 ≥ 𝟏𝟎 𝑦 𝒏. 𝟏 − 𝒑 ≥ 𝟏𝟎 se asegura que n es lo suficientemente grande para que sea buena
Aproximar T con Estandarizando
distribución normal
Aprox Ẋ c/distr normal Estandarizando
APLICACIÓN TCL cuando APLICACIÓN DE LA SUMA n>30 APLICACIÓN DE LA VARIANZA

Si población es normal Distribucion normal con parámetros de Distribucion chi cuadrado con (n-1) grado de
Si desconocemos la distribución de la distribución (esperanza del total = esperanza libertad. Se usa en intervalos de confianza.
población pero n>30 . Pero conocemos su de variable* tamaño de la muestra) ;
media 𝝁 y su varianza 𝞼2 (varianza = varianza de población * tamaño
de la muestra)
ẋ ~ N (𝝁 (esperanza = media poblacional) ;
𝞼2 varianza = (varianza poblacional / n
tamaño de muestra)
A medida que aumenta valor de n,

disminuye variabilidad.
Distribución de la media y la suma muestral: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria iid de una distribución con media μ y varianza σ 2 .
Entonces:
1- 𝐸 (Ẋ) = 𝜇Ẋ = 𝜇 Si T= 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛, entonces
2- 𝑉 (Ẋ) = 𝜎Ẋ 2 = 𝜎 2/ 𝑛 ⟹ 𝜎Ẋ= 𝜎 / √ n 1- 𝐸 (𝑇) = 𝑛*𝜇
2- 𝑉 (𝑇) = 𝑛*𝜎2 ⟹ 𝜎𝑇= √ n * 𝜎
Distribucion de la varianza muestral: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria iid de una distribución con media μ y varianza σ 2
(*3)
varianza muestral tiene distribución chi-cuadrada si la muestra proviene
de una población normal.
Distribución de Ẋ si la población es normal: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de una distribución normalmente
distribuida con media μ y desviación estándar σ. Entonces para cualquier n, Ẋ tiene una distribución normal con media μ y
desviación estándar 𝜎 /√ n . El prom muestral de una población normal, tiene distribución normal con esos parámetros
sin importar el tamaño de la muestra
P (a < Ẋ < b ) = P ( a – μ < Z < b – μ ) = φ (b – μ) - φ ( a – μ )

𝜎 de Ẋ 𝜎 de Ẋ 𝜎 de Ẋ 𝜎 de Ẋ
μ poblacional = μ muestral Ẋ~N ( μ; 𝜎/√ n)
𝜎 de Ẋ= 𝜎 (desviación típica poblacional ) /√ n
Si segundo valor de ecuación da negativo debo aplicar: φ (b – μ) - [ 1 - φ ( a – μ ) ]
√ 𝜎2 √ 𝜎2
DOS DIGITOS REDONDEO >5 SUMO.
Simbolos < = ≤ y >=≥
*Si me pide calcular n = (𝜎 dado * Z) 2 Siendo Z el valor de la tabla correspondiente a buscar el % q deba resultar.
a- μ Y a= importe que deba superar la media muestral
*P (Ẋ> a) = 1- P (Ẋ< a) = 1- P( Ẋ< a – μ ) = 1 – φ (a – μ ) MUESTRAL

𝜎/√ n 𝜎/√ n
*Si me pide P(X≥ a) = 1 - P(Ẋ ≤ a) = 1 - P(Ẋ ≤ Z) Debo calcular Z = (a – μ ) / 𝜎 1 entero no muestral

*Si me pide percentil: busco en tabla de distribución normal el valor z que corresponde al % percentil solicitado
(percentil/100 = 0,..). Y planteo Z = (X – MEDIA)/ 𝞼x →Y despejo X.
Distribución de 𝑿 si la población no es normal: Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de una distribución con media μ y
desviación estándar σ. TLC: si n>30, 𝑋 tiene una distribución “casi normal” con media μ y desviación estándar 𝜎/√ n .
Mientras más grande sea el valor de n, mejor será la aproximación.
Caso de población finita: TCL establece la distribución de muestreo de la media en
los casos de muestras aleatorias iid. (cuando el muestreo se hace con reemplazo o
se toman muestras de una población conceptualmente infinita), se debe corregir
la desviación estándar de la media por: Si muestra es con reemplazo se anula la
parte de la raíz.
*Si me pide probabilidad de que media muestral de la cantidad de muestras seleccionadas no difiera de la media real en mas de H importe:
 Calculo el desvio estándar de la media para poblaciones finitas 𝞼x
 P (-H/𝞼x < Z < H/𝞼x) = φ H/𝞼x - φ - H/𝞼x = φ H/𝞼x – 1 + φ - H/𝞼x =
UNIDAD 6
Inferencia estadística: trata de averiguar caractertisticas de una población a partor de una muestra de esta
Estimación: Un estimador es un estadístico de la muestra que se utiliza para estimar un parámetro de población. Una estimación es un valor
numérico específico para un estimador, que resulta de la muestra particular que se está observando
 Estimación puntual: un solo número q se utiliza p/estimar un parámetro de la población desconocido. Parámetro de interés 𝜃. El
objetivo es seleccionar un solo número, con base en los datos muestrales, que represente un valor sensible de 𝜃. El estadístico
seleccionado se llama estimador puntual de θ. Propiedades de estimadores:
Insesgamiento Se dice que un estimador puntual 𝜃ˆ es un estimador insesgado de 𝜃 si
estimador insesgado de 𝜃 si E(𝜃ˆ )=θ para todo valor posible de 𝜃
estimador sesgado Sesgo de 𝜃 ˆ= 𝐸 (𝜃ˆ) –𝜃
*Cuando X es una variable aleatoria binomial con parámetros n y p, la proporción muestral 𝑝 = X/n es un estimador insesgado de p
→ E (p) = E (X/n) = 1/n * E (X) = (1/n) * (n*p) = p
*Para saber si una función dada es insesgada o no planteo 𝜃 ˆ= (1/n) * ∑x = (1/n) * ∑sumatoria de números que
acompanan las x * parámetro a evaluar = si se cancela n con el numero obtenido de la sumatoria, el resultado es
1* 𝜃= 𝜃 y es insesgado.
* Sea 𝑥1, 𝑥2, … , 𝑥𝑛 una muestra aleatoria simple de una distribución normal con media μ y varianza 𝝈2 la media de la muestra (1)
es un estimador insesgado de μ y la varianza muestral (2)es un estimador insesgado de 𝝈2
MEDIA MUESTRAL VARIANZA MUESTRAL o 𝝈2/n
Eficiencia se refiere al tamaño de la varianza del estadístico. La eficiencia de un estimador insesgado es la razón entre la
mínima varianza posible de alcanzar y la varianza del estimador. Entre todos los estimadores insesgados se elige el
de menor varianza, se los conoce como estimadores insesgados de varianza mínima de θ
Consistencia Un estadístico es un estimador consistente de un parámetro de población θ si al aumentar el tamaño de la muestra,
se tiene casi la certeza de que el valor del estadístico 𝜃 se aproxima bastante al valor del parámetro poblacional.
lim 𝑛→∞ 𝑃 (|𝜃ˆ − 𝜃| > 𝜀 ) = 0
Si un estimador es consistente, se vuelve más confiable al tener tamaños de muestra más grandes. Condición
suficiente pero no necesaria para consistencia:
Suficiencia Un estimador es suficiente si utiliza toda la info acerca de θ que está contenida en la muestra. Dada X1 ,X2 , ...,Xn ,
una muestra aleatoria de una distribución f(x;θ), entonces T(X1 ,X2 ,...,Xn ), sin ser función de θ es un estadístico
suficiente para θ, si la distribución condicional de las Xi dado el valor de T, no depende de θ .
Se tienen n intentos de Bernoulli donde, p=probabilidad de éxito y T=número de éxitos en los 𝒏 intentos. Una vez
que conocemos T ⇒ 𝒑ˆ = 𝑻/ , no es posible obtener más información acerca de p, la otra info disponible es el orden
en que se dan los éxitos y fracasos.
‸
(arriba del signo) indica que se trata de un valor estimado; proporción d muestra se puede utilizar como estimador de la proporción de la población
Se calcula como probabilidad (numerador va la cantidad de números favorables en la muestra)/ (Denominador va la cantidad total de la población)
Si me pide estimación puntual de media o varianza es calcular la media o varianza muestral.
√ √
Error estándar de un estimado, ej de la media 𝜃ˆ es su desviación estándar 𝜎𝜃ˆ = V (θˆ )= σ 2/n Si el error estándar implica
parámetros desconocidos cuyos valores pueden ser estimados, la sustitución de estas estimaciones en 𝜎𝜃ˆ da el error o desvio
estándar estimado del estimador 𝜎ˆ𝜃ˆ o por 𝑠𝜃ˆ
El desvio/error estándar de la proporción es 𝜎ˆp =

√[ p∗( 1− p ) ]
n
Método de momentos: idea básica es poder igualar ciertas características muestrales a los valores esperados de la población
correspondiente. Luego resolviendo estas ecuaciones con valores de parámetros conocidos se obtienen los estimadores
Metodo de estimación de máxima verosimilitud: cuando tamaño de muestra es grande; calcular el valor del parámetro para el cual la
probabilidad de obtener esa muestra es la mas alta.
 Estimación por intervalo: es un rango de valores que se utiliza para estimar un parámetro de la población desconocido con un nivel
de confianza (grado de confiabilidad del intervalo). A +nivel de confianza +creencia de q el valor del parámetro que se está estimando
queda dentro del intervalo. Ancho del intervalo da info sobre precisión de una estimación de intervalo (nivel de confianza alto e
intervalo angosto= conocimiento del valor del parámetro es razonablemente preciso; amplio intervalo de confianza =existe
incertidumbre sobre el valor de lo que se está estimando)
Intervalo de confianza para μ: Se trata de encontrar dos
valores simetricos respecto de la media que abarquen entre
medio el % de nivel de confianza deseado. Se supone que las
observaciones muestrales reales x1 , x2 , . . . , xn son el
resultado de una muestra aleatoria X1 , . . . , Xn tomada de
una distribución normal con valor medio μ y desviación
estándar σ conocida. Como se trata de n observaciones
independientes la distribución de la media muestral es: 𝑋
~𝑁 (𝜇, 𝜎2/n)
α = nivel de significación (probabilidad de quedar fuera del
intervalo)
1-α = probabilidad de estar dentro del intervalo de confianza, % nivel de confianza (parte sombreada)
Z = (Ẋ - μ)/ (σ/√ n) para poder usar tabla de distribución normal estándar.
CASO 1
Si quiere construir intervalo tal que me den solo el % resultante (0,..).
P (a < (Ẋ - μ)/ (σ/√ n) < b) = 0,…
1- Planteo el % dado (0,…) como area central y hago 1-(0,…)= valor de ambos extremos/2 = valor de cada extremo alrededor
del area central.
2- Busco en tabla distribucion normal el resultado obtenido de hacer (Area central + extremo izq) y saco el respectivo Z y sus
decimales. Planteo (Extremos a y b seran = valor, signos opuestos), si es distribucion normal estandar (media=0, desvio
estandar =1) me queda formulado el intervalo de confianza entre las dos Z halladas). Si no es distribucion normal estandar
debo destipificar ambos extremos por separado (el + y el -) ya que puedo calcular la Z pero no la x, planteo:
Z= (x – μ) / σ → Despejo x = Z * σ + μ
P (-valor dado en tabla < (Ẋ - μ)/ (σ/√ n) < +valor dado en tabla) = 0,…
P (Ẋ -valor dado en tabla *(σ/√ n) < μ < Ẋ + valor dado en tabla * (σ/√ n)) = 0,…
Si me pide el intervalo que incluya la media de la poblacion un determinado %
1- 1-α = 0,… (% dado en ejercicio) → Despejo α = 0,… (% dado ejercicio) + 1
2- Z (α/2) = nivel de confianza. busco resultado obtenido de (α/2) en tabla distr. normal estandar (siempre lo tomo como valor
positivo) y obtengo Z con sus respectivos decimales.
3- Intervalo de confianza del 100(1 − 𝛼)% para la media μ población cuando se conoce el valor de σ viene dado por:
Armo intervalo con valores de media muestral, Z hallado y desvio estandar
muestral
Intervalo de Confianza = (Ẋ - ERROR ; Ẋ + ERROR)
Z (α/2) * (σ/√ n) = ERROR
A + tamano de n disminuye error

Si me pide calcular n para que error sea < 1 (Ej). Despejom en formula de error la |n| > [ ( σ/ ERROR numero dado)* Z (α/2) ]2
Si me pide calcular el nivel de confianza y me da como datos N, desvio estandar y el error, planteo la formula de error
para despejar y saber valor de Z (α/2) ; busco en tabla distribucon normal resultado para hallar el valor de Z correspondiente
(mismo valor en negativo llamemosle a y positivo llamemosle b). y planteo P (-a< Z < b) = P (Z<b) – P (Z< -a) = P (Z<b) – 1 +
P (Z< a) =
Si me pide determinar la media de muestra y el nivel de confianza, dandome como datos el intervalo de confianza, el desvio
estandar y la n (Cantidad de muestras tomadas): Para calcular la media muestral planteo (Lim superior IC+ Lim inf IC)/2
Para calcular el error= Lim superior IC – media muestral= Lim inf IC – media muestral. Planteo formula de error para
despejar valor de Z (α/2) busco en tabla distribucon normal resultado para hallar el valor de Z correspondiente (mismo valor
en negativo llamemosle a y positivo llamemosle b). y planteo P (-a< Z < b) = P (Z<b) – P (Z< -a) = P (Z<b) – 1 + P (Z< a)
(Si me pide lo mismo pero con proporcion es = formula pero en vez de Ẋ va p (casos favorables/proporcion total) y en vez de σ /√ n
va el desvio estándar de la proporción 𝜎ˆp =

√[ p∗( 1− p ) ]
n
*Si no se tiene buena idea de cual es la proporcion uso el valor p=0,5
El ancho de intervalo es 𝐰 = 𝑙𝑠𝑢𝑝 – 𝑙𝑖𝑛𝑓 = 2* 𝑧 (𝛼/2) * (𝜎/√ 𝑛)
*Si me pide que amplitud de intervalo no sea > b. Debo hacer b/2= c → significa que el ERROR calculado como [Z (α/2) * (σ/√ n)] debe
ser menor o igual que c. Planteo [Z (α/2) * (σ/√ n)] ≤ C → Despejo valor de N.
*Si me pide tamano de n para que q diferencia entre media muestral y media poblacional sea – que …, con determinado nivel de
confianza (0,…%), es lo mismo que si me solicitan que el ERROR sea ≤ … . Planteo formula de error con Z (α/2) siendo (α=1+%dado)/2,
busco Z correspondiente a ese resultado obtenido y reeemplazo datos. Despejo N en la formula.
Para un n fijo a mayor precisión (mayor nivel de confianza) mayor longitud del intervalo. Para un nivel de confianza fijo, podemos
“achicar” la longitud del intervalo aumentando el tamaño de la muestra (n). Entonces para garantizar un ancho de intervalo w con un
determinado nivel de confianza, despejamos n 𝑛 = (2*𝑧 (𝛼 /2) * (𝜎 /𝑤) )2
Los altos niveles de confianza producen intervalos amplios, de manera que sacrificamos la precisión para ganar en confianza. Los
intervalos estrechos tienen como resultado niveles de confianza bajos, de modo que sacrificamos confianza para ganar precisión
*Si me pide valor de n dándome el desvio estándar, el % del nivel de confianza y la media, planteo:
1- 1-α = 0,… (% dado en ejercicio) → Despejo α = 0,… (% dado ejercicio) + 1→ Z (α/2) = nivel de confianza. busco resultado
obtenido de (α/2) en tabla distr. normal estandar
2- Planteo n = (𝜎 * Z / μ)2
*Puede solicitarmelo tambien con la proporcion, y en ese caso en vez de desvio estandar pongo la proporcion.
CASO 2
Se supone que las observaciones muestrales reales x1 , x2 , . . . , xn son el resultado de una muestra aleatoria X1 , . . . , Xn tomada de
una distribución con valor medio μ y desviación estándar σ. Siempre que n sea grande el TLC nos dice que la distribución de la media
muestral es aproximadamente: 𝑋 ~𝑁 (𝜇, 𝜎2/ 𝑛). Para un n suficientemente grande el intervalo de confianza dado anteriormente
permanece válido
CASO 3
Sean las observaciones muestrales reales x1 , x2 , . . . , xn el resultado de una muestra aleatoria X1 , . . . , Xn tomada de una distr con
valor medio μ y desviación estándar σ desconocida. Siempre que n sea grande el TLC nos dice que la distribución de la media
muestral es aproximadamente: 𝑋 ~𝑁 (𝜇, 𝜎2/ 𝑛). La proposición que nos permite reemplazar σ con s (desviación estándar) para n
suficientemente grande
Si n es suficientemente grande, la variable estandarizada 𝑍 = (Ẋ − 𝜇)/ (𝑠/√ n ) Tiene
aproximadamente una distribución normal estándar. Esto implica que
Es un intervalo de confianza de muestra grande para μ con un nivel de confianza
aproximadamente igual a 100(1 − 𝛼)%. Esta fórmula es válida sin importar la forma
de la distribución de la población En general n>40 será suficiente.
DISTRIBUCION t: v.a. continua, usada para estimar media de población

normalmente distribuida cuando n es pequeño <30. Una distribución t está regida
por sólo un parámetro, llamado número de grados de libertad de la distribución (gl
o 𝝂). Propiedades, sea tv la curva de función de densidad para el gl v:
1- Cada curva tv tiene forma de campana y con su centro en 0, además esta
mas esparcida que la curva (z) normal estándar.
2- Conforme v se incrementa, la dispersión t v correspondiente disminuye.
3- A medida que v→ꚙ, la secuencia de curvas tv tiende a la curva normal estándar (curva z a menudo se llama curva t con
grado de libertad =ꚙ)
t ;v , valor crítico de t: número sobre el eje de medición que deja debajo de la curva t con v grados de libertad una superficie α=
valor del extremo derecho. Si me da tα;v busco el valor α en tabla en las columnas y la fila correspondiente a los gl especificados.
E (t) = 0 V (t) = v / (v-2)
CASO 4
Si las observaciones provienen de una muestra aleatoria tomada de una
distribución normal con valor medio μ y desviación estándar σ desconocida. Si
n es pequeño, entonces: T = (Ẋ − 𝝁)/ ( /√ n ). Tiene una distribución de
probabilidad t con n-1 grados de libertad. El intervalo de confianza del 100(1 − 𝛼)% para 𝝁 es:
Siendo s el desvió estándar.
1- Calculo tα/2 ; n-1 . Donde me enfoco en resultado de tabla de t student con (n cantidad muestra-1) grados de libertad (en
columna izq eso me da la fila correcta) y α= [ 1-% pedido (0,…0)] /2 busco en tabla, me dará columna correcta.
2- Planteo intervalo con todos los datos.
CASO 5
Intervalo de confianza para una proporción: Sea p la proporción de éxitos en una población, donde éxito identifica a un individuo u
objeto que tiene una propiedad específica. Se toma una muestra de n individuos y sea la v.a. X = número de éxitos en la muestra.
 Si n es pequeño comparado con el tamaño de la población, entonces 𝑿~𝐵𝑖 (𝑛, 𝑝) y 𝐸 (𝑋) = 𝑛. 𝑝 y 𝑉 (𝑋) = 𝑛*𝑝* ( 1 – 𝑝). Si
tanto n*p≥10 como 𝑛*(1 − 𝑝) ≥ 10, X tiene aprox distribución normal.
 Si n es grande se obtiene el siguiente intervalo de confianza para 𝒑 con un nivel de confianza del (1 − 𝛼)%
Intervalos de confianza unilaterales:los intervalos de confianza unilaterales para un nivel de confianza 1 − 𝛼 se obtienen reemplazando 𝒛𝜶 /𝟐 por
𝒛𝜶 ó 𝒕𝜶/𝟐,𝒏−𝟏 por 𝒕𝜶;𝒏−𝟏 según sea el caso.
Un límite de confianza superior de una Un límite de confianza inferior de una
muestra grande para 𝝁 es: muestra grande para 𝝁
Intervalos de confianza para la varianza de una población normal: Sean X1,

X2, …, Xn una muestra aleatoria de una distribución normal con parámetros 𝝁
y 𝞼2. Entonces la variable aleatoria tiene una distribución de probabilidad ji
cuadrada (X2) con n-1 grados de libertad. A medida que 𝝂 aumenta la
función se hace + simétrica.
Sea X2α;v (valor critico de ji cuadrada), el numero sobre el eje de medición de modo que α del area bajo la curva ji
cuadrado con v grados de libertad quede a la derecha de X 2. El area bajo una curva ji cuadrada con v grados dee
libertad a la derecha de X2α;v es α/2, lo mismo que a la izquierda de X2α;v. El area calculada entre dos valores críticos
es 1-α
Por lo que un intervalo con un nivel de confianza del (1 − 𝛼)% para la
varianza viene dado por:
Para un intervalo de confianza para el desvío estándar, basta con sacarle la raíz cuadrada a los
extremos del intervalo anterior. VALIDO SI DISTRIBUCION DE POBLACION ES NORMAL.
1- S2 = varianza
2- 1-α = % dado (o,…)→ α = % dado (0,…) +1 → α/2
3- Busco en tabla chi cuadrado X2α/2;n-1 (usado como denominador en fracción de Lim superior) y X 2 1-α/2;n-1 (usado como denominador en
fracción de Lim inferior).
4- Planteo intervalo con formula
Test de hipótesis
Procedimiento basado en la evidencia muestral y en la teoría de prob que se emplea para determinar si la hipótesis es un enunciado racional y
no debe rechazarse o si es irracional y debe rechazarse. En un trabajo de investigación se emplean 2 hipotesis mutuamente excluyentes; la
hipótesis nula y la alternativa o de investigación. Objetivo d investigación es decidir cuál de dos pretensiones contradictorias sobre el parámetro
es la correcta. Los métodos para lograrlo comprenden la parte de la inferencia estadística llamada prueba de hipótesis, donde se consideran
dos hipótesis contradictoria y el objetivo es decidir, con base en información muestral, cuál de las dos hipótesis es la correcta.Al probar
hipótesis estadísticas, el problema se formulará de modo que una de las pretensiones sea inicialmente favorecida. Esta pretensión inicialmente
favorecida no será rechazada a favor de la pretensión alternativa, a menos que la evidencia muestral la contradiga y apoye fuertemente la
aseveración alternativa.
Hipotesis: elemento que coincide condiciona el diseño de investigación y responde provisionalmente al problema.
Prueba  Hipótesis nula 𝑯𝟎 = pretensión que inicialmente se supone cierta, (creencia previa).
(Test)  Hipótesis alternativa 𝑯𝟏 = aseveración contradictoria de 𝑯𝟎.
de  Hipótesis nula será rechazada a favor de la alternativa si la evidencia muestral sugiere que 𝑯𝟎 es falsa. Las dos posibles
hipótesi conclusiones de una prueba de hipótesis son rechazar o no rechazar 𝑯𝟎
s Plantearemos 3 casos:
1- 2- 3-
*Cuando mucho → Planteo H0 : μ= x y la contradictoria seria H1:: μ> x

Procedimiento de prueba: deben especificar:

 Un estadístico de prueba, una función de los datos muestrales en los cuales se ha de basar la decisión de rechazar o no rechazar 𝐻0.
 Una región de rechazo, el conjunto de todos los valores estadísticos de prueba por los cuales 𝐻0 será rechazada
 La hipótesis nula será rechazada sí y sólo si el valor estadístico de prueba observado cae dentro de la región de rechazo
Errores en test d hipótesis (objetivo seleccionar una estadística del test y región crítica q minimicen la probabilidad de cometer los 2 errores):
 Error tipo I (eI ):rechazar hipótesis nula cuando es V. Como H0 , especifica un valor único del parámetro, existe un solo valor de 𝜶 .
α = máxima cantidad del error que estamos dispuestos a aceptar para dar como valida la hipótesis del investigador.
P (rechazar H0 cuando es verdadera) = P (eI) = α
 Error tipo II (eII) no rechazar la hipótesis nula cuando es falsa. Existe un valor ≠ de 𝜷 x c/valor del parámetro compatible c/ H1
P (no rechazar H0 cuando es falsa) = P (eII) = β
Errores  Supóngase experimento y tamaño fijos; se selecciona un estadístico de prueba. Si se reduce tamaño d región de rechazo
y para obtener valor +pequeño de 𝜶 se obtiene un valor +grande de 𝜷 con cualquier valor de parámetro particular
tamaño compatible con H1 . Como en H0 siempre se plantea la hipótesis que se supone cierta, es más grave cometer error de tipo I,
muestr (rechazarla cuando es verdadera) que cometer error de tipo II (aceptarla cuando es falsa)
a  Especificar valor +grande de 𝜶 que pueda ser tolerado y encontrar una región de rechazo que tenga ese valor de 𝜶. Esto
hace a 𝜷 tan pequeño como sea posible sujeto al límite en . El valor resultante de 𝜶 se conoce como nivel de significación
de la prueba. Niveles tradicionales de significación son 0,10; 0,05 y 0,01. Nivel de confianza dependerá d error de tipo I
(+serio error, +pequeño deberá ser el nivel de significación).
Prueb Población normal 𝝈 conocida: Sean 𝑋1, 𝑋2, … , 𝑋𝑛 una muestra aleatoria de tamaño n de una población normal. Entonces 𝑋 ~(𝝁𝟎;
as 𝝈𝟐/𝒏) Considerando el estadístico estandarizado con la suposición de que 𝐻0 es verdadera. Si se reduce el tamaño de la región de
sobre rechazo para obtener valor +pequeño de 𝜶 se obtiene valor +grande de 𝜷 con cualquier valor de parámetro particular compatible con
la H1.Fijar 𝜶 porque se considera más grave cometer error de tipo I. Fijado el 𝜶 si se considera que el valor de 𝜷 obtenido es muy grande
media podría reducirse ↑tamaño de la muestra.
de Tipificamos y obtenemos el valor del estadístico de prueba: Z = (X muestral - 𝝁𝟎) / (𝝈/√ 𝒏)
una Siendo la hipótesis nula 𝐻0: 𝜇 = 𝜇0 se pueden dar las siguientes situaciones:
pobla Hipótesis alternativa Región rechazo para test nivel α Hipótesis alternativa Región rechazo para test nivel α
ción H1 : μ > μ0 Z ≥ Zα (prueba de cola superior) H 1 : μ < μ0 Z ≤ - Zα (prueba de cola inferior)
Hipótesis alternativa Región rechazo para test nivel α

H 1 : μ ≠ μ0 Z ≥ Zα /2 o Z ≤ - Zα /2 (prueba d 2 colas)
*contradicen los datos la afirmación del fabricante a un nivel de significación 𝛼 = ..? Uso dos colas.
Muestras grandes (n>30) 𝝈 desconocida: cuando n es grande, sin suponer distribución normal y desconociendo , 𝑋muestral también
tiene una distribución aproximadamente normal. Estimando 𝝈𝟐 con 𝒔2 formamos el estadístico estandarizado con la suposición de que
Ho es verdadero. Tendrá las mismas regiones de rechazo del caso anterior
Tipificamos y obtenemos el valor del estadístico de prueba: Z = (X muestral - 𝝁𝟎) / (S/√ 𝒏)
Siendo s=desviación estándar muestral
Muestras chicas (n≤30) 𝝈 desconocida: si las observaciones provienen de una muestra aleatoria tomada de una distribución normal
con valor medio μ y desviación estándar σ desconocida y si n es pequeño, tiene distribución de prob t student con n-1 grados de
libertad.
Tipificamos y obtenemos el valor del estadístico de prueba: T = (X muestral - 𝝁) / (s/√ 𝒏)
El conocimiento de la distribución del estadístico de prueba cuando H o es verdadera, nos permite construir una región de rechazo con
el tipo de error de
tipo I Hipótesis alternativa Región rechazo para test nivel α deseado.
𝐻0: 𝜇 = 𝜇0 H1 : μ > μ0 t ≥ t α , n-1 (prueba de cola superior)
H1 : μ < μ 0 t ≤ - t α , n-1 (prueba de cola inferior)
H 1 : μ ≠ μ0 t ≥ t α/2 , n-1 o - t ≤ t α/2 , n-1 (prueba de 2 colas)
Prueb En las pruebas de hipótesis se debe comprobar, con base en R obtenidos en una muestra, si el valor verdadero de una proporción es
as igual a la constante determinada o si las proporciones de 2 o + poblaciones son iguales. Prueba con muestras grandes: ṗ ~N ( 𝑝; (𝑝
para *(1−𝑝))/ 𝑛) , si n es grande y p chica el reemplazo en la varianza de 𝑝 por p implica un error desestimable, estandarizando
propr Z = (ṗ - p) / √ ¿ ¿] ~ N (0;1)
ocion Bajo H0 el estadístico toma el valor: Z = (ṗ - p0) / √ ¿ ¿] o
Donde q = 1- p y X= numero de eventos en la muestra (denominador de proporción muestral).

H0 : p = p0
Hipotesis alternativa Region rechazo para test de nivel α
H1: p > p0 Z ≥ Zα (prueba de cola superior)
H1: p < p0 Z ≤ - Zα (prueba de cola inferior)
H1: p ≠ p0 Z ≥ Zα/2 o Z ≤ -Zα/2 (prueba de 2 colas)
Valido siempre que n*p0 ≥10 y n*(1-p0) ≥ 10
Prueb Al presentar intervalo de confianza para varianza de población, se establece teorema: Sean X 1, X2, xN una muestra aleatoria de
a distribución normal con parámetros μ y 𝞼2. Entonces la variable aleatoria tiene distribución ji cuadrada con n-1 grados de libertad.
sobre (n-1)* S2 = ∑ ( X I - X media) 2
varia 𝞼2 𝞼2
nza el estadístico de prueba para un test de hipótesis para la varianza, será (n-1)* S2 ~ X 2n-1
de 𝞼 20
pobla * válido si los datos provienen de una población con distribución normal
cion
H0: 𝞼 = 𝞼0
Hipotesis alternativa Region rechazo para test de nivel α
H1: 𝞼 > 𝞼0 X2 ≥ X 2α; n-1 (prueba de cola superior)
H1: 𝞼 < 𝞼0 X2 ≤ X 21-α; n-1 (prueba de cola inferior)
H1: 𝞼 ≠ 𝞼0 X2 ≤ X 21-α/2; n-1 o X2 ≥ X 2α/2; n-1 (prueba de 2 colas)
PASOS A PLANTEAR:
1- Planteamiento hipótesis nula y alternativa. Siempre la nula será H 0: μmuestral = μ poblacion. La alternativa H1 puede ser > < o ≠ a μ
2- Elegir nivel de significancia α = 0,05 si no me lo especifica.
3- Determinacion zona de aceptación y rechazo de la hipótesis nula
4- Determinacion de función pivotal:
ZC = (X muestral - 𝝁𝟎) / (𝝈/√ 𝒏) n>30, población normal y 𝞼 conocido.
TC = (X muestral - 𝝁) / (s/√ 𝒏) con n-1 grados de libertad n≤ 30, t student 𝞼 desconocido.
√
ZC = (P muestral– p poblacionl) / ( p∗q/n ) p = probabilidad que ocurra q= 1-p = probabilidad que no ocurra.
5- Calculo función pivotal elegida. Reemplazo valores. ZC o tC obtenido es el valor final a ubicar dentro de regiones.
6- Ubicar el valor obtenido en el calculo de función pivotal en la región de rechazo (RR) o de aceptación (RA)de la H 0
Criterio de aceptación o rechazo:
Zona de rechazo = α Zona de aceptación = 1- α Zt = Z1-α
Prueba de 1 cola si H1 : μ > μ0
Prueba de 1 cola si H1 : μ < μ0 Si |Zc| > |Zt| se rechaza H0 y acepta H1
Prueba de 1 cola si H1 : μ ≠ μ0 Si |Zc| ≤ |Zt| se mantiene H0
I C para la pendiente de la recta de regresión La pendiente β de la recta de regresión de la población es el cambio promedio verdadero en la
variable dependiente y asociada con un incremento de una unidad en la variable independiente x. La pendiente b hallada por el método de
mínimos cuadrados es una estimación puntual de 𝜷 (β = 𝒃). Las inferencias adicionales sobre 𝜷 están basadas en considerar a β como un
estadístico e investigar su distribución de muestreo
Se puede mostrar que b tiene distri. Normal con Reemplazando 𝞼 por
E(b) = β y V(b) = 𝞼2b = 𝞼2/ sxx su estimación Se:
Sxx= ∑ x2i – (∑xi)2/n Sb = se / √ sxx
Bajo supuestos del modelo la variable Un intervalo de confianza del 100(1-α)% para la verdadera pendiente β de la recta de
regresión es:
b +- tα/2 ; n-2 * Sb
Tiene distribución t con n-2 gl.

L prueba de utilidad del modelo es:
H0: β = 0 H1: β ≠ 0 En cuyo caso el estadístico de prueba será: t = b/sb
Rechazaremos Ho si: t≥ tα/2;n-2 o t ≤ - tα/2;n-2

Estadistica Resumen General

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Estadistica Resumen General

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Resumen General

Cargado por

Copyright:

Formatos disponibles

Estadística: se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y

UNIDAD 1 ESTADISTICA DESCRIPTIVA

Moda: Es el valor más frecuente de la distribución. Puede no ser única.

Cuando s=2 la fórmula es coincidente con la que

Si los datos están agrupados

 La forma o simetría de la distribución

FRECUENCIA ABSOLUTA FRECUENCIA ABSOLUTA

Cálculos estadísticos básicos en calculadora:

En calculadora [S-SUM] (1) ; [S-VAR] (2) ; Y (`)

Regla de la multiplicación De la definición de probabilidad condicional se obtiene el siguiente resultado

Ley de la probabilidad total Sean 𝐴1, 𝐴2, … , 𝐴𝑘 eventos mutuamente excluyentes y

 Valor esperado, valor medio o esperanza de X E(X) ó 𝝁𝒙: es el centro de gravedad de

𝑝𝑋(𝑥) = P(Ᾱ ∩ ⋯ ∩ Ᾱ ∩ A) = 𝑃 (Ᾱ) 𝑥−1 * 𝑃 (A) = (1 – 𝑝) 𝑥−1 * 𝑝

Se puede comprobar que k=0 n ∑ p (X) (k) = 1

[x] es la parte entera de x

𝑅𝑋 = 0; 1; 2; … ; 𝑛 𝐸 (𝑋) = 𝑛 *𝑝 𝑉 (𝑋) = 𝑛*𝑝* (1 –p)

 Distribución de Poisson: Una v.a. X tiene una distribución de

*En aplicación posibility distribution pongo, valor de landa, valor de x y el signo si es ≤ = o ≥

 función de distribución acumulada (fda) F(x) : se define xR, como:

 Esperanza o valor esperado o valor medio E(X) o 𝝁𝒙 :

o función de distribución acumulada, fda:

 La función de probabilidad puntual es:

 La función de probabilidad acumulada es:

𝑥K 𝑝(𝑥k; 𝑦1) 𝑝(𝑥k; 𝑦m)

 Valores esperados de dos v.a. discretas:

 Coeficiente de correlación de Pearson entre dos v.a. X e Y:

Propiedades del p(x;y)

Regresion lineal simple:

o No tiene unidades, es coeficiente

Parámetro es una característica de una población.

Aprox Ẋ c/distr normal Estandarizando

APLICACIÓN TCL cuando APLICACIÓN DE LA SUMA n>30 APLICACIÓN DE LA VARIANZA

A medida que aumenta valor de n,

P (a < Ẋ < b ) = P ( a – μ < Z < b – μ ) = φ (b – μ) - φ ( a – μ )

*P (Ẋ> a) = 1- P (Ẋ< a) = 1- P( Ẋ< a – μ ) = 1 – φ (a – μ ) MUESTRAL

*Si me pide P(X≥ a) = 1 - P(Ẋ ≤ a) = 1 - P(Ẋ ≤ Z) Debo calcular Z = (a – μ ) / 𝜎 1 entero no muestral

El desvio/error estándar de la proporción es 𝜎ˆp =

A + tamano de n disminuye error

va el desvio estándar de la proporción 𝜎ˆp =

DISTRIBUCION t: v.a. continua, usada para estimar media de población

Intervalos de confianza para la varianza de una población normal: Sean X1,

Procedimiento de prueba: deben especificar:

Hipótesis alternativa Región rechazo para test nivel α

Donde q = 1- p y X= numero de eventos en la muestra (denominador de proporción muestral).

Tiene distribución t con n-2 gl.

También podría gustarte

𝑅𝑋 = 0; 1; 2; … ; 𝑛 𝐸 (𝑋) = 𝑛 𝑝 𝑉 (𝑋) = 𝑛𝑝* (1 –p)