Clase 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Teoría de Probabilidades

Para empezar a hablar de probabilidades en primer lugar debemos tener un experimento. Pero no de
cualquier tipo, sino uno de carácter aleatorio. Es decir que aunque repitamos el mismo experimento
bajo las mismas condiciones, podemos tener un resultado distinto.

Formalmente, decimos que un Experimento Aleatorio es una prueba que se realiza y tiene las
siguientes propiedades:

a) Se conoce el conjunto de resultados posibles.

b) No se conoce el resultado de una prueba en particular hasta que ella no se realiza.

c) Es repetible en “igualdad de condiciones” (entre “” porque nunca las condiciones son las
mismas, como se verá en los ejemplos)

Espacio muestral Ω: es el conjunto de resultados posibles de un experimento aleatorio

Ejemplos:

 Se arroja un dado al aire una vez. Ω = {1,2,3,4,5,6}.


Hasta que el dado no termine de caer, no sabemos el resultado. Podemos repetir el experimento
y aunque las condiciones “sean iguales” los resultados podrán variar.
 Se extrae una bolilla de una urna que contiene 10 bolillas rojas y 7 blancas
Ω = {𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑒𝑠 𝑟𝑜𝑗𝑎, 𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑒𝑠 𝑏𝑙𝑎𝑛𝑐𝑎}
 Se arrojan dos monedas al aire una vez. Ω = {𝑐𝑎𝑟𝑎 𝑐𝑎𝑟𝑎, 𝑐𝑎𝑟𝑎 𝑐𝑟𝑢𝑧, 𝑐𝑟𝑢𝑧 𝑐𝑎𝑟𝑎, 𝑐𝑟𝑢𝑧 𝑐𝑟𝑢𝑧}

Un Suceso aleatorio es un subconjunto del espacio muestral. Suele representarse con las letra A, B, C,
etc.

Por ejemplo, si arroja un dado al aire una vez. Ω = {1,2,3,4,5,6}, podemos definir

A: se obtiene un número par.

B: se obtiene un número mayor que 4.

C: se obtiene un 3.

A partir de esos sucesos, podemos crear nuevos, con lo que llamamos algebra de sucesos. Las
operaciones que vamos a realizar provienen de la teoría de conjuntos. Repasemos…

1) Suceso cierto: A= Ω . Es aquel que se presenta toda vez que se realiza el experimento.

2) Suceso imposible: A = Ø. Es aquel que no puede presentarse nunca.

3) Suceso contrario: Al suceso contrario al suceso A lo representamos con 𝐴̅ y es lo que ocurre


cuando no ocurre A.

1
Por ejemplo, volviendo al experimento de arrojar un dado, un ejemplo de suceso cierto es que salga
un número menor que 10. Un ejemplo de suceso imposible podría ser que salga un 0.

Digamos ahora que el suceso A es la aparición de un número par, 𝐴̅ es aparición de un número impar.

4) Unión de sucesos: el suceso A ∪ B ocurre cuando ocurre A o B (o los dos a la vez).

5) Intersección de sucesos: el suceso A ∩ B ocurre cuando ocurre A y B a la vez.

Si A y B no pueden ocurrir a la vez, es decir si el suceso A∩B es Ø, se llaman mutuamente excluyentes o


simplemente sucesos excluyentes.

Cada uno de estos sucesos va a tener una probabilidad de ocurrir, que es una medida del grado de
certidumbre con el que este suceso se da. Para calcular una probabilidad tenemos varios enfoques o
teóricas, que se aplican según el caso.

Definición clásica: Debida a Pierre Simón Laplace1749-1827

Este enfoque queda restringido a los casos de equiprobabilidad, es decir cuando se sabe que los
resultados del experimento aleatorio son igualmente probables. En ese caso la probabilidad es
el cociente entre la cantidad que casos que cumpliría el suceso pedido (casos favorables) y el
total de casos (casos posibles).

Esta definición suele aplicarse a juegos de azar como cartas o dados, pues es igualmente
probable que salga cualquier número en un dado o cualquier carta. Un ejemplo de aplicación
sería en el caso del dado, si el suceso A es obtener un número par:

P(A) = Cantidad de números pares en el dado = 3 = 1 = 0,5


Cantidad de números totales en el dado 6 2

2
Definición frecuencial: Debida a Richard Von Mises 1883-1953.

Se basa en los resultados de un gran número de repeticiones de un experimento. Si fA es la

cantidad de veces que se presenta el suceso A en n pruebas, es la frecuencia relativa de A.

Esta teoría expresa que la probabilidad de A

Este enfoque suele utilizarse en casos sociales. Por ejemplo, si se desea saber la probabilidad
de que un alumno apruebe cierto examen de admisión a la primera vez, no tiene sentido
trabajarlo como casos favorables sobre totales, porque no es igualmente probable aprobar que
no aprobar. Se basa en la experiencia, y cuantos más datos se tenga, más preciso es el resultado.
Digamos que entre los últimos 100 alumnos presentados, 70 de ellos aprobaron al primer
intento, podemos decir que la probabilidad de aprobar en el primer intento es 70/100 = 0,7.

Antes de seguir con el tercer enfoque (y el más formal de los tres), notemos que tanto en la definición
clásica como en la definición frecuencial la probabilidad es un número entre 0 y 1. Y que si tomamos el
suceso A = Ω, tenemos como resultado P(A)=1.

Teoría Axiomática: de Andrey Nikolaevich Kolmogorov 1903-1987.

Este enfoque caracteriza formalmente la probabilidad de un suceso a partir de tres axiomas.


Siendo A un suceso de un espacio muestral Ω,

a) 0 ≤ P(A) ≤ 1
b) 𝑃(Ω)=1
c) Si A y B son sucesos mutuamente excluyentes, 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Esta teoría extiende las anteriores. Si bien no nos da un método de cálculo, tomando probabilidades ya
conocidas (por cualquiera de los métodos previos), podemos llegar a nuevos conocimientos.

Primer corolario de la definición axiomática: P (𝐴̅ ) = 1 – P(A)

A y 𝐴̅ son excluyentes, por lo que P (𝐴 ∪ 𝐴̅ ) = P(A) + P(𝐴̅) .

Pero por otro lado, 𝐴 ∪ 𝐴̅ = Ω, cuya probabilidad es 1. Así 1= P(A) + P(𝐴̅) . Despejando se obtiene
lo pedido.

Segundo corolario de la definición axiomática: P (Ø ) = 0

Pues es el complemento de Ω.

Cabe mencionar que P(A) = 0 no significa que A sea vacío. Solo podemos afirmar que es un suceso raro.

3
Regla de la suma: Si A y B son dos sucesos cualesquiera

La demostración corresponde al ámbito de las matemáticas y es opcional.

Los axiomas solo nos dicen como es la probabilidad de una unión de sucesos que no ocurren a
la vez, así que reescribimos A B y B como la unión de dos sucesos excluyentes:

𝐴 ∪ 𝐵 = 𝐴 ∪ (𝐵 ∩ 𝐴̅)

𝐵 = (𝐴 ∩ 𝐵) ∪ (𝐵 ∩ 𝐴̅)

Por el tercer axioma concluimos que

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵 ∩ 𝐴̅)

𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐵 ∩ 𝐴̅)

Restando miembro a miembro obtenemos:

𝑃(𝐴 ∪ 𝐵) − 𝑃(𝐵) = 𝑃(𝐴) + 𝑃(𝐵 ∩ 𝐴̅) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐵 ∩ 𝐴̅)

Y despejando se obtiene la expresión deseada. □

Apliquemos estas reglas en un ejemplo:

En un grupo de estudiantes del colegio ABC se sabe que el 65% inglés, el 30% habla francés, y el 12%
habla los dos idiomas. Si se selecciona un alumno al azar,

a) ¿Cuál es la probabilidad que no hable francés?

b) ¿Cuál es la probabilidad de que hable inglés o francés?

c) ¿Cuál es la probabilidad de que no hable ni inglés ni francés?

Solución: En este problema la probabilidad está planteada en términos que de porcentaje, que es lo más
usual en el idioma coloquial. Nosotros sabemos que la probabilidad es un número entre 0 y 1, al
multiplicar la probabilidad por 100, se obtiene el porcentaje. En este caso, al dividir el porcentaje por
100, tenemos la probabilidad. Es decir nuestros datos son:

P(I) = 0,65

P(F) = 0,3

P(I ∩ F) = 0,12

a) P(𝐹 ) = 1 – P(F) = 1- 0,3 = 0,7


b) P(I ∪ F) = P(I) +P(F) – P(I ∩ F) = 0,65 +0,3 -0,12 = 0,83

4
c) El punto c nos pide analizar el caso en que a la vez se cumpla 𝐹 y 𝐼 ̅ , es decir pide P(𝐹 ∩ 𝐼 ̅ )

Se podrían plantear ecuaciones de álgebras de sucesos que permitan despejar ese resultado, pero en
estos casos una representación visual vale más. Utilizaremos los llamados diagramas de Venn, clásicos
en la teoría de conjuntos.

Inglés Francés
0,17
0,53 0,12 0,18

El conjunto de alumnos que habla inglés está formado por la unión de los sucesos excluyentes:

* Los alumnos que hablan inglés y no francés

* Los que hablan inglés y también francés.

Simbólicamente, 𝑃(𝐼) = 𝑃(𝐼 ∩ 𝐹) + 𝑃(𝐼 ∩ 𝐹 ).

Sabemos que esas dos probabilidades deben sumar 0,65, es decir 0,65 = 0,12 + 𝑃(𝐼 ∩ 𝐹 ), dejando esa
probabilidad en 0,53.

¿Pueden ver cómo hallar de la misma manera el 0,18?

Finalmente, sabemos que el espacio muestral tiene una probabilidad de 1, así que todos los sucesos
excluyentes deben sumar 1.

Hasta ahora tenemos 0,53 + 0,12 + 0,18 = 0,83, por lo el suceso por fuera de ambos conjuntos es 0,17.
Justamente esta es la respuesta al punto c: P(𝐹 ∩ 𝐼 ̅ ) = 0.17

Veamos otro ejemplo, con una forma distinta de disponer información: Tablas de contingencia

Se entrevistó a un grupo de 200 ejecutivos respecto de su lealtad a la compañía. Una de las preguntas
fue: Si otra compañía le hace una oferta igual o le ofrece un puesto un poco mejor del que tiene ahora,
¿permanecería con la compañía o aceptaría el otro puesto? A partir de las respuestas se hizo una
clasificación cruzada según el tiempo de servicio en la compañía, tal como se muestra en la siguiente
tabla:

5
a) ¿Cuál es la probabilidad que al elegir un ejecutivo al azar este elija permanecer en la compañía?

Solución: Acá simplemente debemos utilizar la teoría clásica de probabilidades: los que deciden
quedarse (sin importar su antigüedad) suman 120, de un total de 200, es decir P(A1) = 120/200 = 0,6

b) ¿Cuál es la probabilidad que al elegir un ejecutivo elija no permanecer en la compañía y esté


hace más de 10 años?

Solución: De la misma manera, debemos tomar como casos favorables la cantidad de ejecutivos que
cumplen ambas condiciones: 30, y la misma cantidad de casos totales: P(A2 ∩ B4) = 30/200 = 0,15

c) ¿Cuál es la probabilidad de elegir un ejecutivo al azar que no esté en la empresa hace entre 1 y 5
años?

Solución: Hallamos primero P(B2)= 45/200 = 0,225. Por lo tanto, P(𝐵2) = 1-0,225 = 0,775.

d) ¿Cuál es la probabilidad de elegir un ejecutivo al azar que esté en la empresa hace 5 años o
menos?

Solución: Estar hace 5 años o menos es B1 ∪ B2, que son excluyentes. P(B1 ∪ B2)= P(B1) +P( B2)=
35/200+45/200 = 0,395

e) ¿Cuál es la probabilidad de elegir un ejecutivo que esté en la empresa hace más de 10 años o que
elija permanecer en caso de una oferta tentadora?

Solución: En esta caso también se trata de una unión, pero ya no excluyente.

P(A1 ∪ B4) = P(A1) + P(B4) - P(A1 ∩ B4) = 120/200 +105/200 -75/200 = 150/200 =0,75

f) Si elegimos un ejecutivo que está hace menos de 1 año, ¿cuál es la probabilidad que permanezca
ante la oferta de otro puesto?

Solución: Este problema plantea una certeza, el ejecutivo elegido ya sabemos que está trabajando hace
menos de un año. La probabilidad consultada es solo si permanecería o no en la empresa. De esta
manera, se acotan los casos totales a solamente 35 y los favorables son 10, por lo que la probabilidad de
lo pedido es 10/35.

6
No se debe confundir con la probabilidad conjunta, en el cual se consulta por ambas opciones, como en
el caso b.

Este caso es uno de los más interesantes en el estudio de probabilidades. Se llama probabilidad
condicional. Se representa 𝑃(𝐴1|𝐵1) y se lee la probabilidad de A1 (permanecer) sabiendo B1 (está
hace menos de un año en el puesto.

Probabilidad Condicional

Cuando nos preguntamos la probabilidad de un suceso ya teniendo la información de otro, estamos


hablando de una probabilidad condicional. Estamos calculando 𝑃(𝐴|𝐵), que es la probabilidad de A,
sabiendo que ocurrió B. Es decir que calculamos 𝑃(𝐴), pero tomando ahora el espacio muestral reducido
a los casos de B. Es decir, cambian nuestros “casos favorables”.

Por ejemplo, en el experimento de tirar un dado, si debo adivinar qué número es, la probabilidad de
acertar es de 1/6. (1 respuesta favorable, sobre 6 totales). Ahora bien, si me dan una pista, por ejemplo,
sabemos que es impar, achican el espacio muestral y ahora la posibilidad de acertar es 1/3.

Formalizando:

A= El número es un 3.

B= El número es impar.

P(A) = 1/6 y P(A|B) = 1/3

Principio de las probabilidades compuestas:

Despejando se obtiene la fórmula: 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴|𝐵) ∗ 𝑃(𝐵)

En el ejemplo anterior, P(A|B) = P(A ∩ B)/P(B) = 1/6 : ½ = 1/3

Observaciones:

 Si A y B son mutuamente excluyentes, entonces P(A|B)=0.


 Si A está incluido en B, entonces: P(A|B) = P(A) / P(B)

P(B|A) = P(A) / P(A)

Sucesos independientes: Dos sucesos son independientes cuando la ocurrencia de uno no aporta
información respecto de la ocurrencia o no del otro. Es decir, P (A|B) = P(A) y P (B|A) = P (B).

En tal caso, tenemos P(A ∩ B) = P(A) * P (B)

7
Podemos preguntarnos en un caso en particular si dos sucesos son independientes o no. En los casos
de monedas o dados, se considera que una tirada es independiente a la otra. En algunos casos no es
evidente y debemos determinar la independencia (o no) de dos sucesos calculando P(A ∩ B).

En el caso de la empresa, ¿será independiente estar hace más de 10 años de la empresa con decidir
permanecer en la misma?

P(A1 ∩ B4) = 75/200 = 0,375

P(A1) * P(B4) = 120/200 * 105/200 = 0,6 * 0,525 = 0,315

Como los resultados son distintos, los sucesos no son independientes.

Ejemplo: En un esquema de urnas, si las extracciones por ejemplo de bolillas se hacen con
reposición (reponiendo la bolilla extraída antes de sacar la siguiente) habrá independencia
entre las extracciones y el resultado de una extracción no depende de la anterior. Decimos
que la urna no tiene memoria de lo ocurrido.

Si las extracciones se hacen sin reposición el resultado de una extracción modificará el


resultado de la siguiente extracción.

Una caja contiene 3 bolas verdes, 5 bolas rojas y 2 bolas azules.

1) Si se extrae una bola al azar, ¿cuál es la probabilidad de obtener una bola azul?

P (A) = 2/10 = 0,2


2) Si se extrae una bola al azar, se anota, se la devuelve y luego se extrae otra ¿cuál es la
probabilidad de que ambas sean azules?

En este caso, hay independencia, pues al reponer la bolita, la urna no tiene memoria.

P(1era A ∩ 2da A) = P(1era A) * P(2da A) = 0,2 * 0,2 = 0,04

3) Si se extrae una bola al azar luego se extrae otra (sin reponer la primera) ¿cuál es la probabilidad
de que ambas sean azules?

En esta caso no hay independencia: P(1era A ∩ 2da A) = P(1era A) * P(2da A|1era A) =

Calculemos P (2da A|1era A): si ya sacamos una azul, ahora en la urna hay 3 verdes, 4 rojas y 1 sola
azul, por lo que la probabilidad es 1/9.
Entonces P (1era A ∩ 2da A) = P(1era A) * P(2da A|1era A) = 0,2 * 1/9 ≃ 0,0222

8
Teorema de Bayes o regla de las probabilidades a posteriori.

Este teorema calcula la probabilidad condicional denominada probabilidad a posteriori, combinando las
probabilidades a priori con otras probabilidades condicionales. Una probabilidad a priori es un valor
asignado, a veces temporalmente, a la ocurrencia de un suceso, que puede cambiar con la evidencia del
resultado de un experimento.

Pensemos en un suceso B llamado efecto, que puede presentarse con alguna de las causas mutuamente
excluyentes y exhaustivas A1, A2, …,An como se observa en la siguiente partición del espacio muestral
mostrado en el diagrama de Venn siguiente:

Las condiciones de esta partición son: 𝑎) A𝑖 ∩ A𝑗 = Ø 𝑝𝑎𝑟𝑎 𝑖≠𝑗

𝑏) A1 ∪ A2 ∪ … ∪ An es todo el espacio muestral

𝑐) 𝑃(A𝑖) >0

El teorema de Bayes nos permite calcular la probabilidad

Donde llamamos:

 Las probabilidades P (Ai) : probabilidades a priori.

 Las probabilidades P (Ai/B) : probabilidades a posteriori.

 Las probabilidades P (B/Ai) : verosimilitudes.

Para demostrarlo, basta recordad la probabilidad condicional:

Y por un lado reescribir 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵|𝐴 ). 𝑃(𝐴 ) y por el otro,

𝐵 = 𝐵∩ 𝐴1 ∪𝐵 ∩𝐴2 ∪…∪ 𝐵∩𝐴𝑛

9
𝑃(𝐵)=𝑃(𝐵∩𝐴1 ∪ 𝐵∩𝐴2 ∪…∪ 𝐵∩𝐴𝑛 ) que por ser los Ai excluyentes será:

𝑃(𝐵)=𝑃(𝐵∩𝐴1) + 𝑃(𝐵∩𝐴2) + ⋯ + 𝑃(𝐵∩𝐴𝑛 ) = P(B|A1).P(A1) + 𝑃(𝐵|𝐴2).P(A2) + ⋯ + 𝑃(𝐵|𝐴n).P(An)

En ocaciones el teorema de Bayes se representa más fácilmente en un árbol de decisión:

Ejemplo: Una persona se ha perdido en un bosque y llega a una cabaña de donde parten 4 caminos que
tienen igual probabilidad de ser elegidos. La probabilidad de salir del bosque tomando los distintos caminos
es respectivamente 0.5, 0.4, 0.3 y 0.2. En menos de una hora la persona salió. ¿Cuál es la probabilidad de
que haya elegido el segundo camino?

En un árbol eso se vería de la siguiente manera:

10
0,5 S

C1 C1̅
𝑆
1/4
0,4 S
1/4
C2
𝑆̅

1/4 0,3 S
C3
𝑆̅

1/4 0,2 S
C4
𝑆̅

11

También podría gustarte