0% encontró este documento útil (0 votos)
25 vistas14 páginas

PROBABILIDAD (1) Tratamiento de Datos PDF

Este documento trata sobre el tratamiento de datos en probabilidad. Explica conceptos como estadística descriptiva e inferencial, y medidas descriptivas como la media, mediana, moda y rango medio. También cubre medidas de dispersión como la varianza y desviación estándar, y cómo construir tablas de frecuencias y gráficas de distribución de frecuencias.

Cargado por

Kevin Ivan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
25 vistas14 páginas

PROBABILIDAD (1) Tratamiento de Datos PDF

Este documento trata sobre el tratamiento de datos en probabilidad. Explica conceptos como estadística descriptiva e inferencial, y medidas descriptivas como la media, mediana, moda y rango medio. También cubre medidas de dispersión como la varianza y desviación estándar, y cómo construir tablas de frecuencias y gráficas de distribución de frecuencias.

Cargado por

Kevin Ivan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 14

Universidad Autónoma de Nuevo León

Facultad de Ciencias Físico Matemáticas

Probabilidad

Azucena Ríos
Probabilidad 1. Tratamiento de datos

1. TRATAMIENTO DE DATOS

CONCEPTOS GENERALES

 Estadística descriptiva
 Estadística inferencial
 Estadística

MEDIDAS DESCRIPTIVAS PARA DATOS INDIVIDUALES

Medidas de tendencia central

El propósito de una medida de una tendencia central es resumir en conjunto de


datos de forma que podamos tener un panorama general; una medida de tendencia
central sirve como representante del resto de la información y nos da una idea del
valor central de un conjunto aparentemente desorganizado de datos.

Cuatro medidas comunes son:

 La media
 La mediana
 La moda
 El rango medio

Media

La media es el promedio aritmético de un conjunto de datos y se encuentra sumando


los datos y dividiendo dicha suma entre el número total de datos que se sumaron.

∑𝑁
𝑖=1 𝑥𝑖
Media poblacional: 𝜇 =
𝑁

∑𝒏
𝒊=𝟏 𝒙𝒊
̅=
Media muestral: 𝒙
𝒏

Donde N  tamaño de la población (número total de elementos)

n  tamaño de la muestra (número de elementos en una parte de la


población)

M.C. Azucena Ríos 1


Probabilidad 1. Tratamiento de datos

Mediana

La mediana es un número tal que divide en dos partes iguales a los datos ordenados
es decir, la mitad de los datos son menores que la mediana y la otra mitad son
mayores, por lo que hay la misma cantidad de datos antes y después de su valor.

La mediana se determina ordenando los datos y seleccionando el valor que queda


exactamente en la mitad, es decir, en la posición central.

Mediana poblacional: 𝜇̃

Mediana muestral: 𝑋̃

Regla de cálculo:

Para encontrar el valor de la mediana, hay que ordenar los datos de forma
ascendente.

Si hay una cantidad impar de datos, entonces la mediana es el dato que se


encuentra en la posición central.

Si hay una cantidad par de datos, entonces la mediana es el promedio aritmético


de los dos datos que se encuentran en las posiciones centrales.

Moda

La moda de un conjunto de datos, es el valor que se repite una mayor cantidad de


veces. Debido a esto, a veces no se puede determinar cuando todos los datos tienen
la misma frecuencia o porque los datos no se repiten. También pudiera suceder que
hubiera más de una moda, debido a que existen varios datos que se repiten la
misma cantidad de veces, en cuyo caso diremos que los datos son multimodales.

Moda poblacional: M

Moda muestral: m

Regla de cálculo

Solamente hay que contabilizar cuántas veces aparece cada dato, y la moda será
el(los) dato(s) que se repite con mayor frecuencia.

M.C. Azucena Ríos 2


Probabilidad 1. Tratamiento de datos

Rango medio

El rango medio de un conjunto de datos es punto geométrico central del intervalo


que se genera entre los valores extremos de un conjunto de datos, por lo que para
calcularlo, hay que obtener el promedio del dato mínimo y el máximo.

Rango medio poblacional: 𝑅̅


𝑋𝑚𝑎𝑥+𝑋𝑚𝑖𝑛
= 2

Rango medio muestral: 𝑟̅

EJEMPLO Dados los datos de las estaturas de los estudiantes, calcular todas
las medidas descriptivas de centralidad.

Medidas de dispersión
𝑥̅

x1 x8 x3 x4 x1 x7 x2 x6 x9 x5

Cuando se calcula alguna de las medidas de tendencia central, nos dan una idea
de la magnitud de los datos, sin embargo, esa medida es insuficiente para tener una
visión completa de la naturaleza de los datos.

EJEMPLO Para los dos conjuntos de datos calcular su media.

Caso a) Caso b)

3,5,6,7,7,7,8,10,11 1.18, 1.35, 2.91, 4.2, 8.24, 9.52, 15.2

Solución

𝑥̅ = 7.1 𝑥̅ = 7.1

𝑛=9 𝑛=7

M.C. Azucena Ríos 3


Probabilidad 1. Tratamiento de datos

Diríamos que los datos del caso b) están más dispersos que los del caso a), por lo
que se hace necesario contar también con una medida de dispersión.

Se denomina desviación a la diferencia de cualquier dato con respecto a la media

 (𝑥𝑖 − 𝑥̅ ) sería la desviación muestral


 (𝑥𝑖 − 𝜇) sería la desviación poblacional

Entonces, para tener una medida de dispersión, se podría considerar el


“promedio” de estas desviaciones; sin embargo, esto no es posible, ya que:
𝑁 𝑁

∑(𝑥𝑖 − 𝜇) = ∑ 𝑥𝑖 − 𝑁𝜇 = 𝑁𝜇 − 𝑁𝜇 = 0
𝑖=1 𝑖=1

Otra opción de tener una medida representativa de la dispersión, sería sacando el


promedio pero del valor absoluto de las desviaciones, con el fin de eliminar el
signo y quedarnos con la distancia de cada dato a su media, esto es, |𝑥𝑖 − 𝜇|, pero
resulta difícil algebraicamente, manipular el valor absoluto, de modo que se opta
por usar (𝑥𝑖 − 𝜇)2 lo cual nos conduce al concepto de varianza.

∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
(𝑥1 − 𝜇)2 + (𝑥2 − 𝜇)2 + ⋯ + (𝑥𝑁 − 𝜇)2 ∑𝑁
𝑖=1(𝑥𝑖 − 𝜇)
2
= = = 𝜎2
𝑁 𝑁 𝑁

VARIANZA POBLACIONAL

Observamos que si la variable x, tiene ciertas unidades de medición, entonces la


varianza tiene las unidades de medición elevadas al cuadrado, lo que complica su
interpretación, por lo que tiene sentido regresar a las unidades originales sacando
raíz cuadrada a la varianza, es decir,

∑𝑛 (𝑥 − 𝜇)2
√𝜎 2 = √ 𝑖=1 𝑖 =𝜎
𝑁

Y a esta cantidad se le denomina desviación estándar poblacional.

Del mismo modo, cuando lo que se tienen, son los datos de una muestra y se desea
una medida de la dispersión, entonces se obtiene la varianza muestral, misma que
se puede presentar en dos versiones.

(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ̂2


= =𝜎
𝑛 𝑛

M.C. Azucena Ríos 4


Probabilidad 1. Tratamiento de datos

y mejor aún

(𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2


= = 𝑠2
𝑛−1 𝑛−1

VARIANZA MUESTRAL

De las dos cantidades anteriores que representan a varianza muestral, nos


quedaremos con la versión de la 𝑠 2 debido a que proporciona un valor más cercano
al de la varianza poblacional 𝜎 2 .

Por lo tanto, si sacamos raíz cuadrada a la varianza muestral 𝑠 2 , obtendremos la


desviación estándar muestral

2
∑𝑛
𝑖=1(𝑥𝑖 − 𝑥̅ )
𝑠 = √𝑠2 √
n−1

A la cantidad ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 se le llama Suma de Cuadrados Muestral y si la


desarrollamos…
𝑛 𝑛

∑(𝑥𝑖 − 𝑥̅ ) = ∑[𝑥𝑖2 − 2𝑥𝑖 𝑥̅ + 𝑥̅ 2 ] = ∑ 𝑥𝑖2 − 2𝑥̅ ∑ 𝑥𝑖 + 𝑛𝑥̅ 2 = ∑ 𝑥𝑖2 − 2𝑥̅ 𝑛𝑥̅ + 𝑛𝑥̅ 2
2

𝑖=1 𝑖=1

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = ∑𝑛𝑖=1 𝑥𝑖2 − 𝑛𝑥̅ 2 de modo que entonces, la varianza muestral también
se puede escribir como

∑ 𝑥𝑖2 − 𝑛𝑥̅ 2
𝑆2 =
𝑛−1

Por otro lado, una forma muy rápida, aunque burda, de tener un valor aproximado
de la desviación estándar, es usando el rango:

𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
𝜎̂ =
4

EJERCICIO Para los datos de las estaturas, calcular las medidas de dispersión.

M.C. Azucena Ríos 5


Probabilidad 1. Tratamiento de datos

CONSTRUCCIÓN DE TABLA DE FRECUENCIAS Y GRÁFICAS DE UNA


DISTRIBUCIÓN DE FRECUENCIAS

La frecuencia, es la cantidad de veces que ocurre un evento en particular. Las


frecuencias de ocurrencia de eventos se pueden representar tanto numéricamente,
a través de una tabla de frecuencias, como gráficamente. Para construir una tabla
de frecuencias deben tomarse en cuenta varios aspectos:
 Intervalos de clase de la misma magnitud
 Subdividir los límites de clase para que ninguna observación quede en el
límite.

Cualquier tabla de frecuencia debe poseer las siguientes características:

 Uniformidad: cada clase debe tener la misma amplitud


 Unicidad: dos clases no se traslapan y por lo tanto cada dato pertenece
únicamente a una clase.
 Completez: las clases son tales que todos los datos pertenecen a alguna de
ellas, es decir, ningún dato se queda fuera de las clases.
 Número de clases: se recomiendan es entre 5 y 15 clases. Una guía para
determinar la cantidad adecuada de clases es calculando la regla de Sturges,
donde “c” es el número de clases:
𝑐 = 1 + 3.3 log10 𝑛
 Amplitud de la clase: es la longitud del intervalo de clase. La amplitud de
una clase, denotada por la letra A, se puede calcular de la siguiente manera:
𝑅𝑎𝑛𝑔𝑜 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 𝑈−𝐿
A = 𝑁𝑢𝑚. = =
𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 𝑐 𝑐

Los casos (ejemplos) utilizados hasta ahora, se denominan Datos univariados


porque nos interesa una sola variable (característica) de los objetos. Sin embargo
si se están considerando dos variables y se desean clasificar los datos en base a
dos características, entonces los datos serían bivariados.

M.C. Azucena Ríos 6


Probabilidad 1. Tratamiento de datos

EJEMPLO Los siguientes datos corresponden al tiempo de funcionamiento


(en días) hasta que se presenta la primera falla de radios transmisores-
receptores. Representar gráficamente estos datos.

Como son n=46, de acuerdo a la regla de Sturges el número de intervalos se obtiene


por

c = 1 + 3.3 log10(46) = 1 + (3.3)(1.66) = 1 + 5.478 = 6.487  c = 7

Luego, sabiendo que serán 7 intervalos de clase, y que los datos extremos son 16
y 608, podemos calcular la amplitud de cada intervalo
608−16
𝐴= = 84.571  𝐴 = 84.58
7

Frecuencia
Frecuencia
Frecuencias relativa o Porcentaje
i Intervalos de clase Acumulada
fi proporción %
fa
fr
1 16-100.58 12 0.261 12 26.1%
2 100.58-185.16 13 0.283 25 28.3%
3 185.16-269.74 8 0.174 33 17.4%
4 269.74-354.32 5 0.109 38 10.9%
5 354.32-438.9 5 0.109 43 10.9%
6 438.9-523.48 1 0.022 44 2.2%
7 523.48-608.06 2 0.043 46 4.3%
Número total de
datos= 46 1 100.0%

M.C. Azucena Ríos 7


Probabilidad 1. Tratamiento de datos

Tiempo de vida de radio- ① Histograma


de
trasmisores-receptores frecuencias


13
12
No. de aparatos

Elementos de un gráfico
8 ④
① Título del gráfico
5 5 ② Valores de la variable
1 2 ③ Títulos de los ejes
[unidades de medida]
② ④ Etiquetas de datos

③ Duración [días]

Frecuencia acumulada del ①


Polígono de
frecuencias
tiempo de vida de radio acumuladas


trasmisores-receptores
④ 43 44 46
No. de aparatos

38 Elementos de un gráfico
33
25
① Título del gráfico
12
② Valores de la variable
③ Títulos de los ejes
② [unidades de medida]
④ Etiquetas de datos
Duración [días]

M.C. Azucena Ríos 8


Probabilidad 1. Tratamiento de datos

TIEMPO DE VIDA DE ①
Diagrama de
pastel para
RADIOTRASMISORES-RECEPTORES porcentajes
438.9-523.48; 523.48-608.06;
354.32-438.9; 2.2% 4.3%
10.9% 16-100.58;
269.74-354.32; 26.1%
10.9% ④ Elementos de un gráfico
① Título del gráfico
② Valores de la variable
③ Títulos de los ejes
② [unidades de medida]
185.16-269.74; 100.58-
17.4% 185.16; ④ Etiquetas de datos
Duración [días] 28.3%

EJERCICIO Usar los datos de las estaturas de los estudiantes para construir una
tabla de frecuencias y generar las gráficas adecuadas.

MEDIDAS DESCRIPTIVAS (DE CENTRALIDAD Y DE DISPERSIÓN) PARA


DATOS AGRUPADOS

Cuando no se cuenta con los datos originales, sino que ya se tienen agrupados en
intervalos de clase, también es posible calcular medidas descriptivas, tanto de
centralidad como de dispersión; no se tiene el valor de cada uno de los datos, sin
embargo se puede representar cada uno de ellos a través de su marca de clase
(mi), esto es, el punto central o punto medio de cada intervalo de clase.

Al tener a cada marca de clase, representando a todos los datos que pertenecen a
un intervalo determinado, las fórmulas para calculas algunas medidas descriptivas
sufren algunos ajustes.

M.C. Azucena Ríos 9


Probabilidad 1. Tratamiento de datos

Por ejemplo, tratándose de una muestra, se tendría que:

MEDIA MUESTRAL
∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 PARA DATOS
𝑥̅ =
𝑛 DISCRETOS
AGRUPADOS

MEDIA MUESTRAL
∑𝑐𝑖=1 𝑓𝑖 𝑚𝑖 PARA DATOS
𝑥̅ =
𝑛 CONTINUOS
AGRUPADOS

VARIANZA
2
∑𝑐𝑖=1 𝑓𝑖 𝑚𝑖2 − 𝑛𝑥̅ 2 MUESTRAL PARA
𝑠 =
𝑛−1 DATOS
AGRUPADOS

MEDIA
∑𝑐𝑖=1 𝑓𝑖 𝑚𝑖 POBLACIONAL PARA
𝜇=
𝑁 DATOS CONTINUOS
AGRUPADOS

VARIANZA
2
∑𝑐𝑖=1 𝑓𝑖 𝑚𝑖2 − 𝑁𝜇2 POBLACIONAL
𝜎 =
𝑁 PARA DATOS
AGRUPADOS

M.C. Azucena Ríos 10


Probabilidad 1. Tratamiento de datos

EJEMPLO Para los datos del tiempo de vida de los radio trasmisores-
receptores, encontrar media y varianza y desviación estándar para los datos
agrupados.

Frecuencia
Frecuencia Marca
Frecuencias relativa o Porcentaje
i Intervalos de clase Acumulada de clase
fi proporción %
fa mi
fr
1 16-100.58 12 0.261 12 26.1% 58.29
2 100.58-185.16 13 0.283 25 28.3% 142.87
3 185.16-269.74 8 0.174 33 17.4% 227.45
4 269.74-354.32 5 0.109 38 10.9% 312.03
5 354.32-438.9 5 0.109 43 10.9% 396.61
6 438.9-523.48 1 0.022 44 2.2% 481.19
7 523.48-608.06 2 0.043 46 4.3% 565.77
Número total de
datos= 46 1 100.0%
La media muestral se calcularía de la siguiente manera

∑𝑛𝑖=1 𝑓𝑖 𝑚𝑖 (12)(58.29) + (13)(142.87) + ⋯ + (2)(565.77)


𝑥̅ = = = 207.22
𝑛 46
Y la varianza se obtendría así

∑𝑛𝑖=1 𝑓𝑖 𝑚𝑖2 − 𝑥̅ 2
𝑠2 =
𝑛−1
(12)(58.29)2 + (13)(142.87)2 + ⋯ + (2)(565.77)2 − (207.22)2
=
45
= 19771.38

De donde, podemos obtener la desviación estándar, sacando raíz cuadrada a la


varianza del siguiente modo

𝑠 = √𝑠 2 = √19771.38 = 140.61

Recordemos que otra manera de obtener una medida burda de la desviación


estándar, es utilizando el rango
𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 (608.06−16)
𝜎̂ = 4
=
4
= 148.02

Donde los valores 𝑥𝑚𝑎𝑥 y 𝑥𝑚𝑖𝑛 se pueden obtener de los extremos del primer y
último intervalo de clase, respectivamente.

M.C. Azucena Ríos 11


Probabilidad 1. Tratamiento de datos

Ahora bien, cuando se tiene un conjunto de datos cuyo histograma de frecuencias


tiene forma de “campana”, se puede apreciar que hay una especie de simetría con
respecto a una línea imaginaria de la media.

Si se generan intervalos simétricos centrados en la media de la siguiente manera,


puede observarse que dichos intervalos contienen una cierta cantidad de los datos,
esto es:

µ ± σ contiene ~ 65-68 % de las mediciones

µ ± 2σ contiene ~ 95-98 % de las mediciones

µ ± 3σ contiene ~ 100 % de las mediciones

a lo anterior se le conoce como Regla Empírica, la cual aumenta en exactitud, a


medida que aumenta la simetría con respecto a la media.

Por otro lado, en ocasiones, con solo conocer la medida de dispersión de un


conjunto de datos, no es posible determinar si esa medida es grande o es pequeña,
ya que hay que compararla contra el punto de referencia, que es la media. Debido
a lo anterior definimos el coeficiente de variación (CV) como una medida de la
variabilidad que tiene un conjunto de datos, independientemente de sus unidades
de medición ya que establece la relación que hay entre la desviación estándar y la
media, en términos de porcentaje. Lo anterior permite que el CV puede usarse para
comparar la variabilidad de dos grupos de datos expresados en distintas unidades
de medida. Entonces, el coeficiente de variación se calcula así
𝜎 𝑠
CV = 𝜇 100% ó CV = 𝑥̅ 100%

según sea el caso, una población o una muestra.

EJEMPLO Supóngase que un analista financiero de una firma de corredores


de acciones quiere comparar la variación en las razones de precio-ganancia
para un grupo de acciones comunes, con la variación en el rendimiento neto
sobre la inversión; a partir de muestras de los dos tipos de indicadores se
tiene que para las razones de precio-ganancia, la media es 9.8 y la desviación
estándar 2.4, la media de rendimiento neto sobre la inversión es 20% y la
desviación estándar es 4.3%. Use el coeficiente de variación para comparar la
variación relativa de las relaciones precio-ganancia respecto al rendimiento
sobre la inversión.

M.C. Azucena Ríos 12


Probabilidad 1. Tratamiento de datos

Datos de razón de precio-ganancia Datos de rendimiento neto sobre la


inversión
A B
𝑥̅𝐴 = 9.8 𝑥̅ 𝐵 = 20%
𝑠𝐴 = 2.4 𝑠𝐵 = 4.3%
2.4 4.3
𝐶𝑉𝐴 = 100% = 24.5% 𝐶𝑉𝐵 = 100% = 21.5%
9.8 20

De acuerdo a lo anterior, podemos ver que las razones de precio-ganancia


de las acciones es un indicador económico que tiene una mayor variabilidad
(fluctuación) que el rendimiento sobre la inversión.

EJERCICIO Supóngase que la planta de directores de una gran corporación, quiere


comparar la dispersión de los ingresos de sus empleados no-especializados: para
una muestra de los ejecutivos, el salario medio fue de $33,340 mensuales y la
desviación estándar es de $4,170, mientras que para la muestra de empleados no-
especializados, la media es de $917 mensuales, y la desviación estándar es de
$100. ¿En cuál grupo es mayor la dispersión relativa?

M.C. Azucena Ríos 13

También podría gustarte