9-Estadistica y Distribuciones Bi Dimension Ales
9-Estadistica y Distribuciones Bi Dimension Ales
9-Estadistica y Distribuciones Bi Dimension Ales
Caracteres. Son los apectos que deseamos estudiar en los individuos de una población.
Cada carácter puede tomar distintos valores o modalidades.
Una variable estadística recorre todos los valores de un cierto carácter. Las variables
estadísticas pueden ser:
Tablas de frecuencias
1
Si la variable toma muchos valores realizaremos una tabla de frecuencias
agrupándolos en intervalos. Para ello:
Frecuencias
Frecuencia absoluta: fi
Se llama frecuencia absoluta fi de un valor xi, al número de veces que se repite dicho
valor.
Fi = f1 + f 2 + . + f i
Frecuencia relativa: hi
5, 3, 4, 1, 2, 8, 9, 8, 7, 6, 6, 7, 9, 8, 7, 7, 1, 0, 1, 5, 9, 9, 8, 0, 8, 8, 8, 9, 5, 7.
2
a. Ordenar los datos y calculas las frecuencias.
b. Hacer un diagrama de barras de las frecuencias absolutas y dibujar el polígono
de frecuencias.
a. Ordenamos los datos contando los alumnos que han sacado un 0 han sido 2, un 1 han
sido 3 y así sucesivamente. Construimos la tabla correspondiente:
fi: frecuencia absoluta, número de veces que se repite una nota. El sumatorio nos da los
datos totales N = 30.
xi fi Fi hi=fi/N Hi
0 2 2 2 /30 2/30
1 3 5 3/30 5/30
2 1 6 1/30 6/30
3 1 7 1/30 7/30
4 1 8 1/30 8/30
5 3 11 3/30 11/30
6 2 13 2/30 13/30
7 5 18 5/30 18/30
8 7 25 7/30 25/30
9 5 30 5/30 30/30
30 1
b.
3
Ejemplo de una variable cuantativa continua.
a) Tabla de frecuencias
b) Gráfica: Histograma
Por ser una distribución continua obtenemos áreas de cada intervalo, no hay separación
entre los intervalos.
4
b) Realizar un diagrama de sectores.
. * Para hallar el ángulo a partir del porcentaje, dividimos entre 100 y multiplicamos por
360º
b) Diagrama de sectores
PARÁMETROS ESTADÍSTICOS
MEDIDAS DE CENTRALIZACIÓN
Media aritmética:
x=
∑x ⋅ f
i i
€
5
Moda Mo: Valor de una variable estadística xi que representa mayor frecuencia
absoluta fi.
D1
Si la variable es continua aplicamos la fórmula: M o = Li + c ⋅
D1 + D2
6
Cuartil inferior, Q1, es un valor de la variable que deja por debajo de él al 25%
de la población, y por encima, al 75%.
Cuartil inferior, Q3, deja por debajo de él al 75%, y por encima, al 25%.
1, 2, 2 , 3, 4, 5 , 5, 5, 6 , 8, 9, 10
Q1 = 2,5; M=Q1 = 5; Q3 = 7
MEDIDAS DE DISPERSIÓN
Rango o recorrido: diferencia entre el mayor valor y el menor valor de la variable
estadística.
2
∑( x i )
− x ⋅ fi ∑( x ) i
2
⋅ fi 2
Varianza σ :
σ
2 2
=
N
σ 2
=
N
()
− x
2
∑( x )
i ⋅ fi 2
Desviación
€ típica: σ ⇒ var ianza ⇒ σ =
€ N
()
− x
€
σ
Coeficiente de variación: C.V =
€ x
€
Ejemplo de una variable discreta
Construimos la tabla:
7
Personas x i Frecuencia f i Fi xi.fi x i 2. f i
2 4 4 8 16
3 11 15 33 99
4 11 26 44 176
5 6 32 30 150
6 6 38 36 216
7 2 40 14 98
40 165 755
En un test de inteligencia realizado a una muestra de 200 personas, se han obtenido los
resultados siguientes:
8
Puntuación 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90
Número de personas 6 18 76 70 22 8
a) Es una variable continua, debemos hallar la marca de clase para cada intervalo
sumando los valores extremos y dividiendo entre dos.
Coeficiente de variación
La media y la desviación típica de los puntos conseguidos por Ana y Rosa en una
semana de entrenamiento jugando al baloncesto han sido las siguientes: media de Ana
22 puntos y desviación típica 4,106. Media de Rosa 22 puntos y desviación típica 2.
a) Calcula el coeficiente de variación de cada una de ellas.
9
10
DISTRIBUCIONES BIDIMENSIONALES
CORRELACIÓN
Tenemos un colectivo de n individuos. Estudiamos en ellos dos variables, x, y.
Conocemos los valores de las variables para cada uno de los individuos.
El conjunto de pares de valores ( x1, y1 ) , ( x 2 , y 2 ) , ( x n , y n )
se llama distribución
bidimensional. Si interpretamos cada par de valores como las coordenadas de un punto,
el conjunto de todos ellos se llama nube de puntos o diagrama de dispersión.
La correlación viene
€ a representar
€ la€relación que existe entre esas dos variables
para los n individuos. Puede ser más o menos fuerte según lo apretados que estén los
puntos de la nube en torno a una recta que marca la tendencia y se llama recta de
regresión. Si la pendiente de la recta de regresión es positiva o negativa la correlación
se llama positiva o negativa, respectivamente.
Ejemplos:
• Horas de estudio – Horas de televisión
• Estatura media de los padres – Estatura media de los hijos
• Nota de matemáticas – Nota de física
Estas son las notas de 12 estudiantes en Matemáticas y en Física.
ALUMNO a b c d e f g h i j k l
MATEMÁTICAS 2 3 4 4 5 6 6 7 7 8 10 10
FÍSICA 1 3 2 4 4 4 6 4 6 7 9 10
Medida de la correlación
Vamos a indicar la expresión que nos servirá para obtener su valor de forma numérica e
inequívoca.
11
Centro de gravedad de una distribución bidimensional
Media de la variable x → x =
∑x i
Media de la variable y → y =
∑y i
n n
( )
El punto x, y se llama centro de gravedad de la distribución.
Covarianza€ €
σ xy =
∑( x i )(
− x ⋅ yi − y ) = ∑ x ⋅y
i i
− x⋅ y
n n
Ambas expresiones, como es lógico, coinciden. La segunda de ellas es más cómoda
para obtener numéricamente la covarianza.
€
Correlación
El valor de la correlación entre las dos variables de una distribución bidimensional
viene dado por la expresión:
σ xy
r= σ xy
es la covarianza;
σx ⋅σy
12
Recta de regresión
Tenemos una distribución bidimensional y representamos la nube de puntos
correspondiente. La recta que mejor se ajusta a esta nube de puntos recibe el nombre de
recta de regresión.
Consideramos todas las rectas posibles y = A + Bx y nos quedaremos con aquella para
la cual los cuadrados de las distancias, di (de los puntos a las rectas), sumen lo menos
posible. La recta buscada pasa por el centro de gravedad de la distribución y su
σ
pendiente es myx = xy2 . €
σx
σ xy
La recta tiene por ecuación: y=y+
σ x2
(
⋅ x−x )
€
σ xy
Se llama recta de regresión de Y sobre X. A la pendiente, ,
se le llama coeficiente
σ x2
€
de regresión.
σ σ
La recta de regresión de X sobre Y es: (
x = x + €xy2 ⋅ y − y
σx
)
Al número, xy2 ,
se le
σy
llama coeficiente de regresión de X sobre Y. No es la pendiente de la recta, sino su
inversa.
La recta de regresión para hacer € estimaciones: Se amolda a la€nube de puntos y
describe, grosso modo, su tendencia. Por eso, a partir de la recta de regresión
obtenemos, de forma aproximada, el valor esperado de y para un cierto valor x, o
viceversa. A estos valores se les llama estimaciones.
yˆ ( x o ) es el valor estimado de y correspondiente a x = x o sobre la recta de regresión.
13