Semana 1 Lab
Semana 1 Lab
Semana 1 Lab
Para calcular la media se deben sumar todos los valores y luego dividirlos entre el número total de
observaciones. Por lo tanto, la fórmula de la media es la siguiente:
Ejemplo:
Para hallar la media aritmética tenemos que sumar todas las notas y luego dividir entre el número total
de asignaturas del curso, que es 5. Por lo tanto, aplicamos la fórmula de la media aritmética:
Mediana: La mediana es el valor del medio de todos los datos ordenados de menor a mayor. Es decir,
la mediana divide todo el conjunto de datos ordenados en dos partes iguales.
El cálculo de la mediana depende de si el número total de datos es par o impar:
Si el número total de datos es impar, la mediana será el valor que está justo en el medio de los datos. Es
decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
Si el número total de datos es par, la mediana será la media de los dos datos que están en el centro. Esto
es, la media aritmética de los valores que están en las posiciones n/2 y n/2+1 de los datos ordenados.
Ejemplo:
Lo primero que debemos hacer antes de realizar ningún cálculo es ordenar los datos, por lo que
ponemos los números de menor a mayor.
1,2,3,4,4,5,6,7,8,8
En este caso tenemos 11 observaciones, así que el número total de datos es impar. Por lo tanto,
aplicamos la siguiente fórmula para calcular la posición de la mediana:
2,2,4,4,6,7,8,9,11,13
Este ejemplo es diferente al anterior, ya que esta vez tenemos un total de 10 observaciones, que es un
número par. En consecuencia, el procedimiento para determinar la media es un poco más complicado.
Primero tenemos que calcular las dos posiciones centrales entre las cuales se encontrará la mediana,
para ello debemos aplicar las siguientes dos fórmulas:
Así que la mediana estará entre la quinta y la sexta posición, que corresponden a los valores 6 y 7
respectivamente. En concreto, la mediana será la media aritmética de dichos valores:
Moda: En estadística, la moda es el valor del conjunto de datos que tiene una mayor frecuencia
absoluta, es decir, la moda es el valor que más se repite de un conjunto de datos.
Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con contar el número de
veces que aparece cada dato en la muestra, y el dato más repetido será la moda.
Poner en orden los datos. Este paso no es obligatorio, pero te facilitará contar los números.
5,4,9,7,2,3,9,6,5,2,5
Los números están desordenados, por lo que primero los ordenaremos para que sea más fácil encontrar
la moda.
2,2,3,4,5,5,5,6,7,9,9
Los números 2 y 9 aparecen dos veces, pero el número 5 está repetido tres veces. Por lo tanto, la moda
de la serie de datos es el número 5.
Ejercicio 2
Varianza: es una medida de dispersión que se utiliza para representar la variabilidad de un conjunto
de datos respecto de la media aritmética de los mismo. Así, se calcula como la suma de los residuos
elevados al cuadrado y divididos entre el total de observaciones. No obstante, se trata de una medida
que también puede calcularse como la desviación típica al cuadrado.
Es una medida de dispersión ampliamente utilizada en los sectores de la economía y las finanzas,
interpretándose como el riesgo de que el rendimiento de algún procedimiento en concreto sea distinto
del rendimiento esperado de dicho procedimiento.
•
•
Ejemplo:
Pensemos en una población de elefantes y otra de ratones. La población de elefantes tiene un peso
medio de 5.000 kilogramos y una desviación típica de 400 kilogramos. La población de ratones tiene un
peso medio de 15 gramos y una desviación típica de 5 gramos. Si comparáramos la dispersión de ambas
poblaciones mediante la desviación típica podríamos pensar que hay mayor dispersión para la población
de elefantes que para la de los ratones.
Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos daríamos cuenta que es
justo al contrario.
Elefantes: 400/5000=0,08
Ratones: 5/15=0,33
Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación para los elefantes es de
apenas un 8%, mientras que el de las ratones es de un 33%. Como consecuencia de la diferencia entre
las poblaciones y su peso medio, vemos que la población con mayor dispersión, no es la que tiene una
mayor desviación típica.