Cómo Calcular La Varianza
Cómo Calcular La Varianza
Cómo Calcular La Varianza
artículo
Método 1
Calcular la varianza de una muestra
1.
2.
1
Toma nota de la muestra del conjunto de datos. En la mayoría de los casos,
los estadísticos solo tienen acceso a una muestra o a un subconjunto de la
población que van a analizar. Por ejemplo, en vez de analizar la población
"costo de todos los autos de Alemania", un estadístico averiguaría el costo de
una muestra aleatoria de unos pocos miles de autos. De este modo podría
basarse en esa muestra para obtener una estimación aproximada del costo de
los autos en Alemania, aunque es posible que no coincida con el valor exacto.
Ejemplo: analizando la cantidad de panquecitos que se venden todos los días
en una cafetería, tomas una muestra de seis días aleatorios y obtienes los
siguientes resultados: 17, 15, 23, 7, 9, 13. Esta es una muestra, no la
población, ya que no tienes los datos de todos y cada uno de los días en los
cuales ha estado abierta la cafetería.
Si tienes todos los puntos de datos de una población, continúa con el próximo
método.
3.
2
Anota la fórmula de la varianza de una muestra. La varianza de un conjunto
de datos te indica qué tan dispersos están los puntos de datos. Mientras más
cerca de cero esté la varianza, más cercanos estarán entre sí los puntos de
datos. Cuando vayas a trabajar con muestras de conjuntos de datos, utiliza la
siguiente fórmula para calcular la varianza:[3]
= ∑[( - x̅) ]/
(n - 1)
3
Calcula la media de la muestra. El símbolo x̅ o "x barra" se refiere a la media
de la muestra.[4] Calcúlala como lo calcularías cualquier media: suma todos los
puntos de datos, luego divídela por la cantidad de puntos de datos.
Por ejemplo: primero suma todos los puntos de datos: 17 + 15 + 23 + 7 + 9 +
13 = 84
A continuación, divide la respuesta por la cantidad de puntos de datos, en este
caso, seis: 84 ÷ 6 = 14.
Media de la muestra = x̅ = 14.
Puedes pensar en la media como el "punto central" de los datos. Si los datos
se agrupan cerca de la media, entonces la varianza será baja. Si se encuentran
esparcidos lejos de la media, la varianza será alta.
5.
4
Réstale la media a cada punto de datos. Ahora es momento de
- x̅ = 17 - 14 = 3
- x̅ = 15 - 14 = 1
- x̅ = 23 - 14 = 9
- x̅ = 7 - 14 = -7
- x̅ = 9 - 14 = -5
- x̅ = 13 - 14 = -1
Es fácil revisar tu trabajo, ya que la suma de las respuestas debe ser igual a
cero. Esto se debe justamente a la definición de la media, ya que las
respuestas negativas (distancia de los números pequeños respecto de la
media) cancelan exactamente las respuestas positivas (distancia de los
números más grandes respecto de la media).
6.
5
Eleva cada resultado al cuadrado. Tal como se explicó más arriba, la lista
( - x̅)
- x̅)
92 = 81
(-7)2 = 49
(-5)2 = 25
(-1)2 = 1
8.
8
Aprende a distinguir varianza de desviación estándar. Ten en cuenta que,
al haber un exponente en la fórmula, la varianza se mide en unidades al
cuadrado de los datos originales. Esto puede hacer que no sea tan sencillo
entenderlo en forma intuitiva. En su lugar, a menudo se usa la desviación
estándar. De todas formas, tu esfuerzo no fue en vano, ya que la desviación
estándar no es otra cosa que la raíz cuadrada de la varianza. Es por eso que la
Método 2
Calcular la varianza de una población
1.
1
Comienza con un conjunto de datos de la población. El término "población"
hace referencia al total de datos de las observaciones relevantes. Por ejemplo,
si vas a analizar la edad de los residentes del estado de Texas, tu población
debe incluir la edad de cada uno de los residentes de Texas. Normalmente,
para un conjunto de datos tan grande como ese, crearías una hoja de cálculo.
Sin embargo, aquí tienes un conjunto más pequeño de datos como ejemplo:
Ejemplo: en la habitación de un acuario hay exactamente 6 peceras. Las seis
peceras contienen la siguiente cantidad de peces:
2.
2
Anota la fórmula de la varianza de la población. Debido a que la población
contiene todos los datos que necesitas, esta fórmula te dará el valor exacto de
la varianza de la población. Para poder distinguirla de la varianza de una
muestra (que es solo un valor aproximado), los estadísticos usan otras
variables:[8]
σ = (∑( - μ) )/
n
3
Encuentra la media de la población. Cuando analizas una población, el
símbolo μ ("mu") representa la media aritmética. Para encontrar la media, suma
todos los puntos de datos y luego divide el resultado por la cantidad de puntos
de datos.
Puedes pensar en la media como el "promedio", pero ten cuidado, ya que esa
palabra tiene muchas definiciones en matemática.
4.
4
Réstale la media a cada punto de datos. Los puntos de datos cercanos a la
media tendrán una diferencia más cercana a cero. Repite la resta para cada
punto de datos y comenzarás a tener una noción aproximada de qué tan
dispersos están los datos.
Ejemplo:
- μ = 5 - 10,5 = -5,5
- μ = 5 - 10,5 = -5,5
- μ = 8 - 10,5 = -2,5
- μ = 12 - 10,5 = 1,5
- μ = 15 - 10,5 = 4,5
- μ = 18 - 10,5 = 7,5
5.
5
Eleva al cuadrado todas las respuestas. Ahora, algunos de los números del
paso anterior serán negativos mientras que otros serán positivos. Si dibujas tus
datos en una línea numérica, estas dos categorías representarán los números
que están a la izquierda de la media y los que están a la derecha de la media.
Estos valores no son de mucha ayuda para calcular la varianza, ya que los dos
grupos se cancelarían entre sí. Eleva al cuadrado cada uno de los números
para transformarlos en valores positivos.
Ejemplo:
(-5,5) = 30,25
(-5,5) = 30,25
(-2,5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7,5) = 56,25
6.
6
Encuentra la media de tus resultados. Ahora tienes un valor para cada punto
de datos, relacionado (indirectamente) con la dispersión que ese punto de
datos tiene respecto de la media. Calcula la media de estos valores
sumándolos y luego dividiendo la suma por la cantidad de valores.
Ejemplo:
)/
n, que es la fórmula de la varianza.
Consejos
Debido a que es difícil interpretar la varianza, este valor generalmente se
calcula como punto de partida para el cálculo de la desviación estándar.
hayas listado los puntos de datos, el n-ésimo punto final ya tendrá una
restricción, dado que solamente algunos valores resultarán en la media de la
muestra (x̅) utilizada en la fórmula de la varianza.[10]
Referencias
1. ↑ http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_HypothesisTesting-
ANOVA/BS704_HypothesisTesting-Anova_print.html
2. ↑ http://insidebigdata.com/2014/10/22/ask-data-scientist-bias-vs-variance-
tradeoff/
3. ↑ https://www.youtube.com/watch?v=VgKHjVDK0uM
4. ↑ http://stattrek.com/statistics/notation.aspx
5. ↑ http://www.mathsisfun.com/data/standard-deviation.html
6. ↑ https://www.youtube.com/watch?v=sOb9b_AtwDg
7. ↑ https://www.youtube.com/watch?v=sOb9b_AtwDg
8. ↑ https://www.youtube.com/watch?v=VgKHjVDK0uM
9. ↑ http://datapigtechnologies.com/blog/index.php/understanding-standard-
deviation-2/
Mostrar más... (1)
wikiHows relacionados
Cómo
calcular el área y el perímetro
Cómo
calcular el diámetro de un círculo
Cómo
encontrar una raíz cuadrada sin una calculadora
Cómo
calcular un incremento en porcentaje
Cómo
calcular la velocidad
Cómo
calcular la variación porcentual
Cómo
calcular peso a partir de la masa
Cómo
descomponer números
Cómo
calcular una frecuencia
Cómo
calcular la apotema de un hexágono
Cómo
multiplicar fracciones por números enteros
Cómo
calcular el rango estadístico
Categorías: Matemáticas
En otros idiomas: