Informe Estadistica Rstudio
Informe Estadistica Rstudio
Informe Estadistica Rstudio
EXTENSIÓN LA MANÁ
ASIGNATURA
ESTADÍSTICA APLICADA A LA ECONOMÍA Y NEGOCIOS
CICLO
CUARTO ADMINISTRACION
INTEGRANTES
MENDOZA LEON NAYELI ANAHI
TOMALA BRAVO GLORIA ISABEL
VIZUETE CORRALES SAMANTHA MARGOTH
ZAMBRANO CALUNIA YANELLA NOHELY
Paso 2.- Cargamos la base de datos en Rstudio, dando clic en Import Dataset, seguido de eso
nos aparecerá una ventana donde podemos buscar el archivo e importarlo, una vez
seleccionado el archivo nos aparecerá la vista previa del código para comenzar con el análisis
de datos.
Paso 3.- En el análisis de datos hallaremos lo siguiente de las 3 variables que usaremos.
Máximo
Mínimo
Numero de datos
Rango
Medidas de tendencia central
Medidas de dispersión
Cuartiles por medio de la formula quintiles
Resumen de datos
Gráficos
Paso 4.- Realizar el análisis de datos de las 3 variables, el procedimiento es el mismo para
cada variable y a continuación detallaremos como lo hicimos.
Variable Edad
Primero se analiza los datos de la variable Edad (máximo, mínimo, nº de datos y
rango), escribiendo la fórmula de cada uno como se muestra dentro del recuadro.
Segundo ejecutaremos dando clic en “Run” o a su vez aplastando Ctrl+intro y se nos
imprimirá en la parte de abajo como lo muestra la imagen de lado.
Tercero hallaremos los datos de las medidas de tendencia central y dispersión.
Formulas:
- maximo = max(basededatos$variable)
máximo
- minimo = min(basededatos$variable)
minimo
- n = length(basededatos$variable)
n
- R = maximo – minimo
R
Medidas de dispersión
Formulas:
- varianza= var(basededatos$variable)
varianza
- desviacion_estandar = sd(basededatos$variable)
desviacion_estandar
Formula:
IQR=IQR(basededatos$variable)
IQR
Nota: Todas las fórmulas que hemos usado para la variable edad se usara tanto en la
variable peso, como en la variable talla y se realizara el mismo procedimiento como
lo detallamos anteriormente.
Variable Peso
(Máximo, mínimo, nº de datos y rango)
Variable Talla
(Máximo, mínimo, nº de datos y rango)
Medidas de tendencia central
Medidas de dispersión
Para el resumen se necesitará usar la siguiente formula y así mismo, esta se usará para
las 3 variables.
library(descriptr)
ds_summary_stats(bdd$variable)
Las siguientes fórmulas son para que nos de las gráficas de cada variable.
x11()
par(mfrow = c(3,3))
hist(basededatos$variable)
plot(density(basededatos$variable))
boxplot(basededatos$variable)
qqnorm(basededatos$variable)
qqline(basededatos$variable)
50
50
nominasAlumnos_50_$Edad
10
Frequency
40
40
30
30
5
20
20
0
20 30 40 50 60 5 10 15 20
nominasAlumnos_50_$Edad Index
40
30
20
-2 -1 0 1 2
Theoretical Quantiles
nominasAlumnos_50_$Peso
80
80
6
70
Frequency
70
4
60
60
2
50
50
0
40 50 60 70 80 90 5 10 15 20
nominasAlumnos_50_$Peso Index
70
60
50
-2 -1 0 1 2
Theoretical Quantiles
180
180
8
nominasAlumnos_50_$Talla
6
Frequency
160
160
4
2
140
140
0
nominasAlumnos_50_$Talla Index
160
140
-2 -1 0 1 2
Theoretical Quantiles