Instructivo R Parte1
Instructivo R Parte1
Instructivo R Parte1
Computación
1
javier.espinosa.b@usach.cl
2
francisco.gutierrez@usach.cl
Departamento de Economı́a (FAE) Introducción a R Computación 1 / 50
Información del curso
Asignatura: Computación
Carrera: Ingenierı́a Comercial en Economı́a
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
Principales caracterı́sticas:
Es gratis.
Es un lenguaje de programación desarrollado especialmente para el análisis estadı́stico.
Existe una amplia gama de paquetes R que agrupan un conjunto de funciones
asociadas a un tema en especı́fico.
Es parte de un proyecto colaborativo, lo que fomenta la incorporación de nuevas
funciones compartidas por sus usuarios a nivel mundial.
Incorpora los últimos avances en distintos campos de la ciencia rápidamente.
Instalación de R y R-Studio:
Paso 1: Ingresar al siguiente link (Windows, Mac o Linux) y seguir las instrucciones. Link
de instalación R.
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
getwd()
[1] “C : /Usuario/MiPC /Documentos”
Además de ser una herramienta para el análisis estadı́stico R funciona como una calculadora.
Algunos operadores:
Operación Operador
+ Suma
- Resta
* Multiplicación
/ División
∧ Potencia
exp(x) Exponencial
log(x) Logaritmo en base e
log10(x) Logaritmo en base 10
sqrt(x) Raı́z
abs(x) Valor absoluto
round(x,n) Redondear x con n decimales
Departamento de Economı́a (FAE) Introducción a R Computación 12 / 50
Aspectos básicos
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
Los “objetos de datos” en R se utilizan para almacenar los valores numéricos reales o
complejos, valores lógicos o de caracteres. Estos siempre serán vectores, no hay escalares en R.
Podemos encontrar variables de tipo:
1 Numéricos.
2 Caracteres.
3 Lógicos.
4 Factores.
Podemos crear vectores en R, como tipo de caracteres hasta numéricos (recordar que vectores
de una pura palabra o un número, son vectores de longitud 1, para R). Para crear vectores se
inserta sus componentes entre “c()”:
1 Para crear o guardar un objeto de caracter también usamos la combinación de: “ < −”
1 Para crear o guardar un objeto lógico también usamos la combinación de: “ < −”
Como se logra apreciar, nuestro Objeto 3 responde a la pregunta si los caracteres del vector
Objeto 2 contiene la palabra “vector ”.
Factor (ordenado):
En el Objeto 6 se logra apreciar que ahora los niveles si tienen un orden, a diferencia de
Objeto 5, esto ocurre con la extensión de la función que acabamos de ocupar, donde se le dice
a R que utilice el orden que mencionamos.
En el caso en el que el vector corresponda a una repetición o una secuencia, se utilizan las
funciones:
1 rep(x,n): Repite x n veces, rep(3,10).
rep(3,10
[1] 3 3 3 3 3 3 3 3 3 3
2 seq(x,y,z): Crea una secuencia desde x hasta y con pasos distanciados en z unidades,
seq(2,30,2).
seq(2,30,2)
[1] 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
Tipo de estructuras:
Vector: Estructura de datos unidimensional donde todos sus componentes son del
mismo tipo de datos.
Factor: Es un tipo de vector. Cada elemento debe ser uno de un conjunto fijo de valores,
llamados niveles del factor.
Matrix: Estructura de datos bidimensional donde todos sus elementos son del mismo
tipo.
Array: Estructura de datos multidimensional. Puede ser entendida como una colección
de matrices.
Data frame: Estructura de datos bidimensional. Cada columna contiene valores del
mismo tipo de datos. Sin embargo, diferentes columnas pueden tener diferente tipos de
datos. Todas las columnas deben tener la misma longitud.
Tipos de estructuras:
1 Vector: vector x < − c(1, 4, 5).
2 Factor: factor x < − as.factor (c(“Adulto”, “Adolescente”, “Ni ño”, “Ni ño”))
factor x2 < − factor (c(“Adulto”, “Adolescente”, “Ni ño”, “Ni ño”),
levels = c(“Ni ño”, “Adolescente”, “Adulto”), ordered = TRUE ).
3 Matrix: matrix x < − matrix(3 : 11, nrow = 3, ncol = 3).
4 Array: array x < − array (1 : 5, dim = c(2, 3, 2)).
5 Data frame: dataframe x < − data.frame(“Provincias” =
c(“Arica”, “Iquique”, “Santiago”), “Numero de habitantes” =
c(222619, 299843, 5250565), “Tasa de ocupados”= c(0.572, 0.606, 0.622))
lista names()
Suponga:
t Dos vectores: x e y.
t Una matriz: mi mat.
t Un data frame: mi df
dim(data): Esta función entrega la cantidad de filas y columnas de una matriz o un array.
dim(dbase)
[1] 54 24
length(dbase)
[1] 24
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
1 Formatos de importación: TXT, DAT, XLS, XLSX, CSV, SPSS, SAS, SQL, ACCES, etc.
2 Datos faltantes: “na”, “NA”, “.”, “; ”, “”, etc.
3 Números especiales: “88”, “888”, “99”, “999”, etc.
Variable
Categórica(Cualitativa) Numérica(Cuantitativa)
donde xij representa los valores que toman las variables para la i − ésima observación.
En R se puede importar datos de muchos formatos, tales como: TXT, DAT y Excel, para esto
utilizaremos las siguientes funciones:
Antes de comenzar a importar datos desde alguna planilla de Excel, hay que instalar y cargar
un paquete:
install.packages(“readxl”)
library(readxl)
Con el paquete ya instalado, para importar datos de un libro Excel se puede hacer:
data base < − read excel(“Datos para Chile.xlsx”, sheet = “Datos provincias Chile 2017”)
En la mayorı́a de las bases de datos es necesario llevar a cabo un proceso de limpieza de datos.
La función “gsub” se utiliza para esta limpieza, la cual sirve para modificar las ocurrencias
como se muestra a continuación:
gsub(valor a buscar, valor a reemplazar, objeto)
paste(“A”, 1 : 3, sep = “, ”)
[1] “A, 1” “A, 2” “A, 3”
Existe una función que sirve para unir o fusionar dos data frames por columnas o por filas.
Suponga que:
Df 1 = data.frame(Numeros = c(“uno”, “dos”, “tres”),
Grupo= c(“impar”, “par”, “impar”))
Df 2 = data.frame(Numeros = c(“cuatro”, “dos”, “tres”),
obtencion= c(“dosxdos”, “dosxuno”, “tresxuno”))
merge(data 1, data 2, by= “”)
1 Introducción a R
2 Aspectos básicos
3 Tipos de variables
4 Estructura de datos
5 Importar datos
6 Ejercicios para R
Utilice la base de datos para las provincias de Chile del año 2017 y responda:
1 Encuentre el número total de habitantes para cada provincia.
2 Cree la variable ”densidad(hab/km2 )”.
3 Cree la variable de ”Indice de masculinidad”
4 Calcule el promedio simple de la escolaridad tanto de hombres como de mujeres.
5 Calcule el promedio ponderado de la escolaridad tanto de hombres como de mujeres.
Como ponderador use el tamaño poblacional de cada una de las provincias.
6 Calcule el ingreso promedio de las personas de una provincia ponderado por población.
7 Calcule la cantidad de ocupados e inactivos.