Instructivo R Parte1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 50

Introducción a R

Facultad de Administración y Economı́a


Universidad de Santiago de Chile

Profesor: Javier Espinosa Brito1


Ayudante: Francisco Gutiérrez Miranda2

Computación

1
javier.espinosa.b@usach.cl
2
francisco.gutierrez@usach.cl
Departamento de Economı́a (FAE) Introducción a R Computación 1 / 50
Información del curso

Asignatura: Computación
Carrera: Ingenierı́a Comercial en Economı́a

Profesor: Javier Espinosa Brito


Correo: javier.espinosa.b@usach.cl
Horario de Clases: L7 - L8 a partir de las 19:00hrs.

Ayudante: Francisco Gutiérrez Miranda


Correo: francisco.gutierrez@usach.cl
Horario Ayudantı́a: Sábado, 08:00 a 09:00.

Departamento de Economı́a (FAE) Introducción a R Computación 2 / 50


Información del curso: Evaluación
Evaluación Ponderación
Conocimientos en R 35 %
Conocimientos en Excel, VBA y Python 35 %
Controles (de 2 a 3) 30 %
Inasistencia a prueba o no entrega de trabajo.
En caso de inasistencia a alguna prueba o no entrega de un trabajo a tiempo, dicha falta
debe ser justificada, con evidencia fuerte y clara, ante el profesor por correo electrónico
dentro de los 5 dı́as hábiles siguientes a la fecha de evaluación. La falta de justificación o
evidencia significará la nota mı́nima en la evaluación.
Copia.
Se entenderá por copia aquel texto/código que sea igual al de otro entre estudiantes o
entre un/a estudiante y alguna otra fuente ajena a su propia creación (blog, página, web,
libro, etc.), en su totalidad o parcialmente dentro del desarrollo de alguna respuesta. La
sanción se aplicará tanto al proveedor del material como al usuario y su magnitud
dependerá de la gravedad del hecho, partiendo desde la nota mı́nima en la respuesta.
Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 4 / 50


Introducción: ¿Qué es R?

Principales caracterı́sticas:
Es gratis.
Es un lenguaje de programación desarrollado especialmente para el análisis estadı́stico.
Existe una amplia gama de paquetes R que agrupan un conjunto de funciones
asociadas a un tema en especı́fico.
Es parte de un proyecto colaborativo, lo que fomenta la incorporación de nuevas
funciones compartidas por sus usuarios a nivel mundial.
Incorpora los últimos avances en distintos campos de la ciencia rápidamente.

Departamento de Economı́a (FAE) Introducción a R Computación 5 / 50


Introducción: Instalación

Instalación de R y R-Studio:
Paso 1: Ingresar al siguiente link (Windows, Mac o Linux) y seguir las instrucciones. Link
de instalación R.

Paso 2: Para poder instalar R-Studio es necesario tener R, la descarga se encuentra en el


siguiente link. Link de instalación R-Studio.

Departamento de Economı́a (FAE) Introducción a R Computación 6 / 50


Introducción: Interfaz R-Studio
R-Studio

Departamento de Economı́a (FAE) Introducción a R Computación 7 / 50


Introducción: Interfaz R-Studio

Script: Panel superior izquierdo. Acá se registran las funciones (códigos).


Resultados-consola: Panel inferior izquierdo. Acá se muestra la ejecución de nuestros
códigos.
Gráficos-Ayuda-Archivos: Panel inferior derecho. Acá se muestran los gráficos, las
ayudas de los
códigos, etc.
Objetos: Panel superior derecho. Acá se guardan los objetos creados en el cuadrante de
Script a través de los códigos.

Departamento de Economı́a (FAE) Introducción a R Computación 8 / 50


Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 9 / 50


Aspectos básicos: Directorio de trabajo

1 Para ejecutar un código se selecciona y se presiona Ctrl + Enter.


2 Para conocer el directorio en el que trabajamos, usamos:

getwd()
[1] “C : /Usuario/MiPC /Documentos”

3 Si deseamos cambiar el directorio de trabajo, usamos:

setwd(“D : /Computaci ón/Usach/2021”)


getwd()
[1] “D : /Computaci ón/Usach/2021”

4 IMPORTANTE, a diferencia de STATA para escribir la dirección de trabajo se utiliza


“/” para separar la dirección.

Departamento de Economı́a (FAE) Introducción a R Computación 10 / 50


Aspectos básicos: Identificar y borrar objetos

Algunas funciones útiles para comenzar a usar R:

1 ls(): Muestra los objetos creados.


2 rm(): Borra objetos.
3 rm(list=ls()): Borra todos los objetos creados.

Departamento de Economı́a (FAE) Introducción a R Computación 11 / 50


Aspectos básicos: Operadores y funciones matemáticas básicas

Además de ser una herramienta para el análisis estadı́stico R funciona como una calculadora.
Algunos operadores:
Operación Operador
+ Suma
- Resta
* Multiplicación
/ División
∧ Potencia
exp(x) Exponencial
log(x) Logaritmo en base e
log10(x) Logaritmo en base 10
sqrt(x) Raı́z
abs(x) Valor absoluto
round(x,n) Redondear x con n decimales
Departamento de Economı́a (FAE) Introducción a R Computación 12 / 50
Aspectos básicos

Ejercicio: Calcule en R la siguiente suma 3+56+201. Ahora, calcule la siguiente operación


usando los operadores mostrados anteriormente:

5 − (12 − (16 − (125 : 15x3)) − 34 )


Los resultados de cualquier operación aparecen de color azul, antecedido por >, mientras que
cualquier código o sentencia que escribamos aparecerá en color rojo.

Departamento de Economı́a (FAE) Introducción a R Computación 13 / 50


Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 14 / 50


Tipos de variables

Los “objetos de datos” en R se utilizan para almacenar los valores numéricos reales o
complejos, valores lógicos o de caracteres. Estos siempre serán vectores, no hay escalares en R.
Podemos encontrar variables de tipo:

1 Numéricos.
2 Caracteres.
3 Lógicos.
4 Factores.

Departamento de Economı́a (FAE) Introducción a R Computación 15 / 50


Tipos de variables: Numéricos
1 Para crear o guardar un objeto usamos la combinación de: “ < −”
Objeto 1 < − 3 + 2
Este quedara guardado en el cuadrante superior derecho de la pantalla.
2 Para ver su contenido se puede seleccionar el nombre del objeto y/o escribirlo nuevamente:
x < − 0 : 10
x
[1] 0 1 2 3 4 5 6 7 8 9 10

3 El objeto puede ser usado para crear uno nuevo:


x < − 0 : 10
y <− x +3
y
[1] 3 4 5 6 7 8 9 10 11 12 13
Tipos de variables: Numéricos

Podemos crear vectores en R, como tipo de caracteres hasta numéricos (recordar que vectores
de una pura palabra o un número, son vectores de longitud 1, para R). Para crear vectores se
inserta sus componentes entre “c()”:

x < − c(2, 5 : 7, 1, 20)


x
[1] 2 5 6 7 1 20

Departamento de Economı́a (FAE) Introducción a R Computación 17 / 50


Tipos de variables: Numéricos

Ejemplos de variables numéricas en R:

Departamento de Economı́a (FAE) Introducción a R Computación 18 / 50


Tipos de variables: Caracter

1 Para crear o guardar un objeto de caracter también usamos la combinación de: “ < −”

Objeto 2 < − c(“creamos”, “un”, “vector ”, “de”, “caracter ”)


Objeto 2
[1] “creamos” “un” “vector ” “de” “caracter ”

Departamento de Economı́a (FAE) Introducción a R Computación 19 / 50


Tipos de variables: Caracter

Ejemplos de variables de caracter en R:

Departamento de Economı́a (FAE) Introducción a R Computación 20 / 50


Tipos de variables: Lógicos

1 Para crear o guardar un objeto lógico también usamos la combinación de: “ < −”

Objeto 3 < − {Objeto 2 == “vector ”}


Objeto 3
[1] FALSE FALSE TRUE FALSE FALSE

Como se logra apreciar, nuestro Objeto 3 responde a la pregunta si los caracteres del vector
Objeto 2 contiene la palabra “vector ”.

Departamento de Economı́a (FAE) Introducción a R Computación 21 / 50


Tipos de variables: Lógicos

Ejemplos de variables lógicas en R:

Departamento de Economı́a (FAE) Introducción a R Computación 22 / 50


Tipos de variables: Factores
Existen dos tipos de factores, los “no ordenados” y los “ordenados”. Para crearlos o
guardarlos también se usa la combinación de: “ < −”
Factor (no ordenado):

Objeto 4 < − factor (c(“Primaria”, “Secundaria”, “Universitaria”, “Primaria”))


Objeto 4
[1] Primaria Secundaria Universitaria Primaria
Levels: Primaria Secundaria Universitaria

Objeto 5 < − factor (c(“bajo”, “medio”, “alto”, “bajo”))


Objeto 5
[1] bajo medio alto bajo
Levels: alto bajo medio

En el Objeto 5 se aprecia que los niveles del factor no estan ordenados.


Tipos de variables: Factores
Ejemplos de variables de factor no ordenado en R:
Tipos de variables: Factores

Factor (ordenado):

Objeto 6 < − factor (c(“bajo”, “medio”, “alto”, “bajo”), levels =


c(“bajo”, “medio”, “alto”), ordered = TRUE )
Objeto 6
[1] bajo medio alto bajo
Levels: bajo < medio < alto

En el Objeto 6 se logra apreciar que ahora los niveles si tienen un orden, a diferencia de
Objeto 5, esto ocurre con la extensión de la función que acabamos de ocupar, donde se le dice
a R que utilice el orden que mencionamos.

Departamento de Economı́a (FAE) Introducción a R Computación 25 / 50


Tipos de variables: Factores

Ejemplos de variables de factor ordenado en R:

Departamento de Economı́a (FAE) Introducción a R Computación 26 / 50


Tipos de variables: Tipos de datos

Hay distintos tipos de datos:


1 De Texto (caracteres): “Mi primer texto”
2 Double: 1 + e13
3 Integer: 10L
4 Numérico (real o decimal): -3 , 0.05 , 2
5 Logical: TRUE, FALSE
6 Complex: 2 + 3i

Departamento de Economı́a (FAE) Introducción a R Computación 27 / 50


Tipos de variables

En el caso en el que el vector corresponda a una repetición o una secuencia, se utilizan las
funciones:
1 rep(x,n): Repite x n veces, rep(3,10).

rep(3,10
[1] 3 3 3 3 3 3 3 3 3 3

2 seq(x,y,z): Crea una secuencia desde x hasta y con pasos distanciados en z unidades,
seq(2,30,2).

seq(2,30,2)
[1] 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30

Departamento de Economı́a (FAE) Introducción a R Computación 28 / 50


Tipos de variables

Ejercicio: Defina el vector con los objetos 10,30,31,32,33,0,-2 y 40.

Ejercicio: Defina un objeto x como el vector 1,3,5,7,...31,6,6,6,6,6.

Departamento de Economı́a (FAE) Introducción a R Computación 29 / 50


Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 30 / 50


Estructura de datos

Tipo de estructuras:

Vector: Estructura de datos unidimensional donde todos sus componentes son del
mismo tipo de datos.

Factor: Es un tipo de vector. Cada elemento debe ser uno de un conjunto fijo de valores,
llamados niveles del factor.

Departamento de Economı́a (FAE) Introducción a R Computación 31 / 50


Estructura de datos

Matrix: Estructura de datos bidimensional donde todos sus elementos son del mismo
tipo.

Departamento de Economı́a (FAE) Introducción a R Computación 32 / 50


Estructura de datos

Array: Estructura de datos multidimensional. Puede ser entendida como una colección
de matrices.

Departamento de Economı́a (FAE) Introducción a R Computación 33 / 50


Estructura de datos

Data frame: Estructura de datos bidimensional. Cada columna contiene valores del
mismo tipo de datos. Sin embargo, diferentes columnas pueden tener diferente tipos de
datos. Todas las columnas deben tener la misma longitud.

Departamento de Economı́a (FAE) Introducción a R Computación 34 / 50


Estructura de datos

List: Estructura de datos multidimensional. Es la estructura de datos más compleja.


Cada componente de una lista puede ser de cualquier tipo de datos.

Departamento de Economı́a (FAE) Introducción a R Computación 35 / 50


Estructura de datos

Tipos de estructuras:
1 Vector: vector x < − c(1, 4, 5).
2 Factor: factor x < − as.factor (c(“Adulto”, “Adolescente”, “Ni ño”, “Ni ño”))
factor x2 < − factor (c(“Adulto”, “Adolescente”, “Ni ño”, “Ni ño”),
levels = c(“Ni ño”, “Adolescente”, “Adulto”), ordered = TRUE ).
3 Matrix: matrix x < − matrix(3 : 11, nrow = 3, ncol = 3).
4 Array: array x < − array (1 : 5, dim = c(2, 3, 2)).
5 Data frame: dataframe x < − data.frame(“Provincias” =
c(“Arica”, “Iquique”, “Santiago”), “Numero de habitantes” =
c(222619, 299843, 5250565), “Tasa de ocupados”= c(0.572, 0.606, 0.622))

Departamento de Economı́a (FAE) Introducción a R Computación 36 / 50


Estructura de datos: Funciones claves

Asignación de nombres a objetos en R:


Definir nombres de
Definir nombres Definir nombres
Objeto componentes/sub-
columna filas
objeto
vector names()

matriz colnames() rownames()

data frame names() row.names()

lista names()

Departamento de Economı́a (FAE) Introducción a R Computación 37 / 50


Estructura de datos: Conversión de estructura de datos

Suponga:
t Dos vectores: x e y.
t Una matriz: mi mat.
t Un data frame: mi df

A un vector largo A matriz A data frame


desde vector c(x,y) cbind(x,y) data.frame(x,y)
rbind(x,y)
desde matriz as.vector(mi mat) as.data.frame(mi mat)

desde data frame as.matrix(mi df)

Departamento de Economı́a (FAE) Introducción a R Computación 38 / 50


Estructura de datos: Consultadores de tamaño

dim(data): Esta función entrega la cantidad de filas y columnas de una matriz o un array.

dim(dbase)
[1] 54 24

length(data): Esta función sirve para ver la longitud de un objeto.

length(dbase)
[1] 24

Departamento de Economı́a (FAE) Introducción a R Computación 39 / 50


Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 40 / 50


Importar datos: Formatos

Antes de comenzar a importar es importante saber:

1 Formatos de importación: TXT, DAT, XLS, XLSX, CSV, SPSS, SAS, SQL, ACCES, etc.
2 Datos faltantes: “na”, “NA”, “.”, “; ”, “”, etc.
3 Números especiales: “88”, “888”, “99”, “999”, etc.

Departamento de Economı́a (FAE) Introducción a R Computación 41 / 50


Importar datos: Estadı́stica descriptiva en R

Variable

Categórica(Cualitativa) Numérica(Cuantitativa)

Nominal Ordinal Discreta Continua

Departamento de Economı́a (FAE) Introducción a R Computación 42 / 50


Importar datos: Bases de datos

La información recolectada suele presentarse de la siguiente manera:


Variables
Observación X1 X2 X3 ... Xj ... Xk
1 x11 x12 x13 ... x1j ... x1k
2 x21 x22 x23 ... x2j ... x2k
3 x31 x32 x33 ... x3j ... x3k
. . . . . . .
. . . . ... . . .
. . . . . . .
i xi1 xi2 xi3 ... xij ... xik
. . . . . . .
. . . . ... . . .
. . . . . . .
N xN1 xN2 xN3 ... xNj ... xNk

donde xij representa los valores que toman las variables para la i − ésima observación.

Departamento de Economı́a (FAE) Introducción a R Computación 43 / 50


Importar datos

En R se puede importar datos de muchos formatos, tales como: TXT, DAT y Excel, para esto
utilizaremos las siguientes funciones:

1 read.table(): Importa Base de datos en formato TXT, DAT y CVS.


2 read.csv2(): Importa Base de datos en formato CVS.
3 readxl(): Importa Base de datos en formato XLS y XLSX.

De manera más simple se puede utilizar la herramienta: File-Import Dataset y elegir el


archivo.

Departamento de Economı́a (FAE) Introducción a R Computación 44 / 50


Importar datos: Excel

Antes de comenzar a importar datos desde alguna planilla de Excel, hay que instalar y cargar
un paquete:

install.packages(“readxl”)
library(readxl)

Con el paquete ya instalado, para importar datos de un libro Excel se puede hacer:

data base < − read excel(“Datos para Chile.xlsx”, sheet = “Datos provincias Chile 2017”)

Departamento de Economı́a (FAE) Introducción a R Computación 45 / 50


Importar datos: Manipulación de datos

En la mayorı́a de las bases de datos es necesario llevar a cabo un proceso de limpieza de datos.
La función “gsub” se utiliza para esta limpieza, la cual sirve para modificar las ocurrencias
como se muestra a continuación:
gsub(valor a buscar, valor a reemplazar, objeto)

gsub(“h”, “H”, c(“hola”, “b úho”))


[1] “Hola” “b úHo”

gsub(“A”, “AAA”, c(“abc”, “cbA”))


[1] “abc” “cbAAA”

Departamento de Economı́a (FAE) Introducción a R Computación 46 / 50


Importar datos: Manipulación de datos

paste(objeto 1, objeto 2, ..., sep=””): Sirve para concatenar los vectores.

paste(“A”, 1 : 3, sep = “, ”)
[1] “A, 1” “A, 2” “A, 3”

paste(“Funciones”, “Incorporadas”, sep = “ − ”)


[1] “Funciones − Incorporadas”

Departamento de Economı́a (FAE) Introducción a R Computación 47 / 50


Importar datos: Manipulación de datos

Existe una función que sirve para unir o fusionar dos data frames por columnas o por filas.
Suponga que:
Df 1 = data.frame(Numeros = c(“uno”, “dos”, “tres”),
Grupo= c(“impar”, “par”, “impar”))
Df 2 = data.frame(Numeros = c(“cuatro”, “dos”, “tres”),
obtencion= c(“dosxdos”, “dosxuno”, “tresxuno”))
merge(data 1, data 2, by= “”)

merge(Df1, Df2, by= “Numeros”)


Numeros Grupo obtencion
1 dos par dosxuno
2 tres impar tresxuno

Departamento de Economı́a (FAE) Introducción a R Computación 48 / 50


Estructura

1 Introducción a R

2 Aspectos básicos

3 Tipos de variables

4 Estructura de datos

5 Importar datos

6 Ejercicios para R

Departamento de Economı́a (FAE) Introducción a R Computación 49 / 50


Ejercicio Provincias de Chile

Utilice la base de datos para las provincias de Chile del año 2017 y responda:
1 Encuentre el número total de habitantes para cada provincia.
2 Cree la variable ”densidad(hab/km2 )”.
3 Cree la variable de ”Indice de masculinidad”
4 Calcule el promedio simple de la escolaridad tanto de hombres como de mujeres.
5 Calcule el promedio ponderado de la escolaridad tanto de hombres como de mujeres.
Como ponderador use el tamaño poblacional de cada una de las provincias.
6 Calcule el ingreso promedio de las personas de una provincia ponderado por población.
7 Calcule la cantidad de ocupados e inactivos.

Departamento de Economı́a (FAE) Introducción a R Computación 50 / 50

También podría gustarte