Armando Un Proyecto de Trabajo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Armando un proyecto de trabajo

R + Ciencias Sociales
Hoja de ruta

✔️Paquetes
✔️Lectura / escritura de archivos
✔️Proyectos

2 / 23
Paquetes

3 / 23
Paquetes
Con R podemos aumentar las funciones para realizar operaciones a través de los
paquetes.

4 / 23
Paquetes

Para poder usar un paquete, primero Cada vez que queremos utilizar una
debemos instalarlo: función del paquete, debemos
convocarlo:
install.packages("nombre_del_paquete")
library(nombre_del_paquete)
Tener en cuenta:
Tener en cuenta:
El nombre del paquete va entre comillas.
El nombre del paquete va sin comillas.
Esta función se corre una sóla vez (por
computadora) Se corre cada vez que quiero usar una
función del paquete en cuestión.

5 / 23
Proyectos y rutas de trabajo

6 / 23
Proyectos y rutas de trabajo
Supongamos que descargo la base de datos de registros de certificados CUIDAR-
VERANO en formato separado por comas (.csv) y la quiero importar con R.

la función que me permite importar una base de datos de tipo .csv se llama
read.csv() :

base_cuidar <- read.csv(


file = "C:/Users/pablo/Documents/Pablo/Cursos R/R+BigData/entradas/certificados-personas-por-f
header = TRUE,
sep = ",",
dec = ".")

7 / 23
Proyectos y rutas de trabajo
A tener en cuenta respecto a la ruta donde se ubica el archivo (nuestra base):

base_cuidar <- read.csv(


'file = "C:/Users/pablo/Documents/Pablo/Cursos R/R+BigData/entradas/certificados-personas-por-
header = TRUE,
sep = ",",
dec = ".")

Si se la compartimos a otra persona, se rompe

Si cambiamos de computadora, se rompe

Si lo cambiamos de lugar, se rompe

8 / 23
9 / 23
Armar un nuevo proyecto

Paso 1: Paso 2:

10 / 23
Armar un nuevo proyecto

Paso 3: Resultado:

11 / 23
Proyectos y rutas de trabajo
Armando un proyecto con Rstudio, la función se escribiría de esta forma:

base_cuidar <- read.csv(


'file = "entradas/certificados-personas-por-fecha-ingreso-provincia-localidad.csv",'
header = TRUE,
sep = ",",
dec = ".")

Ventajas:
- Le indicamos a R dónde "vive" nuestra carpeta de trabajo

- La ruta ya no contiene ninguna referencia personal que impida ser abierto en otra computadora

12 / 23
Lectura / escritura de datos

13 / 23
Lectura / escritura de datos
R base tiene una función para cada extensión de archivo:

read.table() --> .txt

read.csv() --> .csv

readRDS() --> .rds

14 / 23
Lectura / escritura de datos
Pero... ¿no están todas, no?
Para ello, instalaremos algunos paquetes que nos permiten incorporar más
funciones para leer más tipos de datos.
Por ejemplo, el paquete haven incorpora:

read_sas() --> .sas (SAS)

read_spss() --> .sav (SPSS)

read_stata() --> .dta (STATA)

y el paquete readxl :

read_xlsx() --> .xlsx (Excel)


15 / 23
Lectura / escritura de datos
Supongamos que queremos comenzar un nuevo proyecto para analizar el conjunto
de certificados solicitados para vacacionar durante la temporada verano del año
2021

El flujo de trabajo sería el siguiente:

1) Armo la carpeta del proyecto, por ejemplo con la estructura siguiente:

📂 cuidar
📂 entradas
📂 salidas
📂 scripts
📂 docs_metodologicos 16 / 23
Lectura / escritura de datos
2) Ubico la base de datos en la carpeta correspondiente (entradas):

📂 cuidar
📂 entradas
📄 certificados-personas-por-fecha-ingreso-provincia-localidad.csv
📂 salidas
📂 scripts
📂 docs_metodologicos

17 / 23
Lectura / escritura de datos
3) Abro Rstudio y creo un proyecto, ubicado en la carpeta principal (cuidar)

📂 cuidar

proyecto_cuidar.Rproj

📂 entradas
📄 certificados-personas-por-fecha-ingreso-provincia-localidad.csv
📂 salidas
📂 scripts
📂 docs_metodologicos

18 / 23
Lectura / escritura de datos
4) Creo un script llamado levantar_datos.R para trabajar en R y lo guardo en la carpeta script

📂 cuidar

proyecto_cuidar.Rproj

📂 entradas
📄 certificados-personas-por-fecha-ingreso-provincia-localidad.csv
📂 salidas
📂 scripts
📄 1_levantar_datos.R
📂 docs_metodologicos
19 / 23
Lectura / escritura de datos
5) En el script, cargo los paquetes cuyas funciones voy a utilizar. En este caso, el paquete readxl para
poder importar bases de datos de una extensión .xlsx (Excel):

library(readxl)

6) Creo un objeto en el cual voy a importar la base de datos y utilizo la función read_xlsx() para
hacerlo.

Recordar: Estamos en un proyecto, por lo que la ruta es a partir de la carpeta en la que se encuentra el
mismo

base_cuidar <- read_xlsx(file = "entradas/cuidar_verano_excel.xlsx")

20 / 23
Funciones para una primera mirada a la base de datos:
Función Acción

dim() Nos dice cuántas filas y columnas tiene la base

colnames() Devuelve todos los nombres de las variables de la base

str() Devuelve una vista preliminar de la estructura de las variables

Devuelve un resúmen de medidas centrales para variables numéricas y características


summary()
para variables de texto
class() Chequeo el tipo de objeto
length() Devuelve la cantidad de elementos de un objeto

table() Frecuencia simple o bivariada de una variable


is.na() Verifica la presencia de valores NA (missinh) en la base/variable

mean() Calcula el valor promedio de una variable numércia


21 / 23
PRÁCTICA

22 / 23
Práctica
1. Crear una carpeta donde alojar el proyecto de trabajo

2. Crear la estructura de carpetas propuesta

3. En la carpeta entradas incorporar una base de datos, preferentemente que usemos cotidianamente
(no importa el formato)

4. Crear un script de trabajo y alojarlo en la carpeta scripts

5. Importar la base de datos y aplicar alguna de las funciones descritas previamente

05:00
23 / 23

También podría gustarte