LATEX
LATEX
LATEX
Una de las grandes ventajas de usar RStudio es que permite generr informes a partir de R. En realidad utiliza
un lenguaje llamado RMarkdown para enriquecer el informe final. Este permite incluir texto, comandos de R,
imágenes y gráficos a un documento. Pero lo más importante es que permite que se reproduzca el análisis
realizado y si se incorporan nuevos datos, los resultados se actualizarán.
Realmente es una herramienta muy potente. Vamos a conocer un poco la metodología para generar informes
con RStudio y RMarkdown.
Estos informes están compuestos por dos partes:
• el fichero que genera el informe (en formato RMarkdown cuya extensión es .RMD)
• el informe generado (en Word, PDF o HTML)
El fichero generador del informe se debe escribir siguiendo las recomendaciones del lenguaje RMarkdown
(http://rmarkdown.rstudio.com). Nuestra recomendación es crear el informe desde RStudio, éstegenera un
fichero de muestra básico que sirve para editar su contenido para adaptarlo a nuestras necesidades.
Para crear un informe en RStudio solo hay que elegir la opción “File”+“New File”+“R Markdown”.
Podemos elegir el destino del informe: una página web que se podrá ver con un navegador, un documento
Word o un PDF.
Esto abrirá un fichero que incluye ya contenido de texto y de lenguaje RMarkdown.
Podremos generar informes en Word, PDF o HTML (formato página web visible con cualquier navegador).
En cada formato cambia el aspecto del mismo.
1
Figure 1: Menú para crear un nuevo informe RMarkdown en RStudio
2
Figure 3: Nuevo informe RMarkdown en RStudio
3
El mismo informe con salida en PDF
Como se puede observar, cuando se genera un documento PDF la tipografía es distinta a cuando generamos
un Word (también cuando generamos HTML). En general, los informes que generan un PDF usan tipografías
tipo Times, con tamaño estándar para el cuerpo de 13 y 16 para títulos. Para editar ficheros PDF se necesitan
herramientas especiales como Adobe Acrobat u otras alternativas. Pero lo importante es que podemos cambiar
o editar el propio generador del PDF para obtener un documento final, que no necesite ninguna edición.
Cualquier texto que se incluya en el fichero generador del informe aparacerá tal cual. Si queremos incluir
subt´ítulos, o caracteres en negrita, o ecuaciones, . . . , tendremos que introducir una sintaxis específica.
Por ejemplo, para introducir títulos, subtítulos, y cabeceras podemos usar el caracter #.
Texto en el generador del informe:
“## Este es el título”
Este es el título
4
Figure 6: Documento en HTML del primer informe en RMarkdown
Este es un subtítulo
Este es un subsubtítulo
Para resaltar una palabra o una frase debemos ponerla entre doble asteriscos.
Este es el texto en el generador del informe:
Dentro de una frase se pueden resaltar **varias palabras**.
El resultado es:
Dentro de una frase se pueden resaltar varias palabras.
Para poner una palabra (o una frase) en cursiva debemos ponerla entre asteriscos simples.
Este es el texto en el generador del informe:
Dentro de una frase se pueden resaltar *varias palabras*.
El resultado es:
Dentro de una frase se pueden resaltar varias palabras.
Para poner una palabra (o una frase) en cursiva debemos ponerla entre asteriscos simples.
Este es el texto en el generador del informe:
Dentro de una frase se pueden resaltar _varias palabras_.
El resultado es:
5
Dentro de una frase se pueden resaltar varias palabras.
Una vez que controlamos como poner títulos, subtítulos y cabeceras y texto, podemos incluir análisis y
resultados de R en el informe. Para ello debemos escribir el código de R entre una cabecera y pie que permite
interpretar la sintaxis de R.
#aquí el código de R
“‘{r datos_aleatorios}
“‘
Por ejemplo, podemos calcular la media de unos valores generados con los siguientes comandos (que deberán
ir entre cabecera y pie de comandos del generador de informes):
Y el resultado es:
set.seed(1234) #semilla de aleatorización para reproducibilidad
x <- 1:50 # asignamos a x los valores de 1 a 50
y <- x + rnorm(x) # rnorm() genera datos aleatorios con probabilidad normal
mean(y) #calcula la media de y
## [1] 25.04695
6
Figure 9: Aquí el pie de figura
7
Lección 4. Incluir gráficos en el informe.
Para incluir gráficos en el informe debemos introducir los comandos de gráficos que hemos visto en los
Módulos 3 y 4 de este curso, o cualquier otro, entre la cabecera y pie de código de R.
Por ejemplo, generamos datos aleatorios y dibujamos una nube de puntos. Cada vez que se generen
aleatoriamente datos la nube de puntos será distinta a menos que usemos el comando “set.seed()” para que
sea una generación de datos aleatoria pero reproducible, como vimos en el Módulo 1 de este curso.
Este es el texto que iría en el genrador de informes:
“‘{r datos_aleatorios}
x <- 1:50 # asignamos a x los valores de 1 a 50
y <- x + rnorm(x) # rnorm() genera datos aleatorios con probabilidad normal
plot(x,y) #nube de puntos de x,y
“‘
Y el resultado es:
50
40
30
y
20
10
0
0 10 20 30 40 50
Lección 5. Control total del informe: qué debe salir en el informe final.
Hemos visto como generar un informe automáticamente a través de RMarkdown y RStudio. Por supuesto,
podemos controlar lo que aparece en el informe así como controlar que tipo de documento final vamos a
8
generar. Podemos por ejemplo generar un artículo cientifíco o una tesis de Máster o Doctorado totalmente
con RMarkdown porque se puede incluir la gestión de citas y referencias (aunque excede los objetivos de
este curso). También podremos generar todo tipo de informes únicos, o repetitivos (semanales, mensuales,
anuales, etc.) que son frecuentes en estudios de seguimiento en experimentos científicos o en proyecto a lo
largo del tiempo.
El control del informe final lo tendremos desde el generador del informe, podremos insertar código para
generar gráficos (tan avanzados como los que hemos visto en el Módulo 3 y 4 de este curso), o hacer análisis,
o ambos. Además podremos insertar imágenes. Por lo que tenemos control total del informe final. Este es el
final de este curso, si has aprendido el contenido de cada módulo entonces habrás alcanzado el primer nivel
de un científico de datos: conocer las herramientas para hacer Data Science. Buena suerte!