Documento Requerimientos R & Rstudio PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

TECNOLOGICO DE ESTUDIOS SUPERIORES

DE CHALCO

DOCUMENTO DE REQUERIMIENTOS
GESTION DE DATOS
RAUL ROMERO CASTRO

INTEGRANTES
LEYVA SÁNCHEZ BRENDA EUNICE
JUÁREZ HERNÁNDEZ ELIZABETH
LEÓN TORRES BRANDON RICARDO

20-11-2020 VIERNES

Página | 1
INTRODUCCIÓN
El lenguaje r y r studio como entorno, más que una serie de herramientas
como power bi, es un entorno de desarrollo completo, que contiene
multiples de herramientas dirigidas completamente a la computacion
estadistica y graficos, entre ellos entrando en materia a la tecnología se
puede hablar de machine learning, entre otros. en este anexo de
requerimientos se muestran especificaciones para el sistema de lenguaje
r y ide r studio.

Página | 2
DESCRIPCION GENERAL
PROPOSITO:
• R es un lenguaje y entorno de programación para análisis estadístico
y gráfico.
• R al estar orientado a las estadísticas, proporciona un amplio
abanico de herramientas.
• Entre otras características de R, podemos nombrar su capacidad
gráfica, que permite generar gráficos con alta calidad, con sólo
utilizar las funciones de graficación.
• R también puede usarse como herramienta de cálculo numérico y a
la vez ser útil para la minería de datos.
• R es un lenguaje interpretado, el usuario normalmente accede por
líneas de comandos o consola.
Existen dos grandes paradigmas de programación:

Programación imperativa: variables, bucles, etc. Es la habitual en lenguajes


como C, Fortran o Matlab.

Programación funcional, donde las funciones son ciudadanos de primera


clase. Lisp fue el lenguaje pionero en programación funcional y,
actualmente, Haskell o Scala son lenguajes casi puramente funcionales;
otros como Python, Java o C++, aunque imperativos, incorporan cada vez
más elementos funcionales.

R permite combinar ambos. Y los combina, además, con la programación


orientada a objetos. El objetivo de la sección será el de familiarizarnos con
los aspectos imperativos y funcionales de la programación en R.

Página | 3
OPEN SOURCE EDICION

• Acceder a RStudio localmente


• Resaltado de sintaxis, finalización de código y sangría inteligente
• Ejecute el código R directamente desde el editor de código fuente
• Salte rápidamente a las definiciones de funciones
• Administre fácilmente varios directorios de trabajo mediante proyectos
• Ayuda y documentación de R integradas
• Depurador interactivo para diagnosticar y corregir errores rápidamente
• Amplias herramientas de desarrollo de paquetes
REQUERIMIENTOS ESPECIFICOS
HARDWARE
• RStudio Pro • Minimum • Recommended
Product (CPU / (CPU / Memory / Disk)
Memory)
• RStudio • 2 core / 4G • 4 - 16 core / 8G - 256G
Server Pro (RAM) / 100 G (RAM) /
(Disk) 100+ GB shared storage
• RStudio • 2 core / 4G • 8 - 16 core / 32G -
Connect (RAM) / 128G (RAM) /
100 G (Disk) 100+ GB shared storage
• RStudio • 2 core / 2G • 2 core / 4 G (RAM) / 500 G
Package (RAM) / 200 G (Disk)
Manager (Disk)

SOFTWARE ADICIONAL O LIBRERIAS (OMITIENDO R Y


R STUDIO)
EL PAQUETE DPLYR
Proporciona una "gramática" (particularmente verbos) para la manipulación y
operaciones con data frames. Con esta gramática podemos comunicar mediante
nuestro código que es lo que estamos haciendo en los data frames a otras personas
(asumiendo que conozcan la gramática). Esto es muy útil, ya que proporciona una
abstracción que anteriormente no existía. Por último, cabe destacar que las funciones

Página | 4
del paquete dplyr son muy rápidas, puesto que están implementadas con el lenguaje
C++.

La grámatica de dplyr

Algunas de los principales "verbos" del paquete dplyr son:


select: devuelve un conjunto de columnas

filter: devuelve un conjunto de filas según una o varias condiciones lógicas


arrange: reordena filas de un data frame

rename: renombra variables en una data frame

mutate: añade nuevas variables/columnas o transforma variables existentes


summarise/summarize: genera resúmenes estadísticos de diferentes variables en
el data frame, posiblemente con strata
_%>% : el operador "pipe" es usado para conectar múltiples acciones en una única
"pipeline" (tubería)

Argumentos comúnes en las funciones dplyr

Todas las funciones que discutiremos en este capítulo tienen en común una serie de
argumentos. En particular,

El primer argumento es el data frame


Los otros argumentos describen que hacer con el data frame especificado en el
primer argumento, podemos referirnos a las columnas en el data frame directamente
sin utilizar el operador $, es decir sólo con el nombre de la columna/variable.

El valor de retorno es un nuevo data frame.

Los data frames deben estar bien organizados/estructurados, es decir debe existir
una observación por columna y, cada columna representar una variable, medida o
característica de esa observación. Para ello, es muy útil es uso del paquete tidy. (lo
veremos en capítulos posteriores).

Página | 5
INSTALACIÓN WINDOWS
CONTINUAR = “->”

LENGUAJE R
-Ejecute el archivo llamado “R-4.0.3-win” como administrador y configure el idioma
de la instalación para iniciar el asistente de instalación.

-Lea con atencion la licencia GNU publica ->


-Localize la ruta de instalación ->

-Seleccione todos los componentes para instalar ->

-Dar clic en utilizar opciones de configuración si es que se requiere configurar algo


avanzado, si no dar en no, y continuar ->
ESPERAR LA INSTALACIÓN

R STUDIO
-Ejecute el archivo llamado “RStudio-1.3.1093” como administrador y seleccione la
ruta de instalación. ->

- ESPERAR LA INSTALACIÓN

INSTALACIÓN LINUX
-Añadir repositorio CRAN:

sudo gedit /etc/apt/sources.list


-Agregar la url del archivo:
deb http://cran.rstudio.com/bin/linux/ubuntu lucid/

-Recibimiento de la clave publica, para el procesamiento de instalación:

~$ gpg --keyserver keyserver.ubuntu.com --recv-key E084DAB9 ~$

gpg -a --export E084DAB9 | sudo apt-key add -


-Update del sistema de archivos LINUX:
~$ sudo apt-get update

Página | 6
-INSTALACIÓN de R:

~$ sudo apt-get install r-base

-Descarga de IDE rstudio:

https://rstudio.com/products/rstudio/download/

-localize el lugar donde se encuentra el archivo que se descargo por medio de la shell
y ejecute el siguiente codigo para instalar.
~$ sudo dpkg -i rstudio*.deb

AÑADIR Y CARGAR DPLYR Y READR


Desde Rstudio una vez que estemos en la ventana Packages, buscamos la librería y
terminamos picando en :

R se conecta a alguno de los repositorios de CRAN (Comprehensive R Archive


Network) en internet, descarga el archivo que contiene el paquete, lo descomprime
y lo instala en nuestro directorio de paquetes por defecto.

Página | 7
En Rstudio para cargar un paquete en memoria basta simplemente con marcar la
casilla junto al nombre del paquete:

Si un paquete ha sido ya cargado con anterioridad, volver a ejecutar library(nombre-del-

Importante: Nótese que si picamos en el nombre de la librería en el menú de Rstudio,


el comando library() se ejecuta en la consola, pero no se copia en el script (si
estuviéramos escribiendo uno). Si estamos desarrollando un script que vamos a
reutilizar posteriormente y en el cual vamos a utilizar funciones incluídas en alguna
librería, es importante que el comando library(nombre-de-la-librería) quede escrito
en el script, ya que si no es así, cuando ejecutemos ese archivo en una nueva sesión
de R el programa no reconocerá las funciones por no haber cargado la librería
previamente en memoria.

Página | 8

También podría gustarte