0% encontró este documento útil (0 votos)
69 vistas51 páginas

Eq Alda Pia

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 51

PRODUCTO INTEGRADOR DE APRENDIZAJE

Nombre de la Unidad de Aprendizaje: Almacén de Datos


Nombre del proyecto: Producto Integrador de Aprendizaje
Programa educativo: Plan 430
Semestre: 4 Grupo: DB
Nombre del maestro: Hiram Isaí Pérez Sauceda
Nombre de los integrantes del equipo:
Aguirre Oláis Lizeth 1951856
Escobar Martínez Belinda María 2013738
Garza López Héctor Eduardo 1963680
Monserrat Duran Gerardo Daniel 2123379
Pérez Rodríguez Diana Laura 2020802

Contenido mínimo a evaluar Cumplimiento


Índice
Introducción .- incluye valores
UANL aplicados
Análisis y emisión de juicio
Conclusiones individuales
Conclusión del equipo
Actividad en inglés
Calificación PIA:

Firma del maestro

San Nicolás de los Garza, ciudad universitaria a (17 – 07 – 2023)


INDICE
Introducción 3
Video 1 y 2 (Toma de contacto) 4
Video 3 y 4 (Series) 4 al 7
Video 5 (DataFrame), 6 (Lectura de DataFrame) y 7 (Selección por índices y
columnas 8 al 11
Video 8 (Información básica de la Data Set con Pandas en Python) 12 al 16
Video 9 (Aplicando funciones a nuestro DataFrame con Pandas) 16 y 17
Video 10 (Ejercicios Prácticos con series en Pandas) 18 al 23
Video 11 (Titanic) 24 al 32
Video 12 (Valores faltantes Pandas) 33 al 44
Video 13 (Trabajando con Fechas Horas) 45 al 51
Conclusión Grupal 52
INTRODUCCIÓN
En este producto integrador de aprendizaje se realizará unos ejercicios que se
encuentran en el apartado de recursos en Nexus, donde desarrollaremos mas
conocimiento sobre la programación y las librerías Pandas que se encuentran
dentro del programa Python.

Daremos una explicación breve de lo que trata esta librería y como es que funciona

Una de las librerías más utilizadas para el análisis de datos en Python es Pandas.
Pandas es una poderosa biblioteca que proporciona estructuras de datos y
herramientas de manipulación de datos de alto rendimiento, lo que la convierte en
una opción ideal para trabajar con datos estructurados y tabulares.

La librería Pandas se basa en dos estructuras de datos fundamentales: Series y


DataFrames. Una Serie es una estructura de datos unidimensional similar a un array
o una columna en una tabla de Excel. Un DataFrame es una estructura de datos
bidimensional que se asemeja a una tabla o una hoja de cálculo, con filas y
columnas etiquetadas.

Pandas ofrece una amplia gama de funcionalidades que facilitan el trabajo con
datos, como la carga y escritura de datos en diferentes formatos (CSV, Excel, SQL,
etc.), la limpieza y transformación de datos, el filtrado y selección de datos, el cálculo
de estadísticas descriptivas, el manejo de valores faltantes, la fusión y combinación
de conjuntos de datos, entre otros.

Además, Pandas se integra bien con otras librerías de análisis de datos en Python,
como NumPy, Matplotlib y SciPy, lo que permite realizar análisis avanzados y
visualizaciones de datos de manera eficiente.
VIDEO 1 Y 2 (TOMA DE CONTACTOS)

VIDEO 3 Y 4 (SERIES)
VIDEO 5 (DATAFRAME), 6 (LECTURA DE DATAFRAME) Y 7 (SELECCIÓN
POR INDICES Y COLUMNAS
VIDEO 8 (INFORMACIÓN BÁSICA DE LA DATA SET CON PANDAS EN PYTHON)
VIDEO 9 (APLICANDO FUNCIONES A NUESTRO DATAFRAME CON PANDAS)
VIDEO 10 (EJERCICIOS PRÁCTICOS CON SERIES EN PANDAS)
VIDEO 11 (TITANIC)
VIDEO 12 (VALORES FALTANTES PANDAS)
VIDEO 13 (TRABAJANDO CON FECHAS HORAS)
CONCLUSIÓN
En conclusión grupal con el Producto Integrador de Aprendizaje es que la materia
almacén de datos es una solución que permite a las organizaciones almacenar,
organizar y gestionar grandes cantidades de datos de manera eficiente. Proporciona
una infraestructura sólida para la recopilación, integración y almacenamiento de
datos provenientes de diversas fuentes.

Un almacén de datos ofrece la capacidad de estructurar y transformar los datos de


modo que sean más fáciles de analizar y comprender. También permite realizar
consultas y análisis complejos para obtener información valiosa y tomar decisiones
informadas.

Ya relacionado con las librerías Pandas y Python son una combinación poderosa
para el análisis y manipulación de datos. Python es un lenguaje de programación
versátil y popular que ofrece una sintaxis clara y legible, lo que facilita el desarrollo
de código. Además, cuenta con una amplia comunidad de desarrolladores y un
ecosistema de librerías extenso que cubre una variedad de aplicaciones.

Pandas, por su parte, es una librería fundamental para el análisis de datos en


Python. Proporciona estructuras de datos eficientes, como las Series y los
DataFrames, que permiten manipular y procesar datos de manera intuitiva. Pandas
ofrece una gran cantidad de funcionalidades para realizar tareas como carga y
escritura de datos, limpieza y transformación de datos, filtrado y selección de datos,
entre otras

La integración de Pandas con otras librerías de análisis de datos, como NumPy,


Matplotlib y SciPy, amplía aún más su capacidad para realizar análisis avanzados y
visualizaciones de datos. Además, Pandas ofrece un alto rendimiento, lo que es
crucial al trabajar con grandes conjuntos de datos.

También podría gustarte