0% encontró este documento útil (0 votos)
16 vistas20 páginas

Eq Pia Alda

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 20

PORTADA

PIA
Nombre de la Unidad de Aprendizaje: Almacenes de Datos
Nombre del proyecto: Reporte de la solución de un caso de Big Data
usando el Entorno Hadoop en una organización
Programa educativo: Licenciado en Administración
Semestre: 4to Grupo: DE
Nombre del maestro: Hiram Isaí Pérez Sauceda
Nombre del equipo: Equipo
Nombre de los integrantes del equipo:
Bojorquez Vega Monica Guadalupe 2064105
Guevara Monsiváis Liliana 2049977
Hernandez Sarabia Hector Francisco 1865799
López Cerda Haydee Lisset 2053721
Tamayo Córdova Alisson Yajaira 2064394

Contenido mínimo a evaluar Cumplimiento


Índice
Introducción .- incluye valores
UANL aplicados
Análisis y emisión de juicio
Conclusiones individuales
Conclusión del equipo
Actividad en inglés
Identificación de sub resultados
de aprendizaje ANECA.
Calificación PIA:

Firma del maestro

San Nicolás de los Garza, ciudad universitaria a 19 de mayo de 2024


1
ÍNDICE

Contenido
PORTADA ............................................................................................................................................. 1
INTRODUCCIÓN (EN INGLÉS)............................................................................................................... 3
PIA………………………………….………………………………………………………………………………………………………………4

CONCLUSIONES INDIVIDUALES ......................................................................................................... 17


CONCLUSIÓN DE EQUIPO .................................................................................................................. 20

2
INTRODUCCIÓN (EN INGLÉS)
The need for information and the ability to take advantage of available
technological tools have become crucial aspects in today's world, where efficient data
management can make the difference between success and stagnation. In this context, Python,
with its wide range of libraries and tools for data analysis, has positioned itself as an indispensable
tool for the extraction, processing and visualization of information

This technical report aims to present an applied case that illustrates how Python, in
particular using the data structures provided by the Pandas library, can be used to solve a specific
information need. In particular, we will focus on Google Colaboratory.

We will explore how Python and Pandas can be used to handle complex data sets, perform
exploratory analysis, data cleaning, data manipulation, and generating informative visualizations.
To do this, we will use a practical example involving real or simulated data, and we will
demonstrate step by step how to apply Pandas functionalities to address the identified
information need.

Throughout this report, we will highlight the advantages and challenges of using Python
and Pandas in Google Colaboratory, as well as tips and best practices to optimize the data analysis
process. At the end, conclusions and recommendations will be provided for future case studies
and practical applications.

3
PIA

4
5
6
7
8
9
10
11
12
13
14
15
https://colab.research.google.com/drive/1y-RvNpa-
GNO8K9Mkg6R09MyhdFbVwws4?usp=sharing

16
CONCLUSIONES INDIVIDUALES
Bojorquez Vega Monica Guadalupe 2064105
Esta asignatura, almacenes de datos ha sido fundamental para mí, no solo por la
comprensión teórica de la gestión y organización de grandes volúmenes de información, sino
también por las habilidades prácticas adquiridas. Conforme se usó en el desarrollo de este
producto integrador de aprendizaje, el lenguaje de programación Pandas me ha permitido
manipular y analizar datos de manera eficiente mediante el uso de DataFrames, que son
estructuras de datos bidimensionales proporcionadas por Pandas. Mediante los DataFrame
pudimos tener más estructura en la ejecución de los códigos, facilitándonos la limpieza,
transformación y visualización de datos. Gracias a la asignatura no solo me ha ampliado mis
conocimientos técnicos cruciales, sino que también ha potenciado mi capacidad para tomar
decisiones informadas basadas en datos.

Guevara Monsiváis Liliana 2049977


En primer lugar, la utilización de bibliotecas como Pandas me facilitó la manipulación y
análisis de conjuntos de datos. El uso de DataFrames, en particular, nos dio una estructura de
tablas que simplifica la organización y gestión de datos, lo que resulta especialmente útil para el
análisis de grandes volúmenes de información, como el que trabajamos.

La capacidad de trabajar de forma colaborativa en entornos como Google Colab amplifica


aún más las posibilidades de análisis de datos, permitiendo que varios usuarios accedan,
modifiquen y compartan el código y los resultados de manera simultánea, lo que facilita la
colaboración y el intercambio de conocimientos entre nosotros como equipo.

Los almacenes de datos proporcionan una infraestructura robusta para la integración y


consolidación de datos provenientes de múltiples fuentes, lo que facilita la generación de insights
y la toma de decisiones informadas. En un futuro, el conocimiento adquirido en la materia de
Almacenes de Datos será fundamental para diseñar y desarrollar soluciones de análisis de datos
más avanzadas y escalables, que permitan gestionar eficientemente la creciente cantidad de
información generada por las organizaciones en la era digital.

Hernandez Sarabia Hector Francisco 1865799


Concluir este curso sobre almacenes de datos me ha permitido comprender y dominar
conceptos esenciales en el manejo de bases de datos mediante Python. Entre los conceptos más
importantes aprendidos están la conexión a bases de datos, la ejecución de consultas SQL y,

17
especialmente, el uso de la biblioteca pandas para manipular y analizar datos. Con pandas, he
aprendido a limpiar, transformar y visualizar datos de manera eficiente. Estos conocimientos son
muy útiles tanto en la vida cotidiana como en el ámbito laboral. Personalmente, puedo utilizarlos
para organizar y analizar datos personales como mis finanzas o mis hábitos de consumo.
Laboralmente, estas habilidades me permiten tomar decisiones informadas basadas en datos,
mejorar procesos y generar reportes precisos. Esto incrementa la eficiencia y la efectividad en
cualquier entorno de trabajo, haciendo que las organizaciones funcionen de manera más
inteligente y productiva.

López Cerda Haydee Lisset 2053721


Para este producto integrados de aprendizaje, mis compañeros de trabajo y yo
elaboramos un programa en el que hicimos uso de algunos códigos que se nos proporcionaron
durante el curso de la materia. Entre algunos de ellos también nos proporcionaron acceso a la
biblioteca de pandas que desarrollamos en las clases.

Durante el semestre la materia de almacenes de datos es esencial para los


administradores ya que involucra la gestión de datos y nos proporciona los conocimientos
necesarios para diseñar, implementar y mantener sistemas que les permitirán a las organizaciones
transformar datos en información valiosa.

Por otro lado quiero mencionar que pandas es una herramienta esencial en el análisis de
datos, además ofrece estructuras de datos flexibles y eficientes, por medio de sus dos
componentes principales: Series y DataFrames. Estás dos permiten manipular y analizar datos que
están representados en tablas de una manera que es tanto intuitiva como potente.

Tamayo Córdova Alisson Yajaira 2064394


En conclusión trabajar en un proyecto utilizando pandas con una base de datos de 10,000
clientes ha sido una experiencia enriquecedora que demuestra el poder y la versatilidad de esta
biblioteca para el análisis de datos en Python. El proyecto ha evidenciado cómo pandas facilita la
manipulación y el análisis de grandes volúmenes de datos de manera eficiente. Con una base de
datos de 10,000 clientes, hemos podido realizar tareas complejas como la limpieza de datos, el
manejo de datos faltantes, la agregación y la generación de estadísticas descriptivas de manera
rápida y precisa. Pandas ha demostrado ser excepcionalmente eficiente para cargar, procesar y
manipular grandes conjuntos de datos. La flexibilidad de pandas en el preprocesamiento de datos
ha sido crucial. Desde la imputación de valores faltantes hasta la normalización de datos y la

18
creación de nuevas variables derivadas. trabajar con pandas en este proyecto ha resaltado su
robustez y utilidad en la gestión y análisis de datos de tamaño considerable. Me llevo una
apreciación más profunda de cómo pandas puede transformar datos en insights accionables,
facilitando decisiones informadas. Para futuros proyectos, consideraré complementar pandas con
otras herramientas para manejar conjuntos de datos más grandes y explorar técnicas avanzadas
de análisis y visualización.

19
CONCLUSIÓN DE EQUIPO
En este producto integrador de aprendizaje colaboramos en equipo para realizar el
programa ya adjuntado, en el que describimos algunos de los comandos que hemos utilizado con
anterioridad durante las clases del curso.

En este curso hemos podido llegar a la conclusión de que Python y pandas son
herramientas fundamentales en el análisis de datos y la ciencia de datos moderna, que nos
ofrecen simplicidad, flexibilidad y potencia que de esa manera se manejan y analizan grandes
volúmenes de información.

Python es un lenguaje de programación, que se destaca por su sintaxis clara y legible, lo


que nos facilita el aprendizaje y uso tanto para desarrollar nuestras habilidades.

Python contiene bibliotecas especializadas, entre las cuales podemos destacar pandas que
es una de las más importantes, sus códigos abiertos que proporcionan estructuras de datos y
herramientas de análisis de datos de alto rendimiento y fáciles de usar. De manera que realizamos
los códigos con su estructura principal que es el DataFrame, que nos permite almacenar y
manipular datos en tablas de manera eficiente; su mayor ventaja es la capacidad que tiene para
manejar grandes conjuntos de datos de manera eficiente.

Enfocándonos en la asignatura que cursamos para poder hacer uso de este programa es
almacenes de datos que para nosotros como administradores es fundamental en el ámbito de
áreas como de la gestión y análisis de grandes volúmenes de información, ya que, nos proporciona
una comprensión profunda de cómo recolectar, almacenar, y gestionar datos de manera eficiente
para apoyar la toma de decisiones empresariales estratégicas.

El almacenamiento de datos de forma centralizada nos permite tener una vista unificada y
coherente que nos ayude con el análisis comparativo y la identificación de patrones y tendencias.

Realizamos un análisis de datos y con ayuda de la biblioteca y el programa pudimos


elaborar diferentes códigos con la obtención de información que requerimos para su elaboración.

20

También podría gustarte