SI709 Business Predictive Analytics 202301
SI709 Business Predictive Analytics 202301
SI709 Business Predictive Analytics 202301
INFORMACIÓN GENERAL
Misión: Formar líderes íntegros e innovadores con visión global para que transformen el Perú.
Visión: Ser líder en la educación superior por su excelencia académica y su capacidad de innovación.
III. INTRODUCCIÓN
Descripción:
El curso de Business Predictive Analytics inicia sentando las bases sobre el análisis de datos y las disciplinas
con las cuales se interrelaciona. Se enfatiza en el ecosistema de herramientas open source a utilizar a lo largo
del curso, así como en los conceptos, definiciones claves, técnicas y su puesta en práctica a través de notebooks
de código con la finalidad de desarrollar un proyecto de Machine Learning, desde la concepción, identificación
de la fuente de datos, tratamiento, transformación de datos, continuando con la utilización de algoritmos para la
modelización del caso de negocio y la evaluación de los resultados a través de métricas. Dado la naturaleza del
curso se proponen actividades de investigación y autoaprendizaje que complementan y aportan al análisis de
datos.
Propósito:
El curso de Business Predictive Analytics tiene como propósito brindar a los estudiantes las competencias para
el desarrollo de proyectos y/o soluciones de analítica predictiva de datos enfocada en soluciones de negocio y la
generación de valor en las organizaciones.
El curso contribuye directamente al desarrollo de la competencia general de razonamiento cuantitativo (nivel 2)
para la carrera de Ingeniería de Sistemas de Información y la competencia específica Aprendizaje continuo
(nivel 2). Tiene como requisito el curso de MA642 Estadística Aplicada.
Al finalizar el curso el estudiante, a partir de los tópicos vistos en clase y las actividades de autoaprendizaje,
podrá desarrollar una solución, enmarcado en un proyecto de analítica predictiva que permita la mejor toma de
decisiones de un caso de negocio propuesto, debidamente sustentado, siguiendo la metodología y/o
aproximaciones expuestas en el curso, que permita el uso de las técnicas adecuadas para tratamiento de datos,
entrenamiento, validación, evaluación y optimización de modelos predictivos de machine learning enfocado en
1
los negocios. Así como comunicar los resultados y diversos insights identificados en el análisis del caso para
finalmente exponerlos en un entorno productivo controlado
V. UNIDADES DE APRENDIZAJE
LOGRO
Competencia(s):
Razonamiento Cuantitativo
Aprendizaje contínuo y autónomo
Logro de la unidad: Al finalizar la unidad, el alumno comprende de manera práctica, las funciones básicas de Google
Analytics, entre las que se incluyen cómo crear una cuenta, implementar un código de seguimiento, analizar informes
básicos y configurar el seguimiento de campañas y objetivos.
TEMARIO
Teoría:
-Data como protagonista
-Tipos de análisis
-Campos en el análisis de datos
-Como hacer un proyecto de Machine Learning
-Setup de un ambiente de Análisis de Datos (conda y/o Google collab)
-Requisito: Algebra Lineal
-Temas de investigación propuestos
Laboratorio:
-Creación de un entorno de analítica predictiva con Laboratorio:
-Notebooks de aplicación
HORA(S) / SEMANA(S)
Semanas 1.
LOGRO
Competencia(s):
Razonamiento Cuantitativo
Aprendizaje contínuo y autónomo
2
Logro de la unidad:
Al finalizar la unidad, el alumno comprende la manera comparar el rendimiento de distintos canales de marketing y
averiguar qué fuentes le envían el tráfico y las conversiones de más calidad.
TEMARIO
Teoría:
-Terminología básica
-Áreas de Machine Learning
-Tipos de Variable
-Business Understanding
Laboratorio:
-Notebooks de aplicación:
HORA(S) / SEMANA(S)
Semana 2
UNIDAD Nº: 3 Data Pre-Processing (Data Collect, Data Quality & Cleaning, EDA, Data Transformation)
LOGRO
Competencia(s):
Razonamiento Cuantitativo
Aprendizaje contínuo y autónomo
Logro de la unidad: Al finalizar la unidad, el alumno comprende los obstáculos que tendrá que afrontar en su búsqueda
por convertirse en un analista orientado a los datos. La búsqueda se basa en el planteamiento y modelo mental
adecuado y en el hecho de pensar de forma diferente e internalizar el coste de las decisiones.
TEMARIO
Teoría:
-Recolectar datos
-Data Collect
-Data Quality & Cleaning (duplicados, nulos, outliers, etc.)
Lab:
- Notebook de aplicación
Teoría:
-Análisis Exploratorio de datos (EDA) (Conclusiones analíticas y entendimiento de los datos)
-Requisito: Estadística
Lab:
- Notebook de aplicación
Teoría:
-Data Transformation (Feature Engineering: (Encoding, Reescalado, Text and Date Data, Numerical)
Laboratorio:
- Notebooks de aplicación
Teoría:
-Sistemas de recomendación
Laboratorio:
- Notebooks de aplicación
Exposición de trabajos parciales
Evaluación Parcial
3
HORA(S) / SEMANA(S)
Semana 3, 4, 5 ,6 ,7 y 8
LOGRO
Competencia(s):
Razonamiento Cuantitativo
Aprendizaje contínuo y autónomo
Logro de la unidad: Al finalizar la unidad, el alumno comprende las mejores prácticas y consejos para hacer frente a las
mayores barreras y crear una estrategia de medición web que sea productiva.
TEMARIO
Teoría:
Modelización
-Regresión
-Regresión Logística
Métricas de Evaluación
-Target continua: R2, MAE, MAPE, MSE y RMSE (regresión)
-Target dicotómica: Matriz de confusión, acurracy, recall, precision, F1-Score, Especificidad, AUC, Gain Chart y
Curva ROC
Lab:
- Notebook de aplicación
Teoría:
-Arboles de decisión (Supervisado)
-Bagging y Boosting
Random Forest
XGBoost
Lab:
- Notebook de aplicación
Teoría:
-KNN (Supervisado)
-K-Means (No Supervisado)
-Market Basquet Analysis
Lab:
- Notebook de aplicación
-Revisión de temas de investigación
HORA(S) / SEMANA(S)
Semanas 9, 10, 11 y 12
LOGRO
Competencia(s):
Razonamiento Cuantitativo
Aprendizaje Continuo
4
Logro de la unidad: Al finalizar la unidad, el alumno aplica técnicas avanzadas para optimizar la modelización y
comunica los resultados con enfoque en el negocio
TEMARIO
Teoría:
-Hiperparametrización (GridSearch)
-Feature Selection o Preselección de variables
Lab:
- Notebook de aplicación
Teoría:
-Librería imbalanced-learn
-Balanceo de datos (oversample y undersample)
-Comunicación de resultados enfocados en el negocio
Lab:
- Notebook de aplicación
Exposición de proyectos grupal
HORA(S) / SEMANA(S)
Semanas 13, 14, 15 y 16
VI. METODOLOGÍA
El Modelo Educativo de la UPC asegura una formación integral, que tiene como pilar el desarrollo de
competencias, las que se promueven a través de un proceso de enseñanza-aprendizaje donde el estudiante
cumple un rol activo en su aprendizaje, construyéndolo a partir de la reflexión crítica, análisis, discusión,
evaluación, exposición e interacción con sus pares, y conectándolo con sus experiencias y conocimientos
previos. Por ello, cada sesión está diseñada para ofrecer al estudiante diversas maneras de apropiarse y poner en
práctica el nuevo conocimiento en contextos reales o simulados, reconociendo la importancia que esto tiene
para su éxito profesional.
El curso se desarrolla en sesiones tanto teóricas como laboratorio-taller, en las cuales se fomenta la
participación individual y grupal de los alumnos, el debate y la sustentación de argumentos. El profesor
cumplirá el rol de facilitador y compartirá sus experiencias en clase contribuyendo al crecimiento profesional
del estudiante.
El cumplimiento del logro de cada una de las unidades responde a la base sobre la que se trabajará el siguiente,
por lo que de esta manera y mediante actividades de aplicación de conceptos, sesiones de trabajo colaborativo e
individuales, sustentación de trabajos y actividades virtuales, el alumno irá adquiriendo las habilidades y
competencias para la aplicación de análisis predictivo enfocado en los negocios, a través de un proyecto de
Machine Learning al final de todo el ciclo. El estudiante deberá dedicar al menos cuatro horas a la semana fuera
del horario de clases para revisar los apuntes de las sesiones, leer lecturas propuestas, desarrollar los casos
propuestos, desarrollar investigaciones, estudiar, practicar los laboratorios realizados en clase, reunirse para
construir progresivamente el proyecto del curso y desarrollar las actividades complementarias.
5
VII. EVALUACIÓN
FÓRMULA
10% (PC1) + 10% (TP1) + 20% (EA1) + 10% (PC2) + 15% (TF1) + 15% (DD1) + 20% (EB1)
6
VIII. CRONOGRAMA
7
EB EVALUACIÓN FINAL 1 Semana 16 E v i d e n c i a d e SÍ
aprendizaje: Aplica
análisis predictivo, a
través, de un proyecto de
Machine Learning
orientado a negocio
Competencias
e v a l u a d a s :
Razonamiento
cuantitativo Aprendizaje
continuo Evaluación
individual
https://upc.alma.exlibrisgroup.com/leganto/readinglist/lists/9513105170003391?institute=51UPC_INST
&auth=LOCAL
ANEXO
En este anexo, se encuentran los reglamentos que todo alumno está obligado a leer y a cumplir en su rol de estudiante
universitario en la UPC.
REGLAMENTO DE DISCIPLINA DE ALUMNOS :
https://sica.upc.edu.pe/categoria/reglamentos-upc/sica-reg-26-reglamento-de-disciplina-de-alumnos
REGLAMENTO PARA LA PREVENCIÓN E INTERVENCIÓN EN CASOS DE HOSTIGAMIENTO SEXUAL- UPC:
https://sica.upc.edu.pe/categoria/normalizacion/sica-reg-31-reglamento-para-la-prevencion-e-
intervencion-en-casos-de-hostiga