Fundamentos de Ciencia de Datos
Fundamentos de Ciencia de Datos
Fundamentos de Ciencia de Datos
Necesitamos entendimiento
Necesitamos modelado
¿Qué es el
entendimiento?
Es la habilidad de transformar
información compleja
en simple y útil
Complejidad en forma de un
problema bien definido
Entendimiento desde datos AI
https://www.python.org
¿Qué es R?
R es un lenguaje y entorno para
computación y gráficos estadísticos. Es
un proyecto de GNU que es similar al
lenguaje y entorno S que se desarrolló
en Bell Laboratories.
https://www.r-project.org
¿Por qué Python y R?
Fundamentos de matemáticas
Necesitamos las matemáticas en ciencia de datos
principalmente para hacer machine learning y
modelado.
Álgebra
Álgebra
Revisar (álgebra lineal):
● Espacios vectoriales
● Grupos
● Independencia Lineal
● Bases y Rangos
● Espacios Afines
● Mapeos Afines
Álgebra
Revisar (geometría analítica):
● Matrices positivas y simétricas
● Desigualdad de Cauchy-Schwarz
● Métrica
● Ortogonalidad
● Ortonormalidad
● Proyecciones ortogonales
● Ortogeneralización de Gran-Schmidt
● Rotación
Álgebra
Revisar (Descomposición matricial):
● Descomposición de Cholesky
● Diagonalización y
eigendescomposición
● Singular Value Decomposition
● Aproximación Matricial
Cálculo
Cálculo
Revisar:
● Reglas de diferenciación
● Regla de la cadena
● Gradiente de vectores
● Jacobiano
● Gradientes de matrices
● Series de Taylor
● Derivadas de orden alto
Estadística y
Probabilidad
Estadística y Probabilidad
Revisar:
● Probabilidad y variables aleatorias
● Probabilidad continua y discreta
● Regla de la suma, regla del producto
● Teorema de Bayes
● Momentos, Medias y covarianzas
● Independencia Estadística
● Distribución Gaussiana
Básicos de programación
en Python y R
GitHub
MatrixDS
DEMO
Entendiendo el negocio de
forma ágil
The agile data science manifesto
● Comunicación para mostrar efectivamente los beneficios a los
ejecutivos enseñando los resultados que se relacionan con los
objetivos de la organización.