Clase
Clase
Clase
Módulo 1
Clase 1 – Junio 6 de 2023
Albeiro Montes Gil
Albeiro Montes
Albeiro Montes
• Lenguajes de programación
• Modelos estadísticos
• Herramientas de visualización
• Bases de datos
• Comprensión de datos
• Eliminación de datos (si aplica)
• Valores faltantes
• Valores duplicados
• Valores por categoría
• Documentación Albeiro Montes
Análisis descriptivo:
Medidas de tendencia central:
• Media: es el promedio aritmético de los valores en el conjunto de datos.
• Mediana: es el valor medio en el conjunto de datos ordenado de forma ascendente.
• Moda: es el valor más frecuente en el conjunto de datos.
Medidas de dispersión:
• Rango: es la diferencia entre el valor máximo y mínimo en el conjunto de datos. Albeiro Montes
• Desviación estándar: mide la dispersión de los valores con respecto a la media.
• Varianza: es el promedio de los cuadrados de las desviaciones respecto a la media.
• Coeficiente de variación: es una medida relativa de la dispersión, calculada como la desviación estándar
dividida por la media.
Medidas de posición:
• Cuartiles: son valores que dividen el conjunto de datos ordenado en cuatro partes iguales.
• Percentiles: son valores que dividen el conjunto de datos ordenado en 100 partes iguales.
Medidas de forma:
• Asimetría: mide la falta de simetría en la distribución de los datos.
• Curtosis: mide la concentración de los datos alrededor de la media.
1. Introducción a Python
Albeiro Montes
Google Colab
Google Colab
Google Colab
Google Colab
Dado que datos abiertos proporciona una API para exponer los
datos, se consumen y se leen los datos usando pandas y
read_csv. Albeiro Montes
Albeiro Montes
• indice_fila_eliminar = [1]
Albeiro Montes
data = data.drop(indice_fila_eliminar)
• fila_mantener = [0]
data = data.drop(data.index.difference(fila_mantener))
suma_columna_A = data['punt_global'].sum()
Albeiro Montes
Buscar NaN
nan= data['punt_global’].isna().any()
Conversión de fecha
data['estu_fechanacimiento'] = pd.to_datetime(data['estu_fechanacimiento'])
La Inteligencia Artificial es una disciplina que busca emular el comportamiento del ser
humano en diferentes sistemas computacionales.
La Inteligencia Artificial tiene ramificaciones las cuales tienen sus propios conceptos.
Albeiro Montes
.
Algunos de los principales algoritmos de Machine Learning son:
• Regresión lineal
• Regresión logística
• Árboles de decisión
• Bosques aleatorios Albeiro Montes
• Máquinas de vectores de soporte (SVM)
• Naive Bayes
• K vecinos más cercanos (K-NN)
• Redes neuronales artificiales
• Algoritmos de agrupamiento, como k-means y DBSCAN
• Algoritmos de reducción de dimensionalidad, como Análisis de Componentes
Principales (PCA) y t-SNE.
.
KNN:
.
KNN:
Albeiro Montes