GuiaCompleta 71014023 2021 PDF
GuiaCompleta 71014023 2021 PDF
GuiaCompleta 71014023 2021 PDF
GUÍA DE
ESTUDIO
COMPLETA
APRENDIZAJE AUTOMÁTICO
CÓDIGO 71014023
APRENDIZAJE AUTOMÁTICO CÓDIGO 71014023
20-21
APRENDIZAJE AUTOMÁTICO
CÓDIGO 71014023
ÍNDICE
PRESENTACIÓN Y CONTEXTUALIZACIÓN
REQUISITOS Y/O RECOMENDACIONES PARA CURSAR LA
ASIGNATURA
EQUIPO DOCENTE
HORARIO DE ATENCIÓN AL ESTUDIANTE
TUTORIZACIÓN EN CENTROS ASOCIADOS
COMPETENCIAS QUE ADQUIERE EL ESTUDIANTE
RESULTADOS DE APRENDIZAJE
CONTENIDOS
METODOLOGÍA
PLAN DE TRABAJO
SISTEMA DE EVALUACIÓN
BIBLIOGRAFÍA BÁSICA
BIBLIOGRAFÍA COMPLEMENTARIA
RECURSOS DE APOYO Y WEBGRAFÍA
GLOSARIO
TUTORIZACIÓN EN CENTROS ASOCIADOS
Tipo OBLIGATORIAS
Nº ETCS 6
Horas 150.0
Idiomas en que se imparte CASTELLANO
PRESENTACIÓN Y CONTEXTUALIZACIÓN
Aunque no se exige cumplir ningún requisito para cursar esta asignatura, es deseable y
recomendable que el alumno haya cursado y aprobado previamente la asignatura
"Fundamentos de Inteligencia Artificial" (2º Curso).
EQUIPO DOCENTE
Nombre y Apellidos ENRIQUE JAVIER CARMONA SUAREZ (Coordinador de asignatura)
Correo Electrónico ecarmona@dia.uned.es
Teléfono 91398-7301
Facultad ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA
Departamento INTELIGENCIA ARTIFICIAL
Competencias Generales
(G.2) Competencias cognitivas superiores: selección y manejo adecuado de conocimientos,
recursos y estrategias cognitivas de nivel superior apropiados para el afrontamiento y
resolución de diversos tipos de tareas/problemas con distinto nivel de complejidad y
novedad. Análisis y Síntesis. Aplicación de los conocimientos a la práctica Resolución de
problemas en entornos nuevos o poco conocidos. Pensamiento creativo. Razonamiento
crítico. Toma de decisiones.
(G.3) Competencias de gestión de la calidad y la innovación: Seguimiento, monitorización y
evaluación del trabajo propio o de otros. Aplicación de medidas de mejora. Innovación.
(G.4) Competencias de expresión y comunicación (a través de distintos medios y con distinto
tipo de interlocutores): Comunicación y expresión escrita. Comunicación y expresión oral.
Comunicación y expresión en otras lenguas (con especial énfasis en el inglés).
Comunicación y expresión matemática, científica y tecnológica (cuando sea requerido y
estableciendo los niveles oportunos).
(G.5) Competencias en el uso de las herramientas y recursos de la Sociedad del
Conocimiento: Manejo de las TIC. Competencia en la búsqueda de información relevante.
Competencia en la gestión y organización de la información. Competencia en la recolección
de datos, el manejo de bases de datos y su presentación.
Competencias Específicas
(BC.6) Conocimiento y aplicación de los procedimientos algorítmicos básicos de las
tecnologías informáticas para diseñar soluciones a problemas, analizando la idoneidad y
complejidad de los algoritmos propuestos.
(BC.15) Conocimiento y aplicación de los principios fundamentales y técnicas básicas de los
sistemas inteligentes y su aplicación práctica.
(BTEc.1) Capacidad para tener un conocimiento profundo de los principios fundamentales de
la computación y saberlos aplicar para interpretar, seleccionar, valorar, modelar, y crear
RESULTADOS DE APRENDIZAJE
Los resultados que se pretenden alcanzar con el estudio de esta asignatura, siguiendo la
notación usada en la memoria de verificación del título por ANECA, son:
(R4) Conocer y ser capaz de implementar algoritmos sencillos y característicos de los
paradigmas más importantes de aprendizaje.
(R5) Ser capaz de identificar qué tipo de tareas están implicadas en un problema de
aprendizaje y saber elegir la técnica de aprendizaje y algoritmo más adecuados en función
de las características de cada tarea.
(R6) Ser capaz de evaluar e informar sobre la calidad de lo aprendido por un sistema de
aprendizaje.
(R7) Conocer y manejar plataformas software de uso generalizado que implementan
algoritmos de aprendizaje automático.
CONTENIDOS
El principal objetivo de esta parte del temario es presentar una introducción al Aprendizaje
Automático (AA), así como una serie de conceptos o fundamentos básicos que son comunes
a todas las técnicas de AA que se estudiarán durante el curso.
Tema 1. Introducción
Objetivos
El principal objetivo de este tema es presentar una introducción al aprendizaje automático.
Breve Introducción
Antes de estudiar una disciplina, resulta importante conocer cuáles son las motivaciones
por las que se considera útil el estudio y utilización de las técnicas pertenecientes a dicha
disciplina. Aquí, las motivaciones que hacen interesante el estudio del aprendizaje
automático se presentarán desde distintos puntos de vista: técnico (desarrolladores de
software), comercial (tendencias del mercado) y científico.
Para poder definir qué es el aprendizaje automático es preciso conocer antes el concepto
genérico de Aprendizaje. Son varias las definiciones existentes en la literatura relacionada
con el tema. Sin embargo, dado que no se conocen, con la profundidad suficiente, los
mecanismos que controlan el aprendizaje humano, la mayoría de las definiciones existentes
se centran más en la funcionalidad del aprendizaje que en los procesos internos asociados a
dicha capacidad. Por tanto, el alumno debería familiarizarse con estas definiciones, para
poder inferir el conjunto de características relacionadas con la capacidad de aprender y, de
esta forma, ser capaz de valorar si un sistema dado posee o no alguna aptitud para
aprender.
Por otro lado, a la hora de acercarse, analizar y entender el aprendizaje automático no existe
una perspectiva única. Aquí, mencionamos tres perspectivas del aprendizaje. La primera,
la perspectiva biológica, se centra en los mecanismos de adaptación de los seres vivos. La
segunda, la perspectiva computacional, concibe el AA como una nueva forma de
programación. Y la tercera, la perspectiva inferencial, se centra en qué tipo de inferencia se
realiza para poder aprender.
Como en cualquier otra rama del saber, también en el aprendizaje automático existen
multitud de circunstancias a lo largo de la historia que han conducido a la situación actual del
campo. Por tanto, el alumno debería conocer las diferentes etapas de esta evolución
histórica, así como las tendencias y relaciones con otras disciplinas, en especial con la
inteligencia artificial, que han marcado y caracterizado cada una de dichas etapas.
Objetivos
El objetivo básico de este tema es presentar una serie de conceptos y procedimientos
básicos en aprendizaje automático que son comunes a todas las técnicas que se estudiarán
en la asignatura.
Breve introducción
En primer lugar se realizará una formalización del concepto del aprendizaje en términos
de tarea, definiendo así cuáles son sus objetivos, sus entradas y salidas, y los diferentes
componentes y relaciones entre ellos. A continuación, se analizarán los principales
elementos y conceptos básicos utilizados en los sistemas de aprendizaje. La
descripción se centrará en introducir dichos conceptos de forma genérica de modo que
puedan ser particularizados, posteriormente, a lo largo de los restantes temas de la
asignatura. Seguidamente, se describirán y analizarán las etapas básicas relacionadas
con el diseño de cualquier experimento de aprendizaje:
• Determinación de la función objetivo
• Recopilación de casos
• Elección de atributos predictivos
• Codificación de los valores de atributo
• Selección de instancias de entrenamiento y de test
Un aspecto importante a la hora de abordar la tarea de aprendizaje es plantearla como un
problema de búsqueda. Esto permitirá crear un marco común, independiente del problema
a resolver, formado por un conjunto de estados (conjunto de todas las configuraciones
posibles de situaciones que pueden darse en el problema) y un conjunto de operadores (que
representan las transiciones entre estados). A su vez, estos dos conjuntos permitirán
formalizar el espacio del problema de búsqueda en forma de grafo en el que los nodos
representan estados y los arcos representan operadores. Por tanto, un problema concreto se
definirá por un estado inicial y un estado final (solución), y la resolución del problema
consistirá en encontrar un camino que permita pasar desde el estado inicial hasta el estado
final.
También se verá que la tarea de aprendizaje se puede descomponer en un conjunto de
subtareas representativas: clasificación, agrupación y caracterización. Por tanto, se hará
una descripción de las características que definen cada una de estas subtareas. Piénsese
que, a la hora de resolver un problema de aprendizaje, resulta útil identificar cuáles son las
tareas que implican aprendizaje y, además, clasificar cada una de ellas de acuerdo a la
subtarea que pertenece. Esto facilitará la elección de la técnica de aprendizaje más
adecuada en virtud del tipo de subtarea.
Objetivos
El principal objetivo de este tema es presentar un conjunto de técnicas de aprendizaje
relacionadas con el aprendizaje de conceptos. Tradicionalmente, se ha denominado
“concepto objetivo” a aquel concepto que puede ser expresado mediante un conjunto de
características. Por tanto, el principal objetivo de las técnicas de aprendizaje que se
describirán en este tema es encontrar, a partir de un conjunto de ejemplos y contraejemplos
expresados en términos de un conjunto de características, una descripción del concepto a
aprender que explique todos los ejemplos positivos y que excluya todos los negativos
(contraejemplos). La descripción final del concepto aprendido (modelo) vendrá expresada en
forma de regla o conjunto de reglas. La diferencia principal entre las técnicas que aquí se
presentan radica en la expresividad utilizada para formular tanto los ejemplos positivos y
negativos como el conjunto de reglas aprendido. Así, en el caso del Espacio de Versiones y
AQ dicha expresividad vendrá limitada por la de la propia lógica de proposiciones (reglas y
ejemplos descritos en términos de atributo-valor). En cambio, en el caso de la programación
lógica inductiva (ILP, del inglés Inductive Logic Programming), el grado de expresividad del
modelo aprendido será mayor al venir formulado en términos de lógica de predicados
(reglas y ejemplos descritos en términos de predicados y relaciones).
Breve introducción
Partiendo de la idea del problema de aprendizaje como un problema de búsqueda, la
estrategia del Espacio de Versiones (EV) es obtener un grupo reducido de hipótesis que
permita explicar adecuadamente todos los ejemplos, tanto positivos como negativos. Los
ejemplos son procesados de uno en uno, de tal forma, que en cada iteración, se reduce el
grupo de hipótesis que explican, no sólo el ejemplo considerado en la iteración, sino también
todos los procesados hasta el momento. Si el conjunto de ejemplos está bien diseñado,
existirá un momento en el que el tamaño del conjunto de hipótesis se reducirá a una única
hipótesis. Se dice entonces que el algoritmo converge y que la hipótesis resultante
representa el concepto aprendido.
De otro lado, no hay que olvidar que uno de los primeros intentos de programar mecanismo
de aprendizaje en máquinas fue debido a Michalski en los setenta. El resultado fue la
creación de una metodología denominada estrella de la que se han derivado numerosas
variantes. Todos los posibles algoritmos que se pueden generar a partir del método estrella
serán presentados en el presente tema con el nombre genérico de algoritmo AQ.
Podría decirse que si las dos técnicas anteriores permiten la aplicación de técnicas de
aprendizaje inductivo sobre la lógica proposicional, la programación lógica inductiva (PLI)
permite la aplicación de técnicas de aprendizaje inductivo sobre la lógica de predicados de
primer orden. Por tanto, dado que este tipo de técnicas permite recibir como entradas
descripciones en lógica de predicados, no sólo acepta ejemplos descritos en esa
representación, sino también incluye una teoría del dominio. Con esto se consigue cubrir las
deficiencias de los métodos inductivos y deductivos, utilizando ideas de ambos. Así, por una
parte, los métodos de aprendizaje inductivo no utilizan conocimiento del dominio y, por otra
parte, los métodos deductivos no son capaces de generalizar más allá de la descripción del
dominio disponible y de un ejemplo de entrenamiento. Por tanto, podría decirse que la PLI
realiza una inducción ayudada por el conocimiento del dominio. La programación lógica
inductiva tiene su origen en los años setenta, en los primeros sistemas que aprendían
Objetivos
El principal objetivo de este tema es presentar dos de las técnicas de aprendizaje quizás
más conocidas y utilizadas en aprendizaje automático: los árboles de decisión y los
árboles de regresión. Más concretamente, en el primer caso, se abordarán los aspectos
más relevantes del algoritmo ID3 y su sucesor C4.5 y, en el segundo caso, se describirán las
características del algoritmo M5.
Breve introducción
En el tema anterior se ha estudiado técnicas de aprendizaje supervisado que abordaban
problemas de clasificación binarios, es decir, un ejemplo pertenece o no a una determinada
clase (concepto objetivo). Además, dichas técnicas no eran tolerantes al ruido en las
entradas, lo que dificulta su aplicación en problemas del mundo real. Estas dos limitaciones
desaparecen en las técnicas de aprendizaje descritas en este tema. Así, los denominados
árboles de decisión abordarán problemas de clasificación en los que la salida del modelo
aprendido puede discriminar entre dos o más clases y, además, es tolerante al ruido en
las entradas. Incluso, se puede dar un paso más y, en lugar de predecir valores de clase, el
objetivo podría ser el de predecir valores continuos. Esta última será la tarea abordada por
los denominados árboles de regresión.
La clave, a la hora de construir un árbol de decisión, radica en elegir en cada nodo de
decisión aquel atributo que tenga mayor capacidad de discriminación sobre los ejemplos
asociados al nodo. Es decir, aquél que para cada valor del atributo genera una partición de
Objetivos
El objetivo de este tema es presentar técnicas que permiten realizar tareas de clasificación a
partir de un conjunto de ejemplos de entrada, sin necesidad de crear un modelo como, por
ejemplo, sí hacen las técnicas que se han presentado hasta ahora. Concretamente, se
Breve introducción
De forma genérica, las técnicas aquí presentadas reciben el nombre de técnicas de
aprendizaje basadas en instancias (IBL, del inglés Instance Based Learning) o técnicas
de aprendizaje vago (del inglés, lazy learning). Esta última denominación hace referencia a
que, precisamente, este tipo de técnicas implican muy poco esfuerzo computacional a la
hora de aprender, reflejado en el hecho de que no generan modelos de aprendizaje a
partir de los ejemplos. Simplemente, se limitan a almacenar dichos ejemplos de tal forma
que, a la hora de clasificar un ejemplo no visto, el algoritmo utiliza como entrada todos los
ejemplos almacenados.
Objetivos
El principal objetivo de este tema es realizar un acercamiento al mundo de los denominados
clasificadores bayesianos. Para ello, describiremos la versión más simple de este tipo de
algoritmos: el algoritmo Naive-Bayes.
Breve introducción
El objetivo de los clasificadores bayesianos, al igual que los árboles de decisión, es el de
crear un modelo, a partir de un conjunto de entrenamiento, que sea capaz de clasificar
ejemplos no vistos. Como hablamos de clasificador, esto presupondrá que la clase de los
ejemplos de entrenamiento viene dada por valores discretos o etiquetas. Este tipo de
clasificadores se basan en estimar la probabilidad de pertenencia a una clase mediante la
estimación de las probabilidades condicionadas, utilizando para ello el teorema de Bayes.
Hay que tener en cuenta que el algoritmo Naive-Bayes asume independencia estadística,
es decir, asume que el valor de los atributos es independiente dada la clase. Sin embargo,
esta propiedad puede no cumplirse en algunos problemas. Por tanto, antes de aplicar este
algoritmo, es siempre conveniente chequear si, para el problema de clasificación que se esté
abordando, es razonable o no esta asunción.
Objetivos
El objetivo principal de este tema es introducir las denominadas redes neuronales
artificiales, un nuevo paradigma de aprendizaje supervisado inspirado en la forma en que
funciona el sistema nervioso de los animales. Básicamente, una red neuronal consiste en
una red de elementos de proceso interconectados, denominadas neuronas, que permiten
aprender la información subyacente en un conjunto de ejemplos de entrenamiento. Dicha
información es almacenada de forma implícita en la topología de la red y en los pesos
asociados a cada conexión. Aunque existen diferentes tipos de redes neuronales, aquí nos
centraremos en el perceptrón multicapa y su algoritmo de aprendizaje estrella, denominado
método de retropropagación del error o en inglés backpropagation.
Breve introducción
Los primeros modelos de redes neuronales datan de 1943 por los neurólogos McCulloch y
Pitts. Años más tarde, en 1949, Donald Hebb desarrolló sus ideas sobre el aprendizaje
neuronal, quedando reflejado en la "regla de Hebb". En 1958, Rosemblatt desarrolló el
perceptrón simple, y en 1960, Widrow y Hoff desarrollaron el ADALINE. En los años
siguientes, se redujo la investigación, debido a la falta de modelos de aprendizaje y el
estudio de Minsky y Papert sobre las limitaciones del perceptrón. Sin embargo, en los años
80, volvieron a resurgir las RNA gracias al desarrollo de la red de Hopfield, y en especial, al
algoritmo de aprendizaje de retropropagación ideado por Rumelhart y McLellan en 1986 que
fue aplicado en el desarrollo de los perceptrones multicapa.
Las características de las RNA las hacen bastante apropiadas para aplicaciones en las que
no se dispone a priori de un modelo identificable que pueda ser programado, pero se
dispone de un conjunto básico de ejemplos de entrada. Asimismo, son altamente robustas
tanto al ruido como a la disfunción de elementos concretos y son fácilmente paralelizables.
Por el contrario, los modelos generados (la propia red) son difícilmente interpretables.
8.1 Introducción.
8.2 MVS para clasificación binaria
Objetivos
Este tema presentará una nueva técnica de aprendizaje supervisado, denominada
máquinas de vectores soporte (SVM, del inglés Support Vector Machines). Sin embargo,
tiene sólo carácter introductorio y, por tanto, sólo constituye una primera aproximación a este
paradigma de aprendizaje.
Breve introducción
Las máquinas de vectores soporte fueron introducidas por Vapnik a mediados de los 90. Los
métodos basados en este paradigma permiten resolver tanto tareas de clasificación como de
regresión. Dentro de la tarea de clasificación, las SVMs pertenecen a la categoría de los
clasificadores lineales, puesto que inducen separadores lineales o hiperplanos, ya sea en
el espacio original de los ejemplos de entrada, si éstos son separables o cuasi-separables
(ruido), o en un espacio transformado (espacio de características), si los ejemplos no son
separables linealmente en el espacio original. La búsqueda del hiperplano de separación en
estos espacios transformados se hará de forma implícita utilizando las denominadas
funciones kernel.
Objetivos
El principal objetivo de este tema es presentar dos técnicas de agrupamiento, muy utilizadas
por la estadística, como son la estrategia aglomerativa y la agrupación en k-medias.
Ambas técnicas tienen la particularidad de que trabajan con conjuntos de entrenamiento con
atributos numéricos. No obstante, existen otras técnicas de agrupamiento que manejan
atributos discretos, pero quedan fuera del temario de esta asignatura.
Breve introducción
La estrategia aglomerativa fue introducida a principio de los 80 por Everitt. Básicamente,
consiste en, dado un conjunto de ejemplos sin etiquetar descrito por valores de atributos,
obtener una jerarquía de clases que incluya, cada una de ellas, a un subconjunto del
conjunto de ejemplos. A estas jerarquías se les denomina dendogramas. En ellas, cada nodo
representa una clase de observaciones.
Por otro lado, la agrupación basada en el algoritmo k-medias no se basa en un proceso de
jerarquización de clases. En este caso, los ejemplos del conjunto de entrenamiento se
agrupan en subconjuntos formados por ejemplos “parecidos” entre sí. Es decir, el objetivo es
obtener una partición del conjunto de ejemplos que maximice la similitud entre los
ejemplos de cada partición (clase) y minimice la similitud entre diferentes particiones
(clases). Tiene la peculiaridad de que el número de clases debe ser proporcionado a priori
por el usuario
Objetivos
En la Parte II, se presentaron las redes neuronales artificiales (RNAs) como uno de los
paradigmas del aprendizaje supervisado. Sin embargo, el principal objetivo de este tema es
mostrar que existen determinados tipo de RNAs que pueden utilizarse para realizar
aprendizaje no supervisado. Son las denominadas redes neuronales auto-organizadas.
Breve introducción
Tal vez los modelos más característicos de redes no supervisadas sean los de Kohonen,
llamadas así en honor al científico finlandés que las creó, siendo también los más utilizados
Las técnicas de aprendizaje presentadas hasta aquí han sido de dos tipos: supervisadas
(cada ejemplo de entrenamiento incorpora la clase a la que pertenece) o no supervisadas
(los ejemplos no disponen de la información de clase). Sin embargo, existe un conjunto de
problemas en los que a los ejemplos se le asocia una especie de información retardada en el
tiempo y que, de alguna manera, puede entenderse desde la perspectiva de las demás
técnicas de aprendizaje como un valor de clase, delimitado por sólo dos valores posibles
(recompensa o castigo). Las técnicas que abordan este tipo de problemas son conocidas, de
forma genérica, con el nombre de técnicas de aprendizaje por refuerzo. El principal objetivo
de esta última parte del temario será presentar uno de los algoritmos más representativos de
este tipo de técnicas, el denominado algoritmo Q-learning.
Objetivos
El principal objetivo del presente tema es introducir el algoritmo Q-learning, uno de los
algoritmos más representativos de las denominadas técnicas de aprendizaje por refuerzo.
Desde un punto de vista más general, también se presentarán las características comunes
de este tipo de técnicas.
Breve introducción
La meta de las técnicas de aprendizaje por refuerzo es adquirir conocimiento, normalmente
denominado política de acción, que permita determinar, una vez adquirido, la mejor acción
a realizar desde un estado dado. La acción a elegir será siempre aquella que maximice el
refuerzo (recompensa) esperado. Básicamente, la forma de adquirir este conocimiento
(modelo) es la siguiente: se irá construyendo progresivamente una tabla en la que se
relaciona cada estado posible si con cada acción posible aj, aprendiendo cuál es el refuerzo
METODOLOGÍA
PLAN DE TRABAJO
Dado el carácter introductorio de este tema, será suficiente realizar una lectura atenta de los
contenidos relacionados con dicho tema.
Por otro lado, para el estudio del algoritmo AQ, se recomienda focalizar en los siguientes
aspectos:
1. Es importante comprender los conceptos de función LEF, selector, complejo y
recubrimiento.
2. En relación al funcionamiento del algoritmo, es importante tener en cuenta que se basa en
la realización de dos búsquedas anidadas. En la más externa, denominada método
estrella, se busca un conjunto de reglas que clasifiquen correctamente a todos los
ejemplos. En la más interna, por cada ejemplo positivo, se busca una regla que describa a
dicho ejemplo y no descrina a ninguno negativo. Precisamente, en cómo se realiza esta
segunda búsqueda es en lo que difieren, fundamentalmente, los diferentes variantes de
este algoritmo.
3. Las variantes del algoritmo, descritas en pp. 149-153 del texto base, no serán objeto de
examen. Se recomienda sólo una lectura atenta.
Finalmente, para el estudio del algoritmo FOIL, se recomienda focalizar en los siguientes
aspectos:
1. La salida del algoritmo es un conjunto de reglas y éstas vienen expresadas en forma de
reglas de Horn. Por tanto, el alumno deberá familiarizarse con este tipo de formato.
1. El procedimiento clave en la dinámica del algoritmo es el denominado literal-máxima-
ganancia. Se encarga de elegir el mejor literal para añadir al cuerpo de la cláusula. De
todos los posibles literales que se pueden formar con los predicados del dominio, este
procedimiento selecciona uno en cada iteración, de acuerdo a un criterio de máxima
ganancia, parecido al que se verá más adelante para el algoritmo ID3. Es muy importante
que el alumno entienda cada uno de las variables y funciones que aparecen en la
fórmula de la ganancia, G(L), y que sea capaz de evaluar cada una de ellas para, de
esta forma, poder evaluar correctamente el valor de la ganancia y poder así elegir el literal
que determine una mayor ganancia.
2. Igualmente es muy importante entender y saber aplicar las reglas que permiten generar
los distintos tipos de literales que se pueden formar (pp. 257-258).
3. Si el alumno consulta otros textos, es posible que encuentre este tipo de árboles bajo el
nombre de árboles de modelo (del inglés, model trees). Es el nombre que Quinlan, el
creador del algoritmo M5, utilizó para designar lo que aquí llamamos árboles de regresión.
funciones.
4. Desde un punto de vista algorítmico, el problema de optimización del margen
geométrico representa un problema de optimización cuadrático con restricciones
lineales que puede ser resuelto mediante técnicas estándar de programación cuadrática.
Dado que el estudio de este tipo de técnicas queda fuera del alcance de este temario, el
principal objetivo de este tema radica en que el alumno estudie y comprenda cómo se
formaliza el problema abordado por las SVMs (ya sea de clasificación o de regresión)
hasta llegar a transformarlo, finalmente, en un problema de optimización cuadrático.
Para el estudio del algoritmo k-medias, se recomienda focalizar en los siguientes aspectos:
1. Es importante señalar que este algoritmo es dependiente de los centroides iniciales,
normalmente elegidos de forma aleatoria. Una mala elección de dichos centroides puede
provocar la no convergencia del algoritmo.
2. También es dependiente de los rangos de variación de los dominios de definición de cada
uno de los atributos de los ejemplos. Por ello, antes de usar el algoritmo, se requiere una
introduciendo algunas modificaciones. Sin embargo, este tipo de variaciones quedan fuera
del alcance de este curso y sólo se recomienda una lectura atenta de esta nueva variante.
SISTEMA DE EVALUACIÓN
TIPO DE PRUEBA PRESENCIAL
Tipo de examen Examen de desarrollo
Preguntas desarrollo 4
Duración del examen 120 (minutos)
Material permitido en el examen
Sólo se permite calculadora no programable.
Criterios de evaluación
BIBLIOGRAFÍA BÁSICA
ISBN(13):9788496094734
Título:APRENDIZAJE AUTOMÁTICO (1ª)
Autor/es:González Boticario, Jesús ; Isasi Viñuela, Pedro ; Borrajo Millán, Daniel ;
Editorial:SANZ Y TORRES
Los capítulos específicos que hay que estudiar del texto base, su relación con el temario de
la asignatura, así como las orientaciones de estudio de cada tema, se especifican en la
sección "Plan de Trabajo" de esta Guía de Estudio. No obstante, la información de dicha
sección no es pública y sólo es visible cuando se accede a la Guía desde el curso virtual de
la asignatura.
Existe también una Fe de Erratas (no oficial) del texto base que podrá descargar desde el
curso virtual.
BIBLIOGRAFÍA COMPLEMENTARIA
ISBN(13):9788420540917
Título:INTRODUCCIÓN A LA MINERÍA DE DATOS (1ª)
Autor/es:Ferri Ramírez, César ; Ramírez Quintana, Mª José ; Hernández Orallo, José ;
Editorial:PEARSON
ISBN(13):9788483223185
Título:APRENDIZAJE AUTOMÁTICO: CONCEPTOS BÁSICOS Y AVANZADOS (1ª)
Autor/es:Sierra Araujo, Basilio ;
Editorial:Pearson Prentice Hall
El segundo libro [Hernández et al-2004], tal y como indica su título, está más orientado a la
minería de datos. Sin embargo, además de tratar sobre los diferentes aspectos de cada una
de las etapas implicadas en el proceso de la minería de datos, realiza también una revisión
de las diferentes técnicas de aprendizaje automático más utilizadas en este campo. El
enfoque del libro es bastante práctico, mostrando numerosos ejemplos con diferentes
entornos software (de uso libre y comercial) de aprendizaje automático.
(3) Enlaces de interés a recursos web relacionados con la asignatura (tutoriales, software,
etc.)
(5) Ejercicios resueltos para que el alumno pueda autoevaluar sus conocimientos.
(8) Un foro de alumnos para que éstos puedan interaccionar. Este foro no es atendido ni
supervisado por el equipo docente.
(9) Enlaces de acceso a las tutorías intercampus ya emitidas, para poder ser visualizadas en
diferido.
GLOSARIO
A continuación se ofrece una serie de enlaces que el alumno puede consultar como glosario
de términos relacionado con los contenidos de la asignatura:
• The Machine Learning Dictionary: http://www.cse.unsw.edu.au/~billw/mldict.html
• Special Issue on Applications of Machine Learning and the Knowledge Discovery Process:
http://robotics.stanford.edu/~ronnyk/glossary.html.
IGUALDAD DE GÉNERO
En coherencia con el valor asumido de la igualdad de género, todas las denominaciones que en esta
Guía hacen referencia a órganos de gobierno unipersonales, de representación, o miembros de la
comunidad universitaria y se efectúan en género masculino, cuando no se hayan sustituido por
términos genéricos, se entenderán hechas indistintamente en género femenino o masculino, según el
sexo del titular que los desempeñe.