Redes Neuronales Artificiales-1
Redes Neuronales Artificiales-1
Redes Neuronales Artificiales-1
Enviar correspondencia a:
Alfonso Palmer Pol. Universidad de las Islas Baleares. Departamento de Psicología. Cra. de Valldemossa, km. 7,5. 07071 Palma (Baleares). Teléfono 971173432.
Resumen: Abstract:
En el presente trabajo, se introduce al lector en el campo de In this paper, we introduce to the reader in the field of artifi-
las redes neuronales artificiales (RNA) –características genera- cial neural networks (ANN) –general features, architectures,
les, arquitecturas, reglas de aprendizaje, ejemplos ilustrativos y learning rules, illustrative examples and general applications—,
aplicaciones generales—, y se realiza una revisión de las aplica- and we review the applications carried out with this technology
ciones llevadas a cabo con esta tecnología en el campo de las in the field of addictive behaviors. Results of research show the
conductas adictivas. Los resultados de las investigaciones capacity of ANN in order to predict drug consumption, extract
demuestran la capacidad de las RNA para predecir el consumo prototype characteristics of addicted subjects and choose the
de drogas, extraer las características prototípicas del sujeto treatment most appropiate according to those characteristics.
adicto y seleccionar el tratamiento más adecuado en función de Although these studies are preliminary, the results can be quali-
esas características. Aunque tales estudios son preliminares, fied as very promising; so, ANN are a powerful tool for profes-
los resultados se pueden considerar prometedores, perfilándo- sional dedicated to field of addictive behaviors.
se las RNA como un potente instrumento al servicio del profe-
sional dedicado al campo de las conductas adictivas. Key words: artificial neural networks, drug addiction, predic-
tion, bibliographic review.
Palabras clave: redes neuronales artificiales; adicción a las dro-
gas; predicción; revisión bibliográfica.
Terminales
Cuerpo axónicos
celular
Axón
Dendritas
Por su parte, la neurona artificial pretende mimeti- denominada función de salida—, sobre la entrada
zar las características más importantes de la neurona neta, se calcula un valor de salida, el cual es enviado a
biólogica. En general, recibe las señales de entrada de otras neuronas (figura 2). Tanto los valores de entrada
las neuronas vecinas ponderadas por los pesos de las
conexiones. La suma de estas señales ponderadas a la neurona como su salida pueden ser señales exci-
proporciona la entrada total o neta de la neurona y, tatorias (cuando el valor es positivo) o inhibitorias
mediante la aplicación de una función matemática — (cuando el valor es negativo).
1 Entrada
Peso
Función Salida
2 Entrada neta de salida
(entrada neta)
N Neuronas j
Neuronas i
1
1
1 1 1 1 1
1 0 0 0 1
1 1 1 1 1
1 0 0 0 0
1 1 1 1 0
.
.
Podemos estar interesados en entrenar la red para 0 0; si el ejemplar es una E, entonces la salida debería
clasificar cada figura en la categoría a la que pertene- ser el vector 0 1 0 0 0; y así sucesivamente. Por últi-
ce. En este caso la red debe aprender a asociar cada mo, el número de neuronas ocultas dependerá, en
figura con la vocal que representa (heteroasociación). gran medida, de la complejidad del problema.
El tipo de arquitectura que se suele utilizar en este La fase de entrenamiento o aprendizaje consistirá
tipo de problemas consiste en un perceptrón multica- en la presentación repetida de un grupo representati-
pa compuesto por una capa de entrada, una oculta y vo de ejemplos de vocales junto con sus salidas
una de salida. El número de neuronas de entrada y de correspondientes. La regla de aprendizaje será super-
salida estará determinado por el problema. Así, la capa visada, debido a que cada información de entrada está
de entrada a la red estará formada por tantas neuro- asociada a una salida deseada. Mediante esta regla
nas de entrada como elementos o píxeles formen las iremos modificando los pesos de las conexiones itera-
figuras; en este caso tenemos 20 píxeles. Cada una tivamente hasta que la salida de la red coincida o se
de estas neuronas de entrada se encargará de recibir aproxime hasta un nivel aceptable a la salida deseada
y procesar un píxel. La capa de salida estará formada para cada uno de los ejemplos de entrenamiento. En
por tantas neuronas como categorías o clases conten- la figura 4A se muestra este proceso para el caso de
ga el problema; en este caso tenemos cinco vocales. un ejemplar de la vocal E. En esta fase, la red organiza
Cada neurona de salida representará una vocal. Pode- una representación interna del conocimiento en los
mos determinar la salida de la red de forma que ante pesos de las conexiones de las neuronas ocultas, a fin
la presentación de un ejemplar, la neurona de salida de aprender la relación que existe entre el conjunto de
correspondiente a la vocal que representa el ejemplar, patrones dados como ejemplo y sus salidas corres-
dé como salida el valor 1 (activada) y todas las demás pondientes.
den como salida el valor 0 (desactivada). Así, si la figu- En la fase de test podremos presentar ejemplares
ra que presentamos a la entrada de la red es una A, nuevos, la red propagará la información a través de las
entonces la salida de la red debería ser el vector 1 0 0 sucesivas capas hasta proporcionar una salida. La pre-
A) Fase de entreno:
Supervisor
B) Fase de test:
sentación de ejemplares desconocidos, distorsiona- trativos, utilizaremos una red monocapa entrenada
dos o incompletos nos permitirá comprobar el grado con aprendizaje no supervisado para realizar esta
de generalización que alcanza el modelo construido. tarea, aunque en la práctica es más efectivo utilizar
En la figura 4B se muestra cómo la red proporciona una red multicapa con aprendizaje supervisado. El
una respuesta correcta ante un ejemplar incompleto número de neuronas de la red monocapa estará
de la vocal E que no había sido utilizado en la fase de determinado por el número de píxeles que componen
entrenamiento. las figuras, en este caso es igual a 20; de forma que
Hemos visto un ejemplo de reconocimiento de cada neurona se encargará de recibir y procesar un
patrones mediante la clasificación de cada figura en la píxel. La fase de aprendizaje consistirá en el almace-
categoría a la que pertenece. Se trata de un caso de namiento de los diferentes ejemplos de entrenamien-
red heteroasociativa. Ahora bien, podríamos estar to en los pesos de la red. Para ello, iremos
interesados en entrenar la red para que aprendiera a presentando los ejemplos o patrones y la red irá modi-
asociar cada patrón o figura consigo misma. Como ficando los pesos de forma iterativa hasta que alcan-
hemos visto, se trataría de un ejemplo de reconoci- cen una estabilidad. En la figura 5A se muestra este
miento de patrones por autoasociación. Con fines ilus- proceso para el caso de un ejemplar de la vocal E.
Salida 1 0 1
de la red
1 i 20 1 i 20
Patrón de Patrón de
1 0 1 0 0 1
entrada entrada
En la fase de test se demuestra la utilidad de este variables de entrada es demasiado grande como para
tipo de modelos. Permiten la reconstrucción de una que un modelo convencional aprenda a solucionar el
determinada información de entrada que se presenta problema en un tiempo razonable.
incompleta o distorsionada, proporcionando como Cuando no se dan estas circunstancias puede ser
salida la información almacenada más parecida. En la más aconsejable optar por solucionar el problema
figura 5B se muestra cómo la red reconstruye en su mediante un modelo derivado de la estadística o la
salida la figura de una E a partir de su entrada incom- Inteligencia Artificial. Por tanto, no debemos concebir
pleta. las RNA como una alternativa, sino más bien como un
complemento a los modelos convencionales ya esta-
blecidos.
Ventajas y limitaciones de las redes neuronales
artificiales Las RNA presentan una serie de ventajas frente a
los modelos estadísticos. Una ventaja fundamental
consiste en que los modelos neuronales normalmen-
Las RNA no son la panacea que permite resolver te no parten de restricciones respecto de los datos de
todos los problemas, sino que están orientadas a un partida (tipo de relación funcional entre variables), ni
determinado tipo de tareas. Podemos destacar cuatro suele imponer presupuestos (como distribución gaus-
características del problema o tarea que hacen acon- siana u otras). Por otra parte, como hemos comenta-
sejable la utilización de las RNA (Martín del Brío y do, la habilidad de las neuronas de calcular funciones
Sanz, 1997). Por una parte, no se dispone de un con- de salida no lineales capacita a la red para resolver
junto de reglas sistemáticas que describan completa- problemas complejos o no lineales. De este modo, en
mente el problema. En cambio, sí disponemos de numerosas aplicaciones se están consiguiendo con
muchos ejemplos o casos (condición indispensable RNA cotas de error mucho mejores que las proporcio-
para poder aplicar las RNA). Por otra parte, los datos nadas por la estadística.
procedentes del problema son imprecisos, incoheren- Respecto a las limitaciones que presentan las RNA,
tes o con ruido (como el ejemplo visto sobre el reco- una de las más importantes consiste en que es difícil
cocimiento de la letra E). Por último, el problema es comprender la naturaleza de las representaciones
de elevada dimensionalidad, es decir, el número de internas generadas por la red para responder ante un