Redes neuronales y capitulos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 28

Redes neuronales

Última actualización: 2021-08-17

Una red neuronal puede aproximar una amplia gama de modelos


predictivos con demandas mínimas sobre la estructura y asunción de
modelos. La forma de las relaciones está determinada durante el
proceso de aprendizaje. Si una relación lineal entre el objetivo y los
predictores es apropiada, los resultados de la red neuronal deben
aproximarse mucho a los del modelo lineal tradicional. Si una relación
no lineal es más apropiada, la red neuronal aproximará
automáticamente la estructura de modelo "correcta".

El equilibrio de esta flexibilidad es que la red neuronal no es


fácilmente interpretable. Si intenta explicar un proceso subyacente
que genera las relaciones entre el objetivo y los predictores, se
debería utilizar mejor un modelo estadístico más tradicional. Sin
embargo, si la interpretabilidad del modelo no es importante, puede
obtener buenas predicciones utilizando una red neuronal.

Figura 1. pestaña Campos

Requisitos del campo. Debe haber al menos un objetivo y una


entrada. Se ignorarán los campos establecidos en Ambos o Ninguno.
No hay restricciones de nivel de medición en los objetivos o en los
predictores (entradas). Para obtener más información,
consulte Opciones de los campos del nodo de modelado.

Las ponderaciones iniciales asignadas a redes neuronales durante la


creación del modelo y, por lo tanto, los modelos finales generados
dependen del orden de los campos en los datos. SPSS Modeler ordena
automáticamente los datos por el nombre del campo antes de
presentarlos a la red neuronal para el entrenamiento. Esto significa
que cambiar el orden explícitamente de los campos en los datos en
sentido ascendente no afectará a los modelos de red neuronal
generados cuando se establece una semilla aleatoria en el generador
de modelos. Sin embargo, cambiar los nombres de campo de entrada
de una forma que cambia el orden de clasificación generará distintos
modelos de red neuronal, incluso con una semilla aleatoria
establecida en el generador de modelos. La calidad del modelo no se
verá afectada de forma significativa dada una orden de clasificación
de nombres de campo.

 El modelo de redes neuronales


 Utilización de redes neuronales con rutas heredadas
 Objetivos (redes neuronales)
 Conceptos básicos (redes neuronales)
 Reglas de parada (redes neuronales)
 Conjuntos (redes neuronales)
 Avanzados (redes neuronales)
 Opciones de modelo (redes neuronales)
 Resumen del modelo (redes neuronales)
 Importancia del predictor (redes neuronales)
 Predicho por observado (redes neuronales)
 Clasificación (redes neuronales)
 Red (redes neuronales)
 Configuración (redes neuronales)

 El modelo de redes
neuronales
 Última actualización: 2021-08-17
 Las redes neuronales son modelos simples del funcionamiento
del sistema nervioso. Las unidades básicas son las neuronas,
que generalmente se organizan en capas, como se muestra en
la siguiente ilustración.
 Figura 1. Estructura de una red neuronal


 Una red neuronal es un modelo simplificado que emula el
modo en que el cerebro humano procesa la información:
Funciona simultaneando un número elevado de unidades de
procesamiento interconectadas que parecen versiones
abstractas de neuronas.
 Las unidades de procesamiento se organizan en capas. Hay tres
partes normalmente en una red neuronal : una capa de
entrada, con unidades que representan los campos de
entrada; una o varias capas ocultas; y una capa de salida,
con una unidad o unidades que representa el campo o los
campos de destino. Las unidades se conectan con fuerzas de
conexión variables (o ponderaciones). Los datos de entrada se
presentan en la primera capa, y los valores se propagan desde
cada neurona hasta cada neurona de la capa siguiente. al final,
se envía un resultado desde la capa de salida.
 La red aprende examinando los registros individuales,
generando una predicción para cada registro y realizando
ajustes a las ponderaciones cuando realiza una predicción
incorrecta. Este proceso se repite muchas veces y la red sigue
mejorando sus predicciones hasta haber alcanzado uno o varios
criterios de parada.
 Al principio, todas las ponderaciones son aleatorias y las
respuestas que resultan de la red son, posiblemente,
disparatadas. La red aprende a través del entrenamiento.
Continuamente se presentan a la red ejemplos para los que se
conoce el resultado, y las respuestas que proporciona se
comparan con los resultados conocidos. La información
procedente de esta comparación se pasa hacia atrás a través
de la red, cambiando las ponderaciones gradualmente. A
medida que progresa el entrenamiento, la red se va haciendo
cada vez más precisa en la replicación de resultados conocidos.
Una vez entrenada, la red se puede aplicar a casos futuros en
los que se desconoce el resultado.

 Utilización de redes
neuronales con rutas
heredadas
 Última actualización: 2021-08-17
 La versión 14 de IBM® SPSS Modeler ha introducido un nuevo
nodo de red neuronal, que admite técnicas de aumento y
agregación autodocimante y optimización para conjuntos de
datos de grandes dimensiones. Las rutas existentes que
contienen el nodo antiguo siguen creando y puntuando modelos
en releases posteriores. Sin embargo, este soporte se eliminará
en un futuro release, por lo que se recomienda utilizar la nueva
versión.
 Desde la versión 13 en adelante, los campos con valores
desconocidos (es decir, valores que no están presentes en los
datos de entrenamiento) ya no son tratados automáticamente
como valores perdidos y se puntúan con el valor $null$. Por lo
tanto, si desea puntuar campos con valores desconocidos como
no nulos mediante un modelo de red neuronal anterior (anterior
a 13) a la versión 13 o posterior, debería marcar los valores
desconocidos como valores perdidos (por ejemplo, por medio
del nodo Tipo).
 Tenga en cuenta que, por motivos de compatibilidad, las rutas
de legado que todavía contienen el nodo antiguo todavía
pueden estar utilizando la opción Limitar tamaño de
conjunto en Herramientas > Propiedades de ruta >
Opciones; esta opción sólo se aplica a las redes de Kohonen y
los nodos K-Medias de la versión 14 en adelante5.

(redes
Objetivos
neuronales)
Última actualización: 2021-08-17
Figura 1. Configuración de objetivos

¿Qué desea hacer?


 Crear un modelo nuevo. Crear un modelo totalmente nuevo.
Éste es el funcionamiento habitual del nodo.
 Continuar entrenando un modelo existente. El
entrenamiento continúa con el último modelo creado
correctamente por el nodo. Esto permite actualizar un modelo
existente sin tener que acceder a los datos originales. Además,
puede dar como resultado un rendimiento significativamente
más rápido ya que sólo se introducen en la ruta los registros
nuevos o actualizados. Los detalles del modelo anterior se
almacenan con el nodo de modelado, lo que permite utilizar
esta opción incluso si el nugget de modelo anterior ya no está
disponible en la ruta o la paleta de modelos.
Nota: Cuando esta opción está habilitada, todos los demás
controles de las pestañas Campos y Opciones de generación
están inhabilitados.

¿Cuál es su objetivo principal? Seleccione el objetivo apropiado.

 Crear un modelo estándar. El método genera un modelo


simple para predecir el destino mediante los predictores. Por lo
general, los modelos estándar son más fáciles de interpretar y
pueden puntuarse más rápido que los conjuntos por aumento,
agregación auntodocimante o los conjuntos de datos muy
grandes.
Nota: Para modelos segmentados, para utilizar esta opción
con Continuar entrenando un modelo existente debe estar
conectado a Analytic Server.
 Mejorar la precisión del modelo (aumento). El método
genera un modelo de conjunto mediante el aumento, que
genera una secuencia de modelos para obtener predicciones
más precisas. Se puede tardar más tiempo en generar y
puntuar conjuntos que un modelo estándar.

El aumento produce una sucesión de "modelos de


componente", cada uno de ellos basados en el conjunto de
datos completo. Antes de crear cada modelo de componente
sucesivo, los registros se ponderan en función de los residuos
del modelo del componente anterior. Los casos con residuos de
grandes dimensiones tienen ponderaciones de análisis
relativamente superiores para que el siguiente modelo de
componente se centre en predecir correctamente estos
registros. Juntos, estos modelos de componentes forman un
modelo de conjunto. El modelo de conjunto puntúa algunos
registros con una regla de combinación; las reglas disponibles
dependen del nivel de medición del destino.

 Mejorar la estabilidad del modelo (agregación


autodocimante). El método genera un modelo de conjunto
mediante la agregación autodocimante, que genera varios
modelos para obtener predicciones más fiables. Se puede
tardar más tiempo en generar y puntuar conjuntos que un
modelo estándar.

La agregación autodocimante produce replicaciones del


conjunto de datos de entrenamiento mediante muestreo con
repetición del conjunto de datos original. Crea muestras de
bootstrap de igual tamaño al conjunto de datos original. Es
decir, se crea un "modelo de componente" de cada replicación.
Juntos, estos modelos de componentes forman un modelo de
conjunto. El modelo de conjunto puntúa algunos registros con
una regla de combinación; las reglas disponibles dependen del
nivel de medición del destino.

 Crear un modelo para conjuntos de datos muy


grandes. El método genera un modelo de conjunto dividiendo
el conjunto de datos en bloques de datos independientes.
Seleccione esta opción si su conjunto de datos es demasiado
grande para construir cualquiera de los modelos anteriores o
para la generación incremental de modelos. Puede que se tarde
menos tiempo en generar esta opción, pero se puede tardar
más tiempo en puntuarla que un modelo estándar.

Cuando existen objetivos múltiples, este método sólo creará un


modelo estándar, sin importar el objetivo seleccionado.

Conceptos básicos (redes


neuronales)
Última actualización: 2021-08-17
Figura 1. Configuración básica

Modelo de red neuronal. El tipo de modelo determina cómo la red


conecta los predictores con los objetivos a través de las capas
ocultas. Los perceptrones multicapa (PMC) permiten relaciones
más complejas con el coste posible de aumentar el tiempo de
entrenamiento y puntuación. La función de base radial
(RBF) puede tener tiempos de entrenamiento y puntuación inferiores,
con el coste posible de una potencia de predicción reducida en
comparación con PMC.
Capas ocultas. Las capas ocultas de una red neuronal contienen
unidades no observables. El valor de cada unidad oculta es alguna
función de los predictores; la forma exacta de la función depende en
parte del tipo de red. Los perceptrones multicapa pueden tener una o
dos capas ocultas; la red de función de base radial puede tener una
capa oculta.

 Calcular automáticamente el número de unidades. Esta


opción construye una red con una capa oculta y calcula el
"mejor" número de unidades en la capa oculta.
 Personalizar el número de unidades. Esta opción le permite
especificar el número de unidades en cada capa oculta. La
primera capa oculta debe tener al menos una unidad. La
especificación de 0 unidades para la segunda capa oculta
construye perceptrones multicapa con una única capa oculta.
Nota: Deberá elegir valores de modo que el número de nodos
no exceda el número de predictores continuos además del
número total de categorías entre todos los predictores
categóricos (distintivo, nominal u ordinal).

Reglas de parada (redes


neuronales)
Última actualización: 2021-08-17
Figura 1. Configuración de reglas de parada

Son las reglas que determinan cuándo detener el entrenamiento de


las redes de perceptrones multicapa; esta configuración se ignora
cuando se utiliza el algoritmo de función de base radial. El
entrenamiento continúa al menos un ciclo (lectura de datos) y puede
detenerse luego según los siguientes criterios.
Emplear el tiempo de entrenamiento máximo (por modelo de
componente). Seleccione si se especifica un número máximo de
minutos para ejecutar el algoritmo. Especificar un número superior a
0. Cuando se construye un modelo de conjunto, es el tiempo de
entrenamiento permitido para cada modelo de componente del
conjunto. Tenga en cuenta que el entrenamiento puede superar
ligeramente el límite de tiempo especificado para completar el ciclo
actual.

Personalizar el número máximo de ciclos de entrenamiento. El


número máximo de ciclos de entrenamiento permitidos. Si se supera
el número máximo de ciclos, el entrenamiento se detiene. Especifique
un entero mayor que 0.

Utilizar precisión mínima. Seleccione esta opción para que el


entrenamiento continúe hasta alcanzar la precisión especificada.
Aunque no debería ocurrir, puede interrumpir el entrenamiento en
cualquier momento y guardar la red con la mejor precisión obtenida
hasta el momento.

El algoritmo de entrenamiento también se detendrá si el error en el


conjunto de prevención sobreajustado no disminuye tras cada ciclo, si
el campo relativo en el error de entrenamiento es pequeño, o si el
índice del error de entrenamiento actual es pequeño comparado con
el error inicial.

(redes
Conjuntos
neuronales)
Última actualización: 2021-08-17
Figura 1. Configuración de conjuntos
Estos ajustes determinan el comportamiento de la agrupación que se
produce cuando los conjuntos de datos de gran tamaño o de aumento
o agregación autodocimante son obligatorios en Objetivos. Las
opciones no aplicables al objetivo seleccionado se ignorarán.

Agregación autodocimante y conjuntos de datos muy


grandes. Al puntuar un conjunto, ésta es la regla utilizada para
combinar los valores predichos a partir de los modelos básicos para
calcular el valor de puntuación del conjunto.

 Regla de combinación predeterminada para objetivos


categóricos. Los valores predichos de conjunto para objetivos
categóricos pueden combinarse mediante votación, la mayor
probabilidad o la mayor probabilidad
media. Votación selecciona la categoría que tenga la mayor
probabilidad más frecuentemente entre los modelos básicos. La
mayor probabilidad selecciona la categoría que logra la
mayor probabilidad individual entre todos los modelos
básicos. Mayor probabilidad media selecciona la categoría
con el valor más elevado cuando se calcula la media de las
probabilidades de categoría entre los modelos básicos.
 Regla de combinación predeterminada para objetivos
continuos. Los valores predichos de conjunto para objetivos
continuos pueden combinarse mediante la media o mediana de
los valores predichos a partir de los modelos básicos.

Tenga en cuenta que cuando el objetivo es mejorar la precisión del


modelo, se ignoran las selecciones de reglas de combinación. El
aumento siempre utiliza un voto de mayoría ponderada para puntuar
objetivos categóricos y una mediana ponderada para puntuar
objetivos continuos.

Aumento y agregación autodocimante. Especifique el número de


modelos básicos que debe generarse cuando el objetivo es mejorar la
precisión o estabilidad del modelo; en el caso de la agregación
autodocimante, se trata del número de muestras de bootstrap. Debe
ser un número entero positivo.

(redes
Avanzados
neuronales)
Última actualización: 2021-08-17
Figura 1. Configuración avanzada
La configuración avanzada controla las opciones que no se ajustan
bien en otros grupos de configuraciones.

Conjunto de prevención sobreajustado. El método de red


neuronal divide los registros de manera interna en un conjunto de
creación de modelos y un conjunto de prevención sobreajustado, el
cual es un conjunto independiente de registros de datos utilizado para
realizar un seguimiento de errores durante la formación para evitar
que el método modele una variación atribuible al azar en los datos.
Especifique un porcentaje de registros. El valor por omisión es 30.

Replicar resultados. Al establecer una semilla aleatoria podrá


replicar análisis. Especifique un entero o pulse en Generar, lo que
creará un entero pseudo-aleatorio entre 1 y 2147483647, ambos
inclusive. De forma predeterminada, los análisis se replican con la
semilla 229176228.

Valores perdidos en predictores. Especifica cómo tratar los


valores perdidos. Eliminar de lista retira los registros con valores
perdidos en predictores de la creación de modelos. Imputar valores
perdidos sustituirá los valores perdidos de los predictores y utilizará
esos registros en el análisis. Los campos continuos imputan la media
de los valores observados mínimos y máximos; los campos
categóricos imputan la categoría que se produce con mayor
frecuencia. Tenga en cuenta que los registros con valores perdidos en
cualquier otro campo especificado en la pestaña Campos se eliminan
siempre de la creación de modelos.
Opciones de modelo (redes
neuronales)
Última actualización: 2021-08-17
Figura 1. Pestaña Opciones de modelo

Nombre del modelo. Puede generar el nombre del modelo


automáticamente tomando como base los campos objetivo o
especificar un nombre personalizado. El nombre generado
automáticamente es el nombre del campo objetivo. Si existen
objetivos múltiples, el nombre del modelo se forma con los nombres
de campos en orden, conectados por símbolos &. Por ejemplo,
si campo1 campo2 campo3 son objetivos, el nombre de modelo
es: campo1 & campo2 & campo3.

Dejar disponible para puntuar. Cuando se puntúa el modelo, se


crearán los elementos seleccionados en este grupo. El valor predicho
(para todos los objetivos) y la confianza (para objetivos categóricos)
se calculan siempre cuando se puntúa el modelo. La confianza
calculada puede basarse en la probabilidad del valor predicho (la
probabilidad predicha más alta) o la diferencia entre la probabilidad
predicha más alta y la segunda probabilidad predicha más alta.

 Probabilidad predicha para objetivos categóricos. Genera


las probabilidades predichas para objetivos categóricos. Se crea
un campo para cada categoría.
 Puntuaciones de propensión para objetivos de marca. En
el caso de modelos con un objetivo de marca (que devuelve una
predicción de sí o no), puede solicitar puntuaciones de
propensión que indican la probabilidad del resultado true
especificado para el campo objetivo. El modelo produce
puntuaciones de propensión en bruto; si hay particiones
activas, el modelo también producirá puntuaciones de
propensión ajustadas en función de la partición de prueba.

 Importancia del
predictor (redes
neuronales)
 Última actualización: 2021-08-17
 Figura 1. Vista de importancia del predictor


 Es normal centrar los esfuerzos de modelado en los campos
predictores más importantes y valorar la omisión de aquellos
con menor relevancia. El gráfico de importancia de los
predictores le ayuda a hacerlo indicando la importancia relativa
de cada predictor en la estimación del modelo. Como los
valores son relativos, la suma de valores de todos los
predictores de la visualización es 1.0. La importancia del
predictor no está relacionada con la precisión del modelo. Sólo
está relacionada con la importancia de cada predictor a la hora
de realizar una predicción, no con si la predicción es o no
precisa.
 Objetivos múltiples. Si hay varios objetivos, cada objetivo se
muestra en un gráfico separado y hay un
desplegable Objetivo que controla qué objetivo mostrar.
 Predicho por
observado (redes
neuronales)
 Última actualización: 2021-08-17
 Figura 1. Vista Predicho por observado


 Para objetivos continuos, muestra un diagrama de dispersión en
intervalos de los valores predichos en el eje vertical por los
valores observados en el eje horizontal.
 Objetivos múltiples. Si existen varios objetivos continuos,
cada objetivo se muestra en un gráfico separado y hay un
despliegue Objetivo que controla qué objetivo mostrar.

(redes
Clasificación
neuronales)
Última actualización: 2021-08-17

Figura 1. Vista de clasificación, estilo de porcentajes en filas


Para los objetivos categóricos, muestra la clasificación cruzada de los
valores observados en contraposición a los predichos en el mapa de
calor, junto con el porcentaje global correcto.

Estilos de tabla. Existen varios estilos de visualización diferentes,


que son accesibles desde la lista desplegable Estilo.
 Porcentajes de fila. Muestra los porcentajes de filas (la casilla
cuenta lo expresado como un porcentaje de los totales de filas)
en las casillas. Este es el método predeterminado.
 Recuentos de casillas. Muestra los recuentos de casillas en
las casillas. El sombreado del mapa de calor se basa aún en los
porcentajes de filas.
 Mapa de calor. No muestra valores en las casillas, solamente
el sombreado.
 Comprimido. No muestra cabeceras de filas o columnas, ni
valores en las casillas. Puede ser útil cuando el objetivo tiene
muchas categorías.
Perdidos. Si cualquier registro tiene valores perdidos en el objetivo,
se muestran en una fila (Perdidos) bajo todas las filas válidas. Los
registros con valores perdidos no contribuyen al porcentaje global
correcto.
Objetivos múltiples. Si existen varios objetivos categóricos, cada
objetivo se muestra en una tabla separada y hay una lista
desplegable de Objetivos que controla qué objetivos mostrar.
Tablas grandes. Si el objetivo mostrado tiene más de 100
categorías, no se mostrará ninguna tabla.

Red (redes neuronales)


Última actualización: 2021-08-17
Figura 1. Vista de red, entradas a la izquierda, estilo de efectos

Muestra una representación gráfica de la red neuronal.

Estilos de gráfico. Existen dos estilos de visualización diferentes a


los que se puede acceder desde el desplegable Estilo.

 Efectos. Muestra cada predictor y objetivo como un nodo en el


diagrama sin importar si la escala de medición es continua o
categórica. Este es el método predeterminado.
 Coeficientes. Muestra nodos indicadores múltiples para
predictores y objetivos categóricos. Las líneas de conexión en el
diagrama de estilo de coeficientes están coloreadas tomando
como base el valor estimado de la ponderación sináptica.

Orientación del diagrama. De forma predeterminada, el diagrama


de la red está dispuesto con las entradas a la izquierda y los objetivos
a la derecha. Utilizando los controles de la barra de herramientas
puede cambiar la orientación, de modo que las entradas estén en la
parte superior y los objetivos en la parte inferior, o las entradas en la
parte inferior y los objetivos en la parte superior.

Importancia del predictor. Las líneas de conexión del diagrama se


ponderan tomando como base la importancia de predictores, con un
grosor de línea mayor correspondiente a una importancia mayor.
Existe un control deslizante Importancia del predictor en la barra de
herramientas que controla qué predictores se muestran en el
diagrama de red. Esto no cambia el modelo, simplemente le permite
centrarse en los predictores más importantes.

Objetivos múltiples. Si hay objetivos múltiples, se muestran todos


en el gráfico.

(redes
Configuración
neuronales)
Última actualización: 2021-08-17
Figura 1. Pestaña Configuración

Cuando se puntúa el modelo, se crearán los elementos seleccionados


en esta pestaña. El valor predicho (para todos los objetivos) y la
confianza (para objetivos categóricos) se calculan siempre cuando se
puntúa el modelo. La confianza calculada puede basarse en la
probabilidad del valor predicho (la probabilidad predicha más alta) o
la diferencia entre la probabilidad predicha más alta y la segunda
probabilidad predicha más alta.

 Probabilidad predicha para objetivos categóricos. Genera


las probabilidades predichas para objetivos categóricos. Se crea
un campo para cada categoría.
 Puntuaciones de propensión para objetivos de marca. En
el caso de modelos con un objetivo de marca (que devuelve una
predicción de sí o no), puede solicitar puntuaciones de
propensión que indican la probabilidad del resultado true
especificado para el campo objetivo. El modelo produce
puntuaciones de propensión en bruto; si hay particiones
activas, el modelo también producirá puntuaciones de
propensión ajustadas en función de la partición de prueba.

Generar SQL para este modelo Cuando se utilizan datos de una


base de datos, se puede devolver código SQL a la base de datos para
su ejecución, lo que proporciona un mayor rendimiento para muchas
operaciones.

Valor predeterminado: Puntuar utilizando el adaptador de


puntuación del servidor (si está instalado) de lo contrario en
curso Si se conecta a una base de datos con un adaptador de
puntuación instalado, se genera SQL con el adaptador de puntuación
y las funciones definidas por el usuario (UDF) asociadas y se puntúa
el modelo dentro de la base de datos. Si no hay ningún adaptador de
puntuación disponible, esta opción capta los datos de la base de
datos y los puntúa en SPSS Modeler.

Puntuar convirtiendo a SQL nativo Si selecciona esta opción, se


genera SQL para puntuar el modelo dentro de la base de datos.
Nota: Aunque esta opción puede proporcionar resultados más
rápidos, el tamaño y la complejidad del SQL nativo aumenta a medida
que lo hace la complejidad del modelo.

Puntuar fuera de la base de datos Si se selecciona, esta opción


capta los datos de la base de datos y los puntúa en SPSS Modeler.

Conceptos básicos de nodos de


modelado
Última actualización: 2021-08-17

IBM® SPSS Modeler ofrece una gran variedad de métodos de


modelado procedentes del aprendizaje automático, la inteligencia
artificial y el estadístico. Los métodos disponibles en la paleta de
modelado permiten derivar nueva información procedente de los
datos y desarrollar modelos predictivos. Cada método tiene ciertos
puntos fuertes y es más adecuado para determinados tipos de
problemas.

La Guía de aplicaciones de IBM SPSS Modeler proporciona ejemplos


para muchos de estos métodos, junto con una introducción general al
proceso de modelado. Esta guía está disponible como una guía de
aprendizaje en línea. Más información.

Los métodos de modelado se dividen en estas categorías:

 Supervisado
 Asociación
 Segmentación.

Modelos supervisados

Los Modelos supervisados utilizan los valores de uno o varios campos


de entrada para predecir el valor de uno o varios resultados o
campos de destino. Algunos ejemplos de estas técnicas son: árboles
de decisiones (árbol C&R, QUEST, CHAID y algoritmos C5.0), regresión
(lineal, logística, lineal generalizada y algoritmos de regresión de
Cox), redes neuronales, máquinas de vectores de soporte y redes
bayesianas.

Los modelos supervisados ayudan a las organizaciones a predecir un


resultado conocido, por ejemplo si un cliente comprará o se irá o si
una transacción se ajusta a un patrón conocido de fraude. Las
técnicas de modelado incluyen aprendizaje automático de las
máquinas, inducción de reglas, identificación de subgrupos, métodos
estadísticos y generación de varios modelos.

Nodos supervisados

El nodo Clasificador automático crea y compara varios modelos


diferentes para obtener resultados binarios (sí o no, abandono o
no de clientes, etc.), lo que le permite seleccionar el mejor
enfoque para un análisis determinado. Son compatibles varios
algoritmos de modelado, por lo que es posible seleccionar los
métodos que desee utilizar, las opciones específicas para cada
uno y los criterios para comparar los resultados. El nodo genera
un conjunto de modelos basado en las opciones especificadas y
clasifica los mejores candidatos en función de los criterios que
especifique.
El nodo Autonumérico calcula y compara modelos para
resultados de rango numérico continuo utilizando cierto número
de métodos diferentes. El nodo funciona de la misma manera
que el nodo Clasificador automático, lo que le permite
seleccionar los algoritmos que desee utilizar y experimentar con
varias combinaciones de opciones en una única pasada de
modelado. Los algoritmos admitidos incluyen redes neuronales,
C&RT, CHAID, regresión lineal, regresión lineal generalizada y
máquinas de vectores de soporte (SVM). Los modelos se pueden
comparar basándose en la correlación, el error relativo o el
número de variables utilizado.
El nodo de árbol de clasificación y regresión (C&R) genera un
árbol de decisión que permite predecir o clasificar observaciones
futuras. El método utiliza la partición reiterada para dividir los
registros de entrenamiento en segmentos minimizando las
impurezas en cada paso, donde un nodo se considera “puro” si
el 100% de los casos del nodo corresponden a una categoría
específica del campo objetivo. Los campos de entrada y objetivo
pueden ser continuos (rango numérico) o categóricos (nominal,
ordinal o marca). Todas las divisiones son binarias (sólo se crean
dos subgrupos).
El nodo QUEST proporciona un método de clasificación binario
para generar árboles de decisión; está diseñado para reducir el
tiempo de procesamiento necesario para realizar los análisis de
C&RT y reducir la tendencia de los métodos de clasificación de
árboles para favorecer a las entradas que permitan realizar más
divisiones. Los campos de entrada pueden ser continuos (rango
numérico), sin embargo el campo objetivo debe ser categórico.
Todas las divisiones son binarias.
El nodo CHAID genera árboles de decisión utilizando estadísticos
de chi-cuadrado para identificar las divisiones óptimas. A
diferencia de los nodos C&RT y Árbol y QUEST, CHAID puede
generar árboles no binarios, lo que significa que algunas
divisiones generarán más de dos ramas. Los campos de entrada
y objetivo pueden ser continuos (rango numérico) o categóricos.
CHAID exhaustivo es una modificación de CHAID que examina
con mayor precisión todas las divisiones posibles, aunque
necesita más tiempo para realizar los cálculos.
El nodo C5.0 genera un árbol de decisión o un conjunto de
reglas. El modelo divide la muestra basándose en el campo que
ofrece la máxima ganancia de información en cada nivel. El
campo objetivo debe ser categórico. Se permiten varias
divisiones en más de dos subgrupos.
El nodo Lista de decisiones identifica subgrupos, o segmentos,
que muestran una mayor o menor posibilidad de proporcionar un
resultado binario relacionado con la población global. Por
ejemplo, puede buscar clientes que tengan menos posibilidades
de abandonar o más posibilidades de responder favorablemente
a una campaña. Puede incorporar su conocimiento empresarial
al modelo añadiendo sus propios segmentos personalizados y
previsualizando modelos alternativos uno junto a otro para
comparar los resultados. Los modelos de listas de decisiones
constan de una lista de reglas en las que cada regla tiene una
condición y un resultado. Las reglas se aplican en orden, y la
primera regla que coincide determina el resultado.
Los modelos de regresión lineal predicen un objetivo continuo
tomando como base las relaciones lineales entre el destino y
uno o más predictores.
El nodo PCA/Factorial proporciona técnicas eficaces de reducción
de datos para reducir la complejidad de los datos. Análisis de
componentes principales (PCA) busca combinaciones lineales de
los campos de entrada que realizan el mejor trabajo a la hora de
capturar la varianza en todo el conjunto de campos, en el que
los componentes son ortogonales (perpendiculares) entre ellos.
Análisis factorial intenta identificar factores subyacentes que
expliquen el patrón de correlaciones dentro de un conjunto de
campos observados. Para los dos métodos, el objetivo es
encontrar un número pequeño de campos derivados que resuma
de forma eficaz la información del conjunto original de campos.
El nodo Selección de características filtra los campos de entrada
para su eliminación en función de un conjunto de criterios (como
el porcentaje de valores perdidos); a continuación, clasifica el
grado de importancia del resto de entradas de acuerdo con un
objetivo específico. Por ejemplo, a partir de un conjunto de datos
dado con cientos de entradas potenciales, ¿cuáles tienen mayor
probabilidad de ser útiles para el modelado de resultados de
pacientes?
El análisis discriminante realiza más supuestos rigurosos que
regresiones logísticas, pero puede ser una alternativa o un
suplemento valioso al análisis de regresión logística si se
cumplen dichos supuestos.
La regresión logística es una técnica de estadístico para
clasificar los registros en función los valores de los campos de
entrada. Es análoga a la regresión lineal pero toma un campo
objetivo categórico en lugar de uno numérico.
El modelo lineal generalizado amplía el modelo lineal general,
de manera que la variable dependiente está relacionada
linealmente con los factores y las covariables mediante una
determinada función de enlace. Además, el modelo permite
que la variable dependiente tenga una distribución no normal.
Cubre la funcionalidad de un amplio número de modelo
estadísticos, incluyendo regresión lineal, regresión logística,
modelos log lineales para recuento de datos y modelos de
supervivencia censurados por intervalos.
Un modelo lineal mixto generalizado (GLMM) amplía el modelo
lineal de modo que el objetivo pueda tener una distribución no
normal, esté linealmente relacionado con los factores y
covariables mediante una función de enlace especificada y las
observaciones se puedan correlacionar. Los modelos lineales
mixtos generalizados cubren una amplia variedad de modelos,
desde modelos de regresión lineal simple hasta modelos
multinivel complejos para datos longitudinales no normales.
El nodo Regresión de Cox le permite crear un modelo de
supervivencia para datos de tiempo hasta el evento en
presencia de registros censurados. El modelo produce una
función de supervivencia que predice la probabilidad de que el
evento de interés se haya producido en el momento dado (t)
para valores determinados de las variables de entrada.
El nodo Máquina de vectores de soporte (SVM) le permite
clasificar datos en uno o dos grupos sin que haya un ajuste por
exceso. SVM funciona bien con conjuntos de datos grandes,
como aquellos con un gran número de campos de entrada.
El nodo Red bayesiana le permite crear un modelo de
probabilidad combinando pruebas observadas y registradas con
conocimiento del mundo real para establecer la probabilidad de
instancias. El nodo se centra en las redes Naïve Bayes
aumentado a árbol (TAN) y de manto de Markov que se utilizan
principalmente para la clasificación.
El nodo Modelo de respuesta de autoaprendizaje (SLRM) permite
crear un modelo en el que un solo caso nuevo o un pequeño
número de casos nuevos se pueden utilizar para volver a
calcular el modelo sin tener que entrenar de nuevo el modelo
utilizando todos los datos.
El nodo Serie temporal estima modelos de suavizado
exponencial, modelos autorregresivos integrados de media
móvil (ARIMA) univariados y modelos ARIMA (o de función de
transferencia) multivariados para series temporales y genera
previsiones. Este nodo Serie temporal es similar al nodo Serie
temporal anterior que estaba en desuso en SPSS
Modeler versión 18. Sin embargo, este nodo Serie temporal más
reciente se ha diseñado para emplear la potencia de IBM SPSS
Analytic Server para procesar grandes cantidades de datos y
mostrar el modelo resultante en el visor de resultados que se ha
añadido en SPSS Modeler versión 17.
El nodo k de modelado de vecino (KNN) asocia el nuevo caso con
la categoría o valor de los objetos k junto a él en el espacio de
predictores, donde k es un entero. Los casos parecidos están
próximos y los que no lo son están alejados entre sí.
El nodo Predicción espacio-temporal (STP) utiliza datos que
contienen datos de ubicación, campos de entrada para la
predicción (predictores), un campo de hora y un campo de
objetivo. Cada ubicación tiene muchas filas en los datos que
representan los valores de cada predictor en cada tiempo de
medición. Después de analizar los datos, se puede utilizar para
predecir los valores de objetivo en cualquier ubicación dentro de
los datos de forma que se utilizan en el análisis.

Modelos de asociación

Los modelos de asociación encuentran patrones en los datos en los


que una o más entidades (como eventos, compras o atributos) se
asocian con una o más entidades. Los modelos construyen conjuntos
de reglas que definen estas relaciones. Aquí los campos de los datos
pueden funcionar como entradas y destinos. Podría encontrar estas
asociaciones manualmente, pero los algoritmos de reglas de
asociaciones lo hacen mucho más rápido, y pueden explorar patrones
más complejos. Los modelos Apriori y Carma son ejemplos del uso de
estos algoritmos. Otro tipo de modelo de asociación es el modelo de
detección de secuencias, que encuentra patrones secuenciales en
datos estructurados temporalmente.

Los modelos de asociación son los más útiles si se desean predecir


varios resultados; por ejemplo, los clientes que adquirieron el
producto X también adquirieron Y y Z. Los modelos de asociación
relacionan una conclusión específica (como la decisión de adquirir un
producto) con un conjunto de condiciones. La ventaja de los
algoritmos de reglas de asociación sobre los algoritmos más estándar
de árboles de decisión (C5.0 y Árbol C&R) es que las asociaciones
pueden existir entre cualquiera de los atributos. Un algoritmo de árbol
de decisión generará reglas con una única conclusión, mientras que
los algoritmos de asociación tratan de buscar muchas reglas, cada
una de las cuales puede tener una conclusión diferente.

Nodos de asociación

El nodo Apriori extrae un conjunto de reglas de los datos y


destaca aquellas reglas con un mayor contenido de información.
Apriori ofrece cinco métodos diferentes para la selección de
reglas y utiliza un sofisticado esquema de indización para
procesar eficientemente grandes conjuntos de datos. En los
problemas de mucho volumen, Apriori se entrena más
rápidamente, no tiene un límite arbitrario para el número de
reglas que puede retener y puede gestionar reglas que tengan
hasta 32 precondiciones. Apriori requiere que todos los campos
de entrada y salida sean categóricos, pero ofrece un mejor
rendimiento ya que está optimizado para este tipo de datos.
El modelo CARMA extrae un conjunto de reglas de los datos sin
necesidad de especificar campos de entrada ni de objetivo. A
diferencia de Apriori el nodo CARMA ofrece configuraciones de
generación basadas en el soporte de las reglas (soporte tanto
para el antecedente como el consecuente) en lugar de hacerlo
sólo respecto al soporte del antecedente. Esto significa que las
reglas generadas se pueden utilizar en una gama de
aplicaciones más amplia, por ejemplo, para buscar una lista de
productos o servicios (antecedentes) cuyo consecuente es el
elemento que se desea promocionar durante esta temporada de
vacaciones.
El nodo Secuencia encuentra reglas de asociación en datos
secuenciales o en datos ordenados en el tiempo. Una secuencia
es una lista de conjuntos de elementos que tiende a producirse
en un orden previsible. Por ejemplo, si un cliente compra una
cuchilla y una loción para después del afeitado, probablemente
comprará crema para afeitar la próxima vez que vaya a
comprar. El nodo Secuencia se basa en el algoritmo de reglas de
asociación de CARMA, que utiliza un método de dos pasos para
encontrar las secuencias.
El nodo Reglas de asociación es parecido al nodo Apriori; sin
embargo, a diferencia de Apriori, el nodo Reglas de asociación
puede procesar datos de lista. Además, el nodo Reglas de
asociación se puede utilizar con IBM SPSS Analytic Server para
procesar big data y aprovechar el procesamiento paralelo.

Modelos de segmentación

Los modelos de segmentación dividen los datos en segmentos o


clústeres de registros que tienen patrones similares de campos de
entrada. Como sólo se interesan por los campos de entrada, los
modelos de segmentación no contemplan el concepto de campos de
salida o destino. Ejemplos de modelos de segmentación son las redes
Kohonen, la agrupación en clústeres de K-medias, la agrupación en
clústeres en dos pasos y la detección de anomalías.

Los modelos de segmentación (también conocidos como "modelos de


agrupación en clústeres") son útiles en aquellos casos en los que se
desconoce el resultado específico (por ejemplo a la hora de detectar
nuevos patrones de fraude o de identificar grupos de interés en la
base de clientes). Los modelos de agrupación en clústeres se centran
en la identificación de grupos de registros similares y en el etiquetado
de registros según el grupo al que pertenecen. Esto se lleva a cabo
sin la ventaja que ofrece el conocimiento previo sobre los grupos y
sus características, y diferencia a los modelos de clústeres de otras
técnicas de modelado en que no hay campos de salida u objetivo
predefinidos para el modelo que se va a predecir. No hay respuestas
correctas o incorrectas para estos modelos. Su valor viene
determinado por su capacidad de capturar agrupaciones interesantes
en los datos y proporcionar descripciones útiles de dichas
agrupaciones. Los modelos de clúster se usan a menudo para crear
clústeres o segmentos que se usan posteriormente como entradas en
análisis posteriores, (por ejemplo mediante la segmentación de
clientes potenciales en subgrupos homogéneos).

Nodos de segmentación

El nodo Agrupación en clústeres automática calcula y compara


los modelos de agrupación en clústeres que identifican grupos
de registros con características similares. El nodo funciona de la
misma manera que otros nodos de modelado automático,
permitiéndole experimentar con múltiples combinaciones de
opciones en una única pasada de modelado. Los modelos se
pueden comparar utilizando medidas básicas con las que se
intenta filtrar y definir la utilidad de los modelos de clúster y
proporcionar una medida según la importancia de campos
concretos.
El nodo K-medias agrupa conjuntos de datos en grupos distintos
(o clústeres). El método define un número fijo de clústeres, de
forma iterativa asigna registros a los clústeres y ajusta los
centros de los clústeres hasta que no se pueda mejorar el
modelo. En lugar de intentar predecir un resultado, los modelos
de k-medias utilizan un proceso conocido como aprendizaje no
supervisado para revelar los patrones del conjunto de campos
de entrada.
El nodo Kohonen genera un tipo de red neuronal que se puede
usar para agrupar un conjunto de datos en grupos distintos.
Cuando la red se termina de entrenar, los registros que son
similares se deberían cerrar juntos en el mapa de resultados,
mientras que los registros que son diferentes aparecerían
aparte. Puede observar el número de observaciones capturadas
por cada unidad en el nugget de modelo para identificar
unidades fuertes. Esto le proporcionará una idea del número
apropiado de clústeres.
El nodo Bietápico es un método de agrupación en clústeres de
dos pasos. El primer paso es hacer una única pasada por los
datos para comprimir los datos de entrada de la fila en un
conjunto de subclústeres administrable. El segundo paso utiliza
un método de agrupación en clústeres jerárquica para fundir
progresivamente los subclústeres en clústeres cada vez más
grandes. El bietápico tiene la ventaja de estimar
automáticamente el número óptimo de clústeres para los datos
de entrenamiento. Puede gestionar tipos de campos mixtos y
grandes conjuntos de datos eficazmente.
El nodo Detección de anomalías identifica casos extraños, o
valores atípicos, que no se ajustan a patrones de datos
“normales”. Con este nodo, es posible identificar valores atípicos
aunque no se ajusten a ningún patrón previamente conocido o
no se realice una búsqueda exacta.

Modelos de minería interna de bases de datos

IBM SPSS Modeler admite la integración con herramientas de


modelado y minería de datos que están disponibles en proveedores
de bases de datos, incluidos Oracle Data Miner y Microsoft Analysis
Services. Podrá crear, puntuar y almacenar modelos dentro de la base
de datos, todo desde la aplicación IBM SPSS Modeler. Para obtener
detalles completos, consulte la >Guía de minería interna de base de
datos de IBM SPSS Modeler.

Modelos de IBM SPSS Statistics

Si dispone de una copia de IBM SPSS Statistics instalada y con la


licencia necesaria en su ordenador, puede acceder y ejecutar
determinadas rutinas de IBM SPSS Statistics en IBM SPSS
Modeler para generar y puntuar modelos.

Opciones de los campos del


nodo de modelado
Última actualización: 2021-08-17

Todos los nodos de modelado tienen una pestaña Campos en la que


se pueden especificar los campos que se usarán para generar el
modelo.
Para generar un modelo, primero se deben especificar los campos
que se desea usar como objetivos y como entradas. Salvo algunas
excepciones, todos los nodos de modelado usarán la información de
los campos procedente de un nodo Tipo anterior en la ruta. Si utiliza
un nodo Tipo para seleccionar campos de entrada y objetivo, no es
necesario cambiar nada en esta pestaña. (Entre las excepciones se
incluyen el nodo Secuencia y el nodo Extracción de texto, que
requieren que la configuración del campo se especifique en el nodo
de modelado.)

Utilizar configuración del nodo Tipo. Esta opción permite indicar


al nodo que use la información de campo de un nodo Tipo situado en
un punto anterior de la ruta. Este es el método predeterminado.

Utilizar configuración personalizada. Esta opción permite indicar


al nodo que use la información de campo especificada aquí en lugar
de la proporcionada en nodos Tipo situados en cualquier punto
anterior de la ruta. Después de seleccionar esta opción, especifique
los campos siguientes si es necesario.

Nota: No todos los campos se visualizan para todos los nodos.

 Utilizar formato transaccional (Apriori, CARMA, Reglas


de asociación MS y nodos Oracle Apriori
únicamente). Seleccione esta casilla de verificación si los
datos de origen están en el formato transaccional. Los
registros de este formato tienen dos campos, uno para una ID y
otro para el contenido. Cada registro representa un único
elemento o transacción y los elementos asociados se enlazan
usando el mismo ID. Cancele esta selección si los datos están
en formato tabular, en los que los elementos se representan
por marcas separadas, donde cada campo de marca representa
la presencia o ausencia de un elemento específico y cada
registro representa un conjunto completo de elementos
asociados. Consulte Datos tabulares frente a datos
transaccionales para obtener más información.
o ID. Para los datos transaccionales, seleccione el campo
de ID de la lista. Los campos numéricos o simbólicos se
pueden utilizar como campo de ID. Cada valor exclusivo
de este campo debe indicar una unidad de análisis
específica. Por ejemplo, en una aplicación de la cesta de
la compra, cada ID puede representar a un sólo cliente.
Para una aplicación de análisis del registro Web, cada ID
puede representar un equipo (con la dirección IP) o un
usuario (con los datos de inicio de sesión).
o Los ID son contiguos. (Nodos Apriori y CARMA
únicamente) Si los datos se han clasificado previamente
de forma que todos los registros con el mismo ID se
agrupan en la ruta de datos, seleccione esta opción para
que el procesamiento sea más rápido. Si los datos no se
han clasificado previamente (o no lo sabe a ciencia
cierta), no active esta opción y el nodo clasificará los
datos automáticamente.
Nota: Si los datos no están ordenados y selecciona esta
opción, es posible que obtenga resultados no válidos en el
modelo.
o Contenido. Especifique los campos de contenido del
modelo. Estos campos contienen los elementos de interés
del modelo de asociación. Se pueden especificar varios
campos de marcas (si los datos están en formato tabular)
o un sólo campo nominal (si los datos están en formato
transaccional).
 Objetivo. En los modelos que requieran uno o varios campos
objetivo, selecciónelos. Se trata de una acción similar a
establecer el rol del campo en Objetivo en un nodo Tipo.
 Evaluación. (Para modelos de Autoclúster únicamente). No se
ha especificado un objetivo para los modelos de clúster; sin
embargo, puede seleccionar un campo de evaluación para
identificar su nivel de importancia. Además, puede evaluar la
calidad con la que los clústeres diferencian los valores de este
campo, que a su vez indica si los clústeres se pueden utilizar
para predecir este campo. Nota El campo de evaluación debe
ser una cadena con más de un valor.
o Entradas. Seleccione el campo(s) de entrada. Se trata de
una acción similar a establecer el rol del campo
en Entrada en un nodo Tipo.
o Partición. Este campo permite especificar un campo
usado para dividir los datos en muestras independientes
para las fases de entrenamiento, prueba y validación en
la generación del modelo. Si usa una muestra para
generar el modelo y otra muestra distinta para
comprobarlo, podrá obtener una buena indicación de la
bondad del modelo a la hora de generar conjuntos de
datos de mayor tamaño similares a los datos actuales. Si
se han definido varios campos de partición mediante
nodos Tipo o Partición, se deberá seleccionar un campo
de partición simple en la pestaña Campos en todos los
nodos de modelado que usen la partición. (Si solamente
hay una partición, se usará automáticamente siempre que
se active la partición.) Debe tener en cuenta que al
aplicar la partición seleccionada en su análisis, también
debe activar la partición en la pestaña Opciones del
modelo para el nodo. (Si se elimina la selección de esta
opción, se posibilita la desactivación de la partición sin
cambiar la configuración del campo.)
 Divididos. En modelos divididos, seleccione el campo o
campos de división. Se trata de una acción similar a establecer
el rol del campo en Dividir en un nodo Tipo. Sólo puede
designar campos con un nivel de medición
de Marca, Nominal, Ordinal o Continuo como campos de
división. Los campos seleccionados como campos de división no
se pueden utilizar como campos de destino, entrada, partición,
frecuencia o ponderación. Consulte Generación de modelos
divididos para obtener más información.
 Utilizar campo de frecuencia Esta opción le permite
seleccionar un campo como ponderación de frecuencia. Úsela si
cada uno de los registros de sus datos de entrenamiento
representan más de una unidad (por ejemplo, si está usando
datos agregados). Los valores del campo deben ser el número
de unidades representadas por cada registro. Consulte el
tema Uso de campos de frecuencia y ponderación para obtener
más información. Las

Nota: si ve el mensaje de error Metadatos (en campos de


entrada/salida) no válidos, asegúrese de que ha especificado
todos los campos necesarios, como el campo de frecuencia.

 Utilizar campo de ponderación Esta opción le permite


seleccionar un campo como ponderación de casos. Las
ponderaciones de casos se usan para contabilizar las
diferencias existentes en la varianza entre los niveles del
campo de salida. Consulte el tema Uso de campos de
frecuencia y ponderación para obtener más información. Las
 Consecuentes. En el caso de nodos de reglas de inducción
(Apriori), seleccione los campos que se deben usar como
consecuentes en el conjunto de reglas resultante. (Se
corresponde con los campos que tienen el
rol Objetivo o Ambas de un nodo Tipo).
 Antecedentes. En el caso de nodos de reglas de inducción
(Apriori), seleccione los campos que se deben usar como
antecedentes en el conjunto de reglas resultante. (Se
corresponde con los campos que tienen el rol
tipo Entrada o Ambas de un nodo Tipo).

Algunos modelos presentan una pestaña denominada Campos que es


diferente a lo descrito en esta sección.

 Consulte Opciones de campos para el nodo Secuencia para


obtener más información.
 Consulte Opciones de campos para el nodo CARMA para
obtener más información.
 Uso de campos de frecuencia y ponderación
Tema principal:
Conceptos básicos sobre modelado
Información relacionada

 Conceptos básicos de nodos de modelado

También podría gustarte