Cap.6 Domjan PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

CAP.

6
PROGRAMAS DE
REFORZAMIENTO Y
CONDUCTA DE ELECCIÓN
Programas simples de
reforzamiento intermitente
Programas de razón Razón fija: Se refuerza al organismo después
de un numero determinado de respuestas.
La característica distintiva de un programa de RF10 (se refuerza cada 10 respuestas). RF1
razón es que el reforzamiento sólo depende (se refuerza cada 1 respuesta). Un registro
del número de respuestas realizadas por el acumulativo es una forma particular de
representar la manera en que una respuesta
organismo. Lo único que requiere un se repite a lo largo del tiempo. Muestra el
programa de razón es el conteo del número de número total (o acumulado) de respuestas que
respuestas emitidas y la entrega del han sucedido hasta un punto particular en el
reforzador cada vez que se cumple el número tiempo. Se conoce como pausa
exigido. posreforzamiento a la tasa cero de
respuestas que ocurre justo después de cada
reforzamiento. La tasa elevada y estable de
respuestas que completa cada requisito de
razón se denomina carrera de la razón. Si se
incrementa un poco la razón requerida es
posible que no haya cambios en la tasa de
respuestas durante la carrera de la razón. Sin
embargo, con requisitos de razón mayores
tienden a ocurrir pausas posreforzamiento
más largas. Si la razón requerida aumenta
mucho de manera súbita es probable que el
animal haga pausas periódicas antes de
completar la razón exigida. Este efecto se
conoce como tensión de la razón. En casos
extremos, dicha tensión puede ser tan grande
que el animal deja de responder del todo.
Razón variable: La predictibilidad puede
eliminarse modificando el número de
respuestas que se pide por reforzamiento de
una ocasión a la siguiente. RV10 (se
determina RV10 con un promedio de variación
en la razón). Como no es posible predecir el
número de respuestas requeridas por
reforzamiento, las pausas predecibles en la
tasa de respuestas son menos probables
en los programas de razón variable que en
los de razón fija. Más bien, los organismos
responden a una tasa bastante estable en
los programas de RV.

Programas de intervalo Intervalo fijo: En un programa de intervalo fijo


(IF), la cantidad de tiempo que tiene que pasar
antes que una respuesta sea reforzada se
Las respuestas únicamente se refuerzan si mantiene constante de un ensayo al siguiente.
ocurren después de que ha transcurrido cierto La tasa de respuestas aumenta a medida que
tiempo. se acerca el momento en que estará
disponible el siguiente reforzador. Este
incremento en la tasa de respuestas se
manifiesta en el registro acumulativo, hacia el
final del intervalo fijo se conoce como festón
del intervalo fijo. El intervalo únicamente
determina cuándo estará disponible el
reforzador, no cuándo será entregado. Para
recibir el reforzador después que se ha hecho
disponible, el sujeto todavía tiene que dar la
respuesta instrumental.

Intervalo variable: Los programas de


intervalo también pueden ser impredecibles.
En un programa de intervalo variable (IV), las
respuestas sólo se refuerzan si ocurren
después que ha transcurrido un lapso variable
desde el inicio del ensayo o el ciclo del
programa

Programas de intervalo y disponibilidad


limitada: En los programas simples de
intervalo, una vez que el reforzador está
disponible permanece así hasta que se realiza
la respuesta requerida, sin importar cuánto
tiempo se lleve. En el caso de los programas
de intervalo fuera del laboratorio, es más
común que los reforzadores sólo estén
disponibles por periodos limitados. Este tipo
de restricción en el tiempo que permanece
asequible un reforzador se conoce como
disponibilidad limitada. Las restricciones de
disponibilidad limitada pueden añadirse a los
programas de intervalo fijo y de intervalo
variable.

Comparación de los
programas de razón y de
intervalo
Reforzamiento de (TER) En el capítulo 5 se observó que el
reforzamiento puede incrementar varias
tiempo entre respuestas características de la conducta; una de ellas es
el intervalo entre respuestas sucesivas. Si el
sujeto es reforzado por una respuesta que
ocurre poco después de la precedente,
entonces se refuerza un TER corto y los TER
cortos se hacen más probables en el futuro.
Por otro lado, si el sujeto es reforzado por una
respuesta que termina un TER largo, entonces
se refuerza un TER largo y este tipo de TER
se hace más probable en el futuro. Un sujeto
cuyos tiempos entre respuestas son
principalmente cortos está respondiendo a una
tasa elevada. En contraste, un sujeto con
tiempos entre respuestas predominantemente
largos está respondiendo a una tasa baja.

Considere un programa de razón. Con un


programa de este tipo no existen
restricciones temporales y entre más
rápido complete el participante la razón
requerida, más pronto recibirá el
reforzador. En consecuencia, un programa de
razón favorece que no se espere demasiado
entre respuestas y apoya tiempos entre
respuestas cortos. Los programas de razón
refuerzan diferencialmente tiempos entre
respuestas cortos.

En contraste, en los programas de intervalo


no resultan ventajosos los tiempos entre
respuestas cortos; de hecho, estos
programas favorecen una espera más larga
entre respuestas.

Funciones de Se denomina función de retroalimentación a


la relación entre las tasas de respuestas y las
retroalimentación tasas de reforzamiento calculadas para una
sesión experimental completa.

¿Cuál es la relación entre la tasa de


respuestas y la tasa de reforzamiento en
los programas de razón?. Dado que en los
programas de razón el único requisito para el
reforzamiento es dar cierto número de
respuestas, entre más rápido complete el
sujeto la razón requerida, más pronto obtiene
el siguiente reforzador. Por lo tanto, la tasa de
respuestas tiene una relación directa con la
tasa de reforzamiento. Entre mayor sea la
tasa de respuestas más reforzadores
recibirá el sujeto por hora y mayor será su
tasa de reforzamiento. Además, no hay
límite a esta función creciente. No importa
con qué rapidez responda el sujeto, si puede
incrementar todavía más su tasa de
respuestas disfrutará del incremento
correspondiente en la tasa de reforzamiento.
La función de retroalimentación para un
programa de razón es una función lineal
creciente y no tiene límite.

¿Qué hay respecto a la función de


retroalimentación de un programa de
intervalo? Los programas de intervalo
establecen un límite superior al número de
reforzadores que puede obtener un sujeto.
Por ejemplo, en un programa IV dos minutos,
si el sujeto obtiene cada reforzador en cuanto
está disponible puede obtener un máximo de
30 reforzadores por hora. Como en un
programa de intervalo variable cada ensayo
empieza con un periodo en que no está
disponible el reforzador, hay un límite superior
al número de reforzadores que puede obtener
un sujeto. En un programa IV dos minutos, el
límite es de 30 reforzadores por hora. Un
sujeto no puede incrementar su tasa de
reforzamiento por arriba de 30 por hora, no
importa cuánto aumente su tasa de
respuestas.

Conducta de elección: programas


concurrentes
Numerosos estudios de elección se han efectuado en cajas de Skinner, equipadas con dos teclas de
respuesta en que podría picotear una paloma. En el experimento típico, la respuesta en cada tecla
es reforzada con algún programa de reforzamiento. Los dos programas están en efecto al mismo
tiempo (de manera concurrente) y el sujeto tiene la libertad para cambiar de una tecla de respuestas
a la otra. Este tipo de procedimiento se conoce como programa concurrente.

Medidas de la conducta de Una técnica común es calcular la tasa relativa


de respuestas en cada alternativa. Por
elección ejemplo, para calcular la tasa relativa de
respuestas en la tecla izquierda se divide la
tasa de respuestas emitidas en la tecla
izquierda entre la tasa total de respuestas.

Como podría sospechar, la forma en que un


organismo distribuye su conducta entre las
dos alternativas de respuesta es influida en
gran medida por el programa de reforzamiento
en efecto, para cada respuesta. Por ejemplo,
si el mismo programa de intervalo variable
está disponible para cada alternativa de
respuesta, como en un procedimiento
concurrente IV 60 segundos IV 60 segundos,
la paloma picoteará ambas teclas con la
misma frecuencia. La tasa relativa de
respuestas para los picoteos en cada lado
será de 0.5.

La ley de igualación Ley de igualación: Regla para la


conducta instrumental propuesta por R. J.
Herrnstein. La regla plantea que la tasa
relativa de respuesta en una alternativa
particular de respuesta es igual a la tasa
relativa de reforzamiento para esa
alternativa de respuesta.
Subigualación: Menor sensibilidad a la
tasa relativa de reforzamiento de lo que
predice la ley de igualación.

La ley de igualación y los Si la ley de igualación es una característica


fundamental de la conducta, entonces también
programas simples de se debería caracterizar al comportamiento
reforzamiento observado en los programas simples de
reforzamiento. Sin embargo, en los programas
simples sólo se proporciona un manipulando.
¿Cómo puede aplicarse a una sola
respuesta una ley que describe la elección
entre varias alternativas?

Como Herrnstein (1970) señaló, puede


considerarse que incluso las situaciones de
una sola respuesta involucran una elección
entre realizar la respuesta especificada (como
presionar una palanca o picotear una tecla) y
participar en otras actividades posibles
(acicalarse, dar vueltas, picotear el piso,
olfatear los hoyos en la cámara experimental).
En un programa simple el sujeto recibe
reforzamiento explícito por realizar una
respuesta operante específica. Además, es
indudable que recibe reforzadores por las
otras actividades en que podría participar
(algunas de las cuales son recompensas
intrínsecas). Por consiguiente, el
reforzamiento total en un experimento, con un
programa simple, incluye tanto las
recompensas extrínsecas programadas como
las otras fuentes no programadas de
reforzamiento. Esas consideraciones permiten
aplicar la ley de igualación a los programas de
reforzamiento con una sola respuesta.

Mecanismos de la ley de Algunas teorías de la igualación son similares


en el hecho de que ignoran lo que podría
igualación ocurrir a nivel de las respuestas individuales.
Esas explicaciones se denominan teorías
molares. Las teorías molares explican
conglomerados de respuestas. Tienen que ver
con la distribución total de respuestas y de
reforzadores en las situaciones de elección.
En contraste con las teorías molares, otras
explicaciones de la relación de igualación se
concentran en lo que sucede a nivel de las
respuestas individuales y consideran que la
relación de igualación es el resultado neto de
esas elecciones individuales. A esas
explicaciones se les denomina teorías
moleculares. La explicación que enfatiza el
reforzamiento de los tiempos entre respuestas
era una explicación molecular o local.

Igualación y Los organismos distribuyen sus actividades


entre las alternativas de respuesta de modo
maximización de las que puedan recibir la mayor cantidad posible
tasas de reforzamiento de reforzamiento en la situación. Según esta
idea, los animales oscilan entre las
alternativas de respuesta para recibir tantos
reforzadores como les sea posible. La idea de
que los organismos maximizan el
reforzamiento ha sido utilizada para explicar la
conducta de elección a un nivel de análisis
tanto molecular como molar.

Maximización molecular De acuerdo con las teorías moleculares de


la maximización, los organismos siempre
eligen la alternativa de respuesta que tenga
mayor probabilidad de ser reforzada en el
momento
Maximización molar Las teorías molares de la maximización
suponen que los organismos distribuyen sus
respuestas entre varias alternativas de modo
que se maximice la cantidad de reforzamiento
que obtienen a largo plazo, aun cuando no se
especifica con claridad qué tan largo debe ser
ese plazo. No obstante, en contraste con las
teorías moleculares, las molares se orientan
en conglomerados de conducta emitida en el
curso de algún periodo, usualmente la
duración total de la sesión experimental más
que en las respuestas individuales de
elección.

Mejoramiento El término mejoramiento se refiere a hacer


que algo sea mejor, no a elegir la mejor
alternativa en ese momento (maximización
molecular) o a hacer que algo sea tan bueno
como sea posible a largo plazo (maximización
global). Más bien, el mejoramiento se refiere a
la meta más modesta (o inocente) de lograr
que la situación mejore. ¿Mejor respecto a
qué? Mejor de lo que había sido en el pasado
reciente. De este modo, los beneficios se
evalúan de manera específica a una situación
limitada, no de manera general o a largo
plazo.

Elección compleja
Programas encadenados Programa de reforzamiento
encadenado-concurrente:
concurrentes Procedimiento complejo de reforzamiento
en que se permite que en el primer
eslabón el participante elija cuál de varios
programas simples de reforzamiento
estará en efecto en el segundo eslabón.
Una vez que se ha hecho la elección las
alternativas rechazadas dejarán de estar
disponibles hasta el inicio del siguiente
ensayo.

El autocontrol frecuentemente es una


Autocontrol cuestión para elegir una recompensa grande
demorada sobre otra inmediata y pequeña.
Por ejemplo, el autocontrol en la alimentación
implica elegir la recompensa grande y
demorada de estar delgado sobre la
recompensa inmediata, pero pequeña, de
comer un pedazo de pastel.

Reducción del valor y Función de descuento del valor:


Función matemática que describe la
explicaciones del manera en que disminuye el valor del
autocontrol reforzador como función de cuánto tenga
que esperarse para la entrega del mismo.

Funciones de descuento Entre más pronunciada sea la función de


descuento de la demora de una persona,
del valor e impulsividad más difícil le será mostrar autocontrol y
en la conducta humana también más impulsiva resultaría ser. En
congruencia con esas ideas, se han
encontrado funciones más pronunciadas de
descuento de la recompensa en estudios
realizados con personas que son
dependientes al alcohol, al tabaco, a la
heroína y en apostadores que también tienen
un problema de abuso de drogas. Los niños
pequeños también tienen funciones más
pronunciadas de descuento de la recompensa
que los adultos en edad universitaria, y los
estudiantes universitarios que participan en
relaciones sexuales sin protección tienen
funciones de descuento más marcadas que
quienes usan condón. Esos estudios muestran
que la función de descuento de la recompensa
mide una característica importante de la
conducta que es pertinente para el autocontrol
en una amplia variedad de situaciones.

¿Puede enseñarse el Sí. Entrenar a la gente con recompensas


demoradas parece tener efectos
autocontrol? generalizados para incrementar su tolerancia
por las recompensas demoradas.

También podría gustarte