Condicionamiento Operante: Definición, Características y Ejemplos

El condicionamiento operante o condicionamiento instrumental es un tipo de aprendizaje donde el comportamiento se controla con las consecuencias.

Se basa en la idea de que los comportamientos que se refuerzan tienden a mostrarse en más ocasiones, mientras que los comportamientos que son castigados se extinguen.

condicionamiento operante con rata

¿Cuál es la diferencia entre el condicionamiento operante y el condicionamiento clásico? En el condicionamiento operante, una respuesta voluntaria es seguida por un reforzador. De esta manera, la respuesta voluntaria (por ejemplo, estudiar para un examen) es más probable que se realice en el futuro. Al contrario, en el condicionamiento clásico un estímulo activa automáticamente una respuesta involuntaria.

El condicionamiento operante puede describirse como un proceso que intenta modificar el comportamiento mediante el uso del refuerzo positivo y negativo. A través del condicionamiento operante, un individuo hace una asociación entre un comportamiento particular y una consecuencia. Ejemplos:

  • Los padres recompensan las buenas calificaciones de un niño con dulces o algún otro premio.
  • Un maestro premia a aquellos estudiantes que son tranquilos y educados. Los estudiantes se dan cuenta que al comportarse así reciben más puntos.
  • Un alimento se da a un animal cada vez que presiona una palanca.

B.F. Skinner (1938) acuñó el término acondicionamiento operante. Skinner identificó tres tipos de respuestas o operantes que pueden seguir el comportamiento:

  • Operantes neutrales: respuestas del entorno que no aumentan ni disminuyen la probabilidad de que se repita un comportamiento.
  • Reforzadores: respuestas del entorno que incrementan la probabilidad de repetición de un comportamiento. Los reforzadores pueden ser positivos o negativos.
  • Castigos: respuestas del entorno que disminuyen la probabilidad de que se repita un comportamiento. El castigo debilita el comportamiento.

Antecedentes del condicionamiento operante

Thorndike fue el primero en reconocer que este condicionamiento incluye algo más que una respuesta y un reforzador. La respuesta se da en presencia de unos estímulos determinados, considerándose tres sucesos: el estímulo, la respuesta y la consecuencia de la respuesta o reforzador.

Esta estructura facilita el desarrollo de diferentes vinculaciones como sería la asociación entre el estímulo y la respuesta, la cual fue para Thorndike clave para la formulación de la ley del efecto. A través de ésta afirmó que las respuestas que vayan seguidas de consecuencias reforzantes, tendrán mayor probabilidad de ocurrencia cuando el estímulo vuelva a aparecer.

Por el contrario, aquellas respuestas que son seguidas de consecuencias negativas, tendrán una menor probabilidad de ocurrencia cuando el estímulo vuelva a aparecer. La ley del efecto es el antecedente del condicionamiento operante o condicionamiento instrumental, como era nombrado por Thorndike.

Pero para Skinner, psicólogo del conductismo, el condicionamiento era el fortalecimiento de las conductas según las consecuencias que anteriormente se hubieran obtenido.

En esta línea, existen dos formas de condicionamiento:

  • El clásico o pavloviano: se basa en la asociación de estímulos incondicionados y condicionados, siendo las respuestas controladas por los estímulos antecedentes.
  • El condicionamiento operante: los estímulos consecuentes o reforzadores hacen que se emita una conducta determinada. Skinner explica que si la conducta es seguida de un reforzador positivo, aumentaría la probabilidad de emisión de dicha conducta en un futuro. Al contrario, si una respuesta no va seguida de un reforzador o ese reforzador es negativo, la probabilidad de emitir dicha conducta en un futuro será menor.

Conceptos básicos del condicionamiento operante

Refuerzo

Es el responsable de la emisión de respuestas, es decir, de la probabilidad de que sucedan, sea mayor o menor en un futuro. Es un estímulo reforzante y consecuente, ya que se da una vez se ha producido la respuesta.

Es imposible saber si un reforzador determinado influye en la conducta hasta que no se presenta de manera contingente con una respuesta y se comprueba que el comportamiento cambia a consecuencia del reforzador.

Existen dos tipos de refuerzo: positivo y negativo. Ambos tienen la misma finalidad de aumentar la probabilidad de que la respuesta se emita en situaciones futuras. Además, para Skinner los reforzadores se definen por medio de las conductas que son observables y medibles.

Refuerzo positivo

El refuerzo positivo refuerza un comportamiento proporcionando una consecuencia que un individuo encuentra gratificante.

Refuerzo negativo

La eliminación de un reforzador desagradable también puede fortalecer un comportamiento. Esto se conoce como refuerzo negativo porque es la eliminación de un estímulo adverso que es “gratificante” para el animal o la persona. El refuerzo negativo refuerza el comportamiento porque detiene o elimina una experiencia desagradable.

Reforzadores primarios

Serían todos aquellos reforzadores básicos que no necesitan de ninguna historia de condicionamiento previa para funcionar como tales. Algunos ejemplos serían el agua, la comida y el sexo.

Reforzadores secundarios

Los reforzadores secundarios si estarían basados en historias previas de condicionamiento gracias a la asociación con estímulos incondicionados. Algunos ejemplos serían el dinero y las calificaciones.

Contingencia de tres términos

Es el modelo básico del condicionamiento operante y está formado por tres componentes: el estímulo discriminativo, la respuesta y el estímulo reforzador.

Un estímulo discriminativo sería aquel que va a indicar al sujeto que el reforzador está disponible, señalando que si lleva a cabo una determinada conducta podrá obtener dicho reforzador. En contraposición tenemos el estímulo delta o estímulos que indican que la conducta no va a llevar a la obtención de ningún tipo de reforzador.

La respuesta sería la conducta que realizará el sujeto, cuya ejecución le llevará o no a la obtención del estímulo reforzador.

Un estímulo reforzador, como se ha mencionado anteriormente, es el responsable de la emisión de la conducta ya que gracias a su aparición la probabilidad de emisión de una respuesta aumentará o disminuirá en el futuro.

Conceptos a conocer del condicionamiento operante

Castigo

El castigo también se mide por sus efectos en la conducta del sujeto. En cambio, a diferencia del refuerzo, lo que se pretende es la disminución o supresión de una determinada conducta.

Un castigo reduce la probabilidad de emisión de una conducta en situaciones posteriores. No obstante, no elimina la respuesta ya que si la amenaza de castigo disminuye, la conducta puede volver a aparecer.

En el castigo también existen dos tipos o procedimientos diferentes, castigo positivo y castigo negativo.

Castigo positivo

Este implica la presentación de un estímulo aversivo tras la realización de un determinado comportamiento. Es dado de manera contingente a la respuesta dada por el sujeto.

Castigo negativo

Consiste en la eliminación de un estímulo como consecuencia de un determinado comportamiento, es decir, consiste en la retirada de un estímulo positivo tras la realización de una determinada conducta.

Extinción

En la extinción se deja de emitir una respuesta debido a que el reforzador ya no aparece. Este proceso se basa en dejar de proporcionar el reforzador correspondiente que se espera conseguir y que ha hecho que ese comportamiento se mantenga a lo largo del tiempo.

Cuando una respuesta se extingue, el estímulo discriminativo pasa a ser estímulo de extinción. Este proceso no debe confundirse con el olvido, que es dado cuando la fuerza de un comportamiento disminuye al no haber sido emitido en un período de tiempo.

Generalización

Ante una situación o estímulo determinado se condiciona una respuesta, que puede aparecer ante otros estímulos o situaciones parecidas.

Discriminación

Este proceso es el opuesto al de generalización, en él se responde de manera diferente según el estímulo y el contexto.

Programas de refuerzo

Skinner también estableció gracias a sus investigaciones diversos programas de refuerzo, entre los que están los programas de reforzamiento continuo y los programas de reforzamiento intermitente.

Programas de refuerzo continuo

Están basados en el reforzamiento constante de la respuesta cada vez que se presente, es decir, cada vez que el sujeto ejecute la conducta deseada obtendrá un estímulo reforzador o positivo.

Programas de refuerzo intermitente

En cambio, aquí el sujeto no siempre obtiene el reforzador al realizar la conducta deseada. Estos se definen en base al número de respuestas dadas o al intervalo de tiempo transcurrido entre respuestas, dando lugar a diferentes procedimientos.

Programas de razón fija

En estos programas el reforzador se proporciona cuando el sujeto genera respuestas fijas y constantes. Por ejemplo, en un programa de razón 10 la persona obtiene el reforzador tras haber realizado diez respuestas cuando se presenta el estímulo.

Programas de razón variable

Éste se construye igual que el anterior, pero en este caso el número de respuestas que el sujeto debe dar para obtener el reforzador es variable.

El reforzador seguiría dependiendo del número de respuestas emitidas por el sujeto pero con una razón variable, gracias a la cual se evita que el sujeto llegue a predecir cuándo obtendrá el reforzador.

Programas de intervalo fijo

En los programas de intervalo la obtención del reforzador no depende del número de respuestas que el sujeto dé, sino que está determinado por el tiempo transcurrido. En consecuencia se refuerza la primera respuesta producida después de haber pasado un periodo de tiempo determinado.

En los programas de intervalo fijo el tiempo entre reforzador y reforzador es siempre el mismo.

Programas de intervalo variable

En estos programas el reforzador se obtiene después de un tiempo, aunque el tiempo es distinto para cada reforzador recibido.

Cambio conductual

Aproximaciones sucesivas o moldeamiento

El moldeamiento consiste en el cambio conductual a través del moldeamiento de conductas o el refuerzo diferencial de aproximaciones sucesivas.

Para moldear una conducta concreta se siguen una serie de pasos. En primer lugar se identifica cuál es la conducta inicial que se pretende moldear para saber a cuál se quiere llegar.

Después, se delimitan los posibles reforzadores que se van a emplear y se separa en pasos o etapas el proceso para llegar a la conducta final, reforzando cada etapa o aproximación sucesiva hasta llegar a la última.

Con este procedimiento dinámico se van transformando tanto las conductas como sus consecuencias. En este sentido, se refuerzan las aproximaciones sucesivas hacia una conducta objetivo.

No obstante, para que se pueda llevar a cabo, es necesario partir de una conducta previa que ya realice el sujeto, para así ir reforzando poco a poco sus conductas hasta llegar a la meta.

Encadenamiento

Con él se forma una nueva conducta a partir de la descomposición en pasos o secuencias más sencillas, reforzando cada respuesta dada en cada uno de los pasos para así llevar al establecimiento de una respuesta más compleja en el repertorio conductual del sujeto.

Se pueden llegar a formar cadenas largas de respuestas utilizando reforzadores condicionados, adoptando una unidad funcional y cuyo establecimiento lleva a la adquisición y definición de una destreza particular.

Referencias

  1. Condicionamiento operante. Recuperado de wikipedia.org
  2. Condicionamiento operante. Recuperado de e-torredebabel.com.
  3. Recuperado de biblio3.url.
  4. Ley del efecto. Recuperado de wikipedia.org.
  5. Extinción. Recuperado de wikipedio.org.
  6. Domjan, M. Principios de aprendizaje y conducta. Paraninfo. 5ª edición.

DEJA UNA RESPUESTA

Please enter your comment!
Please enter your name here