¿Qué es la teoría del reforzamiento de Skinner?

La teoría del reforzamiento de Skinner, también conocida como teoría del condicionamiento operante, es una de las bases de la llamada psicología cognitivo – conductual. Se basa en la idea de que los organismos aprenden unas conductas u otras en función de premios (llamados refuerzos) o castigos.

A pesar de la aceptación por parte de la comunidad científica del condicionamiento clásico de Pavlov, Skinner creía que este modelo era demasiado simple como para poder explicar completamente el aprendizaje humano.

Skinner

Por lo tanto, basándose en la ley del efecto de Thorndike, empezó a investigar cómo los animales aprendían a realizar diferentes conductas. Tras la formulación de la teoría, el conodicionamiento operante sirvió durante muchos años como única explicación del comportamiento humano.

Más adelante, surgieron muchos otros enfoques psicológicos que pusieron en duda algunos de los fundamentos de la Psicología Conductista basada en las teorías de Skinner.

En concreto, en los años 70 apareció otro enfoque (la psicología cognitiva), que complementaba la teoría del condicionamiento. De esta manera, surgió el modelo predominante actualmente en Psicología, la teoría cognitivo – conductual.

Bases de la teoría del reforzamiento de Skinner

Skinner creía que la mejor forma de entender el comportamiento (tanto humano como animal) era observando las causas de una acción y sus consecuencias. Este enfoque fue más adelante conocido como “condicionamiento operante”.

El nombre surge debido a los llamados “operantes”, que son acciones que realiza un organismo y que tienen un efecto en el entorno. Este efecto puede ser positivo (como que un animal encuentre comida si va por un determinado camino) o negativo (como quemarse la mano al tocar el fuego).

Si el organismo consigue un efecto positivo, se considera que la conducta queda “reforzada”, y por lo tanto es más probable que vuelva a producirse en el futuro. Por el contrario, si el efecto que se consigue es negativo, la conducta es “castigada” y tenderá a disminuir su frecuencia en el futuro, o incluso a desaparecer.

Caja de Skinner

Skinner estudió las leyes del condicionamiento operante utilizando animales, especialmente palomas, que introducía en la llamada “Caja de Skinner”.

En ella, los animales eran premiados o castigados en función de las conductas que exhibieran, permitiendo que el científico observase los efectos de diferentes tipos de refuerzos y castigos, su frecuencia…

Tipos de respuestas en la teoría de Skinner

A pesar de que comúnmente tan sólo oímos hablar de refuerzos y castigos, realmente Skinner dividió las posibles respuestas a la conducta de un organismo en cinco tipos: respuesta neutral, refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo.

Aunque cada una de ellas tiene un efecto diferente en la conducta del organismo, se pueden agrupar en tres tipos: las que no provocan cambios en la conducta, las que aumentan la probabilidad de que se vuelva a producir en el futuro, y las que la disminuyen.

Respuesta neutral

Los operantes neutrales son todas las consecuencias de una acción que ni aumentan ni disminuyen la probabilidad de que ésta vuelva a producirse en el futuro. Son las menos comunes de todos los tipos de respuestas: en general, muy pocos operantes son totalmente neutrales.

Un ejemplo de operante neutral sería el siguiente. Si un estudiante sale a exponer un trabajo delante de toda su clase, y no recibe una respuesta calurosa (aplausos, felicitaciones…) pero tampoco una mala respuesta, es probable que no se sienta ni más ni menos predispuesto que antes a volver a presentar un trabajo en público.

Refuerzo positivo

Como ya sabemos, un refuerzo es un operante que aumenta la probabilidad de que una conducta vuelva a producirse en el futuro. Sin embargo, ¿qué significa que un refuerzo sea positivo?

La etiqueta de “positivo”, tanto para refuerzos como para castigos, no tiene nada que ver con que la respuesta sea buena o mala. Por el contrario, se considera un operante como positivo si se le da algo al organismo, y como negativo si se le quita algo.

Por lo tanto, un refuerzo positivo es un operante en el que el organismo recibe algo que hace que se vuelva más probable la repetición de la conducta premiada en el futuro.

El ejemplo clásico es el siguiente: si una rata pulsa una palanca y recibe comida, será más probable que vuelva a pulsarla en el futuro.

Refuerzo negativo

Ya hemos visto que “refuerzo” significa que se aumenta la probabilidad de una conducta en el futuro, y “negativo”, que se elimina algo como respuesta al organismo.

Es decir, un refuerzo negativo sería un operante en el que se elimina algo desagradable para el animal, lo que hace que la probabilidad de que se vuelva a producir la conducta aumenta.

Un ejemplo en el que se ve claramente cómo funciona este tipo de refuerzo es con la conducta de rascarse. Cuando nos pica una parte del cuerpo, tenemos una sensación desagradable de la que nos queremos deshacer; al rascarnos, esa molestia desaparece, por lo que la conducta queda reforzada y es más probable que volvamos a realizarla en el futuro.

Castigo positivo

La otra cara de la moneda de los refuerzos son los llamados “castigos”: operantes que provocan que la conducta se repita con menos frecuencia, o incluso, que desaparezca por completo.

El castigo positivo es lo que comúnmente entendemos como castigo en el lenguaje coloquial. Consiste en una respuesta desagradable para el organismo, que al recibirla, tenderá a disminuir la conducta que le ha llevado a experimentar el castigo.

Ejemplos de castigo positivo serían los siguientes: quemarse al tocar algo caliente, recibir un grito después de hacer algo mal, sentirse enfermo tras comer algo en mal estado…

Castigo negativo

El último tipo de operante es, tal vez, el más complicado de entender para la mayoría de la gente. Se trata de un castigo, por lo que su función principal es reducir la frecuencia de una conducta; sin embargo, la forma de castigar al organismo consiste en quitarle algo que es placentero para él.

Un ejemplo muy claro es el de quitarle un juguete a un niño si se está portando mal, para que deje de hacerlo, o retirarle la atención a alguien si nos está tratando mal.

Referencias

  1. “Operant Conditioning” en: Instructional Design. Recuperado en: 17 Enero 2018 de Instructional Design: instructionaldesign.org.
  2. “Operant Conditioning Examples” en: Psychestudy. Recuperado en: 17 Enero 2018 de Psychestudy: psychestudy.com.
  3. “Skinner’s Theory on Operant Conditioning” en: Psychestudy. Recuperado en: 17 Enero 2018 de Psychestudy: psychestudy.com.
  4. “Classical and Operant Conditioning” en: Learning Theories. Recuperado en: 17 Enero 2018 de Learning Theories: learning-theories.com.
  5. “Skinner – Operant Psychology” en: Simply Psychology. Recuperado en: 17 Enero 2018 de Simply Psychology: simplypsychology.org.
COMPARTIR

DEJA UNA RESPUESTA

Please enter your comment!
Please enter your name here