B.F. Skinner: Teoría del Conductismo y Condicionamiento Operante

Burrhus Frederic Skinner, más conocido como B. F. Skinner, fue un psicólogo americano conocido por sus aportaciones al desarrollar la teoría del conductismo, y por su novela utópica Walden Two (1948).

El conductismo supone que todos los comportamientos son respuestas a ciertos estímulos en el ambiente, o consecuencias de la historia del individuo. Aunque los conductistas generalmente aceptan el papel importante de la herencia en la determinación del comportamiento, se centran principalmente en factores ambientales.

teoría conductismo skinner

Es el psicólogo más reconocido dentro de la corriente del conductismo y su teoría ha sido una de las más influyentes en la Psicología.

Nacido en Pennsylvania en 1904, comenzó a trabajar en sus ideas del comportamiento humano después de obtener su doctorado en Harvard. Los trabajos de Skinner incluyen El comportamiento de los organismos (1938) y una novela basada en sus teorías, Walden dos (1948). Exploró el conductismo en relación con la sociedad en libros posteriores, incluyendo Beyond Freedom and Human Dignity (1971).

Como estudiante en el Hamilton College, Skinner desarrolló una pasión por escribir. Intentó convertirse en escritor profesional después de graduarse en 1926, pero obtuvo poco éxito. Dos años más tarde, decidió seguir una nueva dirección para su vida; se matriculó en la Universidad de Harvard para estudiar psicología.

Skinner consideraba el libre albedrío una ilusión y la acción humana como dependiente de las consecuencias de las acciones anteriores. Si las consecuencias son malas, existe una alta probabilidad de que la acción no se repita. Por el contrario, si las consecuencias son buenas, es probable que se repita la acción. Skinner llamó a esto el principio del refuerzo.

Caja de Skinner

Para fortalecer el comportamiento, Skinner utilizó el condicionamiento operante y para estudiarlo inventó la cámara de acondicionamiento operante, también conocida como la caja de Skinner.

En la década de 1920, Watson había dejado la psicología académica y otros conductistas estaban empezando a ser influyentes, proponiendo nuevas formas de aprender aparte del condicionamiento clásico.

La forma de pensar de Skinner era ligeramente menos extrema que la de Watson. Skinner creía que tenemos mente, pero que simplemente es más productivo estudiar los comportamientos observables en lugar de los eventos mentales internos.

Introducción al conductismo

El conductismo fue el paradigma principal de la psicología entre 1920 y 1950, fundado por John Watson y basado en la creencia de que las conductas pueden ser medidas, entrenadas y cambiadas. El conductismo podría resumirse con la siguiente cita de Watson, considerado el “padre” de esta corriente psicológica:

“Dame una docena de niños sanos, bien formados, para que pueda educarlos, y me comprometo a elegir uno al azar y adiestrarlo para convertirlo en un especialista de cualquier cosa que yo pueda escoger: médico, abogado, artista, hombre de negocios, mendigo o ladrón, prescindiendo de su talento, inclinaciones, tendencias, aptitudes, vocaciones y raza de su sus antepasados”.

John Watson, Behaviorism, 1930.

Según los principios del conductismo, todas las conductas se aprenden del ambiente en el que crecemos. Los conductistas no creían en las determinaciones biológicas.

Además, se ocupaban principalmente de las conductas que podían ser observadas y creían que no había mucha diferencia entre el aprendizaje que tiene lugar en los humanos y el que tiene lugar en los animales.

¿Cómo empezó el conductismo?

El médico ruso Pavlov fue el primero en estudiar teorías relativas al conductismo en la década de 1890. El condicionamiento clásico pavloviano fue descubierto por accidente, cuando descubrió, en un experimento sobre la digestión de sus perros, que éstos salivaban cuando él entraba en la habitación, sin siquiera traer comida consigo.

Pavlov y perro

Para resumir, el condicionamiento clásico implica un aprendizaje que asocia un estímulo incondicionado que trae por defecto una respuesta en el organismo (por ejemplo, un reflejo) con un nuevo estímulo, de forma que éste último también conlleva la misma respuesta.

Esta teoría fue más tarde desarrollada por Watson (1913), que fue el psicólogo estadounidense que fundó la escuela psicológica conductista, publicando un artículo llamado “La psicología tal y como la ve un conductista”. Más tarde, condicionó a un niño para que temiera a una rata blanca.

Thorndike, el psicólogo y pedagogo estadounidense, formalizó el término “Ley de efecto” en 1905. En 1936, Skinner, el psicólogo americano que conforma el verdadero centro de atención del presente artículo, publicó “La conducta de los organismos” e introdujo los conceptos de condicionamiento operante y modelado.

El conductismo según Burrhus Frederic Skinner

Skinner con palo
Fuente: emaze.com.

El trabajo de Skinner tuvo sus raíces en la visión del condicionamiento clásico como algo demasiado simple como para constituir una explicación completa del comportamiento humano complejo. Skinner creía que la mejor forma de comprender la conducta humana era comprobar las causas de una acción y sus consecuencias. Llamó a este planteamiento “condicionamiento operante”.

El condicionamiento operante tiene que ver con los operantes: acciones intencionales que tienen un efecto en el ambiente que nos rodea. Skinner comenzó a identificar los procesos que hacían la ocurrencia de ciertas conductas operantes más o menos probables.

La teoría de Skinner del condicionamiento operante está basada en el trabajo de Thorndike (1905). Edward Thorndike estudió el aprendizaje en los animales utilizando una caja-puzzle para proponer la teoría conocida como “La ley del efecto”.

El condicionamiento operante de Skinner

Como hemos dicho, Skinner es considerado el padre del condicionamiento operante, pero su trabajo está basado en la ley del efecto de Thorndike. Skinner introdujo un nuevo término en la ley del efecto: el refuerzo. La conducta que es reforzada tiende a repetirse; la conducta que no es reforzada tiende a extinguirse (se debilita).

Skinner estudió el condicionamiento operante conduciendo experimentos con animales, que colocaba en una “caja de Skinner”, similar a la caja-puzzle de Thorndike.

Skinner acuñó el término “condicionamiento operante”, que implica cambiar una conducta utilizando refuerzos dados después de la respuesta deseada. Skinner identificó tres tipos de respuestas u operantes que pueden seguir al comportamiento:

  • Operantes neutros. Son respuestas del ambiente que ni aumentan ni disminuyen la probabilidad de que la conducta se repita.
  • Estas respuestas aumentan la probabilidad de que la conducta se repita. Los refuerzos pueden ser positivos o negativos.
  • Son respuestas que disminuyen la probabilidad de que una conducta se repita; los castigos debilitan la conducta en cuestión.

Todos hemos experimentado ejemplos de conductas que han sido afectadas por refuerzos y castigos. Cuando éramos niños, por ejemplo, si hablábamos durante una clase, el profesor nos mandaba callar. Esta respuesta por parte del profesor constituye un castigo que, al menos supuestamente, debería debilitar la conducta de hablar con el compañero durante la clase.

Durante la adolescencia, por ejemplo, llevar un determinado estilo o marca de ropa podría ser reforzado positivamente por los compañeros de misma edad mediante halagos, aceptación social o simplemente algún gesto amable. Esto refuerza y hace que sea más probable que se repita la conducta de llevar puesta una ropa de marca determinada.

El refuerzo positivo

Investigadoras con caja de Skinner y paloma.

Skinner demostró cómo funcionaba el refuerzo positivo colocando una rata hambrienta en su caja de Skinner. La caja contenía una palanca en un lado y la rata, conforme se iba moviendo por la caja, presionaba accidentalmente a la palanca. Inmediatamente, un gránulo de comida caía en un pequeño contenedor al lado de la palanca.

Las ratas aprendieron rápidamente a ir directamente a la palanca después de haber estado unas pocas veces en la caja. La consecuencia de recibir la comida si presionaban la palanca aseguraba que repitieran la conducta una y otra vez.

El refuerzo positivo fortalece una conducta proporcionando una consecuencia que el individuo considera recompensante. Por ejemplo, si tu profesor te da dinero cada vez que completas los deberes, es más probable que repitas la conducta de hacer los deberes en el futuro, fortaleciendo esta conducta.

Refuerzo negativo

La eliminación de un refuerzo desagradable también puede fortalecer una conducta determinada. Esto es conocido como refuerzo negativo, porque es la eliminación de un estímulo adverso que es “recompensante” para la persona o el animal. El refuerzo negativo fortalece la conducta porque detiene o elimina una experiencia desagradable.

Por ejemplo, cuando tienes dolor de cabeza, tomas una aspirina para aliviarlo. El hecho de que desaparezca el dolor constituye un reforzador negativo para la conducta de tomar una aspirina, haciendo más probable que se repita en un futuro cuando tengas dolor de cabeza.

Skinner estudió cómo funcionaba el refuerzo negativo, de nuevo, colocando una rata en su caja de Skinner y exponiéndola a una corriente eléctrica desagradable que le causaba cierto grado de malestar. Esta vez, la palanca de la caja hacía que la corriente eléctrica se detuviese.

Las ratas, al principio, presionaban la palanca por accidente, pero al poco tiempo aprendieron a presionarla para detener la corriente eléctrica. La consecuencia de escapar a la corriente aseguraba que repitieran la acción cada vez que eran colocadas en la caja o cada vez que sentían la electricidad.

De hecho, Skinner enseñó a las ratas incluso a evitar la corriente eléctrica encendiendo una luz justo antes de que la corriente eléctrica apareciese. Las ratas aprendieron pronto a presionar la palanca cuando la luz se encendía porque sabían que esto evitaría que la corriente eléctrica fuera encendida.

Estas dos respuestas aprendidas son conocidas como “aprendizaje por escape” y “aprendizaje por evitación”.

Castigo

El castigo se define como lo contrario al refuerzo, ya que está diseñado para debilitar o eliminar una respuesta en lugar de aumentar su probabilidad. Es un evento aversivo que disminuye la conducta que le sigue.

Tal y como ocurre con el refuerzo, el castigo puede funcionar tanto aplicando directamente un estímulo desagradable, como un shock eléctrico después de una respuesta, como eliminando un estímulo potencialmente recompensante.

Por ejemplo, descontando dinero de la paga de alguien para castigar conductas indeseables. Es necesario señalar que no siempre es fácil distinguir entre castigos y refuerzos negativos.

Existen varios problemas a la hora de utilizar castigos, como son los siguientes:

  • La conducta castigada no se olvida, se suprime. Esta conducta vuelve cuando el castigo no está presente.
  • El castigo puede provocar un aumento de la agresividad. Puede mostrar que la agresividad es una forma de afrontar los problemas.
  • Los castigos crean miedo que se generaliza a conductas indeseables, por ejemplo, miedo a ir a la escuela.
  • Muchas veces, el castigo no modela la conducta hacia el objetivo deseado. El refuerzo te dice qué hacer, mientras el castigo sólo te dice qué no hacer.

Modelado de conductas

Otra de las contribuciones importantes de Skinner es la noción del modelado de conductas a través de la aproximación sucesiva. Skinner argumenta que los principios del condicionamiento operante pueden ser utilizados para producir conductas extremadamente complejas si las recompensas y los castigos son efectuados de forma que animan al organismo en cuestión a estar cada vez más cerca de la conducta deseada.

Para que este resultado se produzca, las condiciones (o contingencias) requeridas para recibir la recompensa deberían cambiar cada vez que el organismo dé un paso para estar más cerca de la conducta deseada.

Según Skinner, la mayor parte de la conducta humana (incluyendo el lenguaje) puede ser explicada como un producto de este tipo de aproximación sucesiva.

Modificación de conductas

La modificación de conductas es un conjunto de terapias o técnicas basadas en el condicionamiento operante. El principio básico consiste en cambiar eventos ambientales relacionados con una conducta determinada de una persona. Por ejemplo, reforzar conductas deseadas e ignorar o castigar las indeseadas.

Sin embargo, esto no es tan simple como suena. Reforzar siempre un comportamiento deseado, por ejemplo, es básicamente sobornar a alguien.

Existen varios tipos de refuerzo positivo. El refuerzo primario se da cuando una recompensa fortalece una conducta por sí misma. El refuerzo secundario se da cuando algo refuerza una conducta porque lleva a un reforzador primario.

Aplicaciones prácticas educativas

En la situación de aprendizaje convencional, el condicionamiento operante se aplica a temas relacionados con las aulas y el estudio, en lugar de aplicarse a contenidos relacionados con el aprendizaje.

Respecto a la aplicación educativa del modelado de conductas, una forma simple de modelar un comportamiento consiste en proporcionar feedback (retroalimentación) respecto a la ejecución del aprendiz (por ejemplo, halagos, señales de aprobación, ánimos).

Por ejemplo, si un profesor quisiera animar a sus estudiantes a responder preguntas en clase, debería elogiarlos en cada intento, sin importar si la respuesta es correcta o no. Gradualmente, el profesor sólo elogiará a los alumnos cuando sus respuestas son correctas y, con el tiempo, tan solo las respuestas excepcionales serán elogiadas.

Las conductas indeseadas, tales como los retrasos al llegar a clase y dominar las discusiones en clase, pueden ser extinguidas siendo ignoradas por el profesor, en lugar de ser reforzadas atrayendo la atención de éste hacia dichas conductas.

Saber que se ha tenido éxito también es importante, ya que motiva los aprendizajes futuros. Sin embargo, es importante variar el tipo de refuerzo que se proporciona, de forma que la conducta se mantenga. Esto no es una tarea sencilla, ya que el profesor puede parecer poco sincero si piensa demasiado la forma en la que debe comportarse a la hora de elogiar a un alumno.

Otras aplicaciones prácticas y evaluación crítica

El condicionamiento operante puede ser utilizado para explicar una gran cantidad de conductas, desde el proceso de aprendizaje hasta la adicción y la adquisición del lenguaje. También tiene aplicaciones prácticas, como las educativas que hemos descrito previamente, y en prisiones, hospitales psiquiátricos y en economía.

En economía, una aplicación conocida del condicionamiento operante es la economía de fichas, un sistema a través del cual la persona recibe fichas justo después de llevar a cabo una conducta deseada. Las fichas se coleccionan y luego se cambian por algún objeto significativo para el individuo.

El uso de investigaciones con animales relativas al condicionamiento operante también plantea la cuestión de la extrapolación de los hallazgos.

Algunos psicólogos alegan que no podemos generalizar a la conducta humana resultados concluidos de investigaciones con animales, ya que su anatomía y fisiología es distinta y no pueden reflexionar sobre sus experiencias ni invocar a la razón, paciencia y memoria como los humanos.

DEJA UNA RESPUESTA

Please enter your comment!
Please enter your name here