miércoles, 11 de octubre de 2017

Carta a Belén sobre el aprendizaje



Querida Belén:

            ¿Te gustó haber ido al circo? No hubo ningún animal haciendo peripecias. Los activistas de derechos de animales han presionado mucho para que ya no se usen animales en el circo. Ellos dicen que los animales en los circos sufren mucho. Quizás tengan razón. Pero, debo confesar que, cuando yo tenía tu edad, lo que más me agradaba del circo era precisamente los espectáculos con animales. Esos espectáculos no son como una corrida de toros, donde se golpea al pobre animal hasta morir. Más bien, en esos espectáculos se enseña al animal a hacer cosas asombrosas. El ver a un elefante dar vueltas o a un mono hacer malabares, siempre me pareció una gran hazaña, no solamente de parte del animal, sino también de quien lo entrena.
            A los psicólogos les interesa muchísimo esto. Ellos dicen que, si logramos entender cómo un animal aprende algo en particular, podremos entender muchísimo mejor la conducta humana. Después de todo, nosotros somos también animales, y en muchas cosas, nuestro aprendizaje se consigue con los mismos principios.

            Un científico de finales del siglo XIX, Ivan Pavlov, inadvertidamente descubrió las bases del aprendizaje animal. Pavlov quería estudiar la digestión de los perros, y cómo salivan antes de empezar a comer. Extrañamente, Pavlov se dio cuenta de que los perros salivaban incluso antes de que llegara la comida, ante la mera presencia de los encargados de repartirles la comida.
            Entonces, a Pavlov se le ocurrió hacer un experimento: presentaría a los perros con comida, pero cada vez que lo hiciera, sonaría una campana. Hizo eso varias veces. Luego, Pavlov sonaba la campana sin mostrarles la comida, y sorprendentemente, los perros salivaban. Así pues, exponía a los perros a una asociación entre la campana y la comida. Éste es quizás el experimento más famoso en toda la historia de la psicología.
            ¿Por qué es tan famoso? Porque Pavlov descubrió que la base del aprendizaje es la asociación. Los perros aprendieron a salivar ante la campana. En condiciones naturales, ningún perro salivaría ante el sonido de una campana. Pero, si ese sonido se asocia con algo que naturalmente sí haga salivar a un perro, entonces el perro sí salivará.
            En este experimento, hay estímulos y hay respuestas. Hay un estímulo natural (la comida), y una respuesta natural (la salivación). Ningún perro tiene que aprender a salivar ante la comida; es ya una conducta instintiva. Pero, tras la asociación, el estímulo ha sido condicionado, y como consecuencia, hay también una respuesta condicionada. El estímulo condicionado es la campana, y la respuesta condicionada es la salivación ante la campana. El perro, pues, ha sido entrenado a responder con una conducta específica a la campana.
            Los psicólogos llaman a este proceso condicionamiento clásico (para distinguirlo de otro tipo de condicionamiento, sobre el cual te escribiré en breve). Cuanto más se asocien los dos eventos, más se reforzará la respuesta condicionada al estímulo condicionado. Si, en cambio, se condiciona la conducta a través de esta asociación, pero no se asocian continuamente los dos eventos, entonces la respuesta condicionada al estímulo condicionado desaparecerá. Los psicólogos llaman a esto extinción.
            Con todo, hay ciertas cosas para las cuales es más fácil condicionar a un animal o una persona, que otras. Por ejemplo, si vas a un restaurante, comes sushi, y un par de horas después tienes una indigestión muy fuerte, es probable que desarrolles una aversión por el sushi, al punto de que más nunca quieras volver a comer esa delicia japonesa. No necesariamente el sushi causó tu indigestión; pudo haber sido otra cosa. Pero, igual que el perro de Pavlov, habrías establecido una asociación entre el sushi y la indigestión, lo suficiente como para aborrecer el sushi por el resto de tu vida.
            No obstante, el condicionamiento en esta aversión sería distinto al experimento de Pavlov. Pues, en ese experimento, es necesaria una continua asociación entre la campana y la comida, a fin de evitar la extinción. En cambio, en tu caso, sólo necesitarías de una sola asociación entre la indigestión y el sushi. Nuestro cerebro está muy atento de las indigestiones, y basta una sola asociación, para rechazar un alimento perennemente.
Es más fácil asociar la indigestión con el sushi, que la campana con la comida, porque la primera asociación es más natural. La evolución de nuestra especie ha hecho que sea más fácil asociar cosas que, en el pasado, pudieron resultar más peligrosas. Un psicólogo, John García, se propuso corroborar esto, con un experimento. Tomó unas ratas, y las expuso a una asociación de descargas eléctricas con sonidos, y luego asoció descargas eléctricas con agua. Como consecuencia, las ratas se estresaban al oír esos sonidos, pero no se estresaban al beber el agua.
Extraño, ¿no? En el fondo, a García no le pareció tan extraño, por una razón muy sencilla: en la naturaleza, una descarga eléctrica está asociada con un sonido (el trueno), mientras que no está asociada con el agua. Por eso, es más fácil condicionar a una rata para que asocie la descarga eléctrica con un sonido, en vez de con el agua.
Por si acaso quedaban dudas, García hizo otro experimento. Expuso a otras ratas a la asociación de agua dulce y radiación (induciendo en ellas nausea), y luego las expuso a la asociación entre el sonido y la radiación. En este caso, las ratas se estresaban ante el agua dulce, pero no ante el sonido. ¿Por qué? Pues, de nuevo, porque en la naturaleza, es más natural que el agua genere nausea.
Un psicólogo, Albert Watson, decía que él podría ser capaz de enseñar cualquier cosa a cualquier persona, a través de los condicionamientos. De hecho, Watson es conocido por una infame frase: “dame una docena de niños sanos… y garantizaré que, al tomar a cualquiera por azar, lo entrenaré para ser cualquier tipo de especialista (médico, abogado, artista, mercader, e incluso mendigo o ladrón), sin importar sus talentos, tendencias, habilidades o vocaciones”. Lo que Watson decía es un disparate, precisamente por lo que García descubrió con sus experimentos. El condicionamiento puede servir para enseñar algunas cosas, pero la conducta sigue teniendo una base instintiva.
En fin, te decía que hay otro tipo de condicionamiento. Los psicólogos lo llaman el condicionamiento operante. En los experimentos de Pavlov, los perros aprendían a asociar la campana y la comida, independientemente de su conducta. Pero, después de los estudios de Pavlov, a los psicólogos les empezó a interesar cómo se puede modificar la conducta de un animal, dependiendo de los premios o castigos que el animal reciba después de tener una conducta específica.
Edward Thorndike, otro psicólogo, ideó otro ingenioso experimento para poner estas ideas a pruebas. Thorndike colocaba a un gato en un laberinto. Al final del laberinto, habría comida. Las primeras veces, el gato se tardaba en llegar a la comida, pues tomaba caminos errados en el laberinto. Pero, cuantas más veces repetía el camino del laberinto, más rápido llegaba a la comida, y evitaba los pasos errados. El gato seguía el método del ensayo y el error.
El estímulo de la comida incentivaba al gato a evitar aquellos pasos errados que hacían que llegase más lentamente a la comida. Thorndike llegó a la conclusión de que, cuantos más efectos placenteros tenga una conducta, mayor será la probabilidad de que esa conducta se repita. Así pues, el placer de llegar a la comida incrementaba la probabilidad de que el gato tomara la ruta correcta. Thorndike llamó a esto la ley del efecto.
Otro psicólogo, B.F. Skinner, pensó en un experimento similar. Skinner colocó a una rata en una caja. En esa caja, habría una palanca. Si la rata movía la palanca, recibiría comida. En la caja, también había un botón. Si la rata oprimía el botón, recibiría una descarga eléctrica. ¿Adivinas qué terminó haciendo la rata al cabo de cierto tiempo? Pues muy sencillo: mover la palanca y no oprimir el botón.
Como ves, Belén, así es como los animales aprenden a hacer peripecias en el circo. Si hacen algo que el entrenador quiere, se les da un premio (generalmente comida). Si hacen algo que el entrenador no quiere, se les castiga, Lamentablemente, muchas veces estos castigos son golpes, y por eso los defensores de animales no quieren que los animales sigan en los circos. Pero, más allá de la crueldad, lo importante acá es el condicionamiento operante. Los animales y las personas repiten determinadas conductas, dependiendo de cuál es la respuesta que sigue a cada una de esas conductas.
Por lo general, ni los animales ni las personas aprenden a hacer algo de un tirón. Muchas veces, para llegar a una conducta, debe aproximarse a ella a través de aprendizajes previos. Por ejemplo, quizás Skinner, antes de proponerse enseñar a la rata a mover la palanca, le pudo haber tratado de enseñar a permanecer en el rincón de la caja, donde estaba la palanca. Así, Skinner podría haber premiado a la rata con comida, al estar en ese rincón. Y, una vez que aprendió a estar en el rincón, Skinner pudo haberle dado comida sólo si movía la palanca. Los psicólogos llaman moldeamiento a este proceso de premiar o castigar conductas que progresivamente se van acercando a la conducta deseada.
Los premios y los castigos no son las únicas formas de modificar la conducta. Un premio sería un refuerzo positivo: al animal o la persona se le da algo adicional (por eso se llama positivo) para reforzar su conducta. Puede haber refuerzos primarios; éstos son los refuerzos que instintivamente nos satisfacen: comida, sexo, etc. Pero, hay también refuerzos secundarios; éstos son refuerzos que no tienen un valor intrínseco, pero que con todo, nos satisfacen, si a través del condicionamiento clásico, los asociamos con una experiencia placentera. Por ejemplo, cuando te aplauden tras pronunciar un discurso, no ganas nada intrínsecamente. Un aplauso no satisface ninguna necesidad instintiva. Pero, debido a tus experiencias previas, has asociado el aplauso con cosas positivas, y así, cuando oyes un aplauso, te sientes motivada, y eso aumenta las probabilidades de que vuelvas a pronunciar un discurso como ése.
Pero, el refuerzo también puede ser negativo: en vez de darle algo adicional, esa conducta se puede reforzar quitando algo molestoso. Por ejemplo, los diseñadores de coches incorporan un ruido muy molestoso cuando no llevamos el cinturón de seguridad. Cuando nos abrochamos el cinturón, el ruido cesa. Esto es un refuerzo negativo: quitando el ruido molestoso, se incrementa la posibilidad de que esa conducta vuelva a ocurrir.
Igualmente, el castigo consiste en administrar algo desagradable, de forma tal que esa conducta no se repita. Pero, también puede funcionar sencillamente al dejar de dar una recompensa a una conducta, de forma tal que, al no haber respuesta, la persona ya no tenga más motivación en continuar esa conducta. Eso, como en el condicionamiento clásico, se llama extinción.
Recuerdo que cuando eras niña, molestabas a tu hermana. Cada vez que lo hacías, tus padres te reprendían. Pero, extrañamente, volvías a molestar a tu hermana. Por aquella época, yo estudiaba psicología en la universidad, y les propuse a tus padres que, en vez de reprenderte, sencillamente te ignoraran cada vez que molestaras a tu hermana. Tus padres me hicieron caso, y al cabo de poco tiempo, tú dejaste ya de molestar a tu hermana. ¿Qué ocurrió acá? Muy sencillo: tu conducta se extinguió. Cada vez que tus padres te reprendían, tú captabas su atención. Y así, que tus padres te reprendieran se convirtió en un refuerzo positivo de tu conducta. En cambio, cuando tus padres te ignoraban, tu conducta no era reforzada. Al no haber respuesta ante tu conducta, sencillamente se extinguió. ¡Ojalá los padres entendieran esto mejor, y dejaran de malcriar inadvertidamente a sus hijos con sus regaños!
Skinner se tomó estas ideas muy en serio, y pensó que podía criar a sus hijos siguiendo estas recomendaciones. Él era de la idea de que la base de la educación es este sistema de refuerzos, y que si se usaban adecuadamente, se podría construir una sociedad utópica. Pero, como sabes, Belén, en este mundo traidor, hay mucho rumor malicioso. Y, a partir de estas ideas, empezó a correr el rumor de que Skinner hacía con sus hijos lo mismo que hacía con las ratas en la caja.
A decir verdad, Skinner construyó una caja (grande y cómoda) para una de sus hijas, de forma tal que sirviera como reemplazo de una cuna. Pero, no lo hizo para hacer experimentos. Lo hizo sencillamente para mantenerla a una mejor temperatura durante los inviernos. Con todo, los chismosos empezaron a decir que Skinner estaba entrenando a su hija como a la rata, dándole comida si movía la palanca, y aplicándole descargas eléctricas si apretaba el botón. Años después, los chismosos decían que la pobre hija de Skinner enloqueció y se suicidó, debido a la crueldad científica de su padre. Tonterías. La hija de Skinner tuvo una vida normal, y siempre tuvo afecto por su padre.
            La frecuencia con que se refuerza una conducta influye mucho en cuán persistente es. Podrías pensar que, cuanto más se refuerce, más firme se hará la conducta. Pero, no es necesariamente así. Si el entrenador quiere establecer por primera vez una conducta, entonces sí, lo mejor es reforzar esa conducta cada vez. A eso se le llama refuerzo continuo. Cada vez que la rata movía la palanca, Skinner le daría comida. Pero, una vez que la conducta ya está establecida, no conviene reforzarla cada vez para que la conducta persista. Pues, si por alguna circunstancia fortuita, la conducta no se refuerza, entonces el animal o la persona perderá la motivación para seguir con esa conducta, y se extinguirá.
            Por eso, para mantener la conducta una vez que ya se ha establecido, es mejor acudir a refuerzos esporádicos. Pueden ser refuerzos de intervalos fijos: en estos casos, Skinner daría comida a la rata cada cierto tiempo. O, pueden ser también refuerzos de razón fija: en estos casos, Skinner daría comida a la rata cada cuatro veces que mueva la palanca.
También puede haber refuerzos de intervalos variados. En estos casos, Skinner daría comida la rata en intervalos de, supongamos, un promedio de 5 minutos. Daría comida tras tres minutos, luego tras siete, luego tras cuatro, luego tras seis, y así sucesivamente. El promedio de tiempo se mantendría, pero la rata nunca sabría bien cuándo vendría la comida. Y, también puede haber refuerzos de razón variada. Skinner daría comida a la rata tras cuatro movimientos de la palanca, luego tras siete, luego tras tres, luego tras seis, y así, se mantendrían los cinco movimientos como promedio.
Los refuerzos de razón variada e intervalos variados son muy efectivos para mantener la conducta. Pues, extrañamente, la recompensa más poderosa no es tanto el premio en sí, sino la expectativa. Incluso, los científicos que estudian el cerebro, han descubierto que cuando se está a la expectativa de un premio, la dopamina (un químico asociado al placer) se eleva muchísimo más que cuando se recibe el premio propiamente. Y, para mantener la expectativa, lo mejor es usar refuerzos de razón o intervalos variados. Con esos refuerzos, no hay forma de predecir cuándo viene un premio, pero con todo, se mantiene la expectativa.
Lamentablemente, los casinos conocen esto muy bien. En los casinos, las máquinas tragaperras están programadas para premiar en un promedio de intentos. Pero, obviamente, el jugador no sabe bien cuándo viene el premio. El jugador sólo sabe que podría venir en cualquier momento. Esa expectativa lo mantiene atado a la máquina, y como la rata en la caja de Skinner, mueve continuamente la palanca.
Todos estos aprendizajes ocurren cuando la propia persona recibe refuerzos. Pero, ¿es posible aprender observando a otros recibir refuerzos por conductas particulares? Por supuesto que sí. Si observas que otra persona tiene una conducta, y como consecuencia de esa conducta, recibe un castigo, entonces tú misma aprenderás a no repetir esa conducta. Esto es la base del castigo ejemplar.
Hay muchas personas que se oponen a la existencia de las cárceles. Ellos opinan que las cárceles son lugares terribles, y que no contribuyen nada a la sociedad. Pero, las cárceles, por más terribles que sean (y ciertamente en muchos países deberían mejorarse sus condiciones), cumplen dos labores muy importantes: primero, restringen al criminal para que no vuelva a delinquir; y segundo, castigan al criminal para que, cuando salga, esté ya condicionado a no volver a delinquir. Pero, hay aún una tercera razón: la cárcel disuade de delinquir al resto de la sociedad. Viendo en otros la terrible experiencia que significa ir a la cárcel, una persona lo pensará dos veces antes de decidirse a robar un banco.

Lamentablemente, también se pueden aprender muchas cosas malas observando a los demás. Un psicólogo, Albert Bandura, se propuso estudiar esto, e hizo unos experimentos muy famosos. Bandura colocó a unos niños en una habitación. Ahí había un muñeco que, al ser golpeado, rebotaba, de forma tal que se le podía golpear muchas veces. Esos niños habían visto previamente un video de un adulto golpeando al muñeco.
Luego, Bandura colocó a otros niños en la misma habitación con el mismo muñeco, pero esta vez, el adulto en el video no golpeaba al muñeco, e incluso en algunas ocasiones, se mostraba gentil ante el muñeco. El grupo de niños que observó al adulto golpear al muñeco en el video, se mostró agresivo con el muñeco. En cambio, el grupo de niños que observó el video del adulto en actitud pacífica ante el muñeco, no mostraba interés en golpearlo.
A partir de esto, Bandura concluyó que el aprendizaje tiene una importante dimensión social. No es necesario enseñar una conducta directamente a alguien. Basta que esa persona la observe en los demás, para repetirla. Estos experimentos de Bandura han resultado muy controvertidos, porque muchos psicólogos opinan que la violencia en los medios de comunicación y videojuegos, puede volver más violenta a la gente. Del mismo modo en que los niños que ven a los adultos golpear al muñeco, terminan ellos mismos golpeando al muñeco; así quien vea una pelea de boxeo, termina queriendo golpear a los demás.
Debo advertirte que no todos los psicólogos están de acuerdo con esto. Hay quien opina que casi nadie termina como Don Quijote. Los seres humanos somos capaces de distinguir la ficción de la realidad, y así, ver una película de Rambo no va a convertir a nadie en un guerrero brutalmente violento. Incluso, algunos psicólogos opinan que la violencia en los medios podría más bien servir como forma de drenar nuestra propia violencia, sin necesidad de herir a los demás. Lo cierto, Belén, es que nadie sabe bien cuán responsables son los medios de comunicación cuando se trata de la violencia en el mundo. Sigue siendo un asunto debatido entre psicólogos.
En fin, toda esta historia que te estoy contando sobre los condicionamientos y los estímulos y las respuestas, básicamente asume que el aprendizaje funciona sobre la base del ensayo y el error, y que se trata exclusivamente de la conducta. Haces algo, te premian, y eso aumenta la probabilidad de que lo vuelvas hacer.
Pero, ha habido también psicólogos que opinan que, al menos en el caso de los primates, el aprendizaje es más complejo. No se trata solamente de moldear una conducta con refuerzos, a través del ensayo y el error. Más bien, el aprendizaje consiste en analizar en la mente un problema en su totalidad, y buscar una solución, en vez de ir pedazo por pedazo a través del ensayo y el error. Así, el aprendizaje es más un proceso cognitivo (es decir, en la mente) que conductual.
Para demostrar esto, el psicólogo Wolfgang Kohler hizo otro experimento muy famoso. Colocó a unos chimpancés en una habitación. Colgado del techo de esa habitación, había unos plátanos. Los chimpancés trataban de alcanzar los plátanos, pero estaban muy altos. Así pues, se frustraban. En vista de que no había recompensa, Skinner y sus colegas habrían concluido que los chimpancés habrían desistido.
Pero, Kholer se aseguró de colocar unas cajas en la habitación. Un chimpancé inteligente tomó las cajas, hizo un pilar con ellas, escaló el pilar, y obtuvo los plátanos. Lo importante acá, era que el chimpancé aprendió, no repitiendo una conducta a través del ensayo y el error dependiendo de los refuerzos. El chimpancé aprendió analizando la situación como un todo. Los psicólogos llaman a esta forma de aprender insight. El aprendizaje humano ciertamente tiene un aspecto conductual, y para eso, los refuerzos son muy efectivos. Pero, hay también un aspecto cognitivo que consiste, no tanto en conductas particulares, sino en esquemas mentales para resolver problemas.
Como ves, Belén, los animales han servido mucho para entender cómo aprenden los seres humanos. Entiendo perfectamente la preocupación de los activistas, pues ciertamente, los entrenadores en los circos pueden ser muy crueles. Pero, espero que entiendas que, aun siendo muy crueles, estos entrenadores conocen bien la psicología, pues sus técnicas de refuerzos se emplean diariamente en nuestra sociedad. De todas formas, un circo sin animales puede ser también muy entretenido, y espero que podamos volver en una futura ocasión. Se despide, tu amigo Gabriel.

No hay comentarios:

Publicar un comentario