Lernen ohne Belohnung

Menschen und Tiere lernen schneller, wenn die Folgen ihrer Handlungen unmittelbar sind. Doch wie kommt das Gehirn zurecht, wenn dies nicht der Fall ist?

24.03.2016 · Leibniz-Institut für Neurobiologie · News

„Menschen und Tiere lernen schneller, wenn die Folgen ihrer Handlungen unmittelbar sind. Zeitliche Verzögerungen in der Abfolge von Ursache und Wirkung verunsichern Mensch und Tier und erschweren den Lernprozess. Eine fundamentale Lernleistung unseres Gehirns besteht indes darin, auch in solchen komplexeren Situationen ein Ereignis korrekt mit der verursachenden Handlung zu verknüpfen. Es existieren darüber hinaus noch weitere, parallel ablaufende Mechanismen, auch solche, die dieses Ursache-Wirkung-Prinzip nicht berücksichtigen. Diese ganz verschiedenen Lernprozesse finden zwar in jeweils unterschiedlichen Hirnarealen, jedoch gleichzeitig statt.

Das sind die Forschungsergebnisse von Neurowissenschaftlerinnen und
–wissenschaftlern einer gemeinsamen Forschergruppe vom Center for Behavioral Brain Sciences CBBS der Otto-von-Guericke-Universität Magdeburg und der Universität Oxford. Sie wurden soeben im Journal NEURON veröffentlicht, einer der renommiertesten neurowissenschaftlichen Fachzeitschriften weltweit.

Das interdisziplinäre Team aus Neurowissenschaftlern und Ingenieuren hat dafür in Studien die Auswirkungen zeitlicher bzw. inhaltlicher Verzögerungen von Ursache und Wirkung auf Lernprozesse untersucht, also Szenarien, in denen die Handlung eines Probanden nicht unmittelbar zum Erfolg führt. Die Wissenschaftler und Wissenschaftlerinnen wollten so herausfinden, welche Strategien Menschen finden, diese Herausforderung zu meistern und sowohl mit als auch ohne Anwendung korrekter Kausalzusammenhänge einen Lernzuwachs zu erreichen.

„Wir haben uns die Frage gestellt, wie unser Gehirn mit solchen Unsicherheiten und Uneindeutigkeiten umgeht, wie es trotzdem herausfindet, welche Handlungen zum Erfolg führen und welche nicht“, erläutert der Neurowissenschaftler Dr. Gerhard Jocham, der die Forschergruppe am CBBS leitet. „Es gibt mehrere Mechanismen im Ursache-Wirkung-Lernen“, so Jocham. „Der wohl effizienteste Prozess nutzt vorhandenes Wissen aus und wird als kontingentes Lernen bezeichnet: Wenn der Kuchen angebrannt ist, liegt das eher daran, dass die Backzeit zu lange war, als an der Menge Zucker im Teig.“ Wenn solches Wissen nicht verfügbar sei, kann alternativ die zeitliche Nähe zwischen Handlung und Ergebnis genutzt werden: Wenn das Licht unmittelbar angeht, nachdem der Schalter gedrückt wurde, so komme diese Handlung als wahrscheinlicher Auslöser in Frage. Auch Statistik könne Probanden helfen, Ursache und Wirkung miteinander zu verknüpfen, so der Neurowissenschaftler: Der Elfmeterschütze beim Fußball könne feststellen, dass er meistens trifft, wenn er flach in die linke Ecke schießt.

Gesunde Menschen und auch Affen seien so effizient im eindeutigen Ursache-Wirkung-Lernen, dass ihre Entscheidungen in Standard-Laborsituationen komplett durch diesen Mechanismus dominiert würden, so Jocham. „Wir konnten in unserer Studie aber zeigen, dass gesunde junge Menschen in einer komplexeren Situation zusätzlich die oben angesprochenen Mechanismen anwendeten: Ohne es zu wissen, nutzten sie zeitliche Zusammenhänge sowie im Gehirn gespeicherte statistische Erfahrungen.“ Diese einfachen Mechanismen können oft nützlich sein, versagten allerdings dann, wenn sich die Umwelt schnell ändert oder Belohnungen zeitlich verzögert eintreten. Unter diesen Umständen ist das kontingente Lernen für erfolgreiche Entscheidungen unabdingbar.

Die Wissenschaftlerinnen und Wissenschaftler konnten das kontingente Lernen mit der Aktivität in einem bestimmten Hirnareal, dem Orbitofrontalkortex, in Verbindung bringen. Patienten und Patientinnen mit Schädigungen in diesem Bereich würden daher oft irrationale Entscheidungen treffen und hätten Probleme, sich an geänderte Bedingungen anzupassen. Die Neurowissenschaftler schließen daraus, dass diese Irritation durch die vermehrte Nutzung alternativer Lernmechanismen zustande kommt, die nicht über den Orbitofrontalkortex vermittelt werden.

Die vollständige veröffentlichte Studie finden Sie unter http://dx.doi.org/10.1016/j.neuron.2016.02.018

Das Center for Behavioral Brain Sciences CBBS ist die Dachstruktur des Forschungsschwerpunktes Neurowissenschaften an der Universität Magdeburg. Wissenschaftlerinnen und Wissenschaftler aus sechs Fakultäten, dem Leibniz-Institut für Neurobiologie und dem Zentrum für Neurodegenerative Erkrankungen DZNE erforschen Lernprozesse, Gedächtnisbildung und die Motivation zielgerichteten Handelns. Das Forschungszentrum hat den Status eines Leibniz-WissenschaftsCampus. Mehr Informationen unter http://www.cbbs.eu/

Kontakt

Sophie Ehrenberg
Presse
Leibniz-Institut für Neurobiologie
Tel.: +49-391-6263-93381
sophie.ehrenberg(at)lin-magdeburg.de

ww.lin-magdeburg.de