Neue Forschungsergebnisse zeigen, wie Dopamin im Gehirn Tiere dazu bringt, Verhaltensweisen zu erkennen und zu verbessern, die zu einer Belohnung führen. Diese Forschung verknüpft spezifische Verhaltensweisen mit der Dopaminfreisetzung und hat wichtige Auswirkungen auf die Verbesserung von Lernprozessen in den Bereichen Bildung und künstliche Intelligenz.

Belohnungen verstärken nicht nur bestimmte Verhaltensweisen, sie können auch das Gesamtmuster unseres Verhaltens schnell verändern.

Stellen Sie sich vor, Sie bringen einem Hund das Apportieren bei. Sie werfen einen Ball, Ihr Hund sprintet hinterher, nimmt den Ball auf und rennt zurück. Dann geben Sie dem hechelnden Welpen eine Belohnung. Doch jetzt kommt der eigentliche Trick für Ihren Hund: Finden Sie heraus, welcher Link die Belohnung erhält. Wissenschaftler nennen dies das „Kreditvergabeproblem“ im Gehirn. Dies ist eine grundlegende Frage zu unserer Fähigkeit zu verstehen, welche Maßnahmen zu positiven Ergebnissen führen.

Dopamin, ein wichtiger chemischer Botenstoff im Gehirn, spielt in diesem Prozess eine entscheidende Rolle. Doch wie genau das Gehirn bestimmte Verhaltensweisen mit der Ausschüttung von Dopamin verknüpft, bleibt unklar.

Am 13. Dezember veröffentlichten Wissenschaftler des Allen Institute, des Zuckerman Institute for Mind, Brain and Behavior an der Columbia University, des Champali Mod Center for the Unknown und des Seattle Children's Research Institute in der Zeitschrift Nature eine Studie, die dieses Rätsel enthüllte. Die Studie zeigt, wie Dopamin nicht nur Belohnung signalisiert, sondern Tiere auch durch Versuch und Irrtum dazu anleitet, bestimmte Verhaltensweisen zu finden, die zu einer Belohnung führen.

Interessanterweise zeigt die Forschung auch, dass das Belohnungssystem des Gehirns alle Bewegungen und Verhaltensweisen eines Tieres schnell und dynamisch verändern kann. Dies unterstreicht eine komplexe Lernstrategie, bei der das Verhalten nicht nur verstärkt, sondern durch Erfahrung aktiv geformt und verfeinert wird, sagte Rui Costa, MD, leitender Autor der Studie.

„Wenn man Verhalten verstärkt, betrachten wir es oft als nur eine Aktion, aber in Wirklichkeit verändert man die gesamte Verhaltensstruktur“, sagte Costa, Präsident und CEO des Allen Institute. „Und was wirklich überraschend ist, ist, wie schnell diese Veränderung erfolgt.“

Entschlüsselung, wie Dopamin das Lernen beeinflusst

Um diese Erkenntnisse aufzudecken, arbeitete das Forschungsteam mit Ingenieuren und Neurowissenschaftlern am Shambali Mod Center for the Unknown zusammen, um ein neuartiges „Closed-Loop“-System zu entwickeln, das spezifische Verhaltensweisen bei Mäusen mit der Echtzeitfreisetzung von Dopamin verknüpfen kann. Forscher statteten Mäuse mit drahtlosen Sensoren aus, um ihre Bewegungen in einem einfachen, kontrollierbaren Raum zu verfolgen. Anschließend speisten sie diese Daten in einen maschinellen Lernalgorithmus ein, der die Aktionen in verschiedene Gruppen einteilte. Anschließend nutzten die Forscher die Optogenetik, eine Methode zur Steuerung von Neuronen mit Licht, um Dopamin-Neuronen zu stimulieren, während die Mäuse vordefinierte „Zielaktionen“ ausführten.

Sie fanden heraus, dass die Mäuse ihr Verhalten schnell änderten, nachdem Dopamin freigesetzt wurde. Sie erhöhen zunächst nicht nur die Häufigkeit der Zielaktion, sondern auch die Häufigkeit ähnlicher Aktionen und Aktionen, die Sekunden vor der Dopaminausschüttung stattfinden. Gleichzeitig nehmen zielferne Aktionen rapide ab. Mit der Zeit wurde diese Verfeinerung immer präziser und die Mäuse konzentrierten sich immer mehr auf die genauen Aktionen, die zur Freisetzung von Dopamin führten.

Die Studie untersuchte auch, wie Mäuse eine Abfolge von Aktionen lernen, und enthüllte einen Schlüsselprozess, der einer Zeitreise in die Vergangenheit ähnelt, um zu verstehen, was zu einer Belohnung führt. Wenn Dopamin-auslösende Aktionen durch längere Intervalle getrennt wurden, lernten die Mäuse langsamer. Dies deutet darauf hin, dass es für die Mäuse umso schwieriger ist, die Abfolge der Aktionen mit einer Belohnung zu verknüpfen, je länger die Wartezeit zwischen den Aktionen ist. Im Wesentlichen wird die Handlung vor der Belohnung schnell gemeistert und verbessert, während die Handlung davor nach und nach verfeinert wird. Dieser „Zurückspulen“-Prozess verstärkte das Verhalten der Mäuse und half ihnen, nach und nach herauszufinden, welche genauen Aktionen und Sequenzen Belohnungen hervorbrachten.

Weiterreichende Auswirkungen auf Bildung und künstliche Intelligenz

Die Ergebnisse könnten Auswirkungen auf so unterschiedliche Bereiche wie Bildung und künstliche Intelligenz (KI) haben, sagte der Hauptautor der Studie, Dr. Jonathan Tang, Assistenzprofessor an der UW Medicine-Pädiatrie und dem Seattle Children's Research Institute. Beispielsweise könnte es besser mit den angeborenen Lernprozessen unseres Gehirns vereinbar sein, im Unterricht zu experimentieren, Fehler zu machen und schrittweise Verbesserungen zuzulassen.

Im Bereich der künstlichen Intelligenz können diese Erkenntnisse zu komplexeren und effizienteren Lernsystemen führen. Indem wir biologische Lernprozesse besser nachbilden, können wir künstliche Intelligenz schaffen, die sich besser an neue Daten und Situationen anpassen kann.

Diese Studie gibt uns ein tieferes Verständnis dafür, wie unser Gehirn durch Versuch und Irrtum lernt und sich anpasst – egal, ob Sie ein Wissenschaftler oder ein Jungtier sind.

„Wir halten vieles davon für selbstverständlich, wie die Dinge funktionieren, einschließlich der Kreditvergabe“, sagte Tang. „Aber wenn man sich wirklich damit beschäftigt, erkennt man die Komplexität. Deshalb betreiben Menschen Wissenschaft: um herauszufinden, was vor sich geht.“

Zusammengestellte Quelle: ScitechDaily