肯定的な補強の研究

Positive Reinforcement Studies
JoVE Science Education
Behavioral Science
A subscription to JoVE is required to view this content.  Sign in or start your free trial.
JoVE Science Education Behavioral Science
Positive Reinforcement Studies

23,284 Views

07:06 min
April 30, 2023

Overview

オペラント条件づけを使用して動作の学習を研究します。学習のこのタイプでは、報酬や罰である結果と動作を関連付けます。 結果が報酬の場合、それは目的の動作の強化に します。 強化アプローチの 1 つのタイプは肯定的な補強、人工、自然、または社会的強化子と、行動が報われる場所です。研究ツールとして肯定的な補強を使用しては、さまざまな動作に関連付けられている神経学的機能についての重要な詳細を引き出すことができます。

このビデオは、男の座るには犬の訓練の例を使用して補強研究の背後にある概念をレビューします。次に、我々 は行動の研究者によって一般的に使用される肯定的な補強の汎用的なプロシージャを見てください。これは、報酬 (食品) を取得する動作 (レバーを押して) を実行する訓練を齧歯動物を含みます。 最後に、特定のアプリケーションは、科学者が肯定的な補強を使用して動作を理解する方法をデモンストレーションします。

Procedure

肯定的な補強は人間および動物の行動に影響を与える重要な要因です。科学者たちは、この現象を「オペラント条件づけ」と呼ばれる学習種類を学ぶ簡単に言えば、オペラント条件づけ、具体的な結果に関連付けることによって動作を図形します。肯定的な補強の動作が実行されるとき、結果報酬であります。これは動作は、将来的に再び発生する可能性が高まります。

このビデオでは、肯定的な補強、一般化された実験および関連アプリケーションのいくつかの原則をカバーしています。

どのように肯定的な補強の議論から始めましょう作品します。私たちは座るには犬を訓練している男の例を使用してこれを行うでしょう。当初、犬に長い時間がかかる人は、座っている犬を指示する場合、彼は座っているは、男は彼に骨を提供します。ここでは、座って、正の強化子の報酬に励まされの動作です。今犬は、コマンドを使用して、正の強化子を関連付けることを学ぶし、動作を学ぶ。報酬は骨を知っているよう男は言う「座る」次回犬これを行うに時間はかかりません。これは負の強化子として機能するひもからの圧力などの負の刺激の除去による動作の強化、負の強化から異なります。この場合、犬は、コマンドに負の強化子を関連付けることを学ぶし、動作を学習します。今犬が鎖からの圧力を避けるためにすぐに座っている知っています。

強化は動物にだけ制限されません。私たちは、私たちの行動に影響を与える肯定的な補強剤の多くの種類があります。具体的な補強剤は、食品、お金と薬やアルコールがあります。また、テストで良い成績を取得するなど、自然の一端があります。また、クラスの前に「良い仕事」を学生に伝える先生に代表される社会の一端があります。

肯定的な補強の背後にある神経は、脳のドーパミン中心に基づいています。ドーパミンは、報酬を求めての行動に関連付けられている神経伝達物質です。報酬は、予想よりも大きい場合は、ドーパミン神経細胞の発火が増加し、その結果、報酬のための欲求を高めます。

肯定的な補強の背後にある原理のアイデアがあるので、この現象を勉強して実験を実行する方法を見てをみましょう。

これらの種類の実験の目標は自主的な動作、レバーを押すと報酬を関連付けるなど、結果と関連付ける動物です。マウスやラットもハトなどの多くの異なった動物を使用して、この現象を研究できます。

この実験では、換気扇と防音ボックス オペラントの室は。2 つのレバー 1 つのアクティブと非アクティブのいずれかチャンバーを装備するここでは、-中央食品ディスペンサーのどちら側に配置されます。刺激光が各レバーの上にあるし、食品ペレットディスペンサーがチャンバー外に配置されます。

動物は、報酬を受け取るために商工会議所で行動応答を実行する必要があります。最初に、動物は、新しい環境に慣れるようにする商工会議所に配置されます。レバー押し行動を強化するために押されると、報酬を提供する 1 つのアクティブなレバーと押されたとき報酬を提供しない非アクティブのレバーを持っていることが重要です。動物より多くの報酬を得るために多くの場合より多くのアクティブなレバーをヒットするについて説明します。報酬あたりレバー押し数を調整もできます。

今、肯定的な補強の実験を実行する方法を知っていると、科学者は神経学的機能に関する貴重な情報を学ぶこのパラダイムを使っていくつかのアプリケーションを見てみましょう。

研究者は、行動強化の強度と濃度の関係を決定するもう 1 つの異なる濃度をテストできます。この実験では、科学者は動物学ぶ糖溶液の投与量を取得するためにレバーを押し、オペラント商工会議所に慣れるまでラットを許可します。別の砂糖の濃度を使用すると、補強に濃度の影響を決定するためにして、それぞれのレバー押し数が記録されます。これは高い糖濃度がレバー押し行動を補強するより大きい機能であることを示します。

肯定的な補強のための別のアプリケーションは、注意をテストします。ここでは、5 つの開口を持つ室にネズミを並べて行動研究者の肯定的な補強を使用して注意と衝動のコントロールを研究します。実験は、ラットが商工会議所の反対側に位置する食品ペレットを得るために絞り値と鼻を突く必要があるときに光が点灯しているように設計されています。もっと注意ラット照らされた開口部にそれを受け取る以上の食品ペレットを支払います。

最後に、肯定的な補強の実験は、学習における神経活動の決定に使用されます。本研究ではハトに正しく 2 つの刺激を区別し、補強食品の報酬を受け取るためにタップして画面を学ぶ最初訓練されます。次に、神経活動を測定するために電極がハトの頭に接続されている、行動のタスクが実行されます。肯定的な補強学んだ応答中に発火神経科学者が研究するをできるように、必要な動作を引き出すことができます。

肯定的な補強のゼウスの概要を見てきただけ。このビデオは肯定的な補強の原則の説明、一般化された実験を説明し、いくつかの現在のアプリケーションの見直し。心理学と神経科学肯定的な補強の背後にある理解することができます科学者が人間の意思決定に影響を与える要因を把握します。いつも見てくれてありがとう!

Transcript

正の強化は、人間や動物の行動に影響を与える重要な要素です。科学者は、「オペラント条件付け」と呼ばれる一種の学習を使用してこの現象を研究しています。簡単に言えば、オペラント条件付けは、行動を特定の結果に関連付けることによって行動を形作ります。正の強化の場合、行動が行われたときの結果は報酬です。これにより、その動作が将来再び発生する可能性が高くなります。

このビデオでは、正の強化の原理、一般化された実験、および関連するアプリケーションの一部について説明します。

まず、ポジティブ強化がどのように機能するかについて説明します。これは、犬が座るように訓練しようとしている男性の例を使用して行います。最初、男性が犬に座るように指示すると、犬は長い時間がかかりますが、彼が座ると、男性は彼に骨を提供します。ここで、座ることは報酬によって奨励される行動であり、それは正の強化子です。今、犬は正の強化子をコマンドに関連付けることを学び、行動を学習します。次に男性が「お座り」と言ったとき、犬はご褒美が骨であることを知っているため、そうする時間が短くなります。これは、負の強化子として機能するリードからの圧力などの負の刺激を取り除くことによって行動が強化される負の強化とは異なります。この場合、犬は負の強化子をコマンドに関連付けることを学び、行動を学習します。これで、犬はリードからの圧力を避けるために素早く座ることを知ることができます。

強化は動物だけに限定されません。私たちにとって、行動に影響を与えるポジティブ強化子には多くの種類があります。より具体的な強化子には、食べ物、お金、薬物やアルコールなどがあります。また、テストで良い成績を取るなど、自然な強化子もあります。さらに、教師がクラスの前で生徒に「よくやった」と言うことに代表される社会的強化子があります。

正の強化の背後にある神経生理学は、脳のドーパミン中枢に基づいています。ドーパミンは、報酬を求める行動に関連する神経伝達物質です。報酬が予想よりも大きい場合、ドーパミンニューロンの発火が増加し、その結果、報酬への欲求が高まります。

正の強化の背後にある原理を理解したところで、この現象を研究する実験を行う方法を見てみましょう。

これらのタイプの実験の目標は、レバーを押すことを報酬に関連付けるなど、自発的な行動を結果に関連付けるように動物を訓練することです。この現象を研究するために、マウス、ラット、さらにはハトなど、さまざまな動物を使用することができます。

この実験では、換気扇を備えた防音ボックスであるオペラントチャンバーを利用しています。ここでは、チャンバーには2つのレバー(1つはアクティブ、もう1つは非アクティブ)が中央のフードディスペンサーの両側に配置されています。刺激ライトは各レバーの上にあり、食品ペレットディスペンサーはチャンバーの外側に配置されています。

動物は報酬を受け取るためにチャンバー内で行動反応を実行する必要があります。まず、動物は新しい環境に慣れるためにチャンバーに入れられます。レバーを押す動作を強化するためには、一度押すと報酬が得られるアクティブなレバーと、押されても報酬が得られない非アクティブなレバーを用意することが重要です。動物は、より多くの報酬を得るために、アクティブレバーをより頻繁に押すことを学びます。報酬ごとのレバー押下回数も調整できます。

正の強化実験を行う方法がわかったところで、科学者がこのパラダイムを使用して神経機能に関する貴重な情報を得ているいくつかのアプリケーションを見てみましょう。

研究者は、強化子のさまざまな濃度をテストして、行動強化の濃度と強度との関係を判断できます。この実験では、科学者たちはラットがオペラントチャンバーに慣れることを許可し、そこで動物は砂糖溶液の投与量を得るためにレバーを押すことを学びます。異なる糖濃度が使用され、それぞれについて、強化に対する濃度の影響を判断するために、レバープレスの数が記録されます。これは、糖濃度が高いほど、レバーを押す動作を強化する能力が高いことを示しています。

正の強化の別のアプリケーションには、注意力のテストが含まれます。ここでは、5つの開口部を持つチャンバーにラットを配置することにより、行動研究者は正の強化を使用して注意とインパルス制御を研究します。この実験は、光が照らされたときに、ラットが開口部に鼻を突っ込んで、餌のペレットをチャンバーの反対側に配置する必要があるように設計されています。ラットが照らされた開口部に注意を払うほど、ネズミはより多くの食物ペレットを受け取ります。

最後に、正の強化実験は、学習中の神経活動を決定するために使用されます。この研究では、ハトはまず2つの刺激を正しく区別するように訓練され、強化食物の報酬を受け取るためにどちらの画面をタップするかを学習します。次に、神経活動を測定するために、ハトの頭に電極を取り付け、行動課題を行います。正の強化は必要な行動を引き出すのに役立ち、科学者は学習した反応中のニューロンの発火を研究することができます。

JoVEのポジティブ強化の紹介をご覧になりました。このビデオでは、正の強化の原理を取り上げ、一般化された実験を説明し、現在のいくつかのアプリケーションをレビューしました。正の強化の背後にある心理学と神経科学を理解することは、科学者が人間の意思決定に影響を与える要因を理解するのに役立ちます。いつものように、ご覧いただきありがとうございます!