講座 心理学概論 5 学習心理学 4 道具的条件付け タイプと説明理論

 子どもの頃、何かいたずらをして親に例えばおやつを「お預け」にされた体験をお持ちの方も少なくないであろう。  

 強化理論では以下の4つの強化事態を区別する。  

 正の強化・・・強化子が与えられる 例 反応するとお菓子がもらえる  

 負の強化・・・罰子がお預けにされる 例 反応すると電撃を回避できる  

 正の罰・・・・罰が与えられる 例 反応するとげんこつを食らう  

 負の罰・・・・強化子がお預けにされる 例 反応すると休みがもらえない  

 さて、言葉の上では明快に見える強化と罰であるが、マゾヒストにとっては「げんこつを食らう」ことが常人と違って「正の強化子」であるような場合があるように、それが罰か強化子かを定義することは難しい。  

 スキナーは、反応を増やすものが強化子であり、反応を減らすものが罰子であると考えた。しかしこれでは、「やってみて、どうか」になり、予めそれが強化子か罰子かを知ることは、原理上不可能になってしまう。  

 ハルは、彼の「動因低減説」にしたがって動因を低減するものが強化子だと考えた。  

 メールは、場面を越えて随伴した強化子は強化子として有効である、という「場面間転移性の原理」を唱えた。しかしいずれにも、そうだとすると例外が生じてしまう。ハルに関してはマゾヒストの例が該当するだろうし、メールに関しては夏の25℃と冬の25℃では報酬価が変わるだろうと指摘してしまえばたちまち意味を失ってしまう。このように、それが報酬か罰かは相対的なものである。  

 この点にいち早く着目したのはD.プレマックである(この名前は覚えておいて欲しい。発達心理学「心の理論」のところで再びお目にかかる名前だからである)。彼は報酬と罰を次のように定義した。「自由に反応できる場合、より生起確率の高い反応は、より生起確率の低い反応を強化する」「同様に、より生起確率の低い反応は、より生起確率の高い反応を罰することができる」。  

 これが反応相対性の観点からより洗練されたのがアリソンとティンバーレイクの「反応制限説」である。この説では「生起確率」に代わって「反応制限」と言う概念が中核にあって「自由反応事態よりより反応制限された反応はより反応制限されていない反応を強化することができる」「より反応制限されていない反応は反応制限された反応を罰することができる」と言う表現に変わっている。たとえば、普段2時間勉強して2時間スマホゲームをするのが、勉強を3時間しないとスマホゲームを30分できないと言うルールの導入によって、スマホゲームは高価値化していっそう熱心に勉強するだろうと言うような理解ができるだろう。

 ただ、この「反応制限説」にも理論上最低3つの問題点がある。一つ目に、「学習の形式で学習のモチベーションは完全に理解できるのか」、二つ目に、「学習は必ずこのような対比状況的に存立しうるのか」、最後に「学習には“絶対的な第三者”がいると言う理論的な仮定に問題はないのか」である。読者諸氏は、ことの外常に学習のような微視的現象のパラダイムには敏感かつ慎重であることに留意願いたい。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です