グッドボーイハートは人と犬が共に成長して調和することを目指すドッグトレーニング・ヒーリングスクールです。

トップページ
お電話でのお問い合わせ
お問い合わせフォーム

犬のごほうびトレーニングのしくみ:報酬が犬に与える影響について

ごほうびトレーニングとは、行動学の中では陽性強化トレーニングといわれるものです。
欧米から入ってきてここ15年くらいは大変流行り、現在でも犬のトレーニングの中に多く取り入れられているトレーニングの手法です。

今日はこのごほうびトレーニングのしくみと、行き過ぎたごほうびトレーニングが犬の行動や犬と人の関係に与える影響についての副作用についてお話しします。


まず、陽性強化トレーニング(ごほうびトレーニング)のしくみは次のとおりです。

犬がある行動をするとごほうび=(報酬)を得られる
報酬を得られる行動の回数は上昇する
という陽性強化という学習心理によって構成されています。

学習心理で説明するときには以下の公式となります。

条件刺激(特定刺激) → 犬が行動 → 報酬の出る合図(イイコとかグッドなど) → 報酬(ごほうび)

これを具体的な行動に当てはめてみましょう。

オスワリという → 犬が座る → イイコ(グッドやクリッカー音) → 報酬(オヤツなど)

陽性強化トレーニングを使って行動を固定させていたくためには、報酬の出る合図が行動の直後に必要だということと、報酬を不定期=ときどきにすることによって行動の強化を高めていくという手順で行われます。
報酬をときどきにする必要性は、パチンコ方式と考えてください。
実はごほうびは出たり出なかったりする方が行動を固定させていくことができます。
次はごほうびが出るかもしれないという予測を継続させることになり、パチンコ台に座り続けるのと同じような現象が犬にも起きるからです。

陽性強化は学習心理学者のBFスキナー氏がオペラント条件付けを発表したことでその認識が広まりました。
心理学の分野では陽性強化を正の強化といいます。行動学では陽性強化の法が一般的のようです。
人を含める動物の行動を学習心理というものを軸にして考える学習主義のさきがけにあたるでしょう。
動物の行動の要因が学習がすべてとはいわないものの、ごほうびと罰で動物を操作することの可能性を模索したことは、実際には現在でも模索し続ける学習心理トレーニングは今も研究が進められています。

陽性強化トレーニングが犬の世界に入り込んだ大きな理由は、それまでの犬のトレーニングが罰(正しくは陰性強化法)を用いて行われるものが多かったため、動物への罰を減らしたいという理由と、罰よりもごほうびの方が受ける動物の副作用が少ないとみられることからではないかと考えます。

30年以上前になりますが自分の経験の中でも、犬のトレーニングの現場で働き始めたときに使用していた道具はチョークチェーンといわれる鉄製の閉まる首輪でした。これは現在でも使用されている道具です。軍用犬の訓練で使われ始め、戦後日本の訓練施設で多く使われるようになりました。簡単に説明するとチョークチェーンは陰性強化というやはりオペラント条件付けのうちのひとつの学習心理を利用して、犬に行動をさせることを目的としています。

チョークチェーンなどの陰性強化の道具は一旦犬が不快に思う刺激を受けるため、使い方を間違えると虐待になりかねません。アメリカは日本よりもより多くの大型犬の問題行動が発生して咬みつきなどの事故も多発しているため、これらの行動を抑えるために一般の飼い主がチョークチェーンを誤って使用すれば、犬の行動は抑えられるどころかますます過剰となり問題が悪化することは道具のしくみと犬という動物の性質を理解できるものであればわかることです。

ところが事実は少し違います。道具の普及は早かったものの学習心理学を教える機関が十分でなかったことから、道具は誤って使われるようになりました。昔の訓練の現場は「見習い」といって、ただ長い時間経ってみているだけでその技術を奪い取れというようなものだったのです。もしかしたら今でも訓練士見習いという言葉はあるのかもしれません。ただ見ているだけなので、机上で学習心理のしくみについて説明をうけることもありません。道具の意味を知識として理解する機会も与えられていません。今は少し改善されているのかもしれませんが、チョークチェーンが広まった当時はその土台がなかったので、道具だけが広まり多くの犬たちは強い刺激を受け続けて苦しい思いをしたことでしょう。

そこに陽性強化トレーニングが広まりました。オペラント条件付けには強化の法則が二つあります。陰性強化、そして陽性強化です。強化とは行動の回数をあげていくということですから、犬に行動をおこさせたければ、陰性強化ではなくて陽性強化を用いたほうがいいと考えるのは自然な発想ですし実際効果も高いです。陽性強化はごほうび=報酬を使うため、強化処置を与える人を報酬と関連付けます。良い方に受け取れば人に近づきやすくなります。もちろん報酬には副作用があります。これについては最後に説明します。

陰性強化や陽性強化といったオペラント条件付けによる学習心理トレーニングが長い間継続しているのは、この分野での研究が大変進んでいることと、人が理解しやすいという側面があります。なぜなら、学習心理の過程は人と犬という異なる動物であっても、動物として共通のルールであるからです。

学習の基本的な過程は種を超えて共通する

この大原則が学習心理トレーニングを普及させた大きな理由でしょう。そして、その学習させたい行動とは、最初は基本的な生活のルールではなく、特殊な作業を行う作業犬のためだったことを忘れてはいけません。これらの学習心理トレーニングを受けて行動を見につけさせる必要があったのは、警察犬、盲導犬、競技会犬といった使役犬たちです。これらの犬は犬が日常的に行う作業として訓練を受けています。この中でも最も生活とは異質に行動しなければいけないのは競技会に出る犬たちです。服従訓練の競技などは日常生活で必要な動作とはちがって、その座り方伏せ方、脚側の仕方などが型にはまって美しくある必要があるため動作も細かく仕上げていく必要があります。逆に、警察犬や盲導犬といった犬の仕事は型にはまるとできず、応用を要求される日常生活に近いものです。盲導犬などはすばやく座るよりもゆっくり座ってもらったほうがいいような仕事ですから学習心理トレーニングもトレーニングのうちのわずかにしか当てはまりません。

これらの特殊犬に使用されていた学習心理トレーニングはそのうち家庭犬のトレーニングにも応用されることになりました。ですが、家庭犬のトレーニングに学習心理トレーニングを過剰にいれてしまうことには大きな副作用が潜んでいます。
犬に特定の行動を学習させるということは、次に起きる行動を予測もしくは誘導し、行動をコントロールすることです。
犬にオスワリを陽性強化で教えるときには、オスワリをしたら声で強化、そのあと報酬を与えたり与えなかったりします。オスワリを知らない犬にはオスワリの合図のあとに犬をオスワリの行動をさせるように誘導する必要があります。犬がオスワリすることが予測できて(誘導できて)はじめてこのトレーニングは成立します。

犬は行動をしたらごほうびをもらえていい事が起こるのだから、陽性強化には何の問題もないように思えますが、実際には陽性強化の多用は犬の行動と性質に影響を与えてしまいます。

例をあげましょう。
例1
オヤツを使ってオスワリ、マテを教えた
オスワリマテができるようになったはずなのに
インターホンがなるとオスワリマテができない

例2
オヤツをつかってオスワリを教えた
オヤツを持っているとオスワリの合図に応える
オヤツを持っていないとわかるとオスワリはしない

どちらもよく起きる例です。
例2のオヤツをもっていないとオスワリしない犬の場合には、陽性強化トレーニングをされている方なら、報酬は時間差で与えるルールや、最初の条件刺激の中にオヤツも入ってしまった結果であるため、そもそもトレーニングとして失敗していることを気づくはずです。

例1のインターホンのとき犬がオスワリをしないのは、犬にとっては報酬を得ることよりも、環境に影響がある警戒モードの方が優先するため当然の結果であるといえます。オスワリ=報酬と条件づけすぎたために起きる間違いです。

報酬を使ったトレーニングの副作用はもっとひどい状態になってあわられます。
陽性強化は人と報酬を結びつけるために人に対して関心を示しやすくなる事が利点のひとつになっています。これは作業犬のトレーニングから家庭犬のしつけに転向したときに自ら感じたことです。家庭犬のしつけの難しさは、犬の人に対する関心の低さです。特に問題行動を生じている落ち着きをなくし始めているような状態では、人の存在がストレスとなり人を回避しようとするため人の呼びかけに対しても応答がなくなっていきます。陽性強化で食べ物を使うと食べ物の存在が関心をひきつけるようになり、結果教えたいことが早く教えられるという利点は確かにあります。

ただこのことが裏を返せば陽性強化トレーニングの欠点にもなります。人=報酬による人に対する過剰な関心は依存となり犬の行動をコントロールしやすくなります。人に依存していて人の要求に常に応えようとする犬は、傍から見れば飼い主さんをずっとみている問題ない犬であることは間違いありません。ただ、そのことで犬が失うものは犬の自律性です。
犬は人がいないと生きていけません。食べるものを獲ることもできないからです。社会的には人が飼わない犬は存在することを許されていないという理由もあります。ただ他者がいないと生きていかないのは自分も同じです。毎日食べているものを自分で作ることすらできませんし、着るものだって通信手段や移動の手段であれすべて他者に頼っています。そうした動物も自律性というのをもっています。犬にも自律性があります。それを育てる環境はなかなか整わないというのが現実ではありますが、はじめから犬の自律性について考えないというのはフェアではないと思います。犬の自律性について最もわかりやすい例は、犬の社会的行動についての多くが誤解されているということです。一昨日のブログに書いた子犬に応答しない成犬の例も自律性を失った犬の行動の例です。


同時に失ってしまう大きな損失は、飼い主が犬という動物について理解する機会を失うということです。
インターホンでマテやハウスに入ることを犬が優先させるためには、人との特定の関係を結ぶ必要があります。これは学習心理によって行われるのではなく、犬の習性や本能の理解によって行われる行動です。

犬の行動と心理は結びついています。行動は心理の働きをふくみ、心理(気持ち)を知るきっかけになるのです。
行動=心理 つまり 行動は心理なのです。
ところが、学習心理は動物の心理と等しくありません。

なぜなら、次の法則があるからです。

動物(犬)の行動は同種の動物(犬)に対するときと
異種(人)や非生物(もの)に対するときでは異なる
動物は種ごとに異なる世界を持っている

これは最も大切な真実です。

陽性強化法を犬のトレーニングに用いるなら、オスワリという言葉と座る動作の関連付け、フセマテという言葉とその動作の関連付けにとどめ、社会性を培う経験学習とは区別されるといいでしょう。陽性強化といっても依存性の
高まる食べものではなく他のものを使ってもいいのです。誘導には手やオモチャを使えますし、依存性の低いものの方が副作用も低く報酬の予測もおこりにくくなります。合図と行動の関連付けがおわったら、あとは生活のルールに取り入れて制御の必要に応じて合図を使っていきます。

これらの合図いに反応させることは、犬に行動の制限をかけなければいけないときに行うものです。
その行動の制限すら犬への理解を脇においてしまえば、本末転倒になってしまいます。
犬を飼うということは異なる種の動物の不思議にふれる最大に楽しい時間です。そして犬は他のどのような動物とも違う人との関係を持っています。その関係性は犬の方からではなく、人の主体性によってつくられるものです。わたしたちが犬とどのような関係を気づいていきたいのか、まだ迷っている方も分からない方も、まずは犬の行動を理解することからはじめてみてはいかがでしょうか。


OLYMPUS DIGITAL CAMERA