要するに、これはランプの灯りが報酬がもらえない”停止の合図”であることを意味しています。
実験の結果、馬たちはこの課題に失敗し続けました。
彼らはランプの灯りがついていようがいまいが、無差別にカードに触れ続け、定期的にやって来るランプ消灯時の報酬を得ていたのです。
一見すると、馬たちはランプが停止の合図であることを理解していないように見えました。
しかし研究者たちは次の実験で、そうではない可能性を見出します。
最終の第3段階では、ランプが点灯しているときにカードに触れると「ペナルティ」が課せられました。
10秒間のタイムアウトが与えられ、その間はゲームに参加することも報酬をもらうこともできなくなったのです。
実験の結果は驚くべきものでした。
それまで無差別にカードに触れ続けていた馬たちは、ペナルティが導入された途端、急にランプの点灯時にはカードに触れなくなったのです。
そしてランプの消灯時にのみカードに触れて、正しい判断をするようになっていました。
これは一体どういうことでしょうか。
考える労力を減らすため、わざと「ルールを無視」していた⁈
研究者によると、このような動物実験で、動物たちが自らの行動を変えるにはある程度の学習時間が必要だといいます。
ところが馬たちは学習時間を要することなく、急激に自分たちの行動を変えていました。
これを受けて研究者らは「馬はそもそもゲームのルールをすべて理解していて、報酬を得るのに労力の少ない行動を戦略的に選んでいる可能性がある」と大胆な指摘をしています。
つまり、馬たちは「ランプ=停止の合図」も初めから分かっていたというのです。
例えば、ランプがついているときには報酬がもらえず、ランプが消えているときに報酬がもらえる場合。
馬たちがこのルールに従って、正しく報酬を得ようとするなら、まず「ランプが点灯している」ことを確認し、次に「この場合にカードに触れるとおやつはもらえない」ことを理解して、最後に「じゃあ触るのはやめておこう」と判断する一連の思考プロセスが必要です。