操作犬訓練
小狗

操作犬訓練

狗訓練中使用了不同的方法,有時很難知道哪一種最適合您和您的狗。 如今,越來越多的人使用 操作性學習. 

如此不同的方法……

在犬類學中,有大量的訓練方法。 粗略地說,我將它們分為兩組:

  • 狗是學習過程中的被動參與者(例如,經典的、眾所周知的機械方法:為了教狗“坐下”命令,我們將狗按在臀部上,從而引起一些不適和激怒狗坐下)
  • 狗是訓練的積極參與者(例如,我們可以教狗同樣的“坐下”命令,方法是給狗看一塊零食,然後將手掌放在狗的頭頂區域,刺激它抬起頭並,因此,將身體背部降低到地面)。

 機械方法給出了相當快的結果。 另一件事是,頑固的狗(例如梗類犬或本土品種)受到的壓力越大,休息得越多:你按壓臀部,狗就會彎腰以免坐下。 另一個細微差別:具有更靈活神經系統的狗通過這種方法很快就會表現出所謂的“習得性無助狀態”。 狗明白“向右一步,向左一步就是執行”,如果它犯了錯誤,它們會立即開始糾正,而且往往相當不愉快。 結果,狗害怕自己做決定,它們在新的環境中迷失方向,不准備採取主動,這是很自然的:它們習慣了主人為它們決定一切。 我不會評論這是好還是壞。 這種方法已經存在很長時間了,並且至今仍在使用。 以前,由於缺乏替代方案,工作主要是通過這種方法建造的,並且我們得到了也在武裝部隊中工作的好狗,也就是說,在真正困難的情況下可以信賴。 但犬隻學並沒有停滯不前,在我看來,不利用新研究成果、學習新知識並將其付諸實踐是一種罪過。 事實上,凱倫·普賴爾(Karen Pryor)開始使用的操作方法已經在犬類學中使用了相當長的時間。 她首先將其用於海洋哺乳動物,但該方法適用於所有人:它可以用來訓練大黃蜂將球射入球門或金魚跳過籃筐。 即使這種動物是通過操作方法訓練的,那麼對於狗、馬、貓等我們能說什麼呢?操作方法與經典方法的區別在於,狗是訓練過程中的積極參與者。

什麼是操作犬訓練

早在 30 世紀 19 年代,科學家愛德華·李·桑代克 (Edward Lee Thorndike) 就得出這樣的結論:在學習過程中,學生是積極的主體,積極鼓勵做出正確的決定,這樣就能快速而穩定地得到結果。 他的經歷被稱為桑代克的問題箱。 該實驗包括將一隻飢餓的貓放入一個帶有格子牆的木箱中,它可以看到盒子另一側的食物。 動物可以通過踩下盒子內的踏板或拉動槓桿來打開門。 但貓首先試圖將爪子伸進籠子的柵欄來獲取食物。 在經歷了一系列的失敗之後,她檢查了裡面的一切,進行了各種動作。 最後,動物踩到了槓桿,門打開了。 經過無數次的重複操作,貓逐漸停止了不必要的動作,並立即踩下了踏板。 

隨後,斯金納繼續進行這些實驗。  

 研究結果得出了一個對於訓練非常重要的結論:被鼓勵,即被強化的動作更有可能在後續的試驗中發生,而那些未被強化的動作則不會被動物在後續的試驗中使用。

操作學習象限

考慮到操作性學習方法,我們不能不思考操作性學習象限的概念,即該方法運行的基本原理。 象限基於動物的動機。 因此,動物執行的動作可能會導致 2 個結果:

  • 增強狗的動機(狗得到了他想要的東西,在這種情況下,他會越來越頻繁地重複這個動作,因為它會導致慾望的滿足)
  • 懲罰(狗得到了它不想得到的東西,在這種情況下狗會避免重複這個動作)。

 在不同的情況下,同一個動作對狗來說既可以是強化,也可以是懲罰——這完全取決於動機。 比如撫摸。 假設我們的狗喜歡被撫摸。 在這種情況下,如果我們的寵物放鬆或無聊,撫摸他心愛的主人當然會起到一種強化作用。 然而,如果我們的狗正處於緊張的學習過程中,我們的撫摸就會非常不恰當,狗很可能會​​將其視為某種懲罰。 考慮另一個例子:我們的狗在家裡吠叫。 我們來分析一下動機:狗吠叫的原因有很多種,但我們現在來分析一下狗因為無聊而吠叫以引起我們注意的情況。 所以,狗的動機:吸引主人的注意力。 從主人的角度來看,狗的行為不正常。 主人看著狗,對它大喊大叫,試圖讓它安靜下來。 主人認為,此刻他懲罰了這隻狗。 然而,狗在這件事上卻有完全不同的觀點——我們還記得她渴望關注嗎? 即使是負面關注也是關注。 也就是說,從狗的角度來看,主人剛剛滿足了他的動機,從而強化了吠叫。 然後我們轉向斯金納在上個世紀得出的結論:受到鼓勵的行為會越來越頻繁地重複。 也就是說,我們無意中在寵物身上形成了令我們煩惱的行為。 懲罰和強化可以是積極的,也可以是消極的。 一個例子可以幫助我們弄清楚這一點。 積極的一面是添加了一些東西。 負面——某些東西被刪除了。 

例如:狗執行了一個動作,因此他收到了一些令人愉快的東西。 它 正強化。 狗坐下來並得到了一塊零食。 如果狗執行了一個動作,結果他收到了一些不愉快的東西,我們正在談論 積極的懲罰 該行動導致了懲罰。 狗試圖從桌上扯下一塊食物,一個盤子和一個平底鍋同時掉在上面,發出“嘩啦”的一聲。 如果狗經歷了一些不愉快的事情,就會執行一個動作,從而使不愉快的因素消失——這就是 負加固。 例如,當使用機械方法訓練學習收縮時,我們將狗壓在臀部上——這會讓他感到不舒服。 一旦狗坐下,臀部的壓力就會消失。 也就是說,收縮作用阻止了對狗臀部的不愉快影響。 如果狗的動作停止了她之前享受的愉快的事情,我們正在談論 消極懲罰。 例如,一隻狗和你一起玩球或玩收縮——也就是說,它收到了愉快的情緒。 玩完後,狗不經意間非常痛苦地抓住了你的手指,你因此不再與寵物玩耍——狗的動作停止了愉快的娛樂。 

根據情況或這種情況的參與者,相同的行為可以被視為不同類型的懲罰或強化。

 讓我們回到家中狗因無聊而狂吠的話題。 主人對狗大喊大叫,狗就沉默了。 也就是說,從主人的角度來看,他的行為(對狗大喊大叫以及隨後的沉默)停止了令人不快的行為——吠叫。 在這種情況下(與主機相關),我們正在談論負強化。 對於一隻想以任何方式引起主人注意的無聊狗來說,主人對狗的吠叫發出的哭聲是一種積極的強化。 雖然,如果狗害怕主人,並且吠叫對它來說是一種自我獎勵行為,那麼主人在這種情況下的哭泣對狗來說就是一種消極的懲罰。 最常見的是,當與狗一起工作時,有能力的專家會使用積極的強化和一點消極的懲罰。

操作犬訓練法的優點

正如你所看到的,在操作方法的框架內,狗本身是學習的中心和主動環節。 在用這種方法訓練的過程中,狗有機會得出結論、控制局勢並進行管理。 使用操作性訓練方法時,一個非常重要的“獎勵”是“副作用”:習慣於積極參與訓練過程的狗變得更加主動、自信(它們知道最終它們成功了,它們統治了)他們可以移山斷水),他們增強了自我控制能力和在令人沮喪的條件下工作的能力。 他們知道:即使現在不行,也沒關係,保持冷靜,繼續做——繼續努力,你就會得到回報! 通過操作方法掌握的技能往往比通過機械方法練習的技能固定得更快。 統計數據就是這麼說的。 現在我只使用軟方法,但我以前的狗接受了對比(胡蘿蔔加大棒方法)和力學的訓練。 老實說,在我看來,當我們積極鼓勵正確的行為並忽略(並試圖避免)錯誤的行為時,積極強化會比機械方法晚一點給出穩定的結果。 但是……我雙手贊成使用軟方法,因為操作方法不僅僅是訓練,它是一個完整的互動系統,是我們與狗關係的哲學,狗是我們的朋友,而且通常是正式成員家庭的。 我更喜歡和狗一起工作一段時間,但最終得到的是一隻充滿活力、想法和幽默感的寵物,保留了它的魅力。 一隻寵物,與我的關係建立在愛、尊重、渴望和與我一起工作的興趣之上。 一隻完全信任我並渴望與我合作的寵物。 因為工作對他來說是有趣的、好玩的,所以服從對他來說也是有趣的、好玩的。繼續閱讀:塑造作為訓練狗的方法。

發表評論