Книга ''Не рычите на собаку!"

05.01.2018

Карен Прайор

Не рычите на собаку!

Книга о дрессировке людей, животных и самого себя!

Карен Прайор

Тренировка с подкреплением подходит как для дрессировки животных, так и для формирования определенного вида поведения у людей.

Конечно, она не избавит вас от всех проблем, да и многие проблемы не настолько существенны, чтобы тратить силы на тренировку.

Но есть довольно большое количество случаев, когда подкрепление может пригодиться.

Глава 1. Что такое «подкрепление»

Виды подкрепления

Положительное подкрепление - то, что происходит одновременно с поступком и ведет к повышению вероятности этого поступка в будущем.

В отличие от наград, которые могут даваться гораздо позже происшедшего (например, награждение победителей соревнований), подкрепление должно происходить в тот же момент, что и само желаемое действия, или сразу после него - главное, чтобы в голове эти два момента связывались в одно целое.

В этом состоит суть успешного обучения.

Подкрепление бывает положительным (то, чего желает субъект: еда, похвала и под.) и отрицательным (то, чего субъект хотел бы избежать: удар, порицание и под.).

Уже существующее поведение можно положительно подкрепить: например, если вы хотите, чтобы ваш любимый человек звонил вам чаще, нужно не обвинять его в том, что он редко звонит (тем самым вызывая у него раздражение и желание звонить реже), а выражать радость и таким способом создать положительное подкрепление.

Однако подкрепление не абсолютно. Когда вы не голодны, еда не будет положительным подкреплением. Для подкрепления выбирают то, чего желает субъект.

Нужно иметь несколько подкреплений для каждой ситуации. Когда обучаемый не знает, что он получит в следующий раз, он испытывает больше интереса к таким сюрпризам.

Отрицательно же подкрепление – довольно спорный вопрос в психологии, т.к. наказывают уже после поведения, т.е. нельзя избежать наказания, поменяв взгляды, потому что неправильно поведение - уже свершившийся факт.

Например, ребенок, который подрался с одноклассником, в дальнейшем может вести себя по-разному, но он уже не сможет изменить факта той самой драки. И наоборот, отрицательного подкрепления можно избежать, если вовремя скорректировать поведение.

Или вы взяли со стола коллеги его любимую ручку и ловите на себе его взгляд. Вы кладете ручку на место и видите, как выражение его лица смягчается. Вы усваиваете этот момент.

Время подачи подкрепления

Подкрепление должно происходить одновременно с действием, которое нужно изменить.

Не допускайте как раннего, так и запоздалого подкрепления, потому что отсрочка подкрепления часто оказывает негативное воздействие (например, если муж говорит жене: «Ты вчера была такая красивая», это может вызвать резонный вопрос жены: «А разве я сейчас (всегда) не красивая?»), а преждевременное подкрепление (в виде подарков, комплиментов и др.) поощряет только попытки, но не сами действия.

Размер подкрепления

Чем меньше величина подкрепления, тем лучше. При работе с животными это значит, что животное быстрее съест его и получит больше подкреплений за одно занятие (при этом самой любимой пищи дрессировщики обычно дают еще меньше).

В любом случае стоит учитывать сложность решаемой задачи.

Большой куш

Получение куша (т.е. награды, которая в разы больше обычного подкрепления и является сюрпризом) – один из наиболее эффективных приемов подкрепления, будь то большая порция рыбы для дрессированного дельфина или неожиданный праздник в офисе.

Условное подкрепление

Дрессировка животных почти по всех случаях начинается с выработки условного подкрепления. Условное подкрепление - это какой-либо первоначально ничего не значащий сигнал (звук, свет, движение), который специально связывают с подачей подкрепления.

Для животных это могут быть предметы, например, полицейский свисток, или слова поощрения: «Хорошая собака!», а у людей в роли такого поощрения могут выступать, например, слова школьного учителя «Очень хорошо» и под.

Перед тем как выработать нужное поведения, вы учите субъект понимать значение условного подкрепления, сочетая его с едой или другим истинным подкреплением.

При работе с животными вы понимаете, что субъект начинал узнавать сигнал, означающий «Хорошо!», когда видите, как животное совершает какое-либо движение при действии условного подкрепления и начинает ждать истинное подкрепление.

Для людей условным подкреплением являются деньги, за которые они могут работать в течение очень длительного срока, т.к. данное условное подкрепление является обозначением вещей, которые можно на них купить. Вероятно, причина такого действия денег лежит в том, что их можно связать с чем угодно.

После выработки условного подкрепления пользуйтесь им осторожно, чтобы его действенность не уменьшилась.

Режимы подкрепления

Постоянное подкрепление необходимо только во время обучения. Согласитесь, будет странным, если после того как вы научили ребенка плавать, вы всё время будете комментировать его действия: «Ты правильно плывешь, молодец, у тебя всё получится!».

В этом случае нужно использовать эпизодическое подкрепление, т.е. давать его в случайном порядке.

Долговременные программы поведения

Проблема при работе с фиксированным режимом подкрепления состоит в том, что первые действия не подкрепляются, из-за чего у субъекта возникает желание делать их хуже.

Например, зарплата в конце недели – это фиксированное подкрепление, из-за которого для многих начало недели является очень тяжелым. В случае, например, с дельфинами, помогает случайное подкрепление первого или второго прыжка в серии, кроме последнего.

Другим явлением, которое возникает при длительных интервалах между подкреплениями, —замедленный старт, но существует способ преодолеть отсроченное начало – ввести подкрепление именно за старт.

Например, если после работы так не хочется час ехать на тренировку, еще час заниматься там, а третий час тратить на дорогу домой, можно разбить всю последовательность на этапы и вознаграждать себя за каждый из них (для кого-то подойдет кусочек шоколадки, для кого-то – фрукт), по прошествии времени подкрепление уже не понадобится.

Долой суеверия

Согласитесь, сложно внимательно не изучать пол в зале кинотеатра, если накануне вы нашли там купюру.

Хотя случайное подкрепление часто не имеет полезного эффекта, оно может оказать значительное воздействие на поведение, и человек оказывается во власти суеверия.

Например, некоторые спортсмены выполнят определенные ритуальные действия перед броском и верят, что именно это принесет им удачу, хотя это всего лишь случайно обусловленное поведение.

К сожалению, от суеверия не так просто избавиться, т.к. оно обычно сильно оберегается. Но всё-таки способ есть – удостовериться, что оно не связано с подкреплением.

Организованное подкрепление

Во многих организациях, будь то общество по борьбе с лишним весом или курсы уверенности в себе, подкрепление происходит за счет влияния группы.

Такие формы группового признания, как значки, дипломы, церемонии награждения, являются очень сильным подкреплением.

Самоподкрепление

Также очень полезно использовать самоподкрепление, которое является одним из способов наградить себя за труды, расслабиться, например, после тяжелой трудовой недели.

Кто-то использует нездоровые способы самоподкрепления (сигареты, вредная пища), но самыми лучшими являются здоровые способы: проведенное время с семьей, прогулка, просмотр фильм, чтение книги.

Глава 2. Процесс выработки

Суть процесса выработки

Смысл процесса выработки заключается в том, чтобы использовать каждую тенденцию изменений поведения в необходимом направлении.

Данный процесс представляет из себя в основном выработку поведения – от игры в гольф до вождения автомобиля. Когда мы в чем-то упражняемся или пытаемся изменить свое поведение, мы находимся в процессе выработки.

Достижение определенного результата в большей степени зависит от упорства, а не от искусства.

10 правил успешной выработки:

1. Увеличивайте критерии постепенно. Вы должны понимать, что субъект уже способен на это. Не форсируйте.

2. В каждый определенный момент работайте над чем-то одним. Разделите задачу на компоненты, тогда обучение будет продвигаться быстрее.

3. Прежде чем увеличивать или повышать критерий, используйте вариативную шкалу подкреплений. Как только субъект усвоил поведение, нужно подкреплять его не каждый раз, чтобы поддерживать его на данном уровне.

4. Перед введением нового критерия на время ослабьте старые. То, что уже выучено, не забудется.

5. Планируйте систему обучения так, что, если ваш подопечный совершит неожиданный рывок в обучении (у него возникнет внезапное озарение), вы будете знать, что и как подкреплять далее.

6. Не меняйте тренеров на полпути. Не отдавайте своего ученика другому тренеру. Определенное поведение, которое должно быть выучено, требует только одного учителя в каждый конкретный момент времени. Менять преподавателя на середине пути можно, только если обучение зашло в тупик и вам уже нечего терять.

7. Когда одна процедура выработки не дает необходимый результат, попробуйте другую.

8. Не заканчивайте урок без положительного подкрепления, иначе это будет восприниматься как наказание.

9. Если выученное поведение становится хуже, пересмотрите систему обучения. Вероятно, нужно будет вернуться к самому началу и быстро заново пройти этот путь.

10. Научитесь завершать работу, останавливаясь на хорошем ответе.

Феномен дзэн

Если не получается окончить занятие на подъеме, можно завершить его чем-то легким, например, игрой. Главное – не заканчивать урок введением нового материала.

Формируем свое поведение

Главная трудность здесь состоит в том, что человек должен сам себе давать подкрепление. Но тогда исчезает эффект неожиданности. Самым успешным методом самоподкрепления является постоянная фиксация результатов.

Нужно вести ее так, чтобы прогресс было видно сразу, например, можно использовать графики, т.к. они наглядно отражают весь процесс изменений.

Глава 3. Управление с помощью стимулов

Правила управления с помощью стимулов

Стимул – это фактор, вызывающий реакцию, действие. Первичные стимулы возникают без тренировок: вздрагивание в ответ на громкий звук и т.д. Другие же запоминаются благодаря ассоциациям: на зеленый свет светофора мы идем, на красный - стоим.

Чтобы воздействовать на субъект с помощью сигналов, нужно сформировать необходимое поведение, а затем сделать так, чтобы оно происходило одновременно с определенным сигнала или сразу после него. Такой стимул после становится сигналом поведения.

Контроль с помощью стимулов определяется 4 условиями (рассмотрим их на примере разучивания собакой команды «Сидеть!»):

1. Поведение должно всегда осуществляться сразу же после подачи условного стимула (когда собаке приказывают, она садится).

2. Поведение никогда не должно возникать без стимула (во время тренировки собака не должна садиться беспричинно).

3. Поведение никогда не должно проявляться в ответ на другие стимулы (когда вы говорите: «Лежать!», собака не должна садиться).

4. В ответ на данный стимул не должно возникать никакое другое поведение (когда вы говорите «Сидеть!», собака не должна ложиться или совершать другое действие).

Только когда все 4 условия соблюдены, собака окончательно понимает команду «Сидеть!», это означает, что теперь вы управляете ею с помощью стимула.

Что может быть условным стимулом?

Условным стимулом может быть все, что доступно восприятию: звуки, свет, прикосновения. Как только субъект научится воспринимать его, сигнал можно будет использовать для вызова выученного поведения.

Интенсивность сигнала и стирание стимулов

Нет конкретных требований к силе и величине условного сигнала. Главное: сигнал должен быть узнаваемым. Например, когда вы видите красный свет, вы останавливаетесь. Пока вы узнаете сигнал, вы понимаете, что нужно делать.

Поэтому, после того как стимул заучен, можно даже постепенно его уменьшать, пока он не станет едва заметен, но все равно будет давать такие же результаты.

Также существует эффект «стирания» стимулов - когда вы получаете результат при таких слабых сигналах, которые не видны постороннему глазу (используется, например, при дрессировке животных, когда человек делает едва заметное действие).

Предвосхищение

Часто, когда субъект усвоил какое-либо действие, он стремится продемонстрировать его раньше сигнала.

Для исправления ситуации можно брать тайм-ауты и какое-то время ничего не делать. За излишнюю поспешность вы наказываете невозможностью работать.

8 методов, помогающие изменить нежелательное поведение:

Метод 1 – «Убить зверя». Этот безусловно действующий метод является высшей мерой наказания (увольнение сотрудника, развод, усыпление неадекватного животного и т.д.). Хотя он жесток, но иногда применим в тех случаях, когда проступок достаточно существенный и нет способов, чтобы легко его изменить.

Недостатком метода является то, что он ничему не учит. Однако этот метод не всегда связан с жестокостью и его можно использовать, когда нет времени, чтобы уделить достаточное внимание субъекту: например, посадить детей в манеж.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Ликвидируйте собаку (застрелить, продать, отдать и т. п.)

Поведение: Ленивый сотрудник. Ваши действия: Увольте его.

Метод 2 – «Наказание». Субъект так же, как и при применении первого метода, ничему не учится, т.к. наказывают за совершенный поступок, который уже невозможно исправить.

Максимум, что может измениться, - это мотивация (ребенок, которого наказали за плохие оценки, в будущем станет учиться лучше, чтобы избежать наказания). Но наказания часто учат не попадаться.

Наказание может помочь, только если порицаемое поведение было сразу замечено и еще не стало привычкой или если наказание стало неожиданностью для субъекта.

Проблемой данного метода является в то, что для наказывающего наказание становится своеобразным подкреплением, т.к. демонстрирует его власть.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Ударьте ее или облейте водой, когда она лает.

Поведение: Ленивый сотрудник. Ваши действия: Отчитывайте, главным образом перед коллегами. Пригрозите уменьшить зарплату или на самом деле уменьшите ее.

Метод 3 – Отрицательное «подкрепление». В отличие от наказания, отрицательное подкрепление, как и положительное, происходит во время действия, а не после.

На этом построены почти все традиционные методики дрессировки животных. Но и люди часто применяют его по отношению друг к другу: суровый взгляд, замечание и т.д.

Есть только 1 случай, когда отрицательно подкрепление подействует лучше положительного: когда субъект точно знает, что должен делать, но сознательно ведет себя по-другому.

Этот метод помогает, например, очертить рамки дозволенного для ребенка. Но при применении данного метода важно прекращать отрицательное подкрепление, когда поведение субъекта хоть немного улучшилось.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Посветите ярким фонарем на будку. Выключите свет, как только собака перестанет лаять.

Поведение: Ленивый сотрудник. Ваши действия: Постоянно контролируйте и критикуйте, когда уровень работы снижается.

Метод 4 – «Угашение». Данный метод означает, что поведение исчезает из-за отсутствия подкрепления. Поведение, которое не приносит никакого эффекта, скорее всего, исчезнет.

Этот способ не всегда срабатывает, но есть ситуации, когда он применим, например, чье-то ворчание, нытьё и т.д. Скажите такому человеку, что это на вас не действует, не обращайте внимание на поведение, не игнорируя при этом человека, - тогда подобные проявления угаснут сами собой.

Одним из способов угашения является привыкание: если действия негативного стимула нельзя избежать, то постепенно реакция на него исчезнет (например, если вы переехали из тихого квартала в дом на центральной магистрали, шум под окнами сначала будет казаться вам невыносимым, но затем вы привыкнете).

Примеры применения метода

Поведение: Собака на дворе лает всю ночь.

Ваши действия: Данный тип поведения самоподкрепляем и редко исчезает сам по себе.

Поведение: Ленивый сотрудник.

Ваши действия: Если сотрудник пытается таким образом привлечь внимание, то перестаньте обращать на него внимание.

Метод 5 – «Выработка несовместимого поведения». Данный метод позволяет обучить субъект определенному действию, физически несовместимому с нежелательным.

Например, собаку, которая любит попрошайничать у стола, можно приучить лежать за пределами кухни, пока люди обедают.

Также данный метод помогает изменить собственное поведение: например, такие действия, как бег, танцы, несовместимы с состояниями грусти, печали, тоски.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Обучите ее ложиться по команде; собаки редко лают лежа.

Кричите команду через окно или установите в собачьей будке рацию. Хвалите.

Поведение: Ленивый сотрудник. Ваши действия: Поручите ему работать быстрее или упорнее над каким-либо заданием; похвалите, когда он закончит работу.

Метод 6 – «Связывание поведения с конкретным сигналом». Субъект совершает действие в ответ на определенный стимул. Когда стимул есть – поведение подчиняется ему, когда стимул отсутствует – поведение прекращается.

Например, чтобы успокоить расшумевшихся детей, можно предложить им: «По команде каждый шумит как можно громче!». Некоторое время это кажется всем забавным, но потом утомляет.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Обучайте собаку лаять по команде «Голос!» и давайте за это положительное подкрепление. В отсутствие команды собака не будет лаять.

Поведение: Ленивый сотрудник. Ваши действия: Отведите для сотрудников определенное время, когда можно лениться и ничего не делать.

Метод 7 – «Выработка отсутствия определенного поведения».

Данный метод необходим, когда вы хотите, чтобы кто-нибудь прекратил уже существующее поведение (например, ворчание родственников в телефонном разговоре).

В результате его применения подкрепляется всё, кроме того, что вам нежелательно.

Известен пример зоопсихолога Гарри Фрэнка, который, приручая волчат, поощрял всю их деятельность, кроме разрушительной. Он выяснил, что единственным способом было лежание на кровати, поэтому их вечера были спокойными, когда он, его жена и волчата лежали на кровати и смотрели телепередачи.

Применение этого метода требует определенных умственных и временных усилий, но часто является единственным способом изменить устоявшееся поведение.

Примеры применения метода

Здесь каждый ищет свою формулу успеха.

Метод 8 – «Смена мотивации». В первую очередь важно осознать мотивы, которые движут человеком.

Например, ребенок, устроивший скандал вечером в супермаркете, может быть голоден. Решить проблему можно, покормив его перед походом по магазинам. Курильщик же может бросить свою привычку, когда риск для здоровья перекрывает желание покурить.

Примеры применения метода

Поведение: Собака на дворе лает всю ночь. Ваши действия: Возможно, собаке одиноко, страшно или скучно. Занимайтесь с ней, уделяйте внимание днем, чтобы собака уставала и спала ночью, или заведите еще одну собаку, чтобы они спали ночью вдвоем.

Поведение: Ленивый сотрудник. Ваши действия: Платите только за выполненную работу, а не за часы, проведенные на рабочем месте.

Глава 4. Как правильно применять подкрепление, чтобы избавиться от нежелательного поведения

Итак, вы уже поняли, как сформировать новое поведение. А как избавиться от уже существующего нежелательного поведения?

Некоторые проблемы, в основе которых лежит сложная мотивация, могут быть преодолены только при использовании всех 8 методов: это относится к кусанию ногтей, хроническим опозданиям и вредным привычкам.

Кусание ногтей

Данная привычка - это одновременно проявление стрессового состояния и способ мгновенного получения облегчения. Такое поведение становится самоподкрепляемым и совершается даже тогда, когда стрессовая ситуация отсутствует. При использовании метода 1 можно надевать перчатки, чтобы грызть ногти стало невозможно. Наказание (метод 2) тут бессильно. Метод 3 может быть эффективным, если намазать ногти неприятным на вкус веществом. Иногда результат дает метод 4 — угашение (человек взрослеет, становится более уверенным в себе), но на это могут потребоваться годы. Положительного эффекта можно добиться, если ловить себя в момент, когда хочется начать грызть ногти, и переключать себя на другое действие, например, выпить воды, попрыгать (метод 5). Можно вознаграждать себя, например, красивым маникюром, когда ногти отрастут (метод 7). А самое главное – нужно сменить мотивацию (метод 8): определите, что является источником стресса, поделитесь своими тревогами с людьми, которые смогут помочь, делайте больше физических упражнений.

Хронические опоздания

У каждого человека свои причины для опоздания: кто-то не хочет идти на нелюбимую работу, поэтому долго собирается, другой считает, что на него навесили слишком много обязанностей, третий не хочет встречаться с неприятными людьми и таким образом демонстрирует, что у него есть поважнее. Но мотивы не так важны, как искреннее желание изменить мотивацию, решив для себя, что нужно всегда приходить вовремя, невзирая на обстоятельства. Если этого недостаточно, можно добавить метод 5 (выработка несовместимого поведения): назначайте для себя более раннее время прибытия. Или используйте метод 7: вознаграждайте себя и попросите друзей тоже делать это.

Вредные привычки

Почти все вредные привычки (будь то курение, чрезмерное употребление алкоголя, шоколада, кофе и т.д.) временно снижают психическое напряжение, поэтому их довольно трудно преодолеть. Программы реабилитации обычно основываются на методах 1 и 8 – вещество становится недоступным, а при лечении пытаются найти другой источник удовольствия для пациента, повысить его самооценку. На кого-то действуют методы 2 и 3. Метод 4 проявляется в том, что человек, решивший бросить курить, убирает пепельницу или же полностью меняет обстановку, где ничего не напоминает им о старых привычках.