Предисловие автора
Эта книга о том, как обучать кого угодно: человека или животное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением домашних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить память? Все это можно достичь, используя принципы обучения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же, как падение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное или чужое,
Что такое положительное подкрепление
Положительное подкрепление — это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия. Запомните это положение. В нем заложен секрет успешного обучения. Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление — это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление — это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук (предупреждающий зуммер в машинах, который раздается, если вы забыли пристегнуть ремень безопасности, — это отрицательное подкрепление). Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам,
Отрицательное подкрепление
Психологи спорят по поводу определения отрицательного подкрепления. Для наших целей отрицательное подкрепление можно определить как то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов — едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, — до всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля,
Время подачи подкрепления
Как уже говорилось, подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление — это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора "Да!" или "Хорошо!", отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика. Собака садится, но к тому времени, когда хозяин говорит: "Хорошая собака", собака уже снова стоит. За что, думает животное, его хвалят? За то, что оно встает. Если у вас возникают трудности
Величина подкрепления
Начинающие тренеры, использующие пищевое подкрепление при работе с животными, часто не знают, какова должна быть величина каждого подкрепления. Ответ таков: чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. В 1979 г. Национальный зоопарк в Вашингтоне, штат Колумбия, пригласил меня в качестве консультанта для обучения группы работников зоопарка технике положительного подкрепления. Одна из смотрительниц в моей группе жаловалась, что обучение панды продвигается у нее очень медленно. Мне показалось это странным, потому что интуитивно я чувствовала, что панды —