"Карен Прайор. He рычите на собаку! (О дрессировке животных и людей)" - читать интересную книгу автора

множество подкреплений - обучение ребенка езде на велосипеде идет под
настоящий поток: "Правильно, крепче держи руль, у тебя получилось, хорошо!"
Но вы будете выглядеть довольно глупо (а ребенок решит, что вы сошли с
ума), если вы будете продолжать хвалить его после того как навык
установился. Для того чтобы поддерживать уже выученное поведение на
определенном уровне надежности, не только не надо подкреплять его все
время, а даже, наоборот, следует прекратить регулярные подкрепления и
перейти на эпизодическое использование подкрепления, подаваемого в
случайном и не предсказуемом порядке. Это и есть то, что психологи называют
вариабельным режимом подкрепления. Вариабельный режим гораздо более
эффективен для поддержания поведения, чем постоянный, предсказуемый. Один
психолог объяснил это мне так: если у вас машина новая и всегда хорошо
заводилась, а однажды, когда вы сели в нее, повернули ключ, она не
завелась, то вы, может быть, и попробуете завести ее еще несколько раз, но
скоро решите, что что-нибудь не в порядке, и позвоните в гараж. Поведение,
состоящее в поворачивании ключа, при отсутствии ожидаемого немедленного
подкрепления быстро угаснет. С другой стороны, если у вас вместо машины
старая консервная банка, которая еще ни разу не заводилась с первой
попытки, и каждый раз требуется целая вечность для того, чтобы привести ее
в движение, вы можете продолжать попытки ее завести в течение получаса;
ваше поведение по поворачиванию ключа происходит в низковероятностном
режиме подкрепления и поэтому сильнейшим образом поддерживается. Если
давать дельфину рыбку за каждый прыжок, то скоро прыжки станут невысокими,
небрежными, лишь бы отделаться. Если теперь перестать давать рыбу, дельфин
тут же перестает прыгать. Но, если после того как животное научилось

прыгать за рыбку, начать подкреплять первый прыжок, затем третий и так
далее наугад, поведение будет поддерживаться на более высоком уровне: не
получив подкрепления, животное станет прыгать чаще, стараясь угадать
счастливый номер, и прыжки могут даже усилиться. В свою очередь это
позволит подкреплять выборочно наиболее сильные прыжки, - то есть
посредством вариативного режима совершенствовать деятельность. Но даже
некоторые профессиональные дрессировщики не могут правильно использовать
вариативный режим положительного подкрепления; многим эта концепция
представляется особенно трудной, не укладывающейся в голове. Нам понято,
что нет нужды продолжать наказывать за неправильное поведение, если оно
прекратилось, но почему бы не вознаграждать постоянно за правильное
поведение. Мы не так уверены в этом только когда ставим целью добиться с
помощью положительного подкрепления улучшения дисциплины. Действенность
вариатавного подкрепления лежит в основе всех азартных игр. Если каждый
раз, опустив в автомат 5 центов, будете получать десять, то скоро вы
потеряете к этому интерес. Да, вы будете делать деньги, но какой это нудный
способ! Людям нравится играть с автоматом именно потому, что невозможно
предугадать заранее, то ли ничего не получишь, то ли какую-то мелочь, то ли
сразу кучу денег, и когда именно будет это подкрепление (это может быть
только один самый первый раз). Почему одни люди втягиваются в азартную
игру, а другие могут поиграть и бросить, это уже другой вопрос, но для тех,
кто попался на крючок, этим крючком стал вариативный режим положительного
подкрепления. Чем длительнее интервалы между подкреплениями в вариативном
режиме, тем сильнее он стимулирует поведение. Однако режимы с длительными
интервалами работают против вас, когда вы пытаетесь угасить поведение. Если