赏罚是推动人类进步的一种机制之一,这种方式在君主时代就已经存在了。不信?可以去看看韩非子,马基微里(Machiavelli) 等著作,他们都提到赏罚分明的重要性。然而把这门学问使用到更深奥,更好玩之外,我认为是Behaviorism, 行为学的功劳了。
一开始就有闻名的John B. Watson 说过一句耐人寻味的一段话,他说:给我一打小孩,我可以把他们变成任何人物!这说明了,只要环境的配合,基本上就奠定了你是个什么样的人。过后就有Ivan Pavlov 的古典制约(Classical Conditioning), 也是心锚的原理,认为人类是通过一种联系而学习的。
然而我个人认为真正奠定行为学的威力是B.F. Skinner。他制作了一个闻名世界的鸽子盒(Skinner Box) 来观看鸽子如何增加某种行为和减少某种行为,从而得出 Operant Conditioning 的理论。而这理论也有4个不同类型。
1. Fixed Ratio
这个机制属于数量型的奖赏。假设说,只要你每完成抄一篇100字的文章,你就有10块钱。那么你的行为会希望越做越多吧?就算已经放工了,还有50字,你还是会先完成工作吧?是很鲜明的奖赏,知道预测奖赏的份量的做法。
2. Variable Ratio
这个机制才是最厉害的!你不知道你将在什么时候有奖赏。比方说,拉老虎机就是根据这个原理制作出来的。你可能是在第5次就拉到钱,可是你不知道下一次是什么时候,可是偶尔也有小奖品出现,所以你会一直想拉的动力就存在了。这个机制是根据指定次数才出现奖赏。可能是每3次,再变成每30次才有一次奖赏等。
3. Fixed Interval
那么这个分别是指定时间才出现奖赏。无论你做多少工作,熬了多少个晚上,完成了多少令人惊叹的作品或工作量,你还是必须等到月尾才出粮给你,对吧?
4. Variable Interval
这是根据时间分配的,但具体的时间并出现奖赏是无法预测的。例如,钓鱼就是其中一例。你应该可以猜到,这个时候的鱼量是最多的,但何时会钓到,也不知道。
要是你能明白这4个原理,基本上你就掌握了洗脑的一些基础了...
很简单。你要怎样训练狗呢?一开始你可以先让它知道做什么动作才有奖赏,它很快就会明白。但问题在于,如果你要它多做几个动作,可是它已经吃饱了(奖赏足够了),它就不会继续了,你会怎么做?惩罚它吗?是个方法,但不是好方法。
更好的做法是,不要继续。在下一次的时候,不要每一次都给奖赏,在可能是做对2次之后,才给。再下一次换去5次,下一次却变成1次就给奖赏。狗会因为不知道几时得到奖赏,就会拼命的做动作,否则就要挨饿了。
很恐怖?放心,人类经常这样做。不信?给你些例子。
你不知道做了什么,令你的伴侣很高兴,结果你们度过了一个很美妙的夜晚。可是第二天,他变得冷冰冰,一言不发。你感到奇怪,结果你做了一些哄他开心的事情,他只给了你一个吻或拥抱。这些类似的事情经常发生,而回馈的方式包括亲吻,拥抱,送礼物等。你会不会因此做得更多哄他开心的事情啊?
你或许不会,但很多人绝对会!父母是如此,伴侣是如此,政府也可能是如此!
看了这篇文章,你是否要好好的思考,究竟要怎样开始赏罚身边的人了呢?呵呵。
No comments:
Post a Comment