Mysteryism Forever: 赏罚的心理学

Tuesday, August 5, 2014

赏罚的心理学

赏罚是推动人类进步的一种机制之一，这种方式在君主时代就已经存在了。不信？可以去看看韩非子，马基微里（Machiavelli) 等著作，他们都提到赏罚分明的重要性。然而把这门学问使用到更深奥，更好玩之外，我认为是Behaviorism, 行为学的功劳了。

一开始就有闻名的John B. Watson 说过一句耐人寻味的一段话，他说：给我一打小孩，我可以把他们变成任何人物！这说明了，只要环境的配合，基本上就奠定了你是个什么样的人。过后就有Ivan Pavlov 的古典制约（Classical Conditioning), 也是心锚的原理，认为人类是通过一种联系而学习的。

然而我个人认为真正奠定行为学的威力是B.F. Skinner。他制作了一个闻名世界的鸽子盒（Skinner Box) 来观看鸽子如何增加某种行为和减少某种行为，从而得出 Operant Conditioning 的理论。而这理论也有4个不同类型。

1. Fixed Ratio

这个机制属于数量型的奖赏。假设说，只要你每完成抄一篇100字的文章，你就有10块钱。那么你的行为会希望越做越多吧？就算已经放工了，还有50字，你还是会先完成工作吧？是很鲜明的奖赏，知道预测奖赏的份量的做法。

2. Variable Ratio

这个机制才是最厉害的！你不知道你将在什么时候有奖赏。比方说，拉老虎机就是根据这个原理制作出来的。你可能是在第5次就拉到钱，可是你不知道下一次是什么时候，可是偶尔也有小奖品出现，所以你会一直想拉的动力就存在了。这个机制是根据指定次数才出现奖赏。可能是每3次，再变成每30次才有一次奖赏等。

3. Fixed Interval

那么这个分别是指定时间才出现奖赏。无论你做多少工作，熬了多少个晚上，完成了多少令人惊叹的作品或工作量，你还是必须等到月尾才出粮给你，对吧？

4. Variable Interval

这是根据时间分配的，但具体的时间并出现奖赏是无法预测的。例如，钓鱼就是其中一例。你应该可以猜到，这个时候的鱼量是最多的，但何时会钓到，也不知道。

要是你能明白这4个原理，基本上你就掌握了洗脑的一些基础了...

很简单。你要怎样训练狗呢？一开始你可以先让它知道做什么动作才有奖赏，它很快就会明白。但问题在于，如果你要它多做几个动作，可是它已经吃饱了（奖赏足够了），它就不会继续了，你会怎么做？惩罚它吗？是个方法，但不是好方法。

更好的做法是，不要继续。在下一次的时候，不要每一次都给奖赏，在可能是做对2次之后，才给。再下一次换去5次，下一次却变成1次就给奖赏。狗会因为不知道几时得到奖赏，就会拼命的做动作，否则就要挨饿了。

很恐怖？放心，人类经常这样做。不信？给你些例子。

你不知道做了什么，令你的伴侣很高兴，结果你们度过了一个很美妙的夜晚。可是第二天，他变得冷冰冰，一言不发。你感到奇怪，结果你做了一些哄他开心的事情，他只给了你一个吻或拥抱。这些类似的事情经常发生，而回馈的方式包括亲吻，拥抱，送礼物等。你会不会因此做得更多哄他开心的事情啊？

你或许不会，但很多人绝对会！父母是如此，伴侣是如此，政府也可能是如此！

看了这篇文章，你是否要好好的思考，究竟要怎样开始赏罚身边的人了呢？呵呵。

Mysteryism Forever

Tuesday, August 5, 2014

赏罚的心理学

No comments:

Post a Comment