[算法·思想]囚徒困境之道德测试完结篇
前言:总结研究“囚徒困境”中发现的问题和归纳“道德测试”中的疑惑。
到目前为止写过关于囚徒困境中博客:
one:囚徒困境之JAVA模拟实现
two:囚徒困境之到底想说什么?
Part one 道德能力的意义与测量:
三个重要的问题:
1、怎么通过参与者内在的道德标准而不是通过外部的标准来测验某种能力呢?这里所说的内在标准和外在标准分别指的是什么?在囚徒困境中,又是怎样的?
2、什么才能构建一个恰当的道德任务?
3、经典的心理测量方法在囚徒困境中不适用,道德心理学又是怎么解决这个问题的?
《道德能力测验》(MCT)
1、寻找一个适当的道德任务,在囚徒困境中,选择“合作”与“背叛”这样的问题算是一个任务吗?
2、怎样得到能力测验的结构与内容?背景为“囚徒困境”的结构和内容,可以算是一个两难问题吗?如果是,结构和内容分别指的是什么呢?
3、道德能力表怎么确定?
注:以上部分问题来自《怎样教授道德才有效——德育心理学家给教师的建议》 中国轻工业出版社2018年2月出版
Part two囚徒困境背景再次详解:
了解囚徒困境背景:囚徒困境中的第一个问题:什么条件下才会促使人与人之间的合作?由于某些原因,下一步对局的收益总是杯看作比当前一步的收益少。处理这个问题的一个自然的方法就是在累计收益值时,把下一步对局的收益看作当前一步收益的一部分。下一步相对与当前一步的权重(或称为重要性)记作w,即一个折扣系数。存在的客观问题:如果折扣系数w足够大,则不存在独立于对方所采用的策略的最优策略。
第一次:在罗伯特·XX组织的第一次计算机模拟程序比赛中,14个程序经过对局,出乎意料的是:长度比”随机算法“还少的算法Tit For Tat获得了胜利。
第二次:在第二次的对局中,所有参赛的选手都知道了第一次的对局结果,很有参赛者在Tit For Tat的基础上进行了大量的分析和改进。其中出色的“唐宁”颇具实力,作为一个相当复杂的决策规则的范例。“唐宁”视图了解对方并这个了解的基础上作出能够得到长期的最好得分的选择。为了判断对方的反应,“唐宁”估计对方在合作之后选择合作的概率和在它背叛之后合作的概率,每走一步,“唐宁”便对这两个条件概率作出新的估计。在此基础上,作出自己长期支付最大化的选择。对局结果还是Tit For Tat获得了第一名。
经过两次的对局,得到的结果就是:一个具有善良、宽容、简单明了等特点的程序更能获胜。
注:以上部分叙述来自《合作的进化》(修订版) 上海人民出版社2017出版
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
