原帖由 天宫公主 于 2006-3-8 06:41 发表
也许因为专业问题, 对于这种东西比较喜欢用统计学的思想. 在统计学里, 一般来说对于观测数据, 无论数据看起来多么反常, 它永远是神圣不可侵犯的.
那么如果我们把吕布, 关张他们看成实验室的老鼠, 我们用若干个试验去看谁比谁更猛一些, 那么我们可以把演义中的单挑看成每次实验的结果.
在做这种实验时, 我们经常会用到一个概念叫information entropy, 也就是信息理论. 每个试验结果的entropy越高, 说明了它给我们的信息越多. 一般的说, I_i = - log p_i (这个定义是通过解函数方程得出来的, 不是凭空想象的), 其中p_i 是用其它试验预测第 i 次试验结果的概率. 显然, 当p_i -> 0, I_i 便会越高. 用常用语言来说, 试验结果越是出现难以预料的事, 那么该试验的信息价值便越高. 虽然说某些试验有可能有误差, 但是否可以因为这种误差来删除试验结果呢? 理论上说, entropy低而variance高的情况下, 试验结果可以删除.
所以从entropy角度看, 我宁可定马超对许禇为无效战例, 也不会定关羽对文丑为无效战例. 因为即使马超对许禇无效了, 它对综合排的顺序也影响不大(没这次单挑, 我们也基本猜到结果, 所以p_i 高而 entropy 低. 因此它只要有一点不确定因素, 都足以构成无效化的理由. 但关羽对文丑则不同, 它是否有效对最终排名结果影响很大, 所以除非你有非常非常多的证据, 说这次的确是一次随机噪音, 那么我们是不应该随便删除含信息这么大的实验结果的. 或者说, 对于entropy比较高的战例, 我们需要很多反方面因素才可以定为无效. 而entropy比较低的, 我们则并不需要太多.
另, 还要说一点, 我认为回合数是一个很不准的参数. 事实上50以上的单挑, 除了平的没什么别的结果了. 因此能够坚持到50合, 至少从统计数据上看, 就能坚持到500合 ...
公主此说非常精彩,看了这几段,本人一直以来的一个想法,就像是找到了组织一般。
由于没什么统计学的专业概念,之前一直用关键度来模糊的判断各场单挑的重要性。现在看来这不就是公主所说的entropy嘛
有一个设想,把武将的所有单挑按entropy从高到低排列起来,然后从低端开始删除战例,直到每个武将只剩下唯一的一个entropy最高的战例,这时他们的高下就出来啦!
下面是我认为的几个武将entropy最高的战例
吕布:关张三十合战不倒吕布
关羽:三合令文丑心怯
张飞:徐州战吕布一百合平
马超:二十合击败张郃
颜良:二十合击败徐晃
赵云:三十合击败张郃
许褚:大战马超230合
典韦:大战许褚数个时辰
黄忠:大战关羽过百合
庞德:大战关羽过百合
文丑:大战赵云五六十合
……(下略)
lz不好意思,借地了^_^