标题: 红楼梦版本流传的概率分析和现存版本中有“原本”的可能性 [打印本页]
作者:
ptcn 时间: 2009-1-6 20:59 标题: 红楼梦版本流传的概率分析和现存版本中有“原本”的可能性
红楼梦版本流传的概率分析和现存版本中有“原本”的可能性
今天我们所见到的手写版本有:甲戌本、庚辰本、己卯本、梦稿本、列藏本。(另外,还有王府本、甲辰本、舒序本,但这些本子是否“手写本”我不太明确。)
现在一般认为:
A、甲戌本、庚辰本、己卯本、梦稿本、列藏本之间不是“同版抄本”的关系,而是“不同版的改本”的关系;
B、今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”。
但这两个观点(或假设)同时成立,则是很不可能成立的“小概率事件”。
I.
为了说明这个问题,先确定流传模型,其“与本问题相关的底线模型”是:甲戌本、庚辰本、己卯本、梦稿本、列藏本在初始时各有一个“原本”和一个“抄本”。
今天的现实是:它们各有一个本子存世。
那么,我们可以算一算由上述模型开始至今出现目前这种每个手写版本各存一本的情况的概率:
在10个元素中任取五个的取法共有:10!/5!5!=2x3x2x3x7=252种。
其中,每组2个共5组手写版本中各组均选1的选法有2的五次方共32种。而出现五种手写版本各存一本的情况的概率就是32/252=13%。
而同时5种手写版本现存的本子都不是“原本”的概率是多少呢?是2的五次方即32的倒数,约3%。
如此,我们就有97%的把握作出反证法结论:
今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本中至少有一个本子是“原本”!
那么,上述A、B两种情况即:
A、甲戌本、庚辰本、己卯本、梦稿本、列藏本之间不是“同版抄本”的关系,而是“不同版的改本”的关系;
B、今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”
同时成立的概率就是3%X13%=0.39%,也就是千分之4!这已经是小概率了。
II.
回过头来再说为什么上述模型是“底线模型”,因为这个模型仅包含了最少/最基本的元素,如果再减少一个要素(即一个“抄本”),则问题就不成为问题了-今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本中100%地至少有一个本子是“原本”。
换言之,对于比“底线模型”少一个元素(一个抄本)的模型,目前存在至少一个“原本”的概率是100%。
那么,对于比“底线模型”元素更多的模型,结果如何?
为了简洁,考虑这样的“三本模型”: 甲戌本、庚辰本、己卯本、梦稿本、列藏本在初始时各有一个“原本”和两个“抄本”。
在这个模型下,从15个初始本子中存流5个本子有15!/5! 5!=90810720种取法,而其中出现今天实际发生的“各版本各有一个本子存世”的情况则有3的五次方共243中取法,概率是243/90810720=百万分之2.7。
出现“各版本各有一个本子存世”的现状的概率随初始本子数目的增大急剧趋零。
这说明,“初始的”本子(“原本”+抄本)的数目很不可能很多!各有两本的可能性不过13%。各有3本的可能性则仅仅有百万分之2.7!
此时现存甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”的概率为2/3的五次方,即32/243,约13%。我们作出“今存本中有原本”的正确概率仍然有87%!
而出现今天情况的概率是两者之积:13%X万分之2.7。这实在太小概率了!
III.
如果我们把王府本、甲辰本、舒序本也作为和其他五本同样地位的“手本”加入到模型里,那么对于“各版本初始有一原本+一抄本”模型,“各存一本”的概率是
(2的八次方)/(16!/8!8!)=(2的八次方)/(2X3X2X13X2X11X10X3/(4X2))=(2的八次方)/(3X13X11X10X3)=(2的七次方)/(3X13X11X5X3)=128/6435=0.020
约为万分之二。
如果只把王府本、甲辰本、舒序本之一作为和其他五本同样地位的“手本”加入到模型里,那么对于“各版本初始有一原本+一抄本”模型,“各版本各存一本”的概率是
(2的六次方)/(12!/6!6!)=(2的六次方)/(2X11X2X3X2X7/2)=(2的六次方)/(2X11X2X3X7)=(2的四次方)/(11X3X7)=16/231=0.070
约为万分之七。
可见,随着版本数目的增大,“各版本各存一本”的现状的概率也较快地趋零。“五版本”模型下为千分之4,“六版本”模型下为万分之七,“八版本”模型下为万分之二。
在“六版2本”模型下,“现存六版均非原本”的概率是2的六次方的倒数,为1/64=1.5%。
在“八版2本”模型下,“现存八版均非原本”的概率是2的八次方的倒数,为1/256=0.4%
“有原本”的概率快速趋于1。
在“六版3本”模型下,“现存六版均非原本”的概率是2/3的六次方,为64/729=0.088
在“八版3本”模型下,“现存八版均非原本”的概率是2/3的八次方,为256/6561=0.04
“有原本”的概率也快速趋于1。
IV.
对模型的修正:考虑到“原本更被重视,因而其被保留的概率大于抄本”,假定“原本被保留的概率比抄本大一倍”,则
在“五版2本”情况下,“现存五版均非原本”的概率是1/3的五次方,为1/125=0.8%。
比不修正时的3%大为减小。
结论:
在至少现存的甲戌本、庚辰本、己卯本、梦稿本、列藏本是是“不同版的改本”的情况下,按照概率理论,这些“不同版的改本”很不太可能都有多于一个的“抄本”。而且,现存的甲戌本、庚辰本、己卯本、梦稿本、列藏本中有至少一个“原本”的概率很大(约90%甚至更大),而在考虑“原本被珍视”的修正因素后,“现存五本中至少有一是原本”的概率更大。
[ 本帖最后由 ptcn 于 2009-1-6 21:18 编辑 ]
作者:
ptcn 时间: 2009-1-6 20:59
算那些阶乘算得偶头大。感觉可能还是算得不对
谁有相关的工具,帮忙算算这几个值:
10!/5!5!=
15!/5! 5!=
16!/8!8!=
12!/6!6!=
先谢过了!
[ 本帖最后由 ptcn 于 2009-1-6 21:47 编辑 ]
作者:
KYOKO 时间: 2009-1-6 22:22
不看各种版本内容的????
作者:
墨叶 时间: 2009-1-6 22:25
使用附件中的计数器。
10!/(5!5!)=252
1/252=0.003968253968253968253968253968254
15!/(5! 5!)=90810720
1/90810720=1.1011915773820535725297630059535e-8
16!/8!8!=12870
1/12870=7.7706115471287590333359235371824e-5
12!/6!6!=924
1/924=0.0010822510822510822510822510822511
使用市面上的科学计算器会更快。
可以直接算排列和组合。
[ 本帖最后由 墨叶 于 2009-1-6 22:28 编辑 ]
作者:
墨叶 时间: 2009-1-6 22:27
总感觉楼主的证明过程不合理。
作者:
水镜门生 时间: 2009-1-6 22:28
很有趣味性,可以当成文理大综合的考题
作者:
ptcn 时间: 2009-1-6 22:56
顶楼的一些细节有错(主要是把百分比的移位方向搞反了,真晕了),更正版本如下:
------------------------
红楼梦版本流传的概率分析和现存版本中有“原本”的可能性
今天我们所见到的手写版本有:甲戌本、庚辰本、己卯本、梦稿本、列藏本。(另外,还有王府本、甲辰本、舒序本,但这些本子是否“手写本”我不太明确。)
现在一般认为:
A、甲戌本、庚辰本、己卯本、梦稿本、列藏本之间不是“同版抄本”的关系,而是“不同版的改本”的关系;
B、今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”。
但这两个观点(或假设)同时成立,则是很不可能成立的“小概率事件”。
I.
为了说明这个问题,先确定流传模型,其“与本问题相关的底线模型”是:甲戌本、庚辰本、己卯本、梦稿本、列藏本在初始时各有一个“原本”和一个“抄本”。
今天的现实是:它们各有一个本子存世。
那么,我们可以算一算由上述模型开始至今出现目前这种每个手写版本各存一本的情况的概率:
在10个元素中任取五个的取法共有:10!/5!5!=2x3x2x3x7=252种。
其中,每组2个共5组手写版本中各组均选1的选法有2的五次方共32种。而出现五种手写版本各存一本的情况的概率就是32/252=13%。
而同时5种手写版本现存的本子都不是“原本”的概率是多少呢?是2的五次方即32的倒数,约3%。
如此,我们就有97%的把握作出反证法结论:
今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本中至少有一个本子是“原本”!
那么,上述A、B两种情况即:
A、甲戌本、庚辰本、己卯本、梦稿本、列藏本之间不是“同版抄本”的关系,而是“不同版的改本”的关系;
B、今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”
同时成立的概率就是3%X13%=0.39%,也就是千分之4!这已经是小概率了。
II.
回过头来再说为什么上述模型是“底线模型”,因为这个模型仅包含了最少/最基本的元素,如果再减少一个要素(即一个“抄本”),则问题就不成为问题了-今天所见的甲戌本、庚辰本、己卯本、梦稿本、列藏本中100%地至少有一个本子是“原本”。
换言之,对于比“底线模型”少一个元素(一个抄本)的模型,目前存在至少一个“原本”的概率是100%。
那么,对于比“底线模型”元素更多的模型,结果如何?
为了简洁,考虑这样的“三本模型”: 甲戌本、庚辰本、己卯本、梦稿本、列藏本在初始时各有一个“原本”和两个“抄本”。
在这个模型下,从15个初始本子中存流5个本子有15!/5!10!=3003种取法,而其中出现今天实际发生的“各版本各有一个本子存世”的情况则有3的五次方共243中取法,概率是243/3003=0.08。
出现“各版本各有一个本子存世”的现状的概率随初始本子数目的增大而减小。
这说明,“初始的”本子(“原本”+抄本)的数目很不可能很多!各有两本的可能性不过13%。各有3本的可能性为8%!
此时现存甲戌本、庚辰本、己卯本、梦稿本、列藏本都不是“原本”的概率为2/3的五次方,即32/243,约13%。我们作出“今存本中有原本”的正确概率仍然有87%!
III.
如果我们把王府本、甲辰本、舒序本也作为和其他五本同样地位的“手本”加入到模型里,那么对于“各版本初始有一原本+一抄本”模型,“各存一本”的概率是
(2的八次方)/(16!/8!8!)=(2的八次方)/(2X3X2X13X2X11X10X3/(4X2))=(2的八次方)/(3X13X11X10X3)=(2的七次方)/(3X13X11X5X3)=128/6435=0.020,约为百分之二。
如果只把王府本、甲辰本、舒序本之一作为和其他五本同样地位的“手本”加入到模型里,那么对于“各版本初始有一原本+一抄本”模型,“各版本各存一本”的概率是
(2的六次方)/(12!/6!6!)=(2的六次方)/(2X11X2X3X2X7/2)=(2的六次方)/(2X11X2X3X7)=(2的四次方)/(11X3X7)=16/231=0.070,约为百分之七。
可见,随着版本数目的增大,“各版本各存一本”的现状的概率较快地减小。“五版本”模型下为13%,“六版本”模型下为百分之七,“八版本”模型下为百分之二。
在“六版2本”模型下,“现存六版均非原本”的概率是2的六次方的倒数,为1/64=1.5%,而“有原本”的概率约98.5%
在“八版2本”模型下,“现存八版均非原本”的概率是2的八次方的倒数,为1/256=0.4%,而“有原本”的概率约99.6%
“有原本”的概率快速趋于1。
在“六版3本”模型下,“现存六版均非原本”的概率是2/3的六次方,为64/729=8.8% 而“有原本”的概率约91%
在“八版3本”模型下,“现存八版均非原本”的概率是2/3的八次方,为256/6561=4%而“有原本”的概率约96%
IV.
对模型的修正:考虑到“原本更被重视,因而其被保留的概率大于抄本”,假定“原本被保留的概率比抄本大一倍”,则
在“五版2本”情况下,“现存五版均非原本”的概率是1/3的五次方,为1/125=0.8%。比不修正时的3%大为减小。而“有原本”的概率约99.2%
结论:
在至少现存的甲戌本、庚辰本、己卯本、梦稿本、列藏本是“不同版的改本”的情况下,按照概率理论,这些“不同版的改本”很不太可能都有多于一个的“抄本”。而且,现存的甲戌本、庚辰本、己卯本、梦稿本、列藏本中有至少一个“原本”的概率很大(约90%甚至更大),而在考虑“原本被珍视”的修正因素后,“现存五本中至少有一是原本”的概率更大。
[ 本帖最后由 ptcn 于 2009-1-7 12:38 编辑 ]
作者:
ptcn 时间: 2009-1-6 22:57
原帖由 墨叶 于 2009-1-6 22:25 发表
使用附件中的计数器。
10!/(5!5!)=252
1/252=0.003968253968253968253968253968254
15!/(5! 5!)=90810720
1/90810720=1.1011915773820535725297630059535e-8
16!/8!8!=12870
1/12870=7.7706115471 ...
多谢!多谢!
我已经被数字搞晕了,你帮了我大忙。
作者:
ptcn 时间: 2009-1-6 23:23
原帖由 墨叶 于 2009-1-6 22:27 发表
总感觉楼主的证明过程不合理。
主流“红学”(以及一般意义上的“考证派”)遭遇困境的一个原因,在于其工具/方法(基于“三基本原则”的考证方法)的粗陋和匮乏。
我这里提出的概率分析方法,在现代理工的层次上自然是肤浅的,但比“考证派”的工具还是要新颖和独特的。所以,抛砖引玉嘛。
附:
考据学三基本原则:
1、第一手材料原则
2、孤证不立
3、证人与证明对象的关系
[ 本帖最后由 ptcn 于 2009-1-7 12:43 编辑 ]
作者:
ptcn 时间: 2009-1-7 12:56
20选5的计算出现错误,导致结果有数量级的差错,已修正。
在5版各4本以上的情况下,出现今天这样“各存一本的概率”已经低于10%。反之,我们本应该有90%以上的运气能看到“同版抄本”,但我们却没有能看到。
另外,每个版本都应该有:至少一个稿本(如梦稿本)、誉清本、抄本。而所谓的“原本”应该包括稿本和誉清本。所以模型里的“原本”至少应该有2个,
而“有无原本问题的底线模型”就应该是:甲戌本、庚辰本、己卯本、梦稿本、列藏本在初始时各有两个“原本”和一个“抄本”。
这样的模型下,“有原本”的概率要更大。
另外还有一个考虑因素,就是曾经存在更多的版本,但只有一部分版本流传下来。这个因素会减小“有原本”的概率,但究竟减小多大程度还需要计算。
但如果王府本、甲辰本、舒序本能被确定为“脂定本”的话,再有额外的“脂定本”的可能性已经不大了。
脂砚可能会搞过多达10个版本?但不太可能超过20个。
作者:
一般般 时间: 2009-1-8 01:18
说话某书再版10次,每出版一次作者都会做出一定的修改。那么按楼主的理论这再版的10次中必有一个是原本的机率机乎是100%。。但事实上,他们都是再版。
作者:
ptcn 时间: 2009-1-8 23:11
原帖由 一般般 于 2009-1-8 01:18 发表
说话某书再版10次,每出版一次作者都会做出一定的修改。那么按楼主的理论这再版的10次中必有一个是原本的机率机乎是100%。。但事实上,他们都是再版。
确实需要先澄清“原本”的定义。
但红学家们恰恰没有做这个澄清。
欢迎光临 轩辕春秋文化论坛 (http://xycq.org.cn/forum/) |
Powered by Discuz! 5.0.0 |