新浪博客

用字统计证明《红楼梦》后四十回与前八十回是同一作者创作

2019-06-19 08:08阅读:
用字统计证明《红楼梦》后四十回与前八十回是同一作者创作
By金品之

(以下仅为纲要)


假设:
文学是语言艺术。作家拥有个人独特的语言风格和遣词造句习惯。在长篇巨作中,这种风格和习惯会大致保持一致,不因内容变化而呈现显著差异。表达情感的语词可能例外。《红楼梦》后四十回与前八十回是否同一作者创作,可据此证明之。


方法:
取书中用得最多的36个字词,考其在前80回和后40回出现的频次。然后计算比例。若前80回频次/全书频次≈0.67,后40回频次/全书频次≈0.33,后40回频次/80回频次≈0.5,则证明《红楼梦》后40回与前80回为同一人创作。


样本:

取样字词排序,主要参考网络公开发布的《红楼梦用字表》(北美大牛,2013),但各字词使用频次均经我重新逐一核定。可能因为所用版本和统计工具不同,我的数据与用字表有别。36字词分三次统计,每组12个。(寓意12钗、副冊、又副冊。一笑!)36字词依次借用三十六个干支标记。
请注意:这绝对是一项大样本研究,该36字词在全书出现频次为265085次,全书总字数为732115个。265085/732115=0.36.就是说,《红楼梦》七十多万字,其中将近四成用的就是这36个字!36字的出频正好占全书字数的36/100,这也真是巧合!


数据
(一)红楼梦用得最多的12
120
80
40
/
/
/

甲子=21216
14266
6950
0.67
0.33
0.49


乙丑=
0.65
0.35
0.51


丙寅=
0.67
0.33
0.50


丁卯=
0.72
0.29
0.40


戊辰=
0.65
0.35
0.53


己巳=
0.66
0.34
0.51


庚午=
0.65
0.35
0.53


辛未=
0.63
0.37
0.58


壬申=
0.65
0.35
0.54


癸酉=
0.70
0.30
0.43


甲戌=
0.70
0.30
0.44


乙亥=
0.71
0.29
0.41

一总
211458
0.67
0.33
0.49


211458/732115=0.29

(二)红楼梦用得次多的12
120
80
40
/
/
/

丙子=
0.72
0.28
0.39


丁丑=
0.68
0.32
0.47


戊寅=
0.61
0.39
0.63


己卯=
0.67
0.33
0.50


庚辰=6089
4023
2066
0.66
0.34
0.51


辛巳=
0.66
0.34
0.52


壬午=
0.66
0.34
0.52


癸未=
0.65
0.35
0.54


甲申=
0.73
0.27
0.37


乙酉=
0.74
0.26
0.36


丙戌=
0.72
0.28
0.38


丁亥=
0.59
0.41
0.70

二总
71132
0.67
0.33
0.49


71132/732115=0.10

(三)红楼梦用得再次多的12
120
80
40
/
/
/

戊子=
0.57
0.43
0.75


己丑=
0.60
0.40
0.68


庚寅=
0.69
0.31
0.44


辛卯=
0.62
0.38
0.61


壬辰=
0.66
0.34
0.50


癸巳=
0.57
0.43
0.75


甲午=
0.64
0.36
0.57


乙未=
0.62
0.38
0.60


丙申=
3381
586
0.85
0.15
0.17


丁酉=
0.65
0.35
0.55


戊戌=
0.69
0.31
0.44


己亥=
0.54
0.46
0.84

三总
52176
0.64
0.36
0.48


52176/732115=0.07

全总334766
0.66
0.34
0.49



结果:
假设被精准证实。(最多十二字均比0.67
0.33
0.49
,次多为
0.67
0.33
0.49
,再次多为0.64
0.36
0.48
,三十六字总均比为0.66
0.34
0.49

如假设本身无逻辑缺陷,则“红楼梦》后四十回与前八十回是同一作者创作”命题成立。
(附注:36字词中唯一偏移太大的用“丙申”标记的那个字是“笑”,它的偏移证实假设中“表达情感的语词可能例外”的猜想。详见前贴《对《红楼梦》书中所用“笑”和“笑道”的统计及寓意诠释》。另,反义词“哭”可援为旁证:“哭”在全书出頻601次,前部269,后部332,反超很多。)


我的更多文章

下载客户端阅读体验更佳

APP专享