用字统计证明《红楼梦》后四十回与前八十回是同一作者创作
By金品之
(以下仅为纲要)
一
假设:
文学是语言艺术。作家拥有个人独特的语言风格和遣词造句习惯。在长篇巨作中,这种风格和习惯会大致保持一致,不因内容变化而呈现显著差异。表达情感的语词可能例外。《红楼梦》后四十回与前八十回是否同一作者创作,可据此证明之。
二
方法:
取书中用得最多的36个字词,考其在前80回和后40回出现的频次。然后计算比例。若前80回频次/全书频次≈0.67,后40回频次/全书频次≈0.33,后40回频次/前80回频次≈0.5,则证明《红楼梦》后40回与前80回为同一人创作。
三
样本:
取样字词排序,主要参考网络公开发布的《红楼梦用字表》(北美大牛,2013),但各字词使用频次均经我重新逐一核定。可能因为所用版本和统计工具不同,我的数据与用字表有别。36字词分三次统计,每组12个。(寓意12钗、副冊、又副冊。一笑!)36字词依次借用三十六个干支标记。
请注意:这绝对是一项大样本研究,该36字词在全书出现频次为265085次,全书总字数为732115个。265085/732115=0.36.就是说,《红楼梦》七十多万字,其中将近四成用的就是这36个字!36字的出频正好占全书字数的36/100,这也真是巧合!
四
数据
(一)红楼梦用得最多的12字
全120回
前80回
后40回
前/全
后/全
后/前
甲子=21216
14266
6950
0.67
0.33
By金品之
(以下仅为纲要)
一
假设:
文学是语言艺术。作家拥有个人独特的语言风格和遣词造句习惯。在长篇巨作中,这种风格和习惯会大致保持一致,不因内容变化而呈现显著差异。表达情感的语词可能例外。《红楼梦》后四十回与前八十回是否同一作者创作,可据此证明之。
二
方法:
取书中用得最多的36个字词,考其在前80回和后40回出现的频次。然后计算比例。若前80回频次/全书频次≈0.67,后40回频次/全书频次≈0.33,后40回频次/前80回频次≈0.5,则证明《红楼梦》后40回与前80回为同一人创作。
三
样本:
取样字词排序,主要参考网络公开发布的《红楼梦用字表》(北美大牛,2013),但各字词使用频次均经我重新逐一核定。可能因为所用版本和统计工具不同,我的数据与用字表有别。36字词分三次统计,每组12个。(寓意12钗、副冊、又副冊。一笑!)36字词依次借用三十六个干支标记。
请注意:这绝对是一项大样本研究,该36字词在全书出现频次为265085次,全书总字数为732115个。265085/732115=0.36.就是说,《红楼梦》七十多万字,其中将近四成用的就是这36个字!36字的出频正好占全书字数的36/100,这也真是巧合!
四
数据
(一)红楼梦用得最多的12字
全120回
前80回
后40回
前/全
后/全
后/前
甲子=21216
14266
6950
0.67
0.33
