计算机与“红学”研究综论
何其芳_红学_研究综述_徐川

⑥
— —纪 念 何 其 芳 中国社会科学院文 学 研 究 所《衷 心 感 谢 他 — 同志逝世十周年 》 等相关篇章; 有些存在于某些文学 理 论
瑨 瑏 遗产论文如蓝棣之《略论何其芳的文学理论遗产 》 等的相 瑧 瑏
二 〇 一 三 年 第 二 辑
如刘梦溪 关节段中; 有 些 存 在 于 红 学 评 论 著 作 与 文 章 中,
瑏 瑩 《红楼梦与百年中国 》 、 白盾和汪大白合著《红楼争鸣二百 瑠 瑐 瑡 瑐 年》 、 陈维昭《红学与二十世纪学术思想 》 、 杜 景 华《红 学 瑐 瑢 瑐 瑣 孙玉明《红 学: 1954 》 等; 还 有 一 些 在 研 究 何 其 芳 风雨 》 、
的专 论 中, 如 薛 瑞 生 《论 何 其 芳 在 当 代 红 学 史 上 的 地
型共名 ” 说是对“典 型 ” 内 涵 的 扩 展 。 他 说: “何 其 芳 的‘典 说, 实际上是对于‘典型 ’ 内容的扩展, 将两个人物 型共名 ’ 的精神内涵从狭隘的阶级 或 时 代 典 型 扩 大 为 更 广 泛 的‘共 。 何其芳提出的‘共名 ’ 观点 …… 确实突破当时正盛 行 名’ 的狭隘的阶级 性 观 点, 进 入 到 更 普 泛 的 人 性 领 域, 从而将
瑣 瑑
何 其 芳 ﹃ 红 学 ﹄ 研 究 综 述
315
典型问题是现实主义叙事文学的核心问题 。 当时文坛 居于支配地位的说法 是: 典 型 是 共 性 与 个 性 的 统 一 。 共 性 典 型 的 个 性 不 过 是 阶 级 性 的 具 体 表 现。 “共 就是阶级性, 名说 ” 的提出, 给文坛带来清新 之 风 。 何 其 芳 提 出 的“典 型 说引起 许 多 学 者 重 视, 肯定其理论价值的具有代表 共名 ” 性的学者包括薛瑞生 、 邓庆佑 、 黄霖 、 贺仲明 、 陶德宗等等 。 薛瑞生认 为“共 名 ” 说 是 何 其 芳 评 红 的 理 论 核 心。 他 说的角度, 从人性和人 评论道: “当代红学正应该从‘共名 ’ 道的角度, 去继续 探 求《红 楼 梦 》 的 思 想、 艺术和人物的丰 富意蕴, 才能继续对《红楼梦 》 作 出美 学和 历史 的评 价。而
统计与红学研究

统计与红学研究计算机、统计学与“红学”研究综论作者:贾洪卫董坚徐锐摘⾃:《红楼博客站》⾃清朝传世⼆百多年以来,《红楼梦》的艺术魅⼒长久地吸引着许许多多国内外研究者和普通的读者。
在这部不朽的名著中,作者塑造了众多的栩栩如⽣的⼈物形象,使⽤了优美、⽣动的⽂学语⾔。
书中还涉及到哲学、经济、教育、诗词、对联、谜语、酒令、成语、修辞、园林、建筑、服装、医药、烹调、戏曲、⾳乐、舞蹈、绘画、爱情、⼼理、外貌描写等领域以及⼈物空间、时间的主体结构和错综复杂的关系,引起了⼈们⼴泛的探索和研究。
⽬前已经形成了⼀门国际性的学问──红学。
近年来关于红学研究现代化,如何运⽤计算机分析⽂学作品的问题,已经引起了社会科学和计算机科学界的普遍关注。
国际上关于建⽴以计算机为代表的现代化“国际红学资料中⼼”的呼声也引起红学界的注意。
在这种形势下,综论计算机与红学研究的历史和现状,介绍其研究内容和存在的问题不仅可以加深⼈们对《红楼梦》这部辉煌巨著的认识和理解,⽽且对于古典⽂学研究的现代化探索也是有借鉴意义的。
计算机应⽤于⽂学作品的研究是近⼗多年的事情。
七⼗年代中期,英国剑桥⼤学的两位师⽣因运⽤计算机侦破伪造莎⼠⽐亚的奇案⽽震动了西⽅⽂学界。
他们对⼀家出版商出版的莎⼠⽐亚新作品,⽤计算机对它的修辞和结构进⾏分析和⽐较。
把新作品中的句型与公认的莎⼠⽐亚作品作⽐较,发现莎⼠⽐亚⼀向不采⽤的修辞和⽤语出现了,句型和结构也同惯⽤的⽅法不⼀样。
他们将⽤计算机分析出来的⼤量证据向法院起诉,使伪造莎⼠⽐亚作品的出版商哑⼝⽆⾔,只得承认作伪。
这项研究成果引起了国内外学者的重视,纷纷利⽤计算机来分析研究别的古典⽂学作品,导致计算机闯进“红学”研究园地。
1980年6⽉。
在美国梦⽃湖畔的威斯康星⼤学召开的⾸届国际《红楼梦》研讨会上,威斯康星华裔学者陈炳藻先⽣宣读了⼀篇《从词汇上的统计论〈红楼梦〉的作者问题》的⽂章,引起了国际红学界的注意和兴趣。
1986年,陈炳藻教授公开发表了《电脑在⽂学上的应⽤:〈红楼梦〉与〈⼉⼥英雄传〉两书作者⽤词的⽐较》⼀⽂;之后⼜出版了《电脑红学:论〈红楼梦〉作者》的专著。
基于数理统计方法的红楼梦研究

统计方法在《红楼梦》前80回与后40回分析的运用高健(南京师范大学统计(金融)系,南京)摘要本文在数据的基础上通过统计方法对《红楼梦》前80回与后40回作了比较分析。
在写作风格方面,运用两个独立样本的假设检验得出前80回与后40回在写作风格上有着较大的差异。
在人物方面,通过K-S检验方法,这几个主要人物人在前后的出场规律有着巨大差异。
在情景分析方面,运用聚类分析,得出在前80回中主要情感色彩是“欢快”的,都大多数情感色彩“沉重”的回合集中在后40回。
关键字两个独立样本的假设检验 K-S检验方法聚类分析(一)引言《红楼梦》是我国四大名著之首,而且有很多悬而未决的问题,把统计学的定量分析方法引入红学研究是很自然的。
华裔学者陈炳藻教授(见[1],[2])在美国威斯康星大学召开的“首届国际《红楼梦》研讨会”上曾发表了通过统计学方法算出相关用词的相关程度,发现前80回与后40回均为曹雪芹一人所作.我国华东师范大学陈大康教授得出了迥异的结论(1987,[3]),它将红楼梦分成3组,通过分析各组之间用词句式,作出推论:后40回非曹雪芹所作(但含有少量残稿).复旦大学李贤平教授的也通过对于虚词运用多元统分析(主成份分析、典型相关分析、聚类分析等),提出了新观点(1987,[4]):《红楼梦》前80回是曹雪芹根据《石头记》增删而成;而后40回则是曹家亲友搜集整理原稿加工补写而成。
东南大学韦博成通过运用各回合对于情景的关注程度(2009,[5]),分析前80回和后40回合的不同。
以上几位学者对于前80回和后40回的不同之处分析主要集中在写作之人写作手法的不同,没有考虑到《红楼梦》这部巨作本身的故事也决定了其前后两部分的不同。
本文基于前面几位学者,不仅从写作风格方面做了简要分析,同时从故事的本身进行的不同异同分析。
在分析写作风格方面,通过多元分析中的两个独立样本的建设检验对于使用虚词的规律进行分析,从霍特林2T统计量的值我们看出,写作风格有着较大的不同。
计算机在人文学科研究领域的应用

计算机在人文学科研究领域的应用计算机在现代社会中的应用已经无处不在,它不仅在科学技术领域发挥着巨大的作用,也在人文学科研究中起到了重要的推动作用。
本文将探讨计算机在人文学科研究领域中的应用,并分析其带来的好处和挑战。
一、文献数字化与文献检索计算机技术的快速发展使得大量的文献可以以数字化的形式存在。
这项技术让人们能够更加方便地获取和管理各种文献资料,为人文学科研究者提供了便利。
通过计算机,人们可以对海量的文献进行全文检索,快速找到自己需要的资料。
同时,数字化的文献也可以在计算机上进行标注、批注和整理,辅助研究者进行文献综述和撰写学术论文。
二、数据挖掘与统计分析人文学科研究通常依赖于大量的数据分析和统计工作。
而计算机强大的数据处理能力使得这一过程变得更加高效。
计算机提供的数据挖掘技术可以帮助人们从庞大的信息中找出规律和模式,进而揭示出一些隐藏在数据中的重要信息。
此外,计算机还可以通过统计分析对文本、调查结果等进行量化分析,提供客观的数据支持。
三、虚拟现实与模拟实验虚拟现实技术是计算机在人文学科研究中的又一重要应用。
通过虚拟现实环境,研究者可以模拟出各种人文场景,比如历史事件、文化遗产等,以便更好地理解和研究。
虚拟现实还可以帮助研究者进行考古挖掘、重建古老建筑等活动,提供真实感观的体验和数据收集。
这为人文学科领域的研究者提供了更多的选择和可能性。
四、自然语言处理与机器翻译在语言学、文学研究等人文学科中,计算机可以发挥自然语言处理和机器翻译的作用。
自然语言处理技术可以帮助人们更好地理解和分析自然语言,包括词语、语法、语义等方面。
同时,机器翻译技术的发展使得不同语言之间的翻译更加便捷和准确。
这可以让研究者更方便地阅读、理解和比较不同语言的文献和资料。
尽管计算机在人文学科研究中带来了很多便利和创新,但也面临着一些挑战和问题。
首先,人文学科的研究对象通常是复杂且主观的,计算机在处理这类数据时往往难以达到人类的思考水平。
电脑技术与文学创作的结合

电脑技术与文学创作的结合在当代社会,电脑技术的迅速发展与文学创作的蓬勃发展相互交织,为文学创作带来了全新的可能性和变革。
电脑技术的广泛应用为作家们提供了更多的工具和平台,使他们能够以更创新、更便捷的方式进行文学创作,进而推动了文学创作的发展和进步。
首先,电脑技术的应用为文学创作者提供了更多的创作方式和媒介。
传统的纸质书籍已经不能满足现代读者的需求,电子书籍的兴起使得读者可以随时随地地获取到自己所需要的文学作品。
同时,电子书籍的推出也为作家们提供了新的创作平台。
作家们可以将自己的作品发布在互联网上,通过电子书的形式进行销售或者分享,这样一来,他们可以更加方便地与读者进行交流和互动,从而获取更多的反馈和意见。
其次,数字化技术的应用使得文学作品的传播范围大大扩展。
传统印刷出版受到时间、空间和成本等多方面的限制,而数字化技术的普及与应用使得文学作品可以以电子书、博客、微信公众号等多种形式在线发布。
这样一来,不仅使得更多的读者可以方便地获取到这些作品,同时也打破了传统文学创作的地域限制,使得文学创作可以更好地面向世界。
再次,电脑技术的发展也为文学创作的实验和创新提供了更广阔的空间。
例如,人工智能技术的应用使得计算机可以学习和模仿人类的写作风格,并生成类似的文学作品。
虽然这些作品是否算得上是真正的文学作品仍存在争议,但这无疑为文学创作带来了新的可能性。
同样,在文学创作过程中,计算机的辅助可以提供多种文学素材和参考资料,使得作家们可以更好地调研和创作。
此外,电脑技术的应用也使得文学创作的编辑和修订过程更加便捷和高效。
传统的编辑和校对工作需要大量的纸质文献和手工操作,而电脑技术的发展使得这些工作可以在电子环境下完成。
文学作品可以通过软件进行排版和编辑,编辑人员可以直接在电脑上进行修改和修订,从而减少了传统纸质工作所需的时间和成本。
然而,尽管电脑技术和文学创作的结合为文学创作带来了巨大的变革和提升,但也面临着一些挑战和问题。
关于红楼梦的统计学

《红楼梦》前80回与后40回某些文风差异的统计分析韦博成一、引言在统计学应用的诸多领域中,文学著作的统计分析是一个饶有兴趣的分支。
美国斯坦福大学教授Efron(19761987)和他的学生曾经对莎士比亚的著作进行过相当深入的统计分析(见[1],[2]),并指出:1985年发现的一篇“无名氏”诗稿(仅9节429字)确为莎士比亚所著。
Efron是当今国际上最著名的顶级统计学家之一,他们的工作在当时引起很大反响,另一位国际顶级统计学家Rao誉之为“一曲统计学的赞歌”(见[3])。
《红楼梦》是我国四大名著之首,而且有很多悬而未决的问题,把统计学的定量分析方法引入红学研究是很自然的。
早在1980年,在美国威斯康星大学召开的“首届国际《红楼梦》研讨会”上,该校华裔学者陈炳藻教授首次报告了他在这方面的研究工作(见[4],[5]),此后还出版了专著(见[6])。
陈教授将《红楼梦》120回分为三组,每组40回,并将《儿女英雄传》作为对照组进行比较研究。
他从每组中任取8万字,挑出名词、动词、形容词、副词、虚词这5种词,然后运用统计学方法算出各组之间用词的相关程度,结果发现:《红楼梦》前80回与后40回所用词汇的相关程度远远超过《红楼梦》与《儿女英雄传》所用词汇的相关程度,并由此推断:前80回与后40回均为曹雪芹一人所作。
但是,我国华东师范大学陈大康教授得出了迥异的结论(1987,[7])。
他也把《红楼梦》120回分成三组,每组40回,并统计了其中所含词、字、句等88个项目。
他发现,这些词在前两组出现的规律相同,而与后40回却不一致;关于用字特点和句式规律,前两组也是惊人的吻合,而后40回则迥异。
由此推断:后40回非曹雪芹所作(但含有少量残稿)。
同时,复旦大学李贤平教授又提出“成书新说”(1987,[8])。
李教授选择了47个虚字为识别特征,诸如:“之、其、或、亦、了、的、不、把、别、好”等等,利用各种统计方法(主成份分析、典型相关分析、聚类分析等),对它们在书中各回的出现频率进行统计分析,探索各回写作风格的接近程度,并用三个层次的聚类方法对各回进行分类。
蔡义江的红学研究——当代学人的红学研究综论之一

V0.9 12 NO 6, 0 0 . 2 1
文 章 编 号 :0 6—2 2 2 1 0 10 9 0《 0 0) 6—0 0 0 9~1 1
蔡 义 江 的 红 学 研 究
一
当代 学人 的红 学研 究综论 之 一
高淮 生
摘 要 : 时期 红 学研 究 最 突 出 的特 征 是 红 学研 究 者 的研 究 成 果 硕 果 累 累 , 其 《 楼 梦 》 究 名 家 的 成 果 以 及 新 尤 红 研
评 红楼 梦》 包括 了“ 校注 ” 的作 品 正文 和 注释 文 字 本 两 大部 分 , 外增加 了每 个 回 目前 的 “ 解 ” 回 目 此 题 和 后 的“ 评 ” 再 加 上 结 合 脂 批 的详 细 评 点 , 分 细 总 , 充
致 地 阐释 了各 个 回 目的原貌 、 目的含 义 , 详细 地 回 并 评 鉴 了每个 回 目的具 体 内容 。另 有 “ 编 ” 附 附有 多 篇专 题文 章 , 系统 地 阐述相 关 重 要 的学 术 问题 。该 著 “ 言 ” : 想 把 自己几 十 年 来 研 究 的 心 得告 诉 前 道 “
实 ” 程 中 全 面 地 呈 现 整 个 现 实 社 会 和 人 生 的 意 过
读 者 , 望他们 能少 受些 迷惑 , 生些误 解 。选题 目 希 少
写 文章 固然也 是办 法 , 总 替 代不 了逐 字 逐 句地 表 但
义, 其最 大 的特色 就是 改 变 历 来 小 说 只着 眼于 故 事
向 , 加 上 1 0回 续 书 因 改 变 作 者 原 意 而 形 成 的 对 再 2
红楼梦 》 中的红学 观点 和红 学 思想 , 联 系 《 楼 梦 并 红
诗 词 曲赋评 注 》 开 较 为 全 面 的评 述 。《 义 江 新 展 蔡
关于红学研究方法论的思考

关于红学研究方法论的思考江苏省如皋市技工学校孙德祥《红楼梦》在它产生的同时,就产生了红学,《红楼梦》在社会上流传影响的历史,也就是红学产生发展的历史。
在数百年的红学史上,流派纷纭,名家众多,研究方法更是多种多样,百花齐放。
旧红学派的评点、题咏、索隐,新红学派的考据求证及五七年以后对《红楼梦》的群众性研究,在红学史上都各领风骚,各有所得。
研究方法的更新和变化,促使红学研究随社会历史的进程不断发展进步,始终具有旺盛的生命力,不断以崭新的面貌出现在社会历史的发展进程中,和社会历史的发展保持着高度的一致性。
但随着社会历史的不断发展进步人们对《红楼梦》的认识理解不断加深,对红学研究也提出了更新更高的要求,旧的研究方法越来越暴露出其时代社会的阶级的思想认识的局限性,也就越来越不能适应当前新的时代社会特点,不能满足人们对红学研究的各种需求,使得目前的红学研究呈现一种沉默徘徊的状态。
要想使得红学研究有所突破,有所建树,使之适应于新的时代社会特点,就首先必须有一个方法论上的突破和创新,必须以马克思主义的辩证法特别是历史的辩证法作为红学研究的最根本的指导方法。
但这种方法论上的突破和创新又不是凭空产生出来的,突破创新的基础和前提还是几百年来的红学研究,突破创新不是对传统研究方法的全盘否定,而是对它的扬弃,发扬光大它的合理成份,剔除舍弃那些旧时代旧社会旧思想认识的糟粕,同时补充大量的新内容新成份新血液,用马克思主义历史辩证法指导下的各种新的科学的研究方法来进行红学研究。
要做到这一点,就必须以马克思主义的世界观和方法论为指导,对红学研究方法作一个传统的未来的全面综合思考,从而指导和促进红学研究不断深入不断发展。
红学研究受中国古代小说研究以至整个古典文学研究的影响,在发展过程中产生了自己传统的研究方法。
在这些研究方法的指导下,全部红学研究取得了大量的研究成果,促进了人们对《红楼梦》的认识和理解。
但时代、社会、阶级的局限性,直接影响着人们思想认识的深度,也就直接影响着各项红学研究工作的发展,使得传统的研究方法带上某些美中不足之处和缺陷,在推动红学研究工作向前发展的同时也限制着研究的深度,阻碍各项研究的继续深入和发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机与“红学”研究综论作者:贾洪卫董坚徐锐摘自:《红楼博客站》自清朝传世二百多年以来,《红楼梦》的艺术魅力长久地吸引着许许多多国内外研究者和普通的读者。
在这部不朽的名著中,作者塑造了众多的栩栩如生的人物形象,使用了优美、生动的文学语言。
书中还涉及到哲学、经济、教育、诗词、对联、谜语、酒令、成语、修辞、园林、建筑、服装、医药、烹调、戏曲、音乐、舞蹈、绘画、爱情、心理、外貌描写等领域以及人物空间、时间的主体结构和错综复杂的关系,引起了人们广泛的探索和研究。
目前已经形成了一门国际性的学问──红学。
近年来关于红学研究现代化,如何运用计算机分析文学作品的问题,已经引起了社会科学和计算机科学界的普遍关注。
国际上关于建立以计算机为代表的现代化“国际红学资料中心”的呼声也引起红学界的注意。
在这种形势下,综论计算机与红学研究的历史和现状,介绍其研究内容和存在的问题不仅可以加深人们对《红楼梦》这部辉煌巨著的认识和理解,而且对于古典文学研究的现代化探索也是有借鉴意义的。
计算机应用于文学作品的研究是近十多年的事情。
七十年代中期,英国剑桥大学的两位师生因运用计算机侦破伪造莎士比亚的奇案而震动了西方文学界。
他们对一家出版商出版的莎士比亚新作品,用计算机对它的修辞和结构进行分析和比较。
把新作品中的句型与公认的莎士比亚作品作比较,发现莎士比亚一向不采用的修辞和用语出现了,句型和结构也同惯用的方法不一样。
他们将用计算机分析出来的大量证据向法院起诉,使伪造莎士比亚作品的出版商哑口无言,只得承认作伪。
这项研究成果引起了国内外学者的重视,纷纷利用计算机来分析研究别的古典文学作品,导致计算机闯进“红学”研究园地。
1980年6月。
在美国梦斗湖畔的威斯康星大学召开的首届国际《红楼梦》研讨会上,威斯康星华裔学者陈炳藻先生宣读了一篇《从词汇上的统计论〈红楼梦〉的作者问题》的文章,引起了国际红学界的注意和兴趣。
1986年,陈炳藻教授公开发表了《电脑在文学上的应用:〈红楼梦〉与〈儿女英雄传〉两书作者用词的比较》一文;之后又出版了《电脑红学:论〈红楼梦〉作者》的专著。
利用计算机对《红楼梦》前八十回和后四十回的用字进行了测定,并从数理统计学的观点出发,探讨《红楼梦》前后用字的相关程度。
他将《红楼梦》一百二十回本按顺序编成三组,每组四十回。
并将《儿女英雄传》作为第四组进行比较研究,从每组中任取八万字,分别挑出名词、动词、形容词、副词、虚词这五种词,运用数理语言学,通过计算机程序对这些词进行编排、统计、比较和处理,进而找出各组相关程度。
结果发现《红楼梦》前八十回与后四十回所用的词汇正相关程度达78.57%,而《红楼梦》与《儿女英雄传》所用词的正相关程度是32.14%。
由此推断得出前八十回与后四十回的作者均为曹雪芹一人的结论。
这项关于著作权之争的研究结论能否为红学界所接受,还存在一定的争论。
但是,这种用计算机进行探索的创造性研究方法,给人们留下了深刻的印象。
《红楼梦》著作权的问题多年来一直争论不休。
目前红学家们普遍的看法是:前八十回为曹雪芹所作,后四十回为高鹗所续。
按照这种看法,从陈炳藻先生的研究结论,我们可以从另一个角度看出,曹雪芹续的《红楼梦》后四十回是相当成功的。
由于高鹗对前八十回研究的深入透彻,不但保持了前八十回的思想倾向和艺术风格,而且在文字风格上也几乎一致。
所以,曹雪芹、高鹗合著的一百二十回本《红楼梦》才被社会普遍承认,一直广泛流传至今,成为中国古典文学的瑰宝。
运用计算机分析研究《红楼梦》为红学研究现代化开辟了一条崭新的道路。
然而,让计算机读懂《红楼梦》似乎神秘莫测。
但是,我们只要了解计算机的特点,就能从这种神奇的应用中认识其本质。
计算机有高速的运算能力,每秒钟可运算百亿次以上来处理由0和1组合成的符号系统和数学模型。
计算机有高超的记忆能力,可以存储整座图书馆书籍和文献的内容。
计算机有高度的精确性和准确的逻辑判断能力,每秒钟可进行成千上万次的逻辑判断,可代替人的部分脑力劳动,把重复、繁重的汉字逻辑判断交给机器高速处理。
计算机还可以自动运行,只要把事先编好的程序输入计算机,就可以自动地指挥计算机工作。
文学作品是语言文字的组合,语言是人类用来表达和交流思想的工具,文字是记录语言的符号。
从计算机科学的角度来看,一部文学作品就是一个符号系统。
因此可以采用计算机技术来理解《红楼梦》这样的文学作品,进行探索和研究。
《红楼梦》一书中前前后后写了三十二个梦,这些梦是否有内在的联系呢?计算机专家们将梦的文学描写变成数字模型,编好程序输入到计算机里,用计算机测定了它们之间的相关程度。
比如第五回“贾宝玉神游太虚境”与第一百一十六回的梦,经过计算机分析,两个梦有许多相同处,“太虚幻境”与“真如福地”的环境名异实同。
因此这两个梦有一定的内在联系。
由此可见,计算机的分析能力是相当惊人的。
1983年以来,国内红学研究者运用计算机探索《红楼梦》,也给红学研究带来了新的活力。
江苏学者彭昆仑等用计算机探索《红楼梦》时间进程和人物年龄问题,取得了成效,解开了《红楼梦》中的年龄谜;对于林黛玉入京都这一年究竟是几岁,红学家们历来就有多种说法──13岁、11岁、9岁、8岁、6岁。
他们选定贾宝玉、林黛玉、薛宝钗等七十二名人物为信息存储对象。
按小说各章节所描写的人物年龄和时令特征,参照有关红学家的研究成果和各种说法,将信息编码存入计算机。
运用数理逻辑对年龄、年序问题进行分析、筛选,获得了初步成功。
计算机认为林黛玉入京都“九岁论”说似乎矛盾点少一些,比较符合生活和文学逻辑。
中央电视台拍摄的电视连续剧《红楼梦》有中关故事纪年、季节和人物年龄的处理意见,曾经采用了这项研究成果。
运用计算机探索《红楼梦》人物年龄方面取得成功后,彭昆仑等人又用计算机定量研究《红楼梦》版本来解决一些疑难问题,成功地运用计算机程序模拟出具有深刻艺术韵味的“怡红夜宴图”。
一百多年来,“怡红夜宴图”一直是困扰红学家的疑案之一。
红学家们为此争论不休,争论的焦点就是参加夜宴的总人数和宴席上的座次排列。
在这个问题上,彭昆仑等人几乎考察了从乾隆年代开始的脂评系统的所有国内版本,也了解了红学各家的研究动态、主要分歧,终于用计算机绘制出他们心目中的“怡红夜宴图”。
他们研制的《探讨怡红夜宴图程序》解决了参加夜宴的总人数和宴席上的座次排列。
计算机能根据使用者的要求显示或打印出《夜宴洒令点数异文及研究者的评判总表》;能自动形成《怡红夜宴图》的各主要研究者的《怡红夜宴图人物座位图》;能找出某些版本存在的错误;能允许使用者随机输入自己的新观点,并对之进行审查。
最后,计算机还能定量评价版本的权威性。
以上这些工作都能在几秒钟之内完成。
这一研究成果,在松花江畔的哈尔滨召开的第二届国际《红楼梦》研讨会上进行了交流,引起了国内外红学家的极大关注。
虽然有的学者对这个计算机模拟的“怡红夜宴图人物座次图”提出了商榷意见,但是这种引入计算机进行探索的方法,毕竟为红学研究揭开了新的一页。
1985年以来,南京工学院(现东南大学)、深圳大学相继开发了《红楼梦》作品研究的计算机数据库系统,把红学研究的计算机化推向了一个新的高潮。
南京工学院与江苏镇江市科委合作开发的《红楼梦》大型数据库系统,在微型计算机中,全文存入人民文学出版社(1982年版)根据庚辰本修订的《红楼梦》一百二十回本原著。
这个《红楼梦》数据库具有原著检索、人物档案处理、统计表格和图形显示四大功能。
提供了4154项检索项目、525名人物简要档案、24份反映近年红学研究的统计表、两幅荣国府、大观园图形、十条人物活动路径,将小说划分为1661个结构模型等项目。
尤其是荣国府大观园平面示意图及路径显示和组合查询功能引起了专家学者的极大兴趣。
计算机系统提供的林黛玉入贾府、刘姥姥一进荣国府、元春省亲等十个人物的活动路径的动态表演,使人“眼花缭乱”。
系统所提供的对原著的综合检索功能,可按文学、哲学、政治、法律、社会、经济、伦理、技艺、音乐和历史等诸方面进行检索。
对文学又分诗词、对联、洒令、谜语、戏曲、文论、诗论和画论等8个方面进行检索。
他们的《红楼梦》数据库系统在1986年6月哈尔滨《红楼梦》博览会上展出并进行操作表演,充分显示了现代科学技术与古典文学相结合的艺术魅力。
深圳大学也研制成功《红楼梦》多功能计算机自动检索系统,为从语言、文学和中国古代文化等方面对《红楼梦》进行研究提供资料。
研究人员将中国艺术研究院《红楼梦》研究所校注、人民文学出版社1982年出版的《红楼梦》作为基础原文全文输入计算机。
人们利用这个检索系统第一次得到了《红楼梦》中一系列重要的统计数据。
如《红楼梦》全书的精确字数是731017个;书中使用不同的汉字4462个,使用最多的是“了”,达21176次;全书有1623个不同的四字格成语,用得最多的是“不在话下”;书中采用了二十四种修辞手法,用得最多的是“比喻”,共408条。
这个计算机系统可对有关语言、文学、古代文化等方面三十个专题二百多个项目进行检索。
研究者使用这个检索系统,可以在1分钟内查到三十个专题范围内的有关内容。
在文学研究方面,可以查到常用修辞手法在《红楼梦》中的用例,各类文学描写的有关段落,每个人物出现的全部场合,诗词中的任何一个篇章。
外貌描写分面容、神情、体态等小类;心理描写分喜悦、忧愁、怨恨、嫉妒等小类;爱情描写分宝玉和黛玉、尤三姐和柳湘莲等小类。
例如:要了解书中有关宝黛爱情的全部描写,只需几秒钟到几十秒钟的时间,计算机荧光屏上就能显示出来,并由打印机自动打印出来。
这个系统还可以用计算机软件的形式为各方面的研究者提供较为完整的《红楼梦》成套专题资料,第一次实现了运用计算机对中国古典名著进行综合研究。
根据电脑检索系统提供的资料,有关人员对红学研究中的一些问题提出了新的看法。
例如,在对《红楼梦》前八十回与后四十回的一些语言风格要素与风格手段,即某些用字、用词及回尾处理的差异做了比较研究后,得出了前八十回与后四十回语言风格存在明显差异的结论,为两者出现不同作者之手提供了有力的证据。
这与从词汇数量统计的结果相比较,似乎更具有说服力。
深圳大学完成的这项《红楼梦》电脑分专题自动检索科研课题在北京通过了国家鉴定。
1987年月10月在慕尼黑举办的联邦德国第一届中文信息电脑处理研讨会上,《红楼梦》电脑检索系统成为一个最引人注目的项目,受到了与会者的高度关注和赞扬。
1987年,复旦大学数学系副教授李贤平的工作引人注目。
他在美国威斯康星大学的计算机前工作了数百小时,绘制了三百多张图纸,运用计算机技术中的模式识别法和统计学家使用的探索性数据分析法,对《红楼梦》进行统计分析、风格分析。
他翻阅了大量的红学研究论文和资料,利用过去红学家发掘的资料进行考证。
把《红楼梦》一百二十回本作为一个整体,以47个虚字为识别特征,对它们在书中各回的出现频率进行统计分析,输入计算机后将使用频率绘成图纸,根据图纸反映出的表明不同创作风格的星云状和阶梯状图形,提出了又一次震惊红学界的《红楼梦》成书过程新观点,证明了《红楼梦》各回写作风格具有不同的类别,各部分实际上是由不同作者在不同时期里完成的。