多面向的鲁迅:大数据、民间及东亚的视野

复旦大学中文系博士后战玉冰应南方周末之邀,用一款大数据软件分析了鲁迅著作和鲁迅相关的研究论文,找到了其中的高频词。结果显示,在与鲁迅相交往的人物中,“章士钊”和“陈西滢(陈源)”出现频次最高,其次分别是“胡适”“徐志摩”“杨荫榆”“林语堂”“梁实秋”“高长虹”。由此不难看出鲁迅的朋友圈或者他文章里最喜欢吐槽的人。

对《鲁迅研究月刊》上发表的全部文章“机读”后发现,在与鲁迅相关的人物中,“周作人”一直是学者们最为关注的。

责任编辑:刘悠翔

2021年9月28日,鲁迅长孙、鲁迅文化基金会会长周令飞在国家图书馆出席《鲁迅手稿全集》新书首发式。 (视觉中国/图)

2021年9月,一位“阅读者”统计鲁迅全集和四十年来的《鲁迅研究月刊》全文,得出了一份报告:

鲁迅笔下小说人物出现次数最多的是“阿Q”。这不仅因为《阿Q正传》算得上鲁迅唯一的中篇小说,篇幅最长,更是“阿Q”形象深入人心的缘故,在鲁迅《<阿Q正传>的成因》等文章及很多往来书信中,都反复提到过“阿Q”。

在与鲁迅相交往的人物中,“章士钊”和“陈西滢(陈源)”出现频次最高,其次分别是“胡适”“徐志摩”“杨荫榆”“林语堂”“梁实秋”“高长虹”。由此不难看出鲁迅的朋友圈或者他文章里最喜欢吐槽的人。此外,“袁世凯”“段祺瑞”“蒋介石”“孙中山”等政治人物的名字在鲁迅文章中的出现频次也很高,可见鲁迅后期杂文创作社会性与政治性特色之一斑。

这位“阅读者”是一款大数据软件,由曾任《收获》杂志编辑的走走辞职后带领创业团队开发。这款软件的主要功能有提炼文本关键元素、计算关键词分布及关系、绘制全文情绪曲线,走走想借此尝试将文学评判从主观定性变为客观定量。

走走与复旦大学中文系博士后战玉冰应南方周末之邀,用软件分析了鲁迅著作和鲁迅相关的研究论文,找到了其中的高频词。

如果按每十年为一个单位节点来划分,1980年代的鲁迅研究的关键词中,常常见到“同志”与“革命”的身影,明显带有前一个时代遗留下来的烙印;1990年代“文化”的词频异军突起,此后居高不下,某种程度上很能反映时代转变特征,即研究者的关注重心从鲁迅与革命的关系,渐渐转移到鲁迅的文学研究,乃至文化研究领域。具体到鲁迅小说中的人物,研究者们最喜欢分析的首推《阿Q正传》中的“阿Q”,其次是《伤逝》中的“子君”“涓生”以及《祝福》中的“祥林嫂”。

长期以来,人们普遍相信,细读文学作品是理解作者意图和文本内容的重要(甚至是唯一)途径。随着科技进步,细读这一动作的发出者不再仅限于人,机器的加入,让文本分析开始在“大数据”层面上展开。

无论何时,只要还有人阅读鲁迅,对于鲁迅的探索便不会停止。“机读”大数据尚未抓取到的是,有愈来愈多的人以素心来体察鲁迅心灵的不同面向,由此诞生了众多别开生面的著作。从更宏观的层面观察,鲁迅已然成为“东亚文化共同体”中现代文化的重要内核,如一颗

登录后获取更多权限

立即登录

网络编辑:柔翡 校对:胡晓

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}