高于|杜甫影响力高于李白?大数据研究唐诗宋词结论很颠覆

大数据研究唐诗宋词 结论很颠覆
用大数据分析:唐代诗人白居易作品量第一 但影响力排十名之外 宋词名篇中收录词作最多的不是苏轼、辛弃疾而是周邦彦
用大数据分析唐宋诗词 , 结论可能超出你的想象——唐代诗人中作品量居第一的白居易 , 影响力排在十名之外;宋词名篇中收录词作最多的不是苏轼、辛弃疾而是周邦彦;综合影响指数表明 , 杜甫高于李白、辛弃疾强于苏轼……
以上新发现 , 是国家社科基金重大项目“唐宋文学编年系地信息平台建设”首席专家、四川大学文学与新闻学院讲席教授王兆鹏分析所得 。

唐诗是中国诗歌史上第一座高峰 。 唐代诗歌五万多首 , 诗人三千余位 , 诗人和诗作都达到前所未有的量级 。 宋代词人近一千五百位 , 词作超两万一千阕 。
从个体诗人来看 , 唐诗宋词里谁的作品最多?王兆鹏的大数据显示 , 白居易名列唐诗作品量的榜首 , 诗作近三千;杜甫和李白紧随其后 , 都超过千首大关 。 宋词中辛弃疾的词作量位居第一 , 有六百余阕 , 其次是苏轼、刘辰翁 。 宋诗的篇数 , 则由陆游称雄 , 凡九千多首 , 其次是刘克庄和杨万里 。
根据综合影响指数排名 , 唐代诗人影响力第一的是杜甫 , 其次为李白、王维 , 而作品量居第一的白居易 , 影响力排在十名之外 。 宋代词人作品量和影响力第一的都是辛弃疾 , 苏轼和周邦彦分别居第二、第三 。 高居宋诗影响力榜首的是苏轼 , 作品量雄居榜首的陆游紧随其后 。
提到唐诗宋词的名家 , 人们习称“李杜”“苏辛” , 似乎李优于杜、苏胜于辛 。 但综合影响指数表明 , 杜甫高于李白、辛弃疾强于苏轼 。 更令人意外的是 , 最受追捧的词人不是苏、辛而是周邦彦 。 在一百首和三百首宋词名篇中 , 周邦彦各占十五首和四十首 , 占有率远高于苏、辛 。
用客观的数据去衡量、分析颇为主观的诗词鉴赏 , 是否科学、能否可行?在接受北京青年报采访人员专访时 , 王兆鹏强调 , 虽然数据能在一定程度上描述显示文学史的发展面貌和进程 , 但也有明显的局限性 。
30年前开始研究
积累了上百万条数据
问:《大数据里的唐宋诗词世界》课题的初衷是什么?
答:我1992年就开始做唐宋诗词的定量分析了 。 初衷是每人心目中都有自己的唐宋诗词名篇 。 究竟历史上哪些唐宋诗词被视为名篇 , 我想用统计数据来分析衡量 。
问:那您是如何利用大数据来衡量唐宋诗词质量的呢?这些数据是如何统计出来的?
答:唐宋诗词作品的质量 , 目前还没找到有效数据来评估、衡量 。 我目前正在努力尝试构建文学作品质量的评价指标体系 , 以便搜集数据 。 这需要比较长的过程 。 此外 , 个人建立的评价指标体系 , 需要学界的认同和共识 。
问:关于文学指标体系 , 学界目前的研究现状怎样?
答:大数据时代的文学数据 , 需要分类分层建立起文学史数据的指标体系 , 以确保数据的信度和效度 。 但目前用大数据来做唐诗宋词研究的学者不多 , 为学界共享的唐宋诗词大数据也相当有限 。
从1992年到现在 , 我虽然积累了一百多万条和唐诗宋词有关的数据 , 但还不完备、不均衡 。 有的时段数据多 , 有的时段数据少;有的这一类数据多 , 那一类数据少;有的诗人数据多 , 有的诗人数据少 。 我们常感慨“书到用时方恨少” , 数据更是这样 。 全方位分析唐诗宋词时 , 常常觉得数据不够用 。
在我看来 , 文学评价指标体系应该以作品为中心来建立 。 作家的影响力是以作品的影响力为前提 。 而作品评价 , 可分两个维度 , 一是相对稳定作品的内在文学价值 , 二是动态不居作品的外在影响力 。 其文学价值 , 可考虑从内容和形式两个层面来评估 。