作品影响力则从创作者、评论者、普通读者三个层面来衡量 。 一是对创作者的影响 , 包括引用、化用、仿效、改编、翻译等 , 体现出作品的典范性和吸引力;二是对评点者的评论和学者的研究 , 反映出作品在文学批评、学术研究层面的美誉度和关注度;三是在普通读者中的传阅度和知晓率 。 确定作品的价值、影响的基本要素和结构后 , 再构建计算模型 , 然后由计算机在相关资源库、语料库和网络运行 , 挖掘提取相关数据 , 最后计算出每篇作品的得分 。
数据无法测度艺术含量
和审美价值高低
问:您在课题里提到 , 据统计 , 东汉到隋末近六百年 , 诗歌总共才五千余首 , 而到唐代 , 诗歌第一次超过万首并直接跨越到五万多首 。 唐诗比之前的八代诗增加了七倍多 , 诗人由六百余位增加到三千余位 , 诗人和诗作都达到前所未有的量级 。 这个数据从何而来 , 有参考哪些重要的文献资料吗?
答:数据来源于我的老朋友尚永亮教授的两篇论文:《八代诗歌分布情形与发展态势的定量分析》和《唐知名诗人之层级分布与代群发展的定量分析》 。
问:白居易的诗数量最多 , 影响力却在前十名开外 , 这是如何判定的?
答:用数据衡定的 。 我们用了多种数据 , 对唐代诗人影响力进行排名 。 白居易的影响力 , 在现当代大于古代 。 他的综合影响力 , 远不如李白、杜甫 。
问:那您通过大数据判定唐诗宋词质量的依据是什么?
答:目前只能用大数据衡量唐诗宋词影响力的大小——包括对后代词人创作的吸引力 , 在后代词评家中的美誉度 , 在普通作者中的知名度等等 。 目前暂时还不能用数据测度唐诗宋词艺术含量和审美价值的高低 。
文学中心在北宋初
就完全移到南方
问:用大数据研究唐宋诗词有无遇到一些学术上的困难 , 又是如何克服的?
答:文学研究从来没有数据意识 , 困难不仅在于到哪儿去找数据 , 更在于找什么样的数据 。 究竟什么样的数据有用有效 , 既需要理论的支撑 , 也需要在实践中检验 。 理论上 , 我们不断探求 , 从统计学、计量信息学和计量历史学中去寻找理论和方法的启示;实践上 , 反复试验 , 失败了重来 。 最痛苦的是 , 数据库建好了 , 文章也写完了 , 忽然发现数据来源不全 , 只好从头补齐数据 , 写好的论文又推倒重来 。
问:您在大数据具体研究中还有哪些新发现呢?
答:数据的意义 , 既能确证传统的结论 , 也会修正传统的结论 , 更能发现新问题 , 改变传统的认知 。 比如 , 中国文化地理有一个著名的结论 , 中国文化中心 , 是由北方中原逐步向南方移动 , 第一次南移是东晋永嘉之乱 , 第二次南移是唐代安史之乱 , 第三次南移是宋代靖康之乱 。 三次战乱推动了文化中心的南移 , 靖康之乱后 , 文化中心就彻底移到南方 。 我们的大数据发现 , 文学中心在北宋初就完全移到南方 , 南方作者的数量全面超越北方 , 无需等到靖康之乱后 。 而且 , 战争不是推动文化中心南移的唯一因素 。
我们还发现 , 宋代的文学中心 , 是逐步向东南沿海移动 。 按今天的地市级行政区划来统计 , 宋代福建南平的作者人数最多 , 名列第一 , 福州居第二 , 这很让人惊讶 。 与此相关的是 , 宋代进士人数福州第一 , 南平第二 。 可见当时南平、福州教育发达 , 进士多 , 诗词作者也多 。 教育与文学是高度正相互的 。
此外 , 我们还发现苏东坡词的创作高峰是在黄州 , 他三分之一的词是在贬谪黄州期间写的 , 他的名篇佳作一半是在黄州写的 。 比如宋词的第一名篇《念奴娇·赤壁怀古》就是在黄州写的 。 黄州成就了苏轼词作的辉煌 。 (文/采访人员 张恩杰 统筹/刘江华)
- 高于|杜甫影响力高于李白?大数据研究唐诗宋词结论很颠覆
- |以诗载画的杜甫和他对竹的态度:新松恨不高千尺,恶竹应须斩万竿
- 瑞幸|传奇世界:如何对抗宠物宝宝级别高于自己的道士?
- |从杜甫诗看七律句式特点04,无数蜻蜓齐上下,一双鸂鶒对沉浮
- |从杜甫诗看七律句式特点03,峣关险路今虚远,禹凿寒江正稳流
- 七律|从杜甫诗看七律句式特点02,沙村白雪仍含冻,江县红梅已放春
- 杜甫|为众人抱薪者,虽已冻毙于风雪,薪火犹在
- 诗圣|杜甫使用的七律句式01,永夜角声悲自语,中天月色好谁看
- 杜甫|八首幽默诗词:买得一枝春欲放,倚门回首,却把青梅嗅
- 诗圣|公元767年,杜甫写下一首诗,成为古今七律巅峰,千年来无人能超越