随着工业化、城市化的进行和新的通讯技术的兴起,由个人所延展开的社交网络日益多变、复杂,社会呈现越来越网络化的趋势,发生“社会网络革命”(social network revolution),与移动革命(mobile revolution)、互联网革命(internet revolution)并列为新时期影响人类社会的三大革命。在此背景下,大数据视角下的文学研究团队(以下简称大数据团队)以社会网络分析工具为技术基础,以《红楼梦》《西游记》《三国演义》《水浒传》四部中国文学史经典作品为数据来源,建构四大名著人物社会关系可视化网络,进而研究个体与社会网络的关系。
7月27日,大数据团队在老师的指导下,聚在一起讨论与构思了数据收集、整理、架构的方案,随后各自来到图书馆、自习室工作。先确定主体框架,选定数个重要节点,再以重要节点为中心拓展社会关系,如《红楼梦》四大家族,《西游记》取经过程,《三国演义》三足鼎立,《水浒传》一百单八将;接着构建网络,对照书本,完善各个人物之间的关系并标明;进而调整布局,对各个节点在图表中的位置进行调整,确保作品的美观性、完整性;最后进行数据分析,基于完成的可视化图表,观察作品人物的关系。这项工作持续了整整一天。
为了确保数据的科学性,大数据团队对其进行了严格的挑选:.《红楼梦》的人物关系数据采自前八十回所出现所有人物,版本为周汝昌所校人文程乙本;《西游记》的人物关系数据选取全书所有人物,版本为人民文学出版社1980年第二版;《三国演义》的人物关系数据选取全书所有人物,版本为通俗演义版本;《水浒传》则选择了大聚义前所有人物,版本为繁本。
大数据团队表示,要从《红楼梦》73万,《西游记》86万,《三国演义》80万,《水浒传》96万的海量文字中提取错综复杂的人物关系是一项繁琐、工作量巨大的任务,因此他们仍然在不断完善和补充这份作品,但为了作品的美观性,他们选取了其中最具代表性的一部分数据用于展示。同时,大数据团队所采用的工具为NodeXL。虽然NodeXL支持网络录入数据,但是由于文学作品的特性,机器无法完整、正确地理解文学人物之间的关系,需要人工录入并进行分析与判断。最后为了作品的美观性,大数据团队选择了手动布局,调整与排版全部手动完成。尽管工作复杂,团队成员都表示这是对古典文学的再吸收、再阅读,是一项令人振奋的工作。
此次基于四大名著的数据可视化是大数据团队利用NodeXL对社会人文领域进行的一次探索,也是他们对大数据可视化在人文艺术方面的应用进行的一次尝试。NodeXL作为众多工具中的一种,对此次的研究与探索起到了重要作用。与此同时,大数据团队的成员们也在本次设计中得到了启发与思考:如何更好地发挥大数据在人文研究领域的作用?在传统与现实的交汇中我们还能做些什么?理论上的真,艺术上的美如何更好地结合?这些问题都将对今后的研究起到重要影响。
http://www.dxsbao.com/shijian/224673.html 点此复制本页地址