利用大数据解读人类传播行为

王广禄 张杰 中国社会科学报 2016年09月28日02版

  计算传播是指由数据驱动、借助于计算方法进行的传播过程,分析计算传播现象的研究领域可称为计算传播学。9月25日,由南京大学等主办的第一届计算传播学论坛在南京举行,来自新闻传播、计算科学等相关领域数十位专家学者与会展开研讨。

  学科兴起依托科技发展

  当前,在数据新闻、计算广告、媒体推荐系统等领域,计算传播技术和手段已得到广泛应用。但直到近几年,“计算传播”和“计算传播学”才被作为概念正式提出。南京大学计算传播学实验中心助理研究员王成军介绍说,作为21世纪以来兴起的计算社会科学的重要分支,计算传播学主要关注人类传播行为的可计算性基础,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,大量收集、分析人类传播行为数据,挖掘人类传播行为背后的机制与原理。

  计算社会科学和计算传播学等研究的蔚然兴起,与人类科技的迅速发展密切相关。南京大学新闻传播学院教授巢乃鹏提到,科技的不断发展使得原先一直存在但难以被记录的相关数据可被发现和记录,使以数据记录人类的传播行为的想法得以实现。比如,我们每个人在互联网上的所有行为都可以被记录下来,在线下的行为数据也越来越多地被电子设备记录。而这些海量的数据逐渐积累,成为分析、描绘人类传播行为以至社会变革的基础数据,计算社会科学和计算传播学在这样的过程中应运而生。

  海量数据的记录保存,成为社会科学的重要研究基础,用计算的方法研究传播学、描述人类的传播行为因此成为可能。王成军谈到,计算传播学非常重视对于数据本身的使用,但数据只是起点,通过数据挖掘、分析,发现人类传播行为的模式,并从机制上对这些模式的出现提供有效的解释,才是其学术研究的价值所在。

  香港城市大学媒体与传播系教授祝建华表示,计算传播学研究需重视“瓶”与“酒”的辩证关系。他分析说,抽样调查、控制实验、内容分析等传统方法,以及行为挖掘、在线实验、文本挖掘等计算方法,是计算传播学之“瓶”;传播过程和效果的存在或变化等现象的发现,或者现象背后原因和机制的发现,是“酒”。计算传播学理论研究的目标,是对这些现象或机制进行解读、分析。

  从“新瓶旧酒”到“新瓶新酒”

  作为一门新兴学科,目前计算传播学的学科框架尚不成熟,人们对于计算传播学内涵和外延的认识也还存在一定分歧,如何从理论和实践上推动相关研究,成为与会学者关注的焦点。

  祝建华提出,从知识生产的角度看,存在复制型实证知识、新填补实证知识、新填补理论知识、崭新前沿知识等区分,第一种是典型的“旧酒”,中间二者可以说是“半新酒”,最后一种才是“全新酒”。相应地,理论研究贡献也存在复制型实证、填空型实证、填空型理论、全新型理论等区分。计算传播学酿造“新酒”、实现研究突破存在不少约束因素,如缺乏好数据、方法不敏感、人类行为相对稳定等。他认为,“新瓶装旧酒”式渐进研究是计算传播学发展的必要阶段,这对于推动学科研究的进步有巨大作用,并且在这样的研究中,可能会涌现、转化出“新酒”。

  数据是计算传播学研究的基础,抓取和分析数据的算法的有效性就显得非常重要。北京大学新闻与传播学院副院长刘德寰认为,当前的大数据运算已解决抓取、简单计算、可视化等问题,未来相对容易解决的有引入经典算法及简单改进、借助软件包解决他人已经解决的问题,而较难的则是如何保证算法的有效性并不断将其改善,比如现在广泛使用的标签推荐、关系推荐、行为赋值等算法,由于数据稀疏、结果不稳定、算法不是基于人的生活等因素,因而均不够完善。他主张,稳定性、人性、数据全面性、分类、变量多元指向、变量交互、注重效率应当成为有效运算的主要原则,并且需要将社会科学诸多领域,如社会学、经济学、政治学、心理学、传播学、营销学的相关知识融入计算过程。

  作为交叉性研究领域,计算传播学需要不同学科领域的学者协同展开研究。“新闻传播学者可能希望利用数据更好地描绘人类的传播行为,技术人员可能着眼于如何将人类传播行为的数据用更好的技术分析处理。”巢乃鹏表示,作为新兴学科,计算传播学一定会逐渐走向传播学前台,成为传播学研究新范式变革的驱动力。这种目标的实现,需要能够对数据进行处理的技术型人员与能够对数据进行有效分析和理论提升的研究者跨越鸿沟、协同合作,在学术对话和思想碰撞中共同探索计算传播学的发展路径。

    记者 王广禄 张杰