运用大数据的社科研究尚在探索之中

赵琪 中国社会科学报 2016年11月24日03版

  用数据作分析已经成为当前科学研究大趋势。人们常常能够看到自然科学领域学者利用各种各样的数据解决科学难题。然而,社会科学领域学者对大数据的应用,仍在不断探索当中。近期,美国塞奇出版社发布报告《谁在做计算社会科学?大数据研究趋势》(Who Is Doing Computational Social Science?Trends in big data research)。报告认为,在社会科学领域中,使用大数据和运用大数据方式解决问题的学者并不十分普及,社会科学领域与大数据之间的关联程度也还不够,已使用大数据的学者在日常科研中还会遇到很多问题。为什么会出现这样的情况?本报记者采访了相关学者。

 大数据吸引社科学者目光

  数字化时代产生了非常多的数据源,它们可以来自社交媒体、非结构化文本、数字传感器、财务和行政事务处理表格等,一些数据甚至已成为具有应用性的商品。有人认为,对大数据的使用是年轻学者的“游戏”,但报告结论发现,事实并非如此。报告作者之一、塞奇出版社研究方法中心研究员凯蒂·梅茨勒(Katie Metzler)在报告中提到:职业生涯与数据使用之间没有必然联系。

  梅茨勒说,这份报告通过调查世界各地的社会科学研究者,了解他们从事的研究是否与大数据有关,以及在实际应用中遇到的困难和挑战,总结当前社会科学领域应用大数据的趋势。从调查结果看,社会科学研究者有兴趣增强自己与大数据之间的联系,但其中仍存在挑战,例如,如何设计研究过程?怎样才能获得可靠的数据?

  梅茨勒表示,起初研究人员与世界各地近50万名社会科学领域专家取得联系,最后收回9412份完整的调查问卷,其中有7933份来自学术界,其余的来自政府部门等。收回的问卷中较多的来自美国、英国、印度和加拿大,此外还有35个国家至少完成了50份问卷。可以说,此次问卷调查具有全球性。受访者在学科分布上也较全面,包括教育学、心理学、健康科学,收回超过1000份问卷,而文学、历史学、政治学、经济学、哲学、人口学、犯罪心理学等也收到了问卷回复。调查结果显示,1/3的受访者自定义其使用过大数据或大数据方法进行学术研究。在这些学者中,约60%的人在过去12个月中使用过大数据。而在其他2/3尚未接触过大数据的学者中,一半提到未来打算接触大数据或未来一定会把大数据运用在其科研中;剩下的一半学者不期望接触和运用大数据。

  英国埃塞克斯大学社会学研究方法中心教授尼克·阿勒姆(Nick Allum)在接受本报记者采访时表示,从报告结论中可以看出,社会科学领域中对大数据的使用并不是很普及,这可能与社会科学学科有关。可以预见,那些常与数据打交道的学科,如社会学、统计学、经济学等可能会应用大数据,而哲学、历史学、文学等学科几乎用不到大数据。其实,使用大数据可以从另一个视角打开科研新思路,因此,未来如何让那些看起来与大数据不大相关的学科应用大数据至关重要。阿勒姆表示,要想采用以大数据为基础的学术研究方法,需要更加了解大数据,以及数据科学的内涵。

探索之路依旧充满障碍

  埃塞克斯大学社会学研究方法中心学者安洁拉·丹曼(Angella Denman)表示,从自然科学研究者处理大数据的方式看,他们可以从事先设计好的仪器中接收到原始数据和信息,这些数据是他们想要的,符合他们的预期,是其科研成功的关键。而社会科学领域学者往往更多或者只能从其他地方,如企业、政府、网络等渠道挖掘和分析数据,但这些数据收集的最初目的大多与学者应用的目的不同。例如,一些社交网站最初并不是为了收集个人相关信息而建立,其目的仅仅是为了协助人们交流和联系。

  丹曼认为,数据来源有限是社会科学领域中大数据应用范围不广的主要因素之一。这一观点在报告中得到了印证。报告提出,在使用过大数据的学者中,他们使用过最常见的数据,首先是不同政府部门收集来的数据,包括卫生、教育或收入等;其次是社交媒体中的数据;最后是一些商业数据。数据来源非常有限,学者即便获得了数据,还需对其拆解和分析,找出可以使用的数据非常困难。同时,需要非常专业的数据分析软件或相关专业人员帮助,这也增加了学者的使用难度。在很多情况下,社会科学研究资助基金申请困难且有限。很多学者想要尝试将自己的研究与大数据关联起来,一旦数据不准确或有缺陷,就会导致整个研究失败,这对学者来说是一个非常困难的选择。

  尽管大数据研究可能作为社会科学发展新的方向,但探索之路依旧充满障碍。因此,现在也是社会科学发展的一个转折点,社会科学发展需要更多新的技能、研究方法和计算工具等。社会科学领域的专家已经准备好应对未来可能面对的挑战,使社会科学知识真正应用于社会发展中。