数据抓取行为的法律性质——“马蜂窝事件”案例分析

2018年12月05日 16:57 来源:中国社会科学网-中国社会科学报 作者:杨东 吴之洲

  10月20日晚,自媒体公众号“小声比比”发布推文,称大型旅游网站马蜂窝涉嫌大量抓取第三方点评数据,一时引发公众热议。据该公众号称,其在马蜂窝网上共发现了7454个抄袭账号,平均每个账号从携程、艺龙、美团、agoda、Yelp等平台抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评,占马蜂窝官网声称总点评数的85%。随着舆论发酵,马蜂窝于22日上午发布公开声明表示将采取法律手段维护自身权益。10月22日晚间,马蜂窝起诉深圳乎睿数据有限公司、丁子奎名誉侵权案获立案。马蜂窝事件的突然爆发让“数据抓取”站到了风口浪尖,但“数据抓取”却并非马蜂窝的首创。事实上,为在用户、商家和投资人面前展现出巨大流量的假象,有相当数量以用户生成内容(User Generated Content, UGC)为商业核心的互联网平台选择利用网络爬虫技术从其他同类平台抓取用户生成的点评等数据,并将这些内容直接发布在自己的网站上。甚至可以说“数据抓取”已经成为了互联网内容产业的一项“潜规则”。

  侵犯其他平台用户著作权

  从相关媒体大量使用的“抄袭”“搬运”等字眼不难看出,马蜂窝在此次事件中被诘难最多的就是其平台内容的原创性,由此就引出了数据抓取行为是否侵犯著作权的问题。在著作权法领域,马蜂窝事件涉及两个问题:一是点评内容是否受著作权法保护,二是点评内容的著作权归属于谁。

  根据《著作权法》第二条可知,我国著作权法保护的客体为“作品”,所以判断点评内容是否受著作权法保护,实际上就是要判断点评内容是否符合“作品”的构成要件。在网络平台语境下的“点评”,一般是指长度在30—400字之间,配上1—9张图片不等,对旅游中的酒店、美食、交通、景色等个人体验以引发用户共鸣为目的所进行的描述。一般认为,“作品”的构成要件包括:(1)反映一定思想情感;(2)具有独创性;(3)有客观表现形式;(4)可复制。在本案的认定中,由于“点评”是用户在相关的在线旅行平台(Online Travel Agency, OTA)上对相关的旅游产品发表的带有主观色彩的评价,以上(1)(3)(4)三点要件基本都可以满足,独创性标准就成为了主要判断标准。因此,对于用户独立完成、内容丰富详尽的点评,著作权法给予当然的保护;而对于那些字数简短,并未蕴含丰富构思的点评内容,著作权法不予保护。

  我国著作权归属的一般原则是作者原则,即作品一经创作,产生的著作权即归于作者。因而在本案中,对于符合独创性要求的点评内容,其著作权归属于作出该点评的用户。值得注意的是,马蜂窝、携程、美团等平台几乎无一例外地在其用户注册协议中规定了著作权转让条款:“用户接受本协议即视为用户主动将其在本平台发表的任何形式的信息的著作权无偿独家转让给平台所有,该平台有权利就任何主体侵权单独提起诉讼并获得全部赔偿。”作为格式合同,这一条款排除了用户的主要权利,因违反《合同法》第四十条的效力性规定而当然无效,不影响用户对其作出的点评内容享有著作权。综上所述,马蜂窝未经许可复制并在其网站发布点评的行为侵犯了其他平台用户对其点评内容的著作权。

  可能构成不正当竞争

  从我国现有的司法实践来看,数据抓取行为有可能构成不正当竞争行为。2017年8月30日,上海知识产权法院作出(2016)沪73民终242号判决,依据《反不正当竞争法》第二条一般条款认定百度地图通过搜索技术从大众点评网等网站获取信息并直接提供给网络用户的行为构成不正当竞争行为。上海知产法院在判决书中指出:“大众点评网上用户评论信息是汉涛公司付出大量资源所获取的,且具有很高的经济价值,这些信息是汉涛公司的劳动成果”,“百度公司在百度地图和百度知道产品中大量使用来自大众点评网用户的评论信息,已对大众点评网构成实质性替代,这种替代必然会使汉涛公司的利益受到损害,其行为超过必要限度,违反公认的商业道德,构成不正当竞争”。在马蜂窝事件中,马蜂窝网的行为与前述百度公司的行为十分相似,都是利用爬虫技术大量抓取并使用来自其他平台的用户点评信息,因而携程、艺龙、美团等平台可就其平台内被抓取的点评信息向马蜂窝主张反不正当竞争法意义上的损害赔偿。

  需要强调的是,数据抓取并不必然构成不正当竞争行为。上海知识产权法院等多家法院在适用一般条款对数据抓取行为进行规制时都采用了十分谨慎的态度,并对构成不正当竞争的数据抓取行为提出了一系列要求,如要求抓取行为对被抓取方造成了实质损害、抓取行为违反诚实信用原则和公认商业道德等。因此,对于那些用户已在多个平台发布且希望其他平台转发的内容,或是平台网页Robert协议允许抓取的内容而言,不应盲目认定相应的抓取行为构成不正当竞争行为,而应有选择地将其纳入竞争自由的范围。

  侵害个人权益

  在马蜂窝事件中,马蜂窝网抓取数据的行为明显侵犯了消费者的知情权。《消费者权益保护法》第八条规定了消费者有知悉商品真实情况的权利。作为旅游信息服务的提供者和经营者,马蜂窝理应承担《消费者权益保护法》所规定的义务,这种义务并不能因为用户支付的对价较低或未支付对价而被免除。马蜂窝的网站上存在大量来自于其他平台的点评信息,马蜂窝自身不能控制这些信息的真实性。尽管如此,它还是在官网上对外宣称其“拥有2100万条真实点评”,这显然是侵犯了消费者的知情权。不仅如此,其在官网上对于点评真实性的描述具有商业广告的性质,因而可能构成《广告法》意义上的虚假宣传。

  事实上,数据抓取行为还牵涉到一种重要的法律权益——个人信息权益。在不断迈向大数据时代的今天,个人信息保护已经成为了一个日益严峻的课题。个人信息在本质上体现为个人人格尊严和自主决定,因此权利人对业已公开的个人信息享有支配权。具体而言,数据收集者、处理者在收集处理个人信息时应当满足知情同意规则的要求,并遵循合法、正当、必要的原则。目前来看,虽然我国的专门立法程序尚未完成,但2012年通过的《全国人民代表大会常务委员会关于加强网络信息保护的决定》第二条、2017年施行的《网络安全法》第三十五条以及《民法总则》第一百一十一条都对信息的收集、处理作出了明确的要求。在马蜂窝事件中,用户的点评数据包含了大量的个人信息,甚至可以说正是点评中充满真情实感的个人体验才让点评本身具有价值。因此,对具有可识别性的点评信息的收集、处理必须满足个人信息保护的相关要求。显然,马蜂窝在抓取其他平台用户的点评数据时并未做到知情同意,更未符合合法、正当、必要原则的要求。毫无疑问,马蜂窝平台的行为侵犯了用户的个人信息权益。

  以共票制度重塑OTA平台激励制度

  出于“技术中立”的原则,数据抓取本身并不天然具有违法的基因。相反,爬虫技术为互联网领域,尤其是搜索引擎、大数据分析等领域的发展作出了重要的贡献。但若对数据抓取行为不加以限制约束,收集、处理、经营数据的相关平台以及提供优质内容的用户的权益便都无法得到保障,从长远来看必将对互联网内容产业产生负面影响。我们认为,马蜂窝事件所呈现的乱象在很大程度上是由于行业内缺乏一套可持续的激励机制,而以区块链等技术为基础的共票制度将有助于重塑OTA平台的激励制度。

  对于马蜂窝等OTA平台而言,其当前发展存在着一对突出的矛盾——潜在消费者对真实优质点评内容的热切渴望与消费者贡献真实感受的动力不足。虽然各类OTA平台也推出了各种措施与手段力求消费者增加对于点评的参与度,但是现有激励制度存在以下突出问题:第一,激励不明显,对于广泛的消费者而言,OTA的激励往往以积分或代金券等形式进行反馈,实际上是各类OTA平台进行的各种变相促销;第二,OTA平台对点评数据的控制权限过大,其不仅可以从其他平台抓取点评数据,还可以对网站上显示的点评数据进行挑选乃至删改,在这种情况下点评信息的最重要价值——真实性便无从保证。

  共票是实现还利益于人民、维护消费者合理权益、构建良性激励机制的重要支撑。共票理论的要旨就在于打破大机构的垄断,真正将贡献了数据、智力的广大消费者纳入到平台的经济中,使得共享经济回归其本源。因此,共票制度有助于解决上述矛盾。首先,优质的点评是OTA平台吸引用户的关键,对积极进行点评的用户以共票进行激励,可以有效增加用户参与度。共票不同于积分或者是当前各个平台提供的代金券,它是一种权益的凭证,这一权益又直接与平台自身的经营成果相匹配,这就使得用户与平台形成了相互激励的良性生态。其次,共票制度以区块链为技术核心,而区块链又具有不可撤销、篡改的特性。因此,在OTA平台中引入共票制度将杜绝平台挑选、删改特定评论以操纵口碑的行为。最后,借助区块链历史可追溯的特点,用户和平台还可凭借特定点评的固定时间戳以证明其相应的权益,从而对抗其他平台未经许可抓取利用的行为。

 (作者单位:中国人民大学国家发展与战略研究院金融科技与互联网安全研究中心)