原告:杭州阿里巴巴广告有限公司
被告:南京码注公司
(2019)浙0108民初5049号
【案情】
1688系由原告阿里经营和提供网络服务的网络批发平台。阿里巴巴的企业诚信体系建立在用户授权搜集各类信息,并通过阿里巴巴设计的模型、逻辑、方法、流程,对搜集到的各类信息进行加工、整理或分析处理结果的基础之上,该等信息数据库成为阿里巴巴核心资源。基于该等信息数据库,阿里巴巴开发了各类服务产品,给阿里巴巴企业带来巨大的商业利益。
原告于2018年4月24日发布法律声明,称“未经阿里巴巴许可,任何人不得以包括但不限于通过机器人、蜘蛛等程序或设备监视、复制、传播、展示、镜像、上载、下载等方式擅自使用阿里巴巴中国站内的任何内容”。
被告通过直接查询和API接口两种方式向用户提供数据查询服务,查询信息包括从阿里巴巴平台获取的信息以及基于该等信息计算的活性值等。被告使用网络爬虫技术,抓取原告网站公开显示的用户“联系地址”、“联系电话”、“联系人”、“诚信通使用年限”等信息并直接在其运营的网站页面显示。
经过近20年的经营,上千万的企业用户在1688网站开设店铺,1688网站因此积累了大量的企业数据,这些数据已经成为1688网站的竞争优势,具有极大的经济价值。导致1688网站用户的流失,损害阿里巴巴公司的利益。
【法条链接】
《反不正当竞争法》第二条规定,经营者在生产经营活动中,应当遵循自愿、平等、公平、诚信的原则,遵守法律和商业道德,在生产经营活动中不得扰乱市场竞争秩序,损害其他经营者或者消费者的合法权益。
【裁判要旨】
原告阿里做出了法律声明,禁止未经许可使用爬虫软件获取、使用涉案数据,故涉案数据虽已经公开,但并非可以任意获取、使用的开放数据,码注公司不可以毫无节制地抓取、使用涉案数据,应当本着善良、诚信的原则,在必要限度内使用涉案数据。
而码注公司将阿里公布的商家数据直接用于其网站,甚至可以直接替代阿里平台的部分功能,显然超过合理限度。被告码注公司码注公司的行为损害了原告的利益,且其行为违反公认的商业道德,构成不正当竞争。
数据爬取,又叫“网络爬虫”、“网页蜘蛛”,是一种互联网信息自动采集技术。是按照一定的规则,利用科技手段在服务器之间自动地、大批量地抓取万维网的信息或程序脚本的技术。我们熟悉的互联网企业喜爱利用这种技术从掌握大量数据的平台套取数据资源并加以加工为自己所用。
从计算机技术层面看,数据爬取行为的三个关键点:①制定目标信息轮廓:对抓取目标的描述或定义②准确定位资源:对URL(统一资源定位系统,用于指定信息位置的表示方法)的搜索策略③提存有效信息:对网页或数据大批量地分析与过滤爬取技术
具体操作流程可概括为下图