“不做新闻生产者,只做新闻搬运工”今日头条“偷”来的五亿美元?

尽管“今日头条”一再强调自己的机器人推荐机制,但始终无法回避未经授权就通过爬虫抓取媒体网站信息,并且存在私自转码行为的事实。一个创业者为何会认为“我们的商业模式不需要版权”?机器人显然无法回答。听听今日头条CEO张一鸣怎么解释。

责任编辑:苏永通 顾策

6月6日,国务院法制办发布《中华人民共和国著作权法(修订草案送审稿)》公开征求各方意见的通知。 (CFP/图)

专题按:“今日头条”暴露的问题不仅在于技术与法律层面,需要思考的是,一个创业者为何会认为“我们的商业模式不需要版权”?机器人显然无法回答。听听今日头条CEO张一鸣怎么解释。

尽管中国知识产权保护状况未尽如人意,但已有比较健全的法律体系。这不是个模糊地带。受访国内知识产权法学者和官员大多认为今日头条已构成侵权,南方周末的问卷调查也得出同样结果。

这场媒体“围剿”,是过去十多年媒体版权“战争”的继续,但绝不只是新旧媒体之争。任何媒体都可能被侵权,也可能在侵权而不自知或放任。没有对知识产权的基本尊重,谁来保护人类的创造力?

尽管“今日头条”一再强调自己的机器人推荐机制,但始终无法回避未经授权就通过爬虫抓取媒体网站信息,并且存在私自转码行为的事实。

“今日头条”当初在商业模式设计时,从未将版权问题当做成本考虑进去。

国家版权局版权管理司前副司长许超对南方周末记者表示,跟百度只提供只言片语信息不同,今日头条是对信息的二次加工,然后呈现出较丰富的内容,这跟法律对于搜索链接服务商规定的条件不符,所以今日头条只能属于内容服务商。一旦发生侵权,内容服务商是第一侵权人,中间服务商一旦陷入纠纷并事后证明是侵权的话,它是间接侵权,法律叫共同侵权责任。间接侵权才适用“避风港原则”。

2014年6月6日下午,在位于北京知春路的北京字节跳动科技有限公司总部,原定两点半开始的小型媒体沟通会因人没到齐而推迟到三点。

没吃午饭的张一鸣饿得不行,拿来几袋福建产的饼干吃了起来。他是这家公司的CEO,生于1983年,福建人,身材瘦小。知道这家公司的人不多,但它的主打产品——一款名为“今日头条”的手机资讯App,已经广为人知。有媒体形容今日头条是“不做新闻生产者,只做新闻搬运工”。

张一鸣在这天穿了一件灰色T恤,浅蓝色牛仔裤和一双阿迪达斯运动鞋。T恤上面写着一句英文:“Where are you?!”

在吃饼干的时候,张一鸣看到了《新京报》的摄影记者。他觉得自己的吃相可能被拍到了,便对这位摄影记者说,你已经拍了很多,不要再拍了,我不希望自己的照片被使用,不希望你们侵权。

摄影记者说,不让拍为什么要找记者来?张一鸣说,这是沟通会,不是采访。两人话不投机,摄影记者离席而去。

两天前,张一鸣对外界宣布今日头条获得第三轮1亿美元融资。公司估值比一年前翻了近8倍,达5亿美元。

谁知这一消息传开后,迎来的不是掌声,而是传统媒体铺天盖地的口诛笔伐。

就在当日,《广州日报》把今日头条告上法庭,称其在未经告知的情况下转载《广州日报》的报道,涉嫌侵权;6月5日,《新京报》发布了一篇社论,直指今日头条是“剽窃者”,涉嫌版权侵权。一时间,大量媒体跟进报道此事。有媒体人说,这是纸媒的第二次“鸦片战争”(第一次是大约十年前门户网站对于纸媒内容的侵权引发的风波)。

张一鸣显然感受到了压力,6月6日的媒体沟通会也是为了平息这一风波。群访结束后,张一鸣去了中国人民大学法学院,跟一个著名知识产权教授聊了半小时。

回到办公室后,张一鸣接受了南方周末记者的专访。“我们承认确实有未经告知抓取纸媒网站内容的情况,但用户在我们客户端上总点击量的七成都是直接跳转到原始网站。这块我没有看到法律风险。另外一些点击量跳转到的是我们优化和转码之后的页面,但我们保留了原始网站的品牌。这块是有争议的。”张一鸣说。

事实上,从今日头条创办至今,张一鸣压根没有觉得版权问题会给公司带来危机。用张一鸣的话来说,就是:“我们的商业模式不需要版权”。

但版权还是成了张一鸣躲不开的问题。这两天,张一鸣忙着找律师咨询,跟媒体解释,以及跟政府部门写说明材料。同时,跟大量的媒体网站沟通,告知今日头条的抓取行为,对有要求必须跳转到原始网站的媒体,停止转码行为。

“我们的不足是,没有更早点沟通。我们半年前只有几十人,现在两百人。”张一鸣说。

两年崛起

从导航到搜索,再到推荐,这是互联网信息分发的进化过程。今日头条之所以能在短短两年内迅速崛起,在于把握住了这个行业趋势。

2005年,张一鸣从南开大学毕业。此前,他学了两个专业,一是微电子,二是软件工程。

毕业后,张一鸣和师兄共同创业,开发面向企业的协同办公系统,不久便以失败告终。此后几年,他先后在酷讯、微软、饭否网就职。饭否关闭后,张一鸣创立了房产搜索网站九九房,推出掌上租房和买房的App。

早在2008年底,张一鸣就想做一个信息分发的软件,而且打算集中在笑话和房产这两个领域。但他感觉市场一直没有准备好。

2012年下半年,张一鸣说,他看到市场的几个变化:一是机器学习的能力比较强了,为抓取内容和分析内容提供了技术可能;二是社交网络大发展;三是移动互联网大爆发。人们的碎片时间都停留在手机上,但跟PC上一样,手机上的信息太多,人们反而不知道阅读什么了。

他觉得做一款能把人们感兴趣的内容呈现给他们的阅读软件的时机到了。于是,他先在垂直信息领域展开尝试,选择笑话和段子入手,上线了一个App应用,名字从搞笑囧图到内涵段子,再到2012年8月份正式改名为今日头条。团队成员则主要来自微软和百度。

在融资上,张一鸣的朋友周子敬给了他200万元的天使投资。此前,周在华兴资本担任副总裁,后来创办了以太资本,主导过美乐乐、途家、猎聘、唱吧、友盟等多个项目融资。

周子敬对南方周末记者回忆说,2012年他之所以选择投资今日头条,一是看重张一鸣和他的团队,张一鸣是工程师出身,而且他过去的几次创业经历都跟信息分发有关;二是当时他自己也苦于没有一个好的资讯应用,能让他看到他真正想看的信息。得知张一鸣有这样的想法后,就选择了投资。

2012年3月份,海纳亚洲创投基金(SIG)和一些个人股东联合投资了200万美元左右。一些海外的金融经济学家和硅谷的创业者也参与了投资。

“我在咖啡馆跟他们聊了两个小时,用面巾纸给画了一下我们的商业模式,然后他们就决定投资了。”张一鸣说。

2013年3月,俄罗斯投资机构DST的创始人尤里决定投资今日头条约1000万美元。DST之前曾投资了小米手机、Facebook、Twitter、京东和阿里等公司。

张一鸣回忆说,尤里一直没空来中国,最后他们俩通过视频会议敲定了合作。当时担心连线效果,他甚至要求酒店临时增加了网络带宽。尤里问了张一鸣三个问题:一是张一鸣每天是怎么过的,周末是怎么过的;二是他的同事周末在干嘛;三是让张一鸣描绘一下五年后他的软件能帮用户干什么。

第二轮融资之后,很多互联网巨头开始想要投资甚至收购今日头条。张一鸣透露,其中包括腾讯和搜狐等公司都跟他洽谈过收购事宜。最后张一鸣选择拿到红杉资本和微博联合投资的1亿美元。此时,张一鸣提供的数字是,今日头条已经有1.2亿总安装,4000万月活跃用户。

“当时我们也考虑到版权的问题。但我们看到PC上的搜索引擎公司做的也是信息分发的事情,他们通过跟合作伙伴互换流量和分成的办法,解决了版权的问题。只要做到互利共赢,版权问题很好解决。”周子敬对南方周末记者说。作为投资人,他自始至终没有觉得版权会是今日头条的风险。

爬虫的时代

今日头条为何在短短两年内能吸引到上亿用户?张一鸣的解释是,今日头条是一款把用户感兴趣的内容精准推送给用户的软件。他宣称,每个用户看到的内容都是不一样的。

今日头条拥有1000台左右的服务器,购买自华为和戴尔等公司,今日头条内部称这些服务器为“机器人”。研发人员在这些服务器上撰写各种代码,这些代码被称为爬虫或者蜘蛛,它们到传统媒体的网站和门户等网络媒体上抓取各种信息。

如果抓取到一个内容,是门户网站购买自纸媒网站的,今日头条优先从纸媒的网站去抓取。

这些信息抓取过来之后,今日头条的核心技术“算法”开始进行分析。

一旦确定了这些信息是有价值的,接下来的工作就是把这些信息推送到感兴趣的用户手机里的今日头条客户端里。

此外,用户注册的时候,可以使用新浪微博等各种社交工具账号。机器人会根据数据挖掘最终得出一个关于你的大致信息偏好,然后给你推荐相关信息。在用了一段时间之后,机器人会根据你阅读某篇文章的速度来判断你是否有兴趣,然后调整给你推荐的信息。

但一位接近今日头条的人士告诉南方周末记者,今日头条也并非张一鸣所说的完全是机器人筛选信息。据他透露,内容这块也有人工团队:一半进行敏感词等审查,一半是人工对信息做处理。

UC浏览器资讯中心的一位前员工对南方周末记者解释,今日头条之所以仍需要人工处理,是因为其跟很多网站没有达成合作,都是自己去抓取。当被抓取的网站页面发生变化的时候,爬虫就会抓错。所以,一般新闻资讯软件都会有人每晚值班,进行“走查”错误。

今日头条最令人诟病的是它常常未经授权即对其他媒体网页进行转码。

所谓转码就是纸媒们的网站直接放到手机屏幕上阅读速度比较慢,需要进行优化和转码,去除原始网站的页面广告等。实际上,转码是很多手机新闻客户端都在做的事情。

转码仅仅给今日头条带来了内容资源,而无法给原始网站带去流量。这是今日头条被传统媒体视为“窃贼”的原因。

据张一鸣称,今日头条上总点击量的70%都是直接跳转到信息的原始来源网站,主要是中新网、人民网、环球网和新浪网等主流网络媒体。这些媒体一般都开发了专门针对手机用户的内容界面,在手机上阅读的“适配性”比较好。更重要的是这些媒体影响力巨大,今日头条不敢贸然直接转码。

此外,如新浪这样的门户网站跟传统媒体签署的版权协议,并不包括移动端的授权。南都全媒体网络科技公司CEO苟骅对南方周末记者说,南都跟PC上的网络媒体签订的授权协议,明确规定只能在PC端使用,不授权移动端。但也有一些门户网站把南都的内容擅自推送到门户的手机端。对于是否维权,南都还没有想好。

而针对大量的小网站,张一鸣称其自身适配性比较差,如果不转码,今日头条的客户端可能会在运行中突然崩溃。特别是当用户使用的是安卓手机时,客户端崩溃的可能性更大。

据张一鸣称,在国外,跟今日头条类似的一些新闻类应用软件,大部分都是直接跳转到原始网站。因为国外网站对于手机上观看的适配性问题处理得比较好。所以不需要转码。

即便如此,国外类似应用也遭遇过版权问题。Zite是和今日头条最相似的新闻应用,均采用数据挖掘的推荐方式。据《华盛顿邮报》报道,Zite公司早在2011年就在美国被出版商以“非法挪用我们的智慧财产”为由提出警告,最终以双方坐下来谈合作告终。

有趣的是,当时,Zite的辩解理由跟张一鸣今天的说法几乎一样——原理和搜索引擎类似,Zite去掉文章广告是为了让格式更适合阅读等。

一位今日头条的合作媒体人士称,美国的新闻资讯聚合类应用软件的商业模式,大都已经是主动跟内容来源方谈授权转载合作,然后自己设计网页刊发这些内容,在网页上卖广告,得到的钱跟版权持有方进行收入分成。

是不是“窃贼”

在6月5日《新京报》发表社论,直指今日头条涉嫌版权侵权后,张一鸣承认,今日头条确实一开始在未告知的情况下抓取了新京报网的内容,但没有进行转码。

这也是今日头条一直以来走的“野”路子:一开始都是直接抓取并且转码,转码后今日头条没有放置自己的广告,但原网站的广告也消失了。直到被抓取的网站出来维权,然后才开始达成口头、书面协议,但不支付版权费。作为回报,版权方获得今日头条导入的流量。

2013年11月份,新京报网找上门来要求停止抓取。于是,双方坐下来沟通,决定展开合作,但最终这一合作并没有展开。直到6月5日下午两点多,新京报致电今日头条,要求今日头条停止抓取其网站内容。

“这次大概有5家媒体跟我们联系,要求我们的客户端断开跟他们网站的链接。但也有二十多家媒体主动跟我们联系要求合作。”张一鸣说。

他表示,“在中国,直接跳转对方的网站,我是没有法律责任的,hao123和360导航等导航网站以及搜索引擎都是这样的逻辑。转码的话,我看到过一起不构成侵权的判例。”

《中国新闻出版报》2012年报道了张一鸣所说的这起判例。原告蔡骏是小说《玛格丽特的秘密》的著作权人,他发现被告宜搜科技利用其网站为手机网络用户提供该小说的在线阅读服务,侵犯了其著作权,要求被告承担侵权责任。但法院驳回了其诉讼请求,理由是宜搜只是进行了格式转化,将小说链接到第三方网站,适用“避风港原则”。这与今日头条的情况并不一样。

国家版权局版权管理司前副司长许超也对南方周末记者表示,跟百度只提供只言片语信息不同,今日头条是对信息的二次加工,然后呈现出较丰富的内容,这跟法律对于搜索链接服务商规定的条件不符,所以今日头条只能属于内容服务商。一旦发生侵权,内容服务商是第一侵权人,中间服务商一旦陷入纠纷并事后证明是侵权的话,它是间接侵权,法律叫共同侵权责任。间接侵权才适用“避风港原则”。

中国的《信息网络传播权保护条例》(以下简称《条例》)引入了国际法学界的“避风港原则”,《条例》第二十三条规定:网络服务提供者为服务对象提供搜索或者链接服务,在接到权利人的通知书后,根据本条例规定断开与侵权的作品、表演、录音录像制品链接的,不承担赔偿责任。

在国外,这类案例也有很多。北京大学互联网法律中心主任助理张金平在其所著论文《有关爬虫协议的国外案例评析》中介绍,2006年1 月,谷歌在比利时开展了免费的“谷歌新闻”服务,这些新闻内容是谷歌使用爬虫程序从比利时各大网站抓取的内容,并缓存于其服务器中。后来比利时三家大的出版商起诉谷歌侵权,理由是谷歌未经许可就抓取了自己的内容。

当时谷歌提出两个重要抗辩理由。一是对于出版商而言,可以通过爬虫协议告知其访问政策,但这些出版商没有做这项工作,这就表示出版商至少是默认了爬虫工具的抓取行为;二是谷歌不可能向其搜索引擎访问的所有的网页所有人进行联系并获得授权,因此谷歌认为出版商是权力滥用。

官司打了一年多,2007年2月,布鲁塞尔初审法院认为,版权是一种排他性的专有权,在内容上包括了复制权和传播权,使用他人版权作品必须事先获得版权人的同意,最终判定谷歌侵权。谷歌不服上诉,但被维持原判。

但张金平的报告显示,德国的法律又不一样。德国法律认为,网络环境下著作权人不采取爬虫协议技术措施可构成默示许可。

维权后的合作

对于这场版权风波,张一鸣抱怨自己替行业背了黑锅,成为纸媒们的出气口。

他表示,纸媒指责今日头条为“盗贼”,其实,手机浏览器、手机新闻客户端和今日头条这样的搜索推荐软件,都在抓取纸媒们的网站内容。他还现场给南方周末记者打开了几个客户端,有的也对原网站做了转码。

为张一鸣喊冤的还有很多新媒体。他们大多是从今日头条导入巨大流量的受益者。

专业足球资讯网站懂球帝创始人陈聪对南方周末记者表示,目前他们手机网站四成的流量来自今日头条。该网站是主动要求跟今日头条合作的。对于目前今日头条的争论,陈聪认为这是纸媒和新媒体思维差异造成的。

事实上,今日头条已经具备了强大的流量分发能力。如果今日头条不是私自窃取内容进行转码,而是导流量到原始网站,共享利益,也不会招致诸多指责。但通常,很多合作都是其他媒体找到今日头条维权之后才实现的。

汽车资讯网站牛车网创始人海兰告诉南方周末记者,2014年1月,海兰找到张一鸣要求取消转码。今日头条对牛车网进行了一次网页的压力测试后,允许用户点击内容直接进入到牛车网。此后牛车网的流量大增,目前接近四分之一的流量来自今日头条的导流。

手机环球网的市场总监窦佳丽对南方周末记者表示,大概半年前,他们发现今日头条未经许可就抓取环球网的内容,于是找到今日头条维权,提出让对方购买版权。此前环球网跟一些手机新闻客户端签订了版权协议,通过出售版权获得了收益。但今日头条提出可以尝试互换流量的模式。

最后环球网专门开发了一个适合在手机上播放的内容页面,拿来跟今日头条合作。每天的PV量(page view,页面浏览量)从600万到1000万不等。

虎嗅网创始人李岷对南方周末记者表示,虎嗅网早就知道今日头条抓取自己的内容,但一直没有太在意,后来双方才签了一个合作协议,但也只是“走走过场”。直到最近版权风波爆发后,今日头条抓取的虎嗅网内容取消转码,直接跳转到虎嗅网,李岷才发现自己网站的流量开始增长。

其实无论是新媒体还是传统纸媒,都希望在尊重版权的前提下,探索合作的路径。财新传媒一位不愿透露姓名的管理者对南方周末记者表示,我们要维护版权,重视版权价值,但也希望能够扩大影响。如果想发展自有平台,最佳模式显然不是出让版权并收取版权费,而是通过在大平台返链,获得自身平台发展机会。

今日头条当初在商业模式设计时,从未将版权问题当做成本考虑进去。但在版权风波爆发后,张一鸣的态度开始有所改变。他说,今日头条将出台扶持媒体特别是纸媒的广告系统,以及发布一款帮助传统媒体转型互联网的工具,主要功能是快速生成App应用。

他对南方周末记者说,自己并非一分钱不想出,今日头条接下来愿意坐下来谈流量变现的商业合作问题。

“但前提是,不要再骂我们是盗贼了。”张一鸣说。

“今日头条”事件调查。 (曾子颖/图)

网络编辑:zero

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}