Inline image 5

2010年3月9日星期二

尼曼新闻实验室:谷歌中国黑客门:重大事件报道中的原创内容有几成?

原文:The Google/China hacking case: How many news outlets do the original reporting on a big story? 
译文:尼曼新闻实验室:谷歌中国黑客门:重大事件报道中的原创内容有几成?

作者:Jonathan Stray 
发表时间:2010年2月24 
译者:苏吴男爵 
校对:HJ Wilson、大师


我们经常谈及“新型新闻生态系统 ”(the new news ecosystem)——传统媒体 、新兴的网络公司、非盈利组织和个人在其中生产和筛选新闻。但是,报道的工作是如何在新型新闻生态系统的成员中划分的呢?

我尝试着建立关于这个问题的一个数据点,为此选择了一个重大事件并阅读了谷歌资讯的专题中的每一篇报道,借此找出是谁做的工作。在上周关于“两所中国学校被指参与对谷歌的黑客攻击”的121篇相互独立的报道中,有13篇(11%)至少还有那么一点原创内容。只有7家组织(6%)真正独立完成了整个报道。

但是如平常一样,事情比上述数字所反映的要略为微妙一些。我选择谷歌中国黑客门是因为这是个复杂的、国际的、敏感的、并且重要的事件。它属于要求进行大量调查性质的工作——也许还包括获取内部消息和进行外语报道——的一类事件。可以称之为对我们的报道基本功的压力测试,一个实打实的、最糟糕的事件。

《纽约时报》于上周四率先发文,援引参与去年一系列美国公司遭到黑客攻击的匿名消息来源报告,表示已把攻击的源头追踪至中国的大陆的一所名牌大学(上海交通大学,译注)和一所职业技术学校(蓝翔职业技术学校,译注)。文章包含来自两所学校代表的评论。同时文章包括旧金山的电头和来自上海员工的供稿。这则报道即刻随处可见,差不多所有美国的主要报纸和通讯社都报道了此事。

周一早上我开始研究这个问题时,谷歌资讯上已有800篇不同的报道。但是这些报道中有多少确实提供了新的信息?谷歌资讯默认不显示完全相同的转载或剽窃内容,将这些报道减至100余篇相异的版本。我阅读了每一篇报道,7小时之后我绘制出了一张记录有每篇报道的来源的电子表格。我同时记录了出版物的发行国家、新闻的电头或作者的所在地(如果有记录的话),以及每一则消息的报道媒体(报纸、网络媒体、广播电视等等)。这些数据的摘要见页面下方的表格。
下面是我的发现:

——121篇独立的报道中的13篇(11%)包含了一定数量的原创内容。如果一篇报道包含至少一处原创的引证,那么我就把它计为包含原创内容。“原创的引证”是模糊不清的。一些报道——特别是一些更加技术性的报道,从一些非著名博客中引用了信息。从某种意义而言,他们没有提供任何新的东西,但是即使如此我还是忍不住认为他们所做是有价值的。与此同时,很多新闻编辑室勤勉地致电中国的两所学校去确认相同的信息 ,这可能不会为报道增加多少价值。

——只有7篇报道(6%)主要基于原创内容。这7篇报道来自《纽约时报》(The New York Times)、《华盛顿邮报》(The Washington Post)、《华尔街日报》(The Wall Street Journal)、《卫报》(The Guardian)、《技术新闻世界》(Tech News World)、《Bloomberg》(Bloomberg)、中国的新华社《环球时报》

——在这13篇包含原创内容的报道中,8篇由以报纸为主要平台的媒体发布,4篇由通讯社发布,一篇由以网络为主要平台的媒体发布。就这次报道而言,新闻确实是来自报纸。

——14篇报道(12%)由中国媒体发布,它们带有中国的电头(术语,指电讯稿件播发的新闻单位、地点、时间的说明,译注。) 或者提及有中国员工的协助。对于一次有关中国的报道而言,这个比例我觉得相当低。这也许与驻外通讯员的裁减有关?

——9篇报道(7%)完全没有提及信息来源。另有5篇部分信息没有提供来源。考虑到做个超链接是多么容易,这项数据让我大吃一惊。

——谷歌资讯倾向于给包含可靠来源的报道在专题中相对高的排位。谷歌表示他们对报道进行排名的标准依据消息来源的知名度、被其他文章引用的次数和标题的点击率——虽然他们不透露具体如何操作。页面下方的电子表格即依据谷歌资讯的排位进行排列。

——谷歌资讯的新闻聚合算法中包括3篇不相关的报道,至少遗漏了一篇原创的报道。3篇无关报道关于谷歌和中国,但是无关最近的“美国追踪黑客攻击源头至中国”。《金融时报》(Financial Times’)的优秀报道被排除在外令人遗憾——也许这与他们的“支付墙”paywall)有关?也许是出于我作为一个计算机科学家的偏见,我意识到了新闻聚合的困难——但实际上我认为这意味着谷歌资讯干得非常出色,无人操控的网页机器人搜索了使用数十种语言的数百万篇报道并完成了新闻的聚合。

——另外100多个新闻人在干什么?当我意识到反复撰写那一百多篇相互独立而又不包含任何原创内容的报道需要花费多少精力的时候,我不禁愤懑于中。如此大量的新闻人的精力本可以用于报道其他各式各样的新闻,为什么我们要做这种事?有什么法律的、技术的、经济的、文化的障碍妨碍我们轻而易举地链接到最好的报道版本上然后着手做下一个报道吗?

——有意思的是没有一家英语媒体挖掘出中文媒体《齐鲁晚报》的原创报道,这篇报道甚至在香港的一名叫Roland Soong博主帮助下译成了英语一名中国的记者 造访了被视为攻击源头的一座学校,并进一步报道澄清:那里提供的为就业做准备的电脑课程不可能培训出厉害的黑客。Soong告诉我蓝翔职业技术学校在中国是一所以其粗制滥造的深夜广告而闻名的低教学质量的学校。该校与其如纽约时报所称是军方黑客的培训地不如说是一所培养厨师的肉店、以及培养机械维修工的地方。

对一次报道的追踪不能证明任何报道以外的论断。并且使用谷歌资讯作为过滤器也无法真正代表新型新闻生态:其未包括大量的小型博客和其他媒体。Soong说谷歌资讯提示他的站点没有资格被包括在其结果中,因为谷歌资讯不包括小型的、由单个人撰写的博客。这看似是个独断专行的决定,但是在一个对新闻源定义如此纠结的时代,无法想象谷歌能做出什么更加站得住脚的选择。

下方的表格是我收集的资料的摘要,我在其中高亮了原创报道。完整版表格还包括新闻发布国家、发布组织的主要媒体平台,以及每篇报道是否为消息源加上超链接的名单。名单请点这里查看。

相关阅读:



来源说明:本文1.0版本来源译者的志愿翻译者团队。

收录说明:本文已经收录到“译者文集”中,同时进入“译者频道—时事评论”、“译者频道—外交关系”、“纽约时报”索引。 

 ©译者遵守CC协议2.5您可以自由复制、发行、展览、表演、放映、广播或通过信息网络传播,创作演绎本作品。惟须遵守下列条件:署名,非商业性使用,相同方式共享。 

0 comments:

发表评论

知识共享许可协议

本作品采用知识共享署名-非商业性使用-相同方式共享 3.0 Unported许可协议进行许可。