新闻报道如何用好数据?

郑渝川 | 2023-01-30
收藏

美国伊利诺伊大学媒体学院新闻学专业教授、主任布兰特·休斯敦,曾在美国报业从事调查记者工作17年,履行现职后讲授新闻学并负责管理一个在线新闻编辑室。他所著的《新闻里的数据:计算机辅助报道实用指南》一书,已推出第五版,主要讲述的是如何在新闻写作中如何进行基本的数据分析,如何有效利用数字工具。

这本书的简体中文版近日由社会科学文献出版社出版。全书不仅适用于从事新闻报道工作的记者,以及新闻专业的学生,而且在中国内地,也能有效服务于党政机关、企事业单位乃至外企、民企单位的从业者以改善自媒体报道、宣传的水平。

在新闻报道和写作中运用数据的一个基本操作就是,将各种网站上的数据进行挖掘,比如政府、教育、商业网站上的结构化数据。书中讲述了如何快速浏览有用的在线信息,运用搜索技术找到目标信息,然后寻找完整的数据库并下载。书作者指出,通常而言,要进行数据的列和行进行基础分析,可以在Excel电子表格中处理,或者在使用结构化查询语句的数据管理其中处理,然后再进行必要的排序、筛选。书中为此甚至就新闻记者需要掌握的电子表格的相关知识、技术进行了手把手的讲解。

事实上,无论是进行时政报道,还是社会新闻、商业新闻等方面的报道,通过公开信息尤其是各式数据,通常都能够找到大量的信息线索。书中就此还进行了较为详实的方法介绍。比如,如果在网上只能一次查看一条记录或者数据集的一部分,就可以通过抓取网页的方式,然后以便捷的csv或者xls格式储存,必要时可下载与自己使用的浏览器匹配的有关抓取插件。由此一来,记者可以更快地找到许多现象、事物的发展、演进规律,更好地捕捉到异常点,还可以便捷地通过Excel中的求平均值、中位数的工具来得出更符合一般规律的参照值。

如书作者所说的那样,通过电子表格等工具,提高了数据分析能力,还可以起到的积极作用就是,新闻写作可以更为清晰地掌握深层次的事实,比如犯罪数据背后的不同阶层、民族、社会危害值等情况,又如不同阶层居民在某些问题上所能获得的社会支持、政策支持差异,还能得出相关的趋势预测。

下一步就是分析文本,包括网站上,以及社交网站上的文本。一些网站、软件可以帮助计算文稿中某个词(含意思完全一样的词语)或短语,在文档中重复出现的次数。比如,美国记者就曾分别在拜登、特朗普当选美国总统时,对其各自发表的就职演说进行分析,捕捉关注的重点,并通过将二人的演说与之前历任美国总统就职演说进行对照,找出需要关注的关键点。

《新闻里的数据:计算机辅助报道实用指南》书中谈到了如何应用推特、脸书、领英等美国主流社交媒体进行文本收集与分析的方法。

书中讲述了当新闻报道、写作收集有关数据存在技术障碍等困难时,如何利用有限数据创建自己的数据库——当自己的数据库难以完备时,缺失的重要选项就应成为新闻报道追溯探寻的重点。

值得注意的是,在中国内地,无论是新闻报道和写作,还是相类似的自媒体报道、宣传稿件等作品的创作,都不得不面临一个尴尬的问题,那就是有些可以通过线上或线下查询而得的数据,在真实性上存在问题,这也是所谓的“脏数据”。因为有些数据的获得和存储,并没有经过相应的核对、复核,“没有一个数据库是完美的,没有一个数据库是完整的……”,甚至还可能含有误导性字段或者棘手的字段。书中举例指出,美国洛杉矶的政府数据生成的在线地图,就错误地标注和定位了地方的犯罪活动。

上面谈到的是数据准确度问题,还是就是真实性问题。书中指出,在进行新闻报道时,如果要采用网上的有关数据(库),应当进行必要的比对,尽可能找出数据失实的特点。

《新闻里的数据:计算机辅助报道实用指南》(第五版)

书名:《新闻里的数据:计算机辅助报道实用指南》(第五版)

作者:(美)布兰特·休斯敦

译者:刘英华

出版社:社会科学文献出版社

出版日期:2022年11月

 

所有评论({{total}}
查看更多评论
热点快讯
+86
{{btntext}}
我已阅读并同意《用户注册协议》
+86
{{btntext}}