数据新闻繁华背后有隐忧
作 者:张凌霄 来 源:青年记者发表日期:2015-10-12
数据新闻热从何而来
法国哲学家雷吉斯·德布雷(Régis Debray)曾经提出这样的论断:人类社会从媒体的角度可以被定义为三个时代,即书写时代、印刷时代和视听时代。当下我们正处在第三个以视听文化占主导的时代,这是人类有史以来对自身所处社会了解途径最多、范围最广、可接触到的信息最充分的时代。为了更好地满足与生俱来的好奇心,人类自从发明语言文字起就不断地追求着更好的信息沟通手段。当然,简单粗暴地将对新闻的追求和对好奇心的满足画上等号是不确切的,新闻对于人类社会的重要性远大于此。新闻业的进步使当今人类能更好地知晓环境、获取信息、做出决策,而为了这个目的,人类一直走在追求更好的信息获取与传播手段之路上,在工业革命之后建立起了今天庞大的大众新闻媒介系统,包括从技术到体制,再到从业者的培养与传承等一系列的完整体系。
早期的新闻业所依靠的是记者的观察写作与编辑的把关编排。诚然这比作为一门社会专业分工而存在的新闻业出现之前的道听途说要来得真切可靠许多,但依然受从业人员个人因素影响巨大。随着传播技术手段的进步,新闻业在20世纪经历了从解释性报道到调查性报道,再到精确报道的历史进程。这是一个主观性渐减而客观性渐增的过程,使人类在追求新闻报道尽可能地贴近社会客观现实之路上大步前进。而进入21世纪以来,随着计算机、互联网、数据库等技术的发展与普及,利用数据来挖掘新闻话题或辅助事件报道越来越普及;而最近大数据概念从互联网产业向新闻业的扩散,也使数据新闻成为最热话题之一。
数据新闻,或者叫数据驱动新闻,并非一种完全独立的全新形式,其可以追溯到精确新闻、计算机辅助报道等早期报人追求新闻报道尽可能客观的种种尝试。20世纪60年代菲利普·迈耶开创了使用计算机进行精确新闻报道的先河,“将社会科学和行为科学的研究方法应用于实践新闻的报道”。在这之后,计算机辅助报道逐步完善起来,得到广泛应用,并在90年代之后出现了数据库新闻等进一步的尝试。但是,早期的数据库新闻并不包括对数据的深度挖掘与分析,只是对原始数据的初步整合,用来对新闻报道文字进行辅助说明。
而数据新闻则是一次革命。与之前的尝试不同,数据新闻的核心被正式放在了数据上,这里的数据不是简单的统计数字,而是广义上的信息,包括文字图片、音视频,乃至各种行为习惯、地理位置等。在数据新闻的工作流程中,数据被深度挖掘处理,基于一定的标准过滤重组,以可视化的形式展示并讲述新闻故事。在开源的数据新闻手册中,数据被认作既可以是数据新闻的来源,亦可以是讲述新闻故事的工具,新闻业者可以采用信息图表来以相对简化直观的方式报道一个复杂的故事。数据新闻结合了传统的新闻敏感性、叙事说服能力和海量的数据信息,最终创造出新的报道方式。
对数据新闻热的冷思考
数据新闻时代,新闻从业者被寄予更新的要求,他们必须学会掌握通过对数据的搜索、查询、整理、总结与呈现来完成过去仅仅通过采访即可完成的专业信息搜集工作。掌握了这些技术的记者在对于事实的洞察与报道方面将变得更加容易,他不再需要去四处打听,也不需要去绞尽脑汁推测,在理想情况下对于足够多与广的数据的掌握将使得事实之上的遮盖物不复存在。但这种理想状况是否已经或者可以在近期的未来成为现实,现在看依然存在疑问。
数据新闻一方面抓住了技术进步带来的新可能,另一方面也迎合了当下受众的直接需求,但其本质依然应该是对社会事实的客观报道,这就使得在解决了数据来源、分析、呈现等方面的基本疑问之前,我们并不能对其抱有过于理想化的态度。
1.数据从何而来
数据新闻赖以生存的根本是对数据的占有,那么数据来源则成了数据新闻实现精确和贴近客观事实的重中之重。如同传统新闻报道中的采访环节,数据新闻生产的第一步在于数据的采集与挖掘。数据可分为结构性数据和非结构性数据:前者是指存储在数据库当中,有统一结构和格式的数据,如政府、企业公开的统计数据,具有一定的权威性和可信度;后者则是无法用数字或统一的结构来表示的信息,如社交媒体上用户的评论、关注的话题,购物网站上注册用户的购买记录、产品喜好等。仅就数据来源而言,我们当前所能接触到的数据很多时候并未达到真正的大数据标准,官方公开的数据也并不充分,社会渠道所采集到的数据也面临侵犯隐私的指控,以及过于受商业利益摆布的怀疑。可以毫不客气地说,在这些问题解决之前,想依靠数据新闻来实现更为精确地反映社会客观事实的目的只是一个乌托邦式的设想。
2.数据由谁来辨
毫无疑问的是,只要专业性的新闻行业存在,新闻报道的主体就不会完全从专业人士转移到业余用户身上,不管他们是叫记者还是数据分析师。但是这里同样也有疑虑存在:如果主体依然是记者等新闻从业者,那么他们如何能把握数据、驾驭数据、分析数据?如果主体转移到数据分析师、程序员乃至一段电脑程序上去,那么新闻的要素和特性该如何保证呢?又怎样保证新闻专业主义继续存在呢?
我国现有媒体从业者以文科背景为主,并不一定熟悉数据操作的相关规范,而在可视化呈现的操作上也存在一定的困难。样本的选取是否能够代表总体、量表的信效度检验是否合格、问卷的设计是否严谨、内容分析的类目是否妥当,诸多统计学原理和数据分析软件的操作远非未曾和统计学打过交道的媒体人能完全把握的。
若让程序员成为数据新闻的生产者,其又不具备传统媒体人所训练出的专业素养,对新闻叙事的把握则可能会顾及不到新闻的基本原则。“隔行如隔山”,数据要嫁接到新闻行业,还需要慢慢磨合。
3.数据如何呈现
数据本身是“不好看”的,受众也懒得看大段的描述性文字,那么数据就需要“可视化”才能被普通受众所接受。这其实是一个相当吊诡的概念,数据并非如字面上暗示的那般无形,只是大量的数据无法被方便地呈现在受众面前。不管数据新闻的实践者和研究者如何定义数据的可视化概念,其根本上依然是某个主体对于事实的讲述,只不过事实变成了经由各个渠道采集来的数据,讲述者变成了数据分析师或图表设计师。而在浩如烟海的数据的处理中则很难避免主观性偏倚以及对相关性和因果性的混淆。例如在网易“数读”的一篇数据新闻《全球百城声誉排行:中国城市排名落后》中,以图表形式将全球百城进行了得分排名,虽然后面附以短文对这一调查稍作了介绍,但这一评分考量的方面都有哪些,不同方面的权重如何,受众则不得而知。这种只见结果不问过程的“可视化”是对新闻真实性的背弃,这样的“数据新闻”其实已经不能算作新闻了。
结 语
新闻的主要关注对象依然是人和人的社会,对于数据和计算机程序的依赖不宜过高。过于强调工具理性主义最终会使我们迷失本心,通往乌托邦的指路牌往往会将人带入歧途。在大数据热潮下,希望新闻从业者和我们的社会都能不忘初心。但是我们依然有足够的理由相信,技术进步带来的社会进步是需要发展的时间与空间的。假以时日,经过试错,人类对于自身所处的环境与社会的客观认知定将被更好地实现。(作者为中国传媒大学传播研究院博士生)
参考文献:
①喻国明等:《新闻传播的大数据时代》[M],华体会现金 出版社,2014年版
②丁迈 金梅珍:《数据新闻:基于创新思维的新样态》[J],《青年记者》,2014年7月下
③乔纳森·格雷、露西·钱伯、莉莲·博纳格鲁编:《数据新闻手册》[EB/OL],