二、当前社会舆情研判的困境
目前社交媒体时代的网络舆情监测的基本原理依然延续wlebl.0时代的舆情监测逻辑,即首先经过相关的样本库建构,将欲监测的网页进行模板配型,作为监测数据源,通过网络爬虫程序进行数据抓取并下载到本地服务器,在本地服务器进行数据的消重和聚合,进而实现新闻信息文本的智能化呈现。在社交媒体时代,数据源只是变成了微博上的账号,将微博账号进行样本库配型,在整个数据抓取和处理的原理上没有太大的变化和创新。
在舆情监测过程中,存在一些难以回避的程序性缺陷和问题。主要问题如下。
一是舆情监测的效度和信度问题难以验证。目前的舆情监测最大的问题是无法论证自己的有效性,各家有各家的“黑盒子”,相对并不透明,手段和算法的不同势必造成监测结果的偏离,到底谁家更准确,难有定论。从宏观层面来讲,虽然社交媒体时代的舆情监测是建立在以前人工无法验证的大数据基础上的,具有一定的进步性,但抓取的大数据不代表有效数据,基于大数据的分析并不一定能代表网络舆论的整体走势,整体走势依然还有“瞎子摸象”之虞。缺乏验证是目前舆情研究中比较突出的问题。
二是数据源的多寡一定程度上决定了舆情监测的精准度。目前的舆情监测均是以样本库作为数据搜索源,均不是基于全网进行的舆情信息采集,实际上只是样本量较大的局部数据,可能存在数据源不全面而造成重要信息监测缺失,最终影响了数据监测结果。在个别地方新闻宣传部门,由于其数据源的有限,基本上相关的网络管理部门养四五个人,每天用百度搜索、微博搜索等工具,以本县县名或关键词组进行基本的数据搜集就可以满足自身的舆情信息采集和抓取,一定程度上衬托出目前舆情监测行业的尴尬。
三是在消重聚合环节,计算机智能还暂时无法取代人工智能。目前舆情监测软件和服务最大的区别就在于后台的数据处理能力,虽然基于网络信息的更新速率和网络新词层出不穷,但计算机对信息的处理能力始终存在一定的滞后性和简单化,即使在一定程度上解放了人力资源,但在高层次的信息处理如情感判别和影响力评估等方面,计算机还不能完全取代人工智能,计算机处理的数据和结果在实践中的有效性和可行性还有待于进一步提升。
四是从监测的实效性上,舆情监测的速度始终要慢于事件自身的变化速率。舆情监测从字眼上可以看出,监测是对以往信息传播流的横断面的展现,而对于事件的未来走势和影响力难以有准确的预测,这恰恰是舆情监测最希望实现的目标。同时,事件是在时刻变化,数据监测结果仅是对某一个时间横断面的数据呈现,从监测的实效性上看,舆情监测的速率始终慢于事件自身的发展和变化。
以上是从数据采集和监测原理的角度讨论目前舆情监测相关困境和问题,从整个社会发展大背景来看,舆情监测目前还存在以下问题:
一是舆情监测在实践应用层面还存在诸多的盲区。具体来说,一是对舆情预警技术还有待提升。从目前的实践来看,没有任何一家舆情软件服务公司能够做到准确预警,即使一定概率的预警也没有出现,但同时预警也是一个伪命题,一旦危机信息被捕捉到,相关部门的介入一定程度上能够缓解事件的影响和危害,进而影响舆情预警的效力。二是在对微博等社会媒体的监测中存在诸多盲区,目前对微博的数据监测还只能监测某一条具体微博的传播路径,如北大可视化、独到科技等;但对于一个微博账号整体微博数据、某一地区所有用户的微博数据和某一个事件的所有微博数据的监测依然存在盲区;三是对微信数据的监测,由于微信数据的封闭性,在腾讯尚未将数据接口开放前,微信数据还是个黑箱子。
二是大数据时代来临为社会舆情监测带来了挑战和机遇。近一年以来,大数据成为各行各业的热议乃至热炒的概念,大数据对舆情研究来说既是机遇也是挑战。在笔者看来,大数据对整个社会的影响不在于其数据和技术本身,而是彻底颠覆了传统数据时代的逻辑思维和行为逻辑,传统数据时代对因果关系的依赖转为更宽广层面的相关关系,社会预测成为可能,舆情研究可以借助这种思维,通过精巧的数据库支撑和数据挖掘对社会发展趋势进行一定效度的预判,这是带给舆情研究的机遇。但同时,大数据时代数据量的增加和对技术繁杂程度的要求更高,舆情研究的门槛进一步提升,传统的舆情分析中小作坊式的运作模式将进一步被颠覆。
……
展开