第一章互联网科普舆情数据报告
互联网科普舆情研究通过对全网科普大数据的抓取与分析,了解网民关注的科普领域热点,通过对重点、热点科普事件发生时的科普舆情开展多维度分析,解读事件发酵的传播路径与公众态度,为相关部门决策提供科学依据和支持。本报告所使用的2016 ~ 2019 年数据由新华网与北京清博大数据科技有限公司(以下简称清博大数据)提供,对在其数据基础上产生的各类研究报告进行分析阐述。自2020 年起,本报告的数据源由清博大数据更换至人民网舆情数据中心。从数据与报告特征来看,新的数据源更加突出各个时间段的热点科普事件与辟谣事件。
第一节互联网科普舆情数据报告内容框架
为了获取数据,人民网舆情数据中心监测了网络新闻 a、报刊、论坛博客、微信、微博、 APP新闻 b共六大来源的海量数据。本研究相关报告的数据抓取即以此为背景,根据提前选定的十大科普领域种子词,通过技术手段对全网六大来源的相关科普数据进行抓取,结合人工分析形成互联网科普舆情数据报告。人民网舆情数据中心统计的数据标准与清博大数据不同,因此在数量级上略有差异,但对传播数据的分析仍能反映出各个平台的传播状况。互联网科普舆情数据报告共有三种呈现形式,分别是研究月报、研究季报和研究年报。
一、确定科普领域主题、种子词及监测媒介范围
在本次互联网科普舆情研究中,首先确定了十大科普领域主题及其种子词库,十大科普领域主题分别是健康舆情、信息科技、能源利用、生态环境、前沿科技、航空航天、应急避险、食品安全、科普活动和伪科学。每个科普领域主题下都有相应的种子词库,种子词库每月进行迭代更新。此外,根据互联网科普舆情研究的领域,人民网舆情数据中心确定了监测媒介平台类别,通过技术手段为这些科普媒介平台打上科普标签,建立科普舆情监测的媒介平台范围,并定期进行迭代更新。通过技术手段对不同媒介平台科普信息的用户群体特征,科普信息量及用户阅览评价指标(“粉丝”数、文章数、阅读数、评论数、转发数、点赞数等),重点热点科普信息的传播路径等内容进行抓取分析,以文字、图示、趋势图等形式进行呈现,形成研究月报、研究季报和研究年报。
二、互联网科普舆情数据报告内容结构分析
互联网科普舆情数据报告主要通过“数据自动抓取 +人工阅览分析”的方式来形成。
(一)研究月报
研究月报主要包括 5个部分,分别是舆情数据、科普热点事件、科学辟谣热点、地方科普传播对比、舆情研判建议。
(1)舆情数据。主要通过对网络新闻、报刊、论坛博客、微信、微博、 APP新闻六大平台的相关科普信息进行抓取分析(头条新闻纳入 APP新闻),统计不同平台的科普信息数量和百分比情况。对六大平台不同数量的信息数量用柱状图来呈现,对其不同的百分比情况用饼图来呈现。
(2)科普热点事件。指对科普热点事件的陈述与分析,具体包括舆情概述、媒体报道内容解析。
(3)科学辟谣热点。指对科普辟谣事件进行解析,具体包括辟谣事件的传播情况、谣言与真相、真相来源。
(4)地方科普传播对比。每期研究月报都对当月的地方科普情况进行比较,以及对地方的突出科普行动进行解析。
(5)舆情研判建议。每期研究月报都对当月的舆情形式进行解析,并提出相应的应对策略。
(二)研究季报
研究季报在研究月报的基础上撰写,同样包含月报的 5个部分,与研究月报的内容、呈现形式及逻辑起点都是一样的。不同的是,研究季报的数据比研究月报的数据量更大、数据收集的周期更长,数据百分比分布及排名结果等也略有不同。
(三)研究年报
研究年报在全年数据收集的基础上撰写而成,数据量更大,时间周期更长,相关结论和研究月报、季报的也略有不同。
三、数据分析方法
本研究采用文本分析法,共包括 10份研究月报、 4份研究季报、 1份研究年报,研究首先对研究月报和研究季报采用统计学的方法进行取样,参考 1份研究年报的相关内容,对样本中的相关数据结论进行分析,形成规律性认识。
第二节互联网科普舆情数据月报分析
互联网科普舆情数据月报主要包括 5个部分,分别是舆情数据、科普热点事件、科学辟谣热点、地方科普传播对比、舆情研判建议。纵观 2020年 10个月的科普舆情月报,我们可以发现其中的一些规律,以下分别进行阐述。
一、排名前三位的媒介传播平台分别是微信、网络新闻和APP新闻
在对 2020年 10个月的互联网科普舆情数据月报进行统计分析后发现,与其他媒介传播平台相比,微信、网络新闻和 APP新闻的科普舆情信息量在六大媒介平台中位列前三位。微博的科普舆情信息总量偶尔会排进前三位,但从总的数量来看,排进前三名的媒介平台仍以微信、网络新闻和 APP新闻为主。
通过全年数据可以看出,在 10个月中,微信在其中 8个月的科普信息总量都排名在第一位,其余两个月排名在第二位;网络新闻有 2个月的科普信息总量排名在第一位, 8个月排名在第二位; APP新闻的科普信息总量有 9个月排名在第三位。从总的科普信息量来看,在 10个月中,微信科普信息总量为 2 243 228篇,网络新闻科普信息总量是 1 593 612篇,APP新闻科普信息总量为 717 828篇(图 1-1)。
图 1-1 分平台科普舆情信息量
二、排名前三位的科普领域主题分别是前沿科技、应急避险、健康舆情
通过对 2020年的 10份月报进行数据分析可以发现,在十大科普主题中,热度指数综合排名前三位的是前沿科技、应急避险、健康舆情。综合全年的排名来看,在 10个月中,前沿科技主题因为涉及疫苗研究等相关技术,与百姓生活密切相关,始终排名在第一位;应急避险主题在 10个月中始终稳定排名在第二位;健康舆情主题则排名在第三位。
三、“科普中国”排名前三位的媒介传播平台分别是微信、网络新闻和 APP新闻
对 2020年 10个月的互联网科普舆情数据月报进行统计分析后发现,与其他媒介传播平台相比,微信、网络新闻和 APP新闻的“科普中国”舆情信息量在六大媒介平台中主要排名在前三位。
通过全年数据可以看出,在 10个月中,微信的“科普中国”信息总量数据都排名在第一位;网络新闻的“科普中国”信息总量排名在第二位; APP新闻的“科普中国”信息总量排名在第三位,各平台排位比较稳定。从总的“科普中国”信息量来看,在 10个月中,微信“科普中国”的信息总量为 703 450篇,网络新闻“科普中国”的信息总量是 429 055篇,APP的新闻“科普中国”信息总量为 184 516篇(图 1-2)。
图 1-2 分平台“科普中国”舆情信息量
四、月度科普传播表现*突出的三个热区分别是北京市、广东省和湖北省
通过对 2020年 10份研究月报中科普舆情信息地域发布热区的统计和分析可以看出,北京市、广东省和湖北省轮流占据第一的位置。北京市 5个月排名
展开