第1章绪论
本章阐述了本书的研究背景及意义,深入分析了国内外UGC质量研究的现状,在梳理已有研究的基础上,提出了本书的研究内容和创新之处,以及相应的研究思路和研究方法。
1.1 研究背景及意义
1.1.1 研究背景
随着互联网技术的发展和移动设备的普及,人们的生产生活越来越离不开互联网络。尤其是在Web2.0时代,人们可以随时随地借助多种形式的移动设备或终端接入互联网,通过网络进行信息的创建、传播、利用等活动。中国互联网络信息中心(China Internet Network Information Center,CNNIC)2022年8月发布的第50次《中国互联网络发展状况统计报告》指出,截至2022年6月,我国网民规模为10.51亿人,互联网普及率达74.4%,手机网民规模达10.47亿,网民使用手机上网的比例达99.6%,中国网民规模与互联网普及率如图1.1所示(中国互联网络信息中心,2022)。各类网络设备,数量庞大的网民,大规模、多形态、多样化的信息内容,共同构成了一个巨大的网络空间。在这个数字空间中,网络用户发挥了极大的主观能动性,创建和生成了海量、形式丰富的信息内容,这些由用户创建和生成的海量的文字、图片、音频、视频等内容,就是UGC(User-Generated Content),即用户生成内容。2007年,经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)指出了UGC的三个特征:互联网上公开可用的内容、内容的创新性以及强调普通用户的创作。
Web2.0时代,网络用户的参与意识逐渐觉醒,他们不再仅仅满足于信息接收者和信息使用者的身份,参与信息创建与传播的意识愈发强烈。互联网络也从最初的侧重于为用户提供静态网页展示信息、提供信息来源、强调信息属性等服务,向更多地为用户提供信息创建、信息传播与共享的平台转变,强调社交属性与信息属性并重。各类网络平台在给予用户更多参与权和选择权的同时,也更加注重与用户的交互性。如国外涌现出的Facebook、Twitter、Instagram等网络社交平台;Amazon、eBay等电子商务平台;GitHub、Udemy等在线学习平台;国内的微博、微信、豆瓣、知乎、抖音、快手、小红书等各类社交平台。用户通过这些社交媒体平台可以创建、发布、传播并利用文字、图片、视频、音频等多形态、多模态的信息,既增强了信息的生产、传播能力,也拓展了用户的社交范围。《2022年全球数字概览》(Digital 2022: Global Overview Report)报告显示(2022年1月发布),全球约有46.2亿人(58.4%)使用社交媒体(Kemp,2022)。就国内而言,目前,微信的“朋友圈”已经成为微信使用率最高的功能;B站2022年第四季度月均活跃用户达到3.26亿人,用户数量持续增长(李方,2023)。国外,YouTube视频平台的使用率从2019年占美国成年人的73%增长到2021年的81%,用户每天观看10亿小时的视频(翟继茹,2021)。除此之外,第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,短视频用户规模达9.62亿人,在用户的带动下,短视频类型UGC数量强势增长,内容范围逐渐广泛,传播范围也更加分散(中国互联网络信息中心,2022)。内容从生产、生活到学习、工作,从健身、旅游到科技、教育,从美食、美妆到购物、体验评价等众多领域,充分体现了多元化发展。可以说,网络用户参与信息创建的愿望从未如此强烈,参与信息创建的范围从未如此之广,参与信息创建的类型从未如此之多。
庞大的用户规模、强烈的参与意识使UGC保持增长态势。伴随着各类APP的快速发展,UGC的类型、形态、内容也日趋多元化,文本、图片、音频、长视频、短视频等各种各样的UGC屡见不鲜。但不可否认的是,随着用户参与UGC创建和传播,UGC质量问题,如信息冗余、信息侵权、信息失真等也逐步浮现。面对海量的UGC,该如何保障和提升其质量是目前数据时代面临的一大难题。一方面,越来越多的用户参与到信息的创建、组织和传播阶段中,不仅推动了UGC数量的快速增加,还加快了UGC传播的速度、扩大了UGC传播的广度,导致数据处理面临渠道分散、体量更大的问题,数据分析也更加多元和复杂,给UGC质量治理带来了更大挑战。另一方面,用户参与UGC创建与传播,在此过程中融入了自己的意志和智慧。由于UGC强调普通用户的创建,受自身素养、能力、动机等因素的影响,用户创建的UGC质量参差不齐。此外,UGC的数量、类型和增长速度远远超出了人们接收、理解和利用信息的能力范围。处于UGC过载中的用户,其认知能力和辨别能力都受到挑战,导致用户对UGC质量的满意度呈下降趋势。人们在享受信息技术、互联网络快速发展成果的同时,也在承受低质量UGC带来的困扰。用户不得不花费更多的时间和精力来筛选信息,将大量的时间消耗在碎片化UGC上。如果不对UGC质量进行治理,任由大量低质量UGC泛滥,会严重影响网络信息生态,给监管部门和用户信息利用都带来困扰。研究者和实践领域的管理者都已经意识到了UGC存在的质量问题,并采取了一些方式、方法和手段进行UGC质量治理,但却忽略了社交网络用户UGC行为与UGC质量之间的关联关系。本书则立足于用户行为与UGC质量的关联,试图从现有的UGC质量治理范式外找到新的治理理念。
1.1.2 研究意义
本书针对UGC质量问题进行研究,具有如下理论意义和现实意义。
(1)理论意义。以UGC为代表的社会化媒体想要保持高效运转需要高质量的UGC。然而,UGC质量参差不齐,其形态、格式的多样性及内容的动态性、实时性、大规模性对UGC质量控制提出了更高的要求。从理论研究来看,目前国内外学者虽然对UGC质量评价、质量控制措施和用户行为等方面有较多的研究,但将用户行为与UGC质量结合起来进行的研究还比较缺乏,且目前的UGC质量预测、评估与控制机制尚不能很好地解决UGC的质量问题。一方面,用户的UGC创建、传播的动机、行为会影响UGC的质量;另一方面,目前对UGC质量评价、质量控制和用户行为的研究主要集中在如何丰富UGC和激励高质量UGC创建方面,仍需要深入和拓展。本书基于用户行为分析,把UGC的用户行为和UGC内容结合起来,进行UGC质量实时预判与控制,探索UGC质量预判与控制的方法,提供一种UGC质量控制的新思路,有助于促进UGC理论的完善和发展。
(2)现实意义。对UGC进行质量治理,有助于监控舆情、规范网络秩序、发掘UGC价值。但从实际情况来看,海量的UGC中存在大量的垃圾内容和无用信息,严重影响UGC的价值实现。这些垃圾内容及无用信息产生和存在的根源之一在于用户行为的不规范。进入Web2.0时代,用户的信息行为变得越来越复杂,需要从用户行为的角度,研究用户行为对UGC质量的影响,探索UGC质量控制的新路径。从用户行为的角度研究UGC质量控制,一方面符合行为科学的理论与实践,另一方面也是适应新一代网络信息资源管理的需求,有助于UGC的良性发展和高效利用。
在大数据时代,用户创建信息的情景、动机多样复杂,如何把用户行为和UGC质量关联起来,从用户行为视角探索UGC质量提升的途径,营造和维护健康、清朗的网络信息环境,帮助用户更好地利用信息,是目前亟须解决的一个难题。本书在对当前UGC质量现状进行分析的基础上,结合数据挖掘和大数据分析方法挖掘用户行为与UGC质量的关系,提出基于用户行为的UGC质量预判模型,并通过实验验证所提出的UGC质量预判模型的有效性,提出用户、平台、政府等多方协同,共同提升UGC质量,共同营造清朗网络空间的建议。
1.2 国内外研究现状
UGC是用户生成或者创建内容的总称,通常指用户将自己原创的内容通过平台进行展示或者提供给其他用户。经济合作与发展组织在报告中描述了UGC的三个特征:“互联网上公开可用的内容”“内容的创新性”“强调普通用户的创作”(Vickery & Wunsch-Vincent,2007)。然而对UGC的研究,较难严格遵循这些特性。因此本书中讨论的UGC倾向于更为广义的UGC,包括以任何形式发表的由用户创造的文字、图片、视频、音频等内容,从行为上,把“创作”的外延也拓展到转发、点赞等多种行为,把创作者也扩展到机构和专业人员。
UGC发轫于20世纪90年代,经历了个人网站、论坛、博客、视频网站、独立社交网络服务(Social Networking Service,SNS)的演进,现正朝微博、微信、短视频等移动化、大众化、融合化的新方向发展。随着Web2.0的发展,国内外的UGC,无论是用户规模、用户活跃度,还是发展模式、盈利模式等,都已发展到一定程度。移动互联网、物联网、区块链等新兴互联网技术的发展,使用户可以随时随地借助手机、电脑、Pad等终端通过网络创建、接收和共享信息,用户创建信息行为已成为网络信息资源生产过程中占主导地位的信息生产模式。然而,由于内容的创建以普通用户为主导,UGC创建者的信息素养、创建动机、知识水平等均存在差异性,加之信息平台存在利益趋向等问题,致使UGC的质量呈现出极大的不均衡性,给用户的认知带来很大负担,影响了用户对UGC的利用。纵观国内外的研究,研究者针对UGC质量展开了多层次多方位的研究,其中,UGC质量的评价、UGC质量的控制成为国内外学者们的关注热点。
1.2.1 国外研究现状分析
本书以TI=(ugc OR UGC OR CGC OR UCC OR 'user generated content' OR 'user created content' 'wikipedia' OR 'Generated Content' OR 'consumer generated content' OR 'online review' OR 'SOCIAL INFORMATION') AND TS=('quality')为检索式,在Web of Science引文数据库中选择核心集进行检索,共获得相关文献878篇。经数据清洗后,删除不相关文献25篇,最终获得有效文献853篇,其年度分布及论文累积数量如图1.2、图1.3所示,从一定程度上反映了该研究主题受关注程度的变化。将文献导入CiteSpace 5.7进行关键词分析,得到国外UGC质量研究关键词图谱(图1.4),对图1.4进行关键词统计得到国外UGC质量研究TOP10关键词统计表(表1.1)。