1 绪论
1.1 研究背景及意义
在信息技术迅猛发展的今天,人们或在线开展各项生产生活活动,或从互联网获取信息支持线下各项活动,信息空间与物理世界和人类社会相互依存共同构成了人们赖以生存的三元空间。信息在三元空间中扮演着不可或缺的角色,它是不同空间的链接纽带,更是信息空间各项活动展开的基础。为了更好地组织、管理和利用信息,为用户提供更优质的信息服务,相关领域的研究者们围绕信息、信息使用者及信息技术开展了各项研究活动(iSchool,2014)。其中,聚焦于信息使用者的用户研究由于在以用户为中心的信息服务中扮演着至关重要的角色成为主要的研究方向之一。用户研究涉及的研究内容极其广泛,包括用户需求与服务、用户心理与行为、用户教育,等等,是涉及信息科学、心理学、教育学等多学科的交叉性研究方向。对于信息服务提供者而言,用户研究关注的重点之一是充分理解用户并为用户提供优质的信息服务。
社会化问答平台作为一类典型的信息服务平台集合了大众百科和社交媒体的功能,为用户提供了一个分享和获取知识、结识有共同兴趣爱好朋友的平台。如何充分理解平台用户并为之提供优质的知识服务是信息服务提供者和相关研究人员重点关注的问题之一。在社会化问答平台中,用户可以提出、回答、搜索和浏览问题,评价、关注某些主题或用户,提供自己的基本信息和擅长的知识技能;用户通过参与知识共享和交流活动,满足自身需求,包括信息需求、知识需求、自我实现需求等。用户在使用社会化问答平台的过程中,产生了大量内容多样、形态各异的用户数据,这些用户数据成为观察、理解平台用户的重要信息来源,也成为社会化问答平台用户研究的主要数据来源。例如,用户的提问、回答和浏览记录是用户兴趣爱好的体现,用户的互动行为是用户社交情况的表征,用户的注册信息是用户基本情况的反映。然而,面对来源多样、内容丰富、类型各异的用户数据,如何组织和管理用户数据,为用户特征、兴趣或偏好挖掘提供有效且易于使用的数据来源,并使之更好地服务于应用开发与优化成为社会化问答平台用户研究中亟待深入探讨和研究的科学问题。
目前,主要的用户研究方法包括以访谈、焦点小组为代表的用户调查方法,基于问卷调查、心理实验的统计分析方法,利用文本分析、数据挖掘或机器学习的用户建模方法等(范晓燕,2007)。研究者们在开展用户研究的过程中利用其中一种或多种方法挖掘用户不同方面的特征,服务于应用开发与服务优化。但以社会化问答平台为代表的信息服务平台呈现出用户类型多样、用户信息种类繁多及用户数据类型各异的特点,为了充分理解用户的需求偏好和特征,进一步优化和提升信息服务质量与用户体验,需要从全局出发,充分利用各类用户数据、综合各种用户研究方法进行更为全面立体的用户研究。
围绕如何利用形式各异、内容丰富的用户数据进行用户研究和服务优化,相关行业从业人员提出了“用户画像”的理念。用户画像从丰富的用户数据中挖掘用户特征,并将用户特征抽象为标签的形式,旨在多维度、全面立体地刻画用户。在数据支撑和智能分析的基础上,用户画像能够支持分类统计和用户数据挖掘,指导产品研发和用户体验优化,实现精准化营销和个性化推荐。用户画像在新网络环境下的用户研究中焕发出勃勃生机与活力,也为社会化问答平台用户研究提供了全新的研究思路。然而,相关行业从业人员虽然围绕用户画像开展了一系列的实践活动,但尚未将用户画像总结上升为理论,不同领域的研究者们尝试从不同角度对用户画像进行剖析和总结。计算机领域的研究者认为用户画像分析是推断用户特征的过程、手段和方法,是为每个用户贴上精确标签的有效手段(马超,2017);统计学领域的研究者将用户画像理解为对现实世界用户的数学建模(李映坤,2017);心理学领域的研究者认为用户画像是对用户特征的勾画,将用户的特点直观明了地表现出来,以反映用户的触点和痛点,达到与产品和服务的链接甚至是评价(饶璇,2017);图书情报领域的研究者则将用户画像理解为用户信息标签化,是建立在一系列数据之上的目标用户模型(王凌霄等,2018)。但从目前看来,关于用户画像的内涵、实现流程和技术方法并没有形成得到普遍认可的认识。且专门针对社会化问答平台用户画像的研究十分有限,尚未有研究从更为宏观的角度系统地分析社会化问答平台用户具有哪些特征、用户画像如何生成和更新等问题。因此,对用户画像展开更深入的探讨和研究成为当前用户研究的一个重要研究方向,与此同时,如何利用用户画像进行社会化问答平台用户研究也成为一个新的研究问题。
基于上述背景,本书围绕社会化问答平台用户画像展开研究,并着重进行面向主题的社会化问答平台用户画像生成与更新研究,这里的主题代指社会化问答平台主题页面中包括的所有内容。面向主题进行用户画像生成与更新研究的原因在于:社会化问答平台中的用户总是围绕某一主题展开问答和讨论,且社会化问答平台通常通过主题页面的形式组织用户的问答和讨论。通过面向主题将用户缩小到一定范围,一方面能够聚焦有一定共同兴趣的用户,有助于发现用户兴趣的共性和特性;另一方面能够聚焦信息服务中存在的具体问题,有助于提供有针对性的优化方案和改进策略。因此,本书的研究具有重要的理论意义和实践价值。
(1)理论意义
1)丰富用户画像理论。对用户画像研究进行系统的梳理和总结,有助于充分厘清用户画像的研究范畴、主要特征,明晰用户画像生成流程、实现方法。此外,利用用户画像进行社会化问答平台用户研究,可以在实践中检验和丰富用户画像理论和用户画像研究框架。
2)拓展用户研究视角。用户画像基于用户各方面的信息对用户进行全面的描绘,其中包括了体现用户所处自然环境和社会环境的自然属性与社会属性方面的用户数据,将影响用户需求和偏好的自然、社会环境因素囊括在内,使“以用户为中心”的用户研究更加全面、立体和充实。此外,以群体用户画像为依据进行产品设计开发和优化,为当前“以典型用户为中心”或“以核心用户需求为中心”的产品设计和服务理念提供新的实现思路。
(2)实践价值
1)全面理解用户,提升信息服务。对于信息服务提供者而言,从丰富的用户数据中抽象出用户的主要特征,可以从中发现用户的需求、兴趣和偏好,以此为依据优化信息服务,有利于提高信息服务效率,提升用户满意度与服务品质。
2)了解用户特点,促进知识交流。对于广大平台用户而言,通过面向主题的用户画像能够了解其他用户的优势、特长和特点,帮助用户结识有共同兴趣爱好的个人或群体、寻找领域专家或具有领域特长的核心用户或明星用户,促进信息和知识交流。
3)掌握用户动向,提供决策支持。对于政府工作人员而言,借助面向公共问题相关主题的用户画像可以了解用户需求和社会舆论,掌握网民在公共问题上的动向,为制定及时有效的决策提供依据,有助于提升公共服务质量。
1.2 国内外研究现状
社会化问答平台用户画像研究的落脚点主要包括三个方面:一是明确社会化问答平台用户具有何种特点;二是如何结合社会化问答平台的特点生成社会化问答平台用户画像;三是采取何种方法生成和更新面向主题的社会化问答平台用户画像。围绕上述三个落脚点,本书通过述评社会化问答平台用户研究、社会化问答平台主题研究以及用户画像研究等方面已有的研究成果,寻找值得借鉴和学习的研究思路和方法,并尝试从中发现前人研究中的不足,进一步明确本书研究的切入点。
1.2.1 社会化问答平台用户研究
社会化问答平台(Social Q&A)以社会资源的充分聚合和利用为目标,为广大网民提供了一个获取、发现和共享信息、知识及智慧的平台(Morris et al.,2010a)。近年来,在市场机制的作用下,社会化问答平台由于能够满足用户不断提高的信息质量需求,保持着高速发展的态势,并出现了从搜索式问答向社会化问答转变的趋势(金碧漪和许鑫,2014)。因此,充分理解社会化问答平台用户并以此为优化信息服务的依据成为用户研究的一个重要研究方向。
1.2.1.1 用户研究的视角
目前,社会化问答平台的用户研究主要围绕用户需求、用户行为、用户生成内容(提问或回答)及由用户构成的社会网络展开,在由用户构成的社会网络中,用户需求、用户行为和用户生成内容相互联系与作用(如图1.1所示)。
图1.1 社会化问答平台用户研究的研究对象
在开展用户研究时,研究者们既关注用户需求、用户行为、用户生成内容及社会网络的特征;也关注用户需求、用户行为、用户生成内容、社会网络及其他环境因素之间的关系和相互作用。因此,可以进一步将社会化问答平台用户研究归纳为特征研究和作用机制研究。其中,特征研究指的是用户特征研究,包括用户需求特征(赵海平和邓胜利,2016)、用户行为特征(邓胜利和刘瑾,2016)、用户生成内容特征及社会网络特征(陈娟等,2017;刘雨农和刘敏榕,2017)。作用机制研究涉及的内容则更为广泛和复杂,它包括围绕不同要素展开的影响因素研究,如用户共享意愿(杨志博,2016)、用户参与意愿(金家华,2015)、用户持续使用意愿等影响因素(江勇威,2016)的研究;也包括不同要素之间的相互作用机制研究,例如,围绕用户需求与用户生成内容相关性展开的内容评价与用户满意度研究(蒋楠和王鹏程,2012),围绕用户需求与用户行为相互作用展开的行为动机研究(陈娟等,2017),以及围绕用户行为与用户生成内容展开的知识共享激励研究(杨志博,2016)等。
1.2.1.2 用户研究的方法
常用的用户研究方法包括以用户访谈、焦点小组为代表的定性研究方法,以及以问卷调查、日志分析、网站流量分析和数据挖掘为代表的定量研究方法等(范晓燕,2007)。在进行社会化问答平台用户研究的过程中同样采用定性或定量研究方法,但在具体方法的选择上会根据社会化问答平台的功能和用户特点进行取舍和改进。
在社会化问答平台用户特征研究中,用户访谈、对比分析等定性研究方法,问卷调查、内容分析等半定量分析方法,以及社会网络分析、聚类分析等定量研究方法,都得到了广泛的应用。例如,在用户需求特征研究中,研究者们通过问卷调查和内容分析将问题划分为推荐类、观点类、知识类等七大类(Morris et al.,2010b);通过问答实验和对比分析将问题划分为事实性、列举性、定义性、探索性等(吴丹等,2011)。
在用户行为特征研究方面,研究者们利用内容分析方法将用户行为分为知识搜寻行为、知识贡献行为和知识采纳行为三大类(邓胜利等,2017);借助社会网络分析方法对社会化问答平台用户网络进行结构分析,发现大多数乐于分享知识的用户只专注某些小的知识类别,且这些用户在擅长的知识类别上表现出较大的差异性(Shen et al.,2015);也有研究者在根据用户提问和问答特点进行用户分类的基础上,利用回归分析方法得到不同类别用户的行为特征(陈娟等,2017)。
在用户生成内容特征研究方面,研究者们利用人工编码、多维尺度分析和聚类分析等方法从Yahoo! Answers里关于糖尿病的记录中挖掘出用户对于糖尿病健康信息的偏好(金碧漪和许鑫,2014)。
在社会网络特征研究方面,研究者们借助社会网络分析方法计算社会化问答平台社群图密度和中心度,从中识别出网络中的意见领袖,并集合意见领袖的个人背景和回答行为,归纳出意见领袖的特征(金碧漪和许鑫,2015)。
在社会化问答平台用户要素的作用机制研究中,往往通过文献调研、背景分析和基础理论学习构建平台中不同要素之间的作用模型,然后采用问卷调查、回归分析等方法对模型进行检验和修正。例如,利用问卷调查方法收集用户数据,然后通过回归分析方法检验用户体验模型,得到视觉吸引力和需求满足对用户体验有正向影响,情感对视觉吸引力、需求满足、交互和用户体验的关系有显著的中介作用,以及除用户使用频率和年龄外,其他控制变量对情感、用户体验都没有显著影响的结论(陈娟和邓胜利,2015)
展开