第1章 绪论
信息交流是人类社会的一种基本现象,是人与人相互作用与联系的一种方式。随着以社交网络为代表的新型信息交流方式的不断涌现,以及云计算、物联网等技术的兴起,数据发生了“大爆炸”,人类也迅速进入了大数据时代。从历史的角度来看,信息交流从传统文明时期发展至今,受科学技术的影响*为明显和直接(麦克格雷,1988)。在当前大数据时代,社交网络信息交流行为已成为信息管理领域的研究热点,也是极具挑战性的研究领域之一。
(1)信息交流已经进入社交网络时代,信息交流行为的复杂性与重要性不断提升。互联网作为现代信息技术的主流之一,已经对信息交流产生了全方位的影响。社交网络风靡全球,信息交流也随之进入了社交网络时代。社交网络,即社会化网络服务(social networking service,SNS),是Web 2.0体系下的一个技术应用架构,旨在帮助人们建立并维持社交关系。在社交网络中,人们通过信息发布、信息点赞、信息转发、信息评论等多元信息交流方式建立、维系社交关系,同时各种信息流沿着不同社交关系进行实时性、裂变式的演进,从而有力地推动了人类社会进入了一个“无处不网、无时不网,人人上网、时时在线”的信息交流新时代。社交网络本质上是一种基于社交关系的信息交流平台,其高互动性和可参与性极大地促进了社会行为向网络行为、社会关系向网络关系、社会信息向网络信息的转化进程,也使社交网络成为目前*为流行的Web 2.0应用之一。脸书(Facebook)、推特(Twitter)、YouTube、微博、微信、抖音等不同形态的社交网络都在以惊人的速度不断发展,吸引了越来越多的用户加入社交网络之中。人是社会信息活动的主体,人类的信息行为是世界上最广泛、最复杂的现象之一。信息交流行为作为一种重要的信息行为,一直吸引着专家学者们的积极关注。应当注意到,社交网络的快速发展在使人类信息交流需求得到极大释放的同时,又进一步提升了信息交流行为的复杂性与重要性。一方面,由于社交网络信息交流行为主体的异质性、信息交流行为动机的隐蔽性和信息交流行为形态的多样性,个体层面信息交流行为将表现出高度复杂性;另一方面,通过社交网络的强大聚合功能,个体层面信息交流行为将叠加成为群体层面信息交流行为,形成嵌套结构并表现出整体的“涌现性”,从而对人类社会和经济发展产生真实广泛的重要影响。
(2)大数据驱动的科学研究第四范式为社交网络信息交流行为研究开启了新的研究视角—客观行为数据视角。2012年,在互联网上曾经出现了一张转载率很高的信息图谱,它统计了几个知名站点在1 min的时间里所产生的数据量,显示的数据量惊人。在短短的60 s,YouTube用户上传48 h的视频,Google收到2000000次搜索请求,Facebook用户分享684478条信息,“Like”按钮被点击34772次,Twitter要处理1000000条Tweets信息。2013年被称为中国的“大数据元年”,大数据开始在我国逐渐兴起,并深入渗透到各行各业。例如,百度依靠丰富且领先的人工智能应用技术积累,开发了如语音识别、自然语言理解、图像识别、用户画像等超过150项人工智能(artificial intelligence,AI)核心技术,目前已有超过80万开发者使用,日调用数量超过4000亿次,加速带动了实体经济的高效创新。毋庸置疑,人类社会已经进入了大数据时代,而且大数据正以前所未有的速度颠覆人们探索世界的方法,引起了社会经济、国防军事、科学研究等领域的深刻变革。就科学研究领域而言,科学家已经把数据作为科学研究的对象和工具,基于数据来思考、设计和实施科学研究,由此诞生了科学研究第四范式—数据密集型的知识发现(Hey et al.,2009)。哥伦比亚大学沃茨通过研究发现,大数据对极其复杂的人类行为研究起到了极其重大的作用,能够为人类行为研究提供丰富的可靠信息,从而避免了研究者认知的偏见、感知的误差和框架的歧义。无疑,社交网络拥有巨量的活跃用户,他们已经在社交网络中产生了海量的信息交流行为数据,从而给研究者带来前所未有的机遇—从客观行为数据视角挖掘社交网络信息交流行为的规律。因此,可以考虑将科学研究第四范式应用于社交网络信息交流行为研究中,即从客观行为数据视角对社交网络信息交流行为进行定量研究。
(3)人类动力学为从客观行为数据视角研究社交网络信息交流行为提供了重要的理论与方法支撑。对人类行为进行定量研究一直都是科学家不懈努力的一个重要方向。在早期对人类行为的研究中,一个基本的假设是人类的行为从总体上看是随机和稳态的(Dyte et al.,2000)。据此,人类行为可以用泊松过程来描述,人类发出相续行为的间隔时间是较为均匀的,短时间内大量事件的爆发和长时间的静默都应该很难被观测到。然而,Barabási(2005)发表在Nature上的一篇论文却暗示大量由人类活动驱动的系统具有明显偏离泊松统计的性质:人们常常在短时间内密集从事某项活动,而后又在很长时间里将其弃之脑后。无疑,这一重要发现对于基于泊松过程的排队论提出了巨大挑战。Barabási(2005)的工作在复杂性科学领域开创了一个名为“人类动力学”的研究方向,吸引了国际上大量知名科学家的积极关注,相关成果相继在Nature等国际顶级学术期刊上发表。人类动力学是一门新兴的交叉学科,综合借鉴了数学的原理、物理的方法、系统的思想来对人类行为进行定量研究,在发现人类行为统计规律的同时力求寻找表面现象下的内在机制(樊超,2010)。从研究目标上讲,人类动力学主要是通过统计分析揭示人类行为中展现出来的相对普遍的行为规律(如通信间隔时间和回复时间的幂律分布等),并挖掘行为的内在机制(如重要信件优先处理,容易回复的信件优先处理等);从研究方法上讲,人类动力学是通过无干预的客观数据,从一个外在观察者的角度给出量化的分析结果;从技术路线上讲,人类动力学是遵从“观察→数据获取与分析→统计规律挖掘→建模再现行为规律”的循环,几乎不对数据的产生过程、获取过程、分析结果进行人工的干预,从而保证了研究结果的客观性(周涛 等,2013)。事实上,从人类动力学的研究历史来看,科学家最初就是针对人类的通信行为(典型的信息交流行为)进行了相关的探索性研究,从而逐步建立了人类动力学的理论与方法体系。由此,人类动力学的相关理论与方法,完全可以应用于社交网络信息交流行为的定量研究,能够有效地支撑从客观行为数据视角深入挖掘社交网络信息交流行为规律的科学研究。
本书研究的主要目的就是将科学研究第四范式和人类动力学应用于社交网络信息交流行为研究之中,基于大数据驱动的社交网络信息交流行为研究新范式,深入挖掘社交网络信息交流行为隐藏的相关规律,进而揭示社交网络信息交流行为规律的生成机制,并据此构建描述社交网络信息交流行为过程的定量模型,从而为社交网络信息交流行为研究及社交网络信息服务优化研究的纵深拓展提供重要的理论支撑。具体包括:①发现社交网络信息交流行为的统计规律,虽然社交网络中的个体数据随机性较强,但是只要数据达到一定规模,就可以从中发现一些具有普遍意义的统计规律,具体包括个体层面和群体层面两个层次;②揭示社交网络信息交流行为统计规律的生成机制,需要将个人的经验观察、前人的研究成果与相关的统计规律不断地进行对比论证,提炼出可量化的生成机制,为动力学模型的构建提供重要基础;③构建社交网络信息交流行为动力学模型,要求构建的各种动力学模型能够较好地解释和再现统计规律,并通过调整参数大小,动力学模型能够适用于不同类别社交网络的信息交流行为模拟,具有一定的普适性;④提出社交网络信息服务优化的相关方法,利用社交网络信息交流行为动力学模型及其揭示的社交网络信息交流行为规律,提出社交网络个性化信息**服务优化方法和社交网络群服务优化方法。
第2章 社交网络信息交流行为基本理论
本书的研究涉及社交网络信息交流行为、大数据、人类动力学等主题。其中,社交网络信息交流行为是本书的直接研究对象,大数据和人类动力学是研究社交网络信息交流行为问题的切入点。由此,本章将重点阐述社交网络信息交流行为的基本理论,为后续章节的研究奠定理论基础。
2.1 社交网络与网络信息交流行为
伴随着互联网全面进入Web 2.0时代,社交网络风靡全球,各种社交网络应用层出不穷,吸引了越来越多的用户加入其中,同时也对网络信息交流行为产生了重要的影响。此部分将在阐述社交网络和网络信息交流行为基本理论的基础上,揭示社交网络对网络信息交流行为的重要影响。
2.1.1 社交网络概述
美国行为学家亚伯拉罕?马斯洛(2012)在默里把人的需要分为20种的研究基础上,进一步提出了人类基本需要等级论,即需求层次论。马斯洛(2012)认为人类需求像阶梯一样从低到高按层次分为五种,分别是生理需求、安全需求、社交需求、尊重需求和自我实现需求。显然,人是社会化属性的生物,如果失去了社会属性,那人将体现不出其存在的价值,所以社交需求在人类的需求层次体系中具有重要地位。在传统环境下,人们为了维持自己的社交圈,只能通过写信、发短信、打电话、面对面交流等方式进行沟通。社交网络的出现,彻底改变了这种状态。
1. 社交网络的基本概念
目前,社交网络的发展如火如荼,但是关于其定义却是众说纷纭。Snyder等(2007)认为,社交网络较非正式网络关系而言是创造更为频繁和具有深远影响的网络关系的媒介。Boyd等(2007)认为,社交网络是基于互联网的有界服务,允许用户开放自己的资料,创建与自己有联系的系统内其他用户的列表,用户可以浏览其他用户页面。Kwon等(2010)认为,社交网络是一种通过共享有用信息而维持社会关系的在线网络服务社区。王翠英(2012)认为,社交网络不同于传统的社会网络,它是一个信息传播与信息共享、意见交流、交往沟通的多功能平台。综合以上分析,社交网络不仅仅是一种拓展社会关系的新型应用工具,同时也是一类支持信息互动的新型媒介平台,更是整合新型社交应用和新型媒介平台的新型网络空间。
由此,社交网络的概念可从应用视角、媒介视角和空间视角进行三维界定。从应用视角来看,社交网络是新型社交应用,它以六度分隔理论为基础,向用户提供社会化服务,帮助用户建立、维系社会关系。从媒介视角来看,社交网络是新型媒介终端,它是信息的重要载体和传播手段,极大地扩展了人类的信息交流能力和思想认知感情。从空间视角来看,社交网络是由新型社交应用和新型媒介终端构成的新型网络空间,它提供了一个将虚拟和现实结合起来的多维空间,使人类重新以职业、爱好等各自真实的面貌聚集成不同的“部落”。
2. 社交网络的思想观念
从思想内核上看,社交网络建立于Web 2.0理念的基础之上,蕴含了丰富的思想观念,外在的技术架构只是这些思想内涵的具体表现。
(1)平等的世界观。不论男女老少、不论地位等级、不论地域差异、不论语言差别等,人人都能平等地利用社交网络。例如,社交网络的每个用户都可以成为网络内容的创造者,他们享有平等地与其他用户互动交流的机会。
(2)“无知”的知识观。社交网络建立在“无知”的知识观假设基础之上,即在社交网络的新型网络空间中,任何用户都难以对日渐复杂的对象系统及问题全域有一个全面的把握,他们只能按照自己的知识背景对某一领域某一问题有着一定的了解(马费成,2012)。
(3)融入“微”理念的文化观。社交网络将“微”理念融入网络文化之中,构建网络文化的一个新变体—微文化(蒲清平 等,2016),关注微小个体,做微小之事,聚微小之力。个体力量虽微小,但是通过社交网络的聚合放大,就可以体现出群体力量的强大。
(4)主动贡献的价值观。社交网络打破了传统的自上而下的由少数资源控制者集中控制主导的网络体系,转变为自下而上的由广大用户集体智慧和力量主导的网络体系。每个用户的主动贡献是社交网络可持续发展的重要基础
目录
前言
第1章 绪论 1
第2章 社交网络信息交流行为基本理论 4
2.1 社交网络与网络信息交流行为 4
2.1.1 社交网络概述 4
2.1.2 网络信息交流行为概述 6
2.1.3 社交网络对网络信息交流行为的影响 8
2.2 社交网络信息交流行为内涵 10
2.2.1 社交网络信息交流行为的含义 10
2.2.2 社交网络信息交流行为的特征 11
2.2.3 社交网络信息交流行为的类型 13
2.2.4 社交网络信息交流行为的影响因素 14
2.3 社交网络信息交流行为模式 15
第3章 大数据驱动的社交网络信息交流行为研究新范式 18
3.1 科学研究第四范式 18
3.1.1 科学研究范式的内涵 18
3.1.2 科学研究范式的演变过程 18
3.1.3 基于大数据的科学研究第四范式 21
3.2 人类动力学理论 24
3.2.1 人类动力学的核心思想 24
3.2.2 人类动力学的核心指标 25
3.2.3 人类动力学的**模型 28
3.3 科学研究第四范式下社交网络信息交流行为研究范式嬗变 31
3.3.1 科学研究第四范式对社交网络信息交流行为研究的影响 31
3.3.2 基于人类动力学的社交网络信息交流行为研究新范式 31
3.3.3 天涯社区信息交流行为的人类动力学研究示例 33
第4章 单点模式下社交网络信息发布行为研究 43
4.1 单点模式下社交网络信息发布行为实证分析 43
4.1.1 基于数据集B的实证分析—普通用户 43
4.1.2 基于数据集C的实证分析—认证用户 58
4.2 兴趣驱动的普通用户社交网络信息发布行为动力学模型 64
4.2.1 生成机制分析 64
4.2.2 模型规则描述 65
4.2.3 模型仿真与验证 67
4.3 任务驱动的认证用户社交网络信息发布行为动力学模型 72
4.3.1 生成机制分析 73
4.3.2 模型规则描述 73
4.3.3 模型仿真与验证 74
第5章 点对点模式下社交网络信息发布-转发评论行为研究 80
5.1 点对点模式下社交网络信息发布-转发评论行为实证分析 80
5.1.1 数据描述 80
5.1.2 基本统计分析 81
5.1.3 影响因素分析 86
5.2 基于社会交互的社交网络信息发布-转发评论行为动力学模型构建 88
5.2.1 生成机制分析 88
5.2.2 模型规则描述 88
5.3 模型仿真与验证 90
5.3.1 参数设置 90
5.3.2 模型验证 92
第6章 一对多模式下社交网络信息发布-转发行为研究 95
6.1 一对多模式下社交网络信息发布-转发行为实证分析 95
6.1.1 数据描述 95
6.1.2 基本统计分析 96
6.1.3 影响因素分析 101
6.2 基于社会影响理论的社交网络信息发布-转发行为动力学模型构建 105
6.2.1 生成机制分析 105
6.2.2 模型规则描述 106
6.3 模型仿真与验证 107
6.3.1 参数设置 107
6.3.2 模型验证 110
第7章 多对多模式下社交网络信息发布-评论行为研究 116
7.1 多对多模式下社交网络信息发布-评论行为实证分析 116
7.1.1 数据描述 116
7.1.2 基本统计分析 117
7.2 基于二分网络演化的社交网络信息发布-评论行为动力学模型构建 124
7.2.1 生成机制分析 124
7.2.2 模型规则描述 125
7.3 模型仿真与验证 126
7.3.1 参数设置 126
7.3.2 模型验证 132
第8章 社交网络个性化信息**服务优化 136
8.1 社交网络个性化信息**服务概述 136
8.1.1 个性化信息**服务概述 136
8.1.2 个性化信息**服务的基本方法 137
8.1.3 社交网络中的个性化信息**服务 138
8.2 融入用户兴趣漂移特征的微博信息个性化**方法 139
8.2.1 总体模型构建 139
8.2.2 不同时间窗口下用户兴趣主题发现 141
8.2.3 长短期兴趣漂移发现算法 142
8.2.4 基于用户兴趣漂移特征的用户聚类与信息** 144
8.3 实验分析 145
8.3.1 数据采集与预处理 145
8.3.2 实验过程 150
8.3.3 结果评价 164
第9章 社交网络群**服务优化 167
9.1 社交网络群**服务概述 167
9.1.1 群**的基本概念 167
9.1.2 群**中的兴趣融合策略 167
9.1.3 社交网络中的群**服务 168
9.2 兴趣传播视角下的群**方法:以微博超话为例 169
9.2.1 微博超话内部兴趣传播的本质 169
9.2.2 兴趣传播的影响因素分析 170
9.2.3 基于兴趣传播的微博超话群**方法 171
9.3 实验分析 172
9.3.1 数据采集与预处理 172
9.3.2 实验过程 173
9.3.3 结果评价 182
参考文献 184