社交网络信息传播是计算机科学、传播学、社会学、管理学等领域 的重要研究问题,在舆情分析和网络营销领域具有广泛的应用。目前,同类著作更多地站在传播学或管理学角度介绍信息传播的模型、原理和应用。而本书主要从计算机科学角度出发,介绍了该领域的经典问题和*新成果,包括传播模型、话题检测、影响力*大化等问题。此外,本书面向实际应用场景,阐述了如何开发舆情分析和网络营销系统。本书可供社交网络分析与数据挖掘研究领域的研究者了解该方向的前沿基础工作,也可供信息传播与网络舆情领域的工程实践人员作为系统构建的参考和指导。
上篇 理论研究
第1章 传播模型 2
1.1 引言 2
1.2 解释模型 4
1.2.1 问题描述 4
1.2.2 解决方案 5
1.3 预测模型 10
1.3.1 基于图形的方法 10
1.3.2 基于非图形的方法 15
1.4 本章小结 19
参考文献 20
第2章 热门话题检测 24
2.1 引言 24
2.2 热点话题(PT)模型 25
2.2.1 热点话题简介 26
2.2.2 热点话题 26
2.2.3 持续性话题 27
2.2.4 模型应用 27
2.3 在线话题模型(OLDA) 30
2.3.1 概率话题模型和LDA模型的应用 30
2.3.2 OLDA模型原理 31
2.3.3 OLDA模型的先进性 31
2.4 时间和社会话题评估(TSTE) 33
2.4.1 Twitter下的TSTE模型简介 33
2.4.2 内容提取 34
2.4.3 用户权威 35
2.4.4 内容衰退理论 36
2.4.5 从新关键词到新话题 37
2.5 话题预测分析 37
2.5.1 趋势预测 38
2.5.2 趋势变化的原因 39
2.6 异常检测算法下的话题发现 40
2.6.1 概率模型简介 41
2.6.2 概率模型方法 41
2.7 本章小结 44
参考文献 45
第3章 影响力最大化 47
3.1 引言 47
3.2 影响力最大化基本概念 48
3.2.1 影响力最大化的描述 48
3.2.2 社交网络的马尔科夫模型 49
3.3 影响力最大化基本算法 51
3.3.1 启发式算法 51
3.3.2 贪心算法 52
3.4 新鲜度衰减情况下影响力最大化算法 53
3.4.1 新鲜度衰减函数 54
3.4.2 独立级联模型下的新鲜度衰减 54
3.4.3 贪心算法的优化 55
3.4.4 影响力传播计算算法 57
3.5 社交网络中信息覆盖最大化 58
3.5.1 信息覆盖最大化问题简介 58
3.5.2 信息覆盖最大化问题的特征 59
3.5.3 信息覆盖最大化问题的解决方法 60
3.6 在线影响力最大化 61
3.6.1 在线影响力最大化问题描述 61
3.6.2 节点选择策略 62
3.6.3 更新不确定影响概率图 63
3.7 流式子图的增量算法 63
3.7.1 大规模网络下影响力最大化问题 64
3.7.2 增量算法的特征 65
3.8 线性阈值模型下的可扩展社交网络影响力最大化 65
3.8.1 问题描述 65
3.8.2 LDAG算法 66
3.9 本章小结 66
参考文献 66
第4章 收益最大化 69
4.1 引言 69
4.2 最佳营销策略模型 70
4.2.1 模型简介 70
4.2.2 正外部性 70
4.2.3 模型结果 71
4.2.4 市场策略 73
4.2.5 对称设置最佳营销策略 73
4.2.6 影响-拓展营销策略 75
4.3 影响-拓展策略的效率 76
4.3.1 营销策略的社交网络模型 76
4.3.2 影响-拓展策略的效率 77
4.4 线性阈值模型下的收益最大化问题 77
4.4.1 用户估值线性传播模型(LT-V) 78
4.4.2 定价策略 79
4.5 固定价格销售策略 81
4.6 商品数量受限时的收益最大化 82
4.6.1 问题陈述 82
4.6.2 PRUB算法 84
4.6.3 PRUB+IF算法 87
4.7 本章小结 88
参考文献 88
下篇 工程实践
第5章 舆情监测 92
5.1 引言 92
5.2 舆情监测相关技术 93
5.2.1 舆情热点自动监测设计 95
5.2.2 文档关键词提取设计 100
5.2.3 专题生成技术分析设计 102
5.2.4 主题生成技术分析设计 103
5.3 互联网舆情监测分析应用系统 104
5.3.1 互联网舆情监测分析系统结构 105
5.3.2 互联网舆情监测分析系统功能 107
5.4 典型舆情监测系统 108
5.4.1 信息采集子系统 111
5.4.2 舆情分析子系统 113
5.4.3 舆情处理子系统 115
5.4.4 舆情呈现子系统 118
5.4.5 统一管理平台 120
5.4.6 安全保障子系统 122
5.4.7 主要技术指标 123
5.5 其他舆情监测系统介绍 124
5.5.1 人民网舆情系统 124
5.5.2 拓尔思 124
5.5.3 鹰击系统 125
5.5.4 Buzzlogic 125
5.5.5 Nielsen 125
5.5.6 Reputation Defender 126
5.5.7 Visible Technologies 126
5.5.8 Cision 126
5.6 本章小结 127
参考文献 127
第6章 品牌推荐与保护 128
6.1 引言 128
6.2 网络口碑营销与网络水军 129
6.3 品牌推荐与保护关键技术 131
6.3.1 评论采集技术 132
6.3.2 自动评论技术 135
6.3.3 评论情感倾向性分析 139
6.4 品牌推荐与保护系统 142
6.4.1 系统架构 142
6.4.2 系统功能 145
6.4.3 系统数据存储 151
6.5 网络水军识别研究现状 152
6.5.1 网络水军识别简介 152
6.5.2 网络水军识别的关键技术研究 154
6.6 本章小结 156
参考文献 157
第7章 网站验证码识别 162
7.1 引言 162
7.2 验证码识别 163
7.2.1 验证码的概念 163
7.2.2 验证码分类 164
7.2.3 验证码识别框架 165
7.3 图片预处理 166
7.3.1 图像灰度化 168
7.3.2 图像二值化 169
7.3.3 图像去噪 170
7.3.4 干扰线去除 171
7.4 字符分割 173
7.4.1 字符分割简介 173
7.4.2 K-Means聚类分割 174
7.4.3 投影分割 175
7.4.4 改进的连通区检测 176
7.4.5 滴水分割算法 178
7.4.6 基于连通区检测和投影算法结合的分割方法 180
7.5 字符识别 182
7.5.1 字符特征建模 182
7.5.2 特征库生成 188
7.5.3 识别方法 190
7.6 实验结果及分析 190
7.6.1 使用轮廓走势特征的识别 191
7.6.2 分割并使用统计特征的识别 195
7.6.3 不分割且使用位图特征的识别 199
7.7 验证码识别理论和技术在国内外的研究现状 203
7.8 本章小结 205
参考文献 205