2.基于监督采样的影响力估计算法
已有的影响最大化算法致力于为社会网络图中所有节点精确计算影响值,从而划定最有影响力节点。但是精确计算会造成计算量大,运行时间长,因此无法在大规模社会网络中高效发现最有影响力用户。
针对上述问题,本书探索了基于蒙特卡洛理论的采样估计方法ESMCE,大大提升了算法的计算效率,而仅仅损失有限的精度。通过对社会网络中节点的分布特性进行建模和挖掘,发现部分大度数节点的运行时间很长,是整个算法执行的瓶颈。基于蒙特卡洛理论,本书设计了幂律指数监督的采样估计算法ESMCE。ESMCE根据目标社会网络的幂律指数来指导采样节点的个数;为了最小化采样节点的个数和采样轮数,提出了一种基于灰度预测模型的后续采样节点个数预测方法,通过迭代采样的方式逐步求精直至估计误差满足设定的精度要求。
3.动态社会网络的增量式影响最大化算法
现实中的社会网络具有明显的动态性,社会网络图中的节点和边会随着时间发生大量变化。然而,当前的影响最大化算法局限于在给定的静态社会网络图中寻找最有影响力的节点,却忽略了社会网络的动态变化特性。这导致当社会网络拓扑结构发生变化时,已有算法需要完全重新计算才能发现新的影响力节点,带来大量冗余计算。
针对社会网络的动态特性,本书设计了一种基于增量式的影响最大化算法Inclnf。通过深入挖掘社会网络拓扑结构的演化特征,本书发现社会网络拓扑结构的变化服从优先连接定律(Preferential At-tachment Rule),而且最有影响力节点基本上选自于大度数节点。基于以上发现,Inclnf算法设计了一种基于影响局部化理论的影响变化量高效计算方法。之后,基于节点的影响变化量和之前网络对应的最有影响力节点信息,Inclnf算法设计了一种高效剪枝策略,将候选节点范围缩小到影响值增长迅速、度排名靠前的节点集合,从而大幅度降低了算法复杂度,减少了程序运行时间。
4.基于影响最大化的社会网络低延迟内容分发算法为了降低在线社会网络中的用户访问延迟,同时在实际应用中验证所提出影响最大化算法的有效性和可靠性,本书将影响最大化应用于社会网络中的内容分发问题。Web2.0技术使得在线社会网络中存在大量的用户生成内容,带来了大量的网络流量。然而,传统的服务器内容分发策略没有考虑社会网络中用户之间的关联关系以及潜在的内容传播方式。如果能够有效利用这些特性,可以大幅度改善网络流量压力,减少访问延迟,提升用户体验。
针对上述问题,本书设计了一种社会信息感知的内容分发方法SCORE。SCORE首先基于本书提出的IMGPU影响最大化算法来快速发现未来访问频率最高的关键内容;之后通过分析用户之间连接关系和用户的地理位置信息,SCORE提出了一种基于K-MEANS聚类算法和加权球面平均计算方法的边缘服务器选择策略,将关键内容预先分发到离潜在访问用户最近的边缘服务器。这样当未来用户请求到达时,边缘服务器可以就近响应用户请求,从而大幅度降低用户访问延迟,同时减轻网络流量压力。
……
展开