搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
电子商务推荐系统导论
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787030422651
  • 作      者:
    伍之昂,曹杰著
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2014
收藏
内容介绍
    伍之昂、曹杰著的《电子商务推荐系统导论》以 电子商务为应用背景,深入浅出、全面地介绍推荐系 统基本原理和 主流技术,对每种模型和算法的阐述力求易于理解, 并保持数学严谨性。本书 涵盖的内容有:传统推荐模型与算法、情境推荐模型 与算法、社会化推荐模型 与算法、推荐系统评价指标与方法、推荐系统的可信 性和安全性、电子商务推 荐系统与企业绩效、电子商务推荐系统架构设计以及 在大数据时代下推荐系统 的展望。在章节论述过程中,作者主要从学术研究角 度出发,围绕推荐系统面 临的挑战性问题,阐释现有研究中的主流技术,指出 值得进一步研究的难题。    同时,还对电子商务推荐系统设计开发涉及的工程性 技术及成功的实际应用系 统作了简明扼要的阐述。     本书既可作为有兴趣从事推荐系统领域研究工作 的高校教师和研究生的 理论基础用书,帮助他们了解本领域研究现状,把握 关键问题,熟悉基本方法; 亦可作为企业工程师设计和开发推荐系统时的参考书 。       
展开
精彩书摘
第1 章引论
1.1 推荐系统概述
1.1.1 推荐系统:动机与现状
因特网的崛起和迅猛发展使人们获得了前所未有的自由信息空间,也使得世界范围内的信息处于大爆炸状态,造成信息量大、信息质量差、信息价值低等问题,用户难以从过量信息中获取对自己有用的部分,这就是所谓的信息过载(information overload)[1] 。正如文献[2]中所言,数据是广泛可用的,所缺乏的是从中提取出知识的能力。为应对信息过载问题,大量信息过滤网络工具应运而生,人们最常用的莫过于门户网站和搜索引擎,但这些工具都是以面向人们主流需求为主,且用户获取信息的方式是“被动”的。
显然,考虑个性化需求,将有用信息以“主动”方式推送(push) 给用户不仅能过滤信息,而且能增强用户体验,推送的信息也更符合用户个体的需求。简信息聚合(really simple syndication,RSS)是一种在主动信息推送服务方面的典型工具。RSS 是一种消息来源格式规范,能够将新闻标题、摘要、内容按照用户的要求“送”到用户桌面。但是,在RSS 中,用户兴趣通常是由用户预先给定的关键词来描述,但缺乏自动挖掘用户兴趣的功能。
推荐系统(recommender systems) 是一种为用户提供建议的智能化软件工具,是解决信息过载问题非常有潜力的方法[3] 。推荐系统的研究与开发始于20 世纪90 年代初期。第一个推荐系统是Tapestry[4] ,是针对电子邮件的推荐系统。该推荐系统通过分析用户阅读邮件的历史行为来对新邮件重新排序,试图将用户更感兴趣的新邮件推荐给他/她。更为重要的是,Tapestry 首次提出了协同过滤(collaborative filtering,CF)的概念[4] 。后续的推荐系统领域研究表明,协同过滤对推荐系统的发展产生了深远影响,成为关注最多、应用最广泛的方法之一。
推荐系统与以搜索引擎为代表的信息检索技术本质区别[5] 在于:①搜索注重结果之间的关系和排序,而推荐则需研究用户兴趣模型,即结合考虑用户与推荐对象的特征;②搜索由用户主导,包括输入查询词和选择结果,若结果不好,用户会修改查询再次搜索,而推荐则由系统主导用户的浏览顺序,主动引导用户发现需要的结果。
·2·电子商务推荐系统导论
从20 世纪90 年代初期到现在,推荐系统受到学术界和工业界的长期关注,成为炙手可热的研究议题。推荐系统是一门典型的交叉学科,涵盖计算机科学、电子商务、人类社会学、物理学、经济学等诸多领域,图1.1 给出2013 年国际顶级会议ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD) 投稿数量的分布,可以看出,推荐系统在20 个领域中排名第三,其热度由此可见一斑。从2007 年开始,ACM 设立了专门讨论推荐系统的国际会议,ACM Recommender Systems Conference (RecSys) 至今已举办8 届,其知名度持续上升。从2006 年开始,美国密歇根大学Paul Resnick 教授开设了“推荐系统”课程。

图1.1 KDD 2013 年投稿数量领域分布
随着社会网络、物联网、大数据等新概念和新技术的出现和升温,信息过载问题将日益严重,同时,工业界的需求导致用户对信息获取方式的要求也变得越来越高。推荐系统作为既能应对信息过载,又能智能化地为用户主动推送信息的强有力手段,可以预计,在今后数十年内,推荐系统仍然将获得持续关注,更加有效和高效的推荐系统将在人类信息化进程中扮演越来越重要的角色。
1.1.2 电子商务:推荐系统最重要的应用领域
Companies need to shift from the old world of mass production where “standardized products, homogeneous markets, and long product life and development cycles were the rule” to the new world where “variety and customization supplant standardized products”. 
quoted from “Mass Customization”by Joe Pine[6] 
第1 章引论·3·
以上内容引自Joe Pine 的著作“Mass Customization”,说明了企业由传统模式过渡到现代模式的法则,需要从传统标准化商品过渡到多样化的定制商品,其隐含意思就是充分考虑用户个性化需求。这段话恰当地说明了推荐系统为何在电子商务领域得到良好发展和应用的原因。用户的需求通常是模糊的,而商家期望能够把满足用户模糊需求的商品推荐给用户,把用户潜在需求转化为现实需求,从而达到提升商品销售量的目标。
电子商务将企业的销售行为从线下实体店销售搬到了在线销售,用户行为和商品信息的数字化更加促进推荐系统的应用。目前,几乎所有的大型电子商务网站都不同程度地采用了推荐系统[5] ,电子商务成为推荐系统最重要的应用领域,同时,电子商务企业的应用和研究也促进了推荐系统的发展,比如,Amazon 在10 年前提出了基于项目的协同过滤方法[7] ,并沿用至今。推荐系统为电子商务企业带来了新的营销观念,即“一对一营销”,正如Amazon CEO Jeff Bezos 所说,“如果我们有200 万个网络客户,我们就需要在线储备200 万种商品”。总的来说,推荐系统能为电子商务企业带来以下三方面的收益[8] 。
(1) 提升浏览到购买的转化率。网站访问者经常漫无目的地浏览网站,却不购买任何商品,推荐系统能帮助访问者发现其感兴趣的商品,从而促进访问者到购买者的转化。

(2) 提升交叉销售量。推荐系统通过向用户推荐与其已购买商品相关联的商品,用户在购买的最后步骤,网站会向用户推荐与购物车内商品极为相关的附属商品。

(3) 提升用户忠诚度。如何提升用户忠诚度或黏粘度是电子商务网站的核心商业策略之一,推荐系统建立起网站与用户之间的联系,为提升用户忠诚度提供附加值,用户往往会重复访问与其兴趣偏好相匹配的网站,甚至会将这些网站推荐给自己的朋友圈。


在竞争日趋激烈的环境下,电子商务推荐系统能够为电子商务网站有效保留用户,提高电子商务系统绩效,产生巨大的经济效益。构建一个推荐效率高、精度高而且UI 界面合理的商品推荐系统对于电子商务网站的发展十分重要,推荐系统也因此成为工业界的关注热点。
1.1.3 推荐系统:形式化建模
一般地,推荐系统包含两类实体:用户(user)和项目(item) 。用户是指被推荐对象,无需过多解释。而项目则是指推荐对象,推荐系统领域的所有英文文献都使用“item”一词来表达,本书统一将“item ”译为“项目”,泛指不同领域的推荐对象。比如,电子商务推荐系统中,项目表示商品或物品;音乐和电影推荐系统中,项目则表示CD 和DVD;新闻推荐系统中,项目又表示新闻网页,等等。尽管“项目”有可能与英语“project”一词相混淆,但是,将推荐实体“item ”译为“项目”在
·4·电子商务推荐荐系统导论
推荐系统领域的中文文献中广广泛出现[5,9-12]]。
推荐系统输入数据的最简单形式是用户户对项目的评分分数据,称为用用户-项目评分矩阵(user-iteem rating matriix),大部分数据据集采用5 分制制(或5 星制)评评分,即5 分表示最满意,依依次递减。尽管管实际电子商务务系统提供了用用户对购买中不不同方面的评分,如图1.2 所所示的淘宝网评评分体系,就支持持“宝贝与描述述相符”、“卖家家服务态度”、“卖家发货速度度”3 种不同子子项。但是,在在推荐系统形式式化建模时却通通常只考虑综合评分。同时,用户-项目评评分矩阵不一定定都是显式给出出,也可以基于于隐含的用户和项目关系推测得到。如果用用户对某项目评评过分,其偏好好已经从用户--项目评分矩阵中反映出来,,已评分项目就就不作为推荐给给用户的候选对象象。因此,推荐荐系统工作时试图预测用户对对未评分项目的的偏好程度,由预测分值反映。。基于上述分析析,推荐系统
本质是基于已有
有的用户-项目评
  :
(评分矩阵称为训.
 
训练集),寻找一

一个准确的预测
  
测函数P:
1.1

, 



其中,U 和I 分别表示用户和和项目的集合,,任意待预测的的用户项目对(uu,i)在训练集中的评分为空值值。一旦利用预预测函数P 对对用户-项目评分分矩阵缺失值计计算出预测分值后,就很容易易产生推荐,即即将预测分值最最高的项目(或N 个分值最高的的项目集合) 
这这一过程形式化化为
 
推荐给用户,



 1.2
aargmax

, 

图1.2 淘宝网网评分体系
第1 章引论·5·
集合U 和I 在实际中都非常大,用户规模很容易达到百万级,项目规模则更大,这导致超大规模的用户-项目评分矩阵,因此,依靠遍历评分矩阵整个空间设计预测函数P 在计算上不可行。围绕计算预测值的效率问题,推荐系统提出了大量各种各样的模型和算法,如基于内容的、协同过滤、混合型、基于矩阵分解的方法等。
推荐算法(recommendation algorithm) 决定了预测函数P 的设计和计算,是整个推荐系统最核心和关键的部分,在很大程度上决定了推荐系统的类型和性能优劣。推荐算法也因此成为探讨推荐系统的核心部分,本书后续章节正是围绕主流推荐算法来介绍电子商务推荐系统。尽管推荐系统是一门交叉学科,与其联系最紧密的是数据挖掘(data mining) ,数据挖掘是自动地从大规模数据集中发现有用信息的过程,几乎所有的推荐算法都可以被认为是一种数据挖掘技术[13] 。数据挖掘过程大致可分为三个阶段:数据预处理、数据分析以及结果解析,图1.3 描述了这三个阶段中与推荐算法密切相关的数据挖掘方法。在数据预处理阶段,距离计算、抽样、维度约简等技术经常被用于协同过滤算法。在数据分析阶段,分类技术经常被用于基于内容的推荐算法,关联规则挖掘形成了一种单独的推荐算法,聚类可用于具有相似兴趣的用户群组发现及具有相似属性的商品群组发现。

图1.3 推荐系统中经常使用的数据挖掘技术(图片来源:文献[13]) 
1.2 推荐系统研究概览
1.2.1 挑战性问题
推荐系统的研究是围绕其面临的挑战性问题而展开的,因此,首先应在清楚了
·6·电子商务推荐系统导论
解挑战性问题的基础上,来进一步阐释已有的推荐系统研究工作。本书后续章节将围绕针对推荐系统所面临的挑战性问题的研究工作而展开论述,试图为推荐系统这一活跃的研究领域勾勒出较为全面、清晰的概貌。
1. 推荐算法的准确度和可扩展性
推荐算法一直是推荐系统研究中最核心的问题,关注焦点包括准确度和可扩展性两个方面。准确度是衡量算法的有效性(effectiveness) ,可扩展性是衡量算法的效率(efficiency) 。目前,如何设计效率快且准确度高的算法仍然是一个开放性话题,百家争鸣,各种各样的推荐算法被提出。导致这一挑战的根本原因在于数据呈现高度稀疏性,即用户和项目规模通常达到百万级,甚至千万级,而已知的评分数据又比较稀少,基于如此稀疏的数据,设计兼顾有效性和效率的算法却是一大挑战。目前已有的研究大多沿着两种思路来设计推荐算法:一种是以稀疏的用户-项目评分矩阵为输入数据,依托数据挖掘技术,提出新的模型和算法,包括协同过滤及其各种变例、基于内容的推荐、基于维度约简的各类模型以及基于关联规则挖掘的推荐等,将在第2 章介绍这些算法;另一种是在用户-项目评分矩阵的基础上,融入更多的额外数据以缓解稀疏性。将在第3 章讨论的情境推荐模型与算法中考虑推荐的上下文信息,可能包括用户购买意图、季节、节日、位置、同伴、天气等因素。将在第4 章讨论的社会化推荐模型与算法中则考虑用户的社会关系信息,将推荐系统与社会网络结合到一起。
从算法采用的模型来看,无论是单一的评
展开
目录
前言
第1章 引论
 1.1 推荐系统概述
 1.1.1 推荐系统:动机与现状
 1.1.2 电子商务:推荐系统最重要的应用领域
 1.1.3 推荐系统:形式化建模
 1.2 推荐系统研究概览
 1.2.1 挑战性问题
 1.2.2 本书组织结构
 参考文献
第2章 传统推荐模型与算法
 2.1 协同过滤模型
 2.1.1 基于用户的协同过滤
 2.1.2 基于项目的协同过滤
 2.1.3 相似度计算方法
 2.1.4 混合型协同过滤
 2.1.5 一个例子
 2.2 基于内容的推荐模型
 2.2.1 项目和用户表示
 2.2.2 用户兴趣学习模型
 2.3 潜在语义分析模型
 2.3.1 奇异值分解模型
 2.3.2 概率潜在语义分析模型
 2.3.3 潜在狄利克雷分配模型
 2.4 基于关联规则挖掘的推荐
 2.4.1 频繁模式与关联规则挖掘
 2.4.2 基于关联规则的推荐
 参考文献
第3章 情境推荐模型与算法
 3.1 推荐系统情境信息
 3.1.1 什么是情境信息
 3.1.2 情境信息的层次式表征
 3.2 融合情境信息的推荐模型
 3.2.1 情境预过滤
 3.2.2 情境后过滤
 3.2.3 情境化建模
 3.2.4 三类范式的混合使用
 3.3 基于时空信息的推荐模型
 3.3.1 考虑用户兴趣漂移的推荐
 3.3.2 移动推荐
 3.4 基于隐反馈信息的推荐模型
 参考文献
第4章 社会化推荐模型与算法
 4.1 社会计算与社会化推荐
 4.1.1 社会计算研究议题概览
 4.1.2 社会化推荐
 4.2 社会化协同过滤模型
 4.2.1 基于信任关系的社会化协同过滤
 4.2.2 基于矩阵分解的社会化协同过滤
 4.3 社会化标签系统中的推荐
 4.3.1 社会化标签系统概述
 4.3.2 基于社会化标签的多模式推荐
 4.4 链路预测
 4.4.1 基于拓扑结构信息的链路预测
 4.4.2 基于节点信息的链路预测
 4.5 作者协作关系网络中的推荐
 4.5.1 专家推荐
 4.5.2 论文推荐
 4.6 社会化推荐领域的挑战性问题
 参考文献
第5章 推荐系统评价指标与方法
 5.1 评价任务概述
 5.2 评价指标
 5.2.1 准确性指标
 5.2.2 准确度以外的指标
 5.3 实验数据集
 5.3.1 一般性评分数据集
 5.3.2 融合社会网络的数据集
 5.4 评价方法
 5.4.1 在线评价
 5.4.2 离线评价
 5.5 总结
 参考文献
第6章 推荐系统可信性与安全性
 6.1 托攻击概述
 6.1.1 托攻击模型
 6.1.2 托攻击分类
 6.2 托攻击危害性衡量指标与脆弱性分析
 6.2.1 托攻击危害性指标
 6.2.2 托攻击脆弱性分析
 6.3 托攻击检测特征指标与特征选择
 6.3.1 托攻击检测特征指标
 6.3.2 托攻击检测指标特征选择
 6.4 托攻击检测算法
 6.4.1 监督学习模型
 6.4.2 无监督学习模型
 6.4.3 半监督学习模型
 6.5 托攻击检测算法评价方法
 6.5.1 仿真实验
 6.5.2 真实案例分析
 6.6 群组攻击
 6.6.1 严格版本的群组攻击构建算法
 6.6.2 松弛版本的群组攻击构建算法
 6.7 未来的研究方向
 参考文献
第7章 电子商务推荐系统与企业绩效
 7.1 电子商务企业绩效对推荐系统的影响
 7.1.1 电子商务企业绩效的长尾效应
 7.1.2 长尾分布、齐普夫定律和幂律分布
 7.1.3 长尾效应对推荐系统设计的思考
 7.2 多样化推荐系统设计
 7.2.1 多样性的定义
 7.2.2 重排序技术
 7.2.3 基于主题多样性的推荐
 7.3 推荐系统冷启动问题
 7.3.1 冷启动问题概述
 7.3.2 种子项目选择方法
 7.4 总结
 参考文献
第8章 电子商务推荐系统架构设计
 8.1 商用推荐系统概述
 8.1.1 通用框架
 8.1.2 数据类型
 8.1.3 用户画像
 8.2 推荐系统案例分析
 8.2.1 Amazon推荐系统
 8.2.2 Netflix推荐系统
 8.2.3 Hulu推荐系统
 8.3 基于Web日志的推荐
 8.3.1 Web使用挖掘技术
 8.3.2 Google新闻推荐系统
 参考文献
第9章 下一代推荐系统研究展望
 9.1 大数据的挑战
 9.1.1 大数据计算
 9.1.2 大数据计算对推荐系统基础架构的变革
 9.2 推荐系统研究议题展望
 9.2.1 隐私保护
 9.2.2 基于位置的推荐
 9.2.3 群组推荐
 9.2.4 基于演化计算的推荐模型
 参考文献
索引   
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证