搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
机器学习:实用案例解析
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111417316
  • 作      者:
    Drew Conway,John Myles White著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2013
收藏
编辑推荐
  

  《机器学习:实用案例解析》是机器学习和数据挖掘领域的经典图书,基础理论与实践完美的结合,是一部逻辑紧密、内容详实,适合所有相关技术人员的参考书。
  《机器学习:实用案例解析》两名作者都具有丰富的数据分析、处理工作经验,是机器学习实践技术方面的积极实践者。
  
  

 


  
  海报:
  

展开
作者简介

  Drew Conway,机器学习专家,拥有丰富的数据分析、处理工作经验。目前主要利用数学、统计学和计算机技术研究国际关系、冲突和恐怖主义等。他曾作为研究员在美国情报和国防部门供职数年。他拥有纽约大学政治系博士学位,曾为多种杂志撰写文章,是机器学习领域的著名学者。

  John Myles White,机器学习专家,拥有丰富的数据分析、处理工作经验。目前主要从理论和实验的角度来研究人类如何做出决定,同时还是几个流行的R语言程序包的主要维护者,包括ProjectTemplate和log4r。他拥有普林斯顿大学哲学系博士学位,曾为多家技术杂志撰稿,发表过许多关于机器学习的论文,并在众多国际会议上发表演讲。

  陈开江,新浪微博搜索部研发工程师,曾独立负责微博内容反垃圾系统、微博精选内容挖掘算法、自助客服系统(包括自动回复、主动挖掘、舆情监测)等项目,目前主要从事社交挖掘、推荐算法研究、机器学习、自然语言处理相关工作,研究兴趣是社交网络的个性化推荐。

  刘逸哲,阿里巴巴,CBU基础平台部搜索与推荐团队核心技术与query分析方向负责人,机器学习技术领域及圈子负责人。曾任中国雅虎相关性团队、自然语言处理团队算法工程师;AvePoint.inc开发工程师,从事企业级搜索引擎开发。研究兴趣是机器学习、自然语言处理及个性化推荐等算法在大规模数据上的应用。

  孟晓楠,一淘广告技术,阿里非搜索广告算法负责人,负责用户行为分析、建模与细分,RTB竞价算法,展示广告CTR预估与SEM优化。曾工作于网易杭州研究院,参与过分布式全文检索系统和网易博客产品的数据挖掘算法开发。研究兴趣是计算广告技术、机器学习、大数据技术、信息检索等。

展开
内容介绍

  O’Reilly Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年开始,O’Reilly一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O’Reilly的发展充满了对创新的倡导、创造和发扬光大。
  O’Reilly为软件开发人员带来革命性的“动物书”;创建第一个商业网站(GNN);组织了影响深远的开放源代码峰会,以至于开源软件运动以此命名;创立了Make杂志,从而成为DIY革命的主要先锋;公司一如既往地通过多种形式缔结信息与人的纽带。O’Reilly的会议和峰会集聚了众多超级极客和高瞻远瞩的商业领袖,共同描绘出开创新产业的革命性思想。作为技术人士获取信息的选择,O’Reilly现在还将先锋专家的知识传递给普通的计算机用户。无论是通过书籍出版,在线服务或者面授课程,每一项O’Reilly的产品都反映了公司不可动摇的理念——信息是激发创新的力量。

展开
精彩书评

  “O’Reilly Radar博客有口皆碑。”
  ——Wired

  “O’Reilly凭借一系列(真希望当初我也想到了)非凡想法建立了数百万美元的业务。”
  ——Business 2.0

  “O’Reilly Conference是聚集关键思想领袖的绝对典范。”
  ——CRN

  “一本O’Reilly的书就代表一个有用、有前途、需要学习的主题。”
  ——Irish Times

  “Tim是位特立独行的商人,他不光放眼于最长远、最广阔的视野并且切实地按照Yogi Berra的建议去做了:‘如果你在路上遇到岔路口,走小路(岔路)。’回顾过去Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错。”
  ——Linux Journal

展开
精彩书摘
  在图11—7中,我们专注于网络的左半部分,并且把边都删除了,以便于更容易观察节点的标签。快速浏览一遍这部分聚类的Twitter用户名,很明显Drew的这部分网络包含了Drew在Twitter上关注的数据专家。首先我们看到的是知名的数据专家,比如浅绿色的蒂姆·奥莱利(timoreilly)和Nathan Yau(flowingdata),因为他们都是自成一体的。紫色和红色的组也很有趣,因为它们都含有数据黑客,但是被一个关键因子分成两部分:Drew的紫色好友都是数据圈子的杰出成员,例如:HilaryMason(hmason)、PeteSkomoroch(peteskomoroch)、Jake Hofman(jakehofman),但是他们没有一位是R语言圈子的活跃成员。另一方面,红色的节点都是R语言圈子的活跃成员,包括HadlevWickham(hadleywickham)、David Smith(revodavid)、Gary King(kinggary)。此外,力导向算法成功地把这些圈子成员放到一起,并且把属于这两个圈子的那些节点放到圈子的边缘。我们可以看到John(johnmyleswhite)是紫色的,但是他被放到很多红色节点中间。这是因为John在这两个圈子中都是杰出成员,而且数据也反映了这一点。其他的这类例子包括:JD Long(cmastication)和Josh Reich(i2pi)。
  尽管Drew花了很长时间和数据圈子成员交流(包括R用户和非R用户数据圈子成员),但是Drew也使用Twitter与满足其他兴趣的圈子交流。其中一个特别的兴趣是他的学术职业生涯,他关注国家安全技术和政策。在图11—8中,我们突出了Drew网络的右半部分,它包含了来自这些兴趣相关的圈子的成员。和数据专家组类似,这部分包含了2个子组,一个是蓝色的,另外一个是绿色的。和前面的例子一样,节点的分割颜色和摆放位置可以反映出他们在网络中扮演的角色。
  蓝色分割中的Twitter用户铺得很开:一部分离Drew很近,在网络的左边,而另外一些在网络的右边,接近绿色的组。那些靠近左边的用户与技术在国家安全中的角色这一话题有关,这些用户包括:Sean Gourley(sgourley)、Lewis Shepherd(1ewisshepherd)和Jeffrey Carr(Jeffrey Carr)。那些靠近绿色组的用户更加关注国家安全政策,和绿色组中的成员相似。在绿色组中,我们看到很多Twitter上著名的国家安全圈子成员,包括:AndrewExum(abumuqawama)、Joshua Foust(joshua Foust)和Daveed Gartenstein—Ross(daveedgr)。和前面一样,有趣的是,那些属于两个组的人被放置到聚类边缘,例如:Chris Albon(chrisalbon),他在两个圈子中都很杰出。
  ……
展开
目录

前言
第1章 使用R语言
R与机器学习
第2章 数据分析
分析与验证
什么是数据
推断数据的类型
推断数据的含义
数值摘要表
均值、中位数、众数
分位数
标准差和方差
可视化分析数据
列相关的可视化
第3章 分类:垃圾过滤
非此即彼:二分类
漫谈条件概率
试写第一个贝叶斯垃圾分类器
第4章 排序:智能收件箱
次序未知时该如何排序
按优先级给邮件排序
实现一个智能收件箱
第5章 回归模型:预测网页访问量
回归模型简介
预测网页流量
定义相关性
第6章 正则化:文本回归
数据列之间的非线性关系:超越直线
避免过拟合的方法
文本回归
第7章 优化:密码破译
优化简介
岭回归
密码破译优化问题
第8章 PCA:构建股票市场指数
无监督学习
主成分分析
第9章 MDS:可视化地研究参议员相似性
基于相似性聚类
如何对美国参议员做聚类
第10章 kNN:推荐系统
k近邻算法
R语言程序包安装数据
第11章 分析社交图谱
社交网络分析
用黑客的方法研究Twitter的社交关系图数据
分析Twitter社交网络
第12章 模型比较
SVM:支持向量机
算法比较
参考文献

展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证