搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
数据分析技术:使用SQL和Excel工具
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787302461395
  • 作      者:
    (美)Gordon S. Linoff著
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2017
收藏
作者简介
  Gordon S.Linoff,从事数据库工作数十年。在他的记忆中,他开始学习SQL时,还是SQL92标准版。当时他正领导一支开发团队(现已不存在的Thinking Machines公司),编写一个侧重于复杂查询的高性能数据库,用于支持决策分析。
  此后,Gordon在1998年合作创建了Data Miners公司,这是一家致力于数据挖掘、分析和大数据的咨询公司。在他的工作生涯中,数据仍然是永恒的主题——而且通常是存储于关系型数据库中的数据。他对SQL的理解和应用也变得越来越深刻和娴熟。在2014年,他是Stack Overflow的多贡献者,Stack Overflow是行业内领先的技术问答网站。
  Gordon编写的另外几本书也都是畅销书:《数据挖掘技术(第3版)一一应用于市场营销、销售与客户关系管理》、Mastering Data Mining和Mining the Web——这些书籍都侧重于数据挖掘和数据分析。本书延续广受好评的第1版,侧重于如何实际地获取和解释数据结果,更具有实践性。
展开
内容介绍
  SQL是数据查询的基本语言,Excel是数据分析和展示的常见工具。两者结合,可以组成一个强大且易于理解的业务数据分析工具。很多类重要的数据分析并不需要复杂且昂贵的数据挖掘工具。答案就在你的电脑桌上。
  《数据分析技术(第2版)使用SQL和Excel工具》是一本实用指南,作者GordonS.Linoff是数据挖掘领域的专家。书中介绍了如何使用SQL和Excel来设计并完成复杂的数据分析。
  《数据分析技术(第2版)使用SQL和Excel工具》的第1版被广泛认可,第2版涵盖了对SQL和Excel新功能的介绍,同时包括新的技术和实际业务示例。第2版介绍了业务经理和数据分析人员所需掌握的新信息。
  《数据分析技术(第2版)使用SQL和Excel工具》首先介绍数据挖掘所用的SQL基础知识,如何使用Excel展示结果,以及用于理解数据的简单的统计学概念。熟悉执行SQL和操作Excel后,《数据分析技术(第2版)使用SQL和Excel工具》介绍了核心分析技术。
  《数据分析技术(第2版)使用SQL和Excel工具》内容逐步从基础查询扩展到复杂的应用,使读者能够学习到某种数据分析的使用原因和时机,如何设计和实现,以及展示数据分析结果的强大方法。每一步都详细解释了业务环境、技术方法以及在所熟悉工具中的具体实现。
  随着对《数据分析技术(第2版)使用SQL和Excel工具》的阅读,你会发现很多知识点,包括地理信息的重要性,图表中的数据随时间的变化方式,如何使用生存分析理解客户任期和变动,以及影响生存率的因素。同时,还会探索到一些方法,包括分析客户的购买模式、分析购物车以及计算关联规则。此外,《数据分析技术(第2版)使用SQL和Excel工具》还包含重要的SQL数据挖掘模型(线性回归模型、朴素贝叶斯模型等)、建立客户签名所需的信息、用于分析结果集的模型、包含累积增量图表和ROC图表、使用SQL的实践、提高查询性能的方法等。
展开
目录
第1章 数据挖掘者眼中的SQL
1.1 数据库、SQL和大数据
1.1.1 什么是大数据?
1.1.2 关系型数据库
1.1.3 Hadoop和Hive
1.1.4 NoSQL和其他类型的数据库
1.1.5 SQL
1.2 绘制数据结构
1.2.1 什么是数据模型?
1.2.2 什么是表?
1.2.3 什么是实体.关系图表?
1.2.4 邮政编码表
1.2.5 订阅数据集
1.2.6 订单数据集
1.2.7 关于命名的提示
1.3 使用数据流描述数据分析
1.3.1 什么是数据流?
1.3.2 数据流、SQL和关系代数
1.4 SQL查询
1.4.1 做什么,而不是怎么去做
1.4.2 SELECT语句
1.4.3 一个基础的SQL查询
1.4.4 一个基本的SQL求和查询
1.4.5 联接表的意义
1.4.6 SQL的其他重要功能
1.5 子查询和公用表表达式
1.5.1 用于命名变量的子查询
1.5.2 处理统计信息的子查询
1.5.3 子查询和IN
1.5.4 用于UNIONALL的子查询
1.6 小结

第2章 表中有什么?开始数据探索
2.1 什么是数据探索?
2.2 Excel中的绘图
2.2.1 基础图表:柱形图
2.2.2 单元格中的条形图
2.2.3 柱形图的有用变化形式
2.2.4 其他类型的图表
2.3 迷你图
2.4 列中包含的值
2.4.1 直方图
2.4.2 计数的直方图
2.4.3 计数的累积直方图
2.4.4 数字值的直方图(频率)
2.5 探索更多的值——最小值、最大值和模式
2.5.1 最小值和最大值
2.5.2 最常见的值(模式)
2.6 探索字符串值
2.6.1 长度的直方图
2.6.2 起始或结尾包含空白字符的字符串
2.6.3 处理大小写问题
2.6.4 字符串中存储的字符是什么?
2.7 探索两个列中的值
2.7.1 每个州的平均销售额是多少?
2.7.2 在一个单独的订单中,产品重复出现的频率是多少?
2.7.3 哪个州的American Express用户最多?
2.8 由一个列的数据扩展到所有列的数据汇总
2.8.1 针对单列的汇总
2.8.2 返回表中所有列的查询
2.8.3 使用SQL生成汇总编码
2.9 小结
……

第3章 不同之处是如何不同?
第4章 发生的地点在何处?
第5章 关于时间
第6章 客户的持续时间有多久?使用生存分析理解客户和他们的价值
第7章 影响生存率的因素:客户任期
第8章 多次购买以及其他重复事件
第9章 购物车里有什么?购物车分析
第10章 关联规则
第11章 SQL数据挖掘模型
第12章 最佳拟合线:线性回归模型
第13章 为进一步分析数据创建客户签名
第14章 性能问题:高效使用SQL
附录 数据库之间的等价结构
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证