搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
金融数据挖掘
0.00    
图书来源:
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787513642484
  • 作      者:
    刘振亚,李伟编著
  • 出 版 社 :
    中国经济出版社
  • 出版日期:
    2016
收藏
作者简介

  刘振亚,中国人民大学财金学院和英国伯明翰大学教授,博士生导师,摩根大通期货有限公司(JP Morgan Futures)董事,全球管理期货(CTA) Winton Capital中国早期的合作者。在金融计量、量化投资、宏观经济等领域有着深入的研究,从1991年以来已出版多本专业著作,并在China Economic Review 、《世界经济》等国内外一流杂志发表多篇文章。


展开
内容介绍

  本书从金融数据挖掘的数据整理(cluster and classification)和重抽样方法(resampling)开始,介绍了模型的筛选方法(selection methods)、克服高维灾难(disaster of dimensionality)的方法,以及非线性模型(non-linear models)、非参数估计(unsupervised estimation)、决策树(tree-based methods)和支持向量机(support vector machines)等数据挖掘方法,并在后面介绍了R语言的基本操作。

  本书的案例均采用股票市场数据来进行数据挖掘分析,利用简明实用的一些数据挖掘方法来诠释金融数据挖掘的魅力,以期每一名本书的读者都够掌握一些本书介绍的方法,并应用于股票市场投资当中去。当然,正像所有投资书籍及投资机构都会提到的一样,本书也必须指出,“投资有风险,挖掘需谨慎”。


展开
精彩书摘
  《金融数据挖掘》:
  第二节 案例2:系统聚类分析法的应用——股指状态阶段的判断与划分下面用上证综合指数1990年12月至2013年12月的月度数据进行系统聚类分析。这里使用的距离都是欧氏距离,但对类与类之间的距离的定义是不同的,本案例中涉及5种距离的定义,分别是最近距离(Single)、最远距离(Complete)、中位距离(Median)、平均距离(Average)和离差平方和距离(ward)。首先我们使用最近距离定义来进行系统聚类分析,看各月股指的分类结果如何。
  从图2—1中只能看到,第185号样本(2006年10月)为一类,第178号样本(2006年3月)为一类,剩下所有的样本为一类。这个聚类分析的结果就没有太大的意义了,只能说明2006年3月和2006年10月的股指与样本期内的其他月份处于不同的状态。但是这两个月份从股指走势图上却看不出有什么与其他月份股指不同的地方(见图2—2、图2—3)。
  这两个月份的股指均处于2007年大牛市之前,从1990年12月至2013年12月的样本期间来看,它们虽然是低点,但均不是最低点。从原始数据上无法解释为什么这两个样本点被各自分为了一类,看不出它们与其他样本点的显著差别到底在哪里。但是有一点可以肯定的是,这两个月份都是买人的绝佳时机,因为它们的收盘价是比较低的,一个是1837点,另一个是1298点。虽然不能解释机理,但是如果将这种聚类方法的结果作为买人的依据,进而制定量化投资策略,还是有一定的实战价值的。此外,为了检验是否是距离定义方法的不同导致了这种结果,我们又使用了其他4种距离定义(最远距离、中位距离、平均距离、离差平方和距离)进行了系统聚类分析,结果变化不大,依旧能将第185号样本和178号样本区别出来。
  接着,我们再使用1990—2013年的年度数据来进行聚类分析,以寻求更为明确的分析结果,这一次将5种距离定义下的聚类结果都展示出来:从以上聚类分析结果图中可以看出,在最近距离法下,上证综合指数所经历的的年份大致可以分为六类:第一类为17号样本,即2006年;第二类为18号样本,即2007年;第三类为19号样本,即2008年;第四类为1、2号样本,即1990年、1991年;第五类为20~24号样本,即2009—2013年;第六类为其余样本,即1992—2005年。这一聚类结果具有的重要意义是:说明中国股市从2009年以来,已经处于一个新的状态,既不同于2006—2007年时的大牛市,也不同于2007—2008年的大熊市,另外,与2005年之前的股市状态也不一样,所以在分析2014年股市走向时,尽可能地应当参考2009—2013年的股市状况,而不是2008年及之前的股市状况。
  ……
展开
目录

导言

第一章金融数据分类分析(1)——Logit、LDA、QDA与KNN

    第一节 Logistic 分类法

    第二节 LDA、QDA与KNN分类法

    第三节 案例:上证综合指数涨跌预测

第二章金融数据分类分析(2)-聚类分析

    第一节 系统聚类法和K-means聚类法

    第二节 案例

        案例1:系统聚类分析法的应用——股指状态阶段的判断与划分

        案例2. k-means聚类法应用案例

附录:案例代码

第三章金融数据重抽样

    第一节 交叉验证方法

    第二节 拔靴法

    第三节 案例:重抽样方法下的股指涨跌预测模型的再分析

    附录1:投资比例公式证明过程

    附录2:案例代码

第四章线性模型筛选

    第一节 子集筛选法(Subset Selection Methods)

    第二节 收缩筛选法(Shrinkage Selection Methods)

    第三节 案例:regsubset函数在股指涨跌预测模型筛选中的用法

    附录:案例代码

第五章克服高维灾难

第一节主成分分析法(principal components analysis,PCA)

    第二节 部分最小二乘法( Partial Least Squares, PLS )

    第三节 案例

    案例1. 财务指标含义及指向性介绍

 案例2. 主成分分析法在选股中的应用

第六章非线性模型及非参数估计方法

第一节 非线性模型简介

第二节 非参估计方法简介

    第三节 样条估计法

    附录:实例代码

第七章决策树

    第一节 决策树的基本知识

    第二节 三种提高树状模型预测精度的方法

    第三节 案例

        案例1:决策树方法在股指涨跌预测中的应用

        案例2:bagging、randomforest和boosting在决策树模型中的应用

第八章支持向量机

    第一节 最大边际分类器与支持向量分类器

    第二节 支持向量机

    第三节 案例:基于SVM 方法的上证指数涨跌预测

第九章R语言及作图


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证