√量化投资界名师王小川领衔撰写
√零基础入门Python,并进行量化投资入门、进阶及实操
√为有Python基础的读者提供了量化策略建模详解及参考
√提供本书源码及大型回测平台,可进行实战演练
√本书源码可直接实盘应用于投资中
√可与作者在线交流
本书主要讲解如何利用Python进行量化投资,包括对数据的获取、整理、分析挖掘、信号构建、策略构建、回测、策略分析等。本书也是利用Python进行数据分析的指南,有大量的关于数据处理分析的应用,并将重点介绍如何高效地利用Python解决投资策略问题。本书分为Python基础和量化投资两大部分:Python基础部分主要讲解Python软件的基础、各个重要模块及如何解决常见的数据分析问题;量化投资部分在Python基础部分的基础上,讲解如何使用优矿(uqer.io)回测平台实现主流策略及高级定制策略等。
本书可作为专业金融从业者进行量化投资的工具书,也可作为金融领域的入门参考书。在本书中有大量的Python代码、Python量化策略的实现代码等,尤其是对于量化策略的实现代码,读者可直接自行修改并获得策略的历史回测结果,甚至可将代码直接实盘应用,进行投资。
推荐序一
很荣幸收到王小川博士的邀请,为其新书《Python与量化投资:从基础到实战》作序。王小川博士是华创证券研究所非常出色的分析师,在日常工作中非常乐于分享他的开发经验和心得。在本书出版之前,他已经出版了两本关于MATLAB的畅销书,我相信这一本介绍使用Python进行量化投资的新书,会推动相关领域的发展。
在过去的几年中,在很多领域内基于创新类算法的应用场景和相关产品不断涌现,IT的推动作用已经从自动化延展到了智能化。在开源的大氛围下,算法的更新迭代速度不断加快,并在各个领域渗透和融合,专业化程度越来越高。
在金融领域的量化投资、智能投顾、信用评级、新闻监控、舆情分析等多个方向上,目前已经大量使用了相关技术和算法,并且融合的程度在不断加深。与其他领域相比,金融领域的算法应用有其自身的特点:一是信息的来源多、部分数据非结构化;二是在不同的应用场景甚至策略之间,所适用算法的差异较大,例如投资交易的量化策略、智能投顾中的用户画像、新闻处理中的自然语言处理和大数据,都涉及了不同大类的算法;三是投资中各个影响因素之间的逻辑关系复杂化和模糊化;此外,很多金融问题不是单目标优化的,也不是封闭的信息集。
展望未来,在金融科技的落地方向上,量化投资、大数据的Quantamental、精准画像、自然语言处理等依然会是焦点,势必吸引越来越多的关注及资源。量化投资和 Python 这两个词是当下的焦点,王小川博士平时的工作正是其交汇点。正如书名《Python与量化投资:从基础到实战》所表达的,本书包含了王小川博士在工作中的宝贵经验;在案例中描述的示例,正是本研究所金融工程的很多重要研究方向,例如常用的行业轮动、市场中性策略、多因子策略、CTA策略、期权策略、时间序列等。所以,本书对于了解量化开发的运用现状及掌握必备的开发能力而言,是非常有益的。
考虑到众多读者可能没有Python基础,本书从零开始介绍Python语言,并且由浅入深、循序渐进。值得一提的是,与目前市场上的量化投资类图书不同,本书的最大特点是接地气、实用性强,并开源了全部的策略代码,读者可以自行运行和修改。
本书还设置了读者互动网站,对于广大投资者提出的关于本书的疑问,可以在第一时间做出解答。本书可以帮助大家更好地了解量化、掌握方法及提升量化投资的能力,非常值得大家细读。
——华中炜 华创证券执委会委员、副总经理兼研究所所长
推荐序二
互联网时代的量化投资:科技让量化投资和智能投资更普及
科技一直是推动投资行业变革的重要力量,它的发展和应用催生了量化投资的新模式。量化投资利用科学的方法认识市场波动,通过实证方法验证投资假设,通过组合优化生成Alpha交易,可有效地控制风险暴露,高效覆盖大量的投资机会,并提高投资的效率。
自量化投资的开山之作Beat the market:A Scientific Stock Market System出版以来,量化投资便在全球范围内快速发展,涌现出指数基金、对冲基金、SmartBeta和Fund of Funds(FOF)等量化创新产品。量化投资改变了全球资产管理格局,成为主流的投资方法,其管理规模也在快速增长。目前,全球最大的资产管理公司和对冲基金都是基于量化和指数投资的机构。
量化投资行业的蓬勃发展吸引了众多年轻人投入其中,但因其门槛高、专业性强,只有大型投资机构才有能力提供量化研究和投资平台,普通大众没有机会利用专业的量化平台进行研究和投资,也缺乏系统性的量化投资培训教材,这成为制约行业发展的主要问题。因此,在2015年,通联数据推出开放的量化投资平台——优矿,让普通大众也能够拥有华尔街专业机构的量化装备,让量化投资变得更加容易。借助Python科学计算的能力和海量的金融大数据,在优矿平台上可以快速进行统计推断、因子分析、信号研究、资产定价、事件研究、机器学习、深度学习等量化研究工作。优矿已成长为大型的专业量化平台,为行业的发展培养了很多优秀人才。
优矿的部分特色如下。
海量的金融大数据:提供各类资产和财务数据、因子、主题、宏观行业特色大数据和量化场景PIT数据,保障在量化过程中不引入未来数据。
多资产回测框架:提供股票、期货、指数、场内外基金等多资产多策略回测和丰富的衍生工具,保证多因子策略、事件驱动等的快速实现。
优矿的风险模型:接轨国际化风险模型算法,采用优质原始数据,提供10种风格因子和28种行业因子,全面揭示市场行业风险。
量化因子库:提供400多种量化因子库,除了提供了传统的投资因子,还提供了特色Alpha因子如分析师评级、分析师赢利预测等。
《Python与量化投资:从基础到实战》是华创证券研究所量化团队联合通联数据优矿团队的力作,在很大程度上填补了量化投资培训教材的空白,在本书中循序渐进地讲解了量化投资的思想和策略,并借助Python语言帮助读者从零开始进行量化投资实战。
本书适用于有一定数理及编程基础的人员阅读,如果读者能够静下心来,踏踏实实地学习和思考,去理解量化投资的本质和逻辑,就会发现本书蕴藏的宝贵价值。
展望未来,科技的发展也将推动量化投资升级换代。在传统的量化投资中,交易策略是被事先编程的静态模型,其局限性在于策略在一个时期内的效果非常好,但在市场环境发生变化之后就可能效果不佳。机器学习等人工智能技术的应用推动了量化投资进入新时代,智能机器会在市场的发展和变化中观察到市场的异常,交易策略也会随着市场的变化而变化。
量化投资的另一个新趋势是与基本面投资相结合。我们可以用机器帮助我们学习、归纳和总结基本面投资的分析方法和经验,最后形成一套可重复的研究模型。这就是将量化和基本面结合起来,形成“量本投资”的新范式。在未来,无论是做量化还是做基本面的投资者,都应该向中间地带去跨界,去探索。也希望本书的读者们都能够将投资知识和前沿科技融会贯通、学以致用,共同推动中国量化投资行业的发展。
——王政 通联数据创始人兼首席执行官
第1章 准备工作 1
1.1 Python的安装与设置 1
1.2 常见的Python库 2
第2章 Python基础介绍 7
2.1 Python学习准备 7
2.2 Python语法基础 11
2.2.1 常量与变量 11
2.2.2 数与字符串 11
2.2.3 数据类 15
2.2.4 标识符 18
2.2.5 对象 19
2.2.6 行与缩进 20
2.2.7 注释 22
2.3 Python运算符与表达式 22
2.3.1 算数运算符 22
2.3.2 比较运算符 24
2.3.3 逻辑运算符 25
2.3.4 Python中的优先级 27
2.4 Python中的控制流 27
2.4.1 控制流的功能 28
2.4.2 Python的三种控制流 29
2.4.3 认识分支结构if 30
2.4.4 认识循环结构for…in 32
2.4.5 认识循环结构while 33
2.4.6 break语句与continue语句 35
2.5 Python函数 39
2.5.1 认识函数 39
2.5.2 形参与实参 40
2.5.3 全局变量与局部变量 44
2.5.4 对函数的调用与返回值 45
2.5.5 文档字符串 46
2.6 Python模块 47
2.6.1 认识Python模块 47
2.6.2 from…import详解 49
2.6.3 认识__name__属性 50
2.6.4 自定义模块 50
2.6.5 dir()函数 51
2.7 Python异常处理与文件操作 52
2.7.1 Python异常处理 52
2.7.2 异常的发生 55
2.7.3 try…finally的使用 56
2.7.4 文件操作 57
第3章 Python进阶 59
3.1 NumPy的使用 59
3.1.1 多维数组ndarray 59
3.1.2 ndarray的数据类型 60
3.1.3 数组索引、切片和赋值 61
3.1.4 基本的数组运算 62
3.1.5 随机数 63
3.2 Pandas的使用 67
3.2.1 Pandas的数据结构 68
3.2.2 Pandas输出设置 70
3.2.3 Pandas数据读取与写入 70
3.2.4 数据集快速描述性统计分析 71
3.2.5 根据已有的列建立新列 72
3.2.6 DataFrame按多列排序 73
3.2.7 DataFrame去重 73
3.2.8 删除已有的列 74
3.2.9 Pandas替换数据 75
3.2.10 DataFrame重命名 75
3.2.11 DataFrame切片与筛选 76
3.2.12 连续型变量分组 78
3.2.13 Pandas分组技术 79
3.3 SciPy的初步使用 83
3.3.1 回归分析 84
3.3.2 插值 87
3.3.3 正态性检验 89
3.3.4 凸优化 93
3.4 Matplotlib的使用 97
3.5 Seaborn的使用 97
3.5.1 主题管理 98
3.5.2 调色板 101
3.5.3 分布图 102
3.5.4 回归图 104
3.5.5 矩阵图 106
3.5.6 结构网格图 108
3.6 Scikit-Learn的初步使用 109
3.6.1 Scikit-Learn学习准备 110
3.6.2 常见的机器学习模型 111
3.6.3 模型评价方法——metric模块 120
3.6.4 深度学习 124
3.7 SQLAlchemy与常用数据库的连接 124
3.7.1 连接数据库 125
3.7.2 读取数据 126
3.7.3 存储数据 126
第4章 常用数据的获取与整理 129
4.1 金融数据类型 129
4.2 金融数据的获取 131
4.3 数据整理 135
4.3.1 数据整合 135
4.3.2 数据过滤 137
4.3.3 数据探索与数据清洗 138
4.3.4 数据转化 140
第5章 通联数据回测平台介绍 143
5.1 回测平台函数与参数介绍 144
5.1.1 设置回测参数 144
5.1.2 accounts账户配置 154
5.1.3 initialize(策略初始化环境) 160
5.1.4 handle_data(策略运行逻辑) 160
5.1.5 context(策略运行环境) 160
5.2 股票模板实例 168
5.3 期货模板实例 173
5.4 策略回测详情 179
5.5 策略的风险评价指标 181
5.6 策略交易细节 184
第6章 常用的量化策略及其实现 187
6.1 量化投资概述 187
6.1.1 量化投资简介 187
6.1.2 量化投资策略的类型 188
6.1.3 量化研究的流程 189
6.2 行业轮动理论及其投资策略 192
6.2.1 行业轮动理论简介 192
6.2.2 行业轮动的原因 192
6.2.3 行业轮动投资策略 194
6.3 市场中性Alpha策略 199
6.3.1 市场中性Alpha策略介绍 199
6.3.2 市场中性Alpha策略的思想和方法 200
6.3.3 实例展示 201
6.4 大师策略 206
6.4.1 麦克·欧希金斯绩优成分股投资法 207
6.4.2 杰拉尔丁·维斯蓝筹股投资法 211
6.5 CTA策略 219
6.5.1 趋势跟随策略 219
6.5.2 均值回复策略 241
6.5.3 CTA策略表现分析 253
6.6 Smart Beta 258
6.6.1 基于权重优化的Smart Beta 258
6.6.2 基于风险因子的Smart Beta 268
6.7 技术指标类策略 281
6.7.1 AROON指标 281
6.7.2 BOLL指标 285
6.7.3 CCI指标 288
6.7.4 CMO指标 293
6.7.5 Chaikin Oscillator指标 295
6.7.6 DMI指标 299
6.7.7 优矿平台因子汇总 302
6.8 资产配置 317
6.8.1 有效边界 318
6.8.2 Black-Litterman模型 335
6.8.3 风险平价模型 349
6.9 时间序列分析 358
6.9.1 与时间序列分析相关的基础知识 358
6.9.2 自回归(AR)模型 365
6.9.3 滑动平均(MA)模型 372
6.9.4 自回归滑动平均(ARMA)模型 376
6.9.5 自回归差分滑动平均(ARIMA)模型 379
6.10 组合优化器的使用 384
6.10.1 优化器的概念 384
6.10.2 优化器的API接口 386
6.10.3 优化器实例 388
6.11 期权策略:Greeks和隐含波动率微笑计算 392
6.11.1 数据准备 392
6.11.2 Greeks和隐含波动率计算 394
6.11.3 隐含波动率微笑 401
第7章 量化投资十问十答 405