赞誉<br/>序1<br/>序2<br/>序3<br/>前言<br/>第1章 评分卡建模理论基础 1<br/>1.1 评分卡建模常见面试问题 1<br/>1.2 关于模型的系统性理解 2<br/>1.3 与建模密切相关的4个领域 3<br/>1.3.1 机器学习 3<br/>1.3.2 数据挖掘 4<br/>1.3.3 数据分析 4<br/>1.3.4 统计分析 5<br/>1.3.5 四者之间的联系与区别 5<br/>1.4 评分模型与评分卡模型 6<br/>1.4.1 评分模型和评分卡模型的定义 6<br/>1.4.2 评分卡模型的分类 6<br/>1.4.3 评分卡模型的适用性 7<br/>1.4.4 评分卡模型的价值 8<br/>1.4.5 评分卡模型的应用 9<br/>1.5 评分卡建模全流程 9<br/>1.6 对评分卡模型的评价 10<br/>1.7 本章小结 11<br/>第2章 零售信贷业务基础和风险管理 12<br/>2.1 银行零售信贷产品的产品特征和业务流程 12<br/>2.1.1 个人贷款 13<br/>2.1.2 信用卡 17<br/>2.2 信用与信用风险 21<br/>2.2.1 信用风险识别 22<br/>2.2.2 信用风险评估 23<br/>2.2.3 信用风险监测 24<br/>2.2.4 信用风险控制 24<br/>2.2.5 征信 25<br/>2.3 欺诈与欺诈风险 26<br/>2.3.1 欺诈风险的分类 27<br/>2.3.2 欺诈风险的防范 27<br/>2.3.3 欺诈风险与信用风险比较 27<br/>2.4 本章小结 28<br/>第3章 业务需求理解 29<br/>3.1 业务需求理解概述 29<br/>3.2 明确拟解决问题和分析目标 29<br/>3.3 业务访谈的设计和实施 30<br/>3.4 整体分析方案设计 31<br/>3.5 本章小结 32<br/>第4章 数据基础决定模型效果上限 33<br/>4.1 关于数据的系统性认识 33<br/>4.1.1 数据基本特征 33<br/>4.1.2 常见数据问题 36<br/>4.2 传统信贷业务数据 37<br/>4.2.1 贷款可用数据 38<br/>4.2.2 信用卡可用数据 38<br/>4.3 征信数据 39<br/>4.3.1 征信数据概述 39<br/>4.3.2 一代人行征信 40<br/>4.3.3 二代人行征信 41<br/>4.3.4 一、二代人行征信的差异及映射转换 42<br/>4.3.5 人行征信数据的使用 43<br/>4.4 内外部大数据 44<br/>4.4.1 大数据概述 44<br/>4.4.2 银行内部大数据 45<br/>4.4.3 银行外部大数据 45<br/>4.5 数据质量诊断 46<br/>4.5.1 数据质量诊断目的 46<br/>4.5.2 数据质量诊断方法 47<br/>4.6 业务数据分析 48<br/>4.6.1 业务数据分析目的 48<br/>4.6.2 业务数据分析方法 49<br/>4.7 本章小结 49<br/>第5章 利用特征工程提取有效的风险特征 50<br/>5.1 特征工程概述 50<br/>5.1.1 特征与特征工程 50<br/>5.1.2 数据处理与特征工程流程 51<br/>5.1.3 特征工程的理论体系 51<br/>5.1.4 特征工程的抽象范式 52<br/>5.2 特征预处理与转换 53<br/>5.2.1 常见数据质量问题 53<br/>5.2.2 特征清洗与预处理 53<br/>5.2.3 特征编码 54<br/>5.2.4 特征转换 55<br/>5.3 特征提取与生成 56<br/>5.3.1 业务专家经验定义 56<br/>5.3.2 工程化自动化衍生 56<br/>5.3.3 表征学习 58<br/>5.4 特征评价、选择与降维 62<br/>5.4.1 特征评价 62<br/>5.4.2 特征选择与降维 63<br/>5.5 自动化特征工程技术与工具 65<br/>5.5.1 自动化特征工程概述 65<br/>5.5.2 自动化特征工程工具 66<br/>5.6 本章小结 74<br/>第6章 评分卡模型设计 75<br/>6.1 模型设计概述 75<br/>6.1.1 模型设计的定义 75<br/>6.1.2 模型设计的工作内容 76<br/>6.2 排除规则与样本范围 76<br/>6.2.1 排除规则和样本范围的定义 76<br/>6.2.2 申请评分卡模型排除规则 77<br/>6.2.3 行为评分卡模型排除规则 77<br/>6.2.4 催收评分卡模型排除规则 78<br/>6.3 模型细分 79<br/>6.4 表现期定义与Vintage分析 80<br/>6.4.1 表现期定义 80<br/>6.4.2 Vintage分析 80<br/>6.5 滚动率 83<br/>6.5.1 滚动率定义 83<br/>6.5.2 滚动率分析 84<br/>6.5.3 滚动率计算常见问题 84<br/>6.6 观察期的定义与选择 85<br/>6.6.1 观察期的定义 85<br/>6.6.2 观察期的选择 85<br/>6.7 模型设计汇总计数 86<br/>6.7.1 汇总计数定义 87<br/>6.7.2 汇总计数的特别说明 87<br/>6.8 建模方式和模型原型选择 87<br/>6.9 本章小结 88<br/>第7章 评分卡模型开发 89<br/>7.1 模型开发概述 89<br/>7.2 样本分区 90<br/>7.3 样本抽样 91<br/>7.4 变量预筛选 93<br/>7.5 变量分箱 94<br/>7.6 变量再筛选 96<br/>7.7 变量转换WOE 97<br/>7.8 使用逻辑回归进行模型拟合 97<br/>7.8.1 多重共线性检验 97<br/>7.8.2 逻辑回归建模 98<br/>7.8.3 模型训练结果 100<br/>7.9 模型验证 101<br/>7.9.1 排序性 101<br/>7.9.2 区分能力 101<br/>7.9.3 稳定性 103<br/>7.9.4 分值集中度 103<br/>7.9.5 分值分布 104<br/>7.9.6 离散度 104<br/>7.10 评分标尺 105<br/>7.11 模型导出PMML并测试 107<br/>7.12 评分卡建模专用Python包 108<br/>7.12.1 scorecardpy工具包 108<br/>7.12.2 toad工具包 108<br/>7.12.3 RiskModeler工具包 109<br/>7.13 评分卡建模实例 109<br/>7