前言
观自在菩萨。行深般若波罗蜜多时。照见五蕴皆空。度一切苦厄。舍利子。色不异空。空不异色。色即是空。空即是色。受想行识。亦复如是。……乃至无老死。亦无老死尽。无苦集灭道……
——《心经》
在展开这本书的内容之前,我想先说一下佛。与佛结缘,始于2007年3月时任香港理工大学校长潘宗光先生赠予的《心经与生活智慧》《心经与现代管理》这两本书。书中说,无数大德高僧践行的佛教教义,可以解决俗世中的很多问题。生活与工作中的“色”“受”“想”“行”“识”,无一例外,被认知的局限性困扰——不懂得夫妻相处之道,家庭就不会和谐美满;不了解项目管理的理论和方法,就谈不上有效的、高质量的项目管理。但如果我们能像“观自在菩萨”一样,修为到达“行深般若波罗蜜多时”,就能“照见五蕴皆空”,进而“度一切苦厄”,尘世间的种种,均能迎刃而解。
那么,怎么才能做到“行深般若波罗蜜多时”呢?佛教的知识体系提出了“四圣谛”的理论来解决这个问题。所谓“四圣谛”,即“苦”“集”“灭”“道”。“苦”是指发现存在的问题;“集”是指找到问题的根源;“灭”是指寻求解决问题的方法;“道”是指使用正确的方法解决存在的问题。
人工智能是研究如何模拟人类认知的一门科学。认知的含义非常广泛,最朴素的理解是将“所见所闻”变成“所感”。“所见所闻”可以理解为人类的感知智能,其中,“所见”是计算机视觉要解决的问题,“所闻”是自然语言处理(或者说,计算机听觉)要解决的问题。“所感”就是人类认知智能的范畴了。认知智能表现在对“所见所闻”的内容进行理解、解释、规划、推理、演绎、归纳等一系列能力上,并能进一步作出相应的、适当的反应。
本书的重点是向读者详细介绍如何使用深度学习解决人工智能中“所见所闻”的问题,包括以下内容。
第1章详细介绍如何搭建一个以学习为主的深度学习开发环境。本书的所有程序示例都是在这个开发环境中实现的。
第2章简要介绍了人工智能的发展历程、流派,以及机器学习与深度学习的基本内容与相关概念。
第3章以一个用全连接网络实现单标签多分类任务的例子,讲解如何从零构建一个神经网络模型的工作流程和方法,剖析各个流程的相关阶段的主要任务及实现过程。
第4章详细阐述了如何使用全连网络解决计算机视觉、自然语言处理中的二分类、多分类、标量回归等问题,初步介绍了优化模型的方法、原理与实践,让读者对全连接网络有一个全面的理解。
第5章基于程序示例,系统地介绍了卷积神经网络的基本原理、思想及相关模型,帮助读者整体理解卷积神经网络的基础架构,并详细介绍了常用内置回调函数的使用方法,以及防止卷积神经网络过拟合问题的关键技术。
第6章系统地介绍了循环神经网络的基本原理,以及典型模型的演化历程及相关思想,并通过程序示例比较了SimpleRNN、LSTM、GRU、Bidirectional模型的性能优势,详细介绍了解决循环神经网络过拟合问题的方法及Dropout的独特之处。
第7章通过程序示例,详细介绍了深度学习的高阶实践,包括函数式神经网络模型、混合网络模型、基于Xception架构的实践、残差网络的实践、基于预训练词嵌入的实践、使用预训练模型实现特征提取与模型微调、生成式深度学习的实践以及如何使用自定义回调函数监控模型训练过程,并详细阐述了如何从零构建数据集、如何实现数据增强、如何进行数据的批标准化等关键技术。
第8章详细介绍了深度学习模型的封装方法与工程部署方式。
第9章对本书内容进行了概要性的回顾。
回到“四圣谛”的主题上,在佛教的知识体系中,提供了一整套指导方案,践行“四圣谛”的各个环节,比丘僧侣们藉此解决其面临的各种人生难题——解决自己的问题称为小乘,教化而替别人解决问题视为大乘。笔者不是佛教徒,不会去面对青灯古佛修习佛法,自然也没有小乘、大乘之说。不过,佛教典籍的博大精深隐隐左右着笔者的思想和行为。写这本书的目的,就是试图为AI工程师找到解决人工智能在感知问题上的“苦”“集”“灭”“道”,或许暗合大乘之意——尽管笔者连小乘都不到。
郭泽文
2021年1月于北京
展开