第1章绪论
1.1 微观世界的波函数描述和动力学方程
1.1.1 微观粒子的波粒二象性
对微观系统的大量实验观测发现:构成系统的微观粒子都具有波粒二象性,即微观粒子的动力学行为可以表现出粒子性和波动性两种不同的宏观可观测属性。波动性和粒子性对于粒子的动力学行为而言,如同硬币的两个面,互相联系而不可分割。首先大量的实验发现,经典上被认为是波的电磁场在黑体辐射、光电效应和康普顿散射等实验中表现出明显的粒子性(讨论见习题1.1),而被认为是粒子的电子在晶体衍射和双缝干涉等实验中表现出明显的波动性。随后被认为是粒子的原子、分子和大分子的双缝干涉实验也都证实了微观粒子的波动行为。这些微观粒子所表现出的波动特性最先被德布罗意(de Broglie)大胆推广,提出了物质波的概念和著名的德布罗意关系:
(1.1)
(1.2)
式(1.1)和式(1.2)的左边是描写微观粒子粒子属性的能量E和动量p,右边则是对应微观粒子波动属性的频率ν 和波长λ(n为方向矢量,表示波传播方向的单位矢量),而联系它们的比例系数即为著名的普朗克常数h(-h h/2π),这是在量子力学中正式出现的一个非常小的基本物理常数:
(1.3)
微观粒子的波粒二象性使得描述微观系统的方式发生了重大变化,无法利用描述宏观物体的位置、速度和加速度的方式来描述微观粒子的运动状态。由于实际的微观系统一般具有两个重要特征:1构成体系的微观粒子的数目非常巨大,典型的数量级是阿伏伽德罗常数(Avogadro’s number):1023; 2微观粒子的运动速度非常快,在纳米量级的空间内以接近光速的速度运动。对这样的微观系统,宏观的观测者根本无法通过粒子的位置和速度来描述整个系统的运动状态,原则上对这样的系统只能通过统计的方式进行描述,所以对微观量子系统的宏观描述只能采用统计和概率的方式。
1.1.2 波函数和薛定谔方程
基于微观系统的波动性,描述微观系统状态最合适的方式就是用具有统计性质的复变函数(有强度和相位两个维度):
(1.4)
其中,系统的“粒子性”体现在波函数的振幅上,振幅R(r, t)= jΨ(r, t)j 描述系统粒子的统计测度,即概率幅度,而系统的“波动性”则体现在波函数的相位上。严格地讲,波函数的模方jΨ(r, t)j2 用来表示微观物体在时空(r, t)处出现的概率,即粒子的概率密度分布。
经过大量的实验观测和对自由粒子平面波解的认识,薛定谔推测得到一个描述微观系统状态的偏微分方程,这个方程就是著名的薛定谔方程:
(1.5)
其中,.H(r, t)是系统的哈密顿量,代表了系统的总能量,由构成系统粒子的总动能和系统的所有势能共同决定:
(1.6)
其中,位置矢量r (r1, r2, , rj , );rj 代表粒子j 的位置; .pj 代表粒子j 的动量;V(r; t)代表体系总的势能。
薛定谔方程(1.5)直观的物理意义就是体系波函数的演化是在体系能量的推动下进行的,给定初始波函数,体系在任意时刻的波函数可以通过求解薛定谔方程获得。从数学上讲,薛定谔方程是一个时间和空间不对等的偏微分方程,其特殊的形式决定了它有两个基本性质:1不满足相对论的洛伦兹变换。这一性质的存在使得有人把以式(1.5)为核心的量子力学称为初等量子力学或者非相对论量子力学。2该偏微分方程是线性的。也就是说,如果Ψ1, Ψ2, 是薛定谔方程(1.5)的解,那么这些解的线性叠加c 1Ψ1 + c2Ψ2 + 依然是薛定谔方程的解。这个性质在物理上引出了量子系统态的叠加性原理,在数学上决定了量子力学的数学基础是线性代数。
薛定谔方程的建立,可以通过自由粒子的平面波解反向进行形式上的推导(见习题1.3),但严格证明薛定谔方程是不可能的,因此薛定谔方程是第一性原理的,有些教科书则直接把薛定谔方程作为量子力学的基本公理或公设之一。薛定谔方程的正确性最终只能通过实验来证明,到目前为止所有的实验结果都和薛定谔方程(1.5)的计算结果一致。因此,目前量子力学的核心问题就是直接求解特定体系的薛定谔方程,从而得到体系的状态波函数和对应能级或波函数的演化过程,此即为量子力学的第一性原理计算。
1.1.3 波函数的物理意义
虽然对微观系统的状态引入波函数描述是认识微观世界的巨大进步,但对其物理意义的理解却一直存在激烈的争论。目前主流的诠释是玻恩(Born)的概率波假设,认为波函数的模方代表微观系统的概率分布,即jΨ(r, t)j2 代表t 时刻微观粒子在空间r 处单位体积内出现的概率(见习题1.4)。因此,波函数包含了微观体系所有粒子的统计信息,其对系统状态的描述是完备的。 波函数的统计解释决定了波函数作为复变函数的数学性质。物理上由于空间某一处的概率密度在某一时刻t 必须是确定的,所以波函数必须是单值、有限和连续的复函数,而且其在整个空间中是可积的:
(1.7)
其中,波函数对整个空间自由度的积分可归一化为1(如果不强调空间积分维度,则积分体积元表示为dr,除非需要明确积分维度,如d3r 表示三维空间积分)。因此在某一时刻,对薛定谔方程(1.5)进行积分可以证明,只要势函数V(r, t)对于空间和时间是连续函数,那么波函数对空间的一阶导数在空间任何位置也是连续的。但对于空间某处如果势能出现不可积的奇点,那么波函数对空间的一阶导数就会出现跃变,从后文的一些实际例子将会看到这一点。 系统状态的波函数概率描述,导致定义于其上的物理学量都必须看成概率测度上的随机量,其相对于波函数来说就是算符(也称算子)。所以在量子力学框架下不能问某个力学量算符的值是多少,就如同不能问赌博中骰子的值是多少一样。 对这样的随机量,只能谈其统计性质,如平均值、方差(涨落)、高阶矩等。例如,系统中某个粒子j 的动量.pj 就是实空间内粒子波函数对其空间自由度rj 的梯度算符(为了区分算符,通常在变量字母上面加一个.符号):
(1.8)
式(1.8)是一个非常重要的算符形式,其表明如果微观系统状态用实空间的波函数描述,动量就是波函数的空间梯度。为什么动量存在式(1.8)这样的形式?这依然来源于对自由粒子平面波解的计算和验证(具体见习题1.3),式(1.8)作用在平面波上会自然给出与德布罗意关系式(1.2)相容的结果。
由于波函数的模方代表概率分布函数,根据薛定谔方程(1.5),可以非常方便地证明波函数所表达的概率密度对所有粒子在时空上守恒,其满足如下的连续性方程(见习题1.5):
(1.9)
其中,概率密度ρ(r, t) jΨ(r, t)j2 = Ψ(r, t)Ψ.(r, t);概率流密度函数定义为
(1.10)
显然以上的概率流密度函数也是一个分布函数,其表达了粒子在t 时刻r 处单位时间通过单位面积的概率,所以其量纲为m.2s.1,即概率每平方米每秒。注意式(1.10)中的梯度是对所有粒子空间自由度的梯度运算。连续性方程(1.9)代表了波函数所对应的粒子概率在空间V 上(边界为. V )的守恒流动:
有时为了使用方便,上面的概率流密度函数还可写为如下形式:
(1.11)
其中,动量算符.p = m.v = iˉhr;.v 为粒子的速度。显然粒子的概率流密度具有广泛的含义,如果粒子带电量q,那么其乘以电量就是电流密度(单位为库仑每平方米每秒或安培每平方米);如果粒子携带质量m,乘以质量就是质量流密度;如果乘以能量就是能量流密度,乘以热量就是热流密度,等等。 1.2 薛定谔方程的第一性原理计算
1.2.1 方程求解的困难和基本近似
1. 数值计算的困难
对于由N 个粒子组成的微观系统的薛定谔方程,其包含系统全部统计信息的波函数Ψ(r, t) Ψ(r1, r2, , rN, t)理论上可以通过直接求解薛定谔方程获得,但实际上这种计算一般是不可能完成的,主要的原因是系统的大自由度困难。例如,对单独一个苯分子而言,其波函数的自由度在每个时刻都要包含6 个碳原子核的自由度,加上36 个核外电子自由度,总的空间自由度就有(6+36) 3 = 126 个。如果再加每个核和电子的自旋自由度,那么总共就有168 个基本自由度参与到波函数的计算和演化之中,然而真实的苯仅1 摩尔(1mol)物质就包含1023 个苯分子,这是一个非常巨大的数字,即便对初始时刻波函数信息的存储或赋值都是经典计算机无法完成的任务。所以不需要任何经验参数(只包含基本物理常数)直接从薛定谔方程出发进行真实系统的第一性原理计算基本是不可能的,必须引入近似方法降低系统维度才能进行可行的经典波函数计算(或采用非经典的量子并行计算)。
2. 基本的近似方法
为了有效进行基于薛定谔方程的第一性原理计算,第一个重要的降低系统自由度的近似就是将原子核和电子的自由度进行分离,即玻恩-奥本海默近似(Born- Oppenheimer approximation, BOA)。该近似的原理是由于原子核的质量远大于电子的质量(至少大1800 多倍),所以原子核的运动速度远小于电子,这样原子核和电子的自由度就可以动力学分离,电子快速的运动始终跟随着原子核的缓慢运动,所以该近似也被称为绝热近似。BOA 假定分离了原子核和电子的自由度(原子核和电子的波函数可以退耦合或分离),可以只留下求解电子自由度的波函数(原子核的运动由于缓慢可以近似忽略),而原子核的自由度则退化为电子波函数的绝热参数(此时电子波函数中原子核的自由度就变成相对固定的参数)。也就是说,原始薛定谔方程的计算可以变成给定一组原子核的位置或状态后,再求解电子自由度的波函数,所以这样的计算又称为体系的电子结构计算。
然而即便减少了一部分原子核的自由度,问题的求解变成了计算全同电子体系的问题,但体系的自由度依然是巨大的。这时虽然根据对称性可以用单电子波函数构造体系的多电子波函数,进一步发展出如Haree-Fock 等近似方法,但这些计算依然无法解决电子体系的高自由度关联问题。后来在霍恩伯格(Hohenberg)和科恩(Kohn)等科学家的努力下发展出密度泛函理论(density functional theory, DFT)[1],即将电子波函数的统计信息进一步简化,认为全同电子体系的任何物理量都只是电子密度ρ 的函数(不区分每个电子的自由度),这样波函数的自变量就变成了电子密度分布函数:
该近似抛掉了原始波函数中电子与电子之间更详细的高阶空间相关性等统计信息,薛定谔方程可以进一步转化为在电子密度的基础上求解科恩-沈吕九方程(Kohn-Sham equation),使得计算复杂度大大降低。现代的密度泛函计算,无论是含时系统还是不含时系统,由于密度泛函近似,对于不同性质的体系(如金属、 半导体、有机聚合物或磁性材料等)必须发展不同的密度泛函方法,呈现出DFT 计算策略上的复杂格局,所以基于各种计算策略的商业软件和开源软件层出不穷,如适用于周期结构体系的VASP 软件,擅长于建模的MS 软件和适用于分子体系计算的Gaussian 软件等。但无论如何,关于求解不同系统的第一性原理计算,其困难都是来源于多体系统的大自由度,实际可行的计算都是必须建立在一定假设之上的近似计算(非第一性原理计算),所以要想获得系统完全严格的解析结果,只能考虑低自由度下的理想系统,即简单理想模型。
1.2.2 定态问题和单体系统
1. 定态薛定谔方程
对于希望严格解析求解的薛定谔方程,第一个常见的简单模型就是系统的势函数不含时,此时的系统是一个保守系统,系统的总能量E 守恒,哈密顿量是一个动力学守恒量,此时系统的薛定谔方程就变为定态薛定谔方程。对于由N 个粒子组成的量子力学系统,如果粒子所处的势场是保守势(势能只依赖于粒子位置而不依赖于时间,如粒子处于不变的外场中或粒子之间的势不显含时间变量),即V(r, t)= V(r),此时