化学吧 关注:1,506,701贴子:11,383,249

算阴离子体系不加弥散的严重后果

取消只看楼主收藏回复

一楼祭天


IP属地:中国香港来自iPhone客户端1楼2024-07-03 07:32回复
    免责声明:本帖为水贴,计算数据比较少,只是给出一些极端的例子展现一些该加弥散而不加弥散时导致的恶劣后果。仅供欣赏,不要因为看了这帖子就算啥都把弥散拉满。


    IP属地:中国香港来自iPhone客户端2楼2024-07-03 07:39
    回复
      众所周知,弥散函数对刻画被体系束缚较弱的电子密度很有帮助。在接触计算化学时,初学者通常会被告诫“算阴离子要加弥散函数”。
      然而随着学习的进一步深入,弥散函数又会被拽下神坛。加入弥散函数通常对分子结构的优化影响不大,且以Aug-cc-pVnZ为代表的一系列加弥散的基组的大小要远远大于不加弥散的版本,这通常导致计算时间的拉长。同时,其在空间中延伸得极广,这通常导致恶劣的收敛性,并且会对形如Mulliken电荷或Mayer键级等希尔伯特空间下的波函数分析方法造成严重的不良影响(原因:延伸太广导致一个原子的弥散函数可以描述另一个原子的电荷密度,导致电子密度的错误划分)。


      IP属地:中国香港来自iPhone客户端3楼2024-07-03 07:49
      回复
        一同失效的还有前线轨道分析。对于填入电子的实轨道而言,弥散函数的加入通常不会有太大影响,然而虚轨道就遭老罪了。不少初学者在为计算加入弥散函数时,看到体系的LUMO通常就傻眼了——这啥玩意啊?怎么在空间中延伸了那么大一坨?(图例为B3LYP/aug-cc-pVTZ//B3LYP/def2-SVP水平下酚氧负离子的LUMO)


        IP属地:中国香港来自iPhone客户端4楼2024-07-03 08:12
        回复
          这就意味着 弥散函数其实更适合只在那些特殊的任务 如高精度弱相互作用计算和偶极矩计算 这类对远端电子密度的描述要求较高的任务才需要被添加,否则的话如果不是要求高精度,3ζ往上级别的基组通常可以代劳,因为大基组的最外层函数已经具有一部分弥散的特征。可以说,通常情况下的弥散函数对计算精度的改进甚微,远不如把已有的函数继续劈裂来得实在。
          然而,除开上述两种不是很常用的任务,仍然有一类常见任务需要加入弥散函数,否则基组的不完备程度可以差出一种境界。这种任务不是别的,正是阴离子的计算。


          IP属地:中国香港来自iPhone客户端5楼2024-07-03 08:20
          回复
            很多人其实对“阴离子不加弥散”的后果其实没太多感受。受限于计算成本,我们选择一个最简单的例子:氢负离子的绝对能量刻画。
            作为单原子分子,氢负离子的绝对能量不需要各种热力学量的修正(没有分子振动),因此也就没有这一步的误差引入。我们可以非常清楚地知道其绝对能量为其电离能之负值和第一电子亲合能之和,即-1312-73=-1385kJ•mol-1。注意:区别于平常的计算注重相对能量,本例讨论的是其绝对能量。


            IP属地:中国香港来自iPhone客户端6楼2024-07-03 08:26
            回复
              首先先来看正常的加了弥散的情况。我们使用带弥散的aug-cc-pVnZ 基组和上一个帖子一样进行CBS外推(外推公式翻上一个帖子)。如图所示,它们比较顺利地按照预期的CBS外推公式收敛。


              IP属地:中国香港来自iPhone客户端7楼2024-07-03 08:44
              回复
                简单对Hartree Fock能量和相关能进行加和,很容易得到氢负离子的绝对能量是-0.527658Hartree,即
                -0.527658*2625.499=-1385.37kJ•mol-1
                和实验值只有0.37kJ•mol-1的差距,远远小于+-1kJ•mol-1的化学精度要求。事实上,如果正确修约,那么最终的使用值就是-1385kJ•mol-1,分毫不差。


                IP属地:中国香港来自iPhone客户端9楼2024-07-03 08:51
                回复
                  那如果不加弥散函数呢?我们能够期待随着基组的增大,外层函数逐渐也变得弥散,从而获得仍然正确的外推吗?那样的话可再好不过了。


                  IP属地:中国香港来自iPhone客户端10楼2024-07-03 08:54
                  回复
                    数据还在电脑上,这里简单提一下为什么这次的post Hartree Fock方法标注为FCI而不是CCSD或者CCSD(T)。原因很简单,CC和CI皆是在Hartree Fock的基础之上,通过引入激发算符考虑不同阶数的激发不同程度地考虑电子间的相互作用,比如著名的CCSD(T)就是在Hartree Fock的基础上考虑所有单激发和双激发,并通过微扰而非迭代的方式考虑三激发。如果激发被完全考虑,那么就成为了FCI(Fully-component interaction method,完全组态相互作用方法),在给定基组下构成体系薛定谔方程的精确解。显然,FCC(Fully coupled cluster,完全耦合簇方法)=FCI(不过CC收敛得比CI快得多,所以大家都喜欢CC)。
                    而氢负离子巧得很,只有两个电子,因此只有单激发S和双激发D需要考虑。此时,CCSD=FCI,即求解得到的能量是薛定谔方程的精确值。同时由于没有第三个电子可供激发,CCSD=CCSD(T),(T)=0。


                    IP属地:中国香港来自iPhone客户端13楼2024-07-03 20:09
                    回复
                      因此,如果接受波恩-奥本海默近似和非相对论近似,FCI/CBS对体系的刻画是精确的。


                      IP属地:中国香港来自iPhone客户端14楼2024-07-03 20:12
                      回复
                        回到主题。现在我们撤掉弥散函数,看看他们的表现。


                        IP属地:中国香港来自iPhone客户端15楼2024-07-03 20:31
                        回复
                          而结果令人大跌眼镜。不要说能量精确的事情,缺少了弥散函数,连Hartree Fock能量都已经无法正常随基组增大而收敛。随着价层函数的劈裂和极化函数的增加,能量的降低竟然是准线性的!这意味着基组的不完备程度高得惊人,如此根本不能指望使用面对准完备基组的外推公式获得准确的CBS外推能量。
                          本图以半透明的方式添加了aug-cc-pVnZ基组的表现,可以看见相较于表现恶劣的cc-pVnZ,它们的收敛曲线几乎是贴着它们的CBS线的,尤其是HF/aug-cc-pVnZ,几乎是一条直线。而由于基组的不完备度太高,准线性的收敛曲线也大大低估了体系的CBS能量。对如此简单的体系,cc-pVnZ给出的FCI/CBS能量是-1443kJ•mol-1,相较于真值-1385kJ•mol-1足足低了4.2%。
                          这是什么概念呢?对于普通的单点任务,在基组选择正常的情况下,同一基组下,普通泛函(如B3LYP,M06-2X)计算得到的绝对能量和CCSD(T)相比都不会差出1%,这还是在普通泛函为了拟合相对能量而牺牲了一部分绝对能量的准确性的情况下,而本例是4.2%!
                          可以说,cc-pVnZ对氢负离子的刻画是完全Fail的,FCI/cc-pV6Z的能量准确性甚至比不上加了弥散的系列中最菜鸡的FCI/aug-cc-pVDZ。甚至完全考虑了组态相互作用的FCI/cc-pVDZ对绝对能量的刻画还比不上加了弥散但完全不考虑电子相关的HF/aug-cc-pVDZ。


                          IP属地:中国香港来自iPhone客户端16楼2024-07-03 21:08
                          回复
                            而更进一步的分析则会发现这个体系对于cc-pVnZ来说确实是尽力局。这里使用aug-cc-pVnZ(3,4,5,6)的CBS外推确定其CBS能量,包括Hartree Fock能量和相关能。
                            Hartree Fock方法使用单电子近似,完全不考虑电子相关,因此特定基组计算得到的能量与CBS能量的误差值可以视作是基组对电子密度描述能力的直接体现。可以注意到从cc-pVDZ高达8.0%的CBS误差开始,价层电子每多劈裂一次,误差就降低到原本的1/2至3/4,直到cc-pV6Z时,误差已经只剩下0.8%。同时,其与对应的aug-cc-pVnZ基组的差距也在缩小。原因如之前所言:随着价层函数劈裂数的增加,最外层的函数会逐渐具有弥散函数的性质,从而逐渐能够刻画远处的电子密度。
                            相关能的表现更为糟糕。上一个对甲烷做分析的帖子中,楼主提过“(T)对基组质量比S和D更敏感”,这体现在CCSD(T)/cc-pVDZ/B3LYP-D3(BJ)/def2-SVP中(T)微扰相关能高达50%的基组不完备误差,而SD只有22%。然而,如果基组的完备程度连Hartree Fock级别的计算都满足不了,那么S和D的计算结果也会变得极其离谱。可以看出,FCI/cc-pVDZ的基组不完备误差达到了惊人的47%,一路把价层函数数量劈裂到6,这个误差也只能缩小到9.1%。作为对比,FCI/aug-cc-pVDZ的误差只有6%,基组大小可以说只有cc-pV6Z的零头,然而就因为这层弥散函数,它就是能在Hartree Fock能量和交换能上双杀cc-pV6Z。而如果为cc-pV6Z加上标准的一层弥散到aug-cc-pV6Z(注:cc-pVnZ系列基组其实可以加两层弥散函数变成d-aug-cc-pVnZ,但极少有基态计算要加两层弥散函数,极其浪费),误差会从9%直接砸到0.19%,精度直接提高近50倍。
                            可见,正确刻画电子密度的优先级应当被排在能充分刻画电子关联之前,毕竟你怎么能指望方法高精度的post Hartree Fock会对着错误的电子密度输出正确的能量呢,你以为是DFT想怎么拟合就怎么拟合啊(笑


                            IP属地:中国香港来自iPhone客户端17楼2024-07-03 23:20
                            收起回复
                              注:“一层弥散函数”指的是把基组所拥有的所有角动量的函数都加一层弥散(比如,一层d弥散函数包括5个指数系数很小的d型函数,对应5个磁量子数),不是“只给一个函数”。因此,aug-cc-pVnZ 比cc-pVnZ大不止一点,基函数数量一般是其1.5~2倍,这在O(N^3)起步的量子力学方法中会导致非常大的算力成本提高。有时,也会把一些高角动量的弥散函数砍掉以在不怎么影响结果的情况下节约计算成本。


                              IP属地:中国香港来自iPhone客户端18楼2024-07-03 23:53
                              回复