trygve helgaker poul jØrgensen jeppe olsen molecular electronic-structure theory ... ·...

38
1 Università degli Studi di Torino Doctoral School of Science and High Technology Indirizzo Scienze Chimiche AA 2009-2010 Cesare Pisani ADVANCED THEORETICAL TOOLS FOR THE AB-INITIO STUDY OF THE ELECTRONIC STRUCTURE OF MOLECULES AND SOLIDS Appunti e commenti sul testo: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory Wiley, Chichester, 2000

Upload: others

Post on 24-Jun-2020

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

1

Università degli Studi di Torino

Doctoral School of Science and High Technology Indirizzo Scienze Chimiche

AA 2009-2010

Cesare Pisani

ADVANCED THEORETICAL TOOLS FOR THE AB-INITIO STUDY

OF THE ELECTRONIC STRUCTURE OF MOLECULES AND SOLIDS

Appunti e commenti sul testo: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory Wiley, Chichester, 2000

Page 2: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

2

Note introduttive In un ambiente ristretto come il nostro, didattica e ricerca sono strettamente intrecciate. Tradizionalmente, da noi sono i giovani che attraverso le loro tesi di laurea e di dottorato e l’eventuale periodo di post-doc, sulla base delle conoscenze acquisite nei loro studi, sperimentano e producono nuove idee. Come s’insegna oggi la Chimica Teorica (CT) a Torino? Come s’insegnava una volta? Diamo uno sguardo a quanto accadeva un quarto di secolo fa. La liberalizzazione dei Corsi Universitari degli anni ‘70 aveva permesso di formulare degli indirizzi piuttosto avanzati, a cui accedeva una frazione non trascurabile degli iscritti a Chimica. AA 1984-85 Corso di Laurea in Chimica: Alcuni Corsi dell’Indirizzo Chimico Teorico

I anno Istituzioni di Matematiche I (Pastrone) Analisi 1-d; serie di Fourier e polinomiali. Esercitazioni di Matematiche I (Dovesi) Programmazione; Algebra Lineare; Statistica. Seminari

II anno Istituzioni di Matematiche II (Fogagnolo) Integrali, Analisi n-d, Geom. Analitica Esercitazioni di Matematiche II (Pisani) Gruppi; Analisi vettoriale; Funz. analitiche; Trasformate Chimica Fisica I (Borello) Legame chimico, Teoria dei Gruppi, Spettroscopia vibraz. ed elettr.

III anno Chimica Fisica II (Ghiotti) Termodinamica classica, Cinetica chimica Chimica Teorica (Ricca) Postulati MQ, lo spin; Tecn. var. e pert..; HF, CI, MCSCF; Matrice densità Es. di Chimica Fisica I (Roetti) Tecniche di chimica teorica molecolare. Es. al calcolatore Termodinamica Statistica (Dovesi) Postulati; applicazioni

IV-V anno Chimica Quantistica (Pisani) Green functions e tecniche diagrammatiche per sistemi multielettronici Spettroscopia (Ricca) Momento angolare, teorema di Wigner-Eckart; Relatività ristretta; ESR, NMR Si tratta di un curriculum costruttivo, equilibrato, ragionevolmente aggiornato. All’interno dei corsi venivano introdotti di volta in volta argomenti di attualità (formalismo di seconda quantizzazione, DFT, Montecarlo quantistico, sistemi disordinati, gas d’elettroni...). Lo studente arrivava al lavoro di tesi con un solido background che gli permetteva di affrontare una vasta gamma di tematiche avanzate. Con la razionalizzazione imposta dalle riforme universitarie degli anni ‘90, venivano introdotti maggiori vincoli sulla didattica: da una parte la richiesta, in parte giustificata, di preparare professionalmente lo studente già nel ciclo triennale, dall’altra, purtroppo, una lottizzazione obbligata del sapere (e dei titolari d’insegnamenti) secondo le aree disciplinari,. Tutto l’impianto costruttivo veniva a cadere. I corsi di CT, divenuti marginali, si limitavano a creare delle competenze di base (da cui il loro carattere scolastico e ripetitivo). A questo si aggiunge, per quanto riguarda la situazione a Torino, il forte impegno computazionale del gruppo CT sul versante stato solido. Mentre ciò favoriva un approccio “fisico” alla problematica dei sistemi multi-elettronici anche nel settore delle applicazioni, comportava d’altra parte una progressiva perdita di contatto con la cultura molecolare. Osservazione incidentale: il successo della DFT, basato spesso su formulazioni semi-empiriche dei funzionali, ha favorito la diseducazione sul versante CT.

Page 3: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

3

Il recente interesse del gruppo CT al problema del trattamento della correlazione elettronica nei solidi ci ha messo di fronte a un mondo tutto da riscoprire. Il fatto è che le conoscenze vanno avanti, e in fretta. Nel mondo della chimica teorica molecolare si producono in continuazione, a un ritmo fantastico, nuove idee, nuovi schemi computazionali. Si affermano o si riscoprono approcci che risultano più efficienti in situazioni diverse: evoluzione dell’hardware, trattamento di sistemi più grandi e più delicati... C’è dunque un problema di “rimettersi alla pari”: ma come? Un modo è quello di misurarsi con un testo moderno, non convenzionale e chiedersi quanto ne siamo lontani. Ho scelto HJO. E’ un bellissimo testo, aggiornato nella bibliografia, ottimo dal punto di vista didattico (ricco di esercizi risolti e di esempi), attentissimo anche agli aspetti tecnici. E’ un testo essenzialmente di base e volutamente non completo: si occupa solo delle moderne tecniche di soluzione dell’equazione non relativistica HΨ=EΨ. Il significato limitato del minicorso è dunque prima di tutto quello di dare una idea di cosa si dovrebbe sapere in questo campo, oggi. Ma dallo studio di un testo come HJO possono venire stimoli importanti anche per quanto riguarda la nostra attività di ricerca. Mi sono occupato piuttosto degli aspetti metodologici che di quelli tecnici. Ho scelto di mostrare come il potente linguaggio della seconda quantizzazione (che informa tutto HJO) consenta una descrizione economica ed elegante dei diversi approcci; un aspetto particolare ma “pervasivo” è quello dell’uso di esponenziali di operatori, di cui cercherò di mettere in evidenza l’utilità. Gli appunti che seguono dovrebbero aiutare a rintracciare e ripercorrere una linea essenziale nello sviluppo e nell’uso di questo formalismo. Tra gli argomenti importanti trattati in HJO ma non in questo corso, segnalo la discussione sulla scelta del set base atomico, e le tecniche per il calcolo degli integrali in base Gaussiana (capitoli 6-9). Altre tematiche di grande interesse per noi, in parte non coperte in HJO, verranno accennate nelle conclusioni. Quali strumenti didattici si possono attivare per colmare stabilmente questo deficit di cultura? Corsi avanzati di dottorato? Seminari didattici, magari invitando esperti da fuori? Tesi di Laurea di ricupero culturale? La discussione è aperta. Ottobre 2009

Page 4: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

4

Capitolo 1. Il formalismo di seconda quantizzazione Nella formulazione standard della Meccanica Quantistica, le osservabili sono rappresentate da operatori e gli stati da funzioni. Nel linguaggio della Seconda Quantizzazione (SQ), anche le funzioni d’onda sono espresse in termini di operatori, gli operatori creazione-annichilazione (ca) che agiscono sullo stato vuoto. L’antisimmetria della funzione d’onda multielettronica segue dall’algebra di questi operatori, e non richiede particolare attenzione. Dagli operatori ca si costruiscono anche gli operatori standard, come l’Hamiltoniano. Questa descrizione unificata di stati e operatori in termine di un unico set di operatori ca riduce gran parte delle manipolazioni formali ad algebra, consentendo così di ottenere in modo elegante relazioni importanti. 1.1 Lo spazio di Fock

Spazio di Hilbert: Spazio vettoriale e spazio vettoriale duale con prodotto scalare. Gli “oggetti” dei due spazi sono dei ket (|X〉) e dei bra (〈X|) in corrispondenza biunivoca tra loro (|X〉 ↔ 〈X|). Sono definite le seguenti operazioni: Somma di vettori : |X〉+|Y〉=|Z〉 ; 〈X|+〈Y|=〈Z| Prodotto per un numero complesso a : a|X〉=|Y〉 ; 〈X|a*=〈Y| che godono delle seguenti proprietà: |X〉+|Y〉=|Y〉+|X〉 (commutativa della somma) (|X〉+|Y〉)+|Z〉=|X〉+(|Y〉+|Z〉) (associativa della somma) 1|Y〉=|Y〉 ; 0|Y〉=|0〉 (1 è l’el.neutro, |0〉 è il vettore nullo) a (b |X〉) = (a b) |X〉 (associativa del prodotto) (a + b) |X〉 = a |X〉 + b |X〉 (prima distributiva) a (|X〉+|Y〉) = a |X〉+ a |Y〉 (seconda distributiva) Sui ket (bra) possono agire degli operatori lineari F che li trasformano in altri ket (bra): F |X〉=|Z〉; F(a |X〉+ b |Y〉) = a F |X〉+ b F |Y〉 = a |X〉+ a |Y〉 ; FG|X〉 = F (G |X〉) Ad ogni F è associato un operatore coniugato hermitiano F†, tale che F |X〉 ↔ 〈X| F† Per ogni coppia bra-ket (nell’ordine) è definito un prodotto scalare: 〈X|Y〉= c (c numero complesso) con le seguenti proprietà: 〈X|Y〉=(〈Y|X〉)* (〈Y|F) |X〉=〈Y| (F |X〉) 〈X| (a|Y〉+b|Z〉)=a〈X|Y〉+b〈X|Z〉

〈X|X〉 ≥ 0 Ne risulta che deve essere: (F†)†= F (dimostrare per esercizio).

Una base ortonormale dello spazio vettoriale (se esiste) è un insieme finito o numerabile di vettori |Bi〉 (con i=1,2,...) tali che 〈 Bi | Bj 〉=δij , e che ogni vettore dello spazio può essere espreso come combinazione lineare dei vettori base : |X〉 = ∑i ciX | Bi 〉 . La dimensione dello spazio vettoriale è il numero dei vettori base.

Page 5: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

5

Lo spazio di Fock F(M) è uno spazio vettoriale astratto dotato di prodotto interno. E’ definito a partire da una base di 2M vettori ortonormali; il generico vettore base (|k〉) può essere caratterizzato da una sequenza di M cifre binarie:

|k〉 ≡ |k1,…,kM〉 (ki pari a 0 o a 1). Per definizione: 〈k|m〉= δkm , ed ogni vettore dello spazio di Fock può essere espresso come combinazione lineare (cl) dei vettori della base:

|X〉= ∑k ckX |k〉 Valgono tutte le proprietà degli spazi vettoriali con prodotto interno, per es. : 〈X| (a|Y〉+b|Z〉) = a〈X|Y〉+b〈X|Z〉= a∑km c*kX cmY 〈k|m〉 + b∑km c*kX cmY 〈k|m〉 =

= a ∑k c*kX ckY +b ∑k c*kX ckZ . 〈 X|0〉 = 0 Si vede immediatamente che l’operatore identità può essere scritto come: ∑m |m〉〈m| = 1⋅ Con riferimento ad un set di M spin-orbitali ortonormali ΦP(x) possiamo costruire dei detor di ordine N (N≤M) scegliendo un sottoinsieme di N funzioni ΦPi(x) ordinato secondo Pi crescenti, e “collocando” un elettrone in ciascuno di essi. Stabiliamo ora una corrispondenza biunivoca tra il detor |ΦP1 … ΦPN| e il vettore base |k〉 i cui ki valgono 0 se la funzione Φki non è inclusa nel detor, valgono 1 altrimenti. Per es., il detor | Φ3 Φ4 Φ7 | = (1/3!)1/2 || Φ3(x1) Φ4(x2) Φ7(x3) || corrisponde a |k〉 ≡ |0,0,1,1,0,0,1,0,0,…〉 Notiamo che: Lo spazio di Fock può essere scritto come somma diretta di sottospazi a numero di elettroni definito:

F (M) = F (M,0) ⊕ F (M,1) ⊕ …⊕ F (M,M) . Mentre nella meccanica quantistica ordinaria sono definiti soltanto combinazioni lineari (cl) e prodotti scalari tra funzioni di stato che contengono lo stesso numero di elettroni, nello spazio di Fock queste operazioni sono definite anche tra stati a numero di elettroni diverso (ma il prodotto scalare risulta in questo caso nullo!). Il sottospazio F (M,0) contiene un solo vettore, lo “stato di vuoto” |vac〉 ≡ |0,0,0,…〉 . E’: 〈vac|vac〉 = 1 [ N.B: |vac〉 non è il vettore nullo |0〉! ] 1.2 Operatori creazione ed annichilazione (ca) Definiamo M operatori lineari “creazione” aP

† (P=1,…M), che agiscono come segue sul generico vettore base: aP

† |k1,k2,…,0P,…,kM〉 = ΓkP |k1,k2,…,1P,…,kM〉 (Γk

P =∏Q=1P-1(-1)kQ )

aP† |k1,k2,…,1P,…,kM〉 = |0〉

Ossia: l’operatore creazione aP† applicato a un vettore base con kP = 0 (cioè, a un detor N-elettronico

che non contiene il P-esimo spin orbitale) genera un nuovo vettore base con kP = 1 (cioè, un detor (N+1)-elettronico che contiene in più il P-esimo spin orbitale), moltiplicato per un fattore di fase Γk

P che vale 1 se il numero di “uno” a sinistra della P-esima posizione è pari, altrimenti -1. Se kP = 1 si ottiene il vettore nullo. Per es. :

Page 6: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

6

a5† |0,0,1,1,0,0,1,0,0,…〉 = |0,0,1,1,1,0,1,0,0,…〉

a8† |0,0,1,1,0,0,1,0,0,…〉 = -|0,0,1,1,0,0,1,1,0,…〉

a4† |0,0,1,1,0,0,1,0,0,…〉 = 0 |0,0,1,1,1,0,1,0,0,…〉 = |0〉

Per ogni |k〉 si può scrivere: |k〉 = [ ∏P=1

M (aP†)kP ] |vac〉 (infatti, solo gli operatori creazione

corrispondenti a spin-orbitali occupati sono usati; questi ultimi vengono inclusi in ordine inverso rispetto al loro indice, e quindi il fattore di fase è sempre 1). Risulta inoltre, per ogni |k〉, aP

†aP†|k〉= |0〉, ossia aP

†aP† = 0⋅ .

Per Q>P, aP

†aQ†|…,kP,…,kQ,…〉= aP

†δkQ 0 Γk

Q |…,kP,…,1Q,…〉 = δkP 0 δkQ 0

ΓkQΓ

kQ |…,1P,…,1Q,…〉

aQ†aP

†|…,kP,…,kQ,…〉= aQ†δkP 0

ΓkQ |…,1P,…,kQ,…〉 = -δkP 0

δkQ 0 Γk

QΓk

Q |…,1P,…,1Q,…〉 Si ha quindi, in generale: aP

†aQ† + aP

†aQ† ≡ [aP

†,aQ†]+ = 0⋅

A ciascun operatore creazione è associato il suo coniugato hermitiano: l’ operatore lineare “annichilazione” aP = [aP

† ]† (P=1,…M). Per vedere come agisce sul generico vettore base, usiamo l’operatore identità: aP|k〉= ∑m |m〉〈m|aP|k〉 = ∑m |m〉(〈k|aP

†|m〉)*=δkP 1 Γk

P |…,0P,…〉 Ossia: l’op.annich. applicato a un vettore base con kP = 1 (cioè, a un detor N-elettronico che contiene il P-esimo spin orbitale) genera un nuovo vettore base con kP = 0 (cioè, un detor (N-1)-elettronico che contiene in meno il P-esimo spin orbitale), moltiplicato per un fattore di fase Γk

P che vale 1 se il numero di “uno” a sinistra della P-esima posizione è pari, altrimenti -1. Se kP = 0 si ottiene il vettore nullo. Per es. : a4 |0,0,1,1,0,0,1,0,0,…〉 = -|0,0,1,0,0,0,1,0,0,…〉 a7 |0,0,1,1,0,0,1,0,0,…〉 = |0,0,1,1,0,0,0,0,0,…〉 a2 |0,0,1,1,0,0,1,0,0,…〉 = |0〉 In particolare, aP |vac〉=|0〉 Risulta immediatamente : [aP,aQ]+ = 0⋅ Relazioni di anticommutazione tra operatori creazione ed annichilazione. aP

†aP|…,kP,…〉= aP†δkP 1Γ

kP|…,0,…〉 = δkP 1|k〉

aP aP†|…,kP,…〉= aP δkP 0 Γ

kP|…,1…〉 = δkP 0|k〉

Sommando le due relazioni: (aP†aP + aPaP

†)|k〉 = |k〉 ⇒ [aP†,aP]+ = 1⋅

Per P≠Q risulta (sviluppare per esercizio): (aP†aQ + aQaP

†)|k〉 = |0〉 Si ha dunque l’importante risultato: [aP

+,aQ+]+ = [aP,aQ]+ = 0⋅ ; [aP

+,aQ]+ = δPQ⋅ 1.3 Operatori che conservano il numero Operatori occupation-number : NP= aP

†aP (operatore ON) Come appena visto, NP|k〉=δkP 1|k〉 = kP|k〉 ;

Page 7: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

7

cioè l’operatore numero applicato ad un vettore base dà lo stesso vettore se lo spin-orbitale è occupato, altrimenti dà il vettore nullo. Dimostrare per esercizio: NP è hermitiano; NP è idempotente; NPNQ = NQNP ; NP |X〉 = NP (∑k ckX |k〉) = ∑P

k ckX |k〉 [la ∑Pk è ristretta ai vettori base per cui kP=1]

Calcolo dei commutatori degli operatori ON e ca [NP,aQ

†] = aP†aPaQ

†-aQ†aP

†aP= aP†(δPQ-aQ

†aP) - aQ†aP

†aP = δPQaP† - aP

†aQ†aP - aQ

†aP†aP

= δPQaP†= δPQaQ

[NP,aQ] = -([ aQ,NP]) = - [NP,aQ†]† = -δPQaP= -δPQaQ

In generale, se X è un prodotto generico di operatori ca (tra cui operatori aP) , NP si può muovere da sinistra a destra in X, generandone una copia con segno più o meno ogni volta che “attraversa” un operatore aP

† o aP , rispettivamente: [NP , X] = nPX X (dove nP

X è l’eccesso di operatori creazione rispetto a quelli di annichilazione del P-esimo so in X). La somma di tutti gli ON dà l’operatore numero: N = ∑P NP che applicato ad un vettore base fornisce il numero N di elettroni in quel vettore: N |k〉 = (∑P kP) |k〉 = N |k〉. Risulta: [N, X] = nX X (dove nX è l’eccesso di operatori creazione rispetto a quelli di annichilazione in X). Se X è number-conserving (contiene un ugual numero di op. dei due tipi), [N, X] = 0⋅ Tra gli operatori number-conserving è fondamentale l’operatore “eccitazione” generico : XP

Q = aP†aQ

1.4 Operatori ad uno e due elettroni La forma esplicita degli operatori in SQ viene trovata imponendo che i loro elementi di matrice rispetto ad una qualsiasi coppia di funzioni base (|k〉, |m〉) sia la stessa di quella fornita tra i corrispondenti detor secondo le regole di Slater. Si arriva così alle regole: Operatori a un elettrone (in prima quantizzazione, PQ, somma di operatori fc che agiscono sulle coordinate del singolo elettrone [verificare per esercizio]): f = ∑PQ f PQ aP

†aQ con : f PQ = ∫ dx ΦP*(x) fc ΦQ(x)

Operatori a due elettroni (in PQ, somma di operatori gc che agiscono sulle coordinate delle varie coppie di elettroni): g = ½ ∑PQRS gPQRS aP

†aR†aS aQ con :

gPQRS = ∫dx1dx2 ΦP*(x1)ΦR*(x2) gc ΦQ(x1)ΦS(x2) = 〈 PR | gc | QS〉 Si noti la successione degli indici: per il coefficiente g si usa la convenzione dei chimici (el1* el1 el2* el2) per gli operatori ca: (creaz1 creaz2 ann 2 ann1) Per esercizio, calcoliamo l’elemento di matrice 〈k|g |l 〉 tra due stati che differiscono per due so (m,n nel primo, t,u nel secondo), già portati alla “massima coincidenza”. La regola di Slater fornisce in questo caso: 〈k | g | l〉 = 〈 mn || tu〉 = gmtun – gmunt . In SQ abbiamo (tutti gli operatori nascosti nei puntini coincidono):

Page 8: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

8

| l〉 = … at† … au

† … |vac〉 ; | k〉 = … am† … an

† … |vac〉 ; 〈k | = 〈vac |… an … am … 〈k | g | l〉 = ½ ∑PQRS gPQRS 〈vac | … an … am … aP

†aR†aS aQ… at

† … au† … |vac〉

Notiamo ora che o P o R devono essere uguali ad m, altrimenti l’op. am può “migrare” da sinistra a destra cambiando ad ogni passaggio solo il segno dell’elemento di matrice, fino ad agire su |vac〉 a dare il vettore nullo, il cui prodotto scalare con qualsiasi bra è nullo; analogamente, P o R devono essere uguali ad n. Con lo stesso ragionamento si vede che S e Q devono essere uguali a t oppure ad u. Di tutta la sommatoria si salvano solo quattro termini : (PQRS) = (mtnu) ; (PQRS) = (numt) ; (PQRS) = (munt) ; (PQRS) = (ntmu) I primi due termini sono uguali tra loro e così pure i secondi due (mostare!); si ha quindi: 〈k | g | l〉 = gmtnu 〈vac | … an … am … am

†an†au at… at

+ … au+ … |vac〉 +

+ gmunt 〈vac | … an … am … am†an

†at au… at+ … au

+ … |vac〉 I due elementi di matrice sono uguali e opposti (il secondo si riduce al primo scambiando tra loro at au). Calcoliamo il primo elemento. Spostando contemporaneamente, per lo stesso numero di passaggi, am

† a sinistra, at a destra si arriva a : 〈vac |…an … am … am

†an†au at… at

† … au† … |vac〉 = 〈vac |…an …am am

†…an†au…at at

†…au†… |vac〉 =

= 〈vac |…an … an†au … au

† … |vac〉 - 〈vac |… an… am+am…an

+au …at† at… au

† … |vac〉 Il secondo integrale è nullo (at può agire su |vac〉) mentre il primo si può trasformare come prima muovendo contemporaneamente an

† a sinistra, au a destra: 〈vac |…an …an

†au… au†… |vac〉 = 〈vac |…… |vac〉 - 〈vac |…an

†an… au†au …|vac〉 = 1+0. Quindi:

〈k | g | l〉 = gmtnu - gmunt

L’hamiltoniana elettrostatica diventa: H = ∑PQ hPQ aP

+aQ + ½ ∑PQRS gPQRS aP†aR

†aS aQ + hnuc con: h PQ = ∫ dx ΦP*(x) (-∇2/2 - ∑A ZA/|r-rA|) fc ΦQ(x) ; gPQRS = ∫dx1dx2 ΦP*(x1) ΦQ(x1) (1/|r1-r2|) ΦR*(x2) ΦS(x2) hnuc= ½ ( ∑’AB ZAZB/|rA-rB| ) ⋅ Si noti che mentre in PQ gli stati dipendono esplicitamente dalle coordinate elettroniche, in SQ sono gli operatori che contengono questa informazione attraverso i loro elementi di matrice nella base adottata. 1.5 Operatori SQ come proiezione dell’operatore esatto L’ultima osservazione mostra che un operatore in SQ è solo una proiezione dell’operatore esatto nel sottospazio scelto per rappresentarlo. Solo nel caso di una base completa, anche l’operatore SQ è esatto. Per esempio, l’espressione del commutatore canonico:

[rcα,p

cβ] = ιδαβ

vale in SQ solo per una base completa. 1.6 Confronto tra PQ e SQ Un operatore SQ applicato ad uno stato |k〉 genera un vettore dello stesso spazio di Fock. Invece, l’operatore PQ applicato al corrispondente detor, genera una funzione che in generale non può essere espressa come un multidetor di quello spazio di Fock a meno che la base non sia completa. Riassumendo: in SQ tutti gli elementi di matrice possono essere ricondotti al calcolo di 〈vac |X|vac〉, essendo X un prodotto ordinato di operatori ca; il loro valore può quindi essere ottenuto dalle regole di commutazione, dal fatto che 〈vac |vac〉=1 e che au|vac〉= |0〉 .

Page 9: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

9

1.7 Matrici densità Sia uno stato di riferimento normalizzato |R〉 = ∑k ckR |k〉 ∈ F(M,N). Dall’espressione degli operatori SQ del § 1.5, risulta che i rispettivi valori d’aspettazione per quello stato sono dati da: 〈R|f|R〉= ∑PQ f PQ 〈R|aP

†aQ|R〉 ≡ ∑PQ f PQ D PQ 〈R|g|R〉 = ½ ∑PQRS gPQRS 〈R|aP

†aR†aS aQ|R〉 ≡ ½ ∑PQRS gPQRS dPQRS

avendo introdotto gli elementi della matrice densità a uno (DPQ) e due elettroni (dPQRS). Identificando il valore dell’elemento di matrice in SQ con le corrispondenti espressioni in PQ, risulta: γ1(x,x’) = ∑PQ D PQ ΦP*(x’)ΦQ(x) γ2(x1,x2;x1’,x2’) = ½ ∑PQRS d PQRS ΦP*(x1’)ΦQ(x1)ΦR*(x2’)ΦS(x2)

Matrice densità a un elettrone e spin-orbitali naturali. L’insieme dei D PQ costituisce una matrice Hermitiana D di rango M definita semi-positiva (i suoi elementi sono prodotti scalari tra stati a N-1 elettroni). Usando i risultati del § 1.3, si ha: D PP = 〈R|aP

+aP|R〉 = 〈R|NP|R〉 = 〈R| NP NP |R〉 = ∑k (|ckR|2 kP) Essendo ∑k |ckR|2 =1 e kP = 0 o 1, è 0≤ D PP≤ 1. D PP misura la frazione dello stato di riferimento dovuta a tutti i detor che contengono il P-esimo so. E’ anche: Tr(D) = ∑k |ckR|2 ∑P kP = N ∑k |ckR|2 = N. Per gli elementi extra-diagonali si può usare la disuguaglianza di Schwarz: | 〈R|aP

†aQ|R〉 |2 ≤ 〈R|aP†aP|R〉〈R|aQ

†aQ|R〉 per ricavare un limite superiore alla loro norma. Infine, dalla diagonalizzazione di D, si ottiene una matrice diagonale η = U† D U : gli autovettori |Ui〉 definiscono gli spin-orbitali naturali, ed i corrispondenti elementi diagonali ηi (compresi tra 0 ed 1) sono detti numeri d’occupazione degli stessi. Matrice densità a due elettroni …. 1.8 Commutatori ed anticommutatori Conviene mettere a punto una strategia per la valutazione di commutatori ed anticommutatori tra due operatori A e B, costituiti da stringhe di operatori ca: [A,B] e [A,B]+ Definizioni: Il rango di A è il numero di operatori nella stringa diviso per 2. Riduzione del rango si ha quando il rango del commutatore (o anti-commutatore) di A B è minore della somma dei due ranghi. Vale la semplice regola: Si ha riduzione del rango quando si anticommutano due stringhe di rango semi-intero o quando si commutano le due stringhe in tutti gli altri casi (intero/semi-intero, intero/intero). Relazioni utili: 1.8.4 ÷ 1.8.9 (Esempi di applicazione: vedi per es. § 1.9.1)

Page 10: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

10

1.9 Spin orbitali non ortogonali Consideriamo il passaggio a una base non ortogonale. Φm1…ΦmN costituiscono ora un set di M so linearmente indipendenti ΦQ(x) con overlap SPQ = ∫ dx ΦP*(x) ΦQ(x) . Indicando con Φ un vettore riga che contiene che contiene le funzioni ΦQ(x), si può anche scrivere: ∫Φ†Φ = S . La funzione base generica dello spazio di Fock è costituita da un detor N-elettronico (N=1,…M) ||Φk1…ΦkN|| ↔ |k〉 = [ ∏P=1

M (aP†)kP ] |vac〉. Risulta: 〈k|m〉= δ N(k)N(m) det (Skm) , cioè :

L’overlap tra due funzioni base con numero di elettroni diverso è nullo; se N è lo stesso, esso è pari al determinante della matrice degli overlap tra gli so nei due detor, dove (Skm)ij=Ski mj . (dimostrare per esercizio: vedi quaderno). Introduciamo ora un set di so simmetricamente ortonormalizzati Φ = Φ S-½ , ossia: ΦQ(x) = ∑P (S-½)PQ ΦP(x) (∫Φ†Φ = S-½ S S-½ = I ). Analogamente, per gli operatori ca: aQ

† = ∑P (S-½)PQ aP+ (aQ = ∑P (S-½)QP aP ) ; aQ

† = ∑P (S½)PQ aP†

Le relazioni di commutazione diventano: [aP

†,aQ†]+ = [aP,aQ]+ = 0⋅ ; [aP

†,aQ]+ = SQP ⋅ Vale ancora: aP |vac〉=|0〉 … L’espressione di un operatore a un elettrone nella base non ortogonale diventa: f = ∑PQ f PQ aP

†aQ = ∑PQRS f PQ aR†aS (S-½)RP(S-½)QS

⇓ f PQ = ∫ dx ΦP*(x) fc ΦQ(x) = ∑UT f UT(S-½)TQ(S-½)PU f = ∑RS [∑UT (S-1)RU fUT (S-1)TS] aR

†aS Analogamente per gli operatori a due elettroni. Si possono introdurre basi biortogonali, in cui valgono le relazioni di anticommutazione standard, ma in cui gli operatori annichilazione non sono più il coniugato hermitiano di quelli creazione.

Page 11: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

11

Capitolo 2. Lo spin in seconda quantizzazione Nella teoria non relativistica, molte semplificazioni importanti si possono ottenere trattando esplicitamente lo spin elettronico. 2.1 Funzioni di spin Tenendo conto che per il singolo elettrone la coordinata di spin ms ha solo due valori (±1/2) , e che quindi lo spazio di spin è sotteso da due sole funzioni base (α e β), il più generico so può essere scritto nella forma ΦP(x) = φP

α(r) α(ms)+φ Pβ(r) β(ms) . Si fa però di solito riferimento a so della forma

ristretta: Φpσ(x) = φp(r)σ(ms) (con σ =α o β). L’ortonormalità richiede che sia ∫ dr φp*(r) φq(r) = δpq . L’indice “composito” pσ sostituisce l’indice P del capitolo precedente. 2.2 Operatori nella base “orbitalica” Operatori spinless: lo spin non è presente nell’espressione dell’operatore in PQ Per un operatore spinless a un elettrone è: f pσ,qτ = f pq δστ con f pq = ∫ dr φp*(r) fc φq(r) , e si può quindi scrivere: f = ∑pq fpq Epq , con: Epq = apα

†aqα+ apβ†aqβ (operatore di eccitazione di singoletto)

Analogamente, g = ½ ∑pqrs gpqrs ∑στ apσ

†arτ†asτ aqσ con :

gpqrs = ∫dr1dr2 Φp*(r1)Φr*(r2) gc Φq(r1)Φs(r2) = ( pq | rs )〉 [Per orbitali reali: gpqrs = gqpsr = grspq = gsrqp ] Essendo: Epq Ers = (apα

†aqα+ apβ†aqβ ) ( arα

†asα+ arβ†asβ) =

= apα†aqα arα

†asα+ arβ†asβ apβ

†aqβ + apα†aqα arβ

†asβ+ apβ†aqβ arα

†asα = = apα

†arα†asαaqα+δqr apα

†asα + apβ†arβ

+asβaqβ + δqr apβ†asβ + apα

†arβ†asβ aqα + apβ

†arβ† asαaqα

dal confronto risulta: g = ½ ∑pqrs gpqrs (Epq Ers - Eps δqr) ≡

≡ ½ ∑pqrs gpqrs epqrs (epqrs : operatore di eccitazione bi-elettronico) E’: epqrs = erspq In particolare si ha: H = ∑pq hpq Epq + ½ ∑ pqrs gpqrs epqrs + hnuc Operatori di puro spin Per un operatore a un elettrone che agisce solo sulle coordinate di spin risulta: f = ∑στ fστ ∑p apσ

+apτ , con: fστ = ∫ dms σ*(ms) fc τ(ms) Per esempio, per gli operatori step-up (S+) e step-down (S−) è: (S+)αβ=1 ; (S+)αα=(S +)βα=(S +)ββ=0 ; (S−)βα=1 ; (S +)αα=(S +)αβ=(S+)ββ=0 ovvero: S+=∑p apα

†apβ S−=∑p apβ†apα

Page 12: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

12

e anche: Sz= ½ ∑p(apα

†apα−apβ†apβ ) ;

Sx= ½ (S+ +S−) = ½ ∑p (apα†apβ+apβ

†apα) ; Sy=1/(2ι) (S+−S−) = 1/(2ι) ∑p (apα

†apβ−apβ†apα)

S2 = S+ S−+ Sz2−Sz=∑pq[(apα

†apα−apβ†apβ )(aqα

†aqα−aqβ†aqβ )+(apα

†apβaqβ†aqα)]−∑p(apα

†apα−apβ†apβ )

Operatori misti Per un operatore misto a un elettrone va calcolato in generale l’elemento di matrice f pσ,qτ . Per l’op. spin-orbita, VSO (Vc=ξ(r) lc ⋅ Sc ), si ha ad esempio: VSO =∑pq [Vpq

x Tpqx +Vpq

y Tpqy +Vpq

z Tpqz] con:

Vpqµ= ∫ dr φp*(r) ξ(r)(lc)µ φq(r) e:

Tpqx= ½ (apα

†aqβ+apβ†aqα) |

Tpqy= 1/(2ι) (apα

†aqβ−apβ†aqα) | operatori di eccitazione di tripletto

Tpqz = (apα

†aqα−apβ†aqβ) |

2.3 Operatori tensoriali di spin Definiamo operatore tensoriale di spin (ots) TS,M un operatore che agisce nello spazio di Fock e soddisfa alle seguenti relazioni di commutazione (ci riserviamo poi di trovarne espressioni esplicite in termini di operatori ca): [S± , TS,M ] = [S(S+1)−M(M±1)]½ TS,M±1 ; [Sz , TS,M ] = M TS,M con S intero o semi-intero, M compreso tra -S e S a passi di 1, e inoltre TS,S+1 =TS,−S−1=0⋅ A seconda del valore di S (0, ½, 1,…) sono detti ots di singoletto, doppietto, tripletto, … E’ facile verificare (vedi quaderno) che | X 〉 = TS,M | vac 〉 è autostato di Sz e S2 con autovalori M e S(S+1) , e che T0,0 commuta con Sz e S2

. Poiché il commutatore di due operatori hermitiani è anti-hermitiano, TS,M non può essere hermitiano. A partire da un ots se ne può ottenere un altro coniugato dello stesso rango mediante l’operazione TS,M = (−1) S+M (TS,−M)† L’importanza degli ots risiede nel fatto che essi possono essere usati per generare stati con proprietà di spin definite (vedi § 2.6). Esempi Operatori tensoriali di doppietto, singoletto, tripletto: (verifiche sul quaderno).

apᆠ= Sp

½,½, apβ† = Sp

½,−½ {apα†, apβ

†} −apβ = Sp

½,½ , apα = Sp

½,−½ {−apβ, apα}

Page 13: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

13

Accoppiando due ots di doppietto del primo o del secondo tipo si possono ottenere ots di singoletto e tripletto, di creazione e annichilazione rispettivamente. Q0,0

pq = (1/√2) (apα†aqβ

†− apβ†aqα

†) Q1,1 = apα

†aqα† ↔ Q1,1

pq = aqβ apβ Q1,0

pq = (1/√2) (apα†aqβ

†+ apβ†aqα

†) ↔ ... Q1,−1

pq = apβ†aqβ

Accoppiando invece ots di doppietto/creazione con ots di doppietto annichilazione, si ottengono ots di eccitazione di singoletto e di tripletto: E0,0

pq = (1/√2) (apα†aqβ+ apβ

†aqα) E1,1

pq = −apα†aqβ

E1,0

pq = (1/√2) (apα†aqβ− apβ

†aqα) E1,−1

pq = apβ†aqα

N.B. Tutti gli operatori spin-free a uno e due elettroni possono essere scritti in termini di operatori eccitazione di singoletto. Risulta quindi, in particolare: [Sz , H ]=[S2

, H ]= 0⋅. , da cui si ricava che gli autostati dell’Hamiltoniana elettrostatica possono essere classificati come autostati degli operatori di spin. Lo stesso non vale quando sono presenti anche operatori misti (come l’operatore spin-orbita) per i quali sono necessari anche operatori di tripletto. 2.4 Proprietà spinoriali dei detor Per ottenere le proprietà spinoriali dei detor, che sono autofunzioni dell’operatore numero (vedi § 1.3: Npσ|k〉 = kpσ|k〉) conviene ricavare i commutatori degli operatori di spin con N pσ : [Sz , N pσ ] = 0 [S+ , N pα ] = −apα

†apβ [S+ , N pβ ] = apα

†apβ [S− , N pα ] = apβ

†apα [S− , N pβ ] = − apβ

†apα [S2

, N pα ]= S+ apβ†apα−apα

†apβ S− [S2

, N pβ ]= − S+ apβ†apα+apα

†apβ S− Ne risulta in particolare: [S2

, (N pα+N pβ)] = 0 Per vedere l’effetto degli operatori di spin su un detor, conviene scrivere quest’ultimo nella forma: |k〉 = Ac

† Aα† Aβ

† |vac〉 , dove la stringa di core Ac

† contiene (nell’ordine) gli nc operatori creazione apα†apβ

† relativi agli orbitali

Page 14: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

14

doppiamente occupati; la stringa alfa Aα

† contiene (nell’ordine) gli nα operatori creazione apα† relativi agli orbitali

singolarmente occupati con spin α; analogamente per gli nβ operatori creazione nella stringa beta Aβ

† . Si calcoli per esercizio: [S−,Aα

†] (vedi quaderno) Essendo (T= Sz o S2): T |k〉 =TAc

†Aα†Aβ

†|vac〉 =[T,Ac†Aα

†Aβ†] |vac〉=

= ( [T,Ac†]Aα

†Aβ†+Ac

† [T,Aα†]Aβ

†+Ac†Aα

†[T,Aβ†]) |vac〉 ,

si può ottenere il valore di T |k〉 dal calcolo dei commutatori. Risulta: Sz |k〉 = ½ (nα − nβ) |k〉 S2 |k〉 = (1/4) [(nα− nβ)

2+2(nα+ nβ) ]|k〉+ Ac†[S−,Aα

†][S+,Aβ†]vac〉

Nel caso di stati ad alto spin uno delle due stringhe (per es. beta) si riduce all’identità, e il suo commutatore vale 0. In questi casi, |k〉 è autostato di S2 con autovalore nα/2(nα/2+1). In generale, l’applicazione di S2 a |k〉 genera una miscela di determinanti in cui, a quello di partenza, sono aggiunti tutti quelli in cui uno degli so alfa è diventato beta, uno dei beta è diventato alfa. 2.5 Configuration state functions (CSF) Come si capisce dall’ultima osservazione, se |k〉 contiene Nopen (o semplicemente N) orbitali singolarmente occupati, i nuovi determinanti che possono essere generati applicando S2 costituiscono nel loro insieme una “orbita” di 2N detor in cui quegli orbitali sono occupati con alfa o beta spin. L’elemento di matrice di S2 tra due detor che appartengono ad orbite diverse è perciò nullo. Ci interessa trovare delle cl dei detor dell’orbita che siano autostati di S2 e di Sz (CSF). 2.6 Lo schema di accoppiamento genealogico Tra i vari modi in cui tale obiettivo può realizzarsi, c’è quello “costruttivo” detto del genealogical coupling. Si usano a tal fine gli ots (vedi § 2.3). In sostanza, una CSF (S,M) ad N elettroni, si realizza a partire da due CSF ad N-1 elettroni (S-tN,M-1/2), (S-tN,M+1/2), a cui sono stati aggiunti rispettivamente un elettrone alfa ed uno beta. I corrispondenti coefficienti di accoppiamento, sono i Clebsch-Gordan coefficients. L’insieme delle CSF costituisce (come l’insieme dei detor) un sistema ortonormale completo che può essere usato convenientemente quando si cerchino soluzioni a spin definito, per es. le autofunzioni di un’hamiltoniana spin-free. In sintesi: una CSF può essere espressa come cl dei detor di una data orbita corrispondente a j=(nα + nβ) elettroni spaiati, limitata a quelli caratterizzati dalla stessa differenza i=(nα − nβ), essendo M=i/2 un buon numero quantico in entrambe le basi. La matrice unitaria di trasformazione C, di dimensioni Zij × Zij (con Zij = j!/[ (|j+i|/2|!)(|j-i|/2|!)] ) dipende ovviamente solo da i e j e non dal tipo di orbitali coinvolti. La matrice C† consente la trasformazione inversa CSF→detor.

Page 15: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

15

2.7 Matrici densità Nel § 1.7 sono state definite matrici densità a uno o due elettroni relativamente ad uno stato di riferimento |R〉, come insiemi di numeri che consentono di ottenere il valore di aspettazione di qualsiasi operatore a uno o due elettroni per quello stato. Consideriamo ora il caso di operatori hermitiani spinless, ovvero con simmetria di singoletto introdotti nel § 2.2 (per es. l’hamiltoniano). Risulta immediatamente: 〈R|f |R〉= ∑pq fpq Dpq , con: Dpq = 〈R|Epq|R〉 = 〈R|(apα

†aqα + apβ†aqβ)|R〉 ≡ Dpα,qα + Dpβ,qβ

〈R|g |R〉 = ½∑PQRS gpqrs dpqrs, con: dpqrs = ∑στ 〈R|apσ†arτ

†asτ aqσ|R〉 Queste espressioni valgono in generale. Invece, il valore di aspettazione di operatori di tripletto ecc. non possono essere ottenuti dalle sole matrici densità orbitaliche Dpq e dpqrs, ed occorrono espressioni più complesse. Come nel § 1.7, si possono definire orbitali naturali (anziché spin-orbitali naturali) , diagonalizzando la matrice D. I corrispondenti autovalori (i numeri d’occupazione degli orbitali naturali) sono compresi tra 0 e 2. 2.7.3 Le funzioni densità (sviluppare)

Page 16: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

16

Capitolo 3. Cambiamenti di base Lo spazio di Fock è definito in termini di un set ortonormale di spin-orbitali. Può essere interessante considerare trasformazioni da uno ad un altro set (per es., nella soluzione del problema di Hartree-Fock). E’ conveniente esprimere tali trasformazioni unitarie in termini di operatori ca. Si mostra qui che il più generale operatore di questo tipo ha la forma dell’esponenziale di una combinazione lineare di operatori di eccitazione aP

†aQ con coefficienti λPQ = −λPQ* , peraltro arbitrari. In qualche caso, è interessante effettuare una trasformazione con vincoli, per es. tale che mantenga una simmetria. 3.1 Trasformazioni unitarie come esponenziali di matrici exp(A) ≡ ∑n An/n! = 1 + A + A2/2! + … (definizione di esponenziale di matrice) ⇓ [exp(A)]† = exp(A†) ; exp(A) exp(−A) = 1 ; B exp(A) B-1 = exp(B A B-1) [B,A]=0 ⇒ exp(A+B) = exp(A) exp(B) exp(−A) B exp(A) = B + [B,A] + (1/2!) [[B,A],A] + (1/3!) [[[B,A],A],A] + …

(Baker-Campbell-Hausdorff expansion) Infatti: detta X(λ) = exp(−λA) B exp(λA), risulta :

∂X(λ)/∂λ = exp(−λA) [B,A] exp(λA) ; ∂2X(λ)/∂λ2 = exp(−λA) [[B,A],A] exp(λA) ; … X(1) = exp(−A) B exp(A) = {X(0) + λ [∂X(λ)/∂λ]0 + (1/2!) λ2 [∂2X(λ)/∂λ2]0 +….}λ=1 = [BCH] La più generale matrice unitaria può essere espressa nella forma: U = exp(X) , essendo X una qualsiasi matrice antihermitiana (X = −X†). Infatti: UU† = exp(X) [exp(X)] †= exp(X) exp(X †) = exp(X) exp(−X ) = 1 . Viceversa, il teorema spettrale ci assicura che ogni matrice unitaria U può essere diagonalizzata come segue (vedi quaderno): U = V exp(ιδ) V† , essendo V unitaria e δ diagonale e reale. Risulta quindi: U = exp(X) con X = ιV δ V† . La matrice X può essere definita assegnando ad arbitrio valori complessi a Xij, con i>j, e valori immaginari puri a Xii (esempio:…). Si può scrivere: U = exp(ιDX+RX +ιIX), essendo DX una matrice diagonale reale, RX una matrice reale antisimmetrica, IX una matrice reale simmetrica con diagonale nulla. In particolare, se è 0, risulta che la matrice unitaria speciale O = exp(RX +ιIX) ha determinante pari ad 1. Questo tipo di matrici speciali sono quelle più utili in pratica. Ancora più speciale è il caso delle matrici ortogonali del tipo R = exp(RX), per le quali RR†=RRT = 1. Nota X , per ottenere U si può diagonalizzare la matrice hermitiana Y = ιX : Y = W α W† (dove la matrice α è reale). Quindi U = W exp(ια) W† . Per esempio, in un caso bidimensionale con X = RX [a reale, c=cos(a), s=sin(a)]: | 0 a | | 0 −ιa | | 1 ι | | a 0 | | 1 −ι | RX = | | = ι | | = (ι/2) | | | | | | |−a 0 | | ιa 0 | | ι 1 | | 0 −a | | −ι 1 |

| 1 ι | | exp(ιa) 0 | | 1 −ι | R = exp (RX) = (1/2) | | | | | | =

| ι 1 | | 0 exp(−ιa) | | −ι 1 |

| 1 ι | | c+ιs 0 | | 1 −ι | | c s | = (1/2) | | | | | | = | |

| ι 1 | | 0 c-ιs | | −ι 1 | | −s c |

Page 17: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

17

§ 3.1.6: Trasformazioni non unitarie che preservano la metrica: W S W† = S , con S matrice hermitiana non singolare, unitaria (sviluppare solo se necessario). 3.2 Trasformazioni unitarie di spin orbitali Attenzione in questa parte a distinguere tra matrici (κ) e operatori (k = ∑PQ κPQ aP

†aQ ) !! Introduciamo le notazioni: U = exp(−κ) (U matrice hermitiana;

κ matrice antihermitiana, κPQ= −κPQ*: il segno è convenzionale); k = ∑PQ κPQ aP

†aQ (k operatore antihermitiano: k†=∑PQ κPQ* aQ

†aP = −∑PQ κQP aQ†aP = −k );

{ΦP(x)} ; {ΦP(x)} : ΦP(x) = ∑Q ΦQ(x) UQP (due basi di M spin-orbitali ortonormali, legati dalla trasformazione unitaria U);

|n〉 = [ ∏P=1M (aP

†)kn(P) ] |vac〉 ↔ |n〉 = [ ∏P=1M (aP

†)kn(P) ] |vac〉 (vettori base dei due spazi di Fock relativi ai due set di so, e corrispondenti operatori ca). Indichiamo con P1,…,PN gli N so della base {ΦP(x)} che risultano occupati in |n〉. Tenendo conto delle proprietà dei determinanti (se la colonna di una matrice è cl di più colonne, il suo determinante è la cl dei determinanti…) risulta: |n〉 = aP1

†…. aPN† |vac〉 = ∑Q1…QN UQ1P1 … UQNPN aQ1

†…. aQN† |vac〉 , da cui, in generale:

aP†=∑Q aQ

†UQP=∑Q aQ† [exp(−κ)]QP

Si può scrivere equivalentemente (vedi nota all’inizio del paragrafo!): aP

†= exp(−k) aP† exp(k)

Notiamo prima che è : [aP

†, k] = ∑QR κQR (aP†aQ

†aR − aQ†aRaP

†) = −∑QR κQR (aQ†[aR,aP

†]+)= −∑Q κQP aQ†

[[aP†, k] ,k] = −∑Q κQP [aQ

†, k] = ∑QR κRQκQP aR†= ∑R (κ2)

RP aR†

[[[aP†, k] ,k] ,k] = − ∑T (κ3)

TP aT† , ecc.

Usando ora la BCH, e introducendo questi risultati, si ha: exp(−k) aP

† exp(k) = aP† −∑Q κQP aQ

†+(1/2!) ∑Q (κ2) QP aQ

† −(1/3!) ∑Q (κ3) QP aQ

†+…= = ∑Q aQ

† ∑n(1/n!) ((−κ)n) QP =∑Q aQ

† [exp(−κ)]QP (CVD)

Si ha allora (nel terzo passaggio sfruttiamo l’identità exp(k)|vac〉=|vac〉) : |n〉 = [∏P=1

M(aP†)kn(P)]|vac〉=exp(−k)[∏P=1

M (aP†)kn(P)] exp(k) |vac〉 =

= exp(−k)[∏P=1M (aP

†)kn(P)]|vac〉= exp(−k) |n〉 N.B. Se la matrice κ di trasformazione è reale, l’operatore all’esponente si riduce a k = ∑P>Q RκPQ (aP

†aQ −aQ†aP) con solo M(M-1)/2 parametri reali liberi.

3.2 Trasformazioni unitarie che conservano la simmetria Si abbia a disposizione uno stato |R〉 = ∑k ckR |k〉 ∈ F(M,N) , con riferimento ad una certa base {ΦP(x)}. Supponiamo che |R〉 goda di certe proprietà di simmetria, per es. che sia invariante rispetto a

Page 18: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

18

certi operatori di simmetria rotazionale, o che sia autostato di spin con valori assegnati di S e Sz. Consideriamo un cambiamento di base caratterizzato dall’operatore k , che trasforma il nostro stato in uno stato della stessa struttura: |R〉 = exp(−k) |R〉 = ∑k ckR |k〉 . Se richiediamo che |R〉 abbia le stesse proprietà di simmetria di |R〉, questo impone delle restrizioni su k. Se per esempio vogliamo considerare solo rotazioni orbitaliche reali che non mescolino stati di spin, occorre che l’operatore abbia la forma: k = ∑p>q Rκpq (Epq − Eqp). Per approfondimenti, vedi § 4.4, § 10.1.2. 3.1 La funzione logaritmo di matrice Data una matrice non singolare A, definiamo il suo logaritmo Y=log(A), come quella matrice tale per cui exp(Y)=A. Ci limiteremo a considerare i casi in cui A sia diagonalizzabile: A= Z α Z-1 (con autovalori non nulli). Si può allora scrivere: Y = log(A) = Z log(α) Z-1 . Come è noto, la funzione logaritmo è a più valori: log α = log(|α|) + ι(φ+2πn), con n intero arbitrario [essendo α ≡ |α| exp(ι φ)]. Si può fissare l’arbitrarietà imponendo che la fase appartenga all’intervallo (−π,π]. Con questa scelta, c’è una corrispondenza biunivoca tra matrici A vicine ad 1 e matrici Y=log(A) vicine a 0. Supponiamo in particolare che sia: A= 1+S = Z (1+σ) Z-1 con |σi| < 1. Si può allora scrivere in modo univoco: Y = log(A) = Z log(1+σ) Z-1 = −∑n=1

∞ (−1)n Sn/n Valgono le proprietà dei logaritmi, per es.: log(AB) = log(A) + log(B) purché valga la commutabilità del prodotto tra le matrici!

Page 19: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

19

Capitolo 4. Funzioni d’onda esatte e approssimate Prima di imbarcarci nel tentativo di soluzione del problema fondamentale HΨ=EΨ, consideriamo la relazione tra funzioni esatte ed approssimate, con particolare riguardo a questioni quali: size-extensivity; principio variazionale; restrizioni di simmetria. 4.1 Caratteristiche della funzione d’onda esatta Consideriamo l’equazione di Schrödinger non relativistica: HΨ=EΨ. Quando se ne cerca una soluzione approssimata, è utile imporre che la funzione approssimata Φ (espressa come cl di detor all’interno di una base non completa: |Φ〉=∑k ckΦ |k〉) conservi alcune delle caratteristiche della funzione esatta Ψ. Tra queste proprietà c’è quella per cui si può richiedere che sia AΨ=aΨ, essendo A un qualsiasi operatore hermitiano che commuta con H. 1) Ψ è funzione delle coordinate spaziali e di spin di N elettroni. Per conservare questa caratteristica essenziale, |Φ〉 dovrà essere autofunzione dell’operatore numero con autovalore N. Ciò corrisponde a richiedere che nel suo sviluppo partecipino soltanto vettori base |k〉 ∈ F(M,N). 2) Ψ è antisimmetrica rispetto allo scambio delle coordinate di due elettroni qualsiasi (principio di Pauli). Questa condizione è automaticamente soddisfatta da |Φ〉. Si noti che nella DFT si presenta a questo proposito il problema della N-rappresentabilità: tra tutte le possibili funzioni ρ(r) > 0 con ∫ ρ(r) dr=N, quali sono quelle ottenibili da una funzione N-elettronica antisimmetrica? 3) Per uno stato legato N-elettronico, Ψ è al quadrato integrabile e quindi normalizzabile: 〈Ψ|Ψ 〉 = 1 . Questa condizione è soddisfatta anche da |Φ〉 quando (vedi § 1.1) gli spin-orbitali della base costituiscono un set ortonormale (sono costruiti, ad es., a partire da un set finito di gaussiane o orbitali di Slater la cui forma asintotica garantisce l’integrabilità), e ∑k |ckΦ|2=1. Nel caso dei solidi cristallini, il problema si riformula all’interno del modello BvK (Appendice 1). 4) Ψ è variazionale, nel senso che per ogni variazione δΨ ortogonale a Ψ, l’energia è stabile ( 〈δΨ|Ψ 〉 = 0 ⇒ 〈δΨ| H |Ψ 〉 = 0 ). E’ desiderabile conservare questa proprietà anche per |Φ〉: naturalmente in questo caso le variazioni sono all’interno dello spazio di Fock scelto. Non solo questa proprietà garantisce il miglioramento della soluzione allargando la base variazionale, ma semplifica il calcolo di molte proprietà molecolari. Purtroppo non è sempre possibile conciliare l’esigenza variazionale con quella della size-estensività. 5) Ψ è size-extensive, nel senso che per un sistema costituito da più sistemi non interagenti, gli autovalori dell’energia sono la somma di autovalori dell’energia per i singoli sottosistemi. In calcoli approssimati questo corrisponde a richiedere che l’energia ottenuta applicando un particolare schema computazionale al supersistema eguagli la somma delle energie ottenute applicando separatamente lo stesso schema ai singoli sottosistemi. 6) Ψ è autofunzione degli operatori S2 e Sz . Come si è visto nel capitolo 2, questa proprietà può essere imposta espandendo |Φ〉 in termini di CSF. 7) Nell’ambito dell’approssimazione Born-Oppenheimer, Ψ è base per una rappresentazione irriducibile del gruppo punto molecolare. Possiamo imporre la stessa simmetria a |Φ〉 partendo da determinanti costruiti su orbitali adattati per simmetria (vedi § 4.4). Questo vincolo (e quello del punto precedente) possono portare a soluzioni di energia maggiore rispetto al trattamento senza vincoli (unrestricted). 8) Ψ soddisfa alla condizione di “cuspide Coulombiana”, ossia: la media di (∂Ψ/∂rij) calcolata su una

Page 20: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

20

sfera di raggio R intorno a rij = 0 deve tendere a ½Ψ(rij=0) . Questo comportamento non-differenziabile della Ψ in corrispondenza del contatto di due elettroni è molto difficile da imporre a meno che non si esca dalla descrizione basata su funzioni a un solo elettrone. Questo problema è all’origine di molte delle difficoltà di convergenza delle soluzioni approssimate verso la soluzione esatta. L’analoga condizione di “cuspide Colombiana nucleare”, riferita alla prossimità di un elettrone a un nucleo puntiforme causa problemi molto minori. 9) ρ(r) decade esponenzialmente a grandi distanze dalla molecola: ρ(r)∝exp (−αr), [r→∞] . La corretta riproduzione di questo comportamento, che si presenta anche in problemi di superfici solide, richiede l’uso di una base già adatta a questo fine (orbitali di Slater) o sufficientemente flessibile. 10) Ψ soddisfa alle condizioni di “invarianza di gauge” in presenza di potenziali elettromagnetici. Le stesse condizioni dovrebbero essere incorporate nel calcolo approssimato delle proprietà di risposta del sistema.

Approfondiamo nel seguito i punti 4, 5 e 7. 4.2 Il principio variazionale. Sia: H |R〉 = E0|R〉 . Mostriamo che: Per ogni variazione “consentita” della funzione d’onda: |R〉→|R’〉=|R〉+|δ〉, il valore di aspettazione dell’energia E’=〈R’|H|R’〉/〈R’|R’〉 coincide con E0 a meno di infinitesimi di ordine superiore a δ.

Senza perdità di generalità, supponiamo 〈R|R〉=1, per cui E0=〈R|H|R〉. Abbiamo allora (scrivendo esplicitamente i termini fino all’ordine 1 in δ) E’=N/D, con: N = 〈R|H|R〉+〈δ|H|R〉+〈R|H|δ〉+... = E0+〈δ|H|R〉+〈R|H|δ〉+… ; D = 1+ 〈δ|R〉+〈R|δ〉+…

→ E’=N/D = { E0+[〈δ|H|R〉+〈R|H|δ〉+…}{1− 〈δ|R〉− 〈R|δ〉+…}= = E0+〈δ|(H−E0)|R〉+〈R|(H−E0)|δ〉+... = E0+…

Vale anche il viceversa: se E0=〈R|H|R〉/〈R|R〉 è stazionario rispetto a qualsiasi variazione infinitesima |R〉→|R’〉=|R〉+|δ〉, vale H|R〉 = E0|R〉. Si dimostra come prima: E’−E0=〈δ|(H − E0)|R〉+〈R|(H−E0)|δ〉+… = 0 per ipotesi; ma è anche, effettuando la variazione ι|δ〉: 〈δ|(H−E0)|R〉−〈R|(H−E0)|δ〉 +… = 0. Sommando le due: 〈δ|(H− E0)|R〉=0, che dovendo essere vero per 〈δ| arbitrari implica H|R〉=E0|R〉.

Questo risultato è alla base del metodo variazionale. Se lo stato elettronico |C〉 è descritto in termini di un set finito di parametri C, i punti di stazionarietà di E(C)=〈C|H|C〉 ̸〈C|C〉 forniscono una soluzione approssimata del problema. Il teorema variazionale garantisce che l’errore sull’energia è di ordine superiore rispetto all’errore sulla funzione d’onda.

Page 21: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

21

Consideriamo prima il caso lineare con funzioni reali: |C〉=∑i=1P Ci |i〉.

Per ricavare i punti di stazionarietà occorre calcolare le derivate prime e seconde (Ei ,Eij) di E(C) rispetto ai parametri. Conviene partire dall’espressione: E〈C|C〉=〈C|H|C〉 e derivare i due membri. Risulta: Ei〈C|C〉+2 E 〈i|C〉=2〈i|H|C〉 → Ei = 2 [〈i|H|C〉−E〈i|C〉] ̸〈C|C〉 Eij〈C|C〉+2Ej〈i|C〉+2Ei〈j|C〉+2E〈i|j〉=2〈i|H|j〉 → Eij = 2[〈i|H|j〉−Ej〈i|C〉)−Ei〈j|C〉−E〈i|j〉] ̸〈C|C〉

La condizione di stazionarietà (Ei=0) diventa: 〈i|H|C〉=E〈i|C〉 . Ne risulta, in forma matriciale, la solita equazione: HC=εSC: i punti di stazionarietà sono descritti dal set on di vettori |CK〉=∑i=1

P CiK |i〉 associati ai P autovalori εK. Per quanto riguarda l’Hessiano, nel punto CK esso vale: KEij = 2[〈i|H|j〉−εK〈i|j〉]. Nella base degli autovettori esso risulta diagonale: KEMN = 2[εM −εK] δNM. Ossia, nei punti di stazionarietà, l’hessiano ha autovalori KEMM = 2[εM −εK]. Si noti che il K-esimo autovalore è nullo (l’hessiano è singolare). Avendo ordinato gli εK in ordine crescente, risulta che il K-esimo hessiano ha K-1 autovalori negativi, il che corrisponde al fatto che in quel punto l’energia ha un punto a sella di quell’ordine. Solo l’autovalore fondamentale corrisponde a un vero minimo.

Come varia il set di autovalori al cambiare del set rappresentativo? Vale il Teorema di Hylleraas-Undheim: Se si considerano due set rappresentativi di uno sviluppo lineare, S’ ed S”, di cui il secondo differisca dal primo per l’aggiunta di una funzione base, vale la relazione: ε”1 ≤ε’1 ≤ε”2 ≤ …. ≤ε’P≤ε”P+1 cioè, i P autovalori della base povera si inseriscono tra i P+1 della base più ricca. Ne deriva, come corollario, che il K-esimo autovalore calcolato con una tecnica lineare è sempre una stima per eccesso del K-esimo autovalore vero. Nel caso non-lineare questo teorema non vale più: Mentre il minimo valore dell’energia corrispondente ad un punto di stazionarietà è sempre una stima in eccesso dell’autovalore fondamentale, non è detto che i valori successivi siano una stima per eccesso dell’energia degli stati eccitati. Una conseguenza generale del principio variazionale è il teorema di Hellmann-Feynman (1937/9): Al primo ordine, la variazione di energia di uno stato stazionario per effetto di una perturbazione, è ottenibile dal valor medio della derivata della perturbazione nello stato imperturbato. Per dimostrarlo, consideriamo uno stato stazionario |R0〉 dell’Hamiltoniana imperturbata H0 , ed E0 la corrispondente energia: E0= 〈R0|H0 |R0〉 ̸〈R0|R0〉 (è anche, come s’è visto: H0 |R0〉 = E0 |R0〉). Aggiungiamo ora ad H0 una perturbazione αV, ed indichiamo col pedice α i corrispondenti stati stazionari e valori dell’energia: Eα= 〈Rα|H0+αV|Rα〉 ̸〈Rα|Rα〉. La derivata di Eα rispetto ad α in 0 vale: dEα | 2Re 〈∂Rα/∂α| H0+αV |Rα〉 〈Rα| V |Rα〉 −2 Re〈Rα|H0+αV|Rα〉〈∂Rα/∂α|Rα〉 | |= + + | = dα |0 〈Rα|Rα〉 〈Rα|Rα〉 〈Rα|Rα〉

2 |0

2Re 〈[∂Rα/∂α]0 | H0 |R0〉 〈R0| V |R0〉 −2 E0 Re 〈[∂Rα/∂α]0 |R0〉 〈R0| V |R0〉 = + + =

〈R0|R0〉 〈R0|R0〉 〈R0|R0〉 〈R0|R0〉

〈Rα|H0+αV|Rα〉 dEα | 〈R0| V |R0〉

Quindi: ≈ E0 + α | = E0 + α 〈Rα|Rα〉 dα |0 〈R0|R0〉

Page 22: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

22

Questo importante risultato consente di calcolare (al primo ordine) l’effetto di una perturbazione sull’energia senza necessità di ricalcolare la funzione d’onda perturbata.

Per es., se la perturbazione consiste in uno spostamento piccolo delle coordinate nucleari (RA→RA+dA) , è facile calcolare la variazione al primo ordine dell’energia dal valor medio della derivata del potenziale perturbativo:

ri−RA RB−RA E([RA+dA]) ≈ E([RA]) −∑ iA ZA dA• 〈Ψ[RA]| |Ψ[RA]〉 + ∑ A ZA dA• ∑ B>A ZB

|ri−RA|3 |RB−RA|3 L’applicazione a calcoli molecolari è però condizionata dal fatto che un set base molecolare varia col variare delle coordinate nucleari; perciò una funzione d’onda ottimizzata per una data geometria non è adeguatamente descritta da funzioni relative a una geometria diversa. Questa difficoltà non si presenta quando si usi una base di onde piane.

4.2.7 Il teorema del viriale e le forze che agiscono sui nuclei. 4.2.8 Riformulazione variazionale di tecniche non variazionali: Il metodo della Lagrangiana Sia una funzione E(α,λ) . Per fissare le idee, α è una misura della perturbazione, λ corrisponde ad una P-pletta di parametri che determinano la funzione d’onda. In generale λ è univocamente determinato per ogni α [λ=λ*(α)], e quindi si può definire una funzione della sola α: E(α) ≡ E(α,λ*(α)). Si ha: dE(α) ̸dα = {∂E(α,λ) ̸∂α + [∂E(α,λ) ̸∂λ]⋅[∂λ ̸∂α]}*, dove l’asterisco al pedice indica che l’espressione va valutata in λ*(α). In un metodo variazionale, la relazione λ=λ*(α) è tale per cui la funzione E(α,λ) risulta stazionaria rispetto a λ per ogni α: {∂E(α,λ) ̸∂λ}*=0, Ne risulta, in questo caso: dE(α)/dα={∂E(α,λ) ̸∂α}* (che non è altro che il teorema di Hellmann-Feynman). Consideriamo ora un metodo non-variazionale, in cui la relazione λ=λ*(α) sia definita implicitamente da P “vincoli” f(α,λ)=0. Cerchiamo una tecnica semplice per calcolare anche in questo caso dE(α)/dα. Costruiamo a questo fine la Lagrangiana (µ indica una P-pletta di moltiplicatori Lagrangiani): L(α,λ,µ) = E(α,λ)+µ⋅f(α,λ) . Stabiliamo ora, per ogni α,µ la condizione di stazionarietà della Lagrangiana rispetto a λ : 0 = ∂E(α,λ) ̸∂λ + µ ⋅ ∂f(α,λ) ̸∂λ , e imponiamo, in particolare, che essa valga per λ=λ*(α): [0 = ∂E(α,λ) ̸∂λ + µ ⋅ ∂f(α,λ) ̸∂λ ]λ=λ*(α) Questo set di equazioni determina, per ogni α, il valore µ*(α). Risulta dunque (l’asterisco al pedice indica ora che l’espressione va valutata in λ*(α), µ*(α)): L(α,λ,µ)|* =E(α,λ*(α))+µ*(α)⋅f(α,λ*(α))=E(α). Di qui la soluzione del problema: dE(α) dL(α,λ,µ) ∂E ∂f ∂λ ∂E ∂f ∂E(α,λ) ∂f(α,λ) = = + µ ⋅ + + µ ⋅ + f = + µ ⋅ dα dα * ∂λ ∂λ ∂α ∂α ∂α * ∂α ∂α * Questo risultato può essere usato in un caso non variazionale per valutare la derivata dell’energia rispetto alla perturbazione, senza dover valutare l’effetto della perturbazione sulla funzione d’onda. (Vedi § 13.5 e § 14.1, 14.3 per applicazioni a problemi Coupled-cluster e perturbativi).

Page 23: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

23

Osservazione finale sul metodo variazionale Siamo quasi sempre interessati a differenze di energie. Quando si voglia applicare al problema una tecnica variazionale, occorre garantire che si fornisca una descrizione bilanciata del sistema elettronico per tutte le situazioni di interesse (diverse configurazioni nucleari, stati corrispondenti a diversi autovalori, ecc.). 4.3 Il problema della size-extensivity. La scelta del modello approssimato adottato o della sua parametrizzazione gioca un ruolo essenziale al fine della size-extensivity. Questa si realizza solo quando lo spazio variazionale del sistema composto è il prodotto diretto degli spazi dei frammenti separati (vedi ad esempio § 5.6 e 5.7). 4.4 Vincoli di simmetria. E’ spesso desiderabile imporre alle soluzioni approssimate la simmetria dell’Hamiltoniana esatta, sia al fine di facilitare la corrispondenza tra stati esatti ed approssimati, sia per minimizzare il costo computazionale riducendo lo spazio variazionale. Nel seguito consideriamo il caso delle proprietà di simmetria spaziale, facendo riferimento a quanto visto in § 3.2, 3.3 sulle trasformazioni unitarie, ed in § 2.2 sugli operatori spinless. Indichiamo con R un operatore del gruppo punto molecolare, per il quale cioè [R,H]=0. L’effetto di R sugli orbitali è descritto dalla trasformazione Rφp(x) = ∑q φq(x) RUqp . Esprimendo la matrice unitaria RU in termini della matrice antihermitiana Rκ: RU = exp(−Rκ) , si è visto che si può scrivere, in SQ:

R = exp(−Rk) , con Rk = ∑pq Rκpq Epq L’operatore così descritto agisce sul generico stato di Fock sostituendo, in ogni detor, gli so originari con quelli ruotati. Gli autostati di H possono essere classificati secondo le righe (µ) delle rappresentazioni irriducibili (Γ) del gruppo di H, potremmo cioè descriverli come stati |ΓµΦ〉 che soddisfano alla proprietà: R |ΓµΦ〉 = exp(−Rk) |ΓµΦ〉 = ∑ν AΓ

µν*(R) |ΓνΦ〉 . Per ottenere uno stato con queste proprietà di simmetria da uno stato qualsiasi possiamo usare la tecnica dei proiettori di Wigner: ΓµP |Φ〉 = |ΓµΦ〉, con ΓµP= ∑R AΓ

µµ* (R) R . Supponiamo di volere cambiare la base rappresentativa con una trasformazione unitaria W = exp(−λ) [λ antihermitiana], cui corrisponde l’operatore W= exp(−L), essendo L = ∑PQ λPQ aP

†aQ. Affinché la trasformazione mantenga la simmetria degli stati, dovrebbe essere [W,R]=0 per tutti gli R, mentre non è detto che ciò sia vero per la trasformazione scelta. Soddisfa invece a questa proprietà l’operatore unitario totalsimmetrico: symW = ∑R exp(−Rk) exp(−L) exp(Rk) .

Page 24: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

24

Capitolo 5. I modelli standard La chimica quantistica computazionale ha sviluppato un piccolo numero di modelli standard per la costruzione di funzioni d’onda approssimate. Partendo dagli esempi delle molecole di idrogeno e di acqua, si introducono in questo capitolo il modello di Hartree-Fock, il modello MC-SCF, il modello CI, il modello CC, il modello MP. 5.1 Espansioni ad uno ed N elettroni 5.2 Un sistema modello: la molecola di idrogeno in base minima 5.3 Funzioni d’onda esatte nello spazio di Fock: le molecole di idrogeno e di acqua 5.4 L’approssimazione di Hartree-Fock (HF) Il modello HF, il più semplice “wave-function model” nella teoria ab-initio della struttura elettronica, non solo costituisce di suo un’utile approssimazione, ma è anche un punto di partenza per altre tecniche più accurate.Inoltre, esso è size-extensive (vedi § 10.2.4). La funzione d’onda di HF è rappresentata da una singola configurazione di so ed è cioè della forma generale |κ〉= exp(−k) |r〉, in cui la configurazione di riferimento |r〉 è appunto un singolo detor o una singola CSF adattata per simmetria spaziale e/o di spin in una determinata combinazione lineare, e in cui la trasformazione unitaria descritta dall’operatore exp(−k) modifica nel modo più generale possibile gli so presenti in |r〉 , compatibilmente con le restizioni di simmetria. La forma esplicita degli so (ovvero, gli elementi della matrice antihermitiana κ che definiscono k) viene ottenuta minimizzando il valore di aspettazione dell’energia: EHF =minκ 〈κ|H|κ〉. Poiché i parametri κPQ= −κPQ* sono presenti in maniera non lineare nella funzione da minimizzare, il procedimento è necessariamente iterativo. Per la loro ottimizzazione si può pensare ad uno schema numerico (per es., di tipo gradienti-coniugati), come alternativa alla tecnica standard (vedi sotto). Tra le tecniche che possono essere utilizzate per risolvere il problema HF ve n’è una che passa attraverso la matrice densità (senza bisogno di definire esplicitamente |κ〉), e che risulta particolarmente adatta per grandi sistemi (vedi § 10.7). La soluzione di HF può non possedere le caratteristiche di simmetria (spaziale, di spin) che invece contraddistinguono la soluzione esatta. Nel metodo restricted HF (RHF) queste vengono imposte, cioè la minimizzazione dell’energia avviene soggetta a vincoli (vedi § 4.2). In particolare, per quanto riguarda lo spin, la funzione d’onda è scritta come un’opportuna CSF piuttosto che come un singolo detor (vedi § 2.5). Nell’approssimazione unrestricted HF (UHF), le restrizioni sono imposte solo parzialmente o sono assenti del tutto. Accade a volte (soprattutto in prossimità delle strutture d’equilibrio) che la soluzione UHF coincida con la RHF. Supponiamo di avere risolto il problema, cioè di avere trovato la configurazione ottimale |κ〉. Gli so che definiscono lo spazio di Fock possono essere allora suddivisi in due set, quello degli N so occupati {ΦO} (presenti in |κ〉) ed il set complementare degli so virtuali {ΦV}. Ogni trasformazione unitaria che non mescoli i due sottospazi (per la quale cioè sia κOV=0), non cambia la funzione d’onda. In altri termini, mentre i due sottospazi sono univocamente determinati, i singoli so non lo sono.

Page 25: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

25

La procedura normalmente adottata per definire la soluzione di HF passa attraverso la ricerca di so (gli so canonici o Molecular spin-orbitals, MO) che sono autofunzioni dell’operatore monoelettronico fc , la cui rappresentazione in SQ nella base {ΦO}⊕{ΦV} è data da f = ∑PQ [hPQ+∑’I (gPQII - gPIIQ)] aP

†aQ , essendo la sommatoria su I ristretta ai soli N so occupati (mentre l’altra interessa tutti gli so che definiscono lo spazio di Fock): vedi § 10.3.2. La soluzione cercata può dunque essere descritta come la ricerca degli so che portano l’operatore f in forma diagonale: fPQ = δPQ εP (gli ε P sono detti energie orbitaliche, e servono a determinare l’occupazione degli so canonici secondo il principio di Aufbau). Si definisce propriamente energia di correlazione la quantità: Ecorr = Eexact−EHF, essendo Eexact l’energia dell’autostato fondamentale dell’Hamiltoniana non-relativistica ed EHF la corrispondente energia RHF, entrambe calcolate con una base completa. Si include così la correlazione dinamica e quella non-dinamica, ma non la correlazione di Fermi. In pratica, si usa il termine anche nel caso di calcoli UHF e nel caso di basi non complete. 5.5 Teoria Multiconfigurazionale Self-Consistent (MCSCF) In alcuni casi il modello HF basato su un’unica configurazione di riferimento non funziona bene. Sono i casi in cui la correlazione non-dinamica è importante, o in prossimità della struttura d’equilibrio o, più spesso, quando si studiano processi che portano alla rottura e alla ri-formazione di legami chimici. Il modello MCSCF costituisce una generalizzazione del modello HF, utile in questi casi. Si parte da un set di detor di riferimento,{|i〉}, e si ottimizza sia il loro peso relativo, sia la forma degli so che li costituiscono: |κ,C〉= exp(−k) [∑i Ci |i〉], minimizzando il valore di aspettazione dell’energia: EMC = minκ,C {〈κ,C |H|κ,C〉 ̸〈κ,C|κ,C〉}. Il problema principale è quello di disegnare opportunamente il set {|i〉}: il processo di ottimizzazione è spesso difficoltoso e perciò {|i〉} deve essere il più piccolo possibile. Nel metodo CAS-SCF, si ripartiscono gli MO (ottenuti per es. da un calcolo HF) in tre categorie: inattivi, attivi e secondari (o virtuali). Si costruiscono poi le configurazioni |i〉 assegnando occupazione doppia a tutti gli orbitali inattivi, e distribuendo in tutti i modi possibili i restanti elettroni tra gli orbitali attivi, compatibilmente con i vincoli di simmetria. Questo modello è poco adatto a descrivere la correlazione dinamica. L’applicazione della teoria perturbativa al secondo ordine ad una soluzione MCSCF ha però portato ad ottimi risultati. 5.6 Teoria della Interazione di Configurazioni (CI) Il modello CI consiste nel generare una serie di detor applicando delle eccitazioni a 0, 1, 2, …, N elettroni ad uno stato di riferimento |R〉: |C〉 = (1+∑AI XA

I +∑A>B,I>J XABIJ + …) |R〉 ≡ ∑i Ci |i〉 . Gli

operatori di eccitazione sono della forma: XAI = CA

I aA†aI; XAB

IJ = CABIJ aA

†aB†aI aJ , ecc., dove

l’indice I (J,K,…) designa uno degli N so occupati nello stato di riferimento, e A (B,C,…) uno degli so virtuali. Nella teoria CI , solo i coefficienti dell’espansione |C〉 = ∑i Ci |i〉 vengono ottimizzati; lo stato di riferimento e gli orbitali corrispondenti sono generati separatamente in un precedente calcolo HF o MCSCF, e poi mantenuti fissi. Il problema si riduce quindi alla diagonalizzazione della matrice H con elementi Hij=〈i|H|j〉. Come le precedenti, la tecnica CI è variazionale. Essendo anche lineare, fornisce una stima per eccesso

Page 26: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

26

non solo dell’energia dello stato fondamentale, ma anche di quella degli stati eccitati (teorema di Hylleraas-Undheim). Poiché un metodo full-CI è in pratica impossibile per l’enorme numero di configurazioni che si possono ottenere distribuendo gli N elettroni tra i 2M so, si tratta di usare delle CI troncate, in cui il troncamento sia tale da consentire la fattibilità del calcolo, recuperare buona parte dell’energia di correlazione dinamica, mantenere una descrizione bilanciata sull’intero set di configurazioni nucleari esplorate. Nel calcolo “ Single-reference-CI ” si usa di regola come configurazione di riferimento la soluzione di HF in prossimità della struttura di equilibrio. Tutte le altre configurazioni sono ottenute da questa mediante l’applicazione di operatori di eccitazione di ordine m, e si possono quindi classificare come eccitazioni singole, doppie, ecc. (S,D,T,Q,5,6…). Appare logico stabilire una gerarchia di troncamenti includendo tutte e sole le eccitazioni fino ad un certo ordine. L’esperienza mostra che è più utile arrestarsi ad ordini pari (CISD,CISDTQ,…). La convergenza dei risultati è molto più lenta quando ci si scosta dalla struttura per la quale è stata calcolata la configurazione di riferimento. Nel calcolo “ Multireference-CI ” si parte da uno spazio di riferimento che comprende alcune configurazioni di riferimento, ottenute per esempio con un metodo MCSCF o CAS-SCF. Di queste si considerano tutte le eccitazioni fino ad un certo ordine (di solito arrestato al secondo: tecnica MRSDCI). La tecnica è molto potente per piccole molecole, anche se un po’ macchinosa, mentre per sistemi di più grandi dimensioni il numero di configurazioni di riferimento da cui partire diventa rapidamente troppo grande. Si noti infine che una tecnica CI troncata a un certo ordine è intrinsecamente non size-consistent. Per esempio, lo spazio prodotto di due spazi CISD per due frammenti separati, contiene delle quadruple eccitazioni che non sono presenti nello spazio CISD del sistema composto. 5.7 Teoria Coupled-Cluster (CC) Nella teoria CC lo stato fondamentale è espresso a partire da una configurazione di riferimento HF come segue (la convenzione sugli indici è la stessa che per il metodo CI): |CC〉 = exp(T) |HF〉, con: T=T1+T2+ … ≡ (∑AI tA

I aA†aI) + (¼ ∑ABIJ tAB

IJ aA†aB

†aI aJ)+ … La teoria sarà detta CCSD, CCSDT ecc, a seconda dell’ordine massimo Tn incluso nell’esponenziale. Notiamo che: tutti gli operatori nella somma all’esponente commutano tra loro perché gli operatori creazione e quelli annichilazione si riferiscono a due set separati, e il numero di operatori ca in ogni prodotto è pari; quindi: exp(T)= ∏AI exp(tA

I aA†aI)×∏ABIJ exp(¼ tAB

IJ aA†aB

†aI aJ)× … o anche: exp(T)= ∏AI(1+tA

I aA†aI)×∏ABIJ (1+ ¼ tAB

IJ aA†aB

†aI aJ)× …, dove il troncamento dello sviluppo esponenziale è possibile perché tutte le potenze superiori alla prima dei singoli operatori di eccitazione sono nulle; da cui (introducendo il generico operatore di eccitazione τµ): |CC〉 = ∏AI(1+tA

I aA†aI)×(∏ABIJ (1+ ¼ tAB

IJ aA†aB

†aI aJ)×… |HF〉 ≡ ∏µ (1+tµ τµ) |HF〉 . Esprimendo lo stato CC in una forma CI : | CC 〉 = ∑i Ci |i〉, osserviamo che tutte le configurazioni che sono presenti in una FCI sono presenti anche in | CC 〉, qualsiasi sia l’ordine del troncamento. Una certa configurazione n-eccitata |i〉=|ABC…

IJK…〉 ↔ [(I>J>K…)→(A>B>C…)] può però essere generata

Page 27: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

27

in molti modi diversi; per esempio, in un calcolo CCSDT, una tripla eccitata può venire da 3 eccitazioni singole, da una doppia e una singola o da un’unica tripla eccitazione di ordine. Quindi il coefficiente Ci è una cl di prodotti di coefficienti tαλ , dove α e λ sono un set di indici virtuali e occupati rispettivamente e dove il segno del prodotto è + o − a seconda del numero di inversioni di indici dei due set che portano all’ordine corretto.

Quest’ultima osservazione mostra che il problema della determinazione dei coefficienti tαλ di una CC troncata all’ordine n è altamente non lineare. Un approccio variazionale è intrattabile. Si adotta quindi il principio non variazionale della equazione di Schrödinger proiettata. Si scrive prima, tentativamente: H |CC〉 = H exp(T) |HF〉 ≈ ECC |CC〉 = ECC exp(T)|HF〉 (in realtà questa relazione è approssimata, per via del troncamento), ovvero: exp(−T) H exp(T) |HF〉 ≈ ECC |HF〉 , Moltiplicando ambo i membri delle due pseudo-equazioni a sinistra per 〈HF| e per tutti e soli gli 〈αλ| fino all’ordine considerato, e avendo notato che 〈HF|CC〉 = 1 (normalizzazione intermedia), si ha, rispettivamente: ECC = 〈HF|H exp(T) |HF〉 ; 〈αλ|H exp(T)|HF〉 = ECC 〈αλ| exp(T)|HF〉 (unlinked CC eqs.) ECC = 〈HF| exp(−T) H exp(T) |HF〉 ; 0 = 〈αλ| exp(−T) H exp(T)|HF〉 (linked CC eqs.) Si dimostra che le due forme delle equazioni CC sono equivalenti, ma la “linked” è per certi aspetti vantaggiosa: in particolare risulta size-extensive termine a termine (vedi § 13.2.3, 13.3). Le equazioni a destra sono tante quante le incognite tαλ. Per risolverle, vedi § 13.4. Rispetto ad una FCI il numero di parametri coinvolti in una CC troncata è enormemente minore, tanti quanti quelli di una CI troncata allo stesso ordine! Il metodo CC è sorprendentemente accurato. Ottimi risultati si raggiungono già a livello CCSD, o ancor meglio a livello CCSD(T), in cui il contributo delle triple eccitazioni è trattato per via perturbativa. La formulazione CCSDT, in cui le triple sono trattate in modo esatto, dà risultati eccellenti, ma è molto pesante tranne che per piccolissimi sistemi. Il fatto che il metodo non sia variazionale dà meno noia del previsto, anche perché la tecnica Lagrangiana (vedi § 4.2) permette di ridurre i problemi che si possono presentare nel calcolo delle proprietà molecolari. Tuttavia CC è poco adatto a descrivere sistemi caratterizzati da alta correlazione non-dinamica. In questi casi vanno meglio soluzioni MCSCF o MRCI. 5.8 Teoria Perturbativa (MP) Con riferimento al § 5.4, ricordiamo la forma e le proprietà dell’Hamiltoniana monoelettronica di HF f per un sistema N-elettronico. Facciamo qui riferimento al sottospazio di Fock F(M,N) costruito sugli so di HF, che soddisfano all’equazione fc ΦR(r) = εR ΦR(r). Gli so sono suddivisi in due set, quello degli “occupati” (con indici I1, …, IN), corrispondenti alle energie orbitaliche (εR) più basse (principio di Aufbau), e quello complementare dei “virtuali” (con indici V1, …, VM-N); gli indici P, Q, R, S, … designano so generici. Tra le funzioni base di F(M,N), gioca un ruolo chiave |HF〉, il detor in cui tutti e soli gli so del primo set sono presenti. Essa è, tra tutte le possibili funzioni d’onda mono-determinantali, quella che minimizza il valore di aspettazione dell’energia. Ogni altro detor di F(M,N) può essere scritto come (|αn→βn〉), in cui αn e βn indicano rispettivamente una n-pla ordinata di indici “I” (corrispondente a so che sono stati eliminati dal detor fondamentale) ed una n-pla ordinata di indici “V” (corrispondente a so che hanno preso il loro posto). Si ha così (la ∑’I è effettuata sugli indici occupati): f = ∑PQ [h PQ +∑’I(gPQII − gPIIQ)] aP

†aQ = ∑R εR aR†aR

f |HF〉 = (∑’I εI)|HF〉 ≡ E(0)|HF〉 ; f |αn→βn〉 = (E(0) +∑V∈βn εV − ∑I∈αn εI) |αn→βn〉,

Page 28: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

28

ossia: ogni detor è autostato di f con autovalore pari alla somma delle energie orbitaliche degli so in esso presenti. Possiamo ora scrivere (vedi § 1.4): H = ∑PQ hPQ aP

+aQ + ½ ∑PQRS gPQRS aP†aR

†aS aQ + hnuc ≡ f + hnuc+ W dove l’hamiltoniana “perturbativa” (W), detta “potenziale di fluttuazione”, è data da: W = ½ ∑PQRS gPQRS aP

†aR†aS aQ−∑’I (gPQII − gPIIQ) aP

†aQ Conoscendo autostati ed autovalori della “Hamiltoniana imperturbata” (f + hnuc) è possibile utilizzare i risultati della teoria perturbativa di Rayleigh- Schrödinger (RSPT) ai vari ordini di perturbazione, che in questo caso prende il nome di approssimazione di Moller-Plesset di ordine n (MPn). Si possono così ottenere espressioni via via più accurate dell’energia dello stato fondamentale (E MPn = E+ E(0)+…+ E(n)) e della corrispondente funzione d’onda: ( |Ψ MPn 〉 = |HF〉+ …+ |Ψ(n) 〉 ). Una caratteristica importante delle espressioni RSPT dell’energia a qualsiasi ordine è il loro carattere size-extensive, che però non è facile da dimostrare in generale (vedi § 14.1.4). Il metodo perturbativo, invece, non è variazionale. Particolarmente utile, per la sua semplicità ed efficacia, è MP2. Risulta facilmente: EMP2 = EHF − ∑V1>V2,I1>I2 (gV1 I1 V2 I2 − g V1 I2 V2 I1) ̸(εV1+ εV2− εI1− εI2) I vantaggi ottenuti procedendo nell’ordine della perturbazione sono limitati e sono pagati duramente in termini di impegno di calcolo.

Page 29: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

29

Capitolo 6. Funzioni base atomiche Nella maggior parte delle applicazioni chimiche, gli orbitali con cui si costruisce lo spazio di Fock sono scritti come cl di semplici funzioni analitiche, le “funzioni base atomiche”. 6.1 Cosa richiedere a un set di funzioni base mono-elettroniche?

Capitolo 7. Interazioni a corto raggio ed espansioni orbitaliche Il caso dell’atomo di Elio 7.3.2 METODI ESPLICITAMENTE CORRELATI

Capitolo 8. Set base Gaussiani Diverse esigenze per diversi problemi 8.5 BSSE

Capitolo 9. Valutazione degli integrali molecolari Integrali ad uno e due elettroni in base Gaussiana. Tecniche computazionali di altissima efficienza

Page 30: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

30

Capitolo 10. La teoria di Hartree-Fock Per le ragioni già viste, la teoria HF gioca un ruolo chiave nella chimica quantistica. Di per sé, fornisce già delle descrizioni decenti della struttura elettronica e dell’energetica di molti sistemi chimici. Tra gli argomenti trattati in questo capitolo: la dimostrazione del suo carattere size-estensive, il teorema di Brillouin, quello di Koopmans, metodi non convenzionali di soluzione, soluzioni con vincoli di simmetria e senza, l’interpretazione delle energie orbitaliche. E’ descritta in particolare una tecnica per ottenere l’energia HF basata solo sulla densità. 10.6 Tecniche HF “standard” Acceleratori di convergenza (DIIS). 10.7 Teoria HF basata sulla densità Si tratta di una tecnica non convenzionale per la soluzione del problema HF che scala linearmente, quindi adatta per grandi sistemi. Essa si basa sull’espressione dell’energia HF in termini della matrice densità R, espressa in una base di AO reali, generalmente non ortogonali, e sulla minimizzazione dell’energia stessa rispetto a dei parametri X arbitrari che modificano la R mantenendone la caratteristica essenziale, cioè che essa sia ottenibile da un detor closed-shell costruito su N/2 MO ortonormali. Rispetto alle solite convenzioni, R=P/2. Definiamo come al solito (le lettere greche contrassegnano gli AO): Sµν= ∫ϕµϕν ; hµν= ∫ϕµ h

c ϕν ; e inoltre: Gµν(R) = ∑ρσ (2 gµνρσ − gµσρν) Rρσ Si ha, esplicitando la dipendenza della matrice densità dai parametri: E(X) = 2 Tr [h R(X)] + Tr [G(R(X)) R(X)] Si tratta ora di definire la relazione [R=R(X)] che permette di esprimere la più generale matrice densità ottenibile da un detor come funzione di certi parametri arbitrari X . Partiamo da una matrice di riferimento R ≡ R(0) corrispondente a un detor | 0 〉 di MO: φp = ∑µ cµp ϕµ , ossia: Rµν = ∑’p cµp cνp ⇒ R = CDCT , essendo D una matrice del tipo:

| 1N/2 0 | D = | |

| 0 0 | Dall’ortonormalità degli MO: δpq = ∫φp φq = ∑µν cµp cνq Sµν → 1 = CTSC → C-1=CTS → RS = CDC-1, risultano tre proprietà che caratterizzano la “legittimità” di una matrice densità nella base AO: R=RT ; Tr [RS] = Tr [D] = N/2 ; RSRS = CDC-1CDC-1= CDC-1 = RS, ovvero: RSR=R . Notiamo ora che il generico detor N-elettronico closed-shell reale può essere ottenuto da | 0 〉 mediante una trasformazione unitaria degli MO (vedi § 3.2): |0〉 = exp(−k) |0〉 , con k=∑p>q Rκpq (Epq − Eqp) . Tenendo ora conto dell’espressione generale della matrice densità (vedi § 2.7), risulta: Dpq = 〈0|Epq|0〉 =〈0| exp(k) Epq exp(−k) |0〉 , da cui, con semplici manipolazioni, si ottiene la relazione matriciale: D = U D UT, con U = exp(−Rκ) . Nella base degli AO, la matrice densità diventa: R = CDCT = CUDUTCT= CUCTSCDCTSCUTCT = CUCTSRSCUTCT =CUC-1R [CT]-1UTCT =

Page 31: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

31

= C exp(−Rκ)C-1R [CT]-1 exp(Rκ) CT= exp(−C Rκ C-1) R exp([CT]-1 Rκ CT) = exp(−XS) R exp(SX) , dove abbiamo definito la matrice X = C Rκ CT. La relazione ora ottenuta può essere inserita nell’espressione dell’energia e procedere alla minimizzazione di quest’ultima in termini dei parametri Rκ. Una serie di accorgimenti tecnici consentono di rendere la procedura particolarmente efficiente.

a) ELIMINAZIONE DELLE RIDONDANZE Rotazioni che mescolano tra loro MO dello stesso sottospazio (virtuale o occupato) portano a matrici densità equivalenti. Imponendo che ciò non avvenga, ci si può ridurre ad un set di parametri arbitrari, ma non ridondanti. b) PURIFICAZIONE DELLA MATRICE DENSITA’ Anche se in linea di principio la R(X) generata ad ogni stadio soddisfa alla condizione di idempotenza [R(X) = R(X) S R(X)], attraverso le approssimazioni del calcolo questa proprietà potrebbe essere parzialmente perduta. Essa può essere garantita ad ogni stadio con una tecnica di purificazione semplice e potente (p.471): Rn+1 = 3 Rn S Rn −2 Rn S Rn S Rn c) MOSSE NELLO SPAZIO DEI PARAMETRI Dopo avere calcolato le derivate prime e seconde di E(X) rispetto ai parametri non ridondanti, si può usare un qualche metodo efficiente (per es., di tipo Newton) per muoversi nello spazio dei parametri: Xn-1 → Xn ; Rn+1 = exp(−XnS) Rn exp(SXn) . La nuova matrice è poi ottenuta troncando l’espansione BCH del prodotto dei tre operatori a secondo membro (vedi § 3.1) a qualche ordine basso, seguito da purificazione.

Page 32: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

32

Capitolo 11. La teoria CI Si approfondiscono le tecniche accennate in § 5.6. Oltre a riconsiderare il problema della size-estensività, si esaminano in questo capitolo diversi aspetti tecnici, per es. lo sfruttamento del carattere “sparso” della rappresentazione poli-determinantale dell’hamiltoniano.

Capitolo 12. La teoria MCSCF Si approfondiscono le tecniche accennate in § 5.5.

Page 33: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

33

Capitolo 13. La teoria Coupled-Cluster (CC) Si approfondiscono qui le tecniche accennate in § 5.7. Si sono già visti in quella sede i vantaggi del CC: limitati problemi numerici, size-estensività, grande accuratezza quando la soluzione monodeterminantale HF di riferimento è un buon punto di partenza. 13.2 Manipolazioni delle equazioni “linked” CC Ripartiamo dalle equazioni del § 5.7; scriveremo qui E al posto di ECC , e talvolta 〈µ| al posto di 〈αλ|: E = 〈HF|exp(−T)Hexp(T)|HF〉 ; 0 = 〈µ| exp(−T)Hexp(T) |HF〉 Ricordiamo che 〈HF|exp(−T) = 〈HF|(1−T+ ½ T2 + ...) = 〈HF|(1+... + tA...

I... aA† ... + ...) = 〈HF| ,

perché un operatore creazione di MO virtuale agendo da destra sul bra 〈HF| lo annulla. Quindi: E = 〈HF|Hexp(T)|HF〉 = 〈HF|H(1+T+ ½ T2 + ...)|HF〉= 〈HF|H(1+T2+ ½ T1

2 )|HF〉 Nell’ultimo passaggio abbiamo tenuto conto del fatto che termini dello sviluppo di exp(T) che contengono più di due operatori di tipo aA

†, non contribuiscono all’elemento di matrice perché almeno uno di questi può migrare a sinistra di H (i cui termini contengono al più due operatori annichilazione), e quindi annullare 〈HF|; inoltre, per il teorema di Brillouin: 〈HF|HT1|HF〉=0. Osserviamo che exp(T) non è un operatore unitario, perché T non è antihermitiano. Quindi l’operatore H’ = exp(−T) H exp(T) non è hermitiano. Usando la BCH (§ 3.1), si può scrivere: H’ = H + [H, T] + (1/2) [[H, T], T] + (1/6) [[[H, T], T], T] + (1/24) [[[[H, T], T], T] , T]. Questo sviluppo troncato è esatto, perché si dimostra che il nido di commutatori oltre il quarto ordine è nullo. Ulteriori semplificazioni sono possibili elaborando esplicitamente il valore dei commutatori ai vari ordini di eccitazione. Nel caso CCSD (T=T1+T2), per es., le equazioni linked CC diventano: 0 = 〈µ1| H’ |HF〉= 〈µ1|{ H+[H,T]+(1/2)[[H,T1],T1] + [[H,T1],T2]+ (1/6) [[[H, T1],T1],T1]} |HF〉 0 = 〈µ2| H’ |HF〉= 〈µ2|{ H+[H,T]+(1/2)[[H,T1],T1] + [[H,T1],T2] +(1/2) [[H,T2],T2] + + (1/6) [[[H, T1],T1],T1] + (1/2) [[[H, T1],T1],T2] + (1/24) [[[[H, T1],T1],T1],T1]} |HF〉

Nella rappresentazione canonica possiamo scrivere (§ 5.8): H = f + hnuc+ W, con f = ∑R εR aR†aR

Consideriamo un generico termine di T : Xαλ= tA..

I... aA†...aI...), e calcoliamo il commutatore [f,X] .

Di tutta la sommatoria su R si salveranno solo i termini εA aA†aA , εI aI

†aI , con A∈α, I ∈λ. Risulta: εA aA

†aA tA..I... aA

†...aI...− tA..I... aA

†...aI... εA aA†aA...= εA tA..

I... aA†...aI...

εI aI†aI tA..

I... aA†...aI...− tA..

I... aA†...aI... εI aA

†aA...= − εI tA..I... aA

†...aI... Risulta quindi: [f,T] = T’ =∑αλ εαλ Xα

λ, dove εαλ= ∑A∈αεA− ∑I∈λ εI E = 〈HF|H(1+T2+ ½ T1

2 )|HF〉 = EHF+〈HF|(f+hnuc)(T2+½T12)|HF〉+〈HF|W(T2+ ½ T1

2 )|HF〉. Il secondo termine è nullo perché 〈HF|T ’|HF〉 =〈HF|T f |HF〉 = 0.

Nella rappresentazione canonica si ha dunque: E = EHF+〈HF|W(T2+ ½ T1

2 )|HF〉. Analogamente si dimostra che:

εαλtαλ= −〈αλ| exp(−T)Wexp(T) |HF〉

Page 34: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

34

13.3 Size-estensività nella teoria CC Consideriamo un sistema composto di due sottosistemi indipendenti, M e N. L’indipendenza può essere formalizzata dividendo gli operatori ca in due categorie, {aMP

+,aMP} e {aNP+,aNP}, relativi a so del

sottosistema M e N, rispettivamente. E’: |HF〉 = (∏I aMI†)(∏J aNJ

†)|vac〉 = (∏I aMI†)|HFN〉 =

(∏JaNJ†)|HFM〉. L’Hamiltoniana può essere scritta come H = HM+HN , in ciascuna delle quali

compaiono solo operatori ca delle rispettive categorie. Analogamente scriveremo T = TM+TN = ∑µM tµMτµM +∑µN tµNτµN . Risulta evidentemente: [TM,TN]=[TM,HN]=[TN,HM]=0. Si ha: ECC

(MN) = 〈HF|Hexp(T)|HF〉 = 〈HF|( HM+HN) exp(TM) exp(TN)|HF〉 = 〈HF| HM exp(TM) exp(TN)|HF〉+〈HF|HN exp(TM) exp(TN)|HF〉 = 〈HF| exp(TN) HM exp(TM) |HF〉+〈HF| exp(TM) HN exp(TN)|HF〉 = 〈HF| HM exp(TM) |HF〉+〈HF| HN exp(TN)|HF〉= = 〈HFM| (∏J aNJ

†)†HM exp(TM) (∏J aNJ†) |HFM〉+〈HFB|(∏I aMI

†)† HN exp(TN) (∏I aMI†)|HFB〉=

= 〈HFM| HM exp(TM) |HFM〉+〈HFB| HN exp(TN) |HFB〉 = ECC(M) + ECC

(N) 13.4 Tecniche di soluzione 13.4.1 IL METODO DI NEWTON Supponiamo di avere a disposizione, a un certo stadio (n) del calcolo una soluzione approssimata delle equazioni “linked” CC descritta dal vettore di parametri t(n), ossia: T(n) = ∑µ t(n)

µτµ . Il vettore dei “residui” Ω(t(n)) [ Ωµ(t(n)) = 〈µ| exp(−T(n))Hexp(T(n))|HF〉 ] sarà diverso da zero: vogliamo definire una nuova approssimazione t(n+1) = t(n)+ Δt che riduca i residui. Possiamo scrivere: Ω(t(n)+Δt) ≈ Ω(t(n)) + Ω’(t(n)) ⋅ Δt, dove abbiamo definito la matrice delle derivate prime di Ω(t(n)) rispetto ai parametri (il cosiddetto Jacobiano CC): Ω’µν(t(n)) = ∂〈µ|exp(−T(n))Hexp(T(n))|HF〉/∂t(n)

µ = 〈µ|exp(−T(n))[H,τν]exp(T(n))|HF〉. Ponendo Ω(t(n)) + Ω’(t(n)) ⋅ Δt = 0 , risulta Δt = −[Ω’(t(n))]-1 Ω(t(n)) . In pratica, dato che il numero di parametri è molto grande, non si calcola l’inversa ma si risolve iterativamente il sistema di equazioni lineari Ω’(t(n)) ⋅ Δt = −Ω(t(n)) nelle incognite Δtµ. 13.4.2 IL METODO QUASI-NEWTON Partendo dalle equazioni CC nella forma canonica vista sopra: εαλtαλ= −〈αλ|exp(−T)Wexp(T)|HF〉 , è: Ωµ(t(n)) = 〈µ| exp(−T(n)) W exp(T(n))|HF〉+εµtµ Ω’µν(t(n)) = 〈µ| exp(−T(n)) [W,τν] exp(T(n))|HF〉+εµδµν In base a considerazioni basate sulla teoria delle perturbazioni, il termine diagonale è dominante in Ω’ su quello extra-diagonale. Trascurando quest’ultimo si può scrivere la equazione quasi-Newton: Δtµ = −Ωµ(t(n)) / εµ . (Bellissima!!) Il procedimento è robusto e può essere fatto partire da t(0) = 0. Si noti che al primo step le ampiezze sono date semplicemente da tµ = −〈µ|W|HF〉/εµ , analogamente a quanto avviene nella teoria perturbativa. La convergenza è abbastanza rapida, ma può essere accelerata usando tecniche DIIS, del tipo di quelle usate per l’accelerazione dei procedimenti HF-SCF (vedi § 10.6).

Page 35: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

35

13.5 La Lagrangiana variazionale CC e matrici densità rilassate Ripartiamo dalla formulazione Lagrangiana dell’energia vista nel § 4.2.8, e applichiamola a linked CC. λ↔t ; E(α,λ) ↔ E (α,t)= 〈HF|(H+αV)exp(T)|HF〉 ; f(α,λ)=0 ↔ {〈µ|exp(−T)(H+αV)exp(T)|HF〉=0} ; µ↔t (moltiplcatori Lagrangiani); L(α,λ,µ)=E(α,λ)+µ⋅f(α,λ) ↔ L(α,t,t) =〈HF|(H+αV)exp(T)|HF〉+∑ν tν 〈ν|exp(−T)(H+αV)exp(T)|HF〉; [0 = ∂ E(α,λ) ̸∂ λ+µ ⋅∂ f(α,λ) /∂ λ]λ=λ*(α) ↔

↔ [0 = 〈HF|(H+αV)τµexp(T)|HF〉+∑ν tν〈ν|exp(−T)[(H+αV), τµ]exp(T)|HF〉]t=t*(α). Le ultime equazioni definiscono i moltiplicatori t*. In assenza di perturbazioni, queste si riducono a: 0 = 〈HF|(H τµexp(T(0))|HF〉+∑ν tν

(0)〈ν|exp(−T(0))[H, τµ]exp(T(0))|HF〉 , e sono simili a quelle che definiscono il passo di avanzamento nel metodo di Newton, contenendo entrambe lo Jacobiano CC. Possiamo ora calcolare al primo ordine l’effetto di una perturbazione (teorema di Hellmann-Feynmann generalizzato): d E(α,t) ̸ d α 0 = d L(α,t,t) ̸d α 0 = 〈HF| V exp(T(0))|HF〉+∑ν tν

(0)〈ν|exp(−T(0)) V exp(T(0))|HF〉 , ovvero : d E(α,t) ̸d α 0 = 〈Λ | V | CC〉 , con 〈Λ| = 〈HF| + ∑ν tν

(0)〈ν|exp(−T(0)). Possiamo anche definire un’energia variazionale CC: Evar = 〈Λ | H | CC〉 che coincide con quella standard quando le equazioni CC sono soddisfatte (il secondo termine va a zero) ma altrimenti, essendo variazionale, è meno soggetta a problemi numerici. Inoltre può essere il punto di partenza per una tecnica CC variazionale (vedi § 13.6). Notiamo ancora che utilizzando la forma esplicita dell’Hamiltoniano: H = ∑PQ hPQ aP

+aQ + ½ ∑PQRS gPQRS aP†aR

†aS aQ + hnuc , possiamo scrivere Evar = ∑PQ hPQ 〈Λ | aP

+aQ |CC〉 + ½ ∑PQRS gPQRS 〈Λ | aP†aR

†aS aQ | CC〉 + hnuc . Identificando termine a termine questa espressione con quella esatta dell’energia in termini delle matrici densità a uno e due elettroni (vedi § 1.7: E = ∑PQ hPQ D PQ + ½ ∑PQRS gPQRS dPQRS ), possiamo definire gli elementi delle matrici densità Lagrangiane CC ovvero matrici densità rilassate o matrici densità variazionali come segue: ΛDPQ = 〈Λ | aP

+aQ | CC〉 ; ΛdPQRS = 〈Λ | aP†aR

†aS aQ | CC〉 Queste possono essere usate per calcolare i valori di aspettazione dei vari operatori ad uno e due elettroni, e forniscono risultati migliori rispetto alle corrispondenti matrici densità non rilassate: CCDPQ = 〈HF | aP

+aQ | CC〉 ; CCdPQRS = 〈HF | aP†aR

†aS aQ | CC〉. 13.6 Il metodo Equation-of-Motion (EOM)-CC Un approccio di tipo CC può essere usato anche per la ricerca di stati eccitati e di energie di eccitazione. L’idea è di scrivere lo stato generico |c〉 come ottenuto dallo stato di riferimento | CC〉 (che già descrive essenzialmente la correlazione dinamica) attraverso una opportuna cl di stati ottenuti applicando ad esso degli eccitatori : | cN 〉 = ∑µ cµN τµ | CC 〉 = exp(T) [∑µ cµN τµ] |HF〉 . Lo stato | CC〉 corrisponde a | c0 〉 con cµ0 = δµ0 . La ricerca dei coefficienti incogniti e delle energie associate agli altri stati passa attraverso un metodo simil-variazionale (vedi § 13.6.2). Si usa per comodità un riferimento bi-ortogonale (vedi § 1.9). 13.9 Tecniche CC spin-adapted

Page 36: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

36

Capitolo 14. Teoria Perturbativa Si approfondiscono le tecniche accennate nel § 5.8. 14.1 Teoria perturbativa Rayleigh-Schrödinger (RSPT) Definizioni: H = H0 + U ; H|0〉 = E |0〉 ; E = ∑k E(k) ; |0〉 = ∑k |0 (k)〉 . Introducendo la normalizzazione intermedia: 〈0 (0)|0 (k)〉 = 0 (per k>0) , ed eguagliando i termini di ( H0 + U )(∑k |0 (k)〉 ) = (∑k E(k)) ( ∑k |0 (k)〉 ) fino all’ordine n, si ottiene la master equation: (H0 − E(0)) |0 (n)〉 = −U |0 (n-1)〉 + ∑k=1

n E(k) |0 (n-k)〉 , con: E(n) = 〈0 (0)| U |0 (n-1)〉

Usando il proiettore P = 1− |0 (0)〉〈0 (0)| si può riscrivere la master equation nella forma più esplicita: |0 (n)〉 = − P (H0 − E(0))-1 P (U |0 (n-1)〉 − ∑k=1

n-1 E(k) |0 (n-k)〉)

Sono quelle evidenziate le equazioni fondamentali della RSPT. La correzione all’energia ed alla funzione d’onda all’ordine n si ottengono dalle stesse quantità fino all’ordine n-1. In realtà si possono riarrangiare le equazioni in modo da arrivare alla regola 2n+1 di Wigner: L’energia all’ordine 2n+1 è ottenibile dalle correzioni alla funzione d’onda fino all’ordine n. 14.1.3 IL FUNZIONALE DI HYLLERAAS Si tratta di una potente tecnica “variazionale” per ottenere le energie E(2n) in termini dei coefficienti della funzione d’onda fino all’ordine n. 14.2 Teoria perturbativa MP (MPTT) La partizione “imperturbato-perturbato” viene effettuata come nel § 5.8. Viene qui fornita la formulazione esplicita delle correzioni MP sull’energia e sulla funzione d’onda agli ordini più bassi nel caso unrestricted (formalmente il più semplice). N.B. La tecnica “Torino” per il calcolo della matrice densità in CRYSCOR è basata sull’equazione standard: D(1)

PQ = 〈R(1)|aP†aQ|R(1)〉 /〈R(1)|R(1)〉 , con : |R(1)〉 = |HF〉+|MP1〉, essendo |MP1〉 una lc di bieccitate:

|MP1〉 = ∑µ2 t(1)µ2 τµ2 |HF〉 [ τµ2 = aA

†aI aB†aJ ; t(1)

µ2 = 〈HF| aA†aI aB

†aJ H |HF〉 / ( εI+εJ−εA−εB ) ]. Quella “Regensburg” è basata sull’equazione “Lagrangiana” (vedi § 13.5): D(1)

PQ = 〈Λ (1)|aP†aQ|R(1)〉, essendo 〈Λ (1)| definita, in linea di principio, dall’equazione :

Evar(2) = 〈Λ(1)|H|R(1)〉. In realtà se ne usa una forma semplificata, non totalmente variazionale (perché

nella Lagrangiana non sono inclusi alcuni vincoli, in particolare la validità del teorema di Brillouin). Mentre la prima non è “size-extensive” (e richiede perciò correzioni ad hoc), la seconda lo è.

Page 37: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

37

14.3 Teoria perturbativa CC (CCPT) Si tratta di una variante della MPTT, in cui di nuovo si introduce un potenziale di fluttuazione W come differenza tra l’Hamiltoniana vera e quella HF. La forma dell’energia e quella della funzione d’onda sono però prese dalla teoria CC “completa” (che coincide con la FCI): E = 〈HF|exp(−T)Hexp(T)|HF〉 ; 0=〈µ|exp(−T)Hexp(T)|HF〉, ovvero, ponendo OT= exp(−T)Oexp(T): E - Enuc= 〈HF|(fT+WT)|HF〉 ; 0=〈µ|(fT+WT)|HF〉 . Dopo aver scritto: T= T(1)+T(2)+T(3)+ ... e sviluppato gli esponenziali, si risolvono in sequenza le equazioni risultanti includendo tutti i termini fino all’ordine n (T(i) vale i, f vale 0, W vale 1). Apparentemente si tratta di una complicazione, ma in realtà si possono ottenere diversi vantaggi, tra cui una più facile dimostrazione del carattere size-estensivo delle energie a tutti gli ordini, ed una formulazione più elegante della Lagrangiana ai vari ordini. Inoltre, il trattamento qui sviluppato è alla base del formalismo adottato nel paragrafo successivo. 14.4 Teoria perturbativa MP per sistemi closed-shell Vedi sopra. 14.6 Trattamento perturbativo della funzione d’onda CC La tecnica standard CC (capitolo 13) e la tecnica perturbativa CC (§ 14.3) sono basate sulla stessa forma della funzione d’onda e sulla stessa espressione dell’energia, ma usano due distinti tipi di gerarchia (e troncamenti). Nella prima è l’ordine d’eccitazione, nella seconda l’ordine della perturbazione. Sono possibili (e utili) dei metodi ibridi. Un esempio è quello del trattamento perturbativo delle triple eccitazioni in CCSD(T).

Capitolo 15. Tecniche a confronto Sulla scorta di esempi molecolari, e sulla base dei valori sperimentali e calcolati di osservabili diverse, vengono messi a confronto diversi approcci alla soluzione del problema (potenza, precisione, efficienza computazionale...).

Page 38: Trygve HELGAKER Poul JØRGENSEN Jeppe OLSEN Molecular Electronic-Structure Theory ... · 2009-10-30 · Molecular Electronic-Structure Theory Wiley, Chichester, 2000 . 2 Note introduttive

38

Possibili complementi e approfondimenti 1) Lo spazio di Fock per sistemi periodici nell’approssimazione BvK 2) Formulazione locale dei metodi standard 3) Metodi esplicitamente correlati (F12) 4) Calcolo Lagrangiano della matrice densità per metodi non variazionali 5) Il problema degli “intruder states” in calcoli variazionali 6) Formulazione diagrammatica degli approcci standard 7) I “piccoli termini dell’hamiltoniana” e le spettroscopie magnetiche