teoria della relativita ristretta.` parte seconda

48
Capitolo 6 Teoria della relativit` a ristretta. Parte seconda: particella in campo elettromagnetico (trattazione covariante) 6.1 Le equazioni di Maxwell e i potenziali elettromagneti- ci Nel capitolo precedente abbiamo discusso in maniera elementare (seguendo sostanzial- mente la esposizione divulgativa di Einstein) la cinematica relativistica, mostrando in particolare come il principio di costanza della velocit` a della luce conduce a postulare che lo spaziotempo ` e munito di un opportuno prodotto scalare pseudoeu- clideo. Abbiamo poi mostrato come questa geometrizzazione dello spaziotempo induca spontaneamente (attraverso il principio di Hamilton dell’azione stazionaria) a fornire una espressione per la lagrangiana della particella libera, la cui conseguen- za pi` u rilevante ` e che esiste per ogni particella una energia a riposo, data dalla cele- bre formula di Einstein E = mc 2 . Questi argomenti corrispondono sostanzialmente a quelli discussi nell’articolo del 1905 di Einstein: la cinematica nella prima parte (paragrafi da 1 a 5), la dinamica nell’ultimo paragrafo, il decimo. 1 ) Nel presente capitolo ci occupiamo invece, almeno parzialmente, dell’analogo della seconda parte dell’articolo originario di Einstein (paragrafi dal 6 al 9), che ` e dedicata all’elettrodinamica. La trattazione viene qui svolta a due livelli. In una prima parte la trattazione viene svolta a livello “elementare”, ovvero senza fare ri- 1 Si osservi per ` o che la trattazione della dinamica da parte di Einstein ` e alquanto diversa da quella che ` e stata svolta qui, seguendo Planck e Levi–Civita. Si noti in particolare che la relazione E = mc 2 viene data da Einstein non nell’originario articolo del 1905, dal titolo L’elettrodinamica dei corpi in movimento, ma in una brevissima nota successiva, dal titolo L’inerzia di un corpo dipende dal suo contenuto di energia?, in cui si fa un uso essenziale delle propriet` a del campo elettromagnetico, anzich´ e della pura dinamica di una particella. 269

Upload: others

Post on 12-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Teoria della relativita ristretta.` Parte seconda

Capitolo 6

Teoria della relativit a ristretta.Parte seconda: particella incampo elettromagnetico(trattazione covariante)

6.1 Le equazioni di Maxwell e i potenziali elettromagneti-ci

Nel capitolo precedente abbiamo discusso in maniera elementare (seguendo sostanzial-mente la esposizione divulgativa di Einstein) la cinematica relativistica, mostrandoin particolare come il principio di costanza della velocita della luce conduce apostulare che lo spaziotempoe munito di un opportuno prodotto scalare pseudoeu-clideo. Abbiamo poi mostrato come questa geometrizzazione dello spaziotempoinduca spontaneamente (attraverso il principio di Hamilton dell’azione stazionaria)a fornire una espressione per la lagrangiana della particella libera, la cui conseguen-za piu rilevantee che esiste per ogni particella una energia a riposo, data dalla cele-bre formula di EinsteinE = mc2. Questi argomenti corrispondono sostanzialmentea quelli discussi nell’articolo del 1905 di Einstein: la cinematica nella prima parte(paragrafi da 1 a 5), la dinamica nell’ultimo paragrafo, il decimo.1)

Nel presente capitolo ci occupiamo invece, almeno parzialmente, dell’analogodella seconda parte dell’articolo originario di Einstein (paragrafi dal 6 al 9), cheededicata all’elettrodinamica. La trattazione viene qui svolta a due livelli. In unaprima parte la trattazione viene svolta a livello “elementare”, ovvero senza fare ri-

1Si osservi pero che la trattazione della dinamica da parte di Einsteine alquanto diversa da quellachee stata svolta qui, seguendo Planck e Levi–Civita. Si noti in particolare che la relazioneE = mc2

viene data da Einstein non nell’originario articolo del 1905, dal titoloL’elettrodinamica dei corpiin movimento, ma in una brevissima nota successiva, dal titoloL’inerzia di un corpo dipende dalsuo contenuto di energia?, in cui si fa un uso essenziale delle proprieta del campo elettromagnetico,anziche della pura dinamica di una particella.

269

Page 2: Teoria della relativita ristretta.` Parte seconda

270 Andrea Carati e Luigi Galgani

corso al calcolo tensoriale, come d’altra parte avviene nella trattazione di Einstein.Preliminarmente, verranno forniti dei richiami sulle equazioni di Maxwell in mododa costruire un ponte con la trattazione familiare allo studente dai corsi di FisicaGenerale.

In una seconda parte le equazioni di Maxwell e le equazioni di moto per unaparticella in campo elettromagnetico vengono poi discusse con i metodi del calco-lo tensoriale (che Einstein utilizzo in una fase successiva, quando ne ebbe bisognoper formulare la relativita generale).E ovvio che questa trattazione richiederebbedunque un lungoexcursusdi tipo geometrico sul calcolo tensoriale, che nel pre-sente corso non abbiamo la possibilita di svolgere in maniera del tutto soddis-facente. Si deve dunque compiere un difficile compromesso. Siamo fiduciosi chela scelta qui compiuta possa risultare positiva.

6.1.1 Le equazioni di Maxwell (con sorgenti assegnate)

Le equazioni di Maxwell (1873) costituiscono un miracolo della storia della fisica,sı da fare esclamare enfaticamente a Boltzmann, citando il Faust di Goethe:“Wares ein Gott welcher diese Zeichen schrieb ?”(Fu un Dio che scrisse queste righe?). Esse compendiano in linea di principio tutto l’elettromagnetismo. In partico-lare, il termine descrivente la“corrente di spostamento”, introdotto da Maxwellper puri motivi di consistenza interna della teoria, fa sı che le equazioni prevedanol’esistenza di onde elettromagnetiche nel vuoto, che si propagano esattamente conla velocita della lucec, sicche l’ottica stessa viene ridotta a fenomeno elettromag-netico. La propagazione di onde elettromagnetiche con frequenze di gran lungainferiori a quelle ottiche venne successivamente osservata da Hertz (su suggeri-mento di Helmholtz), e questo fatto diede poi origine a tutte le applicazioni cheben conosciamo: la radio, la televisione...2

E noto che in elettromagnetismo si considerano quattro campi descritti dai vet-tori E,D,B,H, che pero nel vuoto si riducono a due soli, perche si haD = E,B = H. Noi ci limiteremo alle equazioni nel vuoto, e faremo riferimento ai campiE ed H che chiameremo semplicementecampo elettricoe campo magnetico. Siammette chel’azione ponderomotricedei campi (cioe l’azione meccanica, la forza,esercitata sulla materia) sia data dallaforza di Lorentz

F(em) = e(E+vc×H) (6.1.1)

su una particella di carica “e” e velocita v; inversamente, la distinzione tra cam-po elettricoE e campo magneticoH e proprio la circostanza che il primo agisceanche su una particella ferma, mentre il secondo produce una forza proporzionalealla velocita della particella,3 e dunque non agisce su una particella ferma. Proprio

2I lavori di Hertz sono riprodotti in un volume della Dover.3Almeno per particelle non dotate di momento magnetico intrinseco.

Page 3: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 271

questa circostanza mostra che la distinzione tra campo elettrico e campo magneti-co (ovvero il corrispondente spezzamento della forza di Lorentz)e relativa e nonassoluta (cioe dipende dal sistema di riferimento). Su questo punto importanteritorneremo piu sotto, mostrando che i campiE edH costituiscono una unita (Ten-sore di Faraday, di ordine 2 ed emisimmetrico) nello spaziotempo, nello stessosenso in cui costituisce una unita un vettore in IRn, che e un oggetto assoluto,ovvero indipendente dalla base eventualmente scelta (mentre le componenti delvettore non sono assolute, ma dipendono dalla base). Ma per ora procediamo inmaniera elementare.

Le equazioni di Maxwell nel vuoto hanno la forma (usiamo il sistema CGSelettromagnetico, forse poco familiare allo studente, ma la scelta delle unita e deltutto irrilevante)

div H = 0

rot E+1c

∂H∂t

= 0 (6.1.2)

div E = ρ

rot H− 1c

∂E∂t

= j/c , (6.1.3)

doveρ = ρ(t,x), j = j(t,x) sono ladensita di caricae ladensita di corrente, che sipensano assegnate funzioni di(t,x) (materia data o assegnata, come si usa dire),mentrec e la velocita della luce nel vuoto.4 Le prime due equazioni si diconocostituire lacoppia omogenea(non hanno secondi membri), mentre le altre duecostituiscono lacoppia non omogenea, o con sorgenti. Come si vede, si tratta diequazionilineari nei campi, sicche vale ilprincipio di sovrapposizione(chee unteorema): “i campi generati da(ρ1+ρ2, j1+ j2) sono la somma dei campi creati da(ρ1, j1) e da(ρ2, j2)”.

OsservazioneCome detto sopra, abbiamo qui usato il sistema CGSelettromagnetico, comune a tutti i grandi trattati di fisica teorica, cometipicamente il classico testo di Landau e Lifshitz. L’elemento piucaratteristicoe forse il fatto che tale sistema fa intervenire nelle equazionidi Maxwell la velocita della luce c, mentre nelle equazioni scritte nel-la forma probabilmente nota agli studenti5 intervengono la costante

4Dal punto di vista mnemonico,e semplicissimo ricordare in quale modoc figuri nelle equazioni.Dove appare il tempot, lı c’e semprec, in maniera che appaia la formazionect (sicche si potrebbeprendere come variabile in luogo del tempo la quantita τ = ct). Per questo motivo avviene ancheche la velocita v appare sempre nella formav/c (si pensiv come la derivata della posizione di unaparticella rispetto al tempo), e lo stesso avviene per la corrente o la densita di corrente (perche ladensita di corrente dovuta a una particellae proporzionale alla sua velocita).

5Ovvero, divB = 0, rot E+ ∂B∂t = 0, div D = ρ , rot H =

(j + ∂D

∂t

), B = µ0H , D = ε0E. Si veda

ad esempio R. Becker,Electromagnetic fields and interactions, Dover (New York, 1964), Sez. 53,pag. 257.

Page 4: Teoria della relativita ristretta.` Parte seconda

272 Andrea Carati e Luigi Galgani

dielettricaε0 e la permeabilita magnetica µ0 del vuoto. Questa intro-duzione di ce resa possibile dal fatto che la quantita 1/(µ0ε0) ha le di-mensioni di una velocita al quadrato, e il suo valore risulta essere pro-prio c2, una circostanza questa che era nota prima di Maxwell, e chefaceva gia presagire che l’elettricita e il magnetismo potessere essereconnessi anche con l’ottica. Cio e proprio vero. Infatti, le equazioni diMaxwell costituiscono anzitutto una generalizzazione delle equazioniche riassumono l’elettrostatica e la magnetostatica al caso di campidipendenti dal tempo, in modo da includere la legge di induzione diFaraday. Maxwell pero aggiunge nella seconda equazione inomo-genea un opportuno termine (la “corrente di spostamento”1

c∂E∂t ), il

quale ha la conseguenza che si hanno onde elettromagnetiche che, nelvuoto, si propagano proprio con velocita c, la stessa della luce, siccheanche l’ottica viene incorportata nell’elettromagnetismo. Questi fattivengono richiamati qui sotto.

Cominciamo con l’osservare che l’elettrostatica e la magnetostatica si otten-gono dalle equazioni di Maxwell come casi particolari statici (in cui cioe ∂H

∂t = 0,∂E∂t = 0, ∂ρ

∂t = 0, ∂j∂t = 0). Infatti in tal caso le equazioni (6.1.2) e (6.1.3), oppor-

tunamente redistribuite, si riducono alle due coppie (conρ e j indipendenti daltempo)

rot E = 0

div E = ρ elettrostatica

div H = 0

rot H = j/c magnetostatica.

Ricordiamo che in elettrostatica e in magnetostatica si introducono rispetti-vamente ilpotenziale scalareΦ (rotE = 0⇒ ∃V : E = −gradV) e il potenzialevettoreA (rotH = 0 ⇒ ∃A : H = rotA), entrambi non definiti univocamente (sipuo scegliereA in modo che divA = 0; si veda piu sotto), e dunque l’elettrostaticae compendiata nell’equazione6

−∆V = ρ

e la magnetostatica nell’equazione7

−∆A = j/c .

6Si introduce l’operatore “laplaciano”∆ := divgrad= ∂xx + ∂yy + ∂zz in coordinate cartesiane

ortogonali. Qui sie usata la notazione∂x = ∂∂x , ∂2

xy = ∂2

∂x∂y e cosı via.7Si ricordi l’identita rot rot= grad div−∆, su cui diremo qualcosa piu sotto.

Page 5: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 273

Nella sostanza, l’elettrostatica nel vuoto (e nello spazio infinito – altrimenti sihanno problemi di condizioni al contorno) si riduce alla legge di Coulomb, e lamagnetostatica nel vuoto si riduce alla Legge di Biot e Savart, che puo leggersidall’equazione rotH = j/c mediante il teorema di Stokes.

Nel caso generale (non statico) si passa alle equazioni di Maxwell cambiandol’equazione rotE = 0 nell’equazione rotE + 1

c∂H∂t = 0, che traduce in termini dif-

ferenziali la legge di induzione di Faraday (una variazione di campo magnetico pro-duce un certo ben definito campo elettrico). Si pensi all’analogia con rotH = j/c.Qui si ha rotE =−1

c∂H∂t : quindi, see assegnato∂H

∂t , questo campo svolge un ruoloanalogo a quello svolto daj nell’equazione di Biot e Savart, e quindi produce uncerto campo elettricoE analogo al campo magneticoH di Biot e Savart creato daj .

Infine, nel passaggio all’elettromagnetismo si cambia anche l’equazione rotH =j/c nell’equazione rotH = 1

c

(j + ∂E

∂t

)che si legge nel modo seguente: una vari-

azione di campo elettrico produce un campo magnetico esattamente (a parte unsegno) come nella legge di Faraday una variazione di campo magnetico produceun campo elettrico. In altri termini,1c

∂E∂t agisce come una corrente elettrica e viene

detto corrente di spostamento8. Proprio questo termine, introdotto da Maxwellper pure ragioni teoriche, fa sı che esistano le onde elettromagnetiche nel vuoto(l’analoga proprieta in presenza di materia verra dimostrata piu sotto facendo usodei potenziali elettromagnetici). Si ha infatti la

Proposizione 1 In assenza di materia (ρ = 0, j = 0) i campiE,H soddisfano nelvuoto l’equazione di d’Alembert9

�E = 0, �H = 0(� =

1c2

∂2

∂t2 −∆)

.

Dimostrazione. Si prende il rotore della seconda equazione omo-genea (6.1.2), ottenendorot rotE = −1

c∂∂t rotH (si scambiano∂

∂t e rotper il teorema di Schwartz). Si sostituisce poirotH prendendolo dal-la seconda equazione inomogenea (6.1.3) (ma conj = 0); usandorot rot = grad div−∆ e anchedivE = 0, si ottiene−∆E = − 1

c2∂2E∂t2 .

Analogamente si trova l’equazione perH prendendo il rotore dellaseconda equazione inomogenea (conj = 0). Q.E.D.

Resta ora da capire di dove venga la necessita di aggiungere il termine con lacorrente di spostamento nella seconda equazione inomogenea. Cio e dovuto alfatto che si richiede, come nella meccanica dei sistemi materiali, che la densita dicaricaρ e la densita di correntej soddisfinol’equazione di continuita

∂ρ∂t

+div j = 0 . (6.1.4)

8Perche in effetti si dovrebbe considerare1c∂D∂t , e il vettoreD veniva chiamato “spostamento”

elettrico.9L’operatore� viene chiamato “quadratello” oppure “dalembertiano”.

Page 6: Teoria della relativita ristretta.` Parte seconda

274 Andrea Carati e Luigi Galgani

Ora, in magnetostatica, prendendo la divergenza nell’equazione rotH = j/c, poichediv rot= 0 si trova divj = 0. Se invece, seguendo Maxwell, poniamo rotH− 1

c∂E∂t =

j/c, abbiamo divj = − ∂∂t divE, e dall’equazione divE = ρ otteniamo l’equazione

di continuita.Dal punto di vista matematico, si avrebbe l’interessante problema di studiare

il problema di Cauchyper i campi, e l’ancor piu interessante problema di studiarevari problemi al contorno; ma di questi problemi qui non ci occupiamo.

Osservazione. Il principio di relativit a e le equazioni di Maxwell:non assolutezza della distinzione tra campo elettrico e campo mag-netico. Come introduzione al problema dell’applicazione del princi-pio di relativita all’elettromagnetismo, puo essere utile considerare ilseguente semplice esempio. Vogliamo determinare i campi elettricoe magnetico prodotti da un filo contenente una densita di carica ρ(uniforme e indipendente dal tempo), anzitutto rispetto a un sistemainerziale K solidale col filo, e poi rispetto a un altro sistema inerzialeK′, in moto rispetto a K lungo la direzionde el filo.

Naturalmente stiamo ammettendo, conformemente al principio di rel-ativita, che in tutti i sistemi inerziali valgano le equazioni di Maxwellin cui figuri la medesima costante c. Anzie proprio questa la for-mulazione pregnante di quello che avevamo chiamato principio dicostanza della velocita della luce, principio che nel capitolo prece-dente avevamo applicato in una forma ridotta (costanza della veloc-ita di propagazione dei raggi di luce, anziche costanza della veloc-ita di propagazione delle onde elettromagnetiche o, meglio ancora,anziche invarianza in forma delle equazioni di Maxwell). Infatti ilproblema che si poneva prima del 1905 era come dovessero cambiarele equazioni dell’elettromagnetismo al cambiare del sistema di rifer-imento, cioe passando da un supposto sistema privilegiato (in qui-ete rispetto all’etere) a ogni altro sistema traslante di moto uniformerispetto a quello. Invece secondo il principio di relativita tutti i siste-mi inerziali sono equivalenti anche rispetto alle equazioni di Maxwell,che devono mantenere la stessa forma in ogni sistema inerziale (econtenere la medesima costante c).

Il problema di come debbano trasformarsi i campi verra discusso inun prossimo paragrafo. Qui, come esercizio preliminare, vogliamorestringerci a mettere in luce come il principio di relativita nel sen-so suddetto comporti che la distinzione tra campo elettrico e campomagnetico non sia assoluta, ma dipenda dal particolare sistema diriferimento considerato.

Nell’esempio che stiamo discutendo, ci si riduce a considerare le equazionistatiche, e quelle inomogenee danno

divE = ρ, rotH = j/c.

Page 7: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 275

Nel sistema “fisso (o stazionario)” (ovvero solidale con il filo), si hauna certa densita di carica, mentre la densita di correntee nulla,j = 0.Dunque si ha un certo campo elettricoE 6= 0, mentre il campo mag-neticoe nullo,H = 0 Ma, se osserviamo il filo da un sistema di rifer-imento inerziale K′ in moto rispetto al filo stesso, il filo appare comecontenente cariche in moto uniforme. Dunque per il sistema “mobile”si ha una certa densita di caricaρ′ 6= 0 che potremmo calcolare, men-tre per la densita di corrente sappiamo che essae certamente diversada quella del sistema “fisso”, perche e nonnulla,j ′ 6= 0. In conseguen-za, secondo la legge di Biot–Savart per il sistema “mobile” si ha uncerto campo magnetico nonnulloH 6= 0. Dunque nel primo sistema sihaE 6= 0,H = 0 mentre nel secondo si haH 6= 0. In conclusione, men-tre nel primo sistema, solidale col filo, si ha solo campo elettrico, nelsistema mobile rispetto al filo si ha invece anche un campo magnetico.La distinzione tra campo elettrico e campo magnetico none assoluta,ma dipende dal sistema di riferimento.

In un prossimo paragrafo mostreremo che questo fatto corrisponde alfatto cha anche la distinzione tra densita di carica e densita di correntenone assoluta, ma dipende dal sistema di riferimento, analogamente aquanto avviene per le componenti di un vettore al variare del sistemadi riferimento: il vettoree una quantita assoluta, indipendente dalsistema di riferimento, mentre ne dipendono le componenti (la primacomponente di un vettore puo essere nulla in un sistema e non in unaltro). In particolare, il principio di relativita permette di ottenerenell’esempio sopra considerato (in cui si haρ 6= 0 e j = 0) le densitaρ′ e j ′ e vedremo che si trovaρ′ = γρ, jx′ =−γρ, j′y = j ′z = 0.

Osservazione: Il problema della self force e l’equazione di Abraham–Lorentz–Dirac. Facciamo qui un ultimo commento, riguardante ilproblema della autointerazione delle particelle cariche attraverso ilcampo elettromagnetico da esse prodotto. Osserviamo anzitutto che,se si hanno delle particelle cariche, ad esse vengono associate certedensita di carica e di corrente, e dunque le particelle “creano”, comesorgenti nelle equazioni di Maxwell inomogenee, certi campi elet-tromagnetici. Ma d’altra parte le particelle subiscono (attraversola forza di Lorentz) anche delle forze dovute ai campi, e quindi inqualche modo anche una forza dovuta ai campi creati da esse stesse.E questo il cosiddettoproblema dell’autocampo, o dellaself force. Sicapisce cosı come nel discutere il moto di particelle in campi elet-tromagnetici si distingue allora tra una trattazione semplificata e unatrattazione generale. Il problema semplificato consiste nello studi-are il moto di particelle con campi assegnati. E questa l’approssi-mazione in cui si pensa che i campi assegnati siano talmente intensida non essere sostanzialmente modificati dai campi creati dalle par-

Page 8: Teoria della relativita ristretta.` Parte seconda

276 Andrea Carati e Luigi Galgani

ticelle stesse. Ede questa proprio l’approssimazione (campi dati) incui lavoreremo sotto.

Ma il problema piu difficilee invece quello in cui si studia il moto delleparticelle quando si tenga conto anche dei campi creati dalle parti-celle stesse (problema della self force). Questo problema fu affrontatoattorno al 1903 da Abraham e Lorentz e poi in ambito relativistico,nel 1938, da Dirac.10 Si giunge in tal modo alla cosiddettaequazionedi Abraham–Lorentz–Dirac, di cui non abbiamo qui il tempo di occu-parci. Facciamo solo osservare che a tale equazione sono associatiproblemi di principio a tutt’oggi non ancora completamente risolti,neanche nel corrispondente problema quantistico (si veda Feynman,Manuale di Fisica, vol II cap. 27). Si pensi che la lagrangiana e lahamiltoniana classiche per il sistema costituito dal campo elettromag-netico e da cariche puntiformi sono state scritte solo pochissimi annifa.11

6.1.2 I potenziali elettromagnetici

Un obiettivo centrale che ci poniamo in questo capitoloe quello di scrivere la la-grangiana, la hamiltoniana e l’azione hamiltoniana di una particella in un campoelettromagnetico assegnato (mentre nel capitolo precedentemente avevamo studi-ato la particella libera). Per affrontare tale problema avremo pero bisogno deipotenziali elettromagnetici, che ora ci apprestiamo ad introdurre.

Proposizione 2 Si considerino le equazioni di Maxwell omogenee (6.1.2) ed in-omogenee (6.1.3). Allora si ha:

i) Le equazioni di Maxwell omogenee (6.1.2) si traducono nella seguente pro-prieta: esistono unpotenziale scalareV e unpotenziale vettoreA, che fornisconoi campiE,H mediante le relazioni

H = rotA

E = −gradΦ− 1c

∂A∂t

. (6.1.5)

ii) I potenziali Φ,A non sono univocamente determinati, e l’arbitrarieta e re-golata nel modo seguente: dati dei potenziali buoniΦ,A, ogni altra coppia dipotenziali buoniΦ′,A′, si ottiene mediante le relazioni

A′ = A +gradχ

Φ′ = Φ− 1c

∂χ∂t

(6.1.6)

10P.A.M. Dirac,Classical theory of radiating electrons, Proc. Royal Soc. (London) A167, 148–168 (1938). Si noti che questo fondamentale lavoro di Dirac, concepito e sviluppato in ambito com-pletamente classico, venne scritto circa 10 anni dopo la formulazione dell’elettrodinamica quantistica!

11Si veda M. Marino,Classical electrodynamics of point charges, Annals of Physics301, 85(2002).

Page 9: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 277

attraverso una funzioneχ(t,x) arbitraria. Quando si compie uan scelta si usa direchee stato scelto un“gauge”. In particolare, i potenziali possono essere scelti inmaniera di soddisfare la cosiddetta “condizione di Lorentz” (gauge di Lorentz)

divA +1c

∂Φ∂t

= 0 (6.1.7)

oppure la condizione (gauge di Coulomb)

divA = 0 . (6.1.8)

iii) In termini dei potenziali, le equazioni di Maxwell inomogenee (6.1.3) pren-dono, nel gauge di Lorentz, la forma delle equazioni delle onde con sorgenti,precisamente

�Φ = ρ�A = j/c . (6.1.9)

Dimostrazione. La dimostrazione procede nel modo seguente.

i) Le formule che esprimono i campi attraverso i potenziali sono unaimmediata conseguenza delle equazioni di Maxwell omogenee (6.1.2),quando si ricordino le proprieta che un campo solenoidale (ovverocon divergenza nulla) puo sempre esprimersi come il rotore di un op-portuno campo vettoriale, e che un campo irrotazionale (ovvero conrotore nullo) puo sempre esprimersi come il gradiente di un opportunocampo scalare12. Dunque dalla prima equazionedivH = 0 segue cheesiste un campo vettorialeA tale cheH = rotA, chee la prima delle(6.1.5). Si sostituisce allora nella seconda equazione omogenea, chediviene (scambiandorot con ∂

∂t )

rot

(E+

1c

∂A∂t

)= 0,

e dunque esiste un campo scalareΦ tale che si haE+ 1c

∂A∂t =−gradΦ,

ovvero la seconda delle (6.1.5).

ii,a) E ovvio che i potenziali non siano univocamente definiti, percheseA va bene, allora va bene ancheA′ dato da

A′ = A +gradχ

con un arbitrariaχ (perche rot gradχ = 0, sicche rot A′ = rotA). Og-ni scelta della funzioneχ si dice costituire la scelta di un “gauge”.

12Ammettiamo qui di essere in un dominio opportuno: va bene ad esempio il caso in cui il dominioe tutto IR3. La dimostrazione di questi fattie banalissima quando si usi la trasformata di Fourier.Questo verra esposto in un’appendice attualmente non ancora scritta.

Page 10: Teoria della relativita ristretta.` Parte seconda

278 Andrea Carati e Luigi Galgani

Tuttavia, si richiede che, al variare della scelta diχ (al variare delgauge), non variino i campi,13 e cio gia avviene perH perche H =rotA = rotA′. Ma nel passaggio daA ad A′, nella formula data,ovvero la seconda delle (6.1.5), varierebbeE, e quindi occorre con-trobilanciare la variazione diA con una opportuna variazione diΦ inmodo da ottenere cheE non cambi.E immediato constatare che l’ap-propriata sceltae V′ = Φ− 1

c∂χ∂t . Quindi l’arbitrarieta dei potenziali

e regolata dalla relazione (6.1.6) con una funzioneχ arbitraria.

ii,b) Mostriamo ora come maie possibile soddisfare la condizione diLorentz. Assegnati dei potenzialiA,Φ, sia

divA +1c

∂Φ∂t

:= f (t,x) 6= 0

e ricerchiamo un’opportunaχ in modo che siadivA′+ 1c

∂Φ′

∂t = 0. Masi ha, in virtu delle (6.1.6),

divA′+1c

∂Φ′

∂t= divA +

1c

∂Φ∂t

+∆χ− 1c2

∂2χ∂t2 = f (t,x)−�χ .

Dunque la condizione di Lorentze soddisfatta se si sceglieχ in modoche sia

�χ = f

con f assegnata, ede ben noto che cio e sempre possibile14. In modoanalogo si dimostra che si puo sodisfare la condizione di Coulomb.

iii) Veniamo infine alle equazioni delle onde per i potenziali, come im-mediata traduzione delle equazioni di Maxwell inomogenee nel gaugedi Lorentz. Dalla prima equazione inomogeneadivE = ρ, introducen-doE in termini di potenziale, si ha

ρ = divE =−div (gradΦ+1c

A) =−∆Φ− 1c

∂∂t

divA ,

sicche, usando la condizione di Lorentz, si trova

ρ =−∆Φ+1c2

∂2V∂t2 = �Φ.

13In altri termini, si ammette che i campi siano “oggetti fisici”, vale a dire osservabili, e quindiben definiti come funzioni dit ed x. I potenziali invece, essendo non univocamente determinati,vengono considerati come strumenti “nonfisici”, aventi una pura utilita matematica. In realta, questoatteggiamento tradizionale verso i potenzialie parso scosso dopo la scoperta del cosiddetto “effettoAharonov–Bohm”, che a prima vista sembrerebbe comportare che si debba attribuire significato fisicoai potenziali. Cio tuttavia none vero. Rimandiamo la discussione ad una appendice (non ancorascritta).

14Anche questo fattoe ovvio quando si usa la traformata di Fourier.

Page 11: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 279

Analogamente, introducendo i potenziali nella seconda equazione in-omogenea, si ha

j/c = rotH− 1c

E = rot rotA +1c(gradΦ+

1c

A) =

= grad divA−∆A +1c

gradΦ+1c2 A =

= �A +grad(divA +1c

Φ) = �A

in virtu della condizione di Lorentz. Q.E.D.

6.2 Equazioni di moto di una particella in campo elet-tromagnetico; lagrangiana, hamiltoniana ed azione.Trattazione elementare in forma tridimensionale

Abbiamo gia detto che in ambito non relativistico si ammette che la forza agentesu una particella carica (di caricae) e la forza elettromagnetica di LorentzF(em)

definita dalla (6.1.1), ovvero

F(em) = e(

E+vc×H

).

Si deve a K. Schwartschild15 la seguente osservazione:

Proposizione 3 La forza di Lorentz ammette un potenziale generalizzato (o poten-ziale elettromagnetico o potenziale elettrocinetico) V(em) definito in termini deipotenzialiΦ edA da

V(em) = e(

Φ− vc·A

),

nel senso che si ha1e

F(em) =ddt

∂V(em)

∂v− ∂V(em)

∂x.

Dimostrazione. Si ha ∂V(em)

∂v =−A/c, e dunque16

ddt

∂V(em)

∂v=−1

c

[∂A∂t

+(v ·grad)A].

15Lo stesso cui si deve la scoperta del campo gravitazionale “creato” da una particella puntiformenell’ambito della relativita generale. Questo risuktato venne illustrato in due famosi lavori scritti nel1916 nell’ospedale di guerra di Brno, dove Schwartschild morı poco dopo.

16Si usa, come al solitod fdt = ∂ f

∂t + (gradf ) · x se f = f (t,x) e si ammettex = x(t) sicche siintroduce la funzionef (t) := f (t,x(t)). Per un abuso di linguaggio si denota poif ≡ f . Nel nostrocaso, invece dif si ha il vettoreA e si considera separatamente ogni componenteAi di A. Persemplicita di notazione scriviamo(gradAi) ·v≡ (v ·grad)Ai , esattamente come si fa per le equazionidi Eiulero dei fluidi perfetti.

Page 12: Teoria della relativita ristretta.` Parte seconda

280 Andrea Carati e Luigi Galgani

D’altra parte si ha

ddx

V(em) ≡ gradV(em) = gradΦ− 1c

grad(v ·A)

Si usa infine l’identita17

grad(v ·A) = (v ·grad)A +v× rotA,

sicche

ddt

∂V(em)

∂v− ∂V(em)

∂x=−gradΦ− 1

c∂A∂t

+vc× rotA = E+

vc×H .

Q.E.D.

Ora, gia in ambito non relativistico era ben noto chee possibile scrivere leequazioni di moto di una particella in forma lagrangiana anche se sie in presenzadi forzeQ dipendenti dalla velocita, purche tali forzeQ ammettano un potenzialegeneralizzatoV, nel senso che si abbia

Q =ddt

∂V∂v

− ∂V∂x

.

Infatti, dalla formula del binomio lagrangiano gia sappiamo che l’equazionema =F conF =−gradV puo scriversi nella forma

ddt

∂L0

∂v− ∂L0

∂x= 0

conL0 = T−V

(T = 12mv2). Dunque, se si considera l’equazione

ma = F+Q

con

F =−gradV, Q =ddt

∂V∂v

− ∂V∂x

,

tale equazione puo scriversi nella forma

ddt

∂L∂v

− ∂L∂x

= 0, L = L0−V .

17Questae un caso particolare dell’identita

grad(a·b = (a·grad)b+a× rotb+(b ·grad)a+b× rota

quando si prendab = v indipendente dax, sicche gradb = 0, rotb = 0. Anche questa identita vienedimostrata facilmente quando si passa alla trasformata di Fourier. Tuttavia,e un facile esercizioverificarla direttamente, particolarmente nel caso∂b

∂t = ∂b∂xi

= 0 che qui ci interessa.

Page 13: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 281

In questo senso, dunque, le equazioni di moto per le particelle soggette a forzedipendenti dalla velocita ma ammettenti un potenziale generalizzato possono es-sere scritte in forma lagrangiana.

Nel nostro caso, abbiamo una particella carica soggetta a forza di Lorentz, cheammette il potenziale generalizzatoV(em). Si ha dunque la

Proposizione 4 L’equazione di Newton (nonrelativistica)

ma = e(E+vc×H)

e equivalente all’equazione di Lagrange

ddt

∂L∂v

− ∂L∂x

= 0

dove la lagrangiana Le definita da

L =12

mv2−eV(em) . (6.2.1)

Abbiamo ora il problema di postulare una forma per l’equazione di moto di unaparticella relativistica in presenza di campiE edH assegnati, o equivalentementein presenza dei corrispondenti potenzialiΦ edA. La piu semplice scelta possibileche si riduca all’equazione non relativisticama = F(em) per piccole velocita si ot-tiene procedendo in modo analogo a quello del caso nonrelativistico, usando oraovviamente la corretta “lagrangiana meccanica”

L(mecc) =−mc2√

1−v2/c2 . (6.2.2)

Si giunge in tal modo a formulare il seguente

Assioma. La lagrangiana relativistica di una particella in campoelettromagneticoe data da L= L(mecc)−eV(em), ovvero

L =−mc2

√1− v2

c2 −e(Φ− v

cA

). (6.2.3)

Naturalmente, per coerenza si deve anche controllare che la corrispondenteazione hamiltoniana abbia, come per la particella libera, carattere geometrico. Suquesto punto ritorneremo alla fine del presente paragrafo.

Ricordando che∂L(mecc)

∂v = mγv, si ha subito allora la

Proposizione 5 L’equazione di moto per una particella relativistica in un campoelettromagneticoe data da

ddt

(mγv) = e(E+vc×H) (6.2.4)

Page 14: Teoria della relativita ristretta.` Parte seconda

282 Andrea Carati e Luigi Galgani

Veniamo ora al teorema dell’energia. In meccanica nonrelativistica questo siottiene mpltiplicando scalarmente per la velocitav l’equazionema= F, e si ottieneT = F ·v doveT = (1/2)mv2 e l’energia cinetica. In ambito relativistico il teoremadell’energia si ottiene analogamente moltiplicando scalarmente perv la (6.2.4). Siha allora la1819

Proposizione 6 (Teorema dell’energia).Si ha

ddt

mγc2 = eE ·v . (6.2.5)

Dimostrazione. Basta verificare l’identita

v · ddt

mγv =ddt

mγc2 ,

e questoe un utile esercizio. Q.E.D.

Abbiamo infine il problema di scrivere l’hamiltoniana di una particella in cam-po elettromagnetico; cio e necessario ad esempio per scrivere l’equazione di Schrodinger(in meccanica quantistica) per una particella in campo elettromagnetico. Comesappiamo dal formalismo hamiltoniano, a tal finee sufficiente considerare l’energiageneralizzata

E = p ·v−L , (6.2.6)

ed esprimerla in termini del momento

p =∂L∂v

(6.2.7)

anziche della velocitav.Il procedimento che si segue ripercorre passo passo quello che si era seguito

per la particella libera. In presenza di campo elettromagnetico, analogamente conimmediati calcoli si trova il

Lemma 1 Per la particella relativistica in campo elettromagnetico si ha

p = mγv+ecA (6.2.8)

E = mγc2 +eΦ . (6.2.9)

Da queste relazioni si ottiene poi la

18Landau chiama energia cinetica la quantita E = mγc2, anche se essa contiene l’energia a riposomc2.

19Si noti che alla variazioe di energia non contri buisce il campo magnetico, perche esso esercitauna forza ortogonale alla velocita.

Page 15: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 283

Proposizione 7 L’hamiltoniana di una particella in campo elettromagnetico, conlagrangiana (6.2.3) ovvero

L =−mc2

√1− v2

c2 −e(Φ− v

cA

),

e data da

H = eΦ+c

√m2c2 +(p− e

cA)2 (6.2.10)

In particolare, nel limite nonrelativistico(v/c)2 << 1, per l’hamiltoniana H e perl’energia E si ha

H =(p− e

cA)2

2m+eΦ+mc2 . (6.2.11)

E =12

mv2 +eΦ+mc2 . (6.2.12)

Dimostrazione. Basta esprimere l’energia E in termini del momen-to p. Dal lemma 1 si osserva(p− e

cA) = mγv, E− eV = mγc2, edunque si ha(

E−eVc

)2

− (p− ecA)2 = m2γ2(c2−v2) = m2c2 ,

ovvero(E−eV)2 = c2

[m2c2 +(p− e

cA)2

].

Q.E.D.

Osservazione.Da un punto di vista mnemonico,e utile osservare chel’hamiltoniana di una particella in campo elettromagnetico si ottieneda quella in assenza di campo (H= c

√p2 +m2c2, oppure nel limite

nonrelativistico H= p2/(2m)+mc2 ) con la semplice sostituzione

p → p− ecA ,

oltre all’aggiunta del termine eΦ.

Terminiamo questo paragrafo con un commento sul carattere geometrico del-l’azione hamiltoniana di una particella in campo elettromagnetico. A tal fine fac-ciamo uso di una proprieta che dimostreremo piu avanti, ovvero che, nello stes-so senso in cui{xµ} = (ct,x) e un quadrivettore, cosı e un quadrivettore anche{Aµ} = (Φ,A). Ricordando poi che{uµ} = (γ,γv

c) e un quadrivettore e che ilprodotto scalare tra due quadrivettori ha la struttura pseudo–euclidea ben nota,si trova che il prodotto scalareg(u,A) tra i quadrivettoriu ≡ {uµ} = (γ,γv

c) edA≡ {Aµ}= (Φ,A) e dato da

g(u,A) = γΦ− γvc·A = γ(Φ− v

c·A)

Page 16: Teoria della relativita ristretta.` Parte seconda

284 Andrea Carati e Luigi Galgani

e dunque, ricordando ds= cγ dt (ovvero dt = γ

cds) otteniamo

Z t1

t0V(em) dt =

1c

Z t1

t0γ(Φ− v

c·A)ds=

1c

Zg(u,A)ds.

Pertanto, ricordando cheR

L(mecc)dt =−mcR

ds, otteniamo che l’azioneS relativaalla lagrangianaL = L(mecc)−eV(em) si scrive nella forma

S=−Z [

mc+ec

g(u,A)]

ds .

Questa ha carattere geometrico nello spaziotempo, perche hanno carattere geomet-rico sia ds (elemento di linea, lunghezza di un tratto di curva) sia il prodotto scalareg(u,A).

In conclusione, l’assioma per il moto di una particella in un campo elettro-magnetico in ambito relativistico, che soprae stato formulato con la scelta dellalagrangiana (6.2.3), puo equivalentemente essere formulato in termini di azionehamiltoniana nel modo seguente:

Assioma.L’azione hamiltoniana relativistica di una particella in cam-po elettromagneticoe data, per ogni curvaΓ di tipo tempo nello spaziotem-po, da

S=−Z

Γ

[mc+

ec

g(u,A)]

ds. (6.2.13)

E molto istruttivo a questo punto confrontare il metodo qui seguito per giustifi-care questo assioma, con il metodo seguito da Landau e Lifshitz (Teoria dei campi).Noi abbiamo scelto un procedimento di tipo induttivo, che puo forse avere qualcheutilit a dal punto di vista pedagogico. Non vie dubbio tuttavia che il procedimentodiretto e compatto di Landau e Lifshitze estremamente piu comodo e significativo,almeno quando si sia in grado di apprezzarlo pienamente.

Sulle dimensioni delle quantita di interesse.Le componenti del vet-tore xµ = (ct,x) sono lunghezze (L). Cosı anche se una lunghez-za; dunque mcds e un’azione (energia per tempo). La quadrivelocita,per comee stata da noi definita,e adimensionale (abbiamo preso laderivata rispetto ad s anziche rispetto a t).

Per quanto riguarda la carica elettrica ed i potenziali elettromagneti-ci, dall’equazione�Φ = ρ, doveρ e una densita di carica (caricaper unita di volume), si ottiene cheΦ (e ogni componente di Aµ) hale dimensionicarica/L. A sua volta, per la carica, basta ricordare chee2/r e un’energia e che anche eΦ (e piu in generale eAµ) e un’energia.Dunque, infine,(e/c)g(u,A)ds e una azione.

Page 17: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 285

6.3 Trasformazioni dei campi: trattazione elementare

Abbiamo gia osservato che la separazione di un campo elettromagnetico in un cam-po elettricoE e in un campo magneticoH e relativa, ovvero dipende dal sistemainerziale considerato: ad esempio se in un sistemaK si ha il solo campo elettricoE creato da una particella ferma, tale particella appare mobile rispetto ad un altrosistemaK′ in moto rispetto aK; dunqueK′ vede una corrente (una carica in moto)e quindi oltre ad un campo elettrico vede anche un campo magnetico. Daremo quisotto la legge con cui si trasformano i campi passando da un sistema inerziale adun altro.

Tale legge di trasformazione si spiega analiticamente nel modo seguente. Nelpassaggio da un sistema di riferimento a un altro, avviene che le equazioni diMaxwell cambierebbero di forma (in conseguenza del cambiamento di coordinatesecondo la trasformazione di Lorentz) se non si imponesse che anche i campi cam-biasssero in maniera adeguata, atta proprio a bilanciare il cambiamento di formadelle equazioni. Ma noi imponiamo che tale bilanciamento avvenga, proprio persoddisfare il principio si relativita. Infatti, il principio di costanza di velocita dellaluce, nella sua forma piu pregnante, si esprime proprio come la condizione che leequazioni di Maxwell non cambino di forma al cambiare del sistema di riferimen-to inerziale. In un certo senso si puo dire che finora abbiamo usato tale principiosolo in forma ridotta, cioe nel limite dell’ottica geometrica, in cui si pensa alla lucecome costituita da raggi, e si impone che la loro velocita sia la stessa (ovveroc) intutti i sistemi inerziali. Qui richiediamo in piu che siano le equazioni di Maxwellstesse a non variare di forma, sicche nessun sistema inerziale risulti privilegiato.

Come esercizio preliminare cominciamo a verificare che invece l’equazione did’Alembertnoncambia forma sotto le trasformazioni di Lorentz. In effetti questaosservazione analitica era gia stata compiuta da W. Voigt nel 1887.20 Consideriamol’equazione di d’Alembert per una quantita Φ scalare (ovvero, che non cambia alcambiare del sistema di riferimento) e poniamo per semplicita di notazionec = 1.Definiamo21

�Φ ≡ ∂2Φ∂t2 − ∂2Φ

∂x2 ≡(

∂2

∂t2 −∂2

∂x2

)Φ ;

l’operatore� viene detto “dalembertiano” e mediante esso l’equazione di d’Alem-bert prende la forma

�Φ = 0 .

Nel capitolo sull’equazione di d’Alembert abbiamo gia osservato che, quando siconsidera una equazione, in generale essa cambia di forma se si esegue un cam-biamento di variabili: ad esempio passando dalle coordinate(t,x) alle coordi-

20W. Voigt, Uber das Doppler’sche Princip. Gottingen Nachrichten, 10 marzo 1887, pag. 41. Siveda la formula (10) a pag. 45. Nelle nostre notazioni, tale formula si leggex′ = x− vt, y′ = γ−1y,z′ = γ−1z, t ′ = t − vx/c2. Quindi, per ottenere le trasformazioni di Lorentz occorre passare dallevariabili primate ad altre che si ottengono moltiplicando quelle primate perγ. Tuttavia, ai fini che siproponeva Voigt questo fattoe inessenziale.

21Consideriamo il caso di una sola dimensione spaziale

Page 18: Teoria della relativita ristretta.` Parte seconda

286 Andrea Carati e Luigi Galgani

nate(ξ,η) = (t−x, t +x) l’equazione di d’Alembert assume la forma (denotiamo∂x ≡ ∂

∂x, ∂2xx≡ ∂x∂x etc)

∂ξ∂ηΦ = 0 ,

e anzi proprio di questo artificio ci siamo serviti per integrare l’equazione. Si hainvece la

Proposizione 8 Il dalembertiano non cambia forma sotto trasformazioni di Lorentz,ovvero si ha

� ′ = �

dove� ′ = ∂2t ′t ′−∂2

x′x′ , � = ∂2tt −∂2

xx.

Dimostrazione. (metodo forza bruta). Dalla trasformazione diLorentz t′ = γ(t−vx),x′ = γ(x−vt), in virtu della formula fondamen-tale per la derivata di una funzione composta si ha

∂t =∂t ′

∂t∂t ′ +

∂x′

∂t∂x′ , ∂x =

∂t ′

∂x∂t ′ +

∂x′

∂x∂x′

ovvero

∂t =∂t ′

∂t∂t ′ +

∂x′

∂t∂x′ = γ(∂t ′−v∂x′)

∂x =∂t ′

∂x∂t ′ +

∂x′

∂x∂x′ = γ(∂x′−v∂t ′) .

(6.3.1)

Si ha dunque

∂t −∂x = γ(1+v)(∂t ′−∂x′)∂t +∂x = γ(1−v)(∂t ′ +∂x′) .

Pertanto, osservando che si ha� = (∂t −∂x)(∂t +∂x),22 otteniamo

� = γ2(1−v2)� ′ = � ′ .

Q.E.D.

Osservazione. Questa proprieta di invarianza in forma del dalember-tiano sotto trasformazioni di Lorentz costituisce di fatto la controparte(in termini di operatori differenziali) della invarianza in forma dellametrica relativistica sotto trasformazioni di Lorentz:

c2t ′2− l ′2 = c2t2− l2 .

22Questa identita operatorialee analoga alla familiare identita algebricaa2−b2 = (a+b)(a−b).

Page 19: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 287

Allo stesso modo si mostra immediatamente che sotto rotazioni nelpiano si ha l’invarianza in forma dell’operatore laplaciano:

∂2

∂x2 +∂2

∂y2 =∂2

∂x′2+

∂2

∂y′2

come traduzione in termini di operatori differenziali dell’invarianzain forma della metrica sotto rotazioni:

x′2 +y′2 = x2 +y2

(qui ci riferiamo evidentemente a sistemi di riferimento cartesianiortogonali, ovvero a sistemi di vettori base ortonormali rispetto al-l’assegnato prodotto scalare).

In effetti, come vedremo piu avanti, le trasformazioni (6.3.1 sulle derivateparziali (∂t ,∂x)→ (∂t ′ ,∂x′) sono nient’altro che le trasformazioni dellecomponenti dei covettori indotte dalle trasformazioni delle componen-ti dei vettori. Troveremo che le derivate parziali si trasformano conl’inversa della trasposta della matrice che fornisce la trasformazionedelle componenti dei vettori. Nel nostro caso, il tutto ammonta acambiare v in−v.

Veniamo dunque alla legge di trasformazione dei campi. Il sistemaK′ si muovecon velocita v lungo l’assex del sistemaK; e conveniente allora decomporre ivettoriE eH nella forma

E = E‖+E⊥, H = H‖+H⊥

doveE‖ denota la componente diE parallela av, cioe all’assex, eE⊥ la corrispon-dente componente ortogonale, cioe nel pianoy,z. Analogamente sia

E′ = E′‖+E′

⊥, H′ = H′‖+H′

⊥.

Cosı anche, denotando conρ, ρ′ e j , j ′ le densita di carica e di corrente rispetto aidue sistemi di riferimento, poniamo

j = j ‖+ j⊥, j ′ = j ′‖+ j ′⊥ .

Si ha allora la

Proposizione 9 Le equazioni di Maxwell non cambiano forma sotto trasformazionidi Lorentz se si ammette che i campi e la densita di carica e di corrente si trasformi-no nel modo seguente (con c= 1):

E′‖ = E‖

E′⊥ = γ(E⊥−H×v)

Page 20: Teoria della relativita ristretta.` Parte seconda

288 Andrea Carati e Luigi Galgani

H′‖ = H‖

H′⊥ = γ(H⊥+E×v)

ρ′ = γ(ρ−v jx)j ′x = γ( jx−vρ)j ′⊥ = j⊥ (ovvero j ′y = jy , j ′z = jz) .

Dimostrazione. 23 Consideriamo la trasformazione di Lorentz in-versa t= γ(t ′+vx′), x= γ(x′+vt′), y= y′, z= z′. Con calcoli analoghia quelli usati per dimostrare l’invarianza del dalembertiano si ha

∂t ′ = γ(∂t +v∂x) , ∂x′ = γ(∂x +v∂t) , ∂y = ∂y′ ,∂z = ∂z′ . (6.3.2)

i) Cominciamo a considerare le equazioni omogenee

∂tH + rotE = 0 , divH = 0 ;

in particolare, la prima componente della prima equazione, e la sec-onda equazione, forniscono

∂tHx = ∂zEy−∂yEz , ∂xHx =−(∂yHy +∂zHz) . (6.3.3)

Vediamo ora cosa sappiamo su∂t ′Hx. Dalla trasformazione di Lorentz∂t ′ = γ(∂t +∂x) otteniamo

∂t ′Hx = γ[∂tHx +v∂xHx] ,

e quindi, per le (6.3.3),

∂t ′Hx = γ(∂zEy−∂yEz)− γv(∂yHy +∂zHz)= ∂zγ(Ey−vHz)−∂yγ(Ez+vHy) .

(6.3.4)

Per confronto con l’originaria equazione

∂tHx = ∂zEy−∂yEz

si vede allora che le due equazioni sono della stessa forma se si pone24

H ′x = Hx, E′

y = γ(Ey−vHz), E′z = γ(Ez+vHy)

23A parte la notazione, seguiamo qui quasi alla lettera il paragrafo 6 del lavoro di Einstein del1905.

24In effetti, basterebbe porreH ′x = αHx,E′

y = αγ(Ey− vHz),E′z = αγ(Ez+ vHy) con una costante

α (dipendente parametricamente dav). Ma, come nel capitolo precedente, si assumeα = α(v2) e simostraα2 = 1, da cuiα = 1 per continuita inv = 0.

Page 21: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 289

ovveroH′‖ = H‖, E′

⊥ = γ(E⊥−H×v) .

ii) Si procede poi analogamente usando le equazioni inomogeneerotH−∂tE = j , divE = ρ. Si ha

∂tEx = ∂yHz−∂zHy− jx, ∂xEx =−(∂yEy +∂zEz)+ρ ,

e si ottiene

∂t ′Ex = ∂y′γ(Hz−vEy)−∂z′γ(Hy +vEz)− γ( jx−vρ)

che, per confronto con l’equazione originale, fornisce

E′‖ = E‖ H⊥

′‖ = γ(H⊥+E×v) , j ′‖ = γ(j ‖−vρ) .

Resta da determinare la legge perρ. A tal fine si usa la condizione chevalga

div′E′ ≡ ∂x′E′x +∂y′E

′y +∂z′E

′z = ρ′ .

Ma allora il primo membro puo essere calcolato e si trova25

div′E′ = γdivE− γv(∂tEx−∂yHz+∂zHy) .

D’altra parte, usando le equazioni di MaxwelldivE = ρ e la primacomponente di−∂tE+ rotH = j , questa equazione diviene

div′E′ = γ(ρ−v jx) ,

sicche la condizionediv′E′ = ρ′ fornisce

ρ′ = γ(ρ−v jx) .

Q.E.D.

Osservazione. Le leggi di trasformazione della densita di carica e corrente mostra-no cheρ, j si trasformano esattamente comet,x; in altri termini ρ, j costituisconoun quadrivettore. Piu precisamente, ripristinandoc 6= 1, si ottiene che

{ jµ}3µ=0 = (cρ, j)

costituisce un quadrivettore.Si ha dunque il

25Basta usare le relazioni gia trovateE′x = Ex, E′

y = γ(Ey−vHz), E′z = γ(Ez+vHy), ∂x′ = γ(∂x+

v∂t), ∂y′ = ∂y,∂z′ = ∂z.

Page 22: Teoria della relativita ristretta.` Parte seconda

290 Andrea Carati e Luigi Galgani

Corollario 1 I potenziali scalare e vettoreΦ, A costituiscono un quadrivettore,diciamo di componenti{Aµ}3

µ=0, ovvero si ha che le quantita

{Aµ} ≡ (Φ,A)

si trasformano come le componenti di un quadrivettore (cioe come le componentidi {xµ} ≡ (ct,x).

Dimostrazione. Sappiamo che i potenziali soddisfano, nel gauge diLorentz, le equazioni�Φ = ρ , �A = j/c, e che l’operatore dalem-bertiano non cambia forma sotto trasformazioni di Lorentz. DunqueΦ ed A devono trasformarsi comeρ e j/c ovvero come cρ e j , cioecome ct edx. Q.E.D.

Da cio segue in particolare, come gia osservato, che l’azioneS relativa alla parti-cella in campo elettromagnetico ha carattere geometrico nello spaziotempo.

6.4 Primi elementi di calcolo tensoriale

6.4.1 Introduzione

Nel paragrafo precedente abbiamo ottenuto le leggi di trasformazione dei campielettromagnetici in maniera elementare ma alquanto laboriosa, in effetti quasi esat-tamente nella maniera seguita inizialmente da Lorentz, Poincare ed Einstein stessi(metodo“brute force” , ovvero forza bruta). Esiste pero un modo per ottenere “avista” le leggi di trasformazione dei campi, e cio si ottiene scrivendo le equazionidi Maxwell stesse in maniera che siano “covarianti a vista” o, come anche si dice,sianoin forma tensoriale. Puo servire da riferimento a questo proposito la seguentefrase di Einstein:

“Prima delle ricerche di Minkowski era necessario effettuare una trasfor-mazione di Lorentz su una legge per accertare l’invarianza rispetto atali trasformazioni; egli invece riuscı ad introdurre un formalismo taleche la forma matematica della legge garantisce di per se l’invarianzadella leggestessa rispetto alle trasformazioni di Lorentz. Creando uncalcolo tensoriale quadridimensionale, egli ottenne per lo spaziotem-po cio che il calcolo tensoriale aveva ottenuto per le tre dimensionispaziali.”

In effetti, il calcolo tensoriale era gia stato sviluppato nell’ambito degli spazivettoriali e piu in generale delle varieta differenziabili, ed esposto in un classico la-voro26 27di Ricci e Levi Civita del 1901, con cui tuttavia Einstein non era familiare

26Methodes de calcul differentiel absolu et leurs applications, Math. Ann.54 (1901).27“I mezzi matematici necessari per la teoria della relativita generale erano gia pronti nel “cal-

colo differenziale assoluto”, il quale si basa sulle ricerche di Gauss, Riemann e Christoffel sulle

Page 23: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 291

nel 1905. Il contributo di Minkowski consistette sostanzialmente nell’estendere talimetodi al caso in cui la varieta e lo spaziotempo della relativita ristretta, concepitodunque come una varieta piatta, ovvero come uno spazio vettoriale, con la pecu-liarita pero di essere munita di un prodotto scalare non definito positivo anziche delprodotto scalare consueto.

E proprio questo l’elemento caratteristico che costringe anche noi, a questopunto, a introdurre degli elementi geometrici che lo studente aveva potuto finoraignorare. In breve si tratta di rendersi conto di quanto segue:

• Quando si ha a che fare con uno spazio vettoriale, diciamoloV, si deve tenereconto del fatto che esistono non solo i vettori, diciamolix, y, v, w, elemen-ti dello spazioV stesso, ma anche i covettori, ovverofunzionali linearisuV (che definiremo subito sotto, come anche altre altre quantita algebriche,come i funzionali multilineari);

• Ora, come mai questo fatto ha potuto essere ignorato nelle trattazioni ele-mentari della fisica? Cio e dovuto al fatto che lo spazio ordinarioe munito diun prodotto scalare, perdipiu euclideo (cioe definito positivo). Infatti da unaparte l’esistenza di un prodotto scalare (o di una metrica, come anche si dice)comporta (come vedremo piu sotto) che esiste un isomorfismo naturale tracovettori e vettori, cioe che ad ogni covettore corrisponde biunivocamente (ein maniera intrinseca) un vettore, sicche i covettori possono nella sostanzascomparire, o piuttosto essere ignorati, rimanere in qualche modo nascosti,in ombra. Ma questo nascondimentoe ancor piu favorito, in pratica, nel casoin cui la metricae anche euclidea. Infatti, in tal caso, se si scelgono vettoribase ortonormali rispetto alla metrica considerata (cioe se si scelgono coor-dinate cartesiane ortoganali), risulta che le componenti che individuano unvettore addiritturacoincidonocon le componenti del corrispondente covet-tore. Dunque, concretamente, lavorando in coordinate cartesiane ortoganalisi ha che vettori e corrispondenti covettori materialmente coincidono, e sipuo comportarsi proprio come se i covettori non esistessero. Ede proprio inquesto spirito che viene condotto l’insegnamento universitario elementare.

• Ma questo nascondimento none piu possibile nello spaziotempo relativisti-co. Infatti in tal casoe pur vero che sie ancora in presenza di una metrica,e cio comporta ancora l’esistenza di un isomorfosmo naturale tra vettori ecovettori. Ma poiche il prodotto scalare none definito positivo (e pseu-doeuclideo), allora succede che, anche se si scelgono vettori base adattati allametrica (e quindi si sceglie l’analogo delle coordinate cartesiane ortogonali),un vettore e l’associato covettore non hanno le medesime componenti (laparte spaziale di un covettore ha segno opposto a quella del corrispondentevettore), e none piu possibile comportarsi concretamente come se i covettori

varieta noneuclidee ede stato eretto a sistema da Ricci e Levi Civita e da essi applicato a problemidi fisica teorica”. Da A. Einstein,I fondamenti della teoria della relativita generale (1916), primoparagrafo.

Page 24: Teoria della relativita ristretta.` Parte seconda

292 Andrea Carati e Luigi Galgani

non esistessero. Bisogna dunque rassegnarsi a fare i conti (in tutti i sensi)con i covettori (e piu in generale a tener conto della struttura multilineareassociata allo spaziotempo).

Dobbiamo dunque cominciare col prendere atto che esistono i covettori, edovremo pertanto abituarci a distinguere le componenti dei vettori da quelle deicovettori. Entra qui sulla scena ilgioco degli indici, sul quale faremo un brevecommento qui sotto: infatti le componentixi dei vettori vengono denotate con in-dici in alto, quelleαi dei covettori con indici in basso.28 Vedremo inoltre che ilprodotto scalaree un funzionale bilineare, con coefficienti che hanno dunque in-dici in basso,gik. Dovremo poi imparare a maneggiare l’isomorfismo tra vettori ecovettori indotto dalla metrica, il quale viene poi concretamente realizzato medi-antel’operazione di abbassamento e innalzamento degli indici. Poche altre cosesaranno infine sufficienti per procedere (regola della traccia, ....).29

Osservazione.Per quanto riguarda il gioco degli indici in alto e inbasso, o piuttosto l’orgia degli indici in alto e in basso, come qualchevolta si dice, bisogna ammettere che sicuramente esso costituisce uncerto ostacolo allo studio del calcolo tensoriale, e che ognuno desider-erebbe evitarlo. In effetti, sarebbe possibile una notazione in cuiquesto gioco fosse evitato, e forse un giorno verra trovato un com-promesso piu soddisfacente. Ma sembra necessario che ci si debbaattenere a un qualche compromesso, in cui il gioco degli indici restapresente, e dopo piu di un secolo non sie trovato un compromessomigliore.

La massima testimonianza a questo propositoe fornita da H. Weyl,uno dei piu grandi matematici del secolo scorso, che peraltro diedecontributi fondamentali alla geometria, e scrisse quello chee in asso-luto uno dei piu bei libri di relativita (sul quale si formo anche Fer-

28Dirac, nel suo celebre manuale di Meccanica Quantistica, segue la convenzione opposta: lecomponenti dei vettori hanno indici in basso e quelle dei covettori in alto. La convenzione di Diracsarebbe forse la piu comoda per un primo impatto col calcolo tensoriale, Infatti tutti hanno avuto ache fare con componenti di vattori, mettendo gli indici in basso, e sarebbe naturale continuare a farecosı, riservando gli indici in alto alle componenti dei covettori, quando infine si scopre che esistonoanche loro. Purtroppo pero Dirac e rimasto isolato in questa sua scelta. D’altra parte, Dirac stessosi e poi rassegnato a seguire la usuale convenzione, come testimoniato dal suo libro di RelativitaGenerale.

29Se si vuole poi procedere allo studio della relativita generale, nella quale, come tutti hannosentito dire, lo spaziotempoe concepito come varieta curva, con curvatura legata alla gravita, allorasi ha bisogno di pochi altri strumenti. Precisamente: il tensore di curvatura e la derivata covariante,Questa era gia sostanzialmente nota alla fine del diciannovesimo secolo, e di uso comune anchenegli spazi piatti quando si usano coordinate generali (non cioe cartesiane ortognali), ad esempio perdeterminare la struttura dell’operatore laplaciano. Questa nozionee in stretta relazione con quella diconnessione geodetica (introdotta da Levi Civita nel 1916, e subito estesa da Weyl a spazi non munitidi metrica), chee necessaria per generalizzare la nozione di parallelismo, e quindi confrontare vettoridi spazi tamgenti diversi, come si fa esempio quando si definisce l’accelerazione.

Page 25: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 293

mi)30. Egli infatti, dopo avere brevemente riassunto le operazioni fon-damentali del calcolo tensoriale,31 per quanto concerne l’uso degliindici cosı si esprime:Various attempts have been made to set up astandard terminology in this branch of mathematics involving only thevectors themselves and not their components, analogous to that of vec-tors in vector analysis. This is highly expedient in the latter, but verycumbersome for the much more complicated framework of the tensorcalculus. In trying to avoid continual reference to the components weare obliged to adopt an endless profusion of names and symbols in ad-dition to an intricate set of rules for carrying out calculations, so thatthe balance of advantage is considerably on the negative side. An em-phatic protest must be entered against these orgies of formalism whichare threatening the peace of even the technical scientist.”Da H. Weyl,Space–time–matter, Dover (New York, 1952), pag. 53–54.

6.4.2 Necessita di considerare i covettori, innalzamento ed abbassa-mento degli indici, regola della traccia, trasformazioni degli op-eratori differenziali.

Il presente paragrafo corrisponde a un terzo circa della parte B del-l’articolo di Einstein del 1916I fondamenti della teoria della relativitagenerale: Parte B, mezzi matematici per la formulazione di equazionicovarianti in modo generale.Qui ci limitiamo all’esposizione delminimo sufficiente per i nostri scopi (relativita speciale in coordinatecartesiane). Nell’articolo di Einstein sono inoltre esposte le nozioni diderivata covariante (dopo avere introduzione i simboli di Christoffel) edi tensore di curvatura. Nella presente esposizione facciamo esplicitoriferimento alla nozione di funzionale lineare (vettore covariante, nel-la terminologia classica) chee implicita nelle formulazioni dell’iniziodel secolo scorso.

Vogliamo dunque anzitutto mettere in luce chei covettori esistono, e vogliamopoi mostrare che in relativita e necessario prenderli in considerazione, nonostanteche nelle trattazioni elementari (si intende nei corsi di Fisica Generale, nelle par-ti elementari dei corsi di analisi e della meccanica) essi possano essere ignorati.Cominceremo col ricordare cosa sono i covettori, come elementi del duale di uno

30H. Weyl, Raum–Zeit–Materie(1918), traduzione ingleseSpace–time–matter, Dover (New York,1952).

31Il riassuntoe il seguente.“The study of tensor calculus is, without doubt, attended by conceptualdifficulties – over and above the apprehension inspired by indices, which must be overcome. Fromthe formal aspect, however, the method of reckoning used is of extreme simplicity; it is much easierthan, e.g., the apparatus of elementary vector–calculus. There are two operations, multiplicationand contraction; then putting the components of two tensors with totally different indices alongsideof one another; the identification of an upper index with a lower one, and, finally, summation (notexpressed) over this index.

Page 26: Teoria della relativita ristretta.` Parte seconda

294 Andrea Carati e Luigi Galgani

spazio vettoriale, e daremo poi un cenno ai campi covettoriali (o piu in generale,tensoriali) su una varieta.

Consideriamo dunque uno spazio vettoriale sui realiV, di dimensionen arbi-traria,32 e prescindiamo per ora dalla eventuale esistenza di un prodotto scalare.Conosciamo le proprieta algebriche degli elementi diV (vettori, che denoteremocon x, y, o anche conv, w), che riguardano la combinazione lineare di due vet-tori, cioe la loro somma, e la moltiplicazione di un vettore per uno scalare (nu-mero reale). Sappiamo che in infiniti modie possibile scegliere una base33, dici-amo{ei}n

i=1, sicche ogni vettoree univocamente individuato dalle sue componentix1, . . . ,xn su quella base,34

x = ∑i

xiei ≡ xiei (6.4.1)

Osservazione: il gioco degli indici e la cosiddetta “convenzione diEinstein”. Si noti il gioco degli indici: i vettori baseei hanno indicein basso; le componenti xi dei vettori hanno indice in alto. Piu sottoavremo covettori baseεi con indice in alto, componentiαi di covettoricon indice in basso. L’esperienza ha mostrato che tale convenzioneha le sue comodita.

Si noti poi la cosiddettaconvenzione di Einstein: si sottintende il sim-bolo di somma, quando si hanno due indici uguali (cioe un indiceripetuto), di cui uno in alto e uno in basso. Nel seguito continuere-mo per un poco a mantenere (come qui sopra) congiuntamente le duenotazioni, e a un certo momento tralasceremo il simbolo di somma.

I covettori . Possiamo ora dire come si definiscono i covettori (rispetto allo spaziovettorialeV): essi sono i funzionali lineari suV, cioe le applicazioni (funzioni!)αa valori reali, con dominioV,

α : V → IR

aventi la proprieta di linearita, ovvero che

α(ax+by) = aα(x)+bα(y)

per ogni coppia di vettorix,y ∈ V e di numeria,b ∈ IR. L’insieme dei covettorisuV viene denotato conV∗ e chiamato“ il duale di V” . Vedremo chee anch’essouno spazio vettoriale di dimensionen, comeV.

32Prendiamo qui dimV = n < ∞; molte proprieta si estendono pero al caso di dimensione infinita.33Nelle trattazioni piu avanzate, i vettori base sono denotati con∂i invece che conei . La ragione

di questo fattoe profonda, e verra illustata brevemente piu avanti.34Si rammenti che le componentixi dei vettori non hanno nulla a che fare con le proiezioni or-

togonali sugli assi, chee una nozione che richiede l’esistenza di un prodotto scalare. Qui non esisteancora nessun prodotto scalare. Eventualmente, esiste solo la “proiezione per parallelismo”, checorrisponde all’uso della “regola del parallelogrammo”.

Page 27: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 295

Cio e molto astratto, e puo essere un primo ostacolo alla comprensione deicovettori. Ma in effetti i covettori sono concretissimi, come mostra l’esempio fon-damentale, cioe quello del covettore corrispondente a“misurare una componentedi un vettore”per una assegnata base, illustrato in Appendice.

Ora comunque cominciamo ad osservare che in virtu della proprieta definitoria(ovvero la linearita), si ha che, fissata una base{ei} in V, anche i covettori (enon solo i vettori) sono individuati dan–uple di numeri reali: come un vettorex e individuato da certe componentix1, . . . ,xn (se e fissata una base{ei} in V),cosı un covettoreα e individuato (con riferimento alla stessa base inV) da certecomponentiα1, . . . ,αn. Infatti, prendiamo un certo covettoreα. Allora, poichesappiamo come esso agisce su ogni vettorex (producendo un numero reale), cosısappiamo in particolare come esso agisce su ognuno dei vettori baseei , e dunquepossiamo associare adα gli n numeriα1, . . . ,αn definiti da

αi = α(ei) (i = 1, . . . ,n) .

D’altra parte, conoscendo questin numeriαi , conosciamo anche tuttoα, cioe lalegge con cuiα agisce su ognix, perche per la proprieta di linearita abbiamo

α(x) = α(∑

i

xiei)

= ∑i

xiα(ei) = ∑i

αixi ≡ αix

i ,

ovvero:

Se si conosce come il covettoreα agisce sui vettori base, cioe si conosconoi numeriαi definiti da

α(ei) = αi (i = 1, . . . ,n) , (6.4.2)

allora l’azione diα su ogni vettorex = ∑i xiei ≡ xiei e data da

α(xiei) = αixi . (6.4.3)

Dunque, avendo fissato una base{ei} in V, ogni covettoreα ∈V∗, e individua-to da unan–upla di numeriαi definita dalla (6.4.2), e la sua azione su ogni vettoree data dalla (6.4.3). Si direbbe allora cheV∗ e isomorfo a IRn. In effetti, perpotere giustificare questa affermazione, occorre anche dire in quale sensoV∗ e unospazio vettoriale, cioe occorre dire comee definita inV∗ l’operazione di sommatra due elementi diV∗ (due covettori) e di moltiplicazione di un covettore per unnumero reale, ovvero come si definiscono le combinazioni lineari inV∗; questopermette anche di comprendere in quale senso i numeriαi sono le “componenti”di α su una opportuna base inV∗, che viene detta“ base duale” ad{ei}. Questofatto e illustrato in Appendice, insieme con un’altra osservazione relativa alla rap-presentazione dei covettori mediante iperpiani nello spazio vettorialeV, chee diparticolare interesse per lo studio della propagazione di onde piane.35

35Quando si ricercano soluzioni dell’equazione di d’Alembert nella forma di onde piane, ovveroΦ(t,x) = Aexp(ikµxµ), allorakµ sono le componenti di un covettore.

Page 28: Teoria della relativita ristretta.` Parte seconda

296 Andrea Carati e Luigi Galgani

L’esempio prototipo di covettore: Il gradiente di uno scalare. Data una fun-zione scalaref = f (x1, . . . ,xn), si ha spesso necessita di considerare lan–upla

∂i f ≡ ∂ f∂xi (6.4.4)

che viene solitamente chiamata il gradiente dif e considerata come un vettore.Ma si vede subito che si tratta invece di un covettore (o meglio, di uncampocovettoriale, ovvero una legge che attribuisce un covettore ad ogni punto di co-ordinatex1, . . . ,xn. Infatti, basta a tal fine ricordare la definizione di derivata di-rezionale e osservare che(∂i f )vi e proprio la derivata direzionale dif nella di-rezione(v1 . . . ,vn). Si tratta quindi di una quantita assoluta, indipendente dallabase, che dipende linearmente dal vettore con componentivk: dunque per definizioneabbiamo a che fare con un covettore. Confermeremo questo fatto piu sotto, con-trollando che, sotto cambiamento di coordinate, lan–upla∂i f si trasforma propriocome richiesto per le componenti di un covettore.

L’isomorfismo naturale tra vettori e covettori indotto dalla metrica: abbassa-mento ed innalzamento degli indici.Veniamo ora ad illustrare il fatto che esisteun isomorfismo (corrispondenza biunivoca, compatibile con la struttura lineare)naturale traV e V∗, cioe tra vettori e covettori, quando sia assegnato un prodottoscalare.

Il modo algebrico per descrivere questa corrispondenza tra vettori e covet-tori quandoe assegnato un prodotto scalaree il seguente. Per definizione, unprodotto scalaree anzitutto un’applicazione bilineareg : V ×V → IR, ovvero una“macchinetta” con due entrate, diciamog(·, ·), la quale produce un numero,g(v,w),per ogni coppia di vettoriv, w; la “macchinetta” deve essere lineare inv se si fissaw, e lineare inw se si fissav.36 Dunque, per la proprieta di bilinerita, se si fis-sav allora g(v, ·) definisce un funzionale lineare duV, cioe un covettore. Esistedunque un’applicazione naturale daV in V∗, e si mostra facilmente che tale cor-rispondenzae biunivoca37. E questo l’isomorfisomo naturale traV eV∗ indotto dalprodotto scalare. Detto in altri termini: dato un prodotto scalare, a ogni vettorevcorrisponde un covettore (funzionale lineareαv) chee semplicemente l’operazione(la funzione) “prendere il prodotto scalare con il fissato vettorev”: in formule

αv(w) = g(v,w) per ogniw ∈V .

Questa formula si scrive anche

αv(·) = g(v, ·) .

36Inoltre, deve essere simmetrica (g(v,w) = g(w,v) ) e nondegenere, ovvero l’unico vettoreortogonale a tutti i vettori deve essere il vettore nullo; in formule

g(v,w) = 0 ∀w comporta v = 0 .

.37Questae la traduzione della proprieta di nondegenerazione.

Page 29: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 297

Viceversa, un vettorev e conosciuto see dato il suo prodotto scalareg(v,w) conogni altro vettorew.

Vediamo infine come tale corrispondenza tra vettori e covettori viene in prat-ica effettuata mediante l’operazione di abbassamento e innalzamento degli indici.Abbiamo gia convenuto di denotare le componentivi dei vettori con indici in altoe le componentiαi dei covettori con indici in basso. Inoltre la metrica (il prodot-to scalare)e individuata (in una base assegnata) da una matrice con due indici inbasso (vedremo piu sotto la ragione di tale scelta), ovvero le “componentigik dellametrica”. Queste sono definite semplicemente da

gik = g(ei ,ek) ,

e vengono introdotte in maniera del tutto naturale. Infatti, nella base{ei} i duevettori v,w si scrivonov = viei , w = wkek e dunque, per la bilinearita del prodottoscalareg, si ha

g(v,w) = g(viei ,wkek) = viwkg(ei ,ek) = gikviwk.

D’altra parte se si pensav fissato,e naturale scrivere

gikviwk = αkwk, con αk = gikvi

ed e chiaro che{αk} e proprio il covettoreg(v, ·) che si ottiene fissandov nelprodotto scalare. Per questo motivo le componenti del covettoreα ≡ αv vengonodenotate addirittura conevk, perche sono le componenti del covettore univoca-mente associato al vettorev, e dunque si scrivevk := gikvi . Anzi, poiche si assumeche il prodotto scalare sia simmetrico,g(v,w) = g(w,v), sicchegik = gki, si scriveanche

vk = gkivi

E questa l’operazione diabbassamento dell’indice.Veniamo ora all’innalzamento dell’ indice, procedendo nella maniera piu piatta

possibile. Ritornando alla notazioneαk = gikvi per il covettoreαk univocamenteassociato al vettorevi , e ovvio che la corrispondenza inversa si scrive nella forma

vi = gikαk

dovegik sono gli elementi della matrice inversa di{gik} (la ragione degli indici inalto si comprendera piu avanti), ovvero definiti da

gikgkl = δil

essendoδil la matrice identita. Quindi la matricegik fornisce la corrispondenza

inversa tra vettori e covettori, e poiche il vettore di componentivi e univocamenteindivituato dal covettore di componentiαk, si conviene di denotare tale vettore conla stessa letteraα del covettore, ovvero si scrive

αi = gikαk .

Page 30: Teoria della relativita ristretta.` Parte seconda

298 Andrea Carati e Luigi Galgani

E questa l’operazione diinnalzamento dell’indice.Si noti in particolare come, in presenza di una metrica euclidea, esistono le

basi ortonormali, cioe basi tali chegik = g(ei ,ek) = δik, e dunque in tali basi l’op-erazione di abbassamento od innalzamento di un indice non produce alcuna vari-azione:in spazi euclidei le componenti di vettori e covettori isomorfi, se riferite auna base ortonormale, sono le medesime. E questo il motivo per cui nella fisica enella geometria elementari si puo tralasciare di parlare di covettori (almeno se cisi riferisce a basi ortonormali). Ma cio none piu possibile in relativita speciale, incui si considera lo spaziotempo riferito a una metrica pseudoeuclidea. Infatti, ciosignifica che nelle basi ortonormali (corrispondenti dunque a sistemi inerziali incui per la parte spaziale ci si riferisce a coordinate cartesiane ortogonali) la matricedella metrica e la sua inversa hanno la forma (con la consueta notazione per gliindici, µ,ν = 0,1,2,3.){

gµν}

= {gµν}= diag(1,−1,−1,−1) ,

e dunque l’innalzamento o l’abbassamento di un indice spaziale comporta un cam-biamento di segno. Ad esempio se si considera il “vettore–evento” di componenti

{xµ}= (ct,x)≡ (ct,x,y,z)

si ha che il covettore ad esso corrispondente secondo la metrica lorentziana hacomponenti {

xµ}

= (ct,−x)≡ (ct,−x,−y,−z).

Campi vettoriali e covettoriali, metrica su una varieta. Abbiamo finora consid-erato uno spazio vettorialeV e abbiamo in corrispondenza definito lo spazio dualeV∗, i cui elementi sono i covettori (funzionali lineari suV); abbiamo poi analoga-mente considerato un particolare funzionale bilineare suV definente un prodottoscalare.

La situazione piu significativa che si deve consideraree pero un’altra, ovveroquella in cui si ha uno spazio vettoriale in ogni punto di una varieta. Consideriamoinfatti il pi u semplice esempio, ovvero quello dello spazio ordinario prerelativisti-co, il consueto spazio euclideo.E proprio questa la varieta di cui parliamo, anchese poi casualmentee essa stessa uno spazio vettoriale (tridimensionale). Ma quel-lo che vogliamo mettere in lucee che in ogni punto di tale varieta e definito unospazio vettoriale, chee lo spazio tangente alla varieta in quel punto. Ede proprioquesto spazio tangente quello che prende il posto dello spazio vettorialeV discussosopra. In altri termini, piu in generale sia data una qualsiasi varieta (differenzia-bile) M, che localmente possiamo riferire a una carta con coordinatex1, . . . ,xn.38

Allora in ogni punto diM, individuato dalle coordinatex = (x1, . . . ,xn). e definito

38In particolare,M puo coincidere con l’ordinario spazio euclideo o lo spaziotempo relativistico,e quindi essere essa stessa uno spazio vettoriale, sicche le coordinate sono addirittura globali e nonsolo locali; ma non sara piu cosı in relativita generale.

Page 31: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 299

lo spazio vettoriale tangente alla varieta (denotato conTxM), i cui elementi sononient’altro che le velocita di tutti i movimenti (curve parametrizzate) che passanoper quel punto. Dal capitolo sulle equazioni di Lagrange abbiamo imparato comel’assegnazione delle coordinate localix = (x1, . . . ,xn) definisca naturalmente unabase vettoriale (che abbiamo chiamatobase coordinata) in ciascun spazio tangenteTxM.

Dunque la situazione che ci interessae quella di una varieta (che per noi poisara lo spaziotempo, isomorfo ad IR4) in cui si hanno delle coordinate(x1, . . . ,xn)oppure(x′ 1, . . . ,x′ n) (due diverse carte; nel nostro caso, le coordinate rispetto a duesistemi inerzialiK, K′). In ogni punto di tale spazioe definito lo spazio vettorialetangenteTxM. Questo spazio prende il posto diV, e ad esso possiamo dunqueassociare lo spazio dualeT∗

x M (dei funzionali lineari relativi aTxM), e cosı anchepossiamo considerare i funzionali bilineari. Per definizione, uncampo vettorialesuM e una funzione che ad ogni puntox di M associa un vettore diTxM; analogamenteuncampo covettorialee una funzione che ad ogni puntox di M associa un elementodi T∗

x M. Cosı, anche, assegnare una metrica (o un prodotto scalare) vuol dire dareuna funzione che ad ogni puntox di M associa un funzionale bilineare suTxM (chesia simmetrico e nondegenere).

Comportamento dei campi vettoriali, dei campi covettoriali e della metricasotto cambiamento di coordinate.Consideriamo un cambiamento di coodinatenella varietaM:

x′ i = x′ i(x1, . . . ,xn) , i = 1, . . . ,n , (6.4.5)

e la corrispondente matrice jacobianaA definita da

Aik =

∂x′ i

∂xk .

Siano poi dati un campo vettorialevi = vi(x1, . . . ,xn) (un vettore funzione del posto)e un campo covettorialeαi = αi(x1, . . . ,xn).

Allora si mostra immediatamente la seguente

Proposizione.Le componenti vi di un vettore e le componentiαi di uncovettore si trasformano rispettivamente con le leggi

v′ i =∂x′ i

∂xk vk , (6.4.6)

α′i =

∂xk

∂x′ iαk . (6.4.7)

Tra l’altro, si noti che nella prima relazione figura la matrice jacobiana∂x′ i

∂xk ,mentre nelle seconda appare la sua inversa (anzi, la trasposta dell’inversa), come si

Page 32: Teoria della relativita ristretta.` Parte seconda

300 Andrea Carati e Luigi Galgani

vede in virtu della relazione39

∂x′ i

∂xk

∂xk

∂x′ l= δi

l (6.4.8)

Dimostrazione. Per quanto riguarda le componenti dei vettori,bisogna ricordare che il modo piu significativo per definire un vettoree il seguente. Avendo fissato delle coordinate xi (una carta, come sidirebbe in geometria differenziale) si considera una curva parametriz-zata xi = xi(λ), ovvero l’analogo di un movimento, in cui il parametrorealeλ prende il posto del tempo. Allora per definizione un vettoreenient’altro che la corrispondente “velocita”:

vi =dxi

dλ.

Se poi si considera il cambiamento di variabili (6.4.12), allora lenuove componenti del vettore velocita sono date da

v′ i =dx′ i

dλ,

dove x′ i e funzione composta diλ (attraverso le coordinate xk). Dunquela prima delle (6.4.6)e nient’altro che la formula per la derivata diuna funzione composta.

Per quanto riguarda le componentiαi dei covettori, la dimostrazionee la seguente. Date le vecchie componentiαi , le nuoveα′

i sono definitedalla condizione40 41

α′i v′ i = αk vk per ogni(v1, . . . ,vk)

(perche il risultato che si ottiene applicandoα a v non deve dipenderedalla base scelta). Dunque, usando la relazione appena trovata perv′ i , si richiede

α′i∂x′ i

∂xk vk = αkvk per ogni (v1, . . . ,vn) ∈ IRn , (6.4.9)

39Basta, nella (6.4.12), pensare le vecchie variabilixk come funzioni delle nuovex′ l , sicche x′ i efunzione composta delle variabilix′ l . Allora si usa il teorema di derivata di una funzione composta,e si osserva

∂x′ i

∂x′ l= δi

l .

40Si noti che la (6.4.9)e una condizione sulle componentiα′i , perche tutte le altre quantita sononote.

41Si ricordi che il funzionale lineareα e definito dalla sua azione su tutti i vettori inTxM, cioe sututte len–uple(v1, . . . ,vn) ∈ IRn; questae la ragione della condizione “per ogni(v1, . . . ,vn) ∈ IRn”.

Page 33: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 301

ovvero

(α′

i∂x′ i

∂xk −αk)vk = 0 per ogni(v1, . . . ,vn) ∈ IRn ,

ovvero42 α′i

∂x′ i

∂xk −αk = 0 , k = 1, . . . ,n, o anche

αk = α′i

∂x′ i

∂xk . k = 1, . . . ,n .

Moltiplicando per ∂xk

∂x′ l , sommando su k e usando la (6.4.8) (e cam-biando nome agli indici) si ottiene infine la seconda delle (6.4.6).

Q.E.D.

Regola per il cambiamento delle componenti: Covarianza e con-travarianza. Si vede dunque che le leggi di trasformazione per lecomponenti dei vettori (6.4.6) e quelle dei covettori (6.4.7) sono bendiverse. Si usa dire che le componenti dei vettori sono di tipocon-travariante,43, le componenti dei covettori sono di tipocovariante.44

Le relazioni (6.4.6) e (6.4.7) sono facilissime a ricordarsi. Conside-riamo ad esempio la (6.4.6), in cui le nuove componenti di un vettorev′ i (indice libero i in alto) sono espresse come combinazione linearidelle vecchie vk. Allora l’incertezzae se a destra debba apparire lamatrice jacobiana∂x′

∂x oppure la sua inversa∂x∂x′ e come debbano essere

scelti gli indici. La regolae la seguente: la matrice jacobiana a destrarispetta esattamente quello che si trova a sinistra. Ovvero, nel nostroesempio: a sinistra c’e una quantita primata conl’indice in alto? Al-lora nella matrice jacobiana a destra la quantita primata appare“inalto, ovvero a numeratore”, con lo stesso indice che c’e a sinistra; poi,al denominatore la sceltae determinata in conseguenza. Analoga-mente consideriamo la (6.4.7). A sinistra appare la quantita primatacon l’indice in basso?. Allora a destra, nella matrice jacobiana, laquantita primata va“in basso, ovvero a denominatore”, con lo stessoindice che c’e a sinistra; poi, al numeratore si va in conseguenza. Lastessa regola (scambiando i termini “primato” e “nonprimato”’) valequando si considerano le relazioni inverse. La grande facilitazione

42Basta prendere successivamente(v1, . . . ,vn) = (1,0, . . . ,0), (v1, . . . ,vn) = (0,1, . . . ,0), . . .,(v1, . . . ,vn) = (0,0, . . . ,1).

43Spesso si usa dire controvariante invece di contravariante, sia in italiano che in inglese. La nostrasceltae quella classica.

44La ragione sta nel fatto che le componenti dei covettori hanno la stessa legge di trasformazionedei vettori baseei (per questo hanno entrambi gli indici in basso), mentre le componenti dei vettoricambiano in maniera“contraria” (contravariano) rispetto a come cambiano i vettori base (per questohanno gli indici in alto, come i covettori–baseεi , che contravariano anch’essi.

Page 34: Teoria della relativita ristretta.` Parte seconda

302 Andrea Carati e Luigi Galgani

consiste nel fatto che non ci si deve ricordare se si debba fare inter-venire la matrice jacobiana o la sua inversa (o addirittura la traspostadi quest’ultima).

L’esempio sopra riportatoe fondamentale, ede il prototipo di una situazioneassolutamente generale. Infatti quello che abbiamo compiutoe di determinarela legge di trasformazione delle componenti dei covettori conoscendo la legge ditrasformazione delle componenti dei vettori, e cio e avvenuto basandosi su un pre-ciso requisito, ovvero che l’applicazione di un covettore a un vettore fornisce unrisultato assoluto, indipendente dalla base. Si richiede infatti che valga

α′iv′ i = αkv

k

sapendo gia che vale

v′ i =∂x′ i

∂xk vk ,

e questa condizione determina45 α′i in funzione diαi (per una applicazione fisica

all’effetto Doppler, si veda avanti). Se sie capito profondamente questo fatto.allorae immediato svolgere i seguente esercizi:

Esercizio. Sapendo che il prodotto scalare gikviwk e una quantita as-soluta, indipendente dalla scelta delle coordinate (si tratta del prodot-to scalare g(v,w)), e sapendo che le componenti vi , wk dei vettorisi trasformano in maniera contravariante, determinare la legge ditrasformazione delle componenti della metrica gik.

Il risultato che si trovae

g′ik =∂x j

∂x′ i∂xl

∂x′ kg jl , (6.4.10)

ovvero le componenti gik della matrice definente la metrica si com-portano in maniera covariante. Si dice che la metricae un tensoredoppio, due volte covariante.

Esercizio. Sapendo che vi edαk sono rispettivamente le componentidi un vettore e di un covettore, e sapendo inoltre che vale

vi = gikαk ,

determinare come si trasformano le componenti gik.

45Questa in effettie la definizione che si trova proprio all’inizio della esposizione del calcolotensoriale data nel citato articolo di Einstein (si veda la formula (6) relativa ai “vettori covarianti”).Si tratta di un esempio particolare di quello che Einstein chiama“un teorema che sara spesso utileper mettere in evidenza il carattere tensoriale”(parte finale del paragrafo 7).

Page 35: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 303

Il risultato che si trovae

g′ ik =∂x′ i

∂x j

∂x′ k

∂x l g jl , (6.4.11)

e dunque gik e un tensore doppio, due volte contravariante.

In altri termini, appare evidente che la legge di trasformazione delle compo-nenti, di tipo covariante o di tipo contravariante,e nient’altro che la traduzione diuna proprieta generale, ovvero che si ha a che fare con dei funzionali lineari o mul-tilineari (si veda la precisazione subito sotto) definiti in maniera intrinseca, cioeindipendente dalle coordinate.E questa quella che piu in generale viene chiamatalegge di covarianza o di tensorialita.

Un punto delicatoe il seguente, riferendoci ancora al caso di unospazio vettoriale V (ma l’estensione al caso delle varieta e banale).Finora abbiamo privilegiato lo spazio vettoriale V (con i suoi vettori),e allora i covettori sono stati definiti come i funzionali lineariα agentisu V, fornendo, per ogniv∈V, il numeroα(v). Ma abbiamo poi detto(si veda l’Appendice) che l’insieme V∗ dei covettorie anch’esso unospazio vettoriale, ede evidente che, avendo fissatov, il numeroα(v)puo essere riguardato come un funzionale lineare agente su V∗: in al-tri termini, il duale di V∗ e proprio V stesso,(V∗)∗ = V, e dunque Vpuo essere riguardato come il duale di V∗, cioe come l’insieme dei fun-zionali lineari sullo spazio dei covettori. Si ha pertanto una completasimmetria:

α : V → IR , v : V∗ → IR ,

e la funzioneα(v) puo essere denotata, in maniera piu simmetrica,con

< α,v > .

Definizione dei campi tensoriali. Si capisce in tal modo come si possa pervenirealla seguente

Definizione: Data una varieta M e una sua carta locale con coor-dinate x1, . . .xn, un tensore (o meglio un campo tensoriale) di tipor,s (ovvero r volte contravariante, s volte covariante)e individuatoda componenti Tj1,..., jri1,...,is con la proprieta che, al cambiare della carta(ovvero sotto trasformazione delle coordinate), le nuove componentisono date da T′ j1,..., jr

i1,...,is , dove

T ′ j1··· jri1···is =

∂x′ j1

∂xl1· · · ∂x′ jr

∂xlr

∂xm1

∂x′ i1· · · ∂xms

∂x′ isT l1···lr

m1···ms(6.4.12)

Page 36: Teoria della relativita ristretta.` Parte seconda

304 Andrea Carati e Luigi Galgani

Questa proprieta, abbastanza complicata a scriversi, rispecchia la piu significa-tiva definizione geometrica seguente: un tensore di tipor,ssu uno spazio vettorialeV e nient’altro che un funzionale multilineare

T : V∗× . . .×V∗︸ ︷︷ ︸r volte

×V× . . .×V︸ ︷︷ ︸svolte

→ IR .

Analogamente, nel caso delle varieta (in cui in luogo diV si haTM =S

x TxM) sot-to cambiamento di coordinate le componenti del tensoreT si trasformano nel modosuddetto (si ripensi alla definizione della metricag e alla legge di trasformazionedelle sue componentigik). Si noti che, conformemente alla osservazione appenafatta sopra, questa definizione geometrica comprende come caso particolare ancheil vettore, pensato come funzionale lineare suV∗, ovverov : V∗ → IR.

Si noti anche come questi tensori di tipor, s sono una generalizzazione del“tensore prototipo” di ordine zero, cioe lo scalare.46

E interessante notare che vale anche l’inverso di quanto detto sopra: se un certoentee definito mediante componenti che si trasformano nel modo sopra indicato,allora tale ente ha significato geometrico, cioe e un funzionale multilineare del tipodetto sopra.

Esempio. Sia dato uno spazio vettoriale V , sicche sappiamo che ivettoriv∈V hanno componenti che si trasformano con la regola v′ i =∂x′ i

∂xk vk. Ammettiamo ora di avere un ente definito da componentiαi

che si trasformano con la leggeα′i =

∂xk

∂x′ iαk. Vogliamo mostrare che le

componenti{αi} definiscono un covettoreα : V → IR. Dunque, perogni vettorev si deve avere un risultatoα(v) che non dipende dallabase scelta, ovvero si deve avere

αivi = α′

k v′ k .

E infatti si ha47

α′i v′ i =

∂xl

∂x′iαl

∂x′ i

∂xk vk =∂xl

∂x′ i∂x′ i

∂xk αl vk

= δlkαl v

k = αl vl

46Si tratta di una funzione a valori reali definita sulla varieta, diciamoF : M → IR. Essa definisceun numero reale per ogni punto della varieta; e allora la forma funzionale della funzionef cherappresentaF deve necessariamente variare al variare delle coordinate proprio in maniera tale chenon cambi il valore diF in corrispondenza di un definito punto della varieta. Ad esempio, seM e laretta reale, ex una coordinata, allora lo scalareF : M→ IR sara rappresentato da una funzione reale divariabile reale, diciamof = f (x). Se poi si passa a un’altra coordinatax′ = x′(x), allora la medesimafunzioneF : M → IR sara rappresentata da una diversa funzionef ′ definita daf ′(x′) = f (x(x′)).

47Si ricordi che gli indici su cui si somma sono “muti” o indici fantoccio (“dummy”) e si puo darloro un nome arbitrario.

Page 37: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 305

Qui si e fatto uso della proprieta

∂xl

∂x′ i∂x′ i

∂xk = δlk ,

che, come gia osservato, none altro che il teorema di derivata dellafunzione composta (si somma su i, mentre l,k sono fissati!): si pensax funzione di x′ e poi x′ funzione di x, e si ricorda∂xl

∂xk = δlk.

L’esempio appena illustratoe un caso particolare della fondamentale

Regola della traccia (o della contrazione o della saturazione): Quan-do in una espressione contenente delle componenti tensoriali si som-ma su un indice ripetuto che si trova una volta in alto (indice di con-travarianza) e una volta in basso (indice di covarianza) (o, come sidice,si satura un indice in alto con uno in basso) si ottiene un tensoredi due ordini in meno, in cui “sono scomparsi quei due indici”. Cosıle quantita αivk individuano un tensore doppio1−1 (una volta con-travariante, una volta covariante), ma se si esegue la saturazione deidue indici si ha la quantita αivi chee uno scalare. Analogamente, seTkl

i sono le componenti di un tensore di tipo2−1, allora Tili (avendo

sommato su i) sono le componenti di un tensore di tipo1−0, ovverodi un vettore. Analogamente gikvk “ e un covettore”, mentre gikαk “ eun vettore”.

Questa proprieta e una immediata conseguemza della definizione (6.4.12)di tensore e della identita (6.4.8).

Veniamo infine all’ultimo richiamo di questo lungo paragrafo: esso riguarda glioperatori differenziali. Cominciamo con un

Esempio.Le quantita

∂i f :=∂ f∂xi

sono le componenti di un covettore (o meglio, di un campo covettori-ale)48 (se f e uno scalare), ovvero si trasformano secondo la legge

∂′i f ′ =∂xk

∂x′ i∂k f . (6.4.13)

Abbiamo qui denotato con f′ la funzione f in cui sie eseguito ilcambiamento di variabili, e anche∂′i f ′ ≡ ∂

∂x′ i f ′.

Dimostrazione. La (6.4.13)e nient’altro che la formula per laderivata di una funzione composta,

∂ f ′

∂x′ i=

∂ f∂xk

∂xk

∂x′ i.

48Si noti che l’aver posto l’indice in alto inxi conduce naturalmente ad un indice in basso per∂i(infatti l’indice i sta in alto al denominatore).

Page 38: Teoria della relativita ristretta.` Parte seconda

306 Andrea Carati e Luigi Galgani

Q.E.D.

Si conferma quindi che quello che di solito viene chiamato il “gra-diente” none un vettore (meglio campo vettoriale) ma un covettore(campo covettoriale). Il vettore gradientee invece definito “alzandogli indici”, cio e e dato da∂i f := gik∂k f .

Si potrebbe allora pensare ingenuamente che eseguendo successive operazionidi derivazione si ottengano sempre tensori, di ordine opportuno, cioe che ogni op-erazione di derivazione aggiunge un indice di covarianza. Ma cio none vero, comemostra il seguente

Lemma. Per le derivate successive di una funzione scalare f vale lalegge di trasformazione

∂′i∂′k f ′ =

∂xl

∂x′ i∂xm

∂x′ k∂l ∂m f +

∂2xm

∂x′ i∂x′ k∂m f . (6.4.14)

Dimostrazione. Per il teorema di derivata di una funzione composta(6.4.13) si ha

∂′i∂′k f ′ =

∂xl

∂x′ i∂l

( ∂xm

∂x′ k∂m f

)=

∂xl

∂x′ i∂xm

∂x′ k∂l ∂m f +

∂xl

∂x′ i∂l

( ∂xm

∂x′ k

)∂m f .

In tal modoe stato determinato il primo termine a secondo membrodella (6.4.14). Nel secondo termine si usa poi

∂l =∂x′ p

∂xl ∂′p

e si ricorda ∂x′ p

∂xl∂xl

∂x′ i = δpi . Q.E.D.

Tuttavia la situazionee molto piu semplice se ci si limita a considerare trasfor-mazioni di coordinate che siano lineari. Si ha infatti il

Corollario. Se ci si limita a trasformazioni di coordinate x′ i = x′ i(x1. . . . ,xn)lineari, le quantita ∂i∂k f si comportano come le componenti di untensore due volte covariante.

Dimostrazione. Poiche anche la trasformazione inversae lineare,si ha

∂2xm

∂x′ i∂x′ k= 0 .

Dunque nella legge di trasformazione (6.4.14) si annulla il secondotermine, e ci si riduce alla legge di trasformazione dei tensori duevolte covarianti. Q.E.D.

Page 39: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 307

In effetti, esiste un modo generale per ottenere quantita geometriche (cioe aven-ti carattere tensoriale) per derivazione di tensori quando si abbia a disposizione unametrica. Questo procedimento fu inventato da Levi Civita nel 1916 e fu poi gen-eralizzato da H.Weyl (derivata covariante) ede stato da noi implicitamente usato,senza farlo notare esplicitamente, nella deduzione dell’equazione di Lagrange.

Dimenticandoci ora del problema generale della derivata covariante, ci bastaqui avere constatato (nel caso delle derivate seconde, ma si vede subito che il risul-tatoe generale) che, se ci si limita a trasformazioni lineari (come le rotazioni nellospazio euclideo, e le trasformazioni di Lorentz nello spaziotempo),e vero cheleoperazioni di derivazione aggiungono altrettanti indici di covarianza. Ad esem-pio, se ci si limita a trasformazioni lineari, allora∂i∂k f (dove f e uno scalare) sicomporta come un tensore due volte covariante (di tipo 0−2); analogamente, sevi

sono le componenti di un vettore (o meglio, di un campo vettoriale), allora∂k vi sicomporta come un tensore di tipo 1−1, e∂ivi come uno scalare (la divergenza delcampo vettorialev) e cosı via.

Particolarmente importantee il seguente esempio, che sara di fondamentaleinteresse per il campo elettromagnetico. SeAµ e un vettore, eAµ il corrispon-dente covettore, allora∂µAν e un tensore due volte covariante, come loe anche iltensoreFµν := ∂µAν − ∂νAµ. Questo tensore doppioFµν e evidentemente emisim-metrico (Fµν = −Fνµ), sicche e individuato da 6 componenti. SeAµ ≡ (Φ,A) e ilquadripotenziale, allora verificheremo che le componenti indipendenti del tensoreFµν sono proprio le componenti del campo elettricoE e del campo magneticoH. IltensoreFµν viene talvolta dettoTensore di Faraday.

Possiamo infine concludere questi cenni di calcolo tensoriale con il seguentefondamentale esempio.

Invarianza in forma dell’operatore dalembertiano sotto trasfor-mazioni di Lorentz. Si osserva anzitutto che in un sistema inerziale(con coordinate spaziali cartesiane ortogonali), avendo la metrica gµνla forma diagonalediag(1,−1,−1,−1), il dalembertiano (denotiamo∂2

tt = ∂t∂t e cosı via)

� := ∂2tt − (∂2

xx+∂2yy+∂2

zz)

si esprime nella forma

� = gµν∂µ∂ν .

Questa formae quella buona, perche satura due indici, uno in alto euno in basso, e fornisce uno scalare. Sappiamo pertanto che, se orapassiamo ad un altroarbitrariosistema di coordinate49, si avra

� ′ = g′ µν∂′µ∂′ν

49Sottointendiamo, ottenuto con trasformazioni lineari, perche altrimenti dovremmo introdurre laderivata covariante in luogo dell’ordinaria derivazione.

Page 40: Teoria della relativita ristretta.` Parte seconda

308 Andrea Carati e Luigi Galgani

dove g′ µν avra una certa espressione fornita dalla regola

g′ µν =∂x′ µ

∂xλ∂x′ ν

∂xσ gλσ .

Tale espressione risulta in generale alquanto complicata. Ma se cilimitiamo a considerare trasformazioni di Lorentz, sappiamo che questesonoisometrie, ovvero sono tali che50 g′ µν = diag(1,−1,−1,−1),e dunque si ha ancora

� ′ = ∂2t ′t ′− (∂2

x′x′ +∂2y′y′ +∂2

z′z′) .

Esercizio: Soluzioni dell’equazione di d’Alembert in forma di ondepiane, ed effetto Doppler. Cerchiamo la soluzione dell’equazione did’Alembert∂µ∂µΦ = 0, ovvero gµν∂µ∂νΦ = 0, nella forma

Φ = Aexp[ikµxµ]

con dei parametri kµ liberi: si tratta di onde pianeperche il luogogeometricoΦ =coste definita dalla condizione kµxµ = cost, e questocorrisponde a una famiglia di piani (nello spaziotempo) parametriz-zati dal covettore kµ. La condizione cheΦ soddisfi l’equazione did’Alembert si traduce allora nella condizione gµνkµkν = 0, ovvero

kµkµ = 0 . (6.4.15)

Dunque i vettori kµ associati ai covettori kµ sonovettori nulli (hannopseudolunghezza nulla). La relazione (6.4.15) viene dettarelazionedi dispersionee la ragionee la seguente. Scriviamo kµxµ nella formatradizionale

kµxµ = ωt−k ·x ,

il che vuol dire che il quadrivettore kµ associato al covettore kµ vienedecomposto in parte temporale (frequenza angolare o pulsazione) eparte spaziale (vettore d’onda) come

{kµ}= (ωc

,k) .

Allora la (6.4.15) fornisce una relazione tra frequenzaω e vettored’ondak che viene appunto dettarelazione di dispersione. Nel caso disoluzioni dell’equazione di d’Alembert (onde nel vuoto), tale relazioneha la forma(ω/c)2−||k||2 = 0, ovvero

|ω|= ck, k = ||k|| .50Piu direttamente, avremmog′µν = gµν, ma poi segue allorag′ µν = gµν.

Page 41: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 309

Esercizio: Si deduca la formula per l’effetto Doppler relativistico perun “boost” di Lorentz (K′ trasla con velocita v lungo l’asse x di K. Sel ,m,n) denotano i coseni direttori del vettore d’ondak (ad esempio,kx = lk = lω/c, allora si trovi

ω′ = γ(ω−vl/c) . (6.4.16)

Si ottengano anche le analoghe relazioni per i coseni direttori del vet-tore d’ondak nel sistema K′. Si confronti l’articolo originale di Ein-stein, paragrafo 7 (Si faccia attenzione al fatto che nell’articlo origi-nale Einstein denota conβ il fattore di Lorentz che oggi tutti denotanoconγ)

6.5 L’elettromagnetismo in forma covariante (o tensori-ale)

6.5.1 Forma covariante della relazione tra potenziali e campi: il ten-sore di Faraday.

La realazione tra potenziali e campie l’ambito in cui il passaggio dal formalismotridimensionale e quello quadridimensionale nello spaziotempo manifesta tutta lasua potenzialita; infatti la relazione tra potenziali e campi prende una forma di unasemplicita e una simmetria stupefacenti.

Ricordiamo brevemente quanto avevamo gia visto con il formalismo elementaretridimensionale. Avevamo introdotto i potenziali scalareΦ e vettoreA, che forni-vano i campiE eH mediante le formule

E =−gradΦ− 1c

∂A∂t

, H = rotA , (6.5.1)

come traduzione delle equazioni di Maxwell omogenee. Le equazioni inomogeneeassumevano invece, nel gauge di Lorentz

1c

∂Φ∂t

+divA = 0 , (6.5.2)

la forma di d’Alembert�Φ = ρ , �A = j/c . (6.5.3)

Osserviamo ora la potenza del formalismo quadridimensionale. Il primo passoconsiste nel porre come assioma che la densita di caricaρ e la densita di correntejsi mettono assieme a formare il quadrivettore densita di quadricorrentejµ definitada51

{ jµ} ≡ (ρc, j) . (6.5.4)

51Si deve pensare che la densita di correntej associata a una particella coincida conρv dovev e lavelocita della particella eρ la corrispondente densita di carica.

Page 42: Teoria della relativita ristretta.` Parte seconda

310 Andrea Carati e Luigi Galgani

Da qui segue allora che anche i potenziali costituiscono un quadrivettore, cioe sipuo porre

{Aµ} ≡ (Φ,A) . (6.5.5)

Questae infatti coerente con la (6.5.4), perche il dalembertianoe invariante.Il primo risultato che si ottiene allorae che la condizione di Lorentz (6.5.2)

viene scritta in forma quadridimensionale nella semplicissima e simmetrica forma

∂µAµ = 0 . (6.5.6)

Inoltre, anche le relazioni tra potenziali e campi, dalla loro forma estremamenteasimmetrica (6.5.1) vengono ad assumere una forma estremamente elegante e sem-plice nel formalismo quadridimensionale. Infatti si ha ad esempio

Hz = ∂1A2−∂2A1

Ez =−∂0A3−∂3A0 ,

e si osserva anzitutto che questa scrittura assume forma piu simmetrica se si ab-bassano gli indici (dunque, cambiando di segno alle componenti spaziali), percheallora si ha

−Hz = ∂1A2−∂2A1

Ez = ∂0A3−∂3A0 .

Considerando anche le altre relazioni in maniera analoga,e allora spontaneo intro-durre il tensore doppio

Fµν = ∂µAν−∂νAµ (Fµν =−Fνµ) , (6.5.7)

chee evidentemennte antisimmetrico, e dunquee individuato da 6 componenti in-dipendenti. Infatti si riconosce immediatamente che le sue componenti, in terminidei campi, sono date da

{Fµν

}=

0 Ex Ey Ez

−Ex 0 −Hz Hy

−Ey Hz 0 −Hx

−Ez −Hy Hx 0

. (6.5.8)

Si vede dunque che il campo elettrico e il campo magnetico costituiscono unaunita, il tensore doppio antisimmetricoFµν (detto talvoltatensore di Faraday). Unpunto crucialee che la struttura tensoriale del quadrivettoreAµ comporta auto-maticamente una struttura tensoriale perFµν (tensore due volte covariante), siccheviene automaticamente stabilito qualee la legge di trasformazione delle sue com-ponenti (e quindi anche dei campiE, H) quando si compie una trasformazione diLorentz sulle coordinate. Svolgeremo questo esercizio piu sotto, verificando che siottengono proprio le leggi di trasformazione gia trovate piu sopra con il metodo el-ementare alla Lorentz, Poincare ed Einstein (metodo forza bruta). Questo esempiodovrebbe illustrare in maniera sufficiente le parole di Einstein citate piu sopra:

Page 43: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 311

“Egli (Minkowski) invece riuscı ad introdurre un formalismo tale chela forma matematica della legge garantisce di per se l’invarianza dellaleggestessa rispetto alle trasformazioni di Lorentz. Creando un calco-lo tensoriale quadridimensionale, egli ottenne per lo spaziotempo cioche il calcolo tensoriale aveva ottenuto per le tre dimensioni spaziali.”

Mostreremo anche quale forma assumono le equazioni di Maxwell in terminidel tensore di Faraday. Preliminarmente, osserviamo che il tensore antisimmetricoFµν associato adFµν secondo le regole per l’innalzamento degli indicie dato da

{Fµν

}=

0 −Ex −Ey −Ez

Ex 0 −Hz Hy

Ey Hz 0 −Hx

Ez −Hy Hx 0

. (6.5.9)

6.5.2 Le equazioni di Maxwell in termini del tensore di FaradayFµν.

Si ha la

Proposizione. In termini del tensore di Faraday Fµν = ∂µAν − ∂νAµ,le equazioni di Maxwell inomogenee si scrivono (in coordinate carte-siane ortogonali rispetto alla metrica di Lorentz) nella forma

∂µFµν = jν/c (ν = 0,1,2,3) , (6.5.10)

mentre le equazioni omogenee assumono la forma

∂λFµν +∂µFνλ +∂νFλµ = 0 , (λ,µ,ν = 0,1,2,3) . (6.5.11)

Dimostrazione. Per le equazioni inomogenee la verificae immedi-ata. Per quanto riguarda quelle omogenee, osserviamo anzitutto chele equazioni che si ottengono in tal modo sono proprio in numero di 4,e corrispondono alle scelte possibili degli indici(λ,µ,ν) tutti diversitra di loro, ovvero(0,1,2) , (0,1,3) , (0,2,3) , (1,2,3) . Infatti siverifica facilmente che in tutti gli altri casi, per l’antisimmetria di F,Fµν = −Fνµ, si ottiene l’identita 0 = 0. Nei casi non banali si ha adesempio:

(0,1,2)→ ∂0F12+∂1F20+∂2F01 = 0

cioe la terza componente di1c∂tH + rotE = 0. Inoltre si ha

(1,2,3)→ ∂1F23+∂2F31+∂3F12 = 0

ovverodivH = 0. Q.E.D.

Page 44: Teoria della relativita ristretta.` Parte seconda

312 Andrea Carati e Luigi Galgani

Esercizio.Verificare che la legge generale di trasformazione delle componenti deitensori, applicata al tensore di Faradyay, fornisce per la trasformazione dei campiesattamente quella precedentemente trovata con il metodo di Lorentz, Poincare edEinstein.Svolgimento. Si veda Landau Lifshitz, Teoria dei campi, paragrafo 24.

6.6 Particella in campo elettromagnetico

6.6.1 Equazioni di moto in forma covariante (con campi assegnati)

Seguendo il procedimento induttivo sviluppato nella prima parte di questo capito-lo siamo gia pervenuti all’assioma che l’azione hamiltoniana di una particella incampo elettromagneticoe data da

S=−Z (

mc+ecg(A,u)

)ds , (6.6.1)

doveg(A,u) e il prodotto scalare tra quadrivelocitauµ e quadripotenzialeAµ,

g(A,u) = gµνAµuν = Aµuµ ,

ovvero

S=−Z (

mc+ecAµuµ)ds . (6.6.2)

Facendo uso della scrittura (6.6.1) per l’azione, abbiamo gia ottenuto per una par-ticella in campo elettromagnetico l’equazione di moto in forma tridimensionale,ovvero

ddt

(mγv) = e(E+1c

v×H) , (6.6.3)

con il corrispondente teorema dell’energia

ddt

mγc2 = eE ·v , (6.6.4)

e vogliamo ora scrivere le corrispondenti equazioni in forma covariante. Otterremoin tal modo 4 equazioni, di cui la componente spaziale coincidera con la (6.6.3),mentre la componente temporale fornira il teorema dell’energia (6.6.4).

Proposizione.L’equazione di moto per una particella in campo elet-tromagnetico, scritta in forma covariante,e data da

mc2aµ = eFµνuν (µ= 0,1,2,3) (6.6.5)

o equivalentemente da

mc2aµ = eFµνuν (µ= 0,1,2,3) . (6.6.6)

Page 45: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 313

Dimostrazione. L’azione hamiltoniana (6.6.2) ha la forma

S=Z

Lds

conL = L(mecc)− e

cAµuµ ,

dove L(mecc) = −mcL, mentreL e la lagrangiana usata nel capito-lo precedente per studiare le geodetiche della particella libera. Imovimenti naturali sono allora le soluzioni xµ(s) delle equazioni diEulero–Lagrange

dds

∂L∂uµ −

∂L∂xµ = 0 .

Avevamo gia eseguito il calcolo che fornisce

∂L(mecc)

∂uµ =−mcuµ .

Dunque si trova∂L∂uµ =−mcuµ−

ecAµ ,

∂L∂xµ =

ec(∂µAν)uν .

Pertanto si ha

dds

∂L∂uµ − ∂L

∂xµ

=−mcaµ− ec

[(∂νAµ)uν +(∂µAν)uν]

=−mcaµ+ ec

(∂µAν−∂νAµ

)uν

=−mcaµ+ ec Fµνuν ,

e dunque le equazioni di Eulero–Lagrange hanno la forma

mcaµ =ecFµνuν .

Q.E.D.

Esercizio. Controllare che la componente spaziale dell’equazione dimoto quadridimensionale (6.6.6) fornisce la (6.6.3), e che la compo-nente temporale fornisce il corrispondente teorema dell’energia (6.6.4).

Page 46: Teoria della relativita ristretta.` Parte seconda

314 Andrea Carati e Luigi Galgani

APPENDICE: SUL DUALE DI UNO SPAZIO VETTORIALE

La base duale.Cominciamo con l’osservare che, data una base{ei} in V, esistonon covettori che si possono veramente toccare con mano. Si tratta dei covettori checorrispondono alla familiare operazione di “misurare i vettori”, cioe misurare lecomponenti di un vettore rispetto alla base assegnata. Infatti, ben sappiamo che,data la base, ogni vettorex e univocamente determinato da componentix1, . . . ,xn

tramite la (6.4.1),x = ∑i xiei ≡ xiei . Si tratta ora di compiere l’operazione inversa,

cioe determinare le componenti quando sia dato il vettore. Il salto psicologico chesi deve compieree di pensare alle componenti come ottenute mediante un’oper-azione, cioe come unafunzioneche produce un numero in corrispondenza di ognivettore. Fissato un ben definito vettore tra i vettori baseei , ad esempioe1, allora ilnumerox1 e una funzione a valori reali definita suV, ovvero si hax1 : V → IR, edeevidente che tale funzionee lineare. Dunque l’operazione di misurare (o estrarre)la i–esima componente di un vettore quando sia fissata una base52 e un covettore,che denoteremo conεi :

εi (∑k

xkek)≡ εi (xkek) = xi . (6.6.7)

Equivalentemente, il covettoreεi e definito da

εi(ek) = δik . (6.6.8)

Dovrebbe dunque essere chiaro che il covettoreα definito dallan–uplaα1, . . . ,αn

mediante la (6.4.2) puo essere pensato come combinazione lineare deglincovettori–baseεi , precisamente la combinazione

α = ∑i

αiεi , (6.6.9)

quando si sottintenda di prendere la naturale definizione di combinazione lineare.53

Infatti la (6.6.9) e nient’altro che una riscrittura della (6.4.3). In questo sensodunque, assegnata una base{ei} in V, risulta che nello spazio dualeV∗ e cor-rispondentemente assegnata una ben definita base, ovvero la{εi} definita dalla(6.6.7) o dalla (6.6.8). Questa viene detta“base duale”. Se si hanno un vettorex ∈ V e un covettoreα ∈ V∗ individuati dalle loro componentixi ed αi nel sen-

52Abbiamo gia ricordato che qui si considerano i vettori a livello puramente algebrico, senzaalcun riferimento a un eventuale prodotto scalare, cioe senza nessuna nozione di ortogonalita, o basiortonormali.

53Ovvero, dati due covettoriα, β e due numeri realia, b, il covettoreaα+bβ e definito da

(aα+bβ)(x) := aα(x)+bβ(x) per ognix ∈V .

Page 47: Teoria della relativita ristretta.` Parte seconda

Meccanica Razionale 1: Teoria della relativita, parte seconda 315

so chex = ∑xiei ≡ xiei , α = ∑αiεi ≡ αiεi , allora si haα(x) = ∑αixi ≡ αixi . 54

Dunque, l’i–esimo covettore–baseεi agisce su ogni vettore estraendone la i–esimacomponente (misura la i–esima componente del vettore).

Covettori, e iperpiani dello spazio vettorialeV. Abbiamo dunque illustrato comeesistano dei covettori ben concreti, che corrispondono a misurare le componentidei vettori rispetto ad una base assegnata, e inoltre come ogni covettore sia com-binazione lineare di quelli. Ma ci si puo anche domandare se i covettori possanoessere descritti in maniera intrinseca, ovvero in maniera indipendente dalla sceltadella base, e addirittura con riferimento allo spazio vettorialeV su cui essi sonodefiniti. La rispostae assolutamente positiva. Anzitutto, ogni covettore individuaun piano (o un iperpiano, nel cason > 3) nello spazio vettorialeV. Infatti, fissatoun covettoreα ∈V∗ (con certe componenti(α1, . . . ,αn) relative alla scelta di unabase inV), si consideri il sottoinsieme diV definito da

Π = {x ∈V : α(x) = 0 , ovvero ∑i

αixi = 0} ; (6.6.10)

in altri termini, Π e il nucleo(ingl. kernel) del funzionale lineareα. Allora tuttisappiamo cheΠ e un piano passante per l’origine dello spazio vettorialeV. Si notiche ogni covettoreβ = aα (a∈ IR), multiplo di quello considerato, evidentementedefinisce lo stesso pianoΠ. Viceversa, ad ogni piano passante per l’origine diVsono associati infiniti covettori, che si ottengono l’uno dall’altro moltiplicando unoarbitrario di essi per un numero. Se si vuole,e possibile poi identificare ognuno ditali covettori assegnando, in aggiunta al piano passante per l’origine, anche il pianoad esso parallelo sul quale quel particolare covettore prende il valore 1. Si capiscedunque perche i covettori svolgono un ruolo importante in ottica nella discussionedei fronti d’onda, e piu in generale nello studio dei fenomeni di propagazione delleonde.

Nelle trattazioni elementari riferite allo spazio euclideoE3, non si fa alcunriferimento ai covettori perche un piano passante per l’origine viene definito at-traverso la scelta di un vettoren ad esso ortogonale. Ovvero, fissato il vettoren inE3, il pianoΠ e definito da

Π = {x ∈ IR3 : x ·n = 0} . (6.6.11)

Ma, come gia abbiamo osservato, cio e possibile solo in virtu del fatto che nellospazio euclideoE3 e assegnata una metrica (cioe un prodotto scalare), e questo

54Da quanto detto risulta in particolare cheV eV∗ hanno la stessa dimensione, perche ogni cov-ettoreα ∈ V∗ e univocamente individuato dan numeriαi . Naturalmente, ancheV∗, essendo unospazio vettoriale, avra il suo duale, che coerentemente denoteremo con(V∗)∗, o piu semplicemnteconV∗∗ (biduale diV) e si mostra iimediatamente che (nel caso finito–dimensionale) si haV∗∗ = V.InveceV∗ eV sono proprio due spazi diversi, che possono venir posti in corrispondenza biunivoca inmaniera “naturale” solo quando si introduca un nuovo elemento nello spazio vettoriale, ad esempio(come nel caso che a noi interessa qui) una metrica, ovvero un prodotto scalare, comee mostrato neltesto.

Page 48: Teoria della relativita ristretta.` Parte seconda

316 Andrea Carati e Luigi Galgani

fatto, come mostriamo nel testo, fornisce un isomorfismo naturale tra vettori e cov-ettori. Si tenga tuttavia presente che, se si prende inV una base che none ortonor-male rispetto all’assegnato prodotto scalare, allora i coefficienti che figurano nelladefinizione analitica del piano, ovvero i numeriαi (le componenti del covettoreα definente il piano), non coincidono affatto con le componenti del vettoren chefigura nella definizione (6.6.11). Questo fattoe spesso causa di confusione nelletrattazioni elementari.