teoria della relativita ristretta.` parte seconda: … 1/relativitasecondo...capitolo 6 teoria della...

48
Capitolo 6 Teoria della relativit` a ristretta. Parte seconda: particella in campo elettromagnetico (trattazione covariante) 6.1 Le equazioni di Maxwell e i potenziali elettromagneti- ci Nel capitolo precedente abbiamo discusso in maniera elementare (seguendo so- stanzialmente la esposizione divulgativa di Einstein) la cinematica relativistica, mostrando in particolare come il principio di costanza della velocit` a della luce conduce a postulare che lo spaziotempo ` e munito di un opportuno prodotto scalare pseudoeuclideo. Abbiamo poi mostrato come questa geometrizzazione dello spa- ziotempo induca spontaneamente (attraverso il principio di Hamilton dell’azione stazionaria) a fornire una espressione per la lagrangiana della particella libera, la cui conseguenza pi` u rilevante ` e che esiste per ogni particella una energia a riposo, data dalla celebre formula di Einstein E = mc 2 . Questi argomenti corrispondo- no sostanzialmente a quelli discussi nell’articolo del 1905 di Einstein: la cinema- tica nella prima parte (paragrafi da 1 a 5), la dinamica nell’ultimo paragrafo, il decimo. 1 ) Nel presente capitolo ci occupiamo invece, almeno parzialmente, dell’analogo della seconda parte dell’articolo originario di Einstein (paragrafi dal 6 al 9), che ` e dedicata all’elettrodinamica. La trattazione viene qui svolta a due livelli. In una 1 Si osservi per ` o che la trattazione della dinamica da parte di Einstein ` e alquanto diversa da quella che ` e stata svolta qui, seguendo Planck e Levi–Civita. Si noti in particolare che la relazione E = mc 2 viene data da Einstein non nell’originario articolo del 1905, dal titolo L’elettrodinamica dei corpi in movimento, ma in una brevissima nota successiva, dal titolo L’inerzia di un corpo dipende dal suo contenuto di energia?, in cui si fa un uso essenziale delle propriet` a del campo elettromagnetico, anzich´ e della pura dinamica di una particella. 257

Upload: others

Post on 08-Jun-2020

13 views

Category:

Documents


0 download

TRANSCRIPT

Capitolo 6

Teoria della relativita ristretta.Parte seconda: particella incampo elettromagnetico(trattazione covariante)

6.1 Le equazioni di Maxwell e i potenziali elettromagneti-ci

Nel capitolo precedente abbiamo discusso in maniera elementare (seguendo so-stanzialmente la esposizione divulgativa di Einstein) la cinematica relativistica,mostrando in particolare come il principio di costanza della velocita della luceconduce a postulare che lo spaziotempo e munito di un opportuno prodotto scalarepseudoeuclideo. Abbiamo poi mostrato come questa geometrizzazione dello spa-ziotempo induca spontaneamente (attraverso il principio di Hamilton dell’azionestazionaria) a fornire una espressione per la lagrangiana della particella libera, lacui conseguenza piu rilevante e che esiste per ogni particella una energia a riposo,data dalla celebre formula di Einstein E = mc2. Questi argomenti corrispondo-no sostanzialmente a quelli discussi nell’articolo del 1905 di Einstein: la cinema-tica nella prima parte (paragrafi da 1 a 5), la dinamica nell’ultimo paragrafo, ildecimo.1)

Nel presente capitolo ci occupiamo invece, almeno parzialmente, dell’analogodella seconda parte dell’articolo originario di Einstein (paragrafi dal 6 al 9), che ededicata all’elettrodinamica. La trattazione viene qui svolta a due livelli. In una

1Si osservi pero che la trattazione della dinamica da parte di Einstein e alquanto diversa da quellache e stata svolta qui, seguendo Planck e Levi–Civita. Si noti in particolare che la relazione E = mc2

viene data da Einstein non nell’originario articolo del 1905, dal titolo L’elettrodinamica dei corpiin movimento, ma in una brevissima nota successiva, dal titolo L’inerzia di un corpo dipende dalsuo contenuto di energia?, in cui si fa un uso essenziale delle proprieta del campo elettromagnetico,anziche della pura dinamica di una particella.

257

258 Andrea Carati e Luigi Galgani

prima parte la trattazione viene svolta a livello “elementare”, ovvero senza fare ri-corso al calcolo tensoriale, come d’altra parte avviene nella trattazione di Einstein.Preliminarmente, verranno forniti dei richiami sulle equazioni di Maxwell in mododa costruire un ponte con la trattazione familiare allo studente dai corsi di FisicaGenerale.

In una seconda parte le equazioni di Maxwell e le equazioni di moto per unaparticella in campo elettromagnetico vengono poi discusse con i metodi del calcolotensoriale (che Einstein utilizzo in una fase successiva, quando ne ebbe bisogno performulare la relativita generale). E ovvio che questa trattazione richiederebbe dun-que un lungo excursus di tipo geometrico sul calcolo tensoriale, che nel presentecorso non abbiamo la possibilita di svolgere in maniera completa. Si deve dunquecompiere un difficile compromesso. Siamo fiduciosi che la scelta qui compiutapossa risultare positiva.

6.1.1 Le equazioni di Maxwell (con sorgenti assegnate)

Le equazioni di Maxwell (1873) costituiscono un miracolo della storia della fisica,sı da fare esclamare enfaticamente a Boltzmann, citando il Faust di Goethe: “Wares ein Gott welcher diese Zeichen schrieb ?” (Fu un Dio che scrisse queste righe?). Esse compendiano in linea di principio tutto l’elettromagnetismo. In partico-lare, il termine descrivente la “corrente di spostamento”, introdotto da Maxwellper puri motivi di consistenza interna della teoria, fa sı che le equazioni prevedanol’esistenza di onde elettromagnetiche nel vuoto, che si propagano esattamente conla velocita della luce c, sicche l’ottica stessa viene ridotta a fenomeno elettroma-gnetico. La propagazione di onde elettromagnetiche con frequenze di gran lungainferiori a quelle ottiche venne successivamente osservata da Hertz (su suggeri-mento di Helmholtz), e questo fatto diede poi origine a tutte le applicazioni cheben conosciamo: la radio, la televisione...2

E noto che in elettromagnetismo si considerano quattro campi descritti dai vet-tori E,D,B,H, che pero nel vuoto si riducono a due soli, perche si ha D = E,B = H. Noi ci limiteremo alle equazioni nel vuoto, e faremo riferimento ai cam-pi E ed H che chiameremo semplicemente campo elettrico e campo magnetico. Siammette che l’azione ponderomotrice dei campi (cioe l’azione meccanica, la forza,esercitata sulla materia) sia data dalla forza di Lorentz

F(em) = e(E+vc×H) (6.1.1)

su una particella di carica “e” e velocita v; inversamente, la distinzione tra campoelettrico E e campo magnetico H e proprio la circostanza che il primo agisce anchesu una particella ferma, mentre il secondo produce una forza proporzionale alla ve-locita della particella,3 e dunque non agisce su una particella ferma. Proprio questa

2I lavori di Hertz sono riprodotti in un volume della Dover.3Almeno per particelle non dotate di momento magnetico intrinseco.

Meccanica Razionale 1: Teoria della relativita, parte seconda 259

circostanza mostra che la distinzione tra campo elettrico e campo magnetico (ov-vero il corrispondente spezzamento della forza di Lorentz) e relativa e non assoluta(cioe dipende dal sistema di riferimento). Su questo punto importante ritorneremopiu sotto, mostrando che i campi E ed H costituiscono una unita (Tensore di Fa-raday, di ordine 2 ed emisimmetrico) nello spaziotempo, nello stesso senso in cuicostituisce una unita un vettore in IRn, che e un oggetto assoluto, ovvero indipen-dente dalla base eventualmente scelta (mentre le componenti del vettore non sonoassolute, ma dipendono dalla base). Ma per ora procediamo in maniera elementare.

Le equazioni di Maxwell nel vuoto hanno la forma (usiamo il sistema CGSelettromagnetico, forse poco familiare allo studente, ma la scelta delle unita e deltutto irrilevante)

div H = 0

rot E+1c

∂H∂t

= 0 (6.1.2)

div E = ρ

rot H− 1c

∂E∂t

= j/c , (6.1.3)

dove ρ = ρ(t,x), j = j(t,x) sono la densita di carica e la densita di corrente, che sipensano assegnate funzioni di (t,x) (materia data o assegnata, come si usa dire),mentre c e la velocita della luce nel vuoto.4 Le prime due equazioni si diconocostituire la coppia omogenea (non hanno secondi membri), mentre le altre duecostituiscono la coppia non omogenea, o con sorgenti. Come si vede, si tratta diequazioni lineari nei campi, sicche vale il principio di sovrapposizione (che e unteorema): “i campi generati da (ρ1 +ρ2, j1 + j2) sono la somma dei campi creati da(ρ1, j1) e da (ρ2, j2)”.

Osservazione Come detto sopra, abbiamo qui usato il sistema CGSelettromagnetico, comune a tutti i grandi trattati di fisica teorica, co-me tipicamente il classico testo di Landau e Lifshitz. L’elemento piucaratteristico e forse il fatto che tale sistema fa intervenire nelle equa-zioni di Maxwell la velocita della luce c, mentre nelle equazioni scrittenella forma probabilmente nota agli studenti5 intervengono la costan-te dielettrica ε0 e la permeabilita magnetica µ0 del vuoto. Questa

4Dal punto di vista mnemonico, e semplicissimo ricordare in quale modo c figuri nelle equazioni.Dove appare il tempo t, lı c’e sempre c, in maniera che appaia la formazione ct (sicche si potrebbeprendere come variabile in luogo del tempo la quantita τ = ct). Per questo motivo avviene ancheche la velocita v appare sempre nella forma v/c (si pensi v come la derivata della posizione di unaparticella rispetto al tempo), e lo stesso avviene per la corrente o la densita di corrente (perche ladensita di corrente dovuta a una particella e proporzionale alla sua velocita).

5Ovvero, div B = 0 , rot E+ ∂B∂t = 0 , div D = ρ , rot H =

(j+ ∂D

∂t

), B = µ0H , D = ε0E. Si veda

ad esempio R. Becker, Electromagnetic fields and interactions, Dover (New York, 1964), Sez. 53,pag. 257.

260 Andrea Carati e Luigi Galgani

introduzione di c e resa possibile dal fatto che la quantita 1/(µ0ε0) hale dimensioni di una velocita al quadrato, e il suo valore risulta esse-re proprio c2, una circostanza questa che era nota prima di Maxwell,e che faceva gia presagire che l’elettricita e il magnetismo potesse-re essere connessi anche con l’ottica. Cio e proprio vero. Infatti,le equazioni di Maxwell costituiscono anzitutto una generalizzazionedelle equazioni che riassumono l’elettrostatica e la magnetostatica alcaso di campi dipendenti dal tempo, in modo da includere la legge diinduzione di Faraday. Maxwell pero aggiunge nella seconda equazio-ne inomogenea un opportuno termine (la “corrente di spostamento”1c

∂E∂t ), il quale ha la conseguenza che si hanno onde elettromagnetiche

che, nel vuoto, si propagano proprio con velocita c, la stessa dellaluce, sicche anche l’ottica viene incorportata nell’elettromagnetismo.Questi fatti vengono richiamati qui sotto.

Cominciamo con l’osservare che l’elettrostatica e la magnetostatica si otten-gono dalle equazioni di Maxwell come casi particolari statici (in cui cioe ∂H

∂t = 0,∂E∂t = 0, ∂ρ

∂t = 0, ∂j∂t = 0). Infatti in tal caso le equazioni (6.1.2) e (6.1.3), oppor-

tunamente redistribuite, si riducono alle due coppie (con ρ e j indipendenti daltempo)

rot E = 0

div E = ρ elettrostatica

div H = 0

rot H = j/c magnetostatica.

Ricordiamo che in elettrostatica e in magnetostatica si introducono rispettiva-mente il potenziale scalare Φ (rotE = 0 ⇒ ∃Φ : E = −grad Φ) e il potenzialevettore A (rotH = 0 ⇒ ∃A : H = rotA), entrambi non definiti univocamente (sipuo scegliere A in modo che divA = 0; si veda piu sotto), e dunque l’elettrostaticae compendiata nell’equazione6

−∆Φ = ρ

e la magnetostatica nell’equazione7

−∆A = j/c .

Nella sostanza, l’elettrostatica nel vuoto (e nello spazio infinito – altrimenti sihanno problemi di condizioni al contorno) si riduce alla legge di Coulomb, e la

6Si introduce l’operatore “laplaciano” ∆ := divgrad = ∂xx + ∂yy + ∂zz in coordinate cartesianeortogonali. Qui si e usata la notazione ∂x = ∂

∂x , ∂2xy = ∂2

∂x∂y e cosı via.7Si ricordi l’identita rot rot = grad div−∆, su cui diremo qualcosa piu sotto.

Meccanica Razionale 1: Teoria della relativita, parte seconda 261

magnetostatica nel vuoto si riduce alla Legge di Biot e Savart, che puo leggersidall’equazione rotH = j/c mediante il teorema di Stokes.

Nel caso generale (non statico) si passa alle equazioni di Maxwell cambiandol’equazione rotE = 0 nell’equazione rotE+ 1

c∂H∂t = 0, che traduce in termini diffe-

renziali la legge di induzione di Faraday (una variazione di campo magnetico pro-duce un certo ben definito campo elettrico). Si pensi all’analogia con rotH = j/c.Qui si ha rotE =−1

c∂H∂t : quindi, se e assegnato ∂H

∂t , questo campo svolge un ruoloanalogo a quello svolto da j nell’equazione di Biot e Savart, e quindi produce uncerto campo elettrico E analogo al campo magnetico H di Biot e Savart creato daj.

Infine, nel passaggio all’elettromagnetismo si cambia anche l’equazione rotH =j/c nell’equazione rotH = 1

c

(j+ ∂E

∂t

)che si legge nel modo seguente: una varia-

zione di campo elettrico produce un campo magnetico esattamente (a parte un se-gno) come nella legge di Faraday una variazione di campo magnetico produce uncampo elettrico. In altri termini, 1

c∂E∂t agisce come una corrente elettrica e viene

detto corrente di spostamento8. Proprio questo termine, introdotto da Maxwell perpure ragioni teoriche, fa sı che esistano le onde elettromagnetiche nel vuoto (l’a-naloga proprieta in presenza di materia verra dimostrata piu sotto facendo uso deipotenziali elettromagnetici). Si ha infatti la

Proposizione 1 In assenza di materia (ρ = 0, j = 0) i campi E,H soddisfano nelvuoto l’equazione di d’Alembert9

�E = 0 , �H = 0(� =

1c2

∂2

∂t2 −∆)

.

Dimostrazione. Si prende il rotore della seconda equazione omo-genea (6.1.2), ottenendo rot rotE = −1

c∂

∂t rotH (si scambiano ∂

∂t e rotper il teorema di Schwartz). Si sostituisce poi rotH prendendolo dal-la seconda equazione inomogenea (6.1.3) (ma con j = 0); usandorot rot = grad div−∆ e anche divE = 0, si ottiene −∆E = − 1

c2∂2E∂t2 .

Analogamente si trova l’equazione per H prendendo il rotore dellaseconda equazione inomogenea (con j = 0). Q.E.D.

Resta ora da capire di dove venga la necessita di aggiungere il termine con lacorrente di spostamento nella seconda equazione inomogenea. Cio e dovuto alfatto che si richiede, come nella meccanica dei sistemi materiali, che la densita dicarica ρ e la densita di corrente j soddisfino l’equazione di continuita

∂ρ

∂t+div j = 0 . (6.1.4)

8Perche in effetti si dovrebbe considerare 1c

∂D∂t , e il vettore D veniva chiamato “spostamento”

elettrico.9L’operatore � viene chiamato “quadratello” oppure “dalembertiano”.

262 Andrea Carati e Luigi Galgani

Ora, in magnetostatica, prendendo la divergenza nell’equazione rotH = j/c, invirtu dell’identita div rot = 0 si trova div j = 0. Se invece, seguendo Maxwell,poniamo rotH− 1

c∂E∂t = j/c, abbiamo div j =− ∂

∂t divE, e dall’equazione divE = ρ

otteniamo l’equazione di continuita.Dal punto di vista matematico, si avrebbe l’interessante problema di studiare

il problema di Cauchy per i campi, e l’ancor piu interessante problema di studiarevari problemi al contorno; ma di questi problemi qui non ci occupiamo.

Osservazione. Il principio di relativita e le equazioni di Maxwell:non assolutezza della distinzione tra campo elettrico e campo ma-gnetico. Come introduzione al problema dell’applicazione del prin-cipio di relativita all’elettromagnetismo, puo essere utile considerareil seguente semplice esempio. Vogliamo determinare i campi elettri-co e magnetico prodotti da un filo contenente una densita di carica ρ

(uniforme e indipendente dal tempo), anzitutto rispetto a un sistemainerziale K solidale col filo, e poi rispetto a un altro sistema inerzialeK′, in moto rispetto a K lungo la direzionde del filo.

Naturalmente stiamo ammettendo, conformemente al principio di re-lativita, che in tutti i sistemi inerziali valgano le equazioni di Max-well in cui figuri la medesima costante c. Anzi e proprio questa laformulazione pregnante di quello che avevamo chiamato principio dicostanza della velocita della luce, principio che nel capitolo prece-dente avevamo applicato in una forma ridotta (costanza della velocitadi propagazione dei raggi di luce, anziche costanza della velocita dipropagazione delle onde elettromagnetiche o, meglio ancora, anzicheinvarianza in forma delle equazioni di Maxwell). Infatti il problemache si poneva prima del 1905 era come dovessero cambiare le equa-zioni dell’elettromagnetismo al cambiare del sistema di riferimento,cioe passando da un supposto sistema privilegiato (in quiete rispettoall’etere) a ogni altro sistema traslante di moto uniforme rispetto aquello. Invece secondo il principio di relativita tutti i sistemi inerzialisono equivalenti anche rispetto alle equazioni di Maxwell, che devo-no mantenere la stessa forma in ogni sistema inerziale (e contenere lamedesima costante c).

Il problema di come debbano trasformarsi i campi verra discusso inun prossimo paragrafo. Qui, come esercizio preliminare, vogliamorestringerci a mettere in luce come il principio di relativita nel sen-so suddetto comporti che la distinzione tra campo elettrico e campomagnetico non sia assoluta, ma dipenda dal particolare sistema diriferimento considerato.

Nell’esempio che stiamo discutendo, ci si riduce a considerare le equa-zioni statiche, e quelle inomogenee danno

divE = ρ, rotH = j/c .

Meccanica Razionale 1: Teoria della relativita, parte seconda 263

Nel sistema “fisso (o stazionario)” (ovvero solidale con il filo), si hauna certa densita di carica, mentre la densita di corrente e nulla, j = 0.Dunque si ha un certo campo elettrico E 6= 0, mentre il campo magne-tico e nullo, H = 0 Ma, se osserviamo il filo da un sistema di riferi-mento inerziale K′ in moto rispetto al filo stesso, il filo appare comecontenente cariche in moto uniforme. Dunque per il sistema “mobile”si ha una certa densita di carica ρ′ 6= 0 che potremmo calcolare, men-tre per la densita di corrente sappiamo che essa e certamente diversada quella del sistema “fisso”, perche e nonnulla, j′ 6= 0. In conseguen-za, secondo la legge di Biot–Savart per il sistema “mobile” si ha uncerto campo magnetico nonnullo H 6= 0. Dunque nel primo sistema siha E 6= 0,H = 0 mentre nel secondo si ha H 6= 0. In conclusione, men-tre nel primo sistema, solidale col filo, si ha solo campo elettrico, nelsistema mobile rispetto al filo si ha invece anche un campo magnetico.La distinzione tra campo elettrico e campo magnetico non e assoluta,ma dipende dal sistema di riferimento.

In un prossimo paragrafo mostreremo che questo fatto corrisponde alfatto cha anche la distinzione tra densita di carica e densita di correntenon e assoluta, ma dipende dal sistema di riferimento, analogamente aquanto avviene per le componenti di un vettore al variare del sistemadi riferimento: il vettore e una quantita assoluta, indipendente dalsistema di riferimento, mentre ne dipendono le componenti (la primacomponente di un vettore puo essere nulla in un sistema e non in unaltro). In particolare, il principio di relativita permette di ottenerenell’esempio sopra considerato (in cui si ha ρ 6= 0 e j = 0) le densitaρ′ e j′ e vedremo che si trova ρ′ = γρ, jx′ =−γρ, j′y = j′z = 0.

Osservazione: Il problema della self force e l’equazione di Abraham–Lorentz–Dirac. Facciamo qui un ultimo commento, riguardante ilproblema della autointerazione delle particelle cariche attraverso ilcampo elettromagnetico da esse prodotto. Osserviamo anzitutto che,se si hanno delle particelle cariche, ad esse vengono associate certedensita di carica e di corrente, e dunque le particelle “creano”, comesorgenti nelle equazioni di Maxwell inomogenee, certi campi elettro-magnetici. Ma d’altra parte le particelle subiscono (attraverso la for-za di Lorentz) anche delle forze dovute ai campi, e quindi in qualchemodo anche una forza dovuta ai campi creati da esse stesse. E questoil cosiddetto problema dell’autocampo, o della self force. Si capiscecosı come nel discutere il moto di particelle in campi elettromagneti-ci si distingue allora tra una trattazione semplificata e una trattazio-ne generale. Il problema semplificato consiste nello studiare il motodi particelle con campi assegnati. E questa l’approssimazione in cuisi pensa che i campi assegnati siano talmente intensi da non esse-re sostanzialmente modificati dai campi creati dalle particelle stesse.

264 Andrea Carati e Luigi Galgani

Ed e questa proprio l’approssimazione (campi dati) in cui lavoreremosotto.

Ma il problema piu difficile e invece quello in cui si studia il moto del-le particelle quando si tenga conto anche dei campi creati dalle parti-celle stesse (problema della self force). Questo problema fu affrontatoattorno al 1903 da Abraham e Lorentz e poi in ambito relativistico,nel 1938, da Dirac.10 Si giunge in tal modo alla cosiddetta equazionedi Abraham–Lorentz–Dirac, di cui non abbiamo qui il tempo di occu-parci. Facciamo solo osservare che a tale equazione sono associatiproblemi di principio a tutt’oggi non ancora completamente risolti,neanche nel corrispondente problema quantistico (si veda Feynman,Manuale di Fisica, vol II cap. 27). Si pensi che la lagrangiana e lahamiltoniana classiche per il sistema costituito dal campo elettroma-gnetico e da cariche puntiformi sono state scritte solo pochissimi annifa.11

6.1.2 I potenziali elettromagnetici

Un obiettivo centrale che ci poniamo in questo capitolo e quello di scrivere lalagrangiana, la hamiltoniana e l’azione hamiltoniana di una particella in un campoelettromagnetico assegnato (mentre nel capitolo precedente avevamo studiato laparticella libera). Per affrontare tale problema avremo pero bisogno dei potenzialielettromagnetici, che ora ci apprestiamo ad introdurre.

Proposizione 2 Si considerino le equazioni di Maxwell omogenee (6.1.2) ed ino-mogenee (6.1.3). Allora si ha:

i) Le equazioni di Maxwell omogenee (6.1.2) si traducono nella seguente pro-prieta: esistono un potenziale scalare Φ e un potenziale vettore A, che fornisconoi campi E,H mediante le relazioni

H = rotA

E = −gradΦ− 1c

∂A∂t

. (6.1.5)

ii) I potenziali Φ,A non sono univocamente determinati, e l’arbitrarieta e re-golata nel modo seguente: dati dei potenziali buoni Φ,A, ogni altra coppia dipotenziali buoni Φ′,A′, si ottiene mediante le relazioni

A′ = A+gradχ

Φ′ = Φ− 1

c∂χ

∂t(6.1.6)

10P.A.M. Dirac, Classical theory of radiating electrons, Proc. Royal Soc. (London) A 167, 148–168 (1938). Si noti che questo fondamentale lavoro di Dirac, concepito e sviluppato in ambito com-pletamente classico, venne scritto circa 10 anni dopo la formulazione dell’elettrodinamica quantistica!

11Si veda M. Marino, Classical electrodynamics of point charges, Annals of Physics 301, 85(2002).

Meccanica Razionale 1: Teoria della relativita, parte seconda 265

attraverso una funzione χ(t,x) arbitraria. Quando si compie uan scelta si usa direche e stato scelto un “gauge”. In particolare, i potenziali possono essere scelti inmaniera di soddisfare la cosiddetta “condizione di Lorentz” (gauge di Lorentz)

divA+1c

∂Φ

∂t= 0 (6.1.7)

oppure la condizione (gauge di Coulomb)

divA = 0 . (6.1.8)

iii) In termini dei potenziali, le equazioni di Maxwell inomogenee (6.1.3) pren-dono, nel gauge di Lorentz, la forma delle equazioni delle onde con sorgenti,precisamente

�Φ = ρ

�A = j/c . (6.1.9)

Dimostrazione. La dimostrazione procede nel modo seguente.

i) Le formule che esprimono i campi attraverso i potenziali sono unaimmediata conseguenza delle equazioni di Maxwell omogenee (6.1.2),quando si ricordino le proprieta che un campo solenoidale (ovverocon divergenza nulla) puo sempre esprimersi come il rotore di un op-portuno campo vettoriale, e che un campo irrotazionale (ovvero conrotore nullo) puo sempre esprimersi come il gradiente di un opportunocampo scalare12. Dunque dalla prima equazione divH = 0 segue cheesiste un campo vettoriale A tale che H = rotA, che e la prima delle(6.1.5). Si sostituisce allora nella seconda equazione omogenea, chediviene (scambiando rot con ∂

∂t )

rot(

E+1c

∂A∂t

)= 0 ,

e dunque esiste un campo scalare Φ tale che si ha E+ 1c

∂A∂t =−gradΦ,

ovvero la seconda delle (6.1.5).

ii,a) E ovvio che i potenziali non siano univocamente definiti, perchese A va bene, allora va bene anche A′ dato da

A′ = A+grad χ

con un arbitraria χ (perche rot grad χ = 0, sicche rot A′ = rotA). Ogniscelta della funzione χ si dice costituire la scelta di un “gauge”. Tutta-via, si richiede che, al variare della scelta di χ (al variare del gauge),

12Ammettiamo qui di essere in un dominio opportuno: va bene ad esempio il caso in cui il dominioe tutto IR3. La dimostrazione di questi fatti e banalissima quando si usi la trasformata di Fourier.Questo verra esposto in un’appendice attualmente non ancora scritta.

266 Andrea Carati e Luigi Galgani

non variino i campi,13 e cio gia avviene per H perche H = rotA =rotA′. Ma nel passaggio da A ad A′, nella formula data, ovvero laseconda delle (6.1.5), varierebbe E, e quindi occorre controbilancia-re la variazione di A con una opportuna variazione di Φ in modo daottenere che E non cambi. E immediato constatare che l’appropriatascelta e V ′ = Φ− 1

c∂χ

∂t . Quindi l’arbitrarieta dei potenziali e regolatadalla relazione (6.1.6) con una funzione χ arbitraria.

ii,b) Mostriamo ora come mai e possibile soddisfare la condizione diLorentz. Assegnati dei potenziali A,Φ, sia

f (t,x) := divA+1c

∂Φ

∂t6= 0

e ricerchiamo un’opportuna χ in modo che sia divA′+ 1c

∂Φ′

∂t = 0. Masi ha, in virtu delle (6.1.6),

divA′+1c

∂Φ′

∂t= divA+

1c

∂Φ

∂t+∆χ− 1

c2∂2χ

∂t2 = f (t,x)−�χ .

Dunque la condizione di Lorentz e soddisfatta se si sceglie χ in modoche sia

�χ = f

con f assegnata, ed e ben noto che cio e sempre possibile14. In modoanalogo si dimostra che si puo sodisfare la condizione di Coulomb.

iii) Veniamo infine alle equazioni delle onde per i potenziali, come im-mediata traduzione delle equazioni di Maxwell inomogenee nel gaugedi Lorentz. Dalla prima equazione inomogenea divE = ρ, introducen-do E in termini di potenziale, si ha

ρ = divE =−div (gradΦ+1c

A) =−∆Φ− 1c

∂tdivA ,

sicche, usando la condizione di Lorentz, si trova

ρ =−∆Φ+1c2

∂2Φ

∂t2 = �Φ.

13In altri termini, si ammette che i campi siano “oggetti fisici”, vale a dire osservabili, e quindiben definiti come funzioni di t ed x. I potenziali invece, essendo non univocamente determinati,vengono considerati come strumenti “nonfisici”, aventi una pura utilita matematica. In realta, questoatteggiamento tradizionale verso i potenziali e parso scosso dopo la scoperta del cosiddetto “effettoAharonov–Bohm”, che a prima vista sembrerebbe comportare che si debba attribuire significato fisicoai potenziali. Cio tuttavia non e vero. Rimandiamo la discussione ad una appendice (non ancorascritta).

14Anche questo fatto e ovvio quando si usa la traformata di Fourier.

Meccanica Razionale 1: Teoria della relativita, parte seconda 267

Analogamente, introducendo i potenziali nella seconda equazione ino-mogenea, si ha

j/c = rotH− 1c

E = rot rotA+1c(grad Φ+

1c

A) =

= grad divA−∆A+1c

grad Φ+1c2 A =

= �A+grad (divA+1c

Φ) = �A

in virtu della condizione di Lorentz. Q.E.D.

6.2 Equazioni di moto di una particella in campo elet-tromagnetico; lagrangiana, hamiltoniana ed azione.Trattazione elementare in forma tridimensionale

Abbiamo gia detto che in ambito non relativistico si ammette che la forza agentesu una particella carica (di carica e) e la forza elettromagnetica di Lorentz F(em)

definita dalla (6.1.1), ovvero

F(em) = e(

E+vc×H

).

Si deve a K. Schwarzschild15 la seguente osservazione:

Proposizione 3 La forza di Lorentz ammette un potenziale generalizzato (o po-tenziale elettromagnetico o potenziale elettrocinetico) V (em) definito in termini deipotenziali Φ ed A da

V (em) = e(

Φ− vc·A

),

nel senso che si ha1e

F(em) =ddt

∂V (em)

∂v− ∂V (em)

∂x.

Dimostrazione. La dimostrazione che ora riportiamo, del tutto tra-dizionale, e un po’ macchinosa; essa diventera invece banalissimaquando disporremo del formalismo tensoriale nello spaziotempo. Re-stando per ora nel formalismo tridimensionale, osserviamo che si ha

15Lo stesso cui si deve la scoperta del campo gravitazionale “creato” da una particella puntiformenell’ambito della relativita generale. Questo risuktato venne illustrato in due famosi lavori scritti nel1916 nell’ospedale di guerra di Brno, dove Schwarzschild morı poco dopo.

268 Andrea Carati e Luigi Galgani

∂V (em)

∂v =−A/c, e dunque16

ddt

∂V (em)

∂v=−1

c

[∂A∂t

+(v ·grad)A].

D’altra parte si ha

∂xV (em) ≡ gradV (em) = gradΦ− 1

cgrad(v ·A) ,

ovvero∂iV (em) = ∂i ∑

kΦ− vk∂iAk

(abbiamo denotato ∂i ≡ ∂

∂xi). Si usa infine l’identita17 sicche

ddt

∂V (em)

∂v− ∂V (em)

∂x=−gradΦ− 1

c∂A∂t

+vc× rotA = E+

vc×H .

Q.E.D.

Ora, gia in ambito non relativistico era ben noto che e possibile scrivere leequazioni di moto di una particella in forma lagrangiana anche se si e in presenzadi forze Q dipendenti dalla velocita, purche tali forze Q ammettano un potenzialegeneralizzato V , nel senso che si abbia

Q =ddt

∂V∂v

− ∂V∂x

.

Infatti, dalla formula del binomio lagrangiano gia sappiamo che l’equazione ma =F con F =−gradV0 puo scriversi nella forma

ddt

∂L0

∂v− ∂L0

∂x= 0

conL0 = T −V0

(T = 12 mv2). Dunque, se si considera l’equazione

ma = F+Q

16Si usa, come al solito d fdt = ∂ f

∂t + (grad f ) · x se f = f (t,x) e si ammette x = x(t) sicche siintroduce la funzione f (t) := f (t,x(t)). Per un abuso di linguaggio si denota poi f ≡ f . Nel nostrocaso, invece di f si ha il vettore A e si considera separatamente ogni componente Ai di A. Persemplicita di notazione scriviamo (gradAi) ·v≡ (v ·grad)Ai, esattamente come si fa per le equazionidi Eiulero dei fluidi perfetti.

17Si tratta in sostanza della nota identita del doppio prodotto vettore, adattata all’operatoredifferenziale rotA = grad×A.

Meccanica Razionale 1: Teoria della relativita, parte seconda 269

con

F =−gradV0, Q =ddt

∂V∂v

− ∂V∂x

,

tale equazione puo scriversi nella forma

ddt

∂L∂v

− ∂L∂x

= 0 , L = L0−V .

In questo senso, dunque, le equazioni di moto per le particelle soggette a forze di-pendenti dalla velocita ma ammettenti un potenziale generalizzato possono esserescritte in forma lagrangiana.

Nel nostro caso, abbiamo una particella carica soggetta a forza di Lorentz, cheammette il potenziale generalizzato V (em). Si ha dunque la

Proposizione 4 L’equazione di Newton (nonrelativistica)

ma = e(E+vc×H)

e equivalente all’equazione di Lagrange

ddt

∂L∂v

− ∂L∂x

= 0

dove la lagrangiana L e definita da

L =12

mv2− eV (em) . (6.2.1)

Abbiamo ora il problema di postulare una forma per l’equazione di moto di unaparticella relativistica in presenza di campi E ed H assegnati, o equivalentementein presenza dei corrispondenti potenziali Φ ed A. La piu semplice scelta possibi-le che si riduca all’equazione non relativistica ma = F(em) per piccole velocita siottiene procedendo in modo analogo a quello del caso nonrelativistico, usando oraovviamente la corretta “lagrangiana meccanica”

L(mecc) =−mc2√

1− v2/c2 . (6.2.2)

Si giunge in tal modo a formulare il seguente

Assioma. La lagrangiana relativistica di una particella in campoelettromagnetico e data da L = L(mecc)− eV (em), ovvero

L =−mc2

√1− v2

c2 − e(Φ− v

cA

). (6.2.3)

Naturalmente, per coerenza si deve anche controllare che la corrispondenteazione hamiltoniana abbia, come per la particella libera, carattere geometrico. Suquesto punto ritorneremo alla fine del presente paragrafo.

Ricordando che ∂L(mecc)

∂v = mγv, si ha subito allora la

270 Andrea Carati e Luigi Galgani

Proposizione 5 L’equazione di moto per una particella relativistica in un campoelettromagnetico e data da

ddt

(mγv) = e(E+vc×H) (6.2.4)

Veniamo ora al teorema dell’energia. In meccanica nonrelativistica questo siottiene mpltiplicando scalarmente per la velocita v l’equazione ma = F, e si ha intal modo T = F ·v dove T = (1/2)mv2 e l’energia cinetica. In ambito relativisticoil teorema dell’energia si ottiene analogamente moltiplicando scalarmente per v la(6.2.4). Si ha allora la1819

Proposizione 6 (Teorema dell’energia). Si ha

ddt

mγc2 = eE ·v . (6.2.5)

Dimostrazione. Basta verificare l’identita

v · ddt

mγv =ddt

mγc2 ,

e questo e un utile esercizio.20 Q.E.D.

Abbiamo infine il problema di scrivere l’hamiltoniana di una particella in cam-po elettromagnetico; cio e necessario ad esempio per scrivere l’equazione di Schrodin-ger (in meccanica quantistica) per una particella in campo elettromagnetico. Comesappiamo dal formalismo hamiltoniano, a tal fine e sufficiente considerare l’energiageneralizzata

E = p ·v−L , (6.2.6)

ed esprimerla in termini del momento

p =∂L∂v

(6.2.7)

18Landau chiama energia cinetica la quantita E = mγc2, anche se essa contiene l’energia a riposomc2.

19Si noti che alla variazioe di energia non contri buisce il campo magnetico, perche esso esercitauna forza ortogonale alla velocita.

20Poniamo c = 1. Si hav · d

dtγv = γ v2 + γv ·a .

Ma dalla definizione di γ si trova γ = γ3 v · a da cui segue γv · a = γ/γ2 ovvero, ricordando γ2 =1/(1− v2),

γ v ·a = γ(1− v2) ,

e dunque

v · ddt

γ v = γ (v2 +1− v2) = γ .

Meccanica Razionale 1: Teoria della relativita, parte seconda 271

anziche della velocita v.Il procedimento che si segue ripercorre passo passo quello che si era seguito

per la particella libera. In presenza di campo elettromagnetico, analogamente conimmediati calcoli si trova il

Lemma 1 Per la particella relativistica in campo elettromagnetico si ha

p = mγv+ec

A (6.2.8)

E = mγc2 + eΦ . (6.2.9)

Da queste relazioni si ottiene poi la

Proposizione 7 L’hamiltoniana di una particella in campo elettromagnetico, conlagrangiana (6.2.3) ovvero

L =−mc2

√1− v2

c2 − e(Φ− v

cA

),

e data da

H = eΦ+ c√

m2c2 +(p− ec

A)2 (6.2.10)

In particolare, nel limite nonrelativistico (v/c)2 << 1, per l’hamiltoniana H e perl’energia E si ha

H =(p− e

c A)2

2m+ eΦ+mc2 . (6.2.11)

E =12

mv2 + eΦ+mc2 . (6.2.12)

Dimostrazione. Basta esprimere l’energia E in termini del momen-to p. Dal lemma 1 si osserva (p− e

c A) = mγv, E − eΦ = mγc2, edunque si ha(

E− eΦ

c

)2

− (p− ec

A)2 = m2γ

2(c2− v2) = m2c2 ,

ovvero(E− eΦ)2 = c2

[m2c2 +(p− e

cA)2

].

Q.E.D.

Osservazione. Da un punto di vista mnemonico, e utile osservare chel’hamiltoniana di una particella in campo elettromagnetico si ottieneda quella in assenza di campo (H = c

√p2 +m2c2, oppure nel limite

nonrelativistico H = p2/(2m)+mc2 ) con la semplice sostituzione

p → p− ec

A ,

oltre all’aggiunta del termine eΦ.

272 Andrea Carati e Luigi Galgani

Terminiamo questo paragrafo con un commento sul carattere geometrico del-l’azione hamiltoniana di una particella in campo elettromagnetico. A tal fine fac-ciamo uso di una proprieta che dimostreremo piu avanti, ovvero che, nello stes-so senso in cui {xµ} = (ct,x) e un quadrivettore, cosı e un quadrivettore anche{Aµ} = (Φ,A). Ricordando poi che {uµ} ≡ { dxµ

dds} = (γ,γ vc ) e un quadrivettore e

che il prodotto scalare tra due quadrivettori ha la struttura pseudo–euclidea ben no-ta, si trova che il prodotto scalare g(u,A) tra i quadrivettori u ≡ {uµ} = (γ,γ v

c ) edA ≡ {Aµ}= (Φ,A) e dato da

g(u,A) = γΦ− γvc·A = γ(Φ− v

c·A)

e dunque, ricordando ds = cγdt (ovvero dt = γ

c ds) otteniamo

Z t1

t0V (em) dt =

1c

Z t1

t0γ(Φ− v

c·A)ds =

1c

Zg(u,A)ds .

Pertanto, ricordando cheR

L(mecc)dt =−mcR

ds, otteniamo che l’azione S relativaalla lagrangiana L = L(mecc)− eV (em) si scrive nella forma

S =−Z [

mc+ec

g(u,A)]

ds .

Questa ha carattere geometrico nello spaziotempo, perche hanno carattere geome-trico sia ds (elemento di linea, lunghezza di un tratto di curva) sia il prodotto scalareg(u,A).

In conclusione, l’assioma per il moto di una particella in un campo elettro-magnetico in ambito relativistico, che sopra e stato formulato con la scelta dellalagrangiana (6.2.3), puo equivalentemente essere formulato in termini di azionehamiltoniana nel modo seguente:

Assioma. L’azione hamiltoniana relativistica di una particella in cam-po elettromagnetico e data, per ogni curva Γ di tipo tempo nello spa-ziotempo, da

S(Γ) =−Z

Γ

[mc+

ec

g(u,A)]

ds . (6.2.13)

E molto istruttivo a questo punto confrontare il metodo qui seguito per giustifi-care questo assioma, con il metodo seguito da Landau e Lifshitz (Teoria dei campi).Noi abbiamo scelto un procedimento di tipo induttivo, che puo forse avere qualcheutilita dal punto di vista pedagogico. Non vi e dubbio tuttavia che il procedimentodiretto e compatto di Landau e Lifshitz e estremamente piu comodo e significativo,almeno quando si sia in grado di apprezzarlo pienamente.

Sulle dimensioni delle quantita di interesse. Le componenti del vet-tore xµ = (ct,x) sono lunghezze (L). Cosı anche s e una lunghez-za; dunque mcds e un’azione (energia per tempo). La quadrivelocita,

Meccanica Razionale 1: Teoria della relativita, parte seconda 273

per come e stata da noi definita, e adimensionale (abbiamo preso laderivata rispetto ad s anziche rispetto a t).

Per quanto riguarda la carica elettrica ed i potenziali elettromagne-tici, dall’equazione �Φ = ρ, dove ρ e una densita di carica (caricaper unita di volume), si ottiene che Φ (e ogni componente di Aµ) hale dimensioni carica/L. A sua volta, per la carica, basta ricordare chee2/r e un’energia e che anche eΦ (e piu in generale eAµ) e un’energia.Dunque, infine, (e/c)g(u,A)ds e una azione.

6.3 Trasformazioni dei campi: trattazione elementare

Abbiamo gia osservato che la separazione di un campo elettromagnetico in un cam-po elettrico E e in un campo magnetico H e relativa, ovvero dipende dal sistemainerziale considerato: ad esempio se in un sistema K si ha il solo campo elettricoE creato da una particella ferma, tale particella appare mobile rispetto ad un altrosistema K′ in moto rispetto a K; dunque K′ vede una corrente (una carica in moto)e quindi oltre ad un campo elettrico vede anche un campo magnetico. Daremo quisotto la legge con cui si trasformano i campi passando da un sistema inerziale adun altro.

Tale legge di trasformazione si spiega analiticamente nel modo seguente. Nelpassaggio da un sistema di riferimento a un altro, avviene che le equazioni di Max-well cambierebbero di forma (in conseguenza del cambiamento di coordinate se-condo la trasformazione di Lorentz) se non si imponesse che anche i campi cam-biasssero in maniera adeguata, atta proprio a bilanciare il cambiamento di formadelle equazioni. Ma noi imponiamo che tale bilanciamento avvenga, proprio persoddisfare il principio si relativita. Infatti, il principio di costanza di velocita dellaluce, nella sua forma piu pregnante, si esprime proprio come la condizione che leequazioni di Maxwell non cambino forma al cambiare del sistema di riferimentoinerziale. In un certo senso si puo dire che finora abbiamo usato tale principio so-lo in forma ridotta, cioe nel limite dell’ottica geometrica, in cui si pensa alla lucecome costituita da raggi, e si impone che la loro velocita sia la stessa (ovvero c) intutti i sistemi inerziali. Qui richiediamo in piu che siano le equazioni di Maxwellstesse a non variare di forma, sicche nessun sistema inerziale risulti privilegiato.

Come esercizio preliminare cominciamo a verificare che invece l’equazione did’Alembert non cambia forma sotto le trasformazioni di Lorentz. In effetti questaosservazione analitica era gia stata compiuta da W. Voigt nel 1887.21 Conside-riamo l’equazione di d’Alembert per una quantita u = u(t,x) scalare (ovvero, chenon cambia al cambiare del sistema di riferimento) e poniamo per semplicita di

21W. Voigt, Uber das Doppler’sche Princip. Gottingen Nachrichten, 10 marzo 1887, pag. 41. Siveda la formula (10) a pag. 45. Nelle nostre notazioni, tale formula si legge x′ = x− vt, y′ = γ−1y,z′ = γ−1z, t ′ = t − vx/c2. Quindi, per ottenere le trasformazioni di Lorentz occorre passare dallevariabili primate ad altre che si ottengono moltiplicando quelle primate per γ. Tuttavia, ai fini che siproponeva Voigt questo fatto e inessenziale.

274 Andrea Carati e Luigi Galgani

notazione c = 1. Definiamo22

�u ≡ ∂2u∂t2 −

∂2u∂x2 ≡

(∂2

∂t2 −∂2

∂x2

)u ;

l’operatore � viene detto “dalembertiano” e mediante esso l’equazione di d’Alem-bert prende la forma

�u = 0 .

Nel capitolo sull’equazione di d’Alembert abbiamo gia osservato che, quando siconsidera una equazione, in generale essa cambia di forma se si esegue un cam-biamento di variabili: ad esempio passando dalle coordinate (t,x) alle coordina-te (ξ,η) = (t − x, t + x) l’equazione di d’Alembert assume la forma (denotiamo∂x ≡ ∂

∂x , ∂2xx ≡ ∂x∂x etc)

∂ξ∂ηu = 0 ,

e anzi proprio di questo artificio ci siamo serviti per integrare l’equazione. Si hainvece la

Proposizione 8 Il dalembertiano non cambia forma sotto trasformazioni di Lo-rentz, ovvero si ha

� ′ = �

dove � ′ = ∂2t ′t ′−∂2

x′x′ , � = ∂2tt −∂2

xx.

Dimostrazione. (metodo forza bruta). Dalla trasformazione di Lo-rentz t ′ = γ(t−vx),x′ = γ(x−vt), in virtu della formula fondamentaleper la derivata di una funzione composta si ha

∂t =∂t ′

∂t∂t ′ +

∂x′

∂t∂x′ , ∂x =

∂t ′

∂x∂t ′ +

∂x′

∂x∂x′

ovvero

∂t =∂t ′

∂t∂t ′ +

∂x′

∂t∂x′ = γ(∂t ′− v∂x′)

∂x =∂t ′

∂x∂t ′ +

∂x′

∂x∂x′ = γ(∂x′− v∂t ′) .

(6.3.1)

Si trova dunque

∂t −∂x = γ(1+ v)(∂t ′−∂x′)∂t +∂x = γ(1− v)(∂t ′ +∂x′) .

Pertanto, osservando che si ha � = (∂t −∂x)(∂t +∂x),23 otteniamo

� = γ2(1− v2)� ′ = � ′ .

Q.E.D.22Consideriamo il caso di una sola dimensione spaziale23Questa identita operatoriale e analoga alla familiare identita algebrica a2−b2 = (a+b)(a−b).

Meccanica Razionale 1: Teoria della relativita, parte seconda 275

Osservazione. Questa proprieta di invarianza in forma del dalember-tiano sotto trasformazioni di Lorentz costituisce di fatto la controparte(in termini di operatori differenziali) della invarianza in forma dellametrica relativistica sotto trasformazioni di Lorentz:

c2t ′2− l′2 = c2t2− l2 .

Allo stesso modo si mostra immediatamente che sotto rotazioni nelpiano si ha l’invarianza in forma dell’operatore laplaciano:

∂2

∂x2 +∂2

∂y2 =∂2

∂x′2+

∂2

∂y′2

come traduzione in termini di operatori differenziali dell’invarianzain forma della metrica sotto rotazioni:

x′2 + y′2 = x2 + y2

(qui ci riferiamo evidentemente a sistemi di riferimento cartesiani or-togonali, ovvero a sistemi di vettori base ortonormali rispetto all’as-segnato prodotto scalare).

In effetti, come vedremo piu avanti, le trasformazioni (6.3.1) sulle de-rivate parziali (∂t ,∂x) → (∂t ′ ,∂x′) sono nient’altro che le trasforma-zioni delle componenti dei covettori indotte dalle trasformazioni dellecomponenti dei vettori. Troveremo che le derivate parziali si trasfor-mano con l’inversa della trasposta della matrice che fornisce la tra-sformazione delle componenti dei vettori. Nel nostro caso, il tuttoammonta a cambiare v in −v.

Veniamo dunque alla legge di trasformazione dei campi. Il sistema K′ si muovecon velocita v lungo l’asse x del sistema K; e conveniente allora decomporre ivettori E e H nella forma

E = E‖+E⊥, H = H‖+H⊥

dove E‖ denota la componente di E parallela a v, cioe all’asse x, e E⊥ la corrispon-dente componente ortogonale, cioe nel piano y,z. Analogamente sia

E′ = E′‖+E′

⊥, H′ = H′‖+H′

⊥.

Cosı anche, denotando con ρ, ρ′ e j, j′ le densita di carica e di corrente rispetto aidue sistemi di riferimento, poniamo

j = j‖+ j⊥, j′ = j′‖+ j′⊥ .

Si ha allora la

276 Andrea Carati e Luigi Galgani

Proposizione 9 Le equazioni di Maxwell non cambiano forma sotto trasforma-zioni di Lorentz se si ammette che i campi e la densita di carica e di corrente sitrasformino nel modo seguente (con c = 1):

E′‖ = E‖

E′⊥ = γ(E⊥−H×v)

H′‖ = H‖

H′⊥ = γ(H⊥+E×v)

ρ′ = γ(ρ− v jx)

j′x = γ( jx− vρ)j′⊥ = j⊥ (ovvero j′y = jy , j′z = jz) .

Nota. La legge di trasformazione di densita di carica e densita dicorrente puo anche essere stabilita a priori, utilizzando l’ipotesi chela quantita di carica sia un invariante, indipendente dal sistema diriferimento.24

Dimostrazione. 25 Consideriamo la trasformazione di Lorentz in-versa t = γ(t ′+vx′), x = γ(x′+vt ′), y = y′, z = z′. Con calcoli analoghia quelli usati per dimostrare l’invarianza del dalembertiano si ha

∂t ′ = γ(∂t + v∂x) , ∂x′ = γ(∂x + v∂t) , ∂y = ∂y′ ,∂z = ∂z′ . (6.3.2)

i) Cominciamo a considerare le equazioni omogenee

∂tH+ rotE = 0 , divH = 0 ;

in particolare, la prima componente della prima equazione, e la se-conda equazione, forniscono

∂tHx = ∂zEy−∂yEz , ∂xHx =−(∂yHy +∂zHz) . (6.3.3)

Vediamo ora cosa sappiamo su ∂t ′Hx. Dalla trasformazione di Lorentz∂t ′ = γ(∂t +∂x) otteniamo

∂t ′Hx = γ[∂tHx + v∂xHx] ,

24Si ua il fatto che, a causa della contrazione delle lunghezze lungo la direzione di traslazione diK′ rispetto a K (mentre restano inalterate le lunghezze trasversali), passando da K a K′ i volumi sicontraggono del fattore γ−1. Dunque, dovendo restare inalterata la carica contenuta in un volume,deve cossispondentente variare la desita di carica.

25A parte la notazione, seguiamo qui quasi alla lettera il paragrafo 6 del lavoro di Einstein del1905.

Meccanica Razionale 1: Teoria della relativita, parte seconda 277

e quindi, per le (6.3.3),

∂t ′Hx = γ(∂zEy−∂yEz)− γv(∂yHy +∂zHz)= ∂zγ(Ey− vHz)−∂yγ(Ez + vHy) .

(6.3.4)

Per confronto con l’originaria equazione

∂tHx = ∂zEy−∂yEz

si vede allora che le due equazioni sono della stessa forma se si pone26

H ′x = Hx, E ′

y = γ(Ey− vHz), E ′z = γ(Ez + vHy)

ovveroH′‖ = H‖, E′

⊥ = γ(E⊥−H×v) .

ii) Si procede poi analogamente usando le equazioni inomogenee rotH−∂tE = j, divE = ρ. Si ha

∂tEx = ∂yHz−∂zHy− jx, ∂xEx =−(∂yEy +∂zEz)+ρ ,

e si ottiene

∂t ′Ex = ∂y′γ(Hz− vEy)−∂z′γ(Hy + vEz)− γ( jx− vρ)

che, per confronto con l’equazione originale, fornisce

E′‖ = E‖ H⊥

′‖ = γ(H⊥+E×v) , j′‖ = γ(j‖− vρ) .

Resta da determinare la legge per ρ. A tal fine si usa la condizione chevalga

div′E′ ≡ ∂x′E ′x +∂y′E ′

y +∂z′E ′z = ρ

′ .

Ma allora il primo membro puo essere calcolato e si trova27

div′E′ = γdivE− γv(∂tEx−∂yHz +∂zHy) .

D’altra parte, usando le equazioni di Maxwell divE = ρ e la primacomponente di −∂tE+ rotH = j, questa equazione diviene

div′E′ = γ(ρ− v jx) ,

sicche la condizione div′E′ = ρ′ fornisce

ρ′ = γ(ρ− v jx) .

Q.E.D.26In effetti, basterebbe porre H ′

x = αHx,E ′y = αγ(Ey − vHz),E ′

z = αγ(Ez + vHy) con una costanteα (dipendente parametricamente da v). Ma, come nel capitolo precedente, si assume α = α(v2) e simostra α2 = 1, da cui α = 1 per continuita in v = 0.

27Basta usare le relazioni gia trovate E ′x = Ex, E ′

y = γ(Ey−vHz), E ′z = γ(Ez +vHy), ∂x′ = γ(∂x +

v∂t), ∂y′ = ∂y,∂z′ = ∂z.

278 Andrea Carati e Luigi Galgani

Osservazione. Le leggi di trasformazione della densita di carica e corrente mo-strano che ρ, j si trasformano esattamente come t,x; in altri termini ρ, j costituisco-no un quadrivettore. Piu precisamente, ripristinando c 6= 1, si ottiene che

{ jµ}3µ=0 = (cρ, j)

costituisce un quadrivettore.Si ha dunque il

Corollario 1 I potenziali scalare e vettore Φ, A costituiscono un quadrivettore,diciamo di componenti {Aµ}3

µ=0, ovvero si ha che le quantita

{Aµ} ≡ (Φ,A)

si trasformano come le componenti di un quadrivettore (cioe come le componentidi {xµ} ≡ (ct,x).

Dimostrazione. Sappiamo che i potenziali soddisfano, nel gauge diLorentz, le equazioni �Φ = ρ , �A = j/c, e che l’operatore dalem-bertiano non cambia forma sotto trasformazioni di Lorentz. DunqueΦ ed A devono trasformarsi come ρ e j/c ovvero come cρ e j, cioecome ct ed x. Q.E.D.

Da cio segue in particolare, come gia osservato, che l’azione S relativa alla parti-cella in campo elettromagnetico ha carattere geometrico nello spaziotempo.

6.4 Primi elementi di calcolo tensoriale

6.4.1 Introduzione

Nel paragrafo precedente abbiamo ottenuto le leggi di trasformazione dei campielettromagnetici in maniera elementare ma alquanto laboriosa, in effetti quasi esat-tamente nella maniera seguita inizialmente da Lorentz, Poincare ed Einstein stessi(metodo “brute force”, ovvero forza bruta). Esiste pero un modo per ottenere “avista” le leggi di trasformazione dei campi, e cio si ottiene scrivendo le equazionidi Maxwell stesse in maniera che siano “covarianti a vista” o, come anche si dice,siano in forma tensoriale. Puo servire da riferimento a questo proposito la seguentefrase di Einstein:

“Prima delle ricerche di Minkowski era necessario effettuare una tra-sformazione di Lorentz su una legge per accertare l’invarianza rispet-to a tali trasformazioni; egli invece riuscı ad introdurre un formalismotale che la forma matematica della legge garantisce di per se l’invarian-za della legge stessa rispetto alle trasformazioni di Lorentz. Creandoun calcolo tensoriale quadridimensionale, egli ottenne per lo spazio-tempo cio che il calcolo tensoriale aveva ottenuto per le tre dimensionispaziali.”

Meccanica Razionale 1: Teoria della relativita, parte seconda 279

In effetti, il calcolo tensoriale era gia stato sviluppato nell’ambito degli spazivettoriali e piu in generale delle varieta differenziabili, ed esposto in un classico la-voro28 29 di Ricci e Levi Civita del 1901, con cui tuttavia Einstein non era familiarenel 1905. Il contributo di Minkowski consistette sostanzialmente nell’estendere talimetodi al caso in cui la varieta e lo spaziotempo della relativita ristretta, concepitodunque come una varieta piatta, ovvero come uno spazio vettoriale, con la peculia-rita pero di essere munita di un prodotto scalare non definito positivo anziche delprodotto scalare consueto.

E proprio questo l’elemento caratteristico che costringe anche noi, a questopunto, a introdurre degli elementi geometrici che lo studente aveva potuto finoraignorare. In breve si tratta di rendersi conto di quanto segue:

• Quando si ha a che fare con uno spazio vettoriale, diciamolo V , si deve tenereconto del fatto che esistono non solo i vettori, diciamoli x, y, v, w, elemen-ti dello spazio V stesso, ma anche i covettori, ovvero funzionali lineari suV (che definiremo subito sotto, come anche altre altre quantita algebriche,come i funzionali multilineari);

• Ora, come mai questo fatto ha potuto essere ignorato nelle trattazioni ele-mentari della fisica? Cio e dovuto al fatto che lo spazio ordinario e munito diun prodotto scalare, perdipiu euclideo (cioe definito positivo). Infatti da unaparte l’esistenza di un prodotto scalare (o di una metrica, come anche si dice)comporta (come vedremo piu sotto) che esiste un isomorfismo naturale tracovettori e vettori, cioe che ad ogni covettore corrisponde biunivocamente (ein maniera intrinseca) un vettore, sicche i covettori possono nella sostanzascomparire, o piuttosto essere ignorati, rimanere in qualche modo nascosti,in ombra. Ma questo nascondimento e ancor piu favorito, in pratica, nel casoin cui la metrica e anche euclidea. Infatti, in tal caso, se si scelgono vettoribase ortonormali rispetto alla metrica considerata (cioe se si scelgono coor-dinate cartesiane ortoganali), risulta che le componenti che individuano unvettore addirittura coincidono con le componenti del corrispondente covet-tore. Dunque, concretamente, lavorando in coordinate cartesiane ortoganalisi ha che vettori e corrispondenti covettori materialmente coincidono, e sipuo comportarsi proprio come se i covettori non esistessero. Ed e proprio inquesto spirito che viene condotto l’insegnamento universitario elementare.

• Ma questo nascondimento non e piu possibile nello spaziotempo relativisti-co. Infatti in tal caso e pur vero che si e ancora in presenza di una metri-ca, e cio comporta ancora l’esistenza di un isomorfismo naturale tra vettori

28Methodes de calcul differentiel absolu et leurs applications, Math. Ann. 54 (1901).29“I mezzi matematici necessari per la teoria della relativita generale erano gia pronti nel “cal-

colo differenziale assoluto”, il quale si basa sulle ricerche di Gauss, Riemann e Christoffel sullevarieta noneuclidee ed e stato eretto a sistema da Ricci e Levi Civita e da essi applicato a problemidi fisica teorica”. Da A. Einstein, I fondamenti della teoria della relativita generale (1916), primoparagrafo.

280 Andrea Carati e Luigi Galgani

e covettori. Ma poiche il prodotto scalare non e definito positivo (e pseu-doeuclideo), allora succede che, anche se si scelgono vettori base adattati allametrica (e quindi si sceglie l’analogo delle coordinate cartesiane ortogona-li), un vettore e l’associato covettore non hanno le medesime componenti (laparte spaziale di un covettore ha segno opposto a quella del corrispondentevettore), e non e piu possibile comportarsi concretamente come se i covettorinon esistessero. Bisogna dunque rassegnarsi a fare i conti (in tutti i sensi)con i covettori (e piu in generale a tener conto della struttura multilineareassociata allo spaziotempo).

Dobbiamo dunque cominciare col prendere atto che esistono i covettori, e do-vremo pertanto abituarci a distinguere le componenti dei vettori da quelle dei co-vettori. Entra qui sulla scena il gioco degli indici, sul quale faremo un breve com-mento qui sotto: infatti le componenti xi dei vettori vengono denotate con indici inalto, quelle αi dei covettori con indici in basso.30 Vedremo inoltre che il prodottoscalare e un funzionale bilineare, con coefficienti che hanno dunque indici in bas-so, gik. Dovremo poi imparare a maneggiare l’isomorfismo tra vettori e covettoriindotto dalla metrica, il quale viene poi concretamente realizzato mediante l’ope-razione di abbassamento e innalzamento degli indici. Poche altre cose sarannoinfine sufficienti per procedere (regola della traccia, ....).31

Osservazione. Per quanto riguarda il gioco degli indici in alto e inbasso, o piuttosto l’orgia degli indici in alto e in basso, come qualchevolta si dice, bisogna ammettere che sicuramente esso costituisce uncerto ostacolo allo studio del calcolo tensoriale, e che ognuno desi-dererebbe evitarlo. In effetti, sarebbe possibile una notazione in cuiquesto gioco fosse evitato, e forse un giorno verra trovato un com-promesso piu soddisfacente. Ma sembra necessario che ci si debbaattenere a un qualche compromesso, in cui il gioco degli indici resta

30Dirac, nel suo celebre manuale di Meccanica Quantistica, segue la convenzione opposta: lecomponenti dei vettori hanno indici in basso e quelle dei covettori in alto. La convenzione di Diracsarebbe forse la piu comoda per un primo impatto col calcolo tensoriale, Infatti tutti hanno avuto ache fare con componenti di vattori, mettendo gli indici in basso, e sarebbe naturale continuare a farecosı, riservando gli indici in alto alle componenti dei covettori, quando infine si scopre che esistonoanche loro. Purtroppo pero Dirac e rimasto isolato in questa sua scelta. D’altra parte, Dirac stessosi e poi rassegnato a seguire la usuale convenzione, come testimoniato dal suo libro di RelativitaGenerale.

31Se si vuole poi procedere allo studio della relativita generale, nella quale, come tutti hannosentito dire, lo spaziotempo e concepito come varieta curva, con curvatura legata alla gravita, allorasi ha bisogno di pochi altri strumenti. Precisamente: il tensore di curvatura e la derivata covariante,Questa era gia sostanzialmente nota alla fine del diciannovesimo secolo, e di uso comune anchenegli spazi piatti quando si usano coordinate generali (non cioe cartesiane ortognali), ad esempio perdeterminare la struttura dell’operatore laplaciano. Questa nozione e in stretta relazione con quella diconnessione geodetica (introdotta da Levi Civita nel 1916, e subito estesa da Weyl a spazi non munitidi metrica), che e necessaria per generalizzare la nozione di parallelismo, e quindi confrontare vettoridi spazi tamgenti diversi, come si fa esempio quando si definisce l’accelerazione.

Meccanica Razionale 1: Teoria della relativita, parte seconda 281

presente, e dopo piu di un secolo non si e trovato un compromessomigliore.

La massima testimonianza a questo proposito e fornita da H. Weyl,uno dei piu grandi matematici del secolo scorso, che peraltro die-de contributi fondamentali alla geometria, e scrisse quello che e inassoluto uno dei piu bei libri di relativita (sul quale si formo ancheFermi)32. Egli infatti, dopo avere brevemente riassunto le operazionifondamentali del calcolo tensoriale,33 per quanto concerne l’uso de-gli indici cosı si esprime: Various attempts have been made to set up astandard terminology in this branch of mathematics involving only thevectors themselves and not their components, analogous to that of vec-tors in vector analysis. This is highly expedient in the latter, but verycumbersome for the much more complicated framework of the tensorcalculus. In trying to avoid continual reference to the components weare obliged to adopt an endless profusion of names and symbols in ad-dition to an intricate set of rules for carrying out calculations, so thatthe balance of advantage is considerably on the negative side. An em-phatic protest must be entered against these orgies of formalism whichare threatening the peace of even the technical scientist.” Da H. Weyl,Space–time–matter, Dover (New York, 1952), pag. 53–54.

6.4.2 Necessita di considerare i covettori, innalzamento ed abbassa-mento degli indici, regola della traccia, trasformazioni degli ope-ratori differenziali.

Il presente paragrafo corrisponde a un terzo circa della parte B del-l’articolo di Einstein del 1916 I fondamenti della teoria della relativitagenerale: Parte B, mezzi matematici per la formulazione di equazio-ni covarianti in modo generale. Qui ci limitiamo all’esposizione delminimo sufficiente per i nostri scopi (relativita speciale in coordinatecartesiane). Nell’articolo di Einstein sono inoltre esposte le nozionidi derivata covariante (dopo avere introduzione i simboli di Christof-fel) e di tensore di curvatura. Nella presente esposizione facciamoesplicito riferimento alla nozione di funzionale lineare (vettore cova-riante, nella terminologia classica) che e implicita nelle formulazionidell’inizio del secolo scorso.

32H. Weyl, Raum–Zeit–Materie (1918), traduzione inglese Space–time–matter, Dover (New York,1952).

33Il riassunto e il seguente. “The study of tensor calculus is, without doubt, attended by conceptualdifficulties – over and above the apprehension inspired by indices, which must be overcome. Fromthe formal aspect, however, the method of reckoning used is of extreme simplicity; it is much easierthan, e.g., the apparatus of elementary vector–calculus. There are two operations, multiplicationand contraction; then putting the components of two tensors with totally different indices alongsideof one another; the identification of an upper index with a lower one, and, finally, summation (notexpressed) over this index.

282 Andrea Carati e Luigi Galgani

Vogliamo dunque anzitutto mettere in luce che i covettori esistono, e vogliamopoi mostrare che in relativita e necessario prenderli in considerazione, nonostanteche nelle trattazioni elementari (si intende nei corsi di Fisica Generale, nelle par-ti elementari dei corsi di analisi e della meccanica) essi possano essere ignorati.Cominceremo col ricordare cosa sono i covettori, come elementi del duale di unospazio vettoriale, e daremo poi un cenno ai campi covettoriali (o piu in generale,tensoriali) su una varieta.

Consideriamo dunque uno spazio vettoriale sui reali V , di dimensione n arbi-traria,34 e prescindiamo per ora dalla eventuale esistenza di un prodotto scalare.Conosciamo le proprieta algebriche degli elementi di V (vettori, che denoteremocon x, y, o anche con v, w), che riguardano la combinazione lineare di due vettori,cioe la loro somma, e la moltiplicazione di un vettore per uno scalare (numero rea-le). Sappiamo che in infiniti modi e possibile scegliere una base35, diciamo {ei}n

i=1,sicche ogni vettore e univocamente individuato dalle sue componenti x1, . . . ,xn suquella base, 36

x = ∑i

xiei ≡ xiei (6.4.1)

Osservazione: il gioco degli indici e la cosiddetta “convenzione diEinstein”. Si noti il gioco degli indici: i vettori base ei hanno indicein basso; le componenti xi dei vettori hanno indice in alto. Piu sottoavremo covettori base εi con indice in alto, componenti αi di covettoricon indice in basso. L’esperienza ha mostrato che tale convenzioneha le sue comodita.

Si noti poi la cosiddetta convenzione di Einstein: si sottintende il sim-bolo di somma, quando si hanno due indici uguali (cioe un indiceripetuto), di cui uno in alto e uno in basso. Nel seguito continuere-mo per un poco a mantenere (come qui sopra) congiuntamente le duenotazioni, e a un certo momento tralasceremo il simbolo di somma.

I covettori. Possiamo ora dire come si definiscono i covettori (rispetto allo spaziovettoriale V ): essi sono i funzionali lineari su V , cioe le applicazioni (funzioni!) α

a valori reali, con dominio V ,α : V → IR

aventi la proprieta di linearita, ovvero che

α(ax+by) = aα(x)+bα(y)

34Prendiamo qui dim V = n < ∞; molte proprieta si estendono pero al caso di dimensione infinita.35Nelle trattazioni piu avanzate, i vettori base sono denotati con ∂i invece che con ei. La ragione

di questo fatto e profonda, e verra illustata brevemente piu avanti.36Si rammenti che le componenti xi dei vettori non hanno nulla a che fare con le proiezioni orto-

gonali sugli assi, che e una nozione che richiede l’esistenza di un prodotto scalare. Qui non esisteancora nessun prodotto scalare. Eventualmente, esiste solo la “proiezione per parallelismo”, checorrisponde all’uso della “regola del parallelogrammo”.

Meccanica Razionale 1: Teoria della relativita, parte seconda 283

per ogni coppia di vettori x,y ∈ V e di numeri a,b ∈ IR. L’insieme dei covettorisu V viene denotato con V ∗ e chiamato “ il duale di V ”. Vedremo che e anch’essouno spazio vettoriale di dimensione n, come V .

Cio e molto astratto, e puo essere un primo ostacolo alla comprensione deicovettori. Ma in effetti i covettori sono concretissimi, come mostra l’esempio fon-damentale, cioe quello del covettore corrispondente a “misurare una componentedi un vettore” per una assegnata base, illustrato in Appendice.

Ora comunque cominciamo ad osservare che in virtu della proprieta definitoria(ovvero la linearita), si ha che, fissata una base {ei} in V , anche i covettori (enon solo i vettori) sono individuati da n–uple di numeri reali: come un vettorex e individuato da certe componenti x1, . . . ,xn (se e fissata una base {ei} in V ),cosı un covettore α e individuato (con riferimento alla stessa base in V ) da certecomponenti α1, . . . ,αn. Infatti, prendiamo un certo covettore α. Allora, poichesappiamo come esso agisce su ogni vettore x (producendo un numero reale), cosısappiamo in particolare come esso agisce su ognuno dei vettori base ei, e dunquepossiamo associare ad α gli n numeri α1, . . . ,αn definiti da

αi = α(ei) (i = 1, . . . ,n) .

D’altra parte, conoscendo questi n numeri αi, conosciamo anche tutto α, cioe lalegge con cui α agisce su ogni x, perche per la proprieta di linearita abbiamo

α(x) = α(∑

ixiei

)= ∑

ixi

α(ei) = ∑i

αixi ≡ αixi ,

ovvero:

Se si conosce come il covettore α agisce sui vettori base, cioe si cono-scono i numeri αi definiti da

α(ei) = αi (i = 1, . . . ,n) , (6.4.2)

allora l’azione di α su ogni vettore x = ∑i xiei ≡ xiei e data da

α(xiei) = αixi . (6.4.3)

Dunque, avendo fissato una base {ei} in V , ogni covettore α ∈V ∗, e individua-to da una n–upla di numeri αi definita dalla (6.4.2), e la sua azione su ogni vettoree data dalla (6.4.3). Si direbbe allora che V ∗ e isomorfo a IRn. In effetti, per po-tere giustificare questa affermazione, occorre anche dire in quale senso V ∗ e unospazio vettoriale, cioe occorre dire come e definita in V ∗ l’operazione di sommatra due elementi di V ∗ (due covettori) e di moltiplicazione di un covettore per unnumero reale, ovvero come si definiscono le combinazioni lineari in V ∗; questopermette anche di comprendere in quale senso i numeri αi sono le “componenti”di α su una opportuna base in V ∗, che viene detta “ base duale” ad {ei}. Questo

284 Andrea Carati e Luigi Galgani

fatto e illustrato in Appendice, insieme con un’altra osservazione relativa alla rap-presentazione dei covettori mediante iperpiani nello spazio vettoriale V , che e diparticolare interesse per lo studio della propagazione di onde piane.37

L’esempio prototipo di covettore: Il gradiente di uno scalare. Data una funzio-ne scalare f = f (x1, . . . ,xn), si ha spesso necessita di considerare la n–upla

∂i f ≡ ∂ f∂xi (6.4.4)

che viene solitamente chiamata il gradiente di f e considerata come un vettore. Masi vede subito che si tratta invece di un covettore (o meglio, di un campo covet-toriale, ovvero una legge che attribuisce un covettore ad ogni punto di coordinatex1, . . . ,xn). Infatti, basta a tal fine ricordare la definizione di derivata direziona-le e osservare che (∂i f )vi e proprio la derivata direzionale di f nella direzione(v1 . . . ,vn). Si tratta quindi di una quantita assoluta, indipendente dalla base, chedipende linearmente dal vettore con componenti vk: dunque per definizione abbia-mo a che fare con un covettore. Confermeremo questo fatto piu sotto, controllandoche, sotto cambiamento di coordinate, la n–upla ∂i f si trasforma proprio comerichiesto per le componenti di un covettore.

L’isomorfismo naturale tra vettori e covettori indotto dalla metrica: abbassa-mento ed innalzamento degli indici. Veniamo ora ad illustrare il fatto che esisteun isomorfismo (corrispondenza biunivoca, compatibile con la struttura lineare)naturale tra V e V ∗, cioe tra vettori e covettori, quando sia assegnato un prodottoscalare.

Il modo algebrico per descrivere questa corrispondenza tra vettori e covettoriquando e assegnato un prodotto scalare e il seguente. Per definizione, un prodottoscalare e anzitutto un’applicazione bilineare g : V ×V → IR, ovvero una “macchi-netta” con due entrate, diciamo g(·, ·), la quale produce un numero, g(v,w), perogni coppia di vettori v, w; la “macchinetta” deve essere lineare in v se si fissaw, e lineare in w se si fissa v.38 Dunque, per la proprieta di bilinerita, se si fis-sa v allora g(v, ·) definisce un funzionale lineare su V , cioe un covettore. Esistedunque un’applicazione naturale da V in V ∗, e si mostra facilmente che tale corri-spondenza e biunivoca39. E questo l’isomorfisomo naturale tra V e V ∗ indotto dalprodotto scalare. Detto in altri termini: dato un prodotto scalare, a ogni vettore vcorrisponde un covettore (funzionale lineare αv) che e semplicemente l’operazione

37Quando si ricercano soluzioni dell’equazione di d’Alembert nella forma di onde piane, ovveroΦ(t,x) = Aexp(ikµxµ), allora kµ sono le componenti di un covettore.

38Inoltre, deve essere simmetrica ( g(v,w) = g(w,v) ) e nondegenere, ovvero l’unico vettoreortogonale a tutti i vettori deve essere il vettore nullo; in formule

g(v,w) = 0 ∀w comporta v = 0 .

.39Questa e la traduzione della proprieta di nondegenerazione.

Meccanica Razionale 1: Teoria della relativita, parte seconda 285

(la funzione) “prendere il prodotto scalare con il fissato vettore v”: in formule

αv(w) = g(v,w) per ogni w ∈V .

Questa formula si scrive anche

αv(·) = g(v, ·) .

Viceversa, un vettore v e conosciuto se e dato il suo prodotto scalare g(v,w) conogni altro vettore w.

Vediamo infine come tale corrispondenza tra vettori e covettori viene in prati-ca effettuata mediante l’operazione di abbassamento e innalzamento degli indici.Abbiamo gia convenuto di denotare le componenti vi dei vettori con indici in altoe le componenti αi dei covettori con indici in basso. Inoltre la metrica (il prodot-to scalare) e individuata (in una base assegnata) da una matrice con due indici inbasso (vedremo piu sotto la ragione di tale scelta), ovvero le “componenti gik dellametrica”. Queste sono definite semplicemente da

gik = g(ei,ek) ,

e vengono introdotte in maniera del tutto naturale. Infatti, nella base {ei} i duevettori v,w si scrivono v = viei, w = wkek e dunque, per la bilinearita del prodottoscalare g, si ha

g(v,w) = g(viei,wkek) = viwkg(ei,ek) = gikviwk.

D’altra parte se si pensa v fissato, e naturale scrivere

gikviwk = αkwk, con αk = gikvi

ed e chiaro che {αk} e proprio il covettore g(v, ·) che si ottiene fissando v nelprodotto scalare. Per questo motivo le componenti del covettore α ≡ αv vengonodenotate addirittura cone vk, perche sono le componenti del covettore univocamen-te associato al vettore v, e dunque si scrive vk := gikvi. Anzi, poiche si assumeche il prodotto scalare sia simmetrico, g(v,w) = g(w,v), sicche gik = gki, si scriveanche

vk = gkivi

E questa l’operazione di abbassamento dell’indice.Veniamo ora all’innalzamento dell’ indice, procedendo nella maniera piu piatta

possibile. Ritornando alla notazione αk = gikvi per il covettore αk univocamenteassociato al vettore vi, e ovvio che la corrispondenza inversa si scrive nella forma

vi = gikαk

dove gik sono gli elementi della matrice inversa di {gik} (la ragione degli indici inalto si comprendera piu avanti), ovvero definiti da

gikgkl = δil

286 Andrea Carati e Luigi Galgani

essendo δil la matrice identita. Quindi la matrice gik fornisce la corrispondenza

inversa tra vettori e covettori, e poiche il vettore di componenti vi e univocamenteindivituato dal covettore di componenti αk, si conviene di denotare tale vettore conla stessa lettera α del covettore, ovvero si scrive

αi = gik

αk .

E questa l’operazione di innalzamento dell’indice.Si noti in particolare come, in presenza di una metrica euclidea, esistono le basi

ortonormali, cioe basi tali che gik = g(ei,ek) = δik, e dunque in tali basi l’operazio-ne di abbassamento od innalzamento di un indice non produce alcuna variazione:in spazi euclidei le componenti di vettori e covettori isomorfi, se riferite a una ba-se ortonormale, sono le medesime. E questo il motivo per cui nella fisica e nellageometria elementari si puo tralasciare di parlare di covettori (almeno se ci si rife-risce a basi ortonormali). Ma cio non e piu possibile in relativita speciale, in cui siconsidera lo spaziotempo riferito a una metrica pseudoeuclidea. Infatti, cio signi-fica che nelle basi ortonormali (corrispondenti dunque a sistemi inerziali in cui perla parte spaziale ci si riferisce a coordinate cartesiane ortogonali) la matrice dellametrica e la sua inversa hanno la forma (con la consueta notazione per gli indici,µ,ν = 0,1,2,3.) {

gµν

}= {gµν}= diag (1,−1,−1,−1) ,

e dunque l’innalzamento o l’abbassamento di un indice spaziale comporta un cam-biamento di segno. Ad esempio se si considera il “vettore–evento” di componenti

{xµ}= (ct,x)≡ (ct,x,y,z)

si ha che il covettore ad esso corrispondente secondo la metrica lorentziana hacomponenti {

xµ}

= (ct,−x)≡ (ct,−x,−y,−z).

Campi vettoriali e covettoriali, metrica su una varieta. Abbiamo finora consi-derato uno spazio vettoriale V e abbiamo in corrispondenza definito lo spazio dualeV ∗, i cui elementi sono i covettori (funzionali lineari su V ); abbiamo poi analoga-mente considerato un particolare funzionale bilineare su V definente un prodottoscalare.

La situazione piu significativa che si deve considerare e pero un’altra, ovveroquella in cui si ha uno spazio vettoriale in ogni punto di una varieta. Consideriamoinfatti il piu semplice esempio, ovvero quello dello spazio ordinario prerelativisti-co, il consueto spazio euclideo. E proprio questa la varieta di cui parliamo, anchese poi casualmente e essa stessa uno spazio vettoriale (tridimensionale). Ma quel-lo che vogliamo mettere in luce e che in ogni punto di tale varieta e definito unospazio vettoriale, che e lo spazio tangente alla varieta in quel punto. Ed e proprioquesto spazio tangente quello che prende il posto dello spazio vettoriale V discusso

Meccanica Razionale 1: Teoria della relativita, parte seconda 287

sopra. In altri termini, piu in generale, sia data una qualsiasi varieta (differenzia-bile) M, che localmente possiamo riferire a una carta con coordinate x1, . . . ,xn.40

Allora in ogni punto di M, individuato dalle coordinate x = (x1, . . . ,xn). e definitolo spazio vettoriale tangente alla varieta (denotato con TxM), i cui elementi sononient’altro che le velocita di tutti i movimenti (curve parametrizzate) che passanoper quel punto. Dal capitolo sulle equazioni di Lagrange abbiamo imparato comel’assegnazione delle coordinate locali x = (x1, . . . ,xn) definisca naturalmente unabase vettoriale (che abbiamo chiamato base coordinata) in ciascun spazio tangenteTxM.

Dunque la situazione che ci interessa e quella di una varieta (che per noi poisara lo spaziotempo, isomorfo ad IR4) in cui si hanno delle coordinate (x1, . . . ,xn)oppure (x′ 1, . . . ,x′ n) (due diverse carte; nel nostro caso, le coordinate rispetto a duesistemi inerziali K, K′). In ogni punto di tale spazio e definito lo spazio vettorialetangente TxM. Questo spazio prende il posto di V , e ad esso possiamo dunque asso-ciare lo spazio duale T ∗

x M (spazio dei funzionali lineari relativi a TxM), e cosı anchepossiamo considerare i funzionali bilineari. Per definizione, un campo vettorialesu M e una funzione che ad ogni punto x di M associa un vettore di TxM; analoga-mente un campo covettoriale e una funzione che ad ogni punto x di M associa unelemento di T ∗

x M. Cosı, anche, assegnare una metrica (o un prodotto scalare) vuoldire dare una funzione che ad ogni punto x di M associa un funzionale bilineare suTxM (che sia simmetrico e nondegenere).

Comportamento dei campi vettoriali, dei campi covettoriali e della metricasotto cambiamento di coordinate. Consideriamo un cambiamento di coodinatenella varieta M:

x′ i = x′ i(x1, . . . ,xn) , i = 1, . . . ,n , (6.4.5)

e la corrispondente matrice jacobiana A definita da

Aik =

∂x′ i

∂xk .

Siano poi dati un campo vettoriale vi = vi(x1, . . . ,xn) (un vettore funzione del posto)e un campo covettoriale αi = αi(x1, . . . ,xn).

Allora si mostra immediatamente la seguente

Proposizione. Le componenti vi di un vettore e le componenti αi di uncovettore si trasformano rispettivamente con le leggi

v′ i =∂x′ i

∂xk vk , (6.4.6)

α′i =

∂xk

∂x′ i αk . (6.4.7)

40In particolare, M puo coincidere con l’ordinario spazio euclideo o lo spaziotempo relativistico,e quindi essere essa stessa uno spazio vettoriale, sicche le coordinate sono addirittura globali e nonsolo locali; ma non sara piu cosı in relativita generale.

288 Andrea Carati e Luigi Galgani

Tra l’altro, si noti che nella prima relazione figura la matrice jacobiana ∂x′ i

∂xk ,mentre nelle seconda appare la sua inversa (anzi, la trasposta dell’inversa), come sivede in virtu della relazione41

∂x′ i

∂xk∂xk

∂x′ l = δil (6.4.8)

Dimostrazione. Per quanto riguarda le componenti dei vettori, bi-sogna ricordare che il modo piu significativo per definire un vettoree il seguente. Avendo fissato delle coordinate xi (una carta, come sidirebbe in geometria differenziale) si considera una curva parametriz-zata xi = xi(λ), ovvero l’analogo di un movimento, in cui il parametroreale λ prende il posto del tempo. Allora per definizione un vettore enient’altro che la corrispondente “velocita”:

vi =dxi

dλ.

Se poi si considera il cambiamento di variabili (6.4.12), allora lenuove componenti del vettore velocita sono date da

v′ i =dx′ i

dλ,

dove x′ i e funzione composta di λ (attraverso le coordinate xk). Dun-que la prima delle (6.4.6) e nient’altro che la formula per la derivatadi una funzione composta.

Per quanto riguarda le componenti αi dei covettori, la dimostrazionee la seguente. Date le vecchie componenti αi , le nuove α′

i sono definitedalla condizione42 43

α′i v′ i = αk vk per ogni (v1, . . . ,vk)

(perche il risultato che si ottiene applicando α a v non deve dipenderedalla base scelta). Dunque, usando la relazione appena trovata perv′ i, si richiede

α′i∂x′ i

∂xk vk = αkvk per ogni (v1, . . . ,vn) ∈ IRn , (6.4.9)

41Basta, nella (6.4.12), pensare le vecchie variabili xk come funzioni delle nuove x′ l , sicche x′ i efunzione composta delle variabili x′ l . Allora si usa il teorema di derivata di una funzione composta,e si osserva

∂x′ i

∂x′ l = δil .

42Si noti che la (6.4.9) e una condizione sulle componenti α′i, perche tutte le altre quantita sononote.

43Si ricordi che il funzionale lineare α e definito dalla sua azione su tutti i vettori in TxM, cioe sututte le n–uple (v1, . . . ,vn) ∈ IRn; questa e la ragione della condizione “per ogni (v1, . . . ,vn) ∈ IRn”.

Meccanica Razionale 1: Teoria della relativita, parte seconda 289

ovvero

(α′i∂x′ i

∂xk −αk)vk = 0 per ogni (v1, . . . ,vn) ∈ IRn ,

ovvero44 α′i

∂x′ i

∂xk −αk = 0 , k = 1, . . . ,n, o anche

αk = α′i

∂x′ i

∂xk . k = 1, . . . ,n .

Moltiplicando per ∂xk

∂x′ l , sommando su k e usando la (6.4.8) (e cam-biando nome agli indici) si ottiene infine la seconda delle (6.4.6).

Q.E.D.

Regola per il cambiamento delle componenti: Covarianza e con-travarianza. Si vede dunque che le leggi di trasformazione per lecomponenti dei vettori (6.4.6) e quelle dei covettori (6.4.7) sono bendiverse. Si usa dire che le componenti dei vettori sono di tipo contra-variante,45, le componenti dei covettori sono di tipo covariante.46

Le relazioni (6.4.6) e (6.4.7) sono facilissime a ricordarsi. Conside-riamo ad esempio la (6.4.6), in cui le nuove componenti di un vettorev′ i (indice libero i in alto) sono espresse come combinazione linearidelle vecchie vk. Allora l’incertezza e se a destra debba apparire lamatrice jacobiana ∂x′

∂x oppure la sua inversa ∂x∂x′ e come debbano essere

scelti gli indici. La regola e la seguente: la matrice jacobiana a destrarispetta esattamente quello che si trova a sinistra. Ovvero, nel nostroesempio: a sinistra c’e una quantita primata con l’indice in alto ? Al-lora nella matrice jacobiana a destra la quantita primata appare “inalto, ovvero a numeratore”, con lo stesso indice che c’e a sinistra; poi,al denominatore la scelta e determinata in conseguenza. Analoga-mente consideriamo la (6.4.7). A sinistra appare la quantita primatacon l’indice in basso ?. Allora a destra, nella matrice jacobiana, laquantita primata va “in basso, ovvero a denominatore”, con lo stessoindice che c’e a sinistra; poi, al numeratore si va in conseguenza. Lastessa regola (scambiando i termini “primato” e “nonprimato”’) valequando si considerano le relazioni inverse. La grande facilitazione

44Basta prendere successivamente (v1, . . . ,vn) = (1,0, . . . ,0), (v1, . . . ,vn) = (0,1, . . . ,0), . . .,(v1, . . . ,vn) = (0,0, . . . ,1).

45Spesso si usa dire controvariante invece di contravariante, sia in italiano che in inglese. La nostrascelta e quella classica.

46La ragione sta nel fatto che le componenti dei covettori hanno la stessa legge di trasformazionedei vettori base ei (per questo hanno entrambi gli indici in basso), mentre le componenti dei vettoricambiano in maniera “contraria” (contravariano) rispetto a come cambiano i vettori base (per questohanno gli indici in alto, come i covettori–base εi, che contravariano anch’essi.

290 Andrea Carati e Luigi Galgani

consiste nel fatto che non ci si deve ricordare se si debba fare interve-nire la matrice jacobiana o la sua inversa (o addirittura la traspostadi quest’ultima).

L’esempio sopra riportato e fondamentale, ed e il prototipo di una situazio-ne assolutamente generale. Infatti quello che abbiamo compiuto e di determinarela legge di trasformazione delle componenti dei covettori conoscendo la legge ditrasformazione delle componenti dei vettori, e cio e avvenuto basandosi su un pre-ciso requisito, ovvero che l’applicazione di un covettore a un vettore fornisce unrisultato assoluto, indipendente dalla base. Si richiede infatti che valga

α′iv′ i = αkvk

sapendo gia che vale

v′ i =∂x′ i

∂xk vk ,

e questa condizione determina47 α′i in funzione di αi (per una applicazione fisica

all’effetto Doppler, si veda avanti). Se si e capito profondamente questo fatto.allora e immediato svolgere i seguente esercizi:

Esercizio. Sapendo che il prodotto scalare gikviwk e una quantita as-soluta, indipendente dalla scelta delle coordinate (si tratta del pro-dotto scalare g(v,w)), e sapendo che le componenti vi, wk dei vetto-ri si trasformano in maniera contravariante, determinare la legge ditrasformazione delle componenti della metrica gik.

Il risultato che si trova e

g′ik =∂x j

∂x′ i∂xl

∂x′ k g jl , (6.4.10)

ovvero le componenti gik della matrice definente la metrica si com-portano in maniera covariante. Si dice che la metrica e un tensoredoppio, due volte covariante.

Esercizio. Sapendo che vi ed αk sono rispettivamente le componentidi un vettore e di un covettore, e sapendo inoltre che vale

vi = gikαk ,

determinare come si trasformano le componenti gik.

47Questa in effetti e la definizione che si trova proprio all’inizio della esposizione del calcolotensoriale data nel citato articolo di Einstein (si veda la formula (6) relativa ai “vettori covarianti”).Si tratta di un esempio particolare di quello che Einstein chiama “un teorema che sara spesso utileper mettere in evidenza il carattere tensoriale” (parte finale del paragrafo 7).

Meccanica Razionale 1: Teoria della relativita, parte seconda 291

Il risultato che si trova e

g′ ik =∂x′ i

∂x j∂x′ k

∂x l g jl , (6.4.11)

e dunque gik e un tensore doppio, due volte contravariante.

In altri termini, appare evidente che la legge di trasformazione delle compo-nenti, di tipo covariante o di tipo contravariante, e nient’altro che la traduzione diuna proprieta generale, ovvero che si ha a che fare con dei funzionali lineari o mul-tilineari (si veda la precisazione subito sotto) definiti in maniera intrinseca, cioeindipendente dalle coordinate. E questa quella che piu in generale viene chiamatalegge di covarianza o di tensorialita.

Un punto delicato e il seguente, riferendoci ancora al caso di unospazio vettoriale V (ma l’estensione al caso delle varieta e banale).Finora abbiamo privilegiato lo spazio vettoriale V (con i suoi vettori),e allora i covettori sono stati definiti come i funzionali lineari α agen-ti su V , fornendo, per ogni v ∈ V , il numero α(v). Ma abbiamo poidetto (si veda l’Appendice) che l’insieme V ∗ dei covettori e anch’essouno spazio vettoriale, ed e evidente che, avendo fissato v, il numeroα(v) puo essere riguardato come un funzionale lineare agente su V ∗:in altri termini, il duale di V ∗ e proprio V stesso, (V ∗)∗ = V , e dun-que V puo essere riguardato come il duale di V ∗, cioe come l’insiemedei funzionali lineari sullo spazio dei covettori. Si ha pertanto unacompleta simmetria:

α : V → IR , v : V ∗ → IR ,

e la funzione α(v) puo essere denotata, in maniera piu simmetrica,con

< α,v > .

Definizione dei campi tensoriali. Si capisce in tal modo come si possa pervenirealla seguente

Definizione: Data una varieta M e una sua carta locale con coordi-nate x1, . . .xn, un tensore (o meglio un campo tensoriale) di tipo r,s(ovvero r volte contravariante, s volte covariante) e individuato dacomponenti T j1,..., jr

i1,...,is con la proprieta che, al cambiare della carta (ov-vero sotto trasformazione delle coordinate), le nuove componenti sonodate da T ′ j1,..., jr

i1,...,is , dove

T ′ j1··· jri1···is =

∂x′ j1

∂xl1· · · ∂x′ jr

∂xlr

∂xm1

∂x′ i1· · · ∂xms

∂x′ isT l1···lr

m1···ms(6.4.12)

292 Andrea Carati e Luigi Galgani

Questa proprieta, abbastanza complicata a scriversi, rispecchia la piu significa-tiva definizione geometrica seguente: un tensore di tipo r,s su uno spazio vettorialeV e nient’altro che un funzionale multilineare

T : V ∗× . . .×V ∗︸ ︷︷ ︸r volte

×V × . . .×V︸ ︷︷ ︸s volte

→ IR .

Analogamente, nel caso delle varieta (in cui in luogo di V si ha T M =S

x TxM) sot-to cambiamento di coordinate le componenti del tensore T si trasformano nel modosuddetto (si ripensi alla definizione della metrica g e alla legge di trasformazionedelle sue componenti gik). Si noti che, conformemente alla osservazione appenafatta sopra, questa definizione geometrica comprende come caso particolare ancheil vettore, pensato come funzionale lineare su V ∗, ovvero v : V ∗ → IR.

Si noti anche come questi tensori di tipo r, s sono una generalizzazione del“tensore prototipo” di ordine zero, cioe lo scalare.48

E interessante notare che vale anche l’inverso di quanto detto sopra: se un certoente e definito mediante componenti che si trasformano nel modo sopra indicato,allora tale ente ha significato geometrico, cioe e un funzionale multilineare del tipodetto sopra.

Esempio. Sia dato uno spazio vettoriale V , sicche sappiamo che ivettori v∈V hanno componenti che si trasformano con la regola v′ i =∂x′i

∂xk vk. Ammettiamo ora di avere un ente definito da componenti αi

che si trasformano con la legge α′i = ∂xk

∂x′iαk. Vogliamo mostrare che le

componenti {αi} definiscono un covettore α : V → IR. Cio vuol direche, per ogni vettore v, si deve avere un risultato α(v) che non dipendedalla base scelta, ovvero si deve avere

αivi = α′k v′ k .

E infatti si ha49

α′i v′ i =

∂xl

∂x′iαl

∂x′ i

∂xk vk =∂xl

∂x′ i∂x′ i

∂xk αlvk

= δlkαlvk = αlvl

48Si tratta di una funzione a valori reali definita sulla varieta, diciamo F : M → IR. Essa definisceun numero reale per ogni punto della varieta; e allora la forma funzionale della funzione f cherappresenta F deve necessariamente variare al variare delle coordinate proprio in maniera tale chenon cambi il valore di F in corrispondenza di un definito punto della varieta. Ad esempio, se M e laretta reale, e x una coordinata, allora lo scalare F : M → IR sara rappresentato da una funzione reale divariabile reale, diciamo f = f (x). Se poi si passa a un’altra coordinata x′ = x′(x), allora la medesimafunzione F : M → IR sara rappresentata da una diversa funzione f ′ definita da f ′(x′) = f (x(x′)).

49Si ricordi che gli indici su cui si somma sono “muti” o indici fantoccio (“dummy”) e si puo darloro un nome arbitrario.

Meccanica Razionale 1: Teoria della relativita, parte seconda 293

Qui si e fatto uso della proprieta

∂xl

∂x′ i∂x′ i

∂xk = δlk ,

che, come gia osservato, non e altro che il teorema di derivata dellafunzione composta (si somma su i, mentre l,k sono fissati!): si pensax funzione di x′ e poi x′ funzione di x, e si ricorda ∂xl

∂xk = δlk.

L’esempio appena illustrato e un caso particolare della fondamentale

Regola della traccia (o della contrazione o della saturazione): Quan-do in una espressione contenente delle componenti tensoriali si som-ma su un indice ripetuto che si trova una volta in alto (indice di con-travarianza) e una volta in basso (indice di covarianza) (o, come sidice, si satura un indice in alto con uno in basso) si ottiene un tensoredi due ordini in meno, in cui “sono scomparsi quei due indici”. Cosıle quantita αivk individuano un tensore doppio 1− 1 (una volta con-travariante, una volta covariante), ma se si esegue la saturazione deidue indici si ha la quantita αivi che e uno scalare. Analogamente, seT kl

i sono le componenti di un tensore di tipo 2−1, allora T ili (avendo

sommato su i) sono le componenti di un tensore di tipo 1− 0, ovverodi un vettore. Analogamente gikvk “e un covettore”, mentre gikαk “eun vettore”.

Questa proprieta e una immediata conseguemza della definizione (6.4.12)di tensore e della identita (6.4.8).

Veniamo infine all’ultimo richiamo di questo lungo paragrafo: esso riguarda glioperatori differenziali. Cominciamo con un

Esempio. Le quantita

∂i f :=∂ f∂xi

sono le componenti di un covettore (o meglio, di un campo covettoria-le)50 (se f e uno scalare), ovvero si trasformano secondo la legge

∂′i f ′ =

∂xk

∂x′ i ∂k f . (6.4.13)

Abbiamo qui denotato con f ′ la funzione f in cui si e eseguito ilcambiamento di variabili, e anche ∂′i f ′ ≡ ∂

∂x′ i f ′.

Dimostrazione. La (6.4.13) e nient’altro che la formula per laderivata di una funzione composta,

∂ f ′

∂x′ i =∂ f∂xk

∂xk

∂x′ i .

50Si noti che l’aver posto l’indice in alto in xi conduce naturalmente ad un indice in basso per ∂i(infatti l’indice i sta in alto al denominatore).

294 Andrea Carati e Luigi Galgani

Q.E.D.

Si conferma quindi che quello che di solito viene chiamato il “gra-diente” non e un vettore (meglio campo vettoriale) ma un covettore(campo covettoriale). Il vettore gradiente e invece definito “alzandogli indici”, cioe e dato da ∂i f := gik∂k f .

Si potrebbe allora pensare ingenuamente che eseguendo successive operazionidi derivazione si ottengano sempre tensori, di ordine opportuno, cioe che ogni ope-razione di derivazione aggiunge un indice di covarianza. Ma cio non e vero, comemostra il seguente

Lemma. Per le derivate successive di una funzione scalare f vale lalegge di trasformazione

∂′i∂′k f ′ =

∂xl

∂x′ i∂xm

∂x′ k ∂l∂m f +∂2xm

∂x′ i∂x′ k ∂m f . (6.4.14)

Dimostrazione. Per il teorema di derivata di una funzione composta(6.4.13) si ha

∂′i∂′k f ′ =

∂xl

∂x′ i ∂l

(∂xm

∂x′ k ∂m f)

=∂xl

∂x′ i∂xm

∂x′ k ∂l∂m f +∂xl

∂x′ i ∂l

(∂xm

∂x′ k

)∂m f .

In tal modo e stato determinato il primo termine a secondo membrodella (6.4.14). Nel secondo termine si usa poi

∂l =∂x′ p

∂xl ∂′p

e si ricorda ∂x′ p

∂xl∂xl

∂x′ i = δpi . Q.E.D.

Tuttavia la situazione e molto piu semplice se ci si limita a considerare trasfor-mazioni di coordinate che siano lineari. Si ha infatti il

Corollario. Se ci si limita a trasformazioni di coordinate x′ i = x′ i(x1. . . . ,xn)lineari, le quantita ∂i∂k f si comportano come le componenti di untensore due volte covariante.

Dimostrazione. Poiche anche la trasformazione inversa e lineare,si ha

∂2xm

∂x′ i∂x′ k = 0 .

Dunque nella legge di trasformazione (6.4.14) si annulla il secondotermine, e ci si riduce alla legge di trasformazione dei tensori duevolte covarianti. Q.E.D.

Meccanica Razionale 1: Teoria della relativita, parte seconda 295

In effetti, esiste un modo generale per ottenere quantita geometriche (cioe aven-ti carattere tensoriale) per derivazione di tensori quando si abbia a disposizione unametrica. Questo procedimento fu inventato da Levi Civita nel 1916 e fu poi gene-ralizzato da H.Weyl (derivata covariante) ed e stato da noi implicitamente usato,senza farlo notare esplicitamente, nella deduzione dell’equazione di Lagrange.

Dimenticandoci ora del problema generale della derivata covariante, ci bastaqui avere constatato (nel caso delle derivate seconde, ma si vede subito che il ri-sultato e generale) che, se ci si limita a trasformazioni lineari (come le rotazioninello spazio euclideo, e le trasformazioni di Lorentz nello spaziotempo), e veroche le operazioni di derivazione aggiungono altrettanti indici di covarianza. Adesempio, se ci si limita a trasformazioni lineari, allora ∂i∂k f (dove f e uno scalare)si comporta come un tensore due volte covariante (di tipo 0−2); analogamente, sevi sono le componenti di un vettore (o meglio, di un campo vettoriale), allora ∂k vi

si comporta come un tensore di tipo 1− 1, e ∂ivi come uno scalare (la divergenzadel campo vettoriale v) e cosı via.

Particolarmente importante e il seguente esempio, che sara di fondamentale in-teresse per il campo elettromagnetico. Se Aµ e un vettore, e Aµ il corrispondentecovettore, allora ∂µAν e un tensore due volte covariante, come lo e anche il tensoreFµν := ∂µAν − ∂νAµ. Questo tensore doppio Fµν e evidentemente emisimmetrico(Fµν =−Fνµ), sicche e individuato da 6 componenti. Se Aµ ≡ (Φ,A) e il quadripo-tenziale, allora verificheremo che le componenti indipendenti del tensore Fµν sonoproprio le componenti del campo elettrico E e del campo magnetico H. Il tensoreFµν viene talvolta detto Tensore di Faraday.

Possiamo infine concludere questi cenni di calcolo tensoriale con il seguentefondamentale esempio.

Invarianza in forma dell’operatore dalembertiano sotto trasfor-mazioni di Lorentz. Si osserva anzitutto che in un sistema inerziale(con coordinate spaziali cartesiane ortogonali), avendo la metrica gµν

la forma diagonale diag (1,−1,−1,−1), il dalembertiano (denotiamo∂2

tt = ∂t∂t e cosı via)

� := ∂2tt − (∂2

xx +∂2yy +∂

2zz)

si esprime nella forma� = gµν

∂µ∂ν .

Questa forma e quella buona, perche satura due indici, uno in alto euno in basso, e fornisce uno scalare. Sappiamo pertanto che, se orapassiamo ad un altro arbitrario sistema di coordinate51, si avra

� ′ = g′ µν∂′µ∂

′ν

51Sottointendiamo, ottenuto con trasformazioni lineari come quelle di Lorentz, perche altrimentidovremmo introdurre la derivata covariante in luogo dell’ordinaria derivazione.

296 Andrea Carati e Luigi Galgani

dove g′ µν avra una certa espressione fornita dalla regola

g′ µν =∂x′ µ

∂xλ

∂x′ ν

∂xσgλσ .

Tale espressione risulta in generale alquanto complicata. Ma se ci li-mitiamo a considerare trasformazioni di Lorentz, sappiamo che questesono isometrie, ovvero sono tali che52 g′ µν = diag (1,−1,−1,−1),e dunque si ha ancora

� ′ = ∂2t ′t ′− (∂2

x′x′ +∂2y′y′ +∂

2z′z′) .

Esercizio: Soluzioni dell’equazione di d’Alembert in forma di on-de piane, ed effetto Doppler. Consideriamo l’equazione di d’Alem-bert (nell’incognita u = u(t,x) )

∂µ∂µ u = 0 ovvero gµν

∂µ∂ν u = 0 , (6.4.15)

e cerchiamone una soluzione nella forma

u = Aexp[ikµxµ] (6.4.16)

con dei parametri kµ liberi. Per ogni fissato kµ si tratta di un’ ondapiana perche il luogo geometrico u =cost e definito nello spaziotempodalla condizione kµxµ =cost, ovvero da un iperpiano. A sua volta (almodo solito), questo iperpiano nello spaziotempo corrisponde nellospazio ordinario a una famiglia di piani paralleli che traslano conuna certa velocita. Questa viene determinata nel modo seguente.

Si osserva che la condizione che u soddisfi l’equazione di d’Alembertsi traduce nella condizione gµνkµkν = 0, ovvero

kµkµ = 0 . (6.4.17)

Dunque l’onda piana (6.4.16) soddisfa l’equazione di d’Alembert (6.4.15)soltanto se il quadrivettore kµ e un vettore nullo (cioe ha pseudo-lunghezza nulla). La relazione (6.4.17) viene detta relazione di di-spersione e la ragione e la seguente. Scriviamo kµxµ nella formatradizionale

kµxµ = ω t−k ·x ,

il che vuol dire (ricordando xµ = (ct,x) ) che il quadrivettore kµ asso-ciato al covettore kµ viene decomposto in parte temporale (frequenzaangolare o pulsazione) e parte spaziale (vettore d’onda) come

{kµ}= (ω

c,k) .

52Piu direttamente, avremmo g′µν = gµν, ma poi segue allora g′ µν = gµν.

Meccanica Razionale 1: Teoria della relativita, parte seconda 297

Allora la (6.4.17) fornisce una relazione tra frequenza ω e vettored’onda k come avviene nella familiare relazione di dispersione. Nelcaso qui considerato di soluzioni dell’equazione di d’Alembert nelvuoto, tale relazione ha dunque la forma (ω/c)2−||k||2 = 0, ovvero

|ω|= ck , k = ||k|| .

In altri termini, l’equazione di d’Alembert nel vuoto ha soluzioni dellaforma di onde piane normali al vettore d’onda k (dunque con lunghez-za d’onda λ = 2π/k) e con pulsazione ω se questi piani si spostano convelocita c e inoltre si ha ω = ck.

Esercizio: Si deduca la formula per l’effetto Doppler relativistico perun “boost” di Lorentz (K′ trasla con velocita v lungo l’asse x di K).Se (l,m,n) denotano i coseni direttori del vettore d’onda k (ovvero siha kx = l ω/c, ky = m ω/c, kz = m ω/c) allora si trovi

ω′ = ωγ(1− vl/c) . (6.4.18)

Si ottengano anche le analoghe relazioni per i coseni direttori delvettore d’onda k nel sistema K′. Si confronti l’articolo originale diEinstein, paragrafo 7. 53

6.5 L’elettromagnetismo in forma covariante (o tensoria-le)

6.5.1 Forma covariante della relazione tra potenziali e campi: il ten-sore di Faraday.

La realazione tra potenziali e campi e l’ambito in cui il passaggio dal formalismotridimensionale e quello quadridimensionale nello spaziotempo manifesta tutta lasua potenzialita; infatti la relazione tra potenziali e campi prende una forma di unasemplicita e una simmetria stupefacenti.

Ricordiamo brevemente quanto avevamo gia visto con il formalismo elemen-tare tridimensionale. Avevamo introdotto i potenziali scalare Φ e vettore A, chefornivano i campi E e H mediante le formule

E =−gradΦ− 1c

∂A∂t

, H = rotA , (6.5.1)

come traduzione delle equazioni di Maxwell omogenee. Le equazioni inomogeneeassumevano invece, nel gauge di Lorentz, caratterizzato da

1c

∂Φ

∂t+divA = 0 , (6.5.2)

53Si faccia attenzione al fatto che nell’articolo originale Einstein denota con β il fattore di Lorentzche oggi tutti denotano con γ.

298 Andrea Carati e Luigi Galgani

la forma di d’Alembert�Φ = ρ , �A = j/c . (6.5.3)

Osserviamo ora la potenza del formalismo quadridimensionale. Il primo passoconsiste nel porre come assioma che la densita di carica ρ e la densita di corrente jsi mettono assieme a formare il quadrivettore densita di quadricorrente jµ definitoda54

{ jµ} ≡ (ρc, j) . (6.5.4)

Da qui segue allora che anche i potenziali costituiscono un quadrivettore, cioe sipuo porre

{Aµ} ≡ (Φ,A) . (6.5.5)

Questa e infatti coerente con la (6.5.4), perche il dalembertiano e invariante.La prima semplificazione di scrittura che si ottiene allora e che la condizione

di Lorentz (6.5.2) viene scritta in forma quadridimensionale nella semplicissima esimmetrica forma

∂µAµ = 0 . (6.5.6)

Inoltre, anche le relazioni tra potenziali e campi, dalla loro forma estremamen-te asimmetrica (6.5.1) vengono ad assumere una forma estremamente elegante esemplice nel formalismo quadridimensionale. Infatti si ha ad esempio

Hz = ∂1A2−∂2A1

Ez =−∂0A3−∂3A0 ,

e si osserva anzitutto che questa scrittura assume forma piu simmetrica se si ab-bassano gli indici (e dunque cambiamo di segno alle componenti spaziali), percheallora si ha

−Hz = ∂1A2−∂2A1

Ez = ∂0A3−∂3A0 .

Considerando anche le altre relazioni in maniera analoga, e allora spontaneo intro-durre il tensore doppio

Fµν = ∂µAν−∂νAµ (Fµν =−Fνµ) , (6.5.7)

che e evidentemennte antisimmetrico, e dunque e individuato da 6 componentiindipendenti (quante sono le componenti dei campi E ed H). Infatti si riconosceimmediatamente che le componenti del tensore Fµν sono date, in termini dei campi,da

{Fµν

}=

0 Ex Ey Ez

−Ex 0 −Hz Hy

−Ey Hz 0 −Hx

−Ez −Hy Hx 0

. (6.5.8)

54Si deve pensare che la densita di corrente j associata a una particella coincida con ρv dove v e lavelocita della particella e ρ la corrispondente densita di carica.

Meccanica Razionale 1: Teoria della relativita, parte seconda 299

Si vede dunque che il campo elettrico e il campo magnetico costituiscono unaunita, il tensore doppio antisimmetrico Fµν (detto talvolta tensore di Faraday).Un punto cruciale e che la struttura tensoriale del quadrivettore Aµ comporta auto-maticamente una struttura tensoriale per Fµν (tensore due volte covariante), siccheviene automaticamente stabilito quale e la legge di trasformazione delle sue com-ponenti (e quindi anche dei campi E, H) quando si compie una trasformazione diLorentz sulle coordinate. Svolgeremo questo esercizio piu sotto, verificando che siottengono proprio le leggi di trasformazione gia trovate nella prima parte di que-sto capitolo con il metodo elementare alla Lorentz, Poincare ed Einstein (metodoforza bruta). Questo esempio dovrebbe illustrare in maniera sufficiente le parole diEinstein citate piu sopra:

“Egli (Minkowski) invece riuscı ad introdurre un formalismo tale chela forma matematica della legge garantisce di per se l’invarianza dellalegge stessa rispetto alle trasformazioni di Lorentz. Creando un calco-lo tensoriale quadridimensionale, egli ottenne per lo spaziotempo cioche il calcolo tensoriale aveva ottenuto per le tre dimensioni spaziali.”

Mostreremo anche quale forma assumono le equazioni di Maxwell in terminidel tensore di Faraday. Preliminarmente, osserviamo che il tensore antisimmetricoFµν associato ad Fµν secondo le regole per l’innalzamento degli indici e dato da

{Fµν}=

0 −Ex −Ey −Ez

Ex 0 −Hz Hy

Ey Hz 0 −Hx

Ez −Hy Hx 0

. (6.5.9)

6.5.2 Le equazioni di Maxwell in termini del tensore di Faraday F .

Si ha la

Proposizione. In termini del tensore di Faraday Fµν = ∂µAν − ∂νAµ

(e del suo corrispondente contravariante Fµν) le equazioni di Maxwellinomogenee si scrivono (in coordinate cartesiane ortogonali rispettoalla metrica di Lorentz) nella forma

∂µFµν = jν/c (ν = 0,1,2,3) , (6.5.10)

mentre le equazioni omogenee assumono la forma

∂λFµν +∂µFνλ +∂νFλµ = 0 , (λ,µ,ν = 0,1,2,3) . (6.5.11)

Dimostrazione. Per le equazioni inomogenee la verifica e immedia-ta. Per quanto riguarda quelle omogenee, osserviamo anzitutto che leequazioni che si ottengono in tal modo sono proprio in numero di 4,

300 Andrea Carati e Luigi Galgani

e corrispondono alle scelte possibili degli indici (λ,µ,ν) tutti diversitra di loro, ovvero (0,1,2) , (0,1,3) , (0,2,3) , (1,2,3) . Infatti siverifica facilmente che in tutti gli altri casi, per l’antisimmetria di F,Fµν = −Fνµ, si ottiene l’identita 0 = 0. Nei casi non banali si ha adesempio:

(0,1,2)→ ∂0F12 +∂1F20 +∂2F01 = 0

cioe la terza componente di 1c ∂tH+ rotE = 0. Inoltre si ha

(1,2,3)→ ∂1F23 +∂2F31 +∂3F12 = 0

ovvero divH = 0. Q.E.D.

Esercizio. Verificare che la legge generale di trasformazione delle componenti deitensori, applicata al tensore di Faradyay, fornisce per la trasformazione dei campiesattamente quella precedentemente trovata con il metodo di Lorentz, Poincare edEinstein.Svolgimento. Si veda Landau Lifshitz, Teoria dei campi, paragrafo 24.

6.6 Particella in campo elettromagnetico

6.6.1 Equazioni di moto in forma covariante (con campi assegnati)

Seguendo il procedimento induttivo sviluppato nella prima parte di questo capito-lo siamo gia pervenuti all’assioma che l’azione hamiltoniana di una particella incampo elettromagnetico e data da

S =−Z (

mc+ec

g(A,u))ds , (6.6.1)

dove g(A,u) e il prodotto scalare tra quadrivelocita uµ e quadripotenziale Aµ,

g(A,u) = gµνAµuν = Aµuµ ,

ovveroS =−

Z (mc+

ec

Aµuµ)ds . (6.6.2)

Facendo uso della scrittura (6.6.1) per l’azione, abbiamo gia ottenuto per una par-ticella in campo elettromagnetico l’equazione di moto in forma tridimensionale,ovvero

ddt

(mγv) = e(E+1c

v×H) , (6.6.3)

con il corrispondente teorema dell’energia

ddt

mγc2 = eE ·v , (6.6.4)

e vogliamo ora scrivere le corrispondenti equazioni in forma covariante. Otterremoin tal modo 4 equazioni, di cui la componente spaziale coincidera con la (6.6.3),mentre la componente temporale fornira il teorema dell’energia (6.6.4).

Meccanica Razionale 1: Teoria della relativita, parte seconda 301

Proposizione. L’equazione di moto per una particella in campo elet-tromagnetico, scritta in forma covariante, e data da

mc2 aµ = eFµνuν (µ = 0,1,2,3) (6.6.5)

o equivalentemente da

mc2 aµ = eFµνuν (µ = 0,1,2,3) . (6.6.6)

Dimostrazione. L’azione hamiltoniana (6.6.2) ha la forma

S =Z

Lds

conL = L(mecc)− e

cAµuµ ,

dove L(mecc) = −mcL, mentre L e la lagrangiana usata nel capito-lo precedente per studiare le geodetiche della particella libera. Imovimenti naturali sono allora le soluzioni xµ(s) delle equazioni diEulero–Lagrange

dds

∂L∂uµ −

∂L∂xµ = 0 .

Avevamo gia eseguito il calcolo che fornisce

∂L(mecc)

∂uµ =−mcuµ .

Dunque si trova∂L∂uµ =−mcuµ−

ec

Aµ ,

∂L∂xµ =− e

c(∂µAν)uν .

Pertanto si hadds

∂L∂uµ − ∂L

∂xµ

=−mcaµ− ec

[(∂νAµ)uν− (∂µAν)uν

]=−mcaµ + e

c

(∂µAν−∂νAµ

)uν

=−mcaµ + ec Fµνuν ,

e dunque le equazioni di Eulero–Lagrange hanno la forma

mcaµ =ec

Fµνuν .

Q.E.D.

Esercizio. Controllare che la componente spaziale dell’equazione dimoto quadridimensionale (6.6.6) fornisce la (6.6.3), e che la compo-nente temporale fornisce il corrispondente teorema dell’energia (6.6.4).

302 Andrea Carati e Luigi Galgani

APPENDICE: SUL DUALE DI UNO SPAZIO VETTORIALE

La base duale. Cominciamo con l’osservare che, data una base {ei} in V , esistonon covettori che si possono veramente toccare con mano. Si tratta dei covettori checorrispondono alla familiare operazione di “misurare i vettori”, cioe misurare lecomponenti di un vettore rispetto alla base assegnata. Infatti, ben sappiamo che,data la base, ogni vettore x e univocamente determinato da componenti x1, . . . ,xn

tramite la (6.4.1), x = ∑i xiei ≡ xiei. Si tratta ora di compiere l’operazione inversa,cioe determinare le componenti quando sia dato il vettore. Il salto psicologico chesi deve compiere e di pensare alle componenti come ottenute mediante un’opera-zione, cioe come una funzione che produce un numero in corrispondenza di ognivettore. Fissato un ben definito vettore tra i vettori base ei, ad esempio e1, allora ilnumero x1 e una funzione a valori reali definita su V , ovvero si ha x1 : V → IR, ed eevidente che tale funzione e lineare. Dunque l’operazione di misurare (o estrarre)la i–esima componente di un vettore quando sia fissata una base55 e un covettore,che denoteremo con εi:

εi (∑

kxkek)≡ ε

i (xkek) = xi . (6.6.7)

Equivalentemente, il covettore εi e definito da

εi(ek) = δ

ik . (6.6.8)

Dovrebbe dunque essere chiaro che il covettore α definito dalla n–upla α1, . . . ,αn

mediante la (6.4.2) puo essere pensato come combinazione lineare degli n covettori–base εi, precisamente la combinazione

α = ∑i

αiεi , (6.6.9)

quando si sottintenda di prendere la naturale definizione di combinazione linea-re.56 Infatti la (6.6.9) e nient’altro che una riscrittura della (6.4.3). In questosenso dunque, assegnata una base {ei} in V , risulta che nello spazio duale V ∗ ecorrispondentemente assegnata una ben definita base, ovvero la {εi} definita dalla(6.6.7) o dalla (6.6.8). Questa viene detta “base duale”. Se si hanno un vettorex ∈ V e un covettore α ∈ V ∗ individuati dalle loro componenti xi ed αi nel sen-so che x = ∑xiei ≡ xiei, α = ∑αiε

i ≡ αiεi, allora si ha α(x) = ∑αixi ≡ αixi. 57

55Abbiamo gia ricordato che qui si considerano i vettori a livello puramente algebrico, senzaalcun riferimento a un eventuale prodotto scalare, cioe senza nessuna nozione di ortogonalita, o basiortonormali.

56Ovvero, dati due covettori α, β e due numeri reali a, b, il covettore aα+bβ e definito da

(aα+bβ)(x) := aα(x)+bβ(x) per ogni x ∈V .

57Da quanto detto risulta in particolare che V e V ∗ hanno la stessa dimensione, perche ogni co-vettore α ∈ V ∗ e univocamente individuato da n numeri αi. Naturalmente, anche V ∗, essendo uno

Meccanica Razionale 1: Teoria della relativita, parte seconda 303

Dunque, l’i–esimo covettore–base εi agisce su ogni vettore estraendone la i–esimacomponente (misura la i–esima componente del vettore).

Covettori, e iperpiani dello spazio vettoriale V . Abbiamo dunque illustrato co-me esistano dei covettori ben concreti, che corrispondono a misurare le componentidei vettori rispetto ad una base assegnata, e inoltre come ogni covettore sia com-binazione lineare di quelli. Ma ci si puo anche domandare se i covettori possanoessere descritti in maniera intrinseca, ovvero in maniera indipendente dalla sceltadella base, e addirittura con riferimento allo spazio vettoriale V su cui essi sonodefiniti. La risposta e assolutamente positiva. Anzitutto, ogni covettore individuaun piano (o un iperpiano, nel caso n > 3) nello spazio vettoriale V . Infatti, fissatoun covettore α ∈ V ∗ (con certe componenti (α1, . . . ,αn) relative alla scelta di unabase in V ), si consideri il sottoinsieme di V definito da

Π = {x ∈V : α(x) = 0 , ovvero ∑i

αixi = 0} ; (6.6.10)

in altri termini, Π e il nucleo (ingl. kernel) del funzionale lineare α. Allora tuttisappiamo che Π e un piano passante per l’origine dello spazio vettoriale V . Si notiche ogni covettore β = aα (a ∈ IR), multiplo di quello considerato, evidentementedefinisce lo stesso piano Π. Viceversa, ad ogni piano passante per l’origine di Vsono associati infiniti covettori, che si ottengono l’uno dall’altro moltiplicando unoarbitrario di essi per un numero. Se si vuole, e possibile poi identificare ognuno ditali covettori assegnando, in aggiunta al piano passante per l’origine, anche il pianoad esso parallelo sul quale quel particolare covettore prende il valore 1. Si capiscedunque perche i covettori svolgono un ruolo importante in ottica nella discussionedei fronti d’onda, e piu in generale nello studio dei fenomeni di propagazione delleonde.

Nelle trattazioni elementari riferite allo spazio euclideo E3, non si fa alcun rife-rimento ai covettori perche un piano passante per l’origine viene definito attraversola scelta di un vettore n ad esso ortogonale. Ovvero, fissato il vettore n in E3, ilpiano Π e definito da

Π = {x ∈ IR3 : x ·n = 0} . (6.6.11)

Ma, come gia abbiamo osservato, cio e possibile solo in virtu del fatto che nellospazio euclideo E3 e assegnata una metrica (cioe un prodotto scalare), e questofatto, come mostriamo nel testo, fornisce un isomorfismo naturale tra vettori e co-vettori. Si tenga tuttavia presente che, se si prende in V una base che non e ortonor-male rispetto all’assegnato prodotto scalare, allora i coefficienti che figurano nelladefinizione analitica del piano, ovvero i numeri αi (le componenti del covettore

spazio vettoriale, avra il suo duale, che coerentemente denoteremo con (V ∗)∗, o piu semplicemntecon V ∗∗ (biduale di V ) e si mostra iimediatamente che (nel caso finito–dimensionale) si ha V ∗∗ = V .Invece V ∗ e V sono proprio due spazi diversi, che possono venir posti in corrispondenza biunivoca inmaniera “naturale” solo quando si introduca un nuovo elemento nello spazio vettoriale, ad esempio(come nel caso che a noi interessa qui) una metrica, ovvero un prodotto scalare, come e mostrato neltesto.

304 Andrea Carati e Luigi Galgani

α definente il piano), non coincidono affatto con le componenti del vettore n chefigura nella definizione (6.6.11). Questo fatto e spesso causa di confusione nelletrattazioni elementari.