universita degli studi di ferrara`felix.unife.it/didattica/tesi/21085-testoni.pdf · 2009. 7....

97
UNIVERSIT ` A DEGLI STUDI DI FERRARA FACOLT ` A DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea Triennale in Matematica Indirizzo Matematica Applicata CATENE DI MARKOV FINITE E TEORIA DI PERRON-FROBENIUS Relatore: Chiar.mo Prof. Josef Eschgf ¨ aller Laureanda: Elena Testoni Anno Accademico 2008-2009

Upload: others

Post on 25-Sep-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

UNIVERSITA DEGLI STUDI DI FERRARA

FACOLTA DI SCIENZE MATEMATICHE, FISICHE ENATURALI

Corso di Laurea Triennale in Matematica

Indirizzo Matematica Applicata

CATENE DI MARKOV FINITE ETEORIA DI PERRON-FROBENIUS

Relatore:Chiar.mo Prof.Josef Eschgfaller

Laureanda:Elena Testoni

Anno Accademico 2008-2009

Page 2: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`
Page 3: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Indice

Introduzione 1

I. CATENE DI MARKOV FINITE

1. Variabili aleatorie elementari 5

2. Il teorema di Radon-Nikodym discreto 14

3. Regole per probabilita composte 19

4. Sequenze di Markov 20

5. Catene di Markov finite 25

6. La matrice di transizione 29

7. Esempi di catene di Markov 31

8. Un programma di simulazione 38

9. Una formula per le potenze 40

10. Il teorema ergodico matriciale 45

II. MATRICI NON NEGATIVE

11. Sistemi dinamici stocastici finiti 59

12. Una stima per il raggio spettrale 63

13. Il teorema di Perron 67

14. Matrici irriducibili 73

15. Il teorema di Frobenius 77

16. Il teorema di Wielandt 79

17. Matrici primitive 82

18. Un modello demografico 91

Bibliografia 92

Page 4: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`
Page 5: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Introduzione

La tesi e suddivisa in due parti: la prima dedicata alla teoria ergodicadelle catene di Markov finite, la seconda allo studio delle matrici nonnegative.

Nei primi tre capitoli vengono forniti alcuni richiami alla teoria del-la probabilita, con la definizione di σ-algebra, variabile aleatoria ele-mentare e alcune proprieta che le caratterizzano. Viene anche enun-ciato e dimostrato il teorema di Radon-Nikodym discreto per la mediacondizionata di una variabile aleatoria elementare.

Il quarto capitolo introduce le sequenze di Markov, un concetto ausi-liario per rendere piu trasparenti i ragionamenti probabilistici usatinei capitoli seguenti.

Nel quinto capitolo vengono introdotte le catene di Markov finite,ossia processi stocastici finiti per i quali l’applicazione ©

n,i(Xn = i)

e una sequenza di Markov.

Nel capitolo 6 vengono approfondite alcune proprieta della matricedi transizione T con cui puo essere descritta una catena di Markov fi-nita. Per il teorema di Kolmogorov (di cui una dimostrazione si trovanella monografia di Woess) per ogni matrice stocastica T ed ogni vetto-re stocastico p0 esiste una catena di Markov ©

nXn finita ed omogenea

tale che la matrice di transizione associata sia T e tale che l’elementoi-esimo di p0 equivale alla probabilita che X0 assuma tale valore i.

Alcuni esempi di catene di Markov e un programma di simulazionesono contenuti nei capitoli 7 e 8.

Il capitolo 9 contiene una formula che ci permette di calcolare la po-tenza n-esima di una matrice qualunque utilizzando il polinomio diinterpolazione di Hermite calcolato mediante lo schema alle differen-ze. Questa formula, numericamente instabile e complicata, e piu diinteresse teorico, e in pratica per le matrici stocastiche e non negativesi useranno invece le formule al limite che deriveremo nel seguito.

Nel capitolo 10, attraverso diversi risultati dell’algebra lineare nu-merica, si studiano le proprieta di una matrice stocastica T .1 e autovalore di T e coincide con il raggio spettrale. Il teorema ergodi-

co matriciale (teorema 10.9) afferma che limN−→∞

1

N

N−1∑

n=0

T n = P , dove P

e la proiezione su FixT , nella decomposizione Rq = Fix T ⊕ Im(T − δ).

In generale la successione ©nT n stessa non converge, ma soltanto

nel caso in cui 1 sia l’unico autovalore di modulo massimo (teorema10.34). In questo caso si ha allora che lim

n→∞T n = P (corollario 10.44).

Alla fine del capitolo la teoria viene illustrata con alcuni esempi calco-lati con Sage.

1

Page 6: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

La seconda parte inizia con il capitolo 11 nel quale vengono defini-ti sistemi dinamici stocastici finiti ad ognuno dei quali viene associatain modo naturale una matrice stocastica, quindi una catena di Markovfinita. Tali sistemi possono essere utilizzati per simulare il comporta-mento di un insieme di cellule in un tessuto che potrebbero passareda uno stato ad un altro. Facciamo vedere come da questo modello siarrivi in modo intuitivo al concetto di matrice non negativa.

Nel capitolo 12 lo studio delle proprieta delle matrici non negativeinizia con alcune importanti stime del raggio spettrale. Esso e ad es-empio compreso tra il minimo e il massimo delle somme di riga e trail minimo e il massimo delle somme di colonna.

Nei capitoli successivi viene esposta la teoria di Perron-Frobenius.Questa teoria inizia con il teorema di Perron. Si dimostra che se Ae una matrice positiva, allora ρ(A) e un autovalore di A di moltepli-cita algebrica uguale a 1 e ad esso corrisponde un autovettore positivo(vettore di Perron) e che tale autovettore e unico se chiediamo che siastocastico. Un altro risultato importante e il teorema 13.21 che per-mette di calcolare il lim

n→∞( 1

ρ(A)An).

Nel capitolo 14, invece, vengono introdotte le matrici (non negative)irriducibili e alcune proprieta che le caratterizzano: una matrice nonnegativa e irriducibile se e solo se esiste m ∈ N tale che (A + δ)m siapositiva.

Il capitolo 15 contiene il teorema di Frobenius per matrici non ne-gative ed irriducibili. Si dimostra che se A e una tale matrice, il suoraggio spettrale ρ(A) e autovalore positivo di A, con molteplicita al-gebrica uguale a 1 ed esiste inoltre un autovettore positivo rispettoall’autovalore ρ(A) (teorema 15.4).

Il teorema di Wielandt nel capitolo 16 stabilisce che se A e una ma-trice non negativa ed irriducibile, l’insieme degli autovalori di modulo

massimo e dato da M(A) = e 2πi

hjρ(A) | j = 0, . . . , h − 1, dove h e la

cardinalita di M(A). Esso stabilisce inoltre che ogni elemento di M(A)ha molteplicita algebrica 1 come autovalore di A.

Il capitolo 17 introduce le matrici primitive, che costituiscono un’ul-teriore sottoclasse delle matrici non negative ed irriducibili, e vengonoesposte le proprieta che le caratterizzano. Esse sono molto importantipoiche alle matrici primitive si generalizza in modo soddisfacente ilteorema di Perron per le matrici positive, come mostrato nel teorema17.5. Vengono introdotte anche le matrici di incidenza e, attraverso al-cuni semplici programmi in Sage, elencate tutte le matrici di incidenza2 × 2 e 3 × 3 primitive e quelle primitive minimali.

Il capitolo 18 mostra in un semplice e popolare modello (noto comemodello di Leslie) come si puo applicare la teoria in demografia. In essosi considera una popolazione suddivisa in fasce d’eta, che pero possonoanche essere interpretate come compartimenti funzionali delle celluledi un tessuto. A questa situazione possono essere applicati i teoremidi convergenza ottenuti nei capitoli precedenti.

2

Page 7: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

La teoria di Perron-Frobenius e stata originata da Perron nell’ambitodella teoria ergodica delle frazioni continue (cfr. Iosifescu/Kraaikamp).

Si e pero rivelata, come mostra il contenuto di questa tesi, utile inmolti altri campi. Negli anni ’60 e stata generalizzata a operatori esemigruppi di operatori positivi su reticoli di Banach; si vedano ad es-empio i lavori citati di Lotz, Greiner e Keicher/Nagel, il libro di Nagel ecoll. (Springer LN 1184) e l’ultimo capitolo di Engel/Nagel. Queste ge-neralizzazioni richiedono tecniche e concetti molto avanzati dell’ana-lisi funzionale.

A livello piu elementare, ma piuttosto interessanti, si presentano leapplicazioni della teoria delle matrici non negative in dinamica simbo-lica e combinatoria delle parole. Siano S := 1, ..., q ed S⋆ il monoidelibero delle parole formate con lettere da S. Per w ∈ S⋆ e j ∈ S siaf(j, w) il numero delle volte che j appare in w.

Per ogni endomorfismo ϕ : S⋆ −→ S⋆ possiamo allora formare lamatrice

T :=

f(1, ϕ(1)) . . . f(1, ϕ(q))...

...f(q, ϕ(1)) . . . f(q, ϕ(q))

Se con Uw :=

f(1, w)...

f(q, w)

denotiamo il vettore di Parikh di w, otte-

niamo un diagramma commutativo

S∗ S∗

Nq

Nq

ϕ

U

T

U

per cui Uϕn(j) = T nUj = (T n)(j) per ogni n ∈ N ed ogni j ∈ S, essendoevidentemente Uj = δj . Cfr. Brin/Stuck, pagg. 64-66, Queffelec, pagg.87-95, Lind/Marcus, pagg. 106-135, per le interpretazioni nell’ambitodella dinamica simbolica e Lothaire per le applicazioni in combinato-ria delle parole.

La tesi contiene, come gia osservato, nel capitolo 11 alcune idee perla modellazione di sistemi biologici (rappresentati ad esempio tramitereti di Petri) mediante matrici non negative. Tali modelli sono moltoversatili e dovrebbero avere molte applicazioni.

3

Page 8: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

4

Page 9: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

I. CATENE DI MARKOV FINITE

1. Variabili aleatorie elementari

Definizione 1.1. Sia Ω un insieme. Un sistema di insiemi A ⊂ P(Ω) sichiama una σ-algebra su Ω, se sono verificate le seguenti condizioni:

(1) Ω ∈ A.

(2) Se A ∈ A, allora Ω \ A ∈ A.

(3) Se A1, A2, . . . ∈ A, allora∞⋃

n=1An ∈ A.

Osservazione 1.2. Sia Ω un insieme e A una σ-algebra su Ω. Allora:

(1) ∅ ∈ A.

(2) Se A1, A2, . . . ∈ A, allora∞⋂

n=1An ∈ A.

(3) Se A1, . . . , Ak ∈ A, allorak⋃

n=1An ∈ A e

k⋂n=1

An ∈ A.

(4) Se A,B ∈ A, allora A \B ∈ A.

Dimostrazione.

(1) ∅ = Ω \ Ω ∈ A.

(2)∞⋂

n=1An = Ω \ (Ω \

∞⋂n=1

An) ∈ A.

(3) Ponendo An = ∅ per k > n abbiamo:k⋃

n=1An =

∞⋃n=1

An ∈ A.

Ponendo An = Ω per k > n abbiamo:k⋂

n=1An =

∞⋂n=1

An ∈ A.

(4) A \B = A ∩ (Ω \B) ∈ A.

Definizione 1.3. Uno spazio misurabile e una coppia (Ω,A), dove Ω eun insieme e A una σ-algebra su Ω.

Definizione 1.4. Sia (Ω,A) uno spazio misurabile. Una misura su Ae un’applicazione µ : A −→ [0,∞] con le seguenti proprieta:

(1) µ(∅) = 0.

(2) Se A1, A2, . . . ∈ A sono disgiunti, allora µ(∞⋃

n=1An) =

∞∑n=1

µ(An).

L’addizione in [0,∞] e definita in modo che a+ ∞ = ∞ per ogni a.

E chiaro che in questo modo sono anche definite le somme infinite.

Osservazione 1.5. Siano (Ω,A) uno spazio misurabile e µ una misura

su A. Se A1, . . . , Ak ∈ A sono disgiunti, allora µ(k⋃

n=1An) =

k∑n=1

µ(An).

5

Page 10: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Siccome µ(∅) = 0 e sufficiente porreAn = ∅ per n > k.

Definizione 1.6. Sia (Ω,A) uno spazio misurabile. Una misura di pro-babilita su A e una misura p su A tale che p(Ω) = 1.

E chiaro che allora p(Ω \A) = 1 − p(A) per ogni A ∈ A.

Osservazione 1.7. (Ω,A) sia uno spazio misurabile e µ una misurasu A. Allora:

(1) Se A,B ∈ A e A ⊂ B, allora µ(A) ≤ µ(B).

(2) Se µ e una misura di probabilita, allora 0 ≤ p(A) ≤ 1 per ogniA ∈ A.

Dimostrazione.

(1) Abbiamo B = A∪(B \ A) con B \A ∈ A.

Percio µ(B) = µ(A) + µ(B \ A) ≥ µ(A).

(2) Immediato dal punto (1) perche A ⊂ Ω e p(Ω) = 1 per ipotesi.

Definizione 1.8. Uno spazio di misura e una tripla (Ω,A, µ), dove(Ω,A) e uno spazio misurabile con Ω 6= ∅ e µ e una misura su A.

Uno spazio di probabilita e una tripla (Ω,A, p), dove (Ω,A) e unospazio misurabile e p una misura di probabilita. Gli elementi di Asono spesso detti eventi.

Osservazione 1.9. Ω sia un insieme e ρ un insieme di σ-algebre su Ω.Allora

⋂A∈ρ

A e una σ-algebra su Ω.

Dimostrazione. Immediata.

Definizione 1.10. Siano Ω un insieme, S ⊂ P(Ω) e ρ l’insieme di tuttele σ-algebre A su Ω con S ⊂ A. Allora

σ-algebra(S) :=⋂A∈ρ

A

e per l’oss. 1.9 una σ-algebra su Ω che evidentemente e la piu piccolaσ-algebra su Ω che contiene S.

Definizione 1.11. Sia X uno spazio topologico. Gli elementi di

borel(X)=σ-algebra(aperti(X)) = σ − algebra(chiusi(X))

sono detti insiemi di Borel di X, borel(X) si chiama l’algebra di Borel

di X.

Definizione 1.12. Sia (Ω,A, µ) uno spazio di misura. Poniamo

(µ = 0) := A ∈ A | µ(A) = 0

Gli elementi di (µ = 0) sono detti insiemi di misura nulla; essi sono,per definizione, automaticamente misurabili.

6

Page 11: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Definiamo inoltre

(µ = 0)∗ = N ⊂ Ω | esiste A ∈ (µ = 0) con N ⊂ A

Definizione 1.13. Uno spazio di misura (Ω,A, µ) si dice completo, see soddisfatta una delle seguenti condizioni equivalenti:

(1) A ∈ (µ = 0) ed N ⊂ A =⇒ N ∈ A.

(2) (µ = 0)∗ ⊂ A.

(3) (µ = 0)∗ = (µ = 0).

In uno spazio di misura completo percio ogni sottoinsieme di un insie-me di misura nulla (automaticamente misurabile) e ancora misurabilee di misura nulla.

Dimostrazione. Dobbiamo dimostrare che le tre condizioni sono equi-valenti.

(1) ⇐⇒ (2): Chiaro.

(2) =⇒ (3): E chiaro che (µ = 0) ⊂ (µ = 0)∗.

Sia N ∈ (µ = 0)∗. Cio significa che esiste A ∈ (µ = 0) tale che N ⊂ A.Abbiamo supposto che (µ = 0)∗ ⊂ A, percio N ∈ A. Dall’oss. 1.7 segueµ(N) ≤ µ(A) = 0 e quindi µ(N) = 0, cosicche N ∈ (µ = 0).

(3) =⇒ (2): Chiaro, perche (µ = 0) ⊂ A.

Nota 1.14. In borel(Rm) si puo definire in modo naturale una misu-ra che per ogni intervallo m-dimensionale coincide con il volume diquell’intervallo. Lo spazio di misura che cosı si ottiene pero non e com-pleto. Si puo dimostrare che esiste un completamento (Rm, leb(Rm, µleb)).

Gli elementi di (leb(Rm)) si chiamano insiemi misurabili nel sensodi Lebesgue e µleb e detta misura di Lebesgue.

Per costruzione borel(Rm) ⊂ leb(Rm); in particolare ogni aperto eogni chiuso di R

m e misurabile nel senso di Lebesgue.

Definizione 1.15. X sia uno spazio topologico ed E ∈ X.

E si dice unGδ , se esistono apertiA1, A2, . . . di X tali cheE =∞⋂

n=1An.

E si dice un Fσ , se esistono chiusi F1, F2, . . . di X tali che E =∞⋃

n=1Fn.

E chiaro che ogni Gδ e ogni Fσ appartiene a borel(X).

Osservazione 1.16. Ogni Gδ o Fσ di Rm appartiene a leb(Rm).

Teorema 1.17. Per A ⊂ Rm sono equivalenti:

(1) A ∈ leb(Rm).

(2) Per ogni ε > 0 esistono un chiuso C ed un aperto U conC ⊂ A ⊂ U tali che µleb(U \ C) < ε.

(3) Esistono un Fσ F e un Gδ G con F ⊂ A ⊂ G tali che

µleb(G \ F ) = 0.

7

Page 12: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Elstrodt, pag. 67.

Definizione 1.18. Siano (Ω,A) e (Ω′,A′) due spazi misurabili.

Un’applicazione f : Ω −→ Ω′ si dice misurabile (piu precisamenteA-A′-misurabile) se f−1(A′) ∈ A per ogni A′ ∈ A′.

Definizione 1.19. (Ω,A) sia uno spazio misurabile. Un’applicazioneX : Ω −→ R si dice misurabile, se e A-borel(R)-misurabile.

Definizione 1.20. Siano Ω un insieme ed f, g due applicazioni.Poniamo allora:

(f = g) := ω ∈ Ω | f(ω) = g(ω)(f ≤ g) := ω ∈ Ω | f(ω) ≤ g(ω)

Per U ⊂ R ed a ∈ R siano inoltre:

(f ∈ U) := ω ∈ Ω | f(ω) ∈ U = f−1(U)

(f = a) := ω ∈ Ω | f(ω) = a = f−1(a)(f < a) := ω ∈ Ω | f(ω) < a = f−1((−∞, a))

(f ≤ a) := ω ∈ Ω | f(ω) ≤ a = f−1((−∞, a])

ecc.

Definizione 1.21. Sia Ω un insieme. Date applicazionif1, . . . , fm : Ω −→ R e insiemi U1, . . . , Um ⊂ R definiamo

(f1 ∈ U1, . . . , fm ∈ Um) := (f1 ∈ U1) ∩ . . . ∩ (fm ∈ Um)

Proposizione 1.22. (Ω,A) sia uno spazio misurabile. Per una funzio-ne X : Ω −→ R sono equivalenti:

(1) X e misurabile.

(2) (X ∈ U) ∈ A per ogni aperto U di R.

(3) (X ∈ V ) ∈ A per ogni chiuso V di R.

(4) (X < a) ∈ A per ogni a ∈ R.

(5) (X ≤ a) ∈ A per ogni a ∈ R.

(6) (X > a) ∈ A per ogni a ∈ R.

(7) (X ≥ a) ∈ A per ogni a ∈ R.

Dimostrazione. Verifica tecnica.

Definizione 1.23. . Una variabile aleatoria (o casuale) reale e un’applicazionemisurabileX : Ω −→ R, dove (Ω,A) e uno spazio misurabile che spessorimane sottinteso e non viene specificato in dettaglio.

Quando necessario diciamo anche che X e definita su (Ω,A).

Definizione 1.24. Sia (Ω,A) uno spazio misurabile. Una variabilealeatoria reale X : Ω −→ R si dice elementare, se assume solo unnumero finito di valori, cioe se l’immagine V := X(Ω) e finita.

In tal caso (X = a) = ∅ per ogni a ∈ R \ V .

8

Page 13: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Quando necessario diciamo anche che X e A-elementare.

Lemma 1.25. Siano (Ω,A) uno spazio misurabile ed X : Ω −→ R

un’applicazione che assume solo un numero finito di valori. Allora sono

equivalenti:

(1) X e misurabile.

(2) (X = a) ∈ A per ogni a ∈ R.

(3) X e A-P(R)-misurabile.

Dimostrazione.

(1) =⇒ (2): Chiaro, perche (X = a) = X−1(a) ed a ∈ borel(R).

(2) =⇒ (3): Sia B ⊂ R. Allora (X ∈ B) =⋃

b∈B

(X = b). Siccome

X assume solo un numero finito di valori, (X = b) 6= ∅ solo per unnumero finito di b ∈ B. Siccome per ipotesi ogni (X = b) ∈ A, anche(X ∈ B) ∈ A.

(3) =⇒ (1): Chiaro.

Definizione 1.26. Ω sia un insieme ed A ⊂ Ω. La funzione caratteri-

stica χA : Ω −→ R associa il valore 1 a tutti gli elementi di A e il valore0 agli elementi di Ω \A.

Essa assume quindi al massimo due valori.

Osservazione 1.27. (Ω,A) sia uno spazio misurabile ed A ⊂ Ω. Allorasono equivalenti:

(1) χA e misurabile.

(2) A ∈ A.

(3) χA e elementare.

Dimostrazione.

(1) =⇒ (2): χA sia misurabile. Allora: A = (χA = 1) ∈ A.

(2) =⇒ (1): Possiamo usare il lemma 1.25. Pero

(χA = 1) = A ∈ A e (χA = 0) = Ω \A ∈ A.

(2) ⇐⇒ (3): Chiaro. Infatti χA assume solo i valori 0 e 1.

Lemma 1.28. Ω sia un insieme ed X,Y : Ω −→ R due applicazioni.

Siano a, α ∈ R. Allora:

(1) (X + Y = a) =⋃

b∈R

(X = b, Y = a− b).

(2) (XY = a) =⋃

b∈R\0

(X = b, Y = ab) se a 6= 0.

(XY = 0) = (X = 0) ∪ (Y = 0).

(3) (αX = a) = (X = aα) per α 6= 0.

(0X = a) =

Ω per a = 0

∅ per a 6= 0

9

Page 14: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(4) (|X| = a) = (X = a)∪(X = −a).

Dimostrazione. Chiaro.

Proposizione 1.29. (Ω,A) sia uno spazio misurabile edX,Y : Ω −→ R

due variabili aleatorie elementari. Sia α ∈ R. Allora X + Y , XY , αX e

|X| sono ancora variabili aleatorie elementari.

Dimostrazione. (1) Dimostriamo prima che queste funzioni assumo-no solo un numero finito di valori. Ma gli insiemi

(X + Y )(Ω) ⊂ a+ b | a ∈ X(Ω), b ∈ Y (Ω)(XY )(Ω) ⊂ ab | a ∈ X(Ω), b ∈ Y (Ω)αX(Ω) = αa | a ∈ X(Ω)|X|(Ω) = |a| | a ∈ X(Ω)

sono finiti.

(2) Possiamo percio applicare il lemma 1.25. L’enunciato segue ades-so dal lemma 1.28 in cui le unioni contengono solo un numero finito ditermini 6= ∅. Infatti

⋃b∈R

(X = b, Y = a− b) =⋃

b∈R

(X = b) ∩ (Y = a− b)

⋃b∈R\0

(X = b, Y =a

b) =

b∈R\0

(X = b) ∩ (Y =a

b)

Definizione 1.30. Siano (Ω,A, p) uno spazio di probabilita edX : Ω −→ R una variabile aleatoria elementare. Allora

MX :=∑a∈R

ap(X = a)

si chiama la media di X.

Osserviamo che questa somma contiene solo un numero finito disommandi diverso da zero, perche l’insieme a ∈ R | (X = a) 6= ∅ efinito per ipotesi quindi anche l’insieme a ∈ R | p(X = a) 6= 0 e finito.

Lemma 1.31. Siano (Ω,A, p) uno spazio di probabilita e

X : Ω −→ R una variabile aleatoria elementare. Sia A ∈ A. Allora

∑a∈R

p(A,X = a) = p(A).

Dimostrazione. Infatti A =⋃

a∈R

(A ∩ (X = a)).

Teorema 1.32. (Ω,A, p) sia uno spazio di probabilita edX,Y : Ω −→ R

due variabili aleatorie elementari. Sia α ∈ R. Allora:

M(αX) = αMX

M(X + Y ) = MX +MY

10

Page 15: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Scrivimo dappertutto∑a

invece di∑a∈R

. Si noti che in

tutte le somme appare solo un numero finito di sommandi non nullo.

(1) L’enunciato e ovvio per α = 0

Sia α 6= 0. Allora

M(αX) =∑

a

ap(αX = a) =∑

a

ap(X = a/α)

= α∑

a

a

αp(X = a/α) = α

a

ap(X = a) = αM(X)

(2) Utilizzando il lemma 1.28 abbiamo

M(X + Y ) =∑

a

ap(X + Y = a)

=∑

a

b

ap(X = b, Y = a− b) =∑

b

a

ap(X = b, Y = a− b)

=∑

b

a

(a+ b)p(X = b, Y = a)

=∑

b

a

ap(X = b, Y = a) +∑

b

a

bp(X = b, Y = a)

=∑

a

a∑

b

p(X = b, Y = a) +∑

b

b∑

a

p(X = b, Y = a)

1.31=∑

a

ap(X = a) +∑

b

bp(Y = b) = MX +MY

Osservazione 1.33. (Ω,A, p) sia uno spazio di probabilita edX,Y : Ω −→ R due variabili aleatorie elementari. Allora:

(1) X ≥ 0 =⇒ MX ≥ 0.

(2) X ≤ Y =⇒ MX ≤MY .

Dimostrazione. (1) Se X ≥ 0, allora

MX =∑a∈R

ap(X = a) =∑

a∈[0,∞)

ap(X = a) ≥ 0.

(2) L’ipotesi implica Y −X ≥ 0, per cui MY −MX = M(Y −X) ≥ 0.

Osservazione 1.34. Siano (Ω,A), (Ω′,A′), (Ω′′,A′′) tre spazi misura-bili. Siano inoltre X : Ω −→ Ω′ A-A′-misurabile e f : Ω′ −→ Ω′′ A′-A′′-misurabile. Allora f(X) := f X : Ω −→ Ω′′ e A-A′′-misurabile.

Dimostrazione. Sia A′′ ∈ A′′. Allora f X)−1(A′′) = X−1(f−1(A′′)).Per ipotesi f−1(A′′) ∈ A′ e quindi X−1(f−1(A′′)) ∈ A.

Corollario 1.35. Siano (Ω,A) uno spazio misurabile ed X : Ω −→ R

una variabile aleatoria reale. La funzione f : R −→ R sia borel(R)-borel(R)-misurabile, ad esempio una funzione continua. Allora

11

Page 16: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

f(X) : Ω −→ R e una variabile aleatoria reale. Se X e elementare,

anche f(X) e elementare.

Dimostrazione. La prima parte segue dall’oss. 1.34.

SeX e elementare, alloraX(Ω) e finito per cui e finito anche l’insiemef(X)(Ω) = f(X(Ω)).

Teorema 1.36. (Ω,A, p) sia uno spazio di probabilita ed

X : Ω −→ R una variabile aleatoria elementare. Sia f : R −→ R

borel(R)-borel(R)-misurabile. Allora

Mf(X) =∑a∈R

f(a)p(X = a)

Dimostrazione. Γ sia il grafico di f, cioe

Γ = (a, t) ∈ R × R | f(a) = t = (a, f(a)) | a ∈ R

Per ogni t ∈ R abbiamo (f(X) = t) =⋃

a∈f−1(t)

(X = a), per cui

Mf(X) =∑

t

tp(f(X) = t) =∑

t

t∑

a∈f−1(t)

p(X = a)

=∑

(a,t)∈Γ

tp(X = a) =∑

a

f(a)p(X = a)

Esempio 1.37. Nella situazione del teorema 1.36 sianoX(Ω) = 0, 1, 2, 3, 4 ed A = P(Ω).

La funzione f su X(Ω) sia data dalla tabella

0 171 302 303 174 30

La funzione f(X) assume solo i valori 17 e 30

per cui

Mf(X) = 17p(f(X) = 17) + 30p(f(X) = 30).

Inoltre

(f(X) = 17) = (X = 0)∪(X = 3)

(f(X) = 30) = (X = 1)∪(X = 2)∪(X = 4)

per cui

Mf(X) = 17[p(X = 0) + p(X = 3)] + 30[p(X = 1) + p(X = 2) + p(X = 4)]

= f(0)p(X = 0) + f(3)p(X = 3) + f(1)p(X = 1) + f(2)p(X = 2) + f(4)p(X = 4)

12

Page 17: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

in accordo con l’enunciato del teorema 1.36.

Osservazione 1.38. (Ω,A, p) sia uno spazio di probabilita ed A ∈ A.Allora χA e una variabile aleatoria elementare (per l’oss. 1.27) e si haMχA = p(A).

Dimostrazione. χA assume solo i valori 0 e 1, percio

MχA=∑a∈R

ap(χA = a) = p(χA = 1) = p(A)

Definizione 1.39. (Ω,A, p) sia uno spazio di probabilita, X : Ω −→ R

una variabile aleatoria elementare ed E ∈ A. Poniamo allora

∫E

Xp := M(XχE)

In particolare quindi MX =∫Ω

Xp.

Osservazione 1.40. Nella situazione della def. 1.39 si ha

∫E

Xp =∑a∈R

ap((X = a) ∩ E).

Dimostrazione. E sufficiente dimostrare che

∫E

Xp =∑

a∈R\0

ap((X = a) ∩ E)

Per definizione pero

∫E

Xp =∑a∈R

ap(XχE = a) =∑

a∈R\0

ap(XχE = a)

Per a 6= 0 ed ω ∈ Ω si ha pero

ω ∈ (XχE = a) ⇐⇒ ω ∈ E e X(ω) = a ⇐⇒ ω ∈ (X = a) ∩ E.

13

Page 18: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

2. Il teorema di Radon-Nikodym discreto

Situazione 2.1. (Ω,A, p) sia uno spazio di probabilita.

Definizione 2.2. Per A,E ∈ A definiamo la probabilita condizionata

p(A|E) ponendo

p(A|E) :=

0 se p(E) = 0

p(A ∩E)

p(E)se p(E) > 0

Si noti che p(A|E) = 0 anche quando solo p(A ∩E) = 0.

Osservazione 2.3. Siano A,E ∈ A. Allora p(A|E)p(E) = p(A ∩ E).

Dimostrazione. Cio e chiaro per p(E) > 0.

Se invece p(E) = 0, allora anche p(A∩E) = 0 e l’uguaglianza rimanevalida.

Lemma 2.4 (formula della probabilita totale). Sia E1, E2, . . . una

successione finita o infinita di elementi disgiunti di A tali che⋃n

En = Ω. Allora per ogni A ∈ A vale

p(A) =∑np(A|En)p(En)

Dimostrazione. L’ipotesi implica A =⋃n(A ∩ En), per cui

p(A) =∑n

p(A ∩ En) =∑n

p(A|En)p(En)

Proposizione 2.5 (formula di Bayes). Sia E1, E2, . . . una successio-

ne finita o infinita di elementi disgiunti di A tali che⋃nEn = Ω. Allora

per ogni A ∈ A con p(A) > 0 ed ogni k vale

p(Ek|A) =p(A|Ek)p(Ek)∑

n

p(A|En)p(En)

Dimostrazione. Per il lemma 2.4∑np(A|En)p(En) = p(A) > 0, per cui

p(Ek|A) =p(Ek ∩A)

p(A)

2.4=

p(A|Ek)p(Ek)∑np(A|En)p(En)

Definizione 2.6. X : Ω −→ R sia una variabile aleatoria elementare.Per E ∈ A definiamo

M(X|E) :=∑a∈R

ap(X = a|E)

M(X|E) si chiama la media di X su E (cfr. oss. 2.7) oppure la media

condizionata di X rispetto ad E.

14

Page 19: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Osservazione 2.7. X : Ω −→ R sia una variabile aleatoria elementareed E ∈ A. Allora∫E

Xp = M(X|E)p(E)

Per p(E) > 0 si ha quindi M(X|E) =1

p(E)

E

Xp.

Dimostrazione. Abbiamo∫E

Xp1.40=∑a∈R

ap((X = a) ∩ E) =∑a∈R

ap(X = a|E)p(E) = p(E)M(X|E)

Osservazione 2.8. X : Ω −→ R sia una variabile aleatoria elementareed E ∈ A con p(E) = 0. Allora M(X|E) = 0.

Dimostrazione. Siccome p(E) = 0, ogni sommando inM(X|E) =

∑a∈R

ap(X = a|E) si annulla.

Corollario 2.9. Siano A,E ∈ A. Allora p(A|E) = M(χA|E).

Dimostrazione. Siccome χA assume solo i valori 0 e 1, abbiamo

M(χA|E) =∑a∈R

ap(χA = a|E) = 1 · p(χA = 1|E) = p(A|E)

Osservazione 2.10. Siano E1, . . . , En ⊂ Ω tali che Ω = E1∪ . . . ∪En.Allora

σ-algebra(E1, . . . , En)= ⋃k∈K

Ek | K ⊂ 1, . . . , n =: F .

Se gli Ei appartengono tutti ad A, allora F e una sotto-σ-algebra finitadi A.

Dimostrazione. E chiaro che E1, . . . , EN ⊂ F ⊂ σ-algebra(E1, . . . , En),per cui e sufficiente dimostrare che F e una σ-algebra.

(1) Ω ∈ F perche Ω = E1 ∪ . . . ∪ En.

(2) E chiaro che l’unione finita di un numero finito di elementi di Fappartiene ancora ad F . Siccome l’insieme F e finito, ogni unione diun numero numerabile di elementi di F e in verita un’unione finita.

(3) E a questo punto sufficiente dimostrare che il complemento di unelemento di F appartiene ancora ad F . Sia K ⊂ 1, . . . , n eP :=

⋃k∈K

Ek. Siccome gli Ej sono disgiunti, abbiamo semplicemente

Ω \ P =⋃

j∈1,...,n\K

Ej ∈ F .

Definizione 2.11. F sia una σ-algebra su Ω. Un elemento E ∈ F sidice minimale (in F), se E e minimale tra gli elementi non vuoti di F .Denotiamo con MinF l’insieme degli elementi minimali di F .

Osservazione 2.12. F sia una σ-algebra finita su Ω. Allora ogni ele-mento non vuoto di F contiene un elemento minimale di F .

15

Page 20: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Lemma 2.13. F sia una σ-algebra finita su Ω.

(1) Siano A ∈ F ed E ∈ MinF . Allora E ⊂ A oppure E ∩A = ∅.

(2) Siano E,F ∈ MinF ed E 6= F . Allora E ∩ F = ∅.

Dimostrazione.

(1) InfattiE∩A ∈ F e contenuto in E. SeE∩A 6= ∅, per la minimalitadi E si deve avere E ∩A = E, cioe E ⊂ A.

(2) Segue immediatamente da (1).

Osservazione 2.14. F sia una σ-algebra finita su Ω. In questo casoanche MinF e un insieme finito, ad esempio MinF = E1, . . . , En congli Ej tutti distinti. Allora Ω = E1∪ . . . ∪En.

Ogni σ-algebra finita su Ω e quindi della forma indicata nell’oss.2.10.

Dimostrazione. Dal lemma 2.13 sappiamo che Ei ∩ Ej = ∅ per ognii 6= j. Dobbiamo percio solo dimostrare che E1 ∪ . . . ∪En = Ω.

Sia B := Ω \ (E1 ∪ . . . ∪ En) 6= ∅. Allora B ∈ F e per l’oss. 2.12 esisteun j tale che Ej ⊂ B. Ma B ⊂ Ω \ Ej , per cui si arriva ad Ej ⊂ Ω \ Ej ,cioe Ej = Ej ∩ Ej = ∅, una contraddizione.

Definizione 2.15. X : Ω −→ R sia una variabile aleatoria elementareedE1, . . . , En ∈ A tali che Ω = E1∪ . . . ∪En. Sia F :=σ-algebra(E1, . . . , En).

Per ω ∈ Ω definiamo allora:

M(X|F)(ω) := M(X|Ei)

se ω ∈ Ei. Otteniamo cosı un’applicazione M(X|F) : Ω −→ R che pos-

siamo scrivere nella forma M(X|F) =n∑

k=1

M(X|Ek)χEk. Questa rap-

presentazione mostra che M(X|F) e F-borel(R)-misurabile e quindianche A-borel(R)-misurabile.

M(X|F) assume solo i valori M(X|E1), . . . ,M(X|En) ed e quindi F-elementare e A-elementare.

Osservazione 2.16. Y : Ω −→ R sia una variabile aleatoria elementa-re ed E ∈ A. Y sia costante su E, ad esempio Y (ω) = c per ogni ω ∈ Eper qualche c ∈ R. Allora

∫E

Y p = c · p(E).

Dimostrazione. Per l’oss. 1.40 abbiamo∫E

Y p =∑a∈R

a · p((Y = a)∩E).

Per ipotesi pero (Y = a) ∩ E = ∅ per a 6= c, mentre (Y = c) ∩ E = E,cosicche

∫E

Y p = c · p((Y = c) ∩ E) = c · p(E).

Teorema 2.17. Nella situazione della def. 2.15 per ogni k = 1, . . . , n siha

∫Ek

M(X|F)p =∫Ek

Xp

16

Page 21: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

oppure, equivalentemente,

M(M(X|F)|Ek) = M(X|Ek)

Questa e la versione discreta del teorema di Radon-Nikodym.

Dimostrazione. SiccomeM(X|F) e costante su Ek ed uguale aM(X|Ek)dall’oss. 2.16 segue

∫Ek

M(X|F)p = M(X|Ek)p(Ek)2.7=∫Ek

Xp

Esempio 2.18. Siano Ω = 1, . . . , 12, A = P(Ω) e p(ω) = 112 per ogni

ω ∈ Ω. La variabile aleatoria elementare X sia definita tramite latabella

ω X(ω)E1 1 2

2 13 24 3

E2 5 76 17 1

E3 8 59 3

10 511 512 2

Abbiamo allora

M(X|E1) = 1 · p(X = 1|E1) + 2 · p(X = 2|E1) + 3 · p(X = 3|E1)

=1/12 + 2 · 2/12 + 3/12

4/12=

8

4= 2

M(X|E2) = 1 · p(X = 1|E2) + 7 · p(X = 7|E2)

=2/12 + 7 · 1/12

3/12=

9

3= 3

M(X|E3) = 2 · p(X = 2|E3) + 3 · p(X = 3|E3) + 5 · p(X = 5|E3)

=2 · 1/12 + 3 · 1/12 + 5 · 3/12

5/12=

20

5= 4

Con F :=σ-algebra(E1, E2, E3) si ha

M(X|F)(ω) =

2 per ω ∈ E1

3 per ω ∈ E2

4 per ω ∈ E3

17

Page 22: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Definizione 2.19. Y : Ω −→ R sia una variabile aleatoria elementareed Y (Ω) = t1, . . . , tn con t1, . . . , tn tutti distinti. Poniamo

σ-algebra(Y ) := σ-algebra((Y = t1), . . . , (Y = tn))

Per una variabile aleatoria elementare X : Ω −→ R sia

M(X|Y ) := M(X|σ- algebra(Y )) =n∑

k=1

M(X|Y = tk)χ(Y =tk)

18

Page 23: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

3. Regole per probabilita composte

Situazione 3.1. (Ω,A, p) sia uno spazio di probabilita.

Lemma 3.2. Siano A,B,C ∈ A. Allora

p(A ∩B|C) = p(A|B ∩ C)p(B|C)

Dimostrazione. Se p(B ∩ C) = 0, allora anche p(A ∩ B ∩ C) = 0, percui le espressioni sia a sinistra che a destra sono uguali a zero.

Sia quindi p(B ∩ C) 6= 0. Allora anche p(C) 6= 0, cosicche

p(A|B ∩ C)p(B|C) =p(A ∩B ∩ C)

p(B ∩ C)

p(B ∩ C)

p(C)=p(A ∩B ∩ C)

p(C)=

= p(A ∩B|C)

Lemma 3.3. Siano n ∈ N + 1 ed A0, A1, . . . , An ∈ A. Allora:

p(An ∩ . . . ∩A1|A0)= p(An|An−1 ∩ . . . ∩A0)p(An−1|An−2 ∩ . . . ∩A0) . . . p(A1|A0)

p(An ∩ . . . ∩A0)= p(An|An−1 ∩ . . . ∩A0)p(An−1|An−2 ∩ . . . ∩A0) . . . p(A1|A0)p(A0)

Dimostrazione. (1) Dimostriamo la prima equazione per induzionesu n.

n = 1: Lemma 3.2.

n −→ n+ 1:

p(An+1 ∩ . . . ∩A1|A0) = p(An+1 ∩ (An ∩ . . . ∩A1)|A0)

3.2= p(An+1|An ∩ . . . ∩A0)p(An ∩ . . . ∩A1|A0)

ind.= p(An+1|An ∩ . . . ∩A0)p(An|An−1 ∩ . . . ∩A0) . . . p(A1|A0)

(2) Moltiplicando la prima equazione con p(A0) e utilizzando l’oss.2.2 si ottiene la seconda.

Corollario 3.4. Siano n, k ∈ N con k < n ed A0, . . . , An ∈ A. Allora:

p(An ∩ . . . ∩A1|A0)= p(An ∩ . . . ∩Ak+1|Ak ∩ . . . ∩A0)p(Ak|Ak−1 ∩ . . . ∩A0) . . . p(A1|A0)

p(An ∩ . . . ∩Ao)= p(An∩. . .∩Ak+1|Ak∩. . .∩A0)p(Ak|Ak−1∩. . .∩A0) . . . p(A1|A0)p(A0)

Dimostrazione. Segue direttamente dal lemma 3.3.

19

Page 24: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

4. Sequenze di Markov

Situazione 4.1. Siano (Ω,A, p) uno spazio di probabilita, q ∈ N + 1fissato ed S := 1, . . . , q. Scriviamo spesso ©

ninvece di ©

n∈N

.

Il concetto di sequenza di Markov e puramente notazionale (in virtudel teorema di Kolmogorov) allo scopo di rendere trasparenti le dimo-strazioni.

Definizione 4.2. ©n,iEi

n : N × S −→ A sia un’applicazione tale che per

ogni n ∈ N si abbia Ω = E1n∪ . . . ∪Eq

n. Diciamo allora che ©n,iEi e una

sequenza di S-partizioni A-misurabili.

Una successione ©nAn : N −→ A si chiama una realizzazione della

sequenza, se per ogni n ∈ N esiste i ∈ S tale che An = Ein.

Definizione 4.3. Una sequenza di Markov e una sequenza ©n,iEi

n di

S-partizioni A-misurabili tali che per ogni realizzazione ©nAn della

sequenza ed oqni n ∈ N per cui p(An ∩ . . . ∩A0) > 0 si abbia

p(An+1|An ∩ . . . ∩A0) = p(An+1|An)

Evidentemente e sufficiente chiedere questa condizione solo pern ∈ N + 1.

Osservazione 4.4. ©n,iEi

n sia una sequenza di S-partizioni A-misurabili.

Allora sono equivalenti:

(1) ©n,iEi

n e una sequenza di Markov.

(2) Per ogni sua realizzazione ©nAn e per ogni n ∈ N + 1 vale

p(An+1 ∩ . . . ∩A0) = p(An+1 ∩An) · p(An−1 ∩ . . . ∩A0|An).

Dimostrazione. ©nAn sia una realizzazione della sequenza data.

Fissato n ∈ N + 1 poniamo E := An−1 ∩ . . . ∩A0.

(1) =⇒ (2): Dobbiamo dimostrare che

p(An+1 ∩An ∩ E) = p(An+1 ∩An) · p(E|An)

Se p(E ∩An) = 0, entrambi i lati dell’equazione si annullano.

Sia quindi p(E ∩An) 6= 0. L’ipotesi (1) implica allora chep(An+1|An ∩ E) = p(An+1|An), per cui

p(An+1 ∩An ∩ E) = p(An+1|An ∩ E) · p(An ∩E) = p(An+1|An) · p(An ∩E)

=p(An+1 ∩An)

p(An)· p(An ∩ E) = p(An+1 ∩An) · p(E|An)

(2) =⇒ (1): Sia p(An ∩ E) > 0. Dobbiamo dimostrare che

20

Page 25: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

p(An+1|An ∩ E) = p(An+1|An). Per ipotesi abbiamo pero

p(An+1 ∩An ∩ E) = p(An+1 ∩An)(E|An), quindi

p(An+1|An ∩E) =p(An+1 ∩An ∩ E)

p(An ∩ E)=p(An+1 ∩An) · p(E|An)

p(An ∩ E)

=p(An+1 ∩An) · p(E ∩An)

p(E ∩An) · p(An)= p(An+1|An)

Lemma 4.5. ©n,iEi

n sia una sequenza di Markov e ©nAn una sua realiz-

zazione. Siano n,m ∈ N con 0 ≤ m ≤ n tali chep(An ∩ . . . ∩Am) 6= 0. Allora

p(An+1|An ∩ . . . ∩Am) = p(An+1|An)

Dimostrazione. (1) Per m = 0 cio e quanto richiesto dalla def. 4.3.

(2) Sia quindi m > 0. Per α = (im−1, . . . , i0) ∈ Sm poniamo

Eα := Eim−1

m−1 ∩ . . . ∩ Ei00 . Inoltre sia S(m) := α ∈ Sm | p(An ∩ . . . ∩

Am ∩ Eα) 6= 0

Allora

p(An+1 ∩ . . . ∩Am) =∑

α∈Sm

p(An+1 ∩ . . . ∩Am ∩ Eα)

=∑

α∈S(m)

p(An+1 ∩ . . . ∩Am ∩ Eα)

=∑

α∈S(m)

p(An+1|An ∩ . . . ∩Am ∩ Eα) · p(An ∩ . . . ∩Am ∩ Eα)

Markov=

α∈S(m)

p(An+1|An) · p(An ∩ . . . ∩Am ∩ Eα)

= p(An+1|An)∑

α∈S(m)

p(An ∩ . . . ∩Am ∩ Eα)

= p(An+1|An)p(An ∩ . . . ∩Am)

per cui

p(An+1|An) =p(An+1 ∩ . . . ∩Am)

p(An ∩ . . . ∩Am)= p(An+1|An ∩ . . . ∩Am)

Proposizione 4.6. ©n,iEi

n sia una sequenza di Markov e ©nAn una sua

realizzazione. Siano n ∈ N, r ∈ N + 1, m ∈ N con 0 ≤ m ≤ n tali che

p(An ∩ . . . ∩Am) 6= 0. Allora

p(An+r ∩ . . . ∩An+1|An ∩ . . . ∩Am) = p(An+r ∩ . . . ∩An+1|An)

Dimostrazione. Possiamo assumere che p(An+r−1 ∩ . . . ∩ An) 6= 0,perche altrimenti entrambi i lati dell’equazione si annullano. Allora

21

Page 26: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

p(An+r ∩ . . . ∩An+1|An ∩ . . . ∩Am)

3.4=

p(An+r ∩ . . . ∩Am+1|Am)

p(An|An−1 ∩ . . . ∩Am) · · · p(Am+1|Am)

4.5=

p(An+r ∩ . . . ∩Am+1|Am)

p(An|An−1) · p(An−1|An−2) · · · p(Am+1|Am)

3.3=p(An+r|An+r−1 ∩ . . . ∩Am) · p(An+r−1|An+r−2 ∩ . . . ∩Am) · · · p(Am+1|Am)

p(An|An−1) · p(An−1|An−2) · · · p(Am+1|Am)

4.5=p(An+r|An+r−1) · p(An+r−1|An+r−2) · · · p(Am+1|Am)

p(An|An−1) · p(An−1|An−2) · · · p(Am+1|Am)

= p(An+r|An+r−1) · p(An+r−1|An+r−2) · · · p(An+1|An)

4.5= p(An+r|An+r−1∩. . .∩An)·p(An+r−1|An+r−2∩. . .∩An) · · · p(An+1|An)

3.3= p(An+r ∩ . . . ∩An+1|An)

Definizione 4.7. ©n,iEi

n sia una sequenza di Markov. Per t ∈ N + 1,

n1, . . . , nt ∈ N e K ⊂ St, poniamo EKn1,...,nt

:=⋃

(k1,...,kt)∈K

Ek1n1

∩ . . . ∩ Ekt

nt.

Teorema 4.8. ©n,iEi

n sia una sequenza di Markov. Siano n ∈ N + 1,

i ∈ S, J ∈ Sr, K ⊂ Sn tali che p(Ein ∩ EK

n−1,...,0) 6= 0. Allora

p(EJn+r,...,n+1|Ei

n ∩ EKn−1,...,0) = p(EJ

n+r,...,n+1|Ein)

Dimostrazione. p(EJn+r,...,n+1 ∩Ei

n ∩EKn−1,...,0)

=∑

(jr,...,j1)∈J

∑(kn−1,...,k0)∈K

p(Ejr

n+r∩ . . .∩Ej1n+1∩Ei

n∩Ekn−1

n−1 ∩ . . .∩Ek0

0 )

=∑

(jr,...,j1)∈J

∑(kn−1,...,k0)∈K

p(Ejr

n+r ∩ . . .∩Ej1n+1|Ei

n ∩Ekn−1

n−1 ∩ . . .∩Ek0

0 )

· p(Ein ∩Ekn−1

n−1 ∩ . . . ∩ Ek0

0 )

Markov=

∑(jr,...,j1)∈J

∑(kn−1,...,k0)∈K

p(Ejr

n+r ∩ . . . ∩Ej1n+1|Ei

n)

· p(Ein ∩Ekn−1

n−1 ∩ . . . ∩ Ek0

0 )

=∑

(jr,...,j1)∈J

p(Ejr

n+r ∩ . . . ∩ Ej1n+1|Ei

n)

· ∑(kn−1,...,k0)∈K

p(Ein ∩ Ekn−1

n−1 ∩ . . . ∩ Ek0

0 )

=∑

(jr,...,j1)∈J

p(Ejr

n+r ∩ . . . ∩ Ej1n+1|Ei

n) · p(Ein ∩ EK

n−1,...,0)

= p(EJn+r,...,n+1|Ei

n) · p(Ein ∩ EK

n−1,...,0)

e cio implica l’enunciato.

22

Page 27: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Corollario 4.9. ©n,iEi

n sia una sequenza di Markov e ©nAn una sua

realizzazione. Siano s, t ∈ N con s < t ed n0, . . . , nt ∈ N con n0 < . . . < nt

tali che p(Ans∩ . . . ∩Ans+1

) 6= 0. Allora

p(Ant∩ . . . ∩Ans+1

|Ans∩ . . . ∩An0

) = p(Ant∩ . . . ∩Ans+1

|Ans)

Corollario 4.10. ©n,iEi

n sia una sequenza di Markov e ©nAn una sua

realizzazione. Siano t ∈ N + 1 ed n0, . . . , nt ∈ N con n0 < . . . < nt tali

che p(Ant−1∩ . . . ∩An0

) 6= 0. Allora

p(Ant∩ . . . ∩An1

|An0) = p(Ant

|Ant−1) · · · p(An1

|An0)

p(Ant∩ . . . ∩An0

) = p(Ant|Ant−1

) · · · p(An1|An0

) · p(An0)

Dimostrazione. In virtu del lemma 3.3 e sufficiente dimostrare laprima uguaglianza. Abbiamo

p(Ant∩ . . . ∩An1

|An0)

3.3= p(Ant

|Ant−1∩ . . . ∩An0

) · · · p(An1|An0

)

4.9= p(Ant

|Ant−1) · · · p(An1

|An0)

Proposizione 4.11. ©n,iEi

n sia una sequenza di Markov e ©nAn una sua

realizzazione. Siano s, t ∈ N con s < t ed n0, . . . , nt ∈ N con

n0 < . . . < nt tali che p(Ans∩ . . . ∩An0

) 6= 0. Allora

p(Ant∩ . . . ∩An1

|An0)

= p(Ant∩ . . . ∩Ans+1

|Ans) · p(Ans

|Ans−1) · · · p(An1

|An0)

Dimostrazione. Infatti

p(Ant∩ . . . ∩An1

|An0)

3.4= p(Ant

∩. . .∩Ans+1|Ans

∩. . .∩An0)·p(Ans

|Ans−1∩. . .∩An0

) · · · p(An1|An0

)

4.9= p(Ant

∩ . . . ∩Ans+1|Ans

) · p(Ans|Ans−1

) · · · p(An1|An0

)

Proposizione 4.12. ©n,iEi

n sia una sequenza di S-partizioni A-misurabili.

Allora sono equivalenti:

(1) ©n,iEi

n e una sequenza di Markov.

(2) Per ogni realizzazione ©nAn di ©

n,iEi

n ed ogni n ∈ N tali che

p(An ∩ . . . ∩A0) 6= 0 vale

p(An+1 ∩ . . . ∩A1|A0) = p(An+1|An) · · · p(A1|A0).

Dimostrazione.

(1) =⇒ (2): Corollario 4.10.

23

Page 28: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(2) =⇒ (1):

p(An+1|An ∩ . . . ∩A0) =p(An+1 ∩ . . . ∩A0)

p(An ∩ . . . ∩A0)

=p(An+1|An) · p(An|An−1) · · · p(A1|A0)

p(An|An−1) · · · p(A1|A0)

= p(An+1|An)

Definizione 4.13. Una successione ©nAn di elementi di A si chiama

indipendente se per ogni n1, . . . , nt ∈ N con n1 < . . . < nt si ha

p(An1∩ . . . ∩Ant

) = p(An1) · · · p(Ant

)

24

Page 29: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

5. Catene di Markov finite

Situazione 5.1. Siano (Ω,A, p) uno spazio di probabilita, q ∈ N + 1fissato ed S := 1, . . . , q.

Definizione 5.2. Un processo stocastico finito (con spazio degli statiS ed a tempo discreto) e una successione ©

nXn di variabili aleato-

rie elementari tali che Xn(Ω) ⊂ S per ogni n ∈ N. Gli elementi di Ssi chiamano stati del processo. Si noti che le nostre ipotesi implicano∑i∈S

p(Xn = i) = 1 per ogni n.

Riformuliamo adesso i risultati del capitolo precedente nel linguag-gio dei processi stocastici.

Definizione 5.3. Nel seguito, in analogia con la def. 1.21, usiamo lanotazione

p(E1, . . . , Em|F1, . . . , Fl) := p(E1 ∩ . . . ∩ Em|F1 ∩ . . . ∩ Fl)

per E1, . . . , Em, F1, . . . , Fl ∈ A, soprattutto per eventi della forma(Xn = k) per un processo stocastico ©

nXn.

Osservazione 5.4. ©nXn sia una processo stocastico finito.

Per n ∈ N ed i ∈ S poniamo Ein := (Xn = i). Allora ©

n,iEi

n e una sequen-

za di S-partizioni A-misurabili. Per ogni successione ©nin : N −→ S la

successione ©n

(Xn = in) e una realizzazione della sequenza.

Definizione 5.5. Una catena di Markov finita (con spazio degli statiS ed a tempo discreto) e un processo stocastico finito ©

nXn per il quale

l’applicazione ©n,i

(Xn = i) : N × S −→ A e una sequenza di Markov.

Chiediamo in altre parole che per n ∈ N ed in+1, . . . , i0 ∈ S conp(Xn = in, . . . ,X0 = i0) 6= 0 si abbia sempre

p(Xn+1 = in+1|Xn = in, . . . ,X0 = i0) = p(Xn+1 = in+1|Xn = in)

Osservazione 5.6. ©nXn sia un processo stocastico finito. Allora sono

equivalenti:

(1) ©nXn e una catena di Markov.

(2) Per n ∈ N ed in+1, . . . , i0 ∈ S vale

p(Xn+1 = in+1, . . . ,X0 = i0)

= p(Xn+1 = in+1,Xn = in) · p(Xn−1 = in−1, . . . ,X0 = i0|Xn = in).

Dimostrazione. Oss. 4.4.

Lemma 5.7. ©nXn sia una catena di Markov finita.

25

Page 30: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Siano n,m ∈ N con 0 ≤ m ≤ n ed in+1, . . . , im ∈ S tali che

p(Xn = in, . . . ,Xm = im) 6= 0. Allora

p(Xn+1 = in+1|Xn = in, . . . ,Xm = im) = p(Xn+1 = in+1|Xn = in)

Dimostrazione. Lemma 4.5.

Proposizione 5.8. ©nXn sia una catena di Markov finita. Siano n ∈ N,

r ∈ N + 1, m ∈ N con 0 ≤ m ≤ n ed in+r, . . . , im ∈ S tali che

p(Xn = in, . . . ,Xm = im) 6= 0. Allora

p(Xn+r = in+r, . . . ,Xn+1 = in+1|Xn = in, . . . ,Xm = im)

= p(Xn+r = in+r, . . . ,Xn+1 = in+1|Xn = in)

Dimostrazione. Prop. 4.6.

Teorema 5.9. ©nXn sia una catena di Markov finita.

Siano n ∈ N, r ∈ N + 1 ed i ∈ S, J ⊂ Sr, K ⊂ Sn tali che

p(Xn = i, (Xn−1, . . . ,X0) ∈ K) 6= 0. Allora

p((Xn+r,...,n+1) ∈ J |Xn = i, (Xn−1, . . . ,X0) ∈ K) =

p((Xn+r,...,n+1) ∈ J |Xn = i)

Dimostrazione. Teorema 4.8.

Corollario 5.10. ©nXn sia una catena di Markov finita.

Siano s, t ∈ N con s < t, n0, . . . , nt ∈ N con n0 < . . . < nt ed i0, . . . , it ∈ Stali che p(Xns

= is, . . . ,Xn0= i0) 6= 0. Allora

p(Xnt= it, . . . ,Xns+1

= is+1|Xns= is, . . . ,Xn0

= i0)

= p(Xnt= it, . . . ,Xs+1 = is+1|Xns

= is).

Dimostrazione. Cor. 4.9.

Corollario 5.11. ©n,iXn sia una catena di Markov finita.

Siano t ∈ N + 1, n0, . . . , nt ∈ N con n0 < . . . < nt ed i0, . . . , it ∈ S tali che

p(Xnt−1= it−1, . . . ,Xn0

= i0) 6= 0. Allora

p(Xnt= it, . . . ,Xn1

= i1|Xn0= i0)

= p(Xnt= it|Xnt−1

= it−1) · · · p(Xn1= i1|Xn0

= i0)

p(Xnt= it, . . . ,Xn0

= i0)

= p(Xnt= it|Xnt−1

= it−1) · · · p(Xn1= i1|Xn0

= i0) · p(Xn0= i0)

Dimostrazione. Cor. 4.10.

Proposizione 5.12. ©n,iXn sia una catena di Markov finita.

Siano s, t ∈ N con s < t, n0, . . . , nt ∈ N con n0 < . . . < nt ed

i0, . . . , it ∈ S tali che p(Xns= is, . . . ,Xn0

= i0) 6= 0. Allora

26

Page 31: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

p(Xnt= it, . . . ,Xn1

= i1|Xn0= i0)

= p(Xnt= it, . . . ,Xns+1

= is+1|Xns= is)

· p(Xns= is|Xns−1

= is−1) · · · p(Xn1= i1|Xn0

= i0)

Dimostrazione. Prop. 4.11.

Proposizione 5.13. ©n,iXn sia un processo stocastico finito. Allora sono

equivalenti:

(1) ©n,iXn e una catena di Markov.

(2) Per ogni n ∈ N ed ogni in+1, . . . , i0 ∈ S tali chep(Xn = in, . . . ,X0 = i0) 6= 0 vale

p(Xn+1 = in+1, . . . ,X1 = i1|X0 = i0)

= p(Xn+1 = in+1|Xn = in) · · · p(X1 = i1|X0 = i0).

Dimostrazione. Prop. 4.12.

Definizione 5.14. ©n,iXn sia un processo stocastico finito. Le variabili

aleatorie ©nXn si dicono indipendenti, se per ogni successione

©nin : N −→ S la successione ©

n(Xn = in) e indipendente. Chiediamo

in altre parole che per ogni n1, . . . , nt ∈ N con n1 < . . . < nt si abbia

p(Xn1= in1

, . . . ,Xnt= int

) = p(Xn1= in1

) · · · p(Xnt= int

)

Osservazione 5.15. ©nXn sia un processo stocastico finito. Le varia-

bili aleatorie ©nXn siano indipendenti. Allora ©

nXn e una catena di

Markov.

Dimostrazione. Siano n ∈ N ed in+1, . . . , i0 ∈ S tali chep(Xn = in, . . . ,X0 = i0) 6= 0. Allora

p(Xn+1 = in+1|Xn = in, . . . ,X0 = i0) =p(Xn+1 = in+1, . . . ,X0 = i0)

p(Xn = in, . . . ,X0 = i0)

=p(Xn+1 = in+1) · · · p(X0 = i0)

p(Xn = in) · · · p(X0 = i0)

=p(Xn+1 = in+1) · p(Xn = in)

p(Xn = in)

= p(Xn+1 = in+1|Xn = in)

Nota 5.16. L’insieme S sia dotato di una struttura di gruppo. ©nYn sia

un processo stocastico finito e le variabili aleatorie Yn indipendenti.Per n ∈ N definiamo Xn := Yn · Yn−1 · · · Y0. Piu esplicitamente per ogniω ∈ Ω si ha Xn(ω) = Yn(ω) ·Yn−1(ω) · · · Y0(ω) usando il prodotto definitonel gruppo S. Allora ©

nXn e una catena di Markov.

27

Page 32: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Siano n ∈ N ed i0, . . . , in+1 ∈ S. Allora

p(Xn+1 = in+1|Xn = in, . . . ,X0 = i0) =p(Xn+1 = in+1, . . . ,X0 = i0)

p(Xn = in, . . . ,X0 = i0)

=p(Y0 = i0, Y1 = i1i

−10 , . . . , Yn+1 = in+1i

−1n )

p(Y0 = i0, Y1 = i1i−10 , . . . , Yn = ini

−1n−1)

=p(Y0 = i0) · · · p(Yn+1 = in+1i

−1n )

p(Y0 = i0) · · · p(Yn = ini−1n−1)

= p(Yn+1 = in+1i−1n )

D’altra parte pero

p(Xn+1 = in+1,Xn = in) =∑

(in−1,...,i0)∈Sn

p(Xn+1 = in+1,Xn = in, . . . ,X0 = i0)

=∑

(in−1,...,i0)∈Sn

p(Y0 = i0, . . . , Yn+1 = in+1i−1n )

=∑

(in−1,...,i0)∈Sn

p(Y0 = i0) · · · p(Yn+1 = in+1i−1n )

= p(Yn+1 = in+1i−1n ) ·

(in−1,...,i0)∈Sn

p(Y0 = i0) · · · p(Yn = ini−1n−1)

= p(Yn+1 = in+1i−1n ) · p(Xn = in)

e cio implica l’enunciato.

Definizione 5.17. Una catena di Markov ©nXn si dice omogenea, se

sono soddisfatte le seguenti condizioni:

(1) Per ogni j ∈ S esiste n ∈ N tale che p(Xn = j) > 0.Poniamo est(j) := n ∈ N | p(Xn = j) > 0.Gli elementi di est(j) si dicono tempi di esistenza di j.

(2) Per ogni i, j ∈ S le probabilita condizionate p(Xn+1 = i|Xn = j)per n ∈ est(j) sono tutte uguali.

Poniamo T(i)(j) := p(Xn+1 = i|Xn = j) per n ∈ est(j).

Otteniamo cosı una matrice T ∈ [0, 1]qq che chiameremo matrice ditransizione della catena di Markov data. Indichiami gli indici tra pa-rentesi per distinguerli dagli esponenti delle potenze di T.

28

Page 33: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

6. La matrice di transizione

Situazione 6.1. Sia (Ω,A, p) uno spazio di probabilita, q ∈ N+1 fissatoed S := 1, . . . , q. ©

nXn sia una catena di Markov finita (con spazio

degli stati S) ed omogenea con matrice di transizione T .

Definizione 6.2. Per i ∈ S ed n ∈ N poniamo p(i)n := p(Xn = i).

Otteniamo cosı per ogni n ∈ N un vettore pn ∈ [0, 1]qq .

Osservazione 6.3. Sia n ∈ N. Allora:

(1) pn+1 = Tpn.

(2) pn = T np0.

Dimostrazione. Dimostriamo la prima uguaglianza di cui la secondae una conseguenza immediata. Sia R := k ∈ S | p(Xn = k) 6= 0. Perogni i ∈ S abbiamo

p(i)n+1 = p(Xn+1 = i) =

k∈S

p(Xn+1 = i,Xn = k)

=∑

k∈S

p(Xn+1 = i|Xn = k) · p(Xn = k)

=∑

k∈R

p(Xn+1 = i|Xn = k) · p(Xn = k)

=∑

k∈R

T(i)(k)p

(k)n =

k∈S

T(i)(k)p

(k)n = (Tpn)(i)

Corollario 6.4. Siano n, n1, n0 ∈ N con n0 ≤ n1 ≤ n. Allora

pn = T n−n1 · T n1−n0 · p0 = T n−n1 · pn1−n0

Teorema 6.5 (equazioni di Chapman/Kolmogorov). Siano i, j ∈ Sed n,m ∈ N tali che p(Xn = j) 6= 0. Allora

p(Xn+m = i|Xn = j) = (Tm)(i)(j)

Dimostrazione. L’enunciato e banale per m = 0.

Procediamo per induzione su m ∈ N + 1.

m = 1: Definizione di T.

m =⇒ m+ 1: Sia R := k ∈ S | p(Xn+m = k,Xn = j) 6= 0.Si osservi che per k 6∈ R

(Tm)(k)(j)

ind= p(Xn+m = k|Xn = j) = 0

Abbiamo

29

Page 34: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

p(Xn+m+1 = i|Xn = j) =∑

k∈S

p(Xn+m+1 = i,Xn+m = k|Xn = j)

3.2=∑

k∈S

p(Xn+m+1 = i|Xn+m = k,Xn = j)p(Xn+m = k|Xn = j)

=∑

k∈R

p(Xn+m+1 = i|Xn+m = k,Xn = j)p(Xn+m = k|Xn = j)

5.10=∑

k∈R

p(Xn+m+1 = i|Xn+m = k)p(Xn+m = k|Xn = j)

ind=∑

k∈R

T(i)(k)(T

m)(k)(j) =

k∈S

T(i)(k)(T

m)(k)(j) = (Tm+1)

(i)(j)

Definizione 6.6. Un vettore v ∈ Rq si dice stocastico, se v ∈ [0, 1]q e

q∑k=1

v(k) = 1.

Una matrice A ∈ Rqq si dice stocastica (per colonne), se ogni colonna di

A e un vettore stocastico.

Osservazione 6.7. (1) Per ogni n ∈ N il vettore pn e stocastico.

(2) La matrice T e stocastica.

Dimostrazione. (1)∑i∈S

p(i)n =

∑i∈S

p(Xn = i) = 1.

(2) Per j ∈ S scegliamo n ∈ est(j). Allora∑i∈S

T(i)(j)

=∑i∈S

p(Xn+1 = i|Xn = j) = 1 perche p(Xn = j) > 0.

Osservazione 6.8. Siano A,B due matrici stocastiche e v un vetto-re stocastico. Allora AB e una matrice stocastica e Av e un vettorestocastico.

Dimostrazione. La verifica e immediata (ad es. Castaldi, pag. 14, oHuppert, pag. 384).

Corollario 6.9. Le potenze T n di T sono matrici stocastiche.

Osservazione 6.10. Dal teorema di esistenza di Kolmogorov si puodedurre che per ogni matrice stocastica T ed ogni vettore stocastico p0

esiste una catena di Markov ©nXn finita e omogenea con matrice di

transizione T e tale che p0(i) = p(X0 = i) per ogni i.

Per questa ragione nelle applicazioni si parte spesso da una matrice

stocastica T i cui coefficienti T(i)(j) vengono interpretati probabilistica-

mente secondo una dizione della forma

T(i)(j) = p(Xn+1 = i|Xn = j) se p(Xn = j) 6= 0

Dimostrazione. Iosifescu/Tautu, pagg. 14-15.

30

Page 35: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

7. Esempi di catene di Markov.

Lemma 7.1. Siano A =

(a bc d

)∈ C

22 e λ, µ gli autovalori di A, n ∈ N.

(1) Sia λ 6= µ. Allora

An =1

λ− µ

(λ− d bc d− µ

)λn +

1

λ− µ

(d− µ −b−c λ− d

)µn

(2) Sia λ = µ. Allora

An =

(1 00 1

)λn +

(λ− d bc d− λ

)nλn−1

Si osservi che in entrambi i casi λ+µ = a+ d, per cui nell’ipotesi λ = µ

vale λ =a+ d

2.

Dimostrazione. Lugli, teorema 2.7 e corollario 2.15.

Nota 7.2. T sia una matrice stocastica 2×2. Allora T puo essere scritta

nella forma T =

(a b

1 − a 1 − b

)con a, b ∈ [0, 1]. Inoltre:

(1) | a− b |≤ 1.

(2) Gli autovalori di T sono 1 ed a− b.

(3) Gli autovalori di T coincidono quindi se e solo se a− b = 1.

In tal caso T =

(1 00 1

)=: δ e si ha T n = δ per ogni n ∈ N.

(4) Se a− b = −1, allora T =

(0 11 0

), cosicche T n = δ

per n ∈ 2N e T n = T per n ∈ 2N + 1, per cui in questo casolim

n→∞T n non esiste.

(5) Sia invece | a− b |< 1. Allora 1 − a+ b 6= 0 e

limn→∞

T n =1

1 − a+ b

(b b

1 − a 1 − a

)

Se poniamo c := 1 − a e d := 1 − b, abbiamo quindi

T =

(a bc d

)

T n =1

b+ c

(b bc c

)+

1

b+ c

(c −b−c b

)(1 − b− c)n

limn→∞

T n =1

b+ c

(b bc c

)

Si osservi che dai punti precedenti segue che | a − b |< 1 se esolo se 0 < b < 1 e 0 < c < 1. Infine per un vettore stocastico

p0 ∈ [0, 1]2 nel nostro caso il limite limn→∞

T np0 =1

b+ c

(bc

)

non dipende da p0.

31

Page 36: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. (1) Ovvio, poiche a, b ∈ [0, 1].

(2) Il determinante di T e uguale ad a(1 − b) − b(1 − a) = a − b, percui il polinomio caratteristico di T e dato da

x2 − x trA+ detA = x2 − (1 + a− b)x+ a− b = (x− 1)(x − a+ b)

(3) a, b ∈ [0, 1] implica che a− b = 1 e possibile solo se b = 0, a = 1.

(4) Similmente a− b = −1 e possibile solo se a = 0, b = 1.

(5) Sia |a − b| < 1. Per il punto (2) gli autovalori di T sono λ = 1 eµ = a − b. L’ipotesi implica λ 6= µ, inoltre abbiamo λ − µ = 1 − a + b,λ− d = b, d− µ = 1 − a = c. Dall’oss. 7.1 otteniamo

T n =1

b+ c

(b bc c

)+

1

b+ c

(c −b−c b

)µn

Siccome pero |µ| < 1 il secondo sommando tende a zero, per cui

limn→∞

T n =1

1 − a+ b

(b bc c

)

Sia infine p0 =

(p(1)0

p(2)0

)un vettore stocastico. Allora

1

b+ c

(b bc c

)p0 =

1

b+ c

(bp

(1)0 + bp

(2)0

cp(1)0 + cp

(2)0

)=

1

b+ c

(bc

)

Corollario 7.3. ©nXn sia una catena di Markov omogenea con spazio

degli stati S = 1, 2 e matrice di transizione T =

(a bc d

).

Abbiamo quindi p(Xn+1 = 1|Xn = 2) = b per p(Xn = 2) 6= 0 e

p(Xn+1 = 2|Xn = 1) = c per p(Xn = 1 6= 0).

Assumiamo 0 < b < 1 e 0 < c < 1. Allora:

(1) limn→∞

T n =1

b+ c

(b bc c

).

(2) Le probabilita limite

limn→∞

p(Xn = 1) =b

b+ c

limn→∞

p(Xn = 2) =c

b+ c

non dipendono dalle probabilita iniziali p(X0 = 1) e p(X0 = 2).

Esempio 7.4. In un’elezione si presentano i candidati A e B. La cam-pagna elettorale dura venti giorni. Siano

p(Xn+1 = A|Xn = A) = 0.8

p(Xn+1 = B|Xn = A) = 0.2

p(Xn+1 = A|Xn = B) = 0.3

p(Xn+1 = B|Xn = B) = 0.7

32

Page 37: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

quando p(Xn = A) 6= 0 e p(Xn = B) 6= 0. La matrice di transizione epercio

T =

(0.8 0.30.2 0.7

)

Gli autovalori di T sono λ = 1, µ = 0.5. Per la nota 7.2 abbiamo

T 20 =1

0.5

(0.3 0.30.2 0.2

)+

1

0.5

(0.2 −0.3−0.2 0.3

)0.520

=

(0.6 0.60.4 0.4

)+

(0.4 −0.6−0.6 0.6

)1

220

∼(

0.6 0.60.4 0.4

)

Dopo venti giorni il 60% della popolazione del paese X votera per ilcandidato A anche se all’inizio tutti erano a favore del candidato B.

Allo stesso modo si possono pronosticare anche cambiamenti dalpunto di vista della condizione sociale, come ad esempio:

ricco poverosano malato

contadino altra professionecristiano non cristianodiligente pigro

Esempio 7.5. Sia S = 1, . . . , q. Assumiamo che delle particelle simuovano sui punti di S con probabilita a verso sinistra (cioe da j aj − 1), con probabilita b verso destra (da j a j + 1) e rimangono nellaposizione che occupano con probabilita r, tranne nelle due estremitadove rimangono intrappolate se le raggiungono. Cio corrisponde aduna matrice di transizione della forma

T =

1 a 0 0 . . . 0 0 00 r a 0 . . . 0 0 00 b r a . . . 0 0 00 0 b r . . . 0 0 0...

......

.... . .

......

...0 0 0 0 . . . r a 00 0 0 0 . . . b r 00 0 0 0 . . . 0 b 1

(1) Siano a = 0.6, r = 0, b = 0.4 per q = 4. Allora, arrotondando a duecifre decimali,

T =

1 0.6 0 00 0 0.6 00 0.4 0 00 0 0.4 1

33

Page 38: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

T 8 =

1 0.79 0.47 00 0 0 00 0 0 00 0.21 0.52 1

≃ T 20

Vediamo che gia dopo otto passaggi praticamente tutte le particelle sitrovano alle due estremita: delle particelle che inizialmente si trovanoin posizione 2, il 79% e rimasto intrappolato nell’estremita sinistra eil 21% nell’estremita destra; di quelle che inizialmente si trovano inposizione 3, il 47% e finito in 1 e il 53% in 4.

(2) Siano a = 0.5, r = 0.2, b = 0.3 per q = 4. Allora

T =

1 0.5 0 00 0.2 0.5 00 0.3 0.2 00 0 0.3 1

T 8 =

1 0.81 0.50 00 0.01 0.01 00 0.01 0.01 00 0.18 0.48 1

T 20 =

1 0.82 0.51 00 0 0 00 0 0 00 0.18 0.49 1

In questo caso la convergenza e piu lenta, soprattutto per la presenzadel termine r = 0.2.

Esempio 7.6. Ci poniamo nella stessa situazione dell’es. 7.5, pero conla possibilita di tornare indietro una volta arrivati alle due estremita,quindi con

T =

1 − b a 0 0 . . . 0 0 0b r a 0 . . . 0 0 00 b r a . . . 0 0 00 0 b r . . . 0 0 0...

......

.... . .

......

...0 0 0 0 . . . r a 00 0 0 0 . . . b r a0 0 0 0 . . . 0 b 1 − a

Siano a = 0.5, r = 0.2, b = 0.3 per q = 4. Allora

T =

0.7 0.5 0 00.3 0.2 0.5 00 0.3 0.2 0.50 0 0.3 0.5

34

Page 39: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

T 8 =

0.49 0.46 0.42 0.380.28 0.28 0.27 0.270.15 0.16 0.19 0.210.08 0.10 0.12 0.15

T 20 =

0.46 0.46 0.46 0.460.28 0.28 0.28 0.280.17 0.17 0.17 0.170.10 0.10 0.10 0.10

T 100 =

0.46 0.46 0.46 0.460.28 0.28 0.28 0.280.17 0.17 0.17 0.170.1 0.1 0.1 0.1

In questo caso tutti i coefficienti di T 8 sono positivi e per un teoremagenerale (che verra formulato e dimostrato piu avanti) la matrice T n

converge ad una matrice le cui colonne sono uguali tra loro.

Esempio 7.7. Sia S := 1, . . . , q con q ≥ 2. Ci poniamo nella stessasituazione dell’es. 7.6, pero supponiamo che il movimento delle parti-celle sia ciclico, cioe con la possibilita di passaggi da 1 a q e viceversa.La matrice di transizione ha allora la forma

T =

r a 0 0 . . . 0 0 bb r a 0 . . . 0 0 00 b r a . . . 0 0 00 0 b r . . . 0 0 0...

......

.... . .

......

...0 0 0 0 . . . r a 00 0 0 0 . . . b r aa 0 0 0 . . . 0 b r

Siano a = 0.5, r = 0.2, b = 0.3 on q = 4. Allora

T =

0.2 0.5 0 0.30.3 0.2 0.5 00 0.3 0.2 0.5

0.5 0 0.3 0.2

T 8 =

0.25 0.25 0.25 0.250.25 0.25 0.25 0.250.25 0.25 0.25 0.250.25 0.25 0.25 0.25

T 100 =

0.25 0.25 0.25 0.250.25 0.25 0.25 0.250.25 0.25 0.25 0.250.25 0.25 0.25 0.25

Modelli compartimentali ciclici possono essere utilizzati nella descri-zione di tessuti se si assume che in una sequenza di stadi di differen-

35

Page 40: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

ziazione l’uscita dall’ultimo stadio provoca un evento di retroazionestimolando cosı la nascita di nuove cellule nello stadio iniziale.

Esempio 7.8 (modello di Ehrenfest). Sia S := 1, . . . , q conq ≥ 2. m := q− 1 particelle siano distribuite in modo arbitrario tra duecompartimenti A e B di un contenitore, separati da una membranaattraverso la quale le particelle possono diffondere. In ogni stato ditempo una molecola diffonde da A a B oppure da B ad A con probabilitarispettivamente pari a j−1

me 1 − j−1

m.

Nell’interpretazione si ha Xn = j, se il comparto A contiene j − 1particelle. Abbiamo quindi

p(Xn+1 = i|Xn = j) =

0 se i 6= j ± 1

1 − j − 1

mse i = j + 1

j − 1

mse i = j − 1

Cio porta alla matrice di transizione

T =

0 1/m 0 0 . . . 0 01 0 2/m 0 . . . 0 00 1 − 1/m 0 3/m . . . 0 00 0 1 − 2/m 0 . . . 0 00 0 0 1 − 3/m . . . 1/m 1

Per m = 4 abbiamo quindi

T =

0 0.25 0 0 01 0 0.50 0 00 0.75 0 0.75 00 0 0.50 0 00 0 0 0.25 1

Esempio 7.9. Riportiamo da Kemeny/Snell, pagg. 39-40, il seguenteesempio.

Tre carri armati combattono tra di loro. Il carro armato A colpisce isuoi avversari con probabilita 2/3, B con probabilita 1/2, C con proba-bilita 1/3. I colpi sono sparati simultaneamente e se un carro armato ecolpito non e piu in grado di combattere. Assumiamo che ciascuno deicarri armati scelga di colpire ogni volta il nemico piu forte tra quellirimasti. Allora otteniamo la seguente matrice di transizione:

T =

E A B C AC BC ABCE 1 0 0 0 2/9 1/6 0A 0 1 0 0 4/9 0 0B 0 0 1 0 0 1/3 0C 0 0 0 1 1/9 1/6 4/9AC 0 0 0 0 2/9 0 2/9BC 0 0 0 0 0 1/3 2/9ABC 0 0 0 0 0 0 1/9

In essa con E indichiamo l’evento in cui nessuno dei carri armati so-

36

Page 41: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

pravvive, con A (risp. B, C) l’evento in cui solo il carro armato A (risp.B, C) sopravvive, con AC (risp. BC) l’evento in cui sopravvivono solo icarri A e C (risp. B e C); con ABC l’evento in cui sopravvivono tutti etre io carri armati. Non e presente l’evento AB poiche il carro armatoC puo essere eliminato solo dopo la distruzione di uno degli altri due.

Si trova che limn→∞

T n ≃ T 10 =

1 0 0 0 0.29 0.25 0.130 1 0 0 0.57 0 0.140 0 1 0 0 0.50 0.120 0 0 1 0.14 0.25 0.600 0 0 0 0 0 00 0 0 0 0 0 00 0 0 0 0 0 0

Guardando l’ultima colonna, che corrisponde alla situazione inizialeABC, un po’ a sorpresa si scopre che il carro armato C sopravvive nel60% dei casi. Cio e naturalmente dovuto al fatto che fino a quandosiamo nella situazione ABC gli altri due non gli sparano.

Esempio 7.10. L’esempio 7.5 con r = 0 e q = 5 puo essere usato perdescrivere le situazioni in caso di parita alla fine di un set di tennis-tavolo (20:20 nel conteggio classico, 10:10 in quello introdotto pochianni fa) o nella pallavolo; cfr. Ferschl, pag. 27. Dal punto di vista delgiocatore A abbiamo gli stati

1 2 punti di vantaggio2 1 punto di vantaggio3 parita4 1 punto di svantaggio5 2 punti di svantaggio

Se a rappresenta la probabilita che uno scambio venga vinto da A, b laprobabilita che venga vinto da B, allora

T =

1 a 0 0 00 0 a 0 00 b 0 a 00 0 b 0 00 0 0 b 1

Per a = 0.7, b = 0.3 la terza colonna, che corrisponde allo stato iniziale

di parita , converge a

0.845000

0.155

.

Mentre cio da un lato conferma che la superiorita del primo giocatorenel singolo scambio (70%) si traduce in una probabilita del 84.5% avincere il set, anche le possibilita per il secondo giocatore con il 15.5%sono maggiori del 9% che si otterrebbe calcolando solo la probabilitadi vincere direttamente 12:10.

37

Page 42: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

8. Un programma di simulazione

Nota 8.1. Creiamo un programma di simulazione:

def simula (T,volte,p=None,j=None):

S=xrange(len(T))

bloccanti=filter(lambda j: T[j][j]==1,S)

if p:

a=0; u=random.random()

for j in S:

b=a+p[j]

if a<=u<b: break

a=b

else: j-=1

v=[j+1]

for t in xrange(volte):

if j in bloccanti: break

a=0; u=random.random()

for i in S:

b=a+T[i][j]

if a<=u<b: v.append(i+1); j=i; break

a=b

return v

(1) Gli argomenti sono:T , che indica la matrice di transizione;volte, che indica il numero di simulazioni;p, che rappresenta il vettore di probabilita da cui partire.

(2) S e il vettore degli indici usati.

(3) bloccanti contiene gli indici j tali che gli elementi diagonali

T(j)(j) coincidano con 1.

(4) Se p e definito, lo usiamo per calcolare uno stato iniziale j.

(5) Se invece p non e definito, allora deve essere definito j che, peril conteggio che inizia da zero, viene sostituito con j − 1.

(6) Nel doppio ciclo finale vengono calcolati gli stati successivi peril numero prescritto di volte oppure fino a quando non vengaraggiunto uno stato bloccante.

(7) Il programma restituisce v.

Esempio 8.2. Consideriamo la matrice T =

(0.5 0.30.5 0.7

):

T=[[0.5,0.3],[0.5,0.7]]; p=[0.6,0.4]

v=simula(T,p,200)

for i in xrange(4): print ’’.join(map(str,v[50*i:50*(i+1)]))

Otteniamo ad esempio l’output

38

Page 43: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

12212212212112122221222121212212112122122212222222

22112222221222122222122211121211122111222222112211

21112212221122221111222222112111112222222222222222

22221112222221112122122122221222222212222122222222

La figura rappresenta graficamente l’output indicato.

Si vede abbastanza bene che le probabilita nella seconda colonna diT si rispecchiano in una tendenza a rimanere nello stato 2 una voltaraggiunto.

Esempio 8.3. Consideriamo ancora la simulazione della parte finaledi un set di tennistavolo vista nell’es. 7.10. Effettuiamo alcune prove.

a=0.7; b=0.3

T=[[1,a,0,0,0],[0,0,a,0,0],[0,b,0,a,0],[0,0,b,0,0],[0,0,0,b,1]]

for k in xrange(5):

v=simula(T,200,j=3)

print ’’.join(map(str,v))

Otteniamo (ad esempio) i seguenti risultati, che traduciamo nei pun-teggi corrispondenti:

3234321

11:10 11:11 11:12 12:12 13:12 14:12

34321

10:11 11:11 12:11 13:11

321

11:10 12:10

34345

10:11 11:11 11:12 11:13

323234321

11:10 11:11 12:11 12:12 12:13 13:13 14:13 15:13

39

Page 44: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

9. Una formula per le potenze

Situazione 9.1. Siano A ∈ Cqq ed MA := (x − λ1)

m1 · · · (x − λs)ms il

polinomio minimale di A con i λk tutti distinti ed mk ≥ 1 per ogni k.Sia m := m1 + . . . +ms.

Osservazione 9.2. In Sage il polinomio minimale di A si ottiene conminpoly(A), la sua fattorizzazione con factor(minpoly(A)).

Esempio 9.3. Proviamo queste istruzioni con il seguente esempio, chesi trova in Gantmacher, pagg. 112-120:

A=matrix(CDF,[[3,-3,2],[-1,5,-2],[-1,3,0]]

print factor(minpoly(A))# (1.0*x-4.0)*(1.0*x-2.0)

Teorema 9.4. Per ogni k = 1, . . . , s ed ogni j = 0, . . . ,mk − 1 sia dato

un vkj ∈ C. Allora esiste esattamente un polinomio H ∈ C[x] di grado

minore di m tale che per ogni k = 1, . . . , s si abbia H(j)(λk) = vkj per

ogni j = 0, . . . ,mk − 1.

Dimostrazione. Giantesio, pag. 46.

Definizione 9.5. Il polinomio H nel teorema 9.4 si chiama polinomiodi interpolazione di Hermite rispetto al problema di interpolazione da-to. Per indicare i parametri del problema di interpolazione denotiamoH con

H[λ1 : (v10, . . . , v1m1−1), . . . , λs : (vs0, . . . , vsms−1)]

Definizione 9.6. Per k = 1, . . . , s e j = 0, . . . ,mk − 1 definiamo Hkj

come la soluzione del problema di interpolazione

H(α)kj (λβ) = δkβδjα

per β = 1, . . . , s ed α = 0, . . . ,mβ − 1. Abbiamo quindi

H10 = H[λ1 : (1, 0, . . . , 0), λ2 : (0, . . . , 0), . . .]

H11 = H[λ1 : (0, 1, 0, . . . , 0), λ2 : (0, . . . , 0), . . .]

H12 = H[λ1 : (0, 0, 1, . . . , 0), λ2 : (0, . . . , 0), . . .]

...

H20 = H[λ1 : (0, . . . , 0), λ2 : (1, 0, . . . , 0), . . .]

H21 = H[λ1 : (0, . . . , 0), λ2 : (0, 1, . . . , 0), . . .]

I polinomi Hkj sono detti polinomi di interpolazione fondamentali di

Hermite.

Teorema 9.7 (formula spettrale di Sylvester-Bucheim). Siano Ωun dominio di C che contiene lo spettro diA ed f : Ω −→ C una funzione

analitica. Allora

40

Page 45: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

f(A) =s∑

k=1

mk−1∑j=0

f (j)(λk)Hkj(A)

Dimostrazione. Giantesio, pagg. 57-58.

Definizione 9.8. Per a ∈ C e j ∈ N + 1 sia a[j] := a(a− 1) · · · (a− j + 1).Poniamo a[0] := 1.

Osservazione 9.9. Per n ∈ N fissato sia f := ©xxn : C −→ C.

Per ogni j ∈ N allora f (j)(z) = n[j]zn−j.

Corollario 9.10. An =s∑

k=1

mk−1∑j=0

n[j]λn−jk Hkj(A).

Esempio 9.11. Sia

A =

3 −3 2−1 5 −2−1 3 0

Calcoliamo prima gli Hkj, poi An. Come nell’esempio 9.3 gli autovalorisono λ = 2, µ = 4. Dobbiamo calcolare

H10 = H[2 : (1), 4 : (0)]

H20 = H[2 : (0), 4 : (1)]

Utilizziamo lo schema alle differenze

2: (1),(0)1, 0

4: (0),(1) [2, 4] -1/2, 1/20,1

Otteniamo quindi

H10 = 1 − 1

2(x− 2) = 2 − x

2

H20 =1

2(x− 2) = −1 +

x

2

Per calcolare An utilizziamo la formula del corollario 9.10:

An = λn(2δ − A

2) + µn(−δ +

A

2) = 2n(2 − A

2) + 4n(−δ +

A

2)

= (2n+1 − 22n)δ + (22n−1 − 2n−1)A

= 2n−1[(4 − 2n+1)δ + (2n − 1)A]

Esempio 9.12. Sia

41

Page 46: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

A =

1 0.7 0 0 00 0 0.7 0 00 0.3 0 0.7 00 0 0.3 0 00 0 0 0.3 1

Troviamo MA = x(x− 1)2(x−λ)(x+λ) con λ ∼= 0.648. Per calcolare An

dobbiamo prima determinare

H10 = H[0 : (1), 1 : (0, 0), λ : (0),−λ : (0)]

H20 = H[0 : (0), 1 : (1, 0), λ : (0),−λ : (0)]

H21 = H[0 : (0), 1 : (0, 1), λ : (0),−λ : (0)]

H30 = H[0 : (0), 1 : (0, 0), λ : (1),−λ : (0)]

H40 = H[0 : (0), 1 : (0, 0), λ : (0),−λ : (1)]

0: (1);(0);(0);(0);(0)

1;0;0;0;0

1: (0, 0);(1, 0);(0, 1);(0, 0);(0, 0) [0, 1] -1;1;0;0;0

0;1;0;0;0 [0, 1] 1;-1;1;0;0

[1] 0;0;1;0;0 [0, λ]

0;1;0;0;0 [1, λ] 0;-8.071;2.841;8.074;0

λ: (0);(0);(0);(1);(0) [1, λ] 0;2.841;0;-2.842;0 [1, -λ]

0;0;0;1;0 [1, -λ] 0;1.724;0;1.724;0.468

-λ: (0);(0);(0);(0);(1) [λ, -λ] 0;0;0;0.772;-0.772

0;0;0;0;1

-1.543;-10.912;2.841;12.460;0

[0, -λ] -2.381;-7.667;1.724;9.614;0.438

0;-5.944;1.724;6.230;-0.284

Otteniamo quindi

H10 = 1 − x+ (x− 1)x− 1.543x(x − 1)2 − 2.381x(x − 1)2(x− λ)

= 1 + (2.381λ − 3.543)x + (1.705 − 4.762λ)x2 + (3.219 + 2.381λ)x3 − 2.381x4

= 1 − 2x− 1.381x2 + 4.762x3 − 2.381x4

H20 = x− x(x− 1) − 10.912x(x − 1)2 − 7.667x(x − 1)2(x− λ)

= (−8.912 + 7.667λ)x + (13.157 − 15.334λ)x2 + (4.442 + 7.667λ)x3 − 7.667x4

= −3.944x + 3.221x2 + 9.410x3 − 7.667x4

H21 = x(x− 1) + 2.841x(x − 12) + 1.724x(x − 1)2(x− λ)

= (1.841 − 1.724λ)x + (−2.958 + 3.448λ)x2 + (−0.607 − 1.724λ)x3 + 1.724x4

= 0.724x − 0.724x2 − 1.724x3 + 1.724x4

42

Page 47: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

H30 = 12.460x(x − 1)2 + 9.614x(x − 1)2(x− λ)

= (12.460 − 9.614λ)x + (19.225λ − 15.306)x2 − (6.768 + 9.614λ)x3 + 9.614x4

= 6.23x − 2.848x2 − 12.998x3 + 9.614x4

H40 = 0.438x(x − 1)2(x− λ)

= −0.438λx + (0.438 + 0.876λ)x2 − (0.876 + 0.438λ)x3 + 0.438x4

= −0.284x + 1.006x2 − 1.16x3 + 0.438x4

Ponendo λ1 := 0, λ2 := 1, λ3 := λ, λ4 := −λ abbiamo per n > 0 quindi

An = λn1H10(A) + λn

2H20(A) + nλn−12 H21(A) + λn

3H30(A) + λn4H40(A)

= H20(A) + nH21(A) + λnH30(A) + (−λ)nH40(A)

= −3.944A + 3.221A2 + 9.410A3 − 7.667A4

+ n(0.724A − 0.724A2 − 1.724A3 + 1.724A4)

+ λn(6.23A − 2.848A2 − 12.998A3 + 9.614A4)

+ (−λ)n(−0.284A + 1.006A2 − 1.16A3 + 0.438A4)

= (−3.944 + 0.724n + 6.23p − 0.284q)A

+ (3.221 − 0.724n − 2.848p + 1.006q)A2

+ (9.410 − 1.724n − 12.998p − 1.160q)A3

+ (−7.667 + 1.724n + 9.614p + 0.438q)A4

dove abbiamo posto p := λn, q := (−λ)n. Abbiamo quindi

An = (−3.944 + 0.724n + 5.946λn)A

+ (3.221 − 0.724n − 1.842λn)A2

+ (9.410 − 1.724n − 14.158λn)A3

+ (−7.667 + 1.724n + 10.052λn)A4

se n e pari e > 0,

An = (−3.944 + 0.724n + 6.514λn)A

+ (3.221 − 0.724n − 3.854λn)A2

+ (9.410 − 1.724n − 11.838λn)A3

+ (−7.667 + 1.724n + 9.176λn)A4

se n e dispari.

43

Page 48: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dovremmo adesso calcolare le prime quattro potenze di A e sostitu-irle nell’espressione che risulta piuttosto complicata e numericamenteinstabile. Vedremo nel prossimo capitolo che in molti casi (compresoquello di quest’esempio) il limite delle potenze di una matrice stocasti-ca puo essere calcolato con una semplice procedura di algebra lineare.

44

Page 49: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

10. Il teorema ergodico matriciale

Osservazione 10.1. V sia uno spazio vettoriale di dimensione finitae ϕ : V −→ V un’applicazione lineare tale che kerϕ ∩ Imϕ = 0. AlloraV = kerϕ⊕ Imϕ.

Dimostrazione. Dobbiamo dimostrare che V = kerϕ+Imϕ. Abbiamopero, usando due risultati noti dell’algebra lineare,

dim(kerϕ+ Imϕ) = dimkerϕ+ dim Imϕ− dim(kerϕ ∩ Imϕ)

= dimkerϕ+ dim Imϕ = dimV

Siccome V ha dimensione finita, da cio segue che V = kerϕ+ Imϕ.

Lemma 10.2. T sia una matrice stocastica q × q ed x ∈ Rq. Allora

|Tx| ≤ √q|x|.

Dimostrazione. Scriviamo∑i

invece diq∑

i=1. Usando la diseguaglian-

za di Cauchy-Schwartz (CS) e l’ipotesi che la matrice T sia ≥ 0 (1) estocastica (2) abbiamo

|Tx|2 =∑

i

|T (i)x|2CS≤∑

i

|T (i)|2|x|2 = |x|2∑

i

|T (i)|2

(1)= |x|2

i

j

(T(i)(j))

2(2)

≤ |x|2∑

i

j

T(i)(j)

= |x|2∑

j

i

T(i)(j) = |x|2

j

1 = q|x|2

Cio implica l’enunciato.

Definizione 10.3. V sia uno spazio vettoriale e ϕ : V −→ V un’applicazionelineare. Poniamo Fixϕ := x ∈ V | ϕx = x.

E chiaro che Fixϕ e un sottospazio vettoriale di V .

Osservazione 10.4. Sia T una matrice stocastica. Allora:

(1) 1 e autovalore di T .

(2) Fix T = ker(T − δ) 6= 0

Dimostrazione. (1) Il vettore

1...1

e autovettore della matrice tras-

posta T t, come segue immediatamente dalla condizione che ogni colon-na di T abbia somma uguale a 1. Cio mostra che 1 e autovalore di T t equindi anche di T .

(2) Segue direttamente da (1).

Definizione 10.5. Per A ∈ Cqq poniamo ||A||F :=

√q∑

i=1

q∑j=1

|A(i)(j)|2.

45

Page 50: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

||A||F si chiama la norma di Frobenius di A.

Si osservi che ‖A‖2F =

q∑i=1

|A(i)|2 =q∑

j=1|A(j)|2.

Osservazione 10.6. ©nAn sia una successione di matrici q × q e

B ∈ Rqq. Allora

limn→∞

An = B ⇐⇒ limn→∞

||An −B||F = 0

Dimostrazione. Cio e chiaro perche la norma di Frobenius di unamatrice coincide con la lunghezza del vettore complessivo dei suoi co-efficienti.

Osservazione 10.7. Siano A,B ∈ Cqq ed x ∈ C

q. Allora:

(1) |Ax| ≤ ||A||F |x|.(2) ‖AB‖F ≤ ‖A‖F ‖B‖F .

Dimostrazione. (1) Utilizzando la diseguaglianza di Cauchy-Schwartzabbiamo:

|Ax|2 =∑i

|A(i)x|2CS≤ ∑

i

|A(i)|2|x|2 = |x|2‖A‖F

(2) ‖AB‖2F =

∑j

|AB(j)|2(1)

≤ ‖A‖2F

∑j

|B(j)|2 = ‖A‖2F ‖B‖2

F .

Osservazione 10.8. ©nAn sia una successione di matrici q × q e

B ∈ Rqq. Allora le seguenti affermazioni sono equivalenti:

(1) limn→∞

An = B.

(2) limn→∞

Anx = Bx per ogni x ∈ Rq.

Dimostrazione. Possiamo assumere che B = 0.

(1) =⇒ (2): Sia x ∈ Rq. Dobbiamo dimostrare che lim

n→∞Anx = 0.

Per l’oss. 10.7 abbiamo |Anx| ≤ ‖An‖F , inoltre limn→∞

‖An‖F = 0 per

l’oss. 10.6.

(2) =⇒ (1): L’ipotesi implica in particolare chelim

n→∞(An)(j) = lim

n→∞Anδj = 0 per ogni j e cio mostra l’enunciato.

Teorema 10.9. Sia T una matrice stocastica q × q. Allora:

(1) Rq = Fix T ⊕ Im(T − δ).

(2) P : Rq −→ R

q sia la proiezione su Fix T nella decomposizione (1).

Allora limN−→∞

1

N

N−1∑

n=0

T n = P

Dimostrazione. Per N ∈ N + 1 poniamo SN :=1

N

N−1∑

n=0

T n.

46

Page 51: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(A) Se x ∈ FixT , allora SNx = x per ogni N .

(B) Sia x ∈ Im(T − δ). Allora esiste y ∈ Rq tale che x = Ty − y.

Per il lemma 10.2 e usando il fatto che le matrici T n sono stoca-stiche, abbiamo

|SNx| = |SN (Ty − y)| =

∣∣∣∣∣1

N

N∑

n=1

T ny − 1

N

N−1∑

n=0

T ny

∣∣∣∣∣

=1

N

∣∣TNy − y∣∣ ≤ 1

N

∣∣TNy∣∣+ 1

N|y|

≤ 1

N(√q|y| + |y|) =

√q + 1

N|y|

Cio mostra che limn→∞

SNx = 0 per ogni x ∈ Im(T − δ).

(C) Sia x ∈ FixT ∩ Im(T − δ). Allora per il punto (B)lim

N−→∞SNx = 0, mentre per il punto (A) SNx = x per ogni N , e

cio e possibile solo se x = 0. Vediamo cosı cheFix T ∩ Im(T − δ) = 0. Pero FixT = ker(T − δ) e dall’oss. 10.1segue R

q = FixT ⊕ Im(T − δ).

(D) La proiezioneP e quindi ben definita e per x ∈ Rq si ha x = u+v,

con u = Px ∈ FixT e v = x− Px ∈ Im(T − δ). Inoltre

limN−→∞

SNx = limN−→∞

SN (u+ v)(A)= u+ lim

N−→∞SNv = u = Px

per ogni N ∈ N + 1. L’enunciato segue dall’oss. 10.8.

Osservazione 10.10. Nelle ipotesi del teorema 10.9 si hanno le rela-zioni:

P 2 = P = PT = TP

Dimostrazione. Sia x ∈ Rq. Per il teorema 10.9 x = u + Tv − v con

u, v ∈ Rq e Tu = u. E chiaro che PPx = Pu = u = Px. Inoltre

Tx = Tu+ TTv − Tv = u+ TTv − Tv, per cui PTx = u, mentreTPx = Tu = u.

Osservazione 10.11. ©nAn sia una successione di matrici stocastiche

q × q e B ∈ Rqq tale che ©

nAn −→ B. Allora anche la matrice B e

stocastica.

Dimostrazione. Chiaro.

Osservazione 10.12. La matrice P nel teorema 10.9 e stocastica.

Definizione 10.13. Sia A ∈ Cqq. Il raggio spettrale di A e definito come

ρ(A) := max|λ| | λ e autovalore di A.

Proposizione 10.14. Sia A ∈ Cqq. Allora ρ(A) ≤ ‖A‖F .

Dimostrazione. Siano v un autovettore di A e λ ∈ C tali che Av = λv.Per l’oss. 10.7 allora |λ||v| = |λv| = |Av| ≤ ‖A‖F |v| e poiche v 6= 0 cioimplica |λ| ≤ ‖A‖F e quindi l’enunciato.

47

Page 52: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Definizione 10.15. Per λ ∈ C ed m ∈ N + 1 definiamo la casella di

Jordan Jm(λ) ∈ Cmm nel modo seguente:

J1(λ) := λ

J2(λ) :=

(λ 10 λ

)

J3(λ) :=

λ 1 00 λ 10 0 λ

...

Jm(λ) :=

λ 1 0 . . . . . . 00 λ 1 . . . . . . 0

0 0 λ . . ....

......

...... . . . 1 0

0 0 . . . . . . λ 10 0 0 . . . 0 λ

Teorema 10.16 (teorema della forma normale di Jordan).Per ogni A ∈ C

qq esiste E ∈ GL(g,C) tale che E−1AE sia della forma

M1 0 . . . 0

0 M2. . .

......

. . .. . . 0

0 . . . 0 Mp

,

dove ogni Mj e una casella di Jordan.

Gli autovalori di A coincidono con gli elementi della diagonale prin-

cipale di E−1AE e vi appaiono con la stessa molteplicita con cui ap-paiono nel polinomio caratteristico di A.

Dimostrazione. Ad es. Huppert, pagg. 23-26.

Osservazione 10.17. Siano A ∈ Cqq ed E ∈ GL(g,C). Per ogni n ∈ N

allora (E−1AE)n = E−1AnE.

Lemma 10.18. Siano λ ∈ C, m ∈ N + 1 ed n ∈ N. Allora

(Jm(λ))n =

(n0

)λn

(n1

)λn−1

(n2

)λn−2 . . .

0(n0

)λn

(n1

)λn−1 . . .

. . .

0 0 0(n0

)λn

Dimostrazione. Induzione su n.L’enunciato e banale per n = 0.

n −→ n+ 1: Poniamo A := Jm(λ). Dobbiamo dimostrare che

48

Page 53: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(An)(i)(j) =

(n

j−1−(i+1)

)λn−[j−1−(i+1)] =

(n

j−i

)λn−j+i per j ≥ i perche e

chiaro che (An)(i)(j) = 0 per j < i. Anche il caso j = i e ovvio. Assumiamo

quindi che j > i. Allora

(An+1)(i)(j) =

m∑

k=1

A(i)(k)(A

n)(k)(j) = A

(i)(i)(A

n)(i)(j) +A

(i)(i+1)(A

n)(i+1)(j)

= λ(An)(i)(j) + (An)

(i+1)(j)

ind= λ

(n

j − i

)λn−j+i +

(n

j − i− 1

)λn−j+i+1

= λn+1−j+i

[(n

j − i

)+

(n

j − i− 1

)]

= λn+1−j+i

(n+ 1

j − i

)

Proposizione 10.19. Sia A ∈ Cqq tale che ρ(A) < 1. Allora lim

n→∞An = 0.

Dimostrazione. Per il teorema 10.16 esiste E ∈ GL(g,C) tale cheE−1AE sia in forma normale di Jordan e per l’oss. 10.17 lim

n→∞An = 0

se e solo se limn→∞

(E−1AE)n = 0. E quindi sufficiente dimostrare che per

ogni m ∈ N + 1 ed ogni λ ∈ C con |λ| ≤ 1 vale limn→∞

(Jm(λ))n = 0. Ma cio

e evidente dal lemma 10.18.

Osservazione 10.20. Siano A ∈ Cqq ed n ∈ N.

(1) Se λ1, . . . , λq sono gli autovalori di A, allora λn1 , . . . , λ

nq sono gli

autovalori di An.

(2) Percio ρ(An) = (ρ(A))n.

Dimostrazione. Cio e una conseguenza immediata del teorema 10.16e del lemma 10.18.

Teorema 10.21. Sia A ∈ Cqq. Allora ρ(A) = lim

n→∞

n√

‖An‖F .

Dimostrazione. Dimostriamo che per ogni ε > 0 esiste n0 ∈ N taleche ρ(A) ≤ n

√‖An‖F < ρ(A) + ε per ogni n ≥ n0.

(1) Per l’oss. 10.20 e la prop. 10.14 abbiamo (ρ(A))n = ρ(An) ≤ ‖A‖F

e quindi ρ(A) ≤ n√

‖An‖F per ogni n ∈ N + 1.

(2) Siano ε > 0 ed Aε :=1

ρ(A) + ε. Allora ρ(Aε) =

ρ(A)

ρ(A) + ε< 1.

Per la prop. 10.19 quindi limn→∞

Anε = 0. In particolare esiste n0 ∈ N tale

che ‖Anε ‖F < 1 per ogni n ≥ n0. Cio significa pero

‖An‖F

(ρ(A) + ε)n< 1,

ovvero n√

‖An‖F < ρ(A) + ε per ogni n ≥ n0.

49

Page 54: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Definizione 10.22. Per A,B ∈ Rqq scriviamo A ≥ B se A

(i)(j) ≥ B

(i)(j) per

ogni i, j. La matrice A si dice non negativa se A ≥ 0.

Lemma 10.23. Siano A,B ∈ Rqq tali che A ≥ B ≥ 0.

Allora ρ(A) ≥ ρ(B).

Dimostrazione. L’ipotesi implica che anche An ≥ Bn ≥ 0 e quindi‖An‖F ≥ ‖Bn‖F per ogni n. Usando il teorema 10.21 abbiamo

ρ(A) = limn→∞

n√

‖An‖F ≥ limn→∞

n√

‖Bn‖F = ρ(B)

Definizione 10.24. Per v ∈ Cq ed A ∈ C

qq siano

‖v‖1 :=

q∑

i=1

|v(i)|

‖A‖1 := max‖A(j)‖1 | j = 1, . . . , q

Per A ≥ 0 abbiamo quindi in particolare

‖A‖1 = max

q∑

i=1A

(i)(j) | j = 1, . . . , q

Osservazione 10.25. Sia T una matrice stocastica. Allora ‖T‖1 = 1.

Dimostrazione. Infatti ‖T(j)‖1 = 1 per ogni j, poiche T e stocastica.

Lemma 10.26. Sia A ∈ Cqq. Allora:

(1) ‖A‖1 = sup

‖Av‖1

‖v‖1| v ∈ C

q \ 0

.

(2) In particolare si ha ‖Av‖1 ≤ ‖A‖1‖v‖1 per ogni v ∈ Cq.

Dimostrazione. Dimostriamo prima il punto (2), scrivendo∑i

invece

diq∑

i=1. Sia v ∈ C

q. Allora, usando la disuguaglianza triangolare, abbia-

mo

‖Av‖1 =∑

i

|A(i)v| =∑

i

|∑

j

A(i)(j)v

(j)| ≤∑

i

j

|A(i)(j)||v

(j)|

=∑

j

|v(j)|∑

i

|A(i)(j)| =

j

|v(j)|‖A(j)‖1

≤∑

j

|v(j)|‖A‖1 = ‖A‖1

j

|v(j)| = ‖A‖1‖v‖1

Viceversa scegliamo j in modo tale che ‖A(j)‖1 = ‖A‖1.Allora ‖Aδj‖1 = ‖A(j)‖1 = ‖A‖1, e siccome ‖δj‖1 = 1, abbiamo

‖A‖1 =‖Aδj‖1

‖δj‖1.

Lemma 10.27. Siano A,B ∈ Cqq. Allora ‖AB‖1 ≤ ‖A‖1‖B‖1.

50

Page 55: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione.

‖AB‖1 = max‖(AB)(j)‖1 | j = 1, . . . , q

= max‖AB(j)‖1 | j = 1, . . . , q10.26≤ max‖A‖1‖B(j)‖1 | j = 1, . . . , q

= ‖A‖1 max‖B(j)‖1 | j = 1. . . . , q

= ‖A‖1‖B‖1

Proposizione 10.28. Sia A ∈ Cqq. Allora ρ(A) ≤ ‖A‖1.

Dimostrazione. Uguale alla dimostrazione della prop. 10.14, utiliz-zando il lemma 10.26.

Teorema 10.29. Sia T una matrice stocastica. Allora ρ(T ) = 1.

Dimostrazione. Per la prop. 10.27 si ha che ρ(T ) ≤ ‖T‖110.25= 1. Ma

per l’oss. 10.4 sappiamo che 1 e autovalore di T , quindi necessariamen-te ρ(T ) = 1.

Lemma 10.30. Sia λ ∈ C. Allora

(1) Se |λ| > 1, allora la successione ©nλn non converge.

(2) Se |λ| < 1, allora limn→∞

λn = 0.

(3) Se |λ| = 1 e λ 6= 1, allora la successione ©nλn non converge.

(4) Per λ = 1 naturalmente limn→∞

λn = 1.

Dimostrazione. E sufficiente dimostrare il punto (3). Sia limn→∞

λn = a.

Allora da un lato limn→∞

λn+1 = λa, ma anche limn→∞

λn+1 = a, per cui

λa = a. Per la continuita del valore assoluto si ha pero |a| = 1, cosicchea 6= 0 e cio implica λ = 1, in contraddizione all’ipotesi.

Osservazione 10.31. Siano λ ∈ C ed m ∈ N. Assumiamo che m ≥ 2 e|λ| ≥ 1. Allora la successione ©

n(Jm(λ))n non converge.

Dimostrazione. Utilizziamo il lemma 10.18. Dal lemma 10.30 segueche la successione non converge per λ 6= 1. Siano λ = 1 edm ≥ 2. Allora

((Jm(λ))n)(1)(2) = n e si vede che anche in questo caso la successione non

puo convergere.

Corollario 10.32. Siano λ ∈ C edm ∈ N+1. Sia A := Jm(λ). Allora:

(1) Se |λ| < 1, allora limn→∞

An = 0.

(2) Se |λ| > 1, allora la successione ©nAn non converge.

(3) Se |λ| = 1 ed m ≥ 2, allora la successione ©nAn non converge.

51

Page 56: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(4) Se |λ| = 1 ed m = 1, allora la successione ©nAn converge se e solo

se λ = 1.

Dimostrazione. (1) e (2): Seguono dal lemma 10.18.

(3): Segue dal corollario 10.31.

(4): Segue dal lemma 10.30.

Proposizione 10.33. T sia una matrice stocastica q×q edE ∈ GL(g,C)tale che S := E−1TE sia in forma normale di Jordan. λ sia un auto-

valore di T con |λ| = 1. Allora per ogni casella di Jordan Jm(λ) cheappare in S si ha m = 1.

Dimostrazione. Per ogni n ∈ N anche la matrice T n e stocastica percui ‖T n‖1 = 1. Per il lemma 10.27 abbiamo

‖Sn‖1 = ‖E−1T nE‖1 ≤ ‖E−1‖1‖T n‖1‖E‖1 = ‖E−1‖1‖E‖1 =: α

Teorema 10.34. Sia T una matrice stocastica. Allora sono equivalen-

ti:

(1) La successione ©nT n converge.

(2) T non possiede un autovalore λ con λ 6= 1 e |λ| = 1.

Dimostrazione. Possiamo trovare E ∈ GL(q,C) tale che S := E−1TEsia in forma normale di Jordan. La successione ©

nT n converge se e solo

se converge la successione ©nSn e cio accade se e solo se per ogni casel-

la di Jordan A := Jm(λ) converge la successione ©nAn. Per il corollario

10.32 e sufficiente considerare il caso |λ| = 1. Per la prop. 10.33 in quelcaso pero m = 1 e l’enunciato segue dal corollario 10.32.

Lemma 10.35 (primo teorema di Gershgorin). Siano

A ∈ Cqq e λ un autovalore di A. Allora esiste j ∈ 1, . . . , q tale che

|λ−A(j)(j)| ≤ ‖A(j)‖1 − |A(j)

(j)|.

Dimostrazione. λ e anche autovalore di At, percio esiste un vettoreriga f ∈ Cq \ 0 tale che fA = λf . Possiamo assumere che |f(1)| ≥ |f(k)|per ogni k ≥ 2. In particolare f(1) 6= 0. Per ipotesi abbiamo

λf(1) = (fA)(1) = fA(1) = f(1)A(1)(1) +

q∑k=2

f(k)A(k)(1)

e quindi

|λ−A(1)(1)| =

∣∣∣∣∣

q∑

K=2

f(k)

f(1)A

(k)(1)

∣∣∣∣∣ ≤q∑

k=2

∣∣∣∣f(k)

f(1)

∣∣∣∣∣∣∣A(k)

(1)

∣∣∣ ≤q∑

k=2

∣∣∣A(k)(1)

∣∣∣ = ‖A(1)‖1 −∣∣∣A(1)

(1)

∣∣∣

Corollario 10.36. Siano T una matrice stocastica q× q e λ un autova-

lore di T . Allora esiste j ∈ 1, . . . , q tale che

|λ−A(j)(j)| ≤ 1 −A

(j)(j).

52

Page 57: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Definizione 10.37. Una matrice A ∈ Cqq si dice a diagonale positiva

se A(j)(j) > 0 per ogni j ∈ 1, . . . , q.

Corollario 10.38. Siano T una matrice stocastica a diagonale positivae λ un autovalore di T con |λ| = 1. Allora λ = 1.

Dimostrazione. Scegliamo j come nel corollario 10.36 e poniamo

a := A(j)(j). Per ipotesi, inoltre |λ − a| ≤ 1 − a. Siano x, y ∈ R con λ =

a + x + iy. Siccome |λ| = 1, necessariamente a + x ≤ 1. Da |λ| = 1segue pero anche a2 + 2ax + x2 + y2 = 1, mentre |λ − a|2 ≤ (1 − a)2

implica x2 + y2 ≤ 1− 2a+ a2 cosicche 1− a2 − 2ax ≤ 1− 2a+ a2 ovvero2a ≤ 2a2 + 2ax. Siccome a > 0 otteniamo 1 ≤ a+ x. Cosicche a+ x = 1.Cio implica λ = 1 + iy. Ma |λ| = 1, per cui y = 0 e λ = 1.

Corollario 10.39. Sia T una matrice stocastica a diagonale positiva.

Allora la successione ©nT n converge.

Dimostrazione. Teorema 10.34 e corollario 10.38.

Definizione 10.40. Per U ∈ R2 sia conv(U) l’inviluppo convesso di

U . Denotiamo inoltre con S1,D,D la circonferenza unitaria, il discounitario aperto e il disco unitario chiuso in R

2.

λ ∈ C si chiama una radice dell’unita, se esiste k ∈ N + 1 tale cheλk = 1.

Osservazione 10.41. Sia U ∈ D. Allora conv(U) ∩ S1 ⊂ U .

Dimostrazione. Geometricamente evidente.

Proposizione 10.42. Siano T una matrice stocastica e λ un autovaloredi T con |λ| = 1. Allora |λ| e una radice dell’unita.

Dimostrazione. Sia T ∈ Rqq. λ e autovalore anche di T t, percio esiste

un vettore riga f ∈ Cq \ 0 tale che fT = λf . Possiamo assumere chemax|f(j)| | j = 1, . . . , q = 1. Sia U := f(1), . . . , f(q). Allora U ⊂ D e

U ∩ S1 6= ∅. Possiamo quindi scegliere un elemento z ∈ U ∩ S1. Sia ad

esempio z = f(1). Allora λz = λf(1) = fT(1) =q∑

k=1

f(k)T(k)(1) ∈ conv(U),

perche T e stocastica.

D’altra parte |λz| = |λ||z| = 1, per cui λz ∈ S1 ∩ conv(U) e dall’oss.10.41 segue che λz ∈ S1 ∩ U . Cio mostra λ(U ∩ S1) ⊂ U ∩ S1.

Qui abbiamo usato soltanto che z ∈ U ∩ S1, percio vediamo cheλ(U ∩ S1) ⊂ U ∩ S1 e quindi anche λnz ∈ U ∩ S1 per ogni n. L’insiemeU ∩ S1 e finito, per cui devono esistere m,n ∈ N + 1 con m > n tali cheλmz = λnz. Pero z 6= 0 e cio implica λn = λm ovvero λm−n = 1.

Lemma 10.43. V sia uno spazio vettoriale (reale o complesso) normato

e ©nxn una successione di elementi di V ed x ∈ V con ©

nxn −→ x.

Allora limN−→∞

1

N

N−1∑

n=0

xn = x.

53

Page 58: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Sia ε > 0. Per ipotesi esisteN1 tale che ‖xn−x‖ < ε/2per ogni n ≥ N1. Scegliamo N0 ≥ N1 in modo tale che

1

N0‖

N1−1∑

n=0

(xn − x)‖ < ε/2. Per N ≥ N0 allora

‖ 1

N

N−1∑

n=0

xn − x‖ = ‖ 1

N

N−1∑

n=0

(xn − x)‖

≤ 1

N‖

N1−1∑

n=0

(xn − x)‖ +1

N‖

N−1∑

n=N1

(xn − x)‖

2+

1

N‖

N−1∑

n=N1

(xn − x)‖ ≤ ε

2+

1

N

N−1∑

n=N1

‖xn − x‖

2+N −N1

N

ε

2< ε

Corollario 10.44. T sia una matrice stocastica q × q e la successione

©nT n sia convergente. Allora:

(1) Rq = Fix T ⊕ Im(T − δ).

(2) Se P : Rq −→ R

q e la proiezione su Fix T nella decomposizione(1), allora lim

n→∞T n = P .

(3) P 2 = P = PT = TP .

Dimostrazione. Lemma 10.43, teorema 10.9 e oss. 10.10.

Corollario 10.45. T sia una matrice stocastica, la successione ©nT n

sia convergente e dimFix T = 1.

Allora FixT contiene un unico vettore stocastico v e si ha

limn→∞

T n = (v, . . . , v).

Dimostrazione. Come nel corollario 10.44 sia P la proiezione su Fix T .Allora TP = P . Sia v una qualsiasi colonna di P . Allora Tv = v, quindiv ∈ FixT . Per l’oss. 10.12 la matrice P e stocastica e quindi v e un

vettore stocastico. In particolare si haq∑

i=1v(i) = 1 e cio determina v

univocamente essendo per ipotesi dim FixT = 1. Cio implica pero cheP = (v, . . . , v).

Esempio 10.46. Come nella nota 7.2 sia T =

(a b

1 − a 1 − b

)con

|a − b| < 1. Allora b 6= 0 e risolvendo T

(xy

)=

(xy

):= v troviamo

ax+ by = x, per cui y =1 − a

bx. Cio mostra che dim FixT = 1. Affinche

v sia un vettore stocastico dobbiamo avere x+y = 1, cioe x+x1 − a

b= 1

ovvero x =b

1 − a+ be y =

1 − a

b

b

1 − a+ b=

1 − a

1 − a+ b, cosicche

54

Page 59: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

P = (v, v) =1

1 − a+ b

(b b

1 − a 1 − a

)in accordo con quanto trovato

nella nota 7.2.

Esempio 10.47. Consideriamo ancora la matrice T =

1 0.7 0 0 00 0 0.7 0 00 0.3 0 0.7 00 0 0.3 0 00 0 0 0.3 1

.

Nell’esempio 9.12 abbiamo trovato che MT = x(x−1)2(x−λ)(x+λ) conλ ∼= 0.648 per cui dal teorema 10.34 segue che la successione ©

nT n con-

verge. Possiamo applicare il corollario 10.44. Risolvendo l’equazioneTx = x troviamo che FixT = SV (δ1, δ5).

Abbiamo inoltre T − δ =

0 0.7 0 0 00 −1 0.7 0 00 0.3 −1 0.7 00 0 0.3 −1 00 0 0 0.3 0

.

Poniamo e3 =

0.7−10.300

, e4 =

00.7−10.30

, e5 =

00

0.7−10.3

.

Allora e3, e4, e5 e una base di Im(T − δ), mentre δ1, δ5, e3, e4, e5 e unabase di R

5. Sia E := (δ1, δ5, e3, e4, e5). Sia x ∈ R5. Allora x possiede una

rappresentazione x = Ea = a(1)δ1 + a(2)δ5 + a(3)e3 + a(4)e4 + a(5)e5 cona = E−1x. Con Sage troviamo

E−1 =

1 0.95 0.84 0.59 00 0.05 0.16 0.41 1

. . .

per cui

a(1) = x(1) + 0.95(2) + 0.84x(3) + 0.59x(4)

a(2) = 0.05x(2) + 0.16x(3) + 0.41x(4) + x(5)

Px = a(1)δ1 + a(2)δ5 =

x(1) + 0.95x(2) + 0.84x(3) + 0.59x(4)

000

0.05x(2) + 0.16x(3) + 0.41x(4) + x(5)

e quindi P =

1 0.95 0.84 0.59 00 0 0 0 00 0 0 0 00 0 0 0 00 0.05 0.16 0.41 1

55

Page 60: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Lemma 10.48. K sia un campo e V uno spazio vettoriale su K. Siano

v1, . . . , vs ∈ V e W := SV (v1, . . . , vs). Sia 1 ≤ m ≤ s tale che i vettoriv1, . . . , vm siano linearmente indipendenti, mentre per ogni j > m i

vettori v1, . . . , vm, vj siano linearmente dipendenti. Allora

SV (v1, . . . , vm) = W . I vettori v1, . . . , vm costituiscono quindi una basedi W .

Dimostrazione. Sia j > m. E sufficiente dimostrare chevj ∈ SV (v1, . . . , vm). Poiche per ipotesi v1, . . . , vm, vj sono linearmentedipendenti, esistono β1, . . . , βm, βj ∈ K, non tutti nulli, tali cheβ1v1+. . .+βmvm+βjvj = 0. Necessariamente βj 6= 0, perche altrimentiv1, . . . , vm sarebbero linearmente dipendenti, percio possiamo scrivere

vj = −β1

βjv1 − . . .− βm

βjvm ∈ SV (v1, . . . , vm)

Osservazione 10.49. U e W siano due sottospazi vettoriali di Rq tali

che Rq = U⊕W . e1, . . . , er sia una base di U , er+1, . . . , eq una base di W .

Siano E := (e1, . . . , eq) e Q := (δ1, . . . , δr, 0, . . . , 0). Allora P := EQE−1

e la proiezione di Rq su U (piu precisamente, come in precedenza, la

matrice di questa proiezione nella base standard di Rq).

Dimostrazione. Sia x ∈ Rq. Allora x = Ea con a ∈ R

q. Allora

Px = E

a(1)

...

a(r)

0...0

= EQa = EQE−1x, e cio mostra l’enunciato.

Nota 10.50. Utilizzando l’oss. 10.48, dal corollario 10.44 otteniamo unsemplice metodo generale per calcolare lim

n→∞T n =: P per una matrice

stocastica T ∈ Rq per la quale questo limite esiste:

(1) Risolvendo l’equazione Tx = x troviamo una base di Fix T .

(2) Estraendo un numero massimo di colonne linearmente indipen-denti di T − δ troviamo una base di Im(T − δ).

(3) Adesso possiamo calcolare P come proiezione su Fix T nella de-composizione R

q = Fix T ⊕ Im(T − δ), usando il metodo dell’oss.10.49.

Esempio 10.51. Sia T =

0.8 0.5 0.1 00.1 0.2 0.7 0.10.1 0.2 0.1 0.30 0.1 0.1 0.6

. Con Sage troviamo

il polinomio minimale MT = (x−0.901)(x−0.655)(x2 −0.144x+0.006),da cui vediamo che T non possiede autovalori λ con λ 6= 1 e |λ| = 1. Peril teorema 10.34 esiste il limite P := lim

n→∞T n. Risolvendo l’equazione

Tx = x troviamo

56

Page 61: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

FixT = SV (e1) con e1 =

88312113

.

Con il vettore stocastico v :=1

153

88312113

per il corollario 10.45 ab-

biamo quindi P = (v, . . . , v).

Esempio 10.52. Sia T =

1 1/2 1/4 0 00 1/4 0 1/4 00 0 1/2 0 00 1/4 0 1/4 00 0 1/4 1/2 1

.

Il polinomio caratteristico di T e uguale a x(x−1)2(x−1/2)2, cosicchedal teorema 10.34 segue che lim

n→∞T n =: P esiste.

Risolvendo Tx = x otteniamo che Fix T = SV (δ1, δ5). Essendo

T − δ =

0 1/2 1/4 0 00 −3/4 0 1/4 00 0 −1/2 0 00 1/4 0 −3/4 00 0 1/4 1/2 0

poniamo

e2 =

1/2−3/4

01/40

, e3 =

1/40

−1/20

1/4

, e4 =

01/40

−3/41/2

Allora e2, e3, e4 e una base di Im(T − δ). Siano E := (δ1, δ5, e2, e3, e4) eQ := (δ1, δ2, 0, 0, 0). Calcoliamo E−1 con Sage:

E−1 =

1 0.75 0.5 0.25 00 0.25 0.5 0.75 10 −1.5 0 −0.5 00 0 −2 0 00 −0.5 0 −1.5 0

Per la nota 10.50 abbiamo

57

Page 62: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

P = EQE−1 =

1 0 0.5 0.25 00 0 −0.75 0 0.250 0 0 −0.5 00 0 0.25 0 −0.750 1 0 0.25 0.5

1 0 0 0 00 1 0 0 00 0 0 0 00 0 0 0 00 0 0 0 0

1 0.75 0.5 0.25 00 0.25 0.5 0.75 10 −1.5 0 −0.5 00 0 −2 0 00 −0.5 0 −1.5 0

=

1 0 0 0 00 0 0 0 00 0 0 0 00 0 0 0 00 1 0 0 0

1 0.75 0.5 0.25 00 0.25 0.5 0.75 10 −1.5 0 −0.5 00 0 −2 0 00 −0.5 0 −1.5 0

=

1 0.75 0.5 0.25 00 0 0 0 00 0 0 0 00 0 0 0 00 0.25 0.5 0.75 0

58

Page 63: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

II. MATRICI NON NEGATIVE

11. Sistemi dinamici stocastici finiti

Definizione 11.1. Un sistema dinamico stocastico finito (SDSF) e unatripla (S,F, ©

j∈S

rj) = (S,F,©jrj) con le seguenti componenti:

(1) S = 1, . . . , q con q ∈ N + 1.

(2) F e un sottoinsieme non vuoto di SS , cioe un insieme non vuotodi applicazioni S −→ S.

(3) Per ogni j ∈ S e dato un vettore stocastico rj ∈ [0, 1]F .

Gli elementi di S si chiamano stati del sistema dinamico, gli ele-menti di F applicazioni (o operatori), i vettori rj sono detti regole delsistema. Per i, j ∈ S poniamo Fij := f ∈ F | f(j) = i.

Definizione 11.2. (S,F,©jrj) sia un SDSF con |S| = q. Per ogni i, j ∈ S

sia T(i)(j) :=

∑f∈Fij

rj(f). Naturalmente la somma e uguale a zero quando

Fij = ∅. Otteniamo cosı una matrice T ∈ [0, 1]qq che chiameremo lamatrice di transizione associata al SDSF dato. Siccome, come vedremonella prop. 11.3, questa matrice e stocastica, ad ogni SDSF e associatauna catena di Markov finita.

Proposizione 11.3. La matrice T definita nella def. 11.2 e stocastica.

Dimostrazione. E chiaro che T ≥ 0. Sia j ∈ S. Siccome per ogni f ∈ Fesiste esattamente un i ∈ S tale che f(j) = i abbiamo

F = F1j∪ . . . ∪Fqj . Percioq∑

i=1T

(i)(j) =

q∑i=1

∑f∈Fij

rj(f) =∑

f∈F

rj(f) = 1, utiliz-

zando l’ipotesi che il vettore rj sia stocastico.

Nota 11.4. Usiamo l’abbreviazione [i1, . . . , iq] per l’applicazionef : 1, . . . , q −→ 1, . . . , q definita da f(j) = ij .

Esempio 11.5. Siano S = 1, 2, 3, 4 ed F = f, g, h con f = [3132],g = [1324], h = [2334]. Le regole siano date dai vettori stocastici

r1 =

0.20.30.5

, r2 =

0.50.10.4

, r3 =

0.80.10.1

, r4 =

0.40.20.4

e si riferiscono all’ordine (f, g, h) su F .

Per ottenere la matrice di transizione T , costruiamo prima la matri-ce degli insiemi Fij :

F11 F12 F13 F14

F21 F22 F23 F24

F31 F32 F33 F34

F41 F42 F43 F44

=

g f ∅ ∅h ∅ g ff g, h f, h ∅∅ ∅ ∅ g, h

59

Page 64: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Percio

T =

r1(g) r2(f) 0 0r1(h) 0 r3(g) r4(f)r1(f) r2(g) + r2(h) r3(f) + r3(h) 0

0 0 0 r4(g) + r4(h)

=

0.3 0.5 0.2 00.5 0 0 0.40.2 0.1 + 0.4 0.8 + 0.1 00 0 0 0.2 + 0.4

=

0.3 0.5 0 00.5 0 0.1 0.40.2 0.5 0.9 00 0 0 0.6

Con Sage si verifica che 1 e l’unico autovalore λ di T con |λ| = 1, co-sicche dal teorema 10.34 segue che lim

n→∞T n =: P esiste. Risolvendo il

sistema Tx = x si trova Fix T = SV (v), dove v e il vettore stocasti-

co dato da v =

5/577/5745/57

0

=

0.090.1230.790

0

, per cui dal corollario 10.45

otteniamo P = (v, v, v, v) =

0.09 0.09 0.09 0.090.123 0.123 0.123 0.1230.790 0.790 0.790 0.790

0 0 0 0

.

Osservazione 11.6. La matrice di transizione di un SDSF (S,F,©jrj)

puo essere ottenuta in modo piu meccanico nella maniera seguente.

Identifichiamo ogni f ∈ F con la matrice che corrisponde all’applicazionelineare R

q −→ Rq definita da δj 7→ δf(j). Sopra a questa matrice scri-

viamo i valori rj(f) per j = 1, . . . , q. Nell’es. 11.5 otteniamo

f =

0.2 0.5 0.8 0.4

0 1 0 00 0 0 11 0 1 00 0 0 0

, g =

0.3 0.1 0.1 0.2

1 0 0 00 0 1 00 1 0 00 0 0 1

, h =

0.5 0.4 0.1 0.4

0 0 0 01 0 0 00 1 1 00 0 0 1

Adesso moltiplichiamo ogni colonna con il valore soprastante; la som-

60

Page 65: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

ma delle matrici che cosı si ottengono e uguale a T :

T =

0 0.5 0 00 0 0 0.4

0.2 0 0.8 00 0 0 0

+

0.3 0 0 00 0 0.1 00 0.1 0 00 0 0 0.2

+

0 0 0 00.5 0 0 00 0.4 0.1 00 0 0 0.4

=

0.3 0.5 0 00.5 0 0.1 0.40.2 0.5 0.9 00 0 0 0.6

Esempio 11.7. La matrice di transizione dell’es. 11.5 si puo ottenereanche nel seguente modo:

δ1 7→ 0.2f(δ1) + 0.3g(δ1) + 0.5h(δ1) = 0.2δ3 + 0.3δ1 + 0.5δ2 =

0.30.50.20

δ2 7→ 0.5f(δ2) + 0.1g(δ2) + 0.4h(δ2) = 0.5δ1 + 0.1δ3 + 0.4δ3 =

0.50

0.50

δ3 7→ 0.8f(δ3) + 0.1g(δ3) + 0.1h(δ3) = 0.8δ3 + 0.1δ2 + 0.1δ3 =

00.10.90

δ4 7→ 0.4f(δ4) + 0.2g(δ4) + 0.4h(δ4) = 0.4δ2 + 0.2δ4 + 0.4δ4 =

00.40

0.6

Nota 11.8. Nella modellazione, ad esempio tramite reti di Petri (cfr.Leardini), di sistemi biochimici o metabolici si considerano spesso si-stemi della forma (P,K,F ), dove P (insieme delle posizioni) e K (in-sieme dei valori) sono insiemi finiti ed F e un insieme non vuoto diapplicazioni KP −→ KP . Possiamo allora definire l’insieme degli statiS := KP . Nella simulazione del sistema e naturale associare ad ognistato j un vettore stocastico rj ∈ [0, 1]F , cosicche ci troviamo nella si-tuazione della def. 11.1.

Nota 11.9. Sia dato un SDSF (S,F,©jrj). Assumiamo che esso corris-

ponda al comportamento di un insieme di cellule che possono passareda uno stato all’altro tramite i passaggi corrispondenti alle transizionif ∈ F . Supponiamo inoltre che il raggiungimento dello stato j inducauna proliferazione (o diminuzione) della popolazione in quello stato di

61

Page 66: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

un fattore λj prima che venga effettuata un’altra transizione. Alloraper descrivere la dinamica del sistema dobbiamo sostituire la matriceT della def. 11.2 con la matrice TD, dove D e una matrice diagonale

della forma D =

λ1 0. . .

0 λq

, per cui TD = (λ1T(1), . . . , λqT(q)).

Questa matrice e non negativa ed evidentemente ogni matrice non ne-gativa A puo essere ottenuta in questo modo da una matrice stocasti-ca, di cui la j-esima colonna e univocamente determinata se A(j) 6= 0.

62

Page 67: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

12. Una stima per il raggio spettrale

Situazione 12.1. Siano q ∈ N + 1 e A ∈ Rqq.

Scriviamo∑i

invece diq∑

i=1e min

i. . . invece di min. . . | i = 1, . . . , q.

Definizione 12.2. Per B ∈ Rqq scriviamo A > B se A

(i)(j) > B

(i)(j) per ogni

i, j. A si dice positiva se A(i)(j) > 0 per ogni i, j.

Similmente, per v,w ∈ Rq scriviamo v ≥ w se v(i) ≥ w(i) per ogni i e

v > w se v(i) > w(i) per ogni i. Il vettore v si dice non negativo se v ≥ 0e v positivo se v > 0.Matrici non negative sono state definite nella def. 10.22.

Definizione 12.3. Sia 1 ≤ k1 < . . . < kr ≤ q. Denotiamo allora conA[k1, . . . , kr] la matrice quadratica che si ottiene da A togliendo tutte lerighe A(i) e tutte le colonne A(j) per le quali i risp. j non appartengonoa k1, . . . , kr. Ogni matrice che si ottiene in questo modo si chiamauna sottomatrice principale di ordine r di A.

Esempio 12.4. Sia A :=

2 5 8 1 63 9 2 7 41 4 6 2 35 1 8 9 26 8 2 1 4

.

Allora A[1, 3, 4] =

2 8 11 6 25 8 9

.

Lemma 12.5. A sia non negativa e B una sottomatrice principale di A.

Allora ρ(B) ≤ ρ(A).

Dimostrazione. Sia B la matrice ottenuta da A sostituendo i coeffi-cienti tolti per ottenereB con coefficienti nulli. Con una matrice di per-

mutazione P si ottienePBP−1 =

(B 00 0

). Il polinomio caratteristico

di B e uguale a quello di B moltiplicato con una potenza di x, per cuiρ(B) = ρ(B). Poiche B ≤ A, per il lemma 10.23 si ha 0 ≤ ρ(B) ≤ ρ(A).

Osservazione 12.6. Nell’esempio 12.4 abbiamoB =

2 0 8 1 00 0 0 0 01 0 6 2 05 0 8 9 00 0 0 0 0

.

Con

P =

1 0 0 0 00 0 1 0 00 0 0 1 00 0 0 0 10 1 0 0 0

63

Page 68: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

abbiamo allora

PB =

2 0 8 1 01 0 6 2 05 0 8 9 00 0 0 0 00 0 0 0 0

, P−1 = P t =

1 0 0 0 00 0 0 0 10 1 0 0 00 0 1 0 00 0 0 1 0

PBP−1 =

2 8 1 0 01 6 2 0 05 8 9 0 00 0 0 0 00 0 0 0 0

Corollario 12.7. A sia non negativa. Allora ρ(A) ≥ A(i)(i) per ogni i.

Osservazione 12.8. A sia non negativa.

(1) Se le somme di colonna di A sono tutte uguali, alloraρ(A) = ‖A‖1.

(2) Se le somme di riga diA sono tutte uguali, allora ρ(A) = ‖(At)‖1.

Dimostrazione. (1) L’enunciato e banale per A = 0. Sia A 6= 0 ed s il

valore comune delle somme di colonna. Allora s 6= 0 e la matrice1

sA e

stocastica. Per il teorema 10.29 si ha ρ(1

sA) = 1 e quindi ρ(A) = s =

‖A‖1.

(2) Segue dal punto (1) considerando la matrice trasposta At, utiliz-zando il fatto che ρ(At) = ρ(A).

Definizione 12.9. A sia non negativa. Allora poniamo

maxsdc(A) := maxj

‖A(j)‖1 = ‖A‖1

maxsdr(A) := maxi

‖A(i)‖1 = ‖At‖1

minsdc(A) := minj

‖A(j)‖1

minsdr(A) := mini

‖A(i)‖1

Osservazione 12.10. A sia non negativa ed m := minsdc(A).

Definiamo la matrice B ∈ Rqq ponendo B

(i)(j) := m

A(i)(j)

‖A(j)‖1.

Allora 0 ≤ B ≤ A e le somme di colonna di B sono tutte uguali ad m.Per l’oss. 12.8 ρ(B) = m.

Dimostrazione. (1) E chiaro che B ≥ 0.

(2) Siccome per definizione m ≤ ‖A(j)‖1, abbiamo B(i)(j) ≤ A

(i)(j) per

ogni i, j.

64

Page 69: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

3) Infine per ogni j abbiamo∑i

B(i)(j) = m

∑i

A(i)(j)

‖A(j)‖1= m

‖A(j)‖1

‖A(j)‖1= m.

Proposizione 12.11. A sia non negativa. Allora:

(1) minsdc(A) ≤ ρ(A) ≤ maxsdc(A).

(2) minsdr(A) ≤ ρ(A) ≤ maxsdr(A).

Dimostrazione. (1) Sappiamo dalla prop. 10.28 cheρ(A) ≤ ‖A‖1 = maxsdc(A). Sia m := minsdc(A). Per l’oss. 12.10 pos-siamo trovare una matrice B con 0 ≤ B ≤ A e ρ(B) = m. Usando illemma 10.23 abbiamo m ≤ ρ(A).

(2) Si ottiene dal punto (1) considerando la matrice trasposta At.

Esempio 12.12. Le somme di colonna della matrice A dell’esempio12.4 sono 17, 27, 26, 20, 19, le somme di riga 22, 25, 16, 25, 21. Dallaprop. 12.11 otteniamo le stime

17 ≤ ρ(A) ≤ 27 e 16 ≤ ρ(A) ≤ 25,

percio 17 ≤ ρ(A) ≤ 25.

Con Sage troviamo che gli autovalori di A, arrotondati a due cifredecimali, sono −2.67, 2.67, 21.80, 3.99 ± 4.16i, per cui ρ(A) = 21.80.

Corollario 12.13. A sia non negativa e tutte le colonne di A oppure

tutte le righe di A non nulle. Allora ρ(A) > 0. In particolare si ha che

ρ(A) > 0 se A > 0.

Osservazione 12.14. A sia non negativa. Le disuguaglianze dellaprop. 12.11 possono essere riscritte in modo piu esplicito:

(1) minj

∑i

A(i)(j) ≤ ρ(A) ≤ max

j

∑i

A(i)(j).

(2) mini

∑j

A(i)j) ≤ ρ(A) ≤ max

i

∑j

A(i)(j).

Osservazione 12.15. Siano ε1, . . . , εq 6= 0 e D :=

ε1 0. . .

0 εq

.

Allora (D−1AD)(i)(j) =

εjεiA

(i)(j).

Dimostrazione. Infatti AD si ottiene da A moltiplicando la j-esimacolonna con εj, e D−1AD da AD moltiplicando la i-esima riga con 1/εi.

Corollario 12.16. A sia non negativa ed ε1, . . . , εq > 0. Allora:

(1) minj

1

εj

i

A(i)(j)εi ≤ ρ(A) ≤ max

j

1

εj

i

A(i)(j)εi.

(2) mini

1

εj

j

A(i)(j)εi ≤ ρ(A) ≤ max

i

1

εj

j

A(i)(j)εi.

65

Page 70: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. Sia D :=

ε1 0. . .

0 εq

.

Le matrici DAD−1 e D−1AD sono anch’esse non negative e possie-dono lo stesso raggio spettrale di A.

Sostituendo nel punto (1) dell’oss. 12.14 A con DAD−1 e nel punto(2) A con D−1AD, otteniamo direttamente l’enunciato, tenendo contodell’oss. 12.15.

Lemma 12.17. A sia non negativa e v ∈ Rq con v > 0. Siano α, β ∈ R

con α, β > 0. Allora:

(1) αv ≤ Av =⇒ α ≤ ρ(A).

(2) αv < Av =⇒ α < ρ(A).

(3) Av ≤ βv =⇒ ρ(A) ≤ β.

(4) Av < βv =⇒ ρ(A) < β.

Dimostrazione. (1) αv ≤ Av significa αv(i) ≤ A(i)v =∑j

A(i)(j)v

(j) per

ogni i, ovvero α ≤ mini

∑j

A(i)(j)

v(j)

v(i)

12.16≤ ρ(A).

(2)-(4) Si ottengono nello stesso modo.

Proposizione 12.18. A sia non negativa e λ un autovalore di A per il

quale esiste un autovettore positivo. Allora ρ(A) = λ.

Dimostrazione. Sia v ∈ Rq con v > 0 ed Av = λv. Cio implica in

particolare A(1)v = λv(1), per cui λ =1

v(1)A(1)v ≥ 0. Siccome banal-

mente λv ≤ Av ≤ λv, dal lemma 12.17 otteniamo λ ≤ ρ(A) ≤ λ, quindiρ(A) = λ.

66

Page 71: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

13. Il teorema di Perron

Situazione 13.1. Siano q ∈ N + 1 e A ∈ Rqq. Scriviamo

∑i

invece diq∑

i=1.

Definizione 13.2. Per v =

v(1)

...

v(q)

∈ C

q poniamo [v] :=

|v(1)|...

|v(q)|

.

Definizione 13.3. Denotiamo con M(A) l’insieme degli autovalori diA di modulo massimo, cioe l’insieme degli autovalori λ di A per i quali|λ| = ρ(A). Vogliamo adesso dimostrare che, se A e positiva, alloraM(A) = ρ(A).

Osservazione 13.4. A sia positiva ed u ∈ Rq con u 6= 0 e u ≥ 0. Allora

Au > 0.

Osservazione 13.5. A sia non negativa e v ∈ Cq. Allora [Av] ≤ A[v].

Dimostrazione. Usando la disuguaglianza triangolare e l’ipotesiA ≥ 0, per ogni i abbiamo

[Av](i) = |A(i)v| = |∑

j

A(i)(j)v

(j)| ≤∑

j

A(i)(j)|v(j)| = (A[v])(i)

Lemma 13.6. A sia positiva, λ ∈ M(A) e v ∈ Cq un autovettore di A

rispetto a λ. Allora:

(1) A[v] = ρ(A)[v] = [Av].

(2) [v] > 0 e quindi i coefficienti di v sono tutti non nulli.

Dimostrazione. (1) Siccome v 6= 0 ed A e positiva, l’oss. 13.4 implicaA[v] > 0. Sia x := A[v] − ρ(A)[v] = A[v] − |λ|v. Dobbiamo dimostrareche x = 0.

Abbiamo ρ(A)[v] = |λ|[v] = [λv] = [Av] ≤ A[v] per l’oss. 13.5, per cuiρ(A)[v] = [Av] ed x ≥ 0.

Assumiamo adesso, per assurdo, che x 6= 0. Allora per l’oss. 13.4Ax > 0, e cio significa ρ(A)A[v] < AA[v]. Pero A[v] > 0, cosicche illemma 12.17 implica ρ(A) < ρ(A), una contraddizione.

(2) Dal cor. 12.13 sappiamo che ρ(A) > 0. Percio dal punto (1) otte-

niamo [v] =1

ρ(A)[Av] > 0.

Corollario 13.7. A sia positiva. Allora ρ(A) e un autovalore di A e

possiede un autovettore positivo.

Proposizione 13.8. A sia positiva e v,w due autovettori di A rispettoall’autovalore ρ(A). Allora esiste t ∈ C tale che v = tw.

Dimostrazione. Sia ad esempio w(1) 6= 0. Allora con t :=v(1)

w(1)formia-

mo il vettore u := v − tw. Dimostriamo che u = 0.

67

Page 72: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Se cosı non fosse, u sarebbe ancora un autovettore di A rispetto aρ(A) e [u] > 0 per il lemma 13.6. Pero u(1) = 0 per la definizione di t.

Corollario 13.9. A sia positiva e v,w due autovettori non negativi di

A rispetto all’autovalore ρ(A). Allora esiste t > 0 tale che v = tw.

Osservazione 13.10. A sia positiva. La prop. 13.8 afferma che l’autovaloreρ(A) possiede molteplicita geometrica 1. Dimostreremo fra poco cheanche la molteplicita algebrica di ρ(A) e uguale a 1.

Definizione 13.11. A sia positiva. Dai corollari 13.7 e 13.9 segue cheA possiede un unico autovettore positivo e stocastico rispetto all’autovaloreρ(A).

Questo autovettore si chiama il vettore di Perron di A.

Proposizione 13.12. A sia positiva. Allora ogni autovettore non ne-gativo di A e un multiplo (reale positivo) del vettore di Perron di A e

quindi in particolare autovettore rispetto a ρ(A).

Dimostrazione. Siano v ∈ Rq \ 0, v ≥ 0 e λ ∈ C tali che Av = λv. Per

il corollario 13.9 e sufficiente dimostrare che λ = ρ(A).

La matrice trasposta At e anch’essa positiva e possiede lo stessoraggio spettrale di A. Per il cor. 13.7 esiste un vettore positivo u taleche Atu = ρ(A)u. Abbiamo allora

ρ(A)‖u, v‖ = ‖ρ(A)u, v‖ = ‖Atu, v‖ = ‖u,Av‖ = ‖u, λv‖ = λ‖u, v‖

Le ipotesi u > 0, v ≥ 0 e u 6= 0 implicano adesso che ‖u, v‖ > 0, e da ciosegue ρ(A) = λ.

Osservazione 13.13. Siano m,n ∈ N + 1 e z1, . . . , zm ∈ Rn tali che

|z1 + . . . + zm| = |z1| + . . . + |zm|. Allora i vettori z1, . . . , zm si trovanotutti su uno stesso raggio passante per l’origine, esistono cioe u ∈ R

n et1, . . . , tm ∈ [0,∞) tali che z1 = t1u, . . . , zm = tmu. Per n = 2 cio significache esiste α ∈ R tale che z1 = eiα|z1|, . . . , zm = eiα|zm|.

Dimostrazione. Il casom = 2 si trova ad esempio in Beckenbach/Bell-man, pag, 70, o Collatz, pag. 28. Nel caso generale l’ipotesi implica

|z1 + . . . + zm−1| + |zm| ≤ |z1| + . . .+ |zm−1| + |zm| = |z1 + . . . + zm|≤ |z1 + . . .+ zm−1| + |zm|

per cui |z1|+ . . .+ |zm−1| = |z1 + . . .+ zm−1| e si conclude per induzione.

Lemma 13.14. A sia positiva, λ ∈ M(A) e v ∈ Cq un autovettore di A

rispetto a λ. Allora esiste α ∈ R tale che v = eiα[v].

Dimostrazione. Per il lemma 13.6 abbiamo [Av] = A[v]. Quindi inparticolare [Av](1) = (A[v])(1) e cio significa

∑j

∣∣∣A(1)(j)v

(j)∣∣∣ =

∑j

A(1)(j)|v(j)| =

∣∣∣∣∣∑j

A(1)(j)v

(j)

∣∣∣∣∣

68

Page 73: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

e per l’oss. 13.13 esiste α ∈ R tale cheA(1)(j)v

(j) = eiα|A(1)(j)v

(j)| = eiαA(1)(j)|v(j)|

per ogni j. Siccome per ipotesi A(1)(j) > 0, vediamo che v(j) = eiα|v(j)| per

ogni j e quindi v = eiα[v].

Proposizione 13.15. A sia positiva. Allora M(A) = ρ(A).

Dimostrazione. Per il cor. 13.7 abbiamo ρ(A) ∈ M(A).

Sia λ ∈ M(A) e v un autovettore rispetto a λ. Per il lemma 13.14esiste α ∈ R con v = eiα[v], per cui

λv = Av = eiα[Av] = eiαρ(A)[v] = eiαρ(A)e−iαv = ρ(A)v

Siccome v 6= 0, cio implica λ = ρ(A).

Osservazione 13.16. A sia non negativa. Allora ρ(A) e un autovaloredi A. A possiede un autovettore non negativo rispetto a ρ(A).

Dimostrazione. Ponendo (An)(i)(j) := A

(i)(j) +1/n per n ∈ N+1, troviamo

una successione ©nAn di matrici positive che converge ad A. Per ogni

n sia vn il vettore di Perron di An. Siccome autovalori e autovettori diuna matrice dipendono in modo continuo dai suoi coefficienti,λ := lim

n→∞ρ(An) e un autovalore di A e lim

n→∞vn =: v esiste ed e ancora

un autovettore ≥ 0 di A rispetto a λ (questo limite e non nullo percheogni |vn| = 1). Siccome gli autovalori di A si ottengono come limitidegli autovalori degli An, per ogni n maggiorati da ρ(An), si deve avereλ ≥ ρ(A) e quindi λ = ρ(A).

Lemma 13.17. v ∈ Cq sia un vettore fisso di A, w ∈ C

q un vettore fisso

di At. Assumiamo inoltre che wtv = 1 e poniamo P := vwt. Allora:

(1) PA = AP = P = P 2.

(2) Pv = v.

v e quindi un vettore non nullo fisso comune di A e P .

Dimostrazione. (1) Per ipotesi Atw = w e quindi wt = wtA. Abbiamopercio:

PA = vwtA = vwt = P .

AP = Avwt = vwt = P .

P 2 = vwtvwt = vwt = P .

(2) Pv = vwtv = v.

Infine v 6= 0 perche wtv = 1.

Lemma 13.18. Sia P ∈ Cqq tale che PA = AP = P = P 2. Allora:

(1) P (A− P ) = 0.

(2) An = P + (A− P )n per ogni n ≥ 1.

(3) Se λ e autovalore 6= 0 di A− P , allora ogni autovettore di A− Prispetto a λ e anche autovettore di A rispetto a λ.

69

Page 74: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Il punto (3) implica in particolare che ogni autovalore 6= 0 di A−P e

anche autovalore di A.

Dimostrazione. (1) P (A− P ) = PA− P 2 = 0.

(2) Induzione su n.

n = 1: A = P + (A− P ).

n −→ n+ 1:

An+1 = AAn ind= A(P + (A− P )n) = AP +A(A− P )n

= P +A(A− P )n(1)= P + (A− P )(A− P )n = P + (A− P )n+1.

(3) Sia v ∈ Cq \ 0 e (A− P )v = λv. Per il punto (1) allora

λPv = P (A − P )v = 0, e siccome λ 6= 0 cio implica Pv = 0. Ma alloraλv = (A− P )v = Av.

Osservazione 13.19. Sia P ∈ Cqq tale che PA = AP = P = P 2. λ sia

un autovalore 6= 0 di molteplicita geometrica 1 di A. A e P abbiano unautovettore in comune rispetto a λ. Allora λ non e autovalore di A−P .

Dimostrazione. Siano v ∈ Cq\0 tale cheAv = λv = Pv e w ∈ C

q\0 taliche (A − P )w = λw. Per il punto (3) del lemma 13.18 abbiamo ancheAw = λw, per cui Pw = 0. Per ipotesi esiste t ∈ C tale che w = tv equindi 0 = Pw = tPv = λtv. Siccome necessariamente t 6= 0, arriviamoad una contraddizione.

Lemma 13.20. Sia P ∈ Cqq e siano soddisfatte le seguenti condizioni:

(1) PA = AP = P = P 2.

(2) A e P hanno un vettore fisso non nullo in comune.

(3) M(A) = 1.

(4) 1 abbia molteplicita geometrica 1 come autovalore di A.

Allora:

(I) ρ(A− P ) < 1.

(II) limn→∞

An = P .

Dimostrazione. (I) Il punto (3) implica che ρ(A) = 1 e ogni autovalorediverso da 1 ha modulo minore di 1. Per l’oss. 13.19 dalla condizione(4) segue invece che 1 non e autovalore di A− P .

Per il lemma 13.18 pero ogni autovalore 6= 0 di A− P e anche auto-valore di A. Cio implica ρ(A− P ) < 1.

(II) Per l’oss. 10.19 abbiamo limn→∞

(A − P )n = 0. Dal punto (2) del

lemma 13.18 otteniamo limn→∞

An = P .

Teorema 13.21. A sia positiva, v il vettore di Perron di A e w il vettore

di Perron di At. Sia P :=vwt

vtw. Allora:

(1) limn→∞

(1

ρ(A)A)n = P .

70

Page 75: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(2) P e una matrice positiva di rango 1.

Dimostrazione. Siccome i vettori v e w sono positivi, il prodotto sca-lare vtw e positivo.

(1) Sia B :=1

ρ(A)A. Allora v e un vettore fisso di B e w :=

w

vtwun

vettore fisso di Bt e si ha vtw = 1. Inoltre P = vwt. Dal lemma 13.17segue che allora PB = BP = P = P 2 e che P e B hanno in v unvettore fisso 6= 0 in comune. E chiaro che ρ(B) = 1. Per la prop. 13.15M(B) = 1.

Per l’oss. 13.10 inoltre 1 possiede molteplicita geometrica 1 come au-tovalore di B. Applicando il lemma 13.20 conB al posto di A otteniamolim

n→∞Bn = P .

(2) E chiaro che P > 0, essendo v e w vettori positivi. Ogni colonnadi P e un multiplo di v. Essendo P 6= 0, cio implica che P e di rango 1.

Corollario 13.22. A sia positiva e ρ(A) = 1. La matrice P sia costruita

come nel teorema 13.21. Allora limn→∞

An = P .

Osservazione 13.23. Sia 1 ≤ p < q. I vettori e1, . . . , ep ∈ Cq siano

ortogonali tra loro e di lunghezza 1. Allora esistono vettori ep+1, . . . , eqtali che la matrice E := (e1, . . . , eq) sia unitaria.

Dimostrazione. E una conseguenza immediata del procedimento diortogonalizzazione di Gram-Schmidt.

Teorema 13.24 (teorema di Schur). Esiste una matrice unitaria

E ∈ U(q) tale che E−1AE sia una matrice triangolare superiore.

Dimostrazione. Induzione su q.

q = 1: Banale.

q − 1 −→ q : Siano λ un autovalore di A ed e1 un autovettore di Acorrispondente a λ e di lunghezza 1. Per l’oss. 13.23 esiste una matri-ce unitaria F ∈ U(q), la cui prima colonna e e1. Siccome Ae1 = λe1,

abbiamo F−1AF =

(λ a0 B

)con a ∈ Cq−1, B ∈ C

q−1q−1.

Per ipotesi di induzione esiste una matrice unitaria G ∈ U(q − 1)tale che T := G−1BG sia triangolare superiore. Allora

E := F

(1 00 G

)∈ U(q) e la matrice

E−1AE =

(1 00 G−1

)F−1AF

(1 00 G

)

=

(1 00 G

)(λ a0 B

)(1 00 G

)=

(λ aG0 T

)

e ancora triangolare superiore.

Proposizione 13.25. A sia positiva. Allora la molteplicita algebrica

dell’autovalore ρ(A) e uguale a 1.

71

Page 76: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. ρ := ρ(A) abbia molteplicita algebrica m. Gli altriautovalori di A siano λm+1, . . . , λq. Per la prop. 13.15 |λj | < ρ per ognij. Per il teorema 13.24 esiste E ∈ U(q) tale che

A = E

ρ. . . ⋆

ρλm+1

0. . .

λq

E−1

Con la matrice P definita come nel teorema 13.21 abbiamo allora

limn→∞

E(A/ρ)nE−1 = limn→∞

1. . . ⋆

1λm+1

ρ

0. . .

λq

ρ

n

= E

1. . . ⋆

10

0. . .

0

E−1 = P

essendo |λj/ρ| < 1 per ogni j.

La matrice P ha percio rango ≥ m. Per il teorema 13.21 pero Ppossiede rango 1 e cio e possibile solo se m = 1.

Osservazione 13.26. I risultati di questo capitolo, in particolare laprop. 13.15, il teorema 13.21 e la prop. 13.25, vengono spesso raccoltisotto il nome di teorema di Perron.

72

Page 77: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

14. Matrici irriducibili

Situazione 14.1. Siano q ∈ N + 1 e A ∈ Rqq.

Con Sq denotiamo il gruppo delle permutazioni di 1, . . . , q.

Osservazione 14.2. La matrice identica mostra che i risultati del ca-pitolo precedente non rimangono validi se l’ipotesi che A sia positi-va viene sostituita con la condizione che A sia non negativa. E statoFrobenius ad individuare la classe di matrici a cui le conclusioni delteorema di Perron possono essere generalizzate, le matrici irriducibili(cfr. Salce, pag. 137).

Definizione 14.3. Un δ-sottospazio di Rq e un sottospazio vettoriale V

di Rq della forma V = SV(δi1 , . . . δik

) con k ∈ N ed i1, . . . , ik ∈ 1, . . . , q.

Definizione 14.4. La matrice A si dice riducibile, se esiste un δ-sotto-spazio A-invariante V di R

q con 0 < dimV < q.

Altrimenti A si dice irriducibile.

Osservazione 14.5. Sia E = (e1, . . . , eq) ∈ GL(q,R) una base ordinatadi R

q. Allora la matrice dell’applicazione ©xAx : R

q −→ Rq rispetto

alla base E e uguale a E−1AE.

Dimostrazione. Corso di Geometria I.

Utilizzando la notazione matriciale si puo vedere direttamente nelmodo seguente. Sia B la matrice dell’applicazione ©

xAx : R

q −→ Rq

rispetto alla base E. Per ogni j allora B(j) e uguale al vettore dellecoordinate di Aej rispetto alla base E. Cio significa AE(j) = EB(j) per

ogni j, quindi AE = EB e B = E−1AE.

Osservazione 14.6. E = (f1, . . . , fk, g1, . . . , gq−k) sia una base di Rq.

Allora sono equivalenti:

(1) Il sottospazio SV (f1, . . . , fk) e A-invariante.

(2) Esistono matrici X ∈ Rkk, Y ∈ R

kq−k, Z ∈ R

q−kq−k tali che

E−1AE =

(X Y0 Z

).

Dimostrazione. Cio e una conseguenza immediata dell’oss. 14.5.

Osservazione 14.7. Sia 1 ≤ k ≤ q. Allora sono equivalenti:

(1) Esiste un δ-sottospazio A-invariante di dimensione k di Rq.

(2) Esistono matrici X ∈ Rkk, Y ∈ R

kq−k, Z ∈ R

q−kq−k e una matrice di

permutazione P ∈ Rqq tali che P−1AP =

(X Y0 Z

).

Dimostrazione. Cio segue dall’oss. 14.6.

Corollario 14.8. Sono equivalenti:

73

Page 78: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(1) A e riducibile.

(2) Esistono k ∈ N con 0 < k < q e una matrice di

permutazione P ∈ Rqq tali che P−1AP =

(X Y0 Z

)

con X ∈ Rkk, Y ∈ R

kq−k, Z ∈ R

q−kq−k.

Definizione 14.9. Per σ ∈ Sq siano δσ := (δσ(1), . . . , δσ(q)) e

δσ := δtσ = δ−1

σ . Abbiamo quindi (δσ)(i)(j) = δi

σ(j) e

(δσ)(i)(j) = (δσ)

(i)(j) = δj

σ(i) = δσ(i)j per ogni i, j.

Osservazione 14.10. Siano σ ∈ Sq, v ∈ Rq, f ∈ Rq, A ∈ R

qq. Allora

δσv =

vσ(1)

...

vσ(q)

fδσ =(fσ(1) . . . fσ(q)

)

δσA =

Aσ(1)1 . . . A

σ(1)q

......

Aσ(q)1 . . . A

σ(q)q

Aδσ =

A1σ(1) . . . A1

σ(q)...

...Aq

σ(1) . . . Aqσ(q)

δσAδσ =

Aσ(1)σ(1) . . . A

σ(1)σ(q)

......

Aσ(q)σ(1) . . . A

σ(q)σ(q)

dove abbiamo tralasciato le parentesi tonde negli indici.

Dimostrazione. Siano i, j ∈ 1, . . . , q. Allora:

(1) (δσv)i = δσ(i)v = vσ(i).

(2) (fδσ)j = fδσ(j) = fσ(j).

(3) (δσA)ij = δσ(i)Aj = Aσ(i)j .

(4) (Aδσ)ij = Aiδσ(j) = Aiσ(j).

(5) (δσAδσ)ij = δσ(i)(Aδσ)j = δσ(i)Aσ(j) = Aσ(i)σ(j).

Osservazione 14.11. A e riducibile se e solo se A+ δ e riducibile.

Dimostrazione. A sia riducibile. Siano X,Y,Z, P come nel cor. 14.8.Allora

P−1(A+ δ)P = P−1AP + δ =

(X Y0 Z

)+ δ =

(X + δ Y

0 Z + δ

)

74

Page 79: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Le matrici X + δ e Z + δ sono ancora quadratiche. Quindi A + δ eriducibile.

Nello stesso modo si dimostra la direzione opposta.

Osservazione 14.12. A sia riducibile edm ∈ N. AlloraAm e riducibile.

Dimostrazione. Siano X,Y,Z, P come nel cor. 14.8. Allora

P−1AmP = (P−1AP )m =

(X Y0 Z

)m

=

(Xm R0 Zm

)

con R ∈ Rkq−k, per cui Am e riducibile.

Osservazione 14.13. Una matrice positiva e irriducibile.

Dimostrazione. Cio segue direttamente dal corollario 14.8.

Osservazione 14.14. Se esiste m ∈ N tale che Am > 0 oppure(A+ δ)m > 0, allora A e irriducibile.

Dimostrazione. (1) Se Am > 0, allora per l’oss. 14.13 Am e irriducibi-le. Cio implica per l’oss. 14.12 che anche A e irriducibile.

(2) Sia (A+ δ)m > 0. Allora per il punto (1) A+ δ e irriducibile el’oss. 14.11 implica che anche A e irriducibile.

Lemma 14.15. A sia non negativa ed irriducibile e v ∈ Rq un vettore

non negativo. Sia 1 ≤ k < n tale che esattamente k delle coordinate div siano positive.

Allora il vettore (A+ δ)v possiede almeno k + 1 coordinate positive.

Dimostrazione. Seguiamo Salce, pag. 138. Sia w := (A+δ)v = Av+v.

E chiaro che w(i) > 0 se v(i) > 0. w ha percio almeno k coordinatepositive. Assumiamo per assurdo che tutte le altre coordinate di wsiano nulle. Allora ogni volta che v(i) = 0 anche (Av)(i) = 0.

Sia ora σ ∈ Sq tale che le prime k componenti di u := δσv siano

positive e quindi le rimanenti nulle. u e quindi della forma u =

(u+

0

)

con u+ ∈ Rk positivo.

Per quanto osservato prima, anche le ultime q − k coordinate diδσAv = δσAδσu sono nulle.

Possiamo scrivere B := δσAδσ nella forma B =

(X YR Z

),

con X ∈ Rkk, Y ∈ R

kq−k, R ∈ R

q−kk , Z ∈ R

q−kq−k. Allora

Bu =

(X YR Z

)(u+

0

)=

(Xu+

Ru+

)=

(Xu+

0

)

Ma u+ e positivo ed R ≥ 0, e cio e possibile solo se R = 0. Cio implicache A e riducibile, in contrasto con l’ipotesi.

Proposizione 14.16. A sia non negativa. Allora sono equivalenti:

(1) A e irriducibile.

75

Page 80: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(2) (A+ δ)q−1 e positiva.

(3) Esiste m ∈ N tale che (A+ δ)m e positiva.

Dimostrazione. (1) =⇒ (2): A sia irriducibile. Sia j ∈ 1, . . . , q.Dimostriamo che la j-esima colonna ((A + δ)q−1)(j) e positiva. Questa

colonna pero e uguale a (A+δ)q−1δj e per il lemma 14.15 questo vettorepossiede q coordinate positive ed e quindi positivo.

(2) =⇒ (3): Banale.

(3) =⇒ (1): Oss. 14.14.

Esempio 14.17. Sia A =

(0 11 0

). Allora A+ δ =

(1 11 1

)e positiva

e dalla prop. 14.16 segue che A e irriducibile.

Pero Am =

(1 00 1

)se m e pari e Am =

(0 11 0

)se m e dispari, e

quindi la matrice Am non e mai positiva.

Osservazione 14.18. A e riducibile se e solo se At e riducibile.

Dimostrazione. Se A e non negativa, cio segue dalla prop. 14.16.

Il caso generale, non difficile, si trova in Huppert, pag. 353.

Osservazione 14.19. Sono equivalenti:

(1) A e riducibile.

(2) Esistono k ∈ N con 0 < k < q e una matrice di permutazione

P ∈ Rqq tale che P−1AP =

(X ′ 0Y ′ Z ′

)con X ′ ∈ R

kk, Y ′ ∈ R

q−kk ,

Z ′ ∈ Rq−kq−k.

Dimostrazione. (1) =⇒ (2): A sia riducibile. Per l’oss. 14.18 anche At

e riducibile, per cui esiste una matrice di permutazione P ∈ Rqq tale

che P−1AtP =

(X Y0 Z

)con X ∈ R

kk, Y ∈ R

kq−k, Z ∈ R

q−kq−k.

Cio implica P−1AP =

(Xt 0Y t Zt

).

(2) =⇒ (1): Per simmetria, usando ancora l’oss. 14.18.

76

Page 81: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

15. Il teorema di Frobenius

Situazione 15.1. Siano q ∈ N + 1 ed A ∈ Rqq.

Lemma 15.2.

(1) ρ(A+ δ) ≤ 1 + ρ(A).

(2) Se A e non negativa, allora ρ(A+ δ) = 1 + ρ(A).

Dimostrazione. (1) Gli autovalori di A siano λ1, . . . , λq con le rispet-tive molteplicita . Dalla forma normale di Jordan e immediato che gliautovalori di A+ δ con le rispettive molteplicita sono 1+λ1, . . . , 1+λq.Percio

ρ(A+ δ) = max|1 + λ1|, . . . , |1 + λq| ≤ max1 + |λ1|, . . . , 1 + |λq|= 1 + max|λ1|, . . . , |λq| = 1 + ρ(A)

(2) Se A e non negativa, anche A+ δ e non negativa e per l’oss. 13.161 + ρ(A) e autovalore di A+ δ. Percio 1 + ρ(A) ≤ ρ(A+ δ) e per il punto(1) cio implica 1 + ρ(A) = ρ(A+ δ).

Osservazione 15.3. Una matrice irriducibile non puo avere righe ocolonne nulle.

Dimostrazione. Supponiamo A(j) = Aδj = 0. Allora SV (δj) e unδ-sottospazio A-invariante. Quindi per definizione A e riducibile, incontrasto con l’ipotesi.

Teorema 15.4 (teorema di Frobenius). La matrice A sia non nega-tiva e irriducibile. Allora:

(1) ρ(A) e autovalore di A.

(2) ρ(A) > 0.

(3) Esiste un autovettore positivo rispetto all’autovalore ρ(A).

(4) La molteplicita algebrica dell’autovalore ρ(A) e uguale a 1.

Dimostrazione. (1) Oss. 13.16.

(2) Per l’oss. 15.3 A non possiede colonne nulle. Dal corollario 12.13segue che ρ(A) > 0.

(3) Per l’oss. 13.16 esiste un autovettore v ≥ 0 rispetto a ρ(A). Allora(A+ δ)v = Av + v = ρ(A)v + v = (1 + ρ(A))v e percio anche(A+δ)q−1v = (1+ρ(A))q−1v. Per la prop. 14.16 pero (A+δ)q−1 > 0, quin-di per l’oss. 13.4 anche (A+δ)q−1v > 0. Abbiamo cosı (1+ρ(A))q−1v > 0,e cio implica v > 0.

(4) La molteplicita algebrica di ρ(A) come autovalore di A e ugualealla molteplicita algebrica di 1 + ρ(A) come autovalore di A+ δ. Ma lamolteplicita algebrica di 1 + ρ(A) come autovalore di A+ δ e minore ouguale alla molteplicita algebrica di (1 + ρ(A))q−1 come autovalore di(A + δ)q−1, come si vede ad esempio dall’oss. 10.20. Per il lemma 15.2il raggio spettrale di A + δ e 1 + ρ(A), per cui, ancora per l’oss. 10.20,(1 + ρ(A))q−1 e il raggio spettrale di (A + δ)q−1. Quest’ultima matrice

77

Page 82: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

e pero positiva, per cui dalla prop. 13.25 vediamo che la molteplicitaalgebrica di (1 + ρ(A))q−1 come autovalore di (A+ δ)q−1 e uguale a 1.

Osservazione 15.5. Sia A :=

(0 11 0

). Questa matrice e non negati-

va ed irriducibile. Gli autovalori di A sono 1 e −1, quindiM(A) = 1,−1.

Cio mostra che la prop. 13.15 non rimane piu valida se si sostituiscel’ipotesi che A sia positiva con la condizione che A sia non negativa.

Definizione 15.6. A sia non negativa ed irriducibile. Dal teorema 15.4segue cheA possiede un unico autovettore positivo e stocastico rispettoall’autovalore ρ(A). Questo vettore si chiama il vettore di Perron di A.

Il vettore di Perron di una matrice positiva e stato introdotto nelladef. 13.11.

Proposizione 15.7. A sia non negativa ed irriducibile. Allora ogni

autovettore non negativo di A e un multiplo (reale positivo) del vettore

di Perron di A e quindi in particolare un autovettore rispetto a ρ(A).

Dimostrazione. Usando i risultati di questo capitolo, e sufficientetrascrivere la dimostrazione della prop. 13.12.

78

Page 83: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

16. Il teorema di Wielandt

Situazione 16.1. Siano q ∈ N + 1 ed A ∈ Rqq.

Definizione 16.2. Per B ∈ Cqq poniamo [B] :=

|B(1)(1) | . . . |B(1)

(q) |...

...

|B(q)(1) | . . . |B(q)

(q) |

.

La notazione analoga per vettori e stata introdotta nella def. 13.2.

Osservazione 16.3. Sia B ∈ Cqq. Allora ρ(B) ≤ ρ([B]).

Dimostrazione. Per ogni n ∈ N la disuguaglianza triangolare implica[Bn] ≤ [B]n. Dalla definizione della norma di Frobenius (introdottanella def. 10.5) segue immediatamente che‖Bn‖F = ‖[Bn]‖F ≤ ‖[B]n‖F . Utilizzando il teorema 10.21 abbiamo

ρ(B) = limn→∞

n√

‖Bn‖F ≤ limn→∞

n√

‖[B]n‖F = ρ([B])

Osservazione 16.4. Siano B ∈ Cqq e v ∈ C

q. Allora [Bv] ≤ [B][v].

Dimostrazione. Come nell’oss. 13.5 usando la disuguaglianza trian-golare per ogni i abbiamo

[Bv](i) = |Bv|(i) = |B(i)v| = |q∑

j=1B

(i)(j)v

(j)| ≤q∑

j=1|B(i)

(j)||v(j)| = ([B][v])(i)

Lemma 16.5. Sia B ∈ Cqq. Supponiamo che siano soddisfatte le se-

guenti condizioni:

(1) A e non negativa e irriducibile.

(2) [B] ≤ A.

(3) ρ(A) = ρ(B).

Sia λ ∈ M(B) e sia v ∈ Cq un autovettore di B rispetto a λ. Allora [v]

e un autovettore di A rispetto a ρ(A) e quindi positivo per 15.7. InoltreA = [B].

Dimostrazione. Poniamo ρ := ρ(A). Per ipotesi ρ coincide anche conil raggio spettrale di B. Per il teorema 15.4 ρ > 0.

Siccome λ ∈ M(B), si ha∣∣∣ρλ

∣∣∣ = 1, percio

ρ[v] = [ρv] =[ρλλv]

= [λv] = [Bv]16.4≤ [B][v] ≤ A[v] (⋆)

Per l’oss. 14.18 ancheAt e irriducibile. Per il teorema 15.4 esiste f ∈ Rq

con f > 0 e tale che fA = ρf . Cio implica fA[v] = ρf [v], ovverof(A[v] − ρ[v]) = 0.

Per (⋆) A[v] − ρ[v] ≥ 0, e siccome f > 0, dobbiamo avere A[v] = ρ[v].Dalla prop. 15.7 segue [v] > 0, mentre in (⋆) abbiamo adesso[B][v] = A[v], cioe (A− [B])[v] = 0. Per ipotesi A− [B] ≥ 0 e cio implicaA = [B].

79

Page 84: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Corollario 16.6. Sia B ∈ Rqq tale che 0 ≤ B ≤ A. A sia irriducibile e

A 6= B. Allora ρ(B) < ρ(A).

Dimostrazione. Altrimenti il lemma 16.5, essendo per ipotesiB = [B], implicherebbe A = B.

Osservazione 16.7. w ∈ Rq sia un vettore positivo e C ∈ C

qq tale che

Cw = [C]w. Allora C = [C].

Dimostrazione. Denotiamo con ReC la parte reale di C e con ImC laparte immaginaria.

(1) Le ipotesi implicano in primo luogo che

Re(Cw) = Re([C]w) = [C]w = Cw

Pero Cw = (ReC)w + i(ImC)w. Siccome w > 0, cio implica C = ReC.La matrice C e quindi reale.

(2) A questo punto pero da w > 0 e Cw = [C]w segue direttamenteC = [C].

Lemma 16.8. Sia B ∈ Cqq. [B] sia irriducibile e ρ(B) = ρ([B]). Sia

λ ∈ M(B). Allora esistono α1, . . . , αq ∈ R tali che con

D :=

eiα1 0. . .

0 eiαq

si ha D−1BD =

λ

ρ[B].

Dimostrazione. Poniamo ρ := ρ(B). Per il teorema 15.4 ρ > 0.

Sia v ∈ Cq un autovettore di B rispetto a λ. Per il lemma 16.5 (ap-

plicato ad A := [B]) abbiamo [v] > 0 e [B][v] = ρ[v]. Possiamo scriverev(k) = eiαk |v(k)|, con α1, . . . , αq ∈ R.

Con D :=

eiα1 0. . .

0 eiαq

abbiamo allora D[v] = v.

Cio implica BD[v] = Bv = λv =λ

ρρv =

λ

ρρD[v] e quindi

ρ

λD−1BD[v] = ρ[v] = [B][v]. Sia C :=

ρ

λD−1BD. Allora C[v] = [B][v].

Come nell’oss. 12.15 abbiamo C(k)(j) =

ρ

λe−iαkeiαjB

(k)(j) , e quindi

|C(k)(j) | = |B(k)

(j) | per ogni k,j, per cui [C] = [B], cosicche C[v] = [C][v].

L’oss. 17.6 implica adesso C = [C] e quindi C = [B].

Cio significaρ

λD−1BD = [B], ovvero D−1BD =

λ

ρ[B].

Definizione 16.9. Due matrici B,C ∈ Cqq si dicono simili, se esiste

E ∈ GL(n,C) tali che C = E−1BC. Scriviamo allora B ∼ C.

Osservazione 16.10. La relazione di somiglianza introdotta nella def.16.9 e una relazione di equivalenza su C

qq.

80

Page 85: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Inoltre, se B ∼ C, allora tB ∼ tC per ogni t ∈ C.

Matrici simili hanno lo stesso polinomio caratteristico.

Corollario 16.11. A sia non negativa ed irriducibile. Siano

ρ := ρ(A) e λ ∈ M(B). Allora A ∼ λ

ρA. Poiche λ ∈ M(B),

λ

ρ6= 0.

Osservazione 16.12. Siano B ∈ Cqq e t ∈ C con t 6= 0. λ sia un autova-

lore di B di molteplicita algebrica m. Allora tλ e autovalore di tB dellastessa molteplicita algebrica m.

Dimostrazione. Cio e chiaro dalla forma normale di Jordan.

Teorema 16.13 (teorema di Wielandt). A sia non negativa ed irri-

ducibile. Sia h := |M(A)|. Allora M(A) = e 2πi

hjρ(A) | j = 0, . . . , h− 1.

Ogni elemento di M(A) ha molteplicita algebrica 1 come autovalore

di A.

Dimostrazione. Poniamo di nuovo ρ := ρ(A). Dal teorema 15.4 sap-piamo che ρ > 0.

(1) Sia λ ∈ M(A). Per il cor. 16.11 A ∼ λ

ρA e dall’oss. 16.12 e dal

teorema 15.4 segue che λ =λ

ρρ e autovalore di

λ

ρA di molteplicita

algebrica 1. Pero A eλ

ρA hanno lo stesso polinomio caratteristico, di

cui λ e quindi radice semplice.

(2) Sia G := λρ

| λ ∈ M(A). Per ipotesi |G| = h ed e chiaro che

G ⊂ S1. E sufficiente dimostrare che G e sottogruppo di S1, perche cioimplica che εh = 1 per ogni ε ∈ G ed e ben noto che

ε ∈ S1 | εh = 1 = e 2πi

hj | j = 0, . . . , h− 1.

Siano λ, µ ∈ M(A). Per il cor. 16.11 abbiamo A ∼ λ

ρA e

A ∼ µ

ρA, quindi l’oss. 16.10 implicaA ∼ λ

µA. Per l’oss. 16.12 cio implica

cheλ

µρ ∈ M(A), cosicche

λ

µ∈ G.

Proposizione 16.14. A sia non negativa ed irriducibile ed h := |M(A)|.Allora lo spettro di A e invariante rispetto alla rotazione di angolo

h.

Dimostrazione. Siano ρ := ρ(A) ed ε := e2π

hi. Per il teorema 16.13 ab-

biamo λ := ερ ∈ M(A). Per il cor. 16.11 A ∼ λ

ρA = εA. Per l’oss. 16.10

A ed εA hanno lo stesso polinomio caratteristico, ma d’altra parte perl’oss. 16.12 lo spettro di εA consiste degli autovalori di A moltiplicatiper ε .

81

Page 86: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

17. Matrici primitive

Situazione 17.1. Siano q ∈ N + 1 ed A ∈ Rqq.

Definizione 17.2. A si dice primitiva, se sono soddisfatte le seguenticondizioni:

(1) A e non negativa e irriducibile.

(2) |M(A)| = 1.

Lemma 17.3. A sia non negativa e irriducibile. Sianoh := |M(A)| e ρ := ρ(A). Sia m ∈ N + 1. Allora:

(1) M(Amh) = ρmh.

(2) ρmh ha molteplicita algebrica h come autovalore di Amh.

Dimostrazione. Per il teorema 16.13 il polinomio caratteristico di A

e della forma (x− ρ)(x− e2πi

h ρ) . . . (x− e2πi

h(h−1)ρ)ψ, dove ψ e il prodotto

dei fattori (x − λ), dove i λ sono gli autovalori di A di modulo minore

di ρ. E chiaro a questo punto l’enunciato.

Proposizione 17.4. A sia non negativa. Se esiste m ∈ N tale che

Am > 0, allora A e primitiva.

Dimostrazione. Per l’oss. 14.14 A e irriducibile. Siano h := |M(A)|e ρ := ρ(A). Il caso m = 0 e banale (e implica q = 1). Sia quindim ≥ 1. Allora anche mh ≥ 1, e chiaramente Amh > 0. Per il lemma17.3 M(Amh) = ρmh e ρmh possiede molteplicita algebrica h comeautovalore di Amh. Per la prop. 13.25 questa molteplicita algebrica epero uguale a 1.

Teorema 17.5. A sia primitiva e ρ := ρ(A). Usando l’oss. 14.18 e il

teorema 15.4 possiamo trovare vettori positivi v,w ∈ Rq tali che

Av = ρv e Atw = ρw. Possiamo assumere che wtv = 1.

Allora limn→∞

(1

ρA)n = vwt.

Dimostrazione. Possiamo ricalcare la dimostrazione del teorema 13.21.Si osservi che ρ > 0 per il teorema 15.4.

Siano B :=1

ρA e P := vwt. Allora v e un vettore fisso di B e w un

vettore fisso di Bt. Dal lemma 13.17 segue che PB = BP = P 2 = P eche P e B hanno in v un vettore fisso positivo in comune. E chiaro cheρ(B) = 1. Naturalmente ancheB e primitiva e quindi M(B) = 1. Peril teorema 16.13 l’autovalore 1 di B possiede molteplicita algebrica equindi anche geometrica 1. Applicando il lemma 13.20 con B al postodi A otteniamo lim

n→∞Bn = P .

Teorema 17.6. A sia non negativa. Allora sono equivalenti:

(1) A e primitiva.

(2) Esiste m ∈ N tale che Am > 0.

82

Page 87: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Dimostrazione. (1) =⇒ (2): Con la notazione del teorema 17.5 ab-

biamo limn→∞

(1

ρA)n = vwt. I vettori v e w sono positivi, per cui anche la

matrice vwt e positiva. Cio implica che deve esistere m ∈ N tale che

(1

ρA)m > 0, e quindi anche Am > 0.

(2) =⇒ (1): Prop. 17.4.

Corollario 17.7. A sia non negativa. Se esiste n ∈ N tale che An siaprimitiva, allora anche A e primitiva.

Dimostrazione. Per il teorema 17.6 esiste m ∈ N tale che Amn > 0.Ma sempre per il teorema 17.6 segue che A e primitiva.

Corollario 17.8. A sia non negativa ed m ∈ N tale che Am > 0. AlloraAn > 0 per ogni n ≥ m.

Dimostrazione. Per l’oss. 14.14 A e irriducibile e quindi non puo ave-re righe nulle per l’oss. 15.3. Cio implica Am+1 > 0. Ripetendo il ragio-namento si trova Am+2 > 0, ecc.

Corollario 17.9. A sia primitiva. Allora An e primitiva per ogni

n ∈ N + 1.

Proposizione 17.10. A sia non negativa ed irriducibile. Se esiste un

indice i tale che A(i)(j) > 0, allora A e primitiva.

Dimostrazione. Per la dimostrazione (non troppo difficile) di questorisultato rimandiamo a Salce, pag. 149.

Proposizione 17.11. A sia primitiva. Allora Aq2−2q+2 > 0.

Dimostrazione. Per la dimostrazione, piuttosto complicata, riman-diamo a Horn/Johnson, pag. 520, Gantmacher, pagg. 424-425, oppureCull/Flahive/Robson, pagg. 198-199.

Teorema 17.12. A sia primitiva e ρ := ρ(A). x sia un vettore non nega-

tivo arbitrario, ma non nullo. Allora il limite limn→∞

ρ−nAnx =: u esiste

ed e un multiplo positivo del vettore di Perron di A.

Se scegliamo v e w come nel teorema 17.5, abbiamo:

(1) u = vwtx = wtx · v.

(2) limn→∞

(Anx)(i)

(Anx)(k)=v(i)

v(k)per ogni i, k.

Questo limite quindi non dipende da x.

(3) Se y e un altro vettore non negativo e non nullo, allora

limn→∞

(Anx)(i)

(Any)(i)=wtx

wtyper ogni i.

Questo limite quindi non dipende da i.

(4) Abbiamo percio

limn→∞

ρ−nAnx = αv

83

Page 88: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

limn→∞

ρ−nAny = βv

con α, β > 0 eα

β=wtx

wty.

Dimostrazione. (1) Per il teorema 17.5 esiste il limiteu := lim

n→∞ρ−nAnx = vwtx. Notiamo che u > 0.

Allora Au = Avwtx = ρvwtx = ρu. Per la prop. 15.7 u e un multiplopositivo del vettore di Perron di A.

(2) Osserviamo che Anx > 0 per n >> 0. Per il punto (1) abbiamo

limn→∞

(Anx)(i)

(Anx)(k)= lim

n→∞

(ρ−nAnx)(i)

(ρ−nAnx)(k)=

(vwtx)(i)

(vwtx)(k)=v(i)wtx

v(k)wtx=v(i)

v(k)

(3) Di nuovo Any > 0 per ogni n >> 0. Per il punto (1) abbiamo

limn→∞

(Anx)(i)

(Any)(i)= lim

n→∞

(ρ−nAnx)(i)

(ρ−nAny)(i)=

(vwtx)(i)

(vwty)(i)=v(i)wtx

v(i)wty=wtx

wty

(4) Chiaro.

Nota 17.13. A sia primitiva. Se A descrive la crescita di una popola-zione suddivisa in sottopopolazioni 1, . . . , q, i punti (2) e (3) del teore-ma 17.12 diventano molto importanti. Il punto (2) afferma infatti che irapporti tra le sottopopolazioni convergono a valori che non dipendonodal vettore di partenza x (che naturalmente deve essere non negativoe non nullo). Il punto (3) descrive, per ogni sottopopolazione i, il modoin cui il numero degli individui appartenenti ad i dipende dai vettoridi partenza.

Esempio 17.14. Sia A =

4 1 0 11 5 0 00 1 2 10 0 2 5

.

Allora A3 =

77 64 22 6462 139 2 1411 42 26 422 24 82 149

.

La matrice A e quindi primitiva.

Il polinomio minimale e (x−6)(x−5)(x−λ)(x−µ), con λ, µ =5 ±

√5

2.

Percio ρ(A) = 6. Calcolando gli autovettori diA eAt rispetto all’autovalore6 vediamo che nei teoremi 17.5 e 17.12 possiamo porre

v =

2212

, w =

1

11

1212

. Percio

limn→∞

6−nAn =1

11

2 4 2 42 4 2 41 2 1 21 4 2 4

0.18 0.36 0.18 0.360.18 0.36 0.18 0.360.09 0.18 0.09 0.180.18 0.36 0.18 0.36

84

Page 89: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Infatti

6−10A10 ≃

0.19 0.36 0.18 0.360.24 0.43 0.12 0.270.09 0.18 0.09 0.180.12 0.30 0.25 0.46

6−20A20 ≃

0.18 0.36 0.18 0.360.19 0.37 0.17 0.350.09 0.18 0.09 0.180.17 0.35 0.19 0.38

Se x ed y sono vettori non negativi e non nulli, allora si avra

limn→∞

(Anx)(i)

(Any)(i)=x(1) + 2x(2) + x(3) + 2x(4)

y(1) + 2y(2) + y(3) + 2y(4)indipendentemente da i.

Nota 17.15. A sia primitiva e ρ := ρ(A). Se nella notazione della si-tuazione 9.1 poniamo λ1 = ρ, il cor. 9.10 diventa

An = ρnH10(A) +s∑

k=2

mk−1∑j=0

n[j]λn−jk Hkj(A)

Siccome ρ > |λk| per k = 2, . . . , s troviamo che limn→∞

ρ−nAn = H10(A).

Esempio 17.16. Sia A la matrice dell’esempio 17.14. AlloraH10 = H[6 : (1), 5 : (0), λ : (0), µ : (0)].

CalcolandoH10 (in questo caso un polinomio di interpolazione di La-grange) troviamo H10 ≃ 0.09091x3 − 0.0909x2 + 2.72727x − 2.2727 e

H(A) ≃

0.18 0.36 0.18 0.360.18 0.36 0.18 0.360.09 0.18 0.09 0.180.18 0.36 0.18 0.36

in accordo con il risultato dell’esempio 17.14.

Il metodo del teorema 17.5 e comunque piu semplice e numerica-mente piu stabile.

Osservazione 17.17. Nella teoria delle popolazioni e nelle ipotesi del

teorema 17.5 il vettore stocasticov

‖v‖1(il vettore di Perron di A) e

detto anche vettore strutturale della popolazione, il vettore stocasticow

‖w‖1(il vettore di Perron di At) si chiama il vettore riproduttivo della

popolazione.

Definizione 17.18. A sia non negativa. La matrice di incidenza di Ae la matrice 〈A〉 che si ottiene da A sostituendo ogni coefficiente nonnullo con 1.

85

Page 90: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Se B e un’altra matrice non negativa appartenente a Rqq, scriviamo

A ≈ B : ⇐⇒ 〈A〉 = 〈B〉. E chiaro che in questo modo otteniamo unarelazione di equivalenza sull’insieme delle matrici non negative in R

qq.

Osservazione 17.19. Le matrici A,B,C,D ∈ Rqq siano non negative e

tali che A ≈ B, C ≈ D. Allora AC ≈ BD.

Dimostrazione. Tutti i coefficienti che appaiono inq∑

k=1

A(i)(k)C

(k)(j) sono

≥ 0, percio affinche (AC)(i)(j) sia positivo e necessario e sufficiente che

esista almeno un k tale che A(i)(k) e C

(k)(j) siano entrambi positivi. Per

ipotesi cio accade se e solo se B(i)(k) e D

(k)(j) sono entrambi positivi.

Osservazione 17.20. A sia non negativa. Dall’oss. 17.19 vediamo cheper verificare che Am > 0, e sufficiente che sia positiva la matrice chesi ottiene dal seguente algoritmo:

(1) P = δ; X = 〈A〉(2) se m == 0: termina

(3) se m e pari: X =⟨X2⟩;m = m/2

(4) altrimenti: P = 〈XP 〉 ;m = m− 1

(5) riprendi da (2)

Corollario 17.21. A sia non negativa. Allora

(1) A e irriducibile se e solo se (〈A〉 + δ)q−1 > 0.

(2) A e primitiva se e solo se 〈A〉q2−2q+2 > 0.

Dimostrazione. Cio segue dalle prop. 14.16 e 17.11.

Nota 17.22. Daremo adesso, per q = 2 e q = 3, elenchi completi dellematrici di incidenza q×q che sono irriducibili o primitive. Usando il cor.17.21, questi elenchi possono essere utilizzati per verificare, per unaqualsiasi matrice non negativa in R

qq, se essa e irriducibile o primitiva.

(1) Per generare tutte le matrici in 0, 1qq , associamo ad ogni numero

naturale n con 0 ≤ n < 2q il vettore v della sua rappresentazionebinaria (completata a q cifre) utilizzando la funzione

def rapp2 (n,cifre=0):

if n<=1: v=[n]

else:

v=rapp2(n//2)

if n%2==0: v.append(0)

else: v.append(1)

d=cifre-len(v)

if d>0: v=[0]*d+v

return v

In Sage otteniamo poi la matrice A corrispondente a v con l’istruzioneA=matrix(q,v). La matrice corrispondente ad n e quindimatrix(q, rapp2(n,q2)) dove q2 e uguale a q2.

86

Page 91: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

(2) Per determinare se una matrice A e positiva, dobbiamo primatrasformare A in una lista di numeri con

def lista(A):

v=[]

for x in A: v.extend(x)

return v

Possiamo percio usare la funzione

def positiva(A):

for x in lista(A):

if x<=0: return 0

return 1

(3) Per verificare se la matrice A e irriducibile o primitiva, appli-chiamo il cor. 17.21:

def irriducibile(A):

q=A.ncols()

return positiva(pow(A+identity_matrix(q),q-1))

def primitiva(A):

q=A.ncols()

return positiva(pow(A,q*q-2*q+2))

(4) Otteniamo l’elenco delle matrici di incidenza primitive con

def primitive(q):

q2=q*q

return filter(primitiva,

[matrix(q, rapp2(n,q2)) for n in range(pow(2,q2))])

e l’elenco delle matrici irriducibili, ma non primitive, con

def irriducibilinonprimitive(q):

q2=q*q

return filter(lambda A:

irriducibile(A) and not primitiva (A),

[matrix(q,rapp2(n,q2)) for n in range(pow(2,q2))])

Osservazione 17.23. Sage contiene una funzione latex che forniscela rappresentazione in Latex per una matrice. Per generare il nostroelenco possiamo quindi usare la funzione

def elencolatex(u,colonne=6):

k=1

for A in u:

print ’$’,latex(A),’$’

if not k%colonne: print ’\\smallskip’; print

k+=1

87

Page 92: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Nota 17.24. Le matrici di incidenza 2 × 2 primitive sono(0 11 1

) (1 11 0

) (1 11 1

)

Solo la matrice

(0 11 0

)e irriducibile, ma non primitiva.

Otteniamo queste matrici con le istruzioni

elencolatex(primitive(q))

elencolatex(irriducibilinonprimitive(q))

Nota 17.25. Delle 29 = 512 matrici di incidenza 3 × 3 le seguenti 139sono primitive:

0 0 10 0 11 1 1

0 0 10 1 11 1 0

0 0 10 1 11 1 1

0 0 11 0 00 1 1

0 0 11 0 01 1 0

0 0 11 0 01 1 1

0 0 11 0 10 1 0

0 0 11 0 10 1 1

0 0 11 0 11 1 0

0 0 11 0 11 1 1

0 0 11 1 00 1 0

0 0 11 1 00 1 1

0 0 11 1 01 1 0

0 0 11 1 01 1 1

0 0 11 1 10 1 0

0 0 11 1 10 1 1

0 0 11 1 11 1 0

0 0 11 1 11 1 1

0 1 00 0 11 0 1

0 1 00 0 11 1 0

0 1 00 0 11 1 1

0 1 00 1 11 0 0

0 1 00 1 11 0 1

0 1 00 1 11 1 0

0 1 00 1 11 1 1

0 1 01 0 10 1 1

0 1 01 0 11 0 0

0 1 01 0 11 0 1

0 1 01 0 11 1 0

0 1 01 0 11 1 1

0 1 01 1 10 1 0

0 1 01 1 10 1 1

0 1 01 1 11 0 0

0 1 01 1 11 0 1

0 1 01 1 11 1 0

0 1 01 1 11 1 1

0 1 10 0 11 0 0

0 1 10 0 11 0 1

0 1 10 0 11 1 0

0 1 10 0 11 1 1

0 1 10 1 11 0 0

0 1 10 1 11 0 1

0 1 10 1 11 1 0

0 1 10 1 11 1 1

0 1 11 0 00 1 0

0 1 11 0 00 1 1

0 1 11 0 01 0 1

0 1 11 0 01 1 0

0 1 11 0 01 1 1

0 1 11 0 10 1 0

0 1 11 0 10 1 1

0 1 11 0 11 0 0

0 1 11 0 11 0 1

0 1 11 0 11 1 0

0 1 11 0 11 1 1

0 1 11 1 00 1 0

0 1 11 1 00 1 1

0 1 11 1 01 0 0

0 1 11 1 01 0 1

0 1 11 1 01 1 0

0 1 11 1 01 1 1

0 1 11 1 10 1 0

0 1 11 1 10 1 1

0 1 11 1 11 0 0

0 1 11 1 11 0 1

0 1 11 1 11 1 0

0 1 11 1 11 1 1

1 0 10 0 11 1 0

1 0 10 0 11 1 1

1 0 10 1 11 1 0

1 0 10 1 11 1 1

1 0 11 0 00 1 0

1 0 11 0 00 1 1

1 0 11 0 01 1 0

1 0 11 0 01 1 1

1 0 11 0 10 1 0

1 0 11 0 10 1 1

1 0 11 0 11 1 0

88

Page 93: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

1 0 11 0 11 1 1

1 0 11 1 00 1 0

1 0 11 1 00 1 1

1 0 11 1 01 1 0

1 0 11 1 01 1 1

1 0 11 1 10 1 0

1 0 11 1 10 1 1

1 0 11 1 11 1 0

1 0 11 1 11 1 1

1 1 00 0 11 0 0

1 1 00 0 11 0 1

1 1 00 0 11 1 0

1 1 00 0 11 1 1

1 1 00 1 11 0 0

1 1 00 1 11 0 1

1 1 00 1 11 1 0

1 1 00 1 11 1 1

1 1 01 0 10 1 0

1 1 01 0 10 1 1

1 1 01 0 11 0 0

1 1 01 0 11 0 1

1 1 01 0 11 1 0

1 1 01 0 11 1 1

1 1 01 1 10 1 0

1 1 01 1 10 1 1

1 1 01 1 11 0 0

1 1 01 1 11 0 1

1 1 01 1 11 1 0

1 1 01 1 11 1 1

1 1 10 0 11 0 0

1 1 10 0 11 0 1

1 1 10 0 11 1 0

1 1 10 0 11 1 1

1 1 10 1 11 0 0

1 1 10 1 11 0 1

1 1 10 1 11 1 0

1 1 10 1 11 1 1

1 1 11 0 00 1 0

1 1 11 0 00 1 1

1 1 11 0 01 0 0

1 1 11 0 01 0 1

1 1 11 0 01 1 0

1 1 11 0 01 1 1

1 1 11 0 10 1 0

1 1 11 0 10 1 1

1 1 11 0 11 0 0

1 1 11 0 11 0 1

1 1 11 0 11 1 0

1 1 11 0 11 1 1

1 1 11 1 00 1 0

1 1 11 1 00 1 1

1 1 11 1 01 0 0

1 1 11 1 01 0 1

1 1 11 1 01 1 0

1 1 11 1 01 1 1

1 1 11 1 10 1 0

1 1 11 1 10 1 1

1 1 11 1 11 0 0

1 1 11 1 11 0 1

1 1 11 1 11 1 0

1 1 11 1 11 1 1

Solo 5 matrici sono irriducibili, ma non primitive:

0 0 10 0 11 1 0

0 0 11 0 00 1 0

0 1 00 0 11 0 0

0 1 01 0 10 1 0

0 1 11 0 01 0 0

Osservazione 17.26. Usando le stesse funzioni, si trova che 25575delle 216 = 65536 matrici di incidenza 4× 4 sono primitive, mentre solo121 sono irriducibili, ma non primitive.

Nota 17.27. Siccome una matrice di incidenza A e sicuramente pri-mitiva, se esiste una matrice di incidenza primitiva B ≤ A, possiamolimitarci ad un elenco delle matrici di incidenza primitive minimaliche otteniamo con la seguente funzione:

def maggiorante(A,B):

u=lista(A); v=lista(B)

for a,b in zip(u,v):

if a<b: return 0

return 1

89

Page 94: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

def primitiveminimali(q):

u=[]; q2=q*q

for A in primitive(q):

for B in u:

if maggiorante(A,B): break;

else: u.append(A)

return u

Troviamo cosı che esistono 21 matrici di incidenza primitive minimali3 × 3:

0 0 10 0 11 1 1

0 0 10 1 11 1 0

0 0 11 0 00 1 1

0 0 11 0 01 1 0

0 0 11 0 10 1 0

0 0 11 1 00 1 0

0 1 00 0 11 0 1

0 1 00 0 11 1 0

0 1 00 1 11 0 0

0 1 01 0 10 1 1

0 1 01 0 11 0 0

0 1 01 1 10 1 0

0 1 10 0 11 0 0

0 1 11 0 00 1 0

0 1 11 0 01 0 1

0 1 11 1 01 0 0

1 0 10 0 11 1 0

1 0 11 0 00 1 0

1 1 00 0 11 0 0

1 1 01 0 10 1 0

1 1 11 0 01 0 0

90

Page 95: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

18. Un modello demografico

Nota 18.1. Nel modello di Leslie le fasce di eta in cui tradizionalmen-te e suddivisa la popolazione possono anche essere interpretate comestadi di differenziazione o compartimenti, ad esempio compartimentifunzionali nelle cellule di un tessuto.

Definizione 18.2. La matrice di transizione che determina il modifi-carsi della distribuzione in fasce d’eta (o stadi di vita) da uno stadio aquello successivo prende il nome di matrice di Leslie ed e della forma

a1 a2 . . . an−1 an

b1 0 . . . 0 00 b2 . . . 0 0

0 0 . . . bn−1 0

con 0 ≤ bj < 1 per ogni j e aj ≥ 0 per ogni j.

Gli ai rappresentano i tassi di natalita, cioe il numero medio di figlinati da un singolo individuo che si trova nella i-esima fascia d’eta ; ibj , invece, rappresentano gli indici di sopravvivenza, cioe la frazionedegli individui della j-esima fascia d’eta che sopravvivono nella fasciasuccessiva, e sono supposti costanti nel tempo.

Osservazione 18.3. Dalla tabella nel capitolo precedente si vede cheuna matrice di Leslie 3 × 3 e primitiva se e solo se

〈A〉 ≥

1 0 11 0 00 1 0

oppure 〈A〉 ≥

0 1 11 0 00 1 0

Esempio 18.4. Consideriamo la matrice di Leslie (Salce, pagg. 123-124)

A =

0 4 30.5 0 00 0.25 0

Con Sage troviamo che ρ(A) = 3/2 = 1.5. Calcolando gli autovettori diA e At rispetto all’autovalore 1.5 vediamo che nei teoremi 17.5 e 17.12possiamo porre

v =

1861

, w =

1

38

132

Per il punto (2) del teorema 17.12 cio significa che la popolazione tendea stabilizzarsi nelle tre fasce d’eta secondo il rapporto 18 : 6 : 1.

Per due vettori non negativi e non nulli x ed y dal punto (3) delteorema 17.12 segue che

limn→∞

(Anx)(i)

(Any)(i)=x1 + 3x2 + 2x3

y1 + 3y2 + 2y3indipendentemente da i.

91

Page 96: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

Bibliografia

E. Beckenbach/R. Bellman: An introduction to inequalities. MAA 1961.

P. Bremaud: Markov chains. Springer 1999.

M. Brin/G. Stuck: Introduction to dynmical systems. Cambridge UP 2002.

A. Castaldi: Catene di Markov finite e matrici stocastiche.Tesi, Ferrara 1995.

L. Collatz: Funktionalanalysis und numerische Mathematik. Springer 1968.

P. Cull/M. Flahive/R. Robson: Difference equations. Springer 2005.

J. Elstrodt: Maß- und Integrationstheorie. Springer 2005.

K. Engel/R. Nagel: A short course on operator semigroups. Springer 2006.

L. Fahrmeir/H. Kaufmann/F. Ost: Stochastische Prozesse. Hanser 1981.

F. Ferschl: Markovketten. Springer 1970.

G. Frobenius: Uber Matrizen aus nicht negativen Elementen.Sber. Preu. Akad. Wiss. Berlin (1912), 456-477.

F. Gantmacher: Matrizentheorie. Springer 1986.

G. Giantesio: Modelli matematici per la crescita tumorale.Tesi LT, Ferrara 2007.

G. Golub/C. Van Loan: Matrix computations. Johns Hopkins UP 1987.

G. Greiner: Zur Perron-Frobenius-Theorie stark stetiger Halbgruppen.Math. Zeitschr. 177 (1981), 401-423.

O. Haggstrom: Finite Markov chains and algorithmic applications.Cambridge UP 2007.

B. Huppert: Angewandte lineare Algebra. De Gruyter 1990.

M. Iosifescu/C. Kraaikamp: Metrical theory of continued fractions.Kluwer 2002.

M. Iosifescu/P. Tautu: Stochastic processes and applications in biologyand medicine I. Springer 1973.

V. Keicher/R. Nagel: Positive semigroups behave asymptotically as rota-tion groups. Positivity 12 (2008), 93-103.

J. Kemeny/J. Snell: Finite Markov chains. Springer 1976.

N. Keyfitz/H. Caswell: Applied mathematical demography. Springer 2005.

C. Leardini: Reti di Petri e analisi formale dei concetti.Tesi, Ferrara 2009.

C. Li/H. Schneider: Applications of Perron-Frobenius theory to populati-on dynamics. J. Math. Biol. 44 (2002), 450-462.

D. Lind/B. Marcus: An introduction to symbolic dynamics and coding.Cambridge UP 1995.

D. Logofet/I. Belova: Nonnegative matrices as a tool to model populationdynamics - classical models and contemporary expansions.J. Math. Sci. 155/6 (2008), 894-907.

M. Lothaire: Applied combinatorics on words. Cambridge UP 2005.

H. Lotz: Uber das Spektrum positiver Operatoren.Math. Zeitschr. 108 (1968), 15-32.

C. Lugli: Equazioni alle differenze e problemi inversi in sistemi dinamicifiniti. Tesi LT, Ferrara 2009.

R. Nagel (ed.): One-parameter semigroups of positive operators.Springer LN Math. 1184 (1986).

O. Perron: Zur Theorie der Matrizen. Math. Ann. 64 (1907), 248-263.

92

Page 97: UNIVERSITA DEGLI STUDI DI FERRARA`felix.unife.it/Didattica/Tesi/21085-Testoni.pdf · 2009. 7. 12. · UNIVERSITA DEGLI STUDI DI FERRARA` FACOLTA DI SCIENZE MATEMATICHE, FISICHE E`

M. Queffelec: Substitution dynamical systems - spectral analysis.Springer LN Math. 1294 (1987).

M. Rabin: Probabilistic automata. Inf. Control 6 (1963), 230-245.

L. Salce: Lezioni sulle matrici. Zanichelli 1993.

H. Schaefer: Some spectral properties of positive linear operators.Pacific J. Math. 10 (1960), 1009-1019.

H. Schaefer: Banach lattices and positive operators. Springer 1974.

E. Seneta: Non-negative matrices and Markov chains. Springer 1981.

H. Wielandt: Unzerlegbare, nicht negative Matrizen.Math. Zeitschr. 52 (1950), 642-648.

W. Woess: Catene di Markov e teoria del potenziale nel discreto.Pitagora 1996.

93