organisatorisches operations research · operations research gliederung der inhalte 1. theorie...

Post on 31-Aug-2019

9 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Operations Research

Rainer Schrader

Zentrum für Angewandte Informatik Köln

20. April 2007

1 / 112

Organisatorisches

• Dozent: Prof. Dr. Rainer Schrader

• Weyertal 80• Tel.: 470-6030• email: schrader@zpr.uni-koeln.de

• Übungen: Dipl.-Inf. Anna Schulze

• Weyertal 80• el.: 470-6050• email: schulze@zpr.uni-koeln.de

• url: www.zaik.uni-koeln.de/AFS

2 / 112

Organisatorisches

• Ort: Hörsaal Mathematisches Institut

• Zeit: Mo, Do 8–10

• Teilnehmerkreis:

• Wirtschaftsmathematik• Mathematik

Voraussetzungen:

• Grundkenntnisse in linearer Algebra und Analysis

• Grundkenntnisse in Informatik hilfreich, aber nicht notwendig

• Vorlesung weitgehend aus sich selbst heraus verständlich

• Folien hängen im Netz (jeweils am Ende der Woche)

3 / 112

Organisatorisches

• Übungsorganisation: −→ Anna Schulze

• Anmeldung zu den Übungen über Homepage ab Mo, 2. April 2007

• Scheinerwerb über Übungsteilnahme und Klausur

• Voraussetzungen für die Teilnahme an der Abschlussprüfung:

• aktive Teilnahme an den Übungen

• 50% der Punkte aus den Übungen

4 / 112

Organisatorisches

Literatur:

• U. Faigle, W. Kern und G. Still: Algorithmic Principles of MathematicalProgramming. Kluwer Academic Publishers 2002.

• David G. Luenberger: Linear and Nonlinear Programming,Addison-Wesley 1984

• A. Schrijver: Theory of Linear and Integer Programming, Wiley

5 / 112 6 / 112

7 / 112 8 / 112

9 / 112 10 / 112

Operations Research

Gliederung der Inhalte

1. Theorie linearer Ungleichungen

2. Polyeder und Polytope

3. Konvexe Funktionen

4. die Simplexmethode

5. ganzzahlige lineare Programme

6. Flüsse in Netzwerken

11 / 112

Theorie linearer Ungleichungssysteme

12 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

13 / 112

Grundbegriffe

• wir betrachten Ungleichungssysteme der Form

aTi x ≤ bi (i ∈ I)

• dabei ist I eine (endliche oder unendliche) Indexmenge

• die Parameter

aTi = [ai1,, . . . , ain] ∈ Rn und bi ∈ R

sind als gegeben vorausgesetzte Vektoren und reelle Zahlen

14 / 112

Grundbegriffe

• für die Anwendungen ist es oft notwendig, sich auf den rationalenZahlkörper Q zu beschränken.

15 / 112

Grundbegriffe

Wir betrachten das Problem:

• bestimme ein x ∈ Rn , das alle Ungleichungen

nXj=1

aij xj ≤ bi (i ∈ I)

erfüllt,

• oder stelle fest, dass kein solches x existiert.

16 / 112

Grundbegriffe

• mit A = [aij ] bezeichnen wir die (möglicherweise unendliche) Matrixmit den n-dimensionalen Zeilenvektoren aT

i

• d.h. A ist die Abbildung

A : I × {1, . . . , n} → R mit A(i , j) = aij

• entsprechend ist b = [bi ] ∈ RI der Koeffizientenvektor der rechtenSeite des Ungleichungssystems

• wir schreiben das Ungleichungssystem dann kurz als

Ax ≤ b ←→nX

j=1

aij xj ≤ bi (i ∈ I).

17 / 112

Grundbegriffe

• die Lösungsmenge des Ungleichungssystem ist

P(A, b) = {x ∈ Rn | Ax ≤ b}.

Beispiel

• ein lineares Gleichungssystem Ax = b mit A ∈ Rm×n und b ∈ Rm istäquivalent zu dem Ungleichungssystem

Ax ≤ b−Ax ≤ −b

• die Lösungsmenge A = {x ∈ Rn | Ax = b} ist ein affinerTeilraum von Rn

18 / 112

Grundbegriffe

Beispiel

• wir fassen eine Matrix X = [xij ] ∈ Rn×n als n2-dimensionalenKoordinatenvektor auf

• sei X = [xij ] eine Lösung des unendlichen Ungleichungssystems

nXi=1

nXj=1

ai aj xij ≥ 0 für alle [a1, . . . , an] ∈ Rn

xij − xji = 0 i , j = 1, . . . , n

• dann ist X = [xij ] eine positiv semidefinite Matrix

19 / 112

Grundbegriffe

• wir betrachten zunächst einen Spezialfall:

• A besteht nur aus einem einzigen Zeilenvektor aT

• Ist a 6= 0, so ist die Punktmenge

P(a, b) = {x ∈ Rn | aT x ≤ b}

ein (n-dimensionaler) Halbraum

• im Fall a = 0 erhalten wir Rn = P(0, 0) als „trivialen“ Halbraum

• ebenso ist die leere Menge ∅ = P(0,−1) ein trivialer Halbraum

• damit ist die Lösungsmenge eines linearen Ungleichungssystemsimmer Durchschnitt von Halbräumen

20 / 112

Grundbegriffe

Beispiel (Hyperebenen)

• sei H(a, b) = {x ∈ Rn | aT x = b} eine Hyperebene

• H ist Durchschnitt ihrer zugeordneten Halbräume

H(a, b) = P(a, b) ∩ P(−a,−b)

• bzw. Lösungsmenge des linearen Ungleichungssystemsa1x1 + . . . + anxn ≤ b−a1x1 − . . .− anxn ≤ −b

ff←→ a1x1 + . . . + anxn = b.

21 / 112

Grundbegriffe

• sei S ⊆ Rn

• S heißt konvex, falls

• für alle x, y ∈ S und alle reellen 0 ≤ λ ≤ 1 gilt:

λx + (1− λ)y ∈ S

xx

yy

konvex nicht konvex

22 / 112

Grundbegriffe

• ist P(a, b) ein Halbraum, so ist P(a, b) konvex

• außerdem ist P(a, b) (im Sinn der Analysis) abgeschlossen

• offensichtlich bleibt Abgeschlossenheit und Konvexität unterDurchschnittsbildung erhalten

• somit ist die Lösungsmenge eines linearen Ungleichungssystemskonvex und abgeschlossen

• wir wollen zeigen:

• die konvexen abgeschlossenen Mengen im Rn sind genau dieLösungsmengen von linearen Ungleichungssystemen

• dazu folgendes grundlegendes Lemma:

23 / 112

Grundbegriffe

Lemma 1 (Trennungslemma)

• sei S ⊆ Rn nichtleer, konvex und abgeschlossen

• dann existiert für jedes y ∈ Rn r S ein Vektor c ∈ Rn und einx0 ∈ S derart, dass

cT y > cT x0 ≥ cT x für alle x ∈ S.

y

S

y

Sc

y

S

x

c

0

24 / 112

Grundbegriffe

y

S

x

c

0

• mit z = cT x0 hat man S ⊆ P(c, z) und y /∈ P(c, z)

• d.h. die Hyperebene H = {x ∈ Rn | cT x = z} trennt den Punkty ∈ Rn von der Menge S ⊆ Rn

• H heißt Stützhyperebene von S im Punkt x0.

25 / 112

Grundbegriffe

Beweis des Trennungslemmas:

(i) das Minimierungsproblemminx∈S‖y − x‖

besitzt eine optimale Lösung x0 ∈ S:

• wir können dazu oBdA annehmen, dass S kompakt ist

• andernfalls beschränken wir uns auf die kompakte Menge

SR = {x ∈ S | ‖y − x‖ ≤ R},

(wobei R > 0 so groß gewählt ist, dass SR 6= ∅ gilt)

• die Funktion x 7→ ‖x − y‖ ist stetig auf Rn

• eine stetige Funktion nimmt auf einem Kompaktum ihre Extremwerte an

• damit existiert eine Minimallösung x0 ∈ S

26 / 112

Grundbegriffe

• für x0 ∈ S gilt‖y − x0‖ = min

x∈S‖y − x‖

• da y /∈ S, folgt x0 6= y

• sei c = y − x0

• wir zeigen, dass c die gewünschten Eigenschaften hat:

(ii) cT x0 < cT y:

• es gilt

cT y − cT x0 = cT (y − x0)

= ‖y − x0‖2

> 0

27 / 112

Grundbegriffe

(iii) cT x0 ≥ cT x für alle x ∈ S:

• sei x ∈ S ein beliebiger Punkt in S

• für 0 < λ < 1 setze z(λ) = x0 + λ(x − x0)

• da S konvex, gilt z(λ) ∈ S

• nach Wahl von x0 folgt

‖c‖2 = ‖y − x0‖2 ≤ ‖y − z(λ)‖2 = ‖c− λ(x − x0)‖2.

• ausmultiplizieren ergibt

−2λcT (x−x0)+λ2‖x−x0‖2 ≥ 0 bzw. −2cT (x−x0)+λ‖x−x0‖2 ≥ 0

• und liefert

cT x − cT x0 = cT (x − x0) ≤12

limλ→0

λ‖x − x0‖2 = 0.

28 / 112

Grundbegriffe

Bemerkung 1

• die Voraussetzung der Abgeschlossenheit von S im Trennungslemmaist wichtig:

• betrachte die konvexe Menge

S = {(x1, x2) | x 21 + x 2

2 < 1} ⊆ R2

• das Trennungslemma gilt aber nicht.

Bemerkung 2

• Für den Vektor c im Trennungslemma können wir oBdA eine normierteLänge ‖c‖ = 1 fordern.

29 / 112

Grundbegriffe

Satz 2Eine Teilmenge S ⊆ Rn ist genau dann konvex und abgeschlossen, wennS Lösungsmenge eines linearen Ungleichungssystems ist.

Beweis:

• die Lösungsmenge eines linearen Ungleichungssystems ist konvex undabgeschlossen

• zum Beweis der anderen Richtung:

• der Fall S = Rn oder S = ∅ ist trivial

• in allen anderen Fällen erhalten wir nach dem Trennungslemma

S =\y/∈S

Py,

• wobei die Py Halbräume mit S ⊆ Py und y /∈ Py sind.

30 / 112

Grundbegriffe

• sei S ⊆ Rn

• wir können S auf zweierlei Arten eine konvexe Menge zuordnen:

• einmal betrachten wir die Menge aller Konvexkombinationen:

conv S = {kX

i=1

λi si | si ∈ S, λi ≥ 0,

kXi=1

λi = 1}.

• d.h. Linearkombinationen mit nichtnegativen Koeffizienten, die sich zu1 aufsummieren

• conv S ist die konvexe Hülle von S

31 / 112

Grundbegriffe

Beispiel

S Sconv

Bemerkung

conv S ist die kleinste konvexe Menge, die S enthält.

32 / 112

GrundbegriffeOffensichtlich gilt:

• S ⊆ conv S

• S ⊆ T =⇒ conv S ⊆ conv T

• conv S = conv(conv S)

Lemma 3Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt:

S ist konvex ⇐⇒ S = conv S.

Beweis: Übungsaufgabe

33 / 112

Grundbegriffe

• dual dazu definiert man:

Spol = {x ∈ Rn | sT x ≤ 1 für alle s ∈ S}. (1)

• Spol ist die Polare zu S

• Spol ist Lösungsmenge eines linearen Ungleichungssystems unddeshalb abgeschlossen (und konvex)

• stellen wir uns S als eine Matrix mit den Zeilenvektoren sT vor, so ist

Spol = P(S, 1),

• wobei b = 1 der Vektor mit allen Komponenten bi = 1 bedeutet

34 / 112

Grundbegriffe

Beispiel

(-1,2)

(-1,-1)

(1,0)

Spol

35 / 112

GrundbegriffeMotivation

• sei S ⊆ Rn mit 0 ∈ S

• sei cT x ≤ z eine lineare Ungleichung, die von allen s ∈ S erfüllt wird

• dann gilt z ≥ 0 (wegen 0 ∈ S)

• im Fall z > 0 kann man die Koeffizienten per Division durchz skalieren

• und enthält die äquivalente Ungleichung

cT x ≤ 1 (c = z−1c).

• Spol ist gerade die Menge aller solcher Koordinatenvektoren c.

36 / 112

GrundbegriffeMan macht sich leicht klar:

• S ⊆ (Spol )pol

• S ⊆ T =⇒ T pol ⊆ Spol

• Spol = (conv S)pol

Satz 4Sei S ⊆ Rn eine beliebige nichtleere Menge mit 0 ∈ S. Dann gilt:

S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .

37 / 112

Grundbegriffe

S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .

Beweis:

• sei S = (Spol )pol ,

• dann ist ist S Durchschnitt von Halbräumen und somit konvex undabgeschlossen

• sei umgekehrt S konvex und abgeschlossen

• nach Satz 2 existiert ein Ungleichungssystem Ax ≤ b mit S = P(A, b)

• da 0 ∈ S, folgt bi ≥ 0 für jede Komponente bi von b

• nach Skalierung können wir annehmen, dass bi ∈ {0, 1}

38 / 112

Grundbegriffe

• d.h. S = P(A, b) mit bi ∈ {0, 1}

• wir ersetzen jede Ungleichung vom Typ aTi x ≤ 0 durch unendlich viele

Ungleichungen(kai )

T ≤ 1 (k ∈ N)

• dann können wir annehmen, dass S von der Form ist:

S = {x ∈ Rn | aTi x ≤ 1 (i ∈ I)}

• das bedeutet aber ai ∈ Spol für alle i ∈ I

• also A ⊆ Spol und somit

S ⊆ (Spol )pol ⊆ Apol ⊆ S

• d.h.S = (Spol )pol .

39 / 112

Grundbegriffe

• sei Ax ≤ b ein Ungleichungssystem

• als Dimension von Ax ≤ b bezeichnet man gewöhnlich die Anzahln der Variablen xj

• uns interessiert aber auch die Dimension der Lösungsmenge P(A, b)

• für einen Spezialfall ist dies bekannt:

40 / 112

Grundbegriffe

• die linearen Teilräume L von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:

L = {x ∈ Rn | Ax = 0}.

• die Dimension dimL von L ist:

dimL = max{k | es gibt k linear unabhängige Punkte x1, . . . , xk ∈ L}.

• bzw. dimL = −1 falls L = ∅

• es gilt die Dimensionsformel

dimL = n − rg A (2)

• mit rg A = (Zeilen/Spalten-)Rang von A

• bei Gleichungssystemen darf man (im Gegensatz zuUngleichungssystemen) immer A als endliche Matrix annehmen

41 / 112

Grundbegriffe

• etwas allgemeiner:

• die affinen Teilräume A von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:

A = {x ∈ Rn | Ax = b}.

• jeder nichtleere affine Teilraum A lässt sich schreiben als

A = p + L = {x | x = p + y, y ∈ L}

• hierbei ist p ∈ Rn und L ein linearer Teilraum

• die (affine) Dimension dimA von A ist:

dimA =

dimL, falls A 6= ∅−1, falls A = ∅

42 / 112

Grundbegriffe

• der allgemeine Fall:

• Idee: einer Teilmenge S ∈ Rn ordnen wir die Dimension des kleinstenaffinen Teilraums zu, der S enthält

• seiPk

i=1 λi si eine Linearkombination von Punkten aus S

• die Linearkombination heißt affine Linearkombinationen, wennzuätzlich gilt

kXi=1

λi = 1

• die affine Hülle aff S ist die Menge aller Punkte, die sich als affineLinearkombinationen aus S ausdrücken lassen

43 / 112

Grundbegriffe

• d.h.

aff S = {kX

i=1

λi si | si ∈ S,

kXi=1

λi = 1}.

• aff S ist der kleinste affine Teilraum von Rn , der S enthält

• die affine Dimension von S ist jetzt

dim S := dim aff S.

S

aff S

44 / 112

Grundbegriffe

• sei S ⊆ Rn eine abgeschlossene konvexe Menge

• sei F ⊆ S eine Teilmenge von S

• F heißt Berührfläche von S, wenn gilt:

(SF0) es gibt einen Vektor a 6= 0 und eine reelle Zahl b ∈ R mit:

(SF1) S ⊆ {x ∈ Rn | aT x ≤ b} = P(a, b)

(SF2) F = {x ∈ S | aT x = b} = S ∩ H(a, b)

• F heißt Seitenfläche von S, wenn F Berührfläche von S ist oderF = S oder F = ∅.

45 / 112

Grundbegriffe

• die Seitenflächen S und ∅ sind die trivialen Seitenflächen

• die anderen sind die nicht-trivialen Seitenflächen

• eine einelementige Seitenfläche F = {v} von S heißtExtrempunkt (oder Ecke) von S

• aus der Definition ergibt sich sofort, dass eine Seitenfläche F vonS selber eine abgeschlossene konvexe Menge ist

• es giltdim F ≤ dim S − 1 ⇐⇒ F 6= S.

• die Extrempunkte von S entsprechen den Seitenflächen F mitdim F = 0

46 / 112

Grundbegriffe

Beispiel

• sei S = {(x1, x2, x3) ∈ R3 | x 21 + x 2

2 + x 23 ≤ 1}.

• die nichttrivialen Seitenflächen von S sind genau die Punkte auf derKugeloberfläche

• dieses sind gleichzeitig auch die Extrempunkte von S

47 / 112

Grundbegriffe

Beispiel

A

B

C

D

E

48 / 112

Grundbegriffe

Beispiel (Stützhyperebenen)

• jede Stützhyperebene H = H(c, b) induziert eine nichtleereSeitenfläche von S, denn:

• sei x0 der Stützpunkt von H

• dann gilt (SF1) wegen

cT x ≤ b = cT x0 für alle x ∈ S

• die Seitenfläche F = S ∩ H enthält x0 und ist folglich nichtleer.

Seitenflächen sind unter Durchschnitten abgeschlossen:

49 / 112

Grundbegriffe

Proposition 5

Sind F1, F2 Seitenflächen der abgeschlossenen konvexen Menge S ⊆ Rn ,dann ist auch F = F1 ∩ F2 eine Seitenfläche von F .

Beweis:

• sei F1 = S ∩ H(a1, b1) und F2 = S ∩ H(a2, b2)

• wir setzen a = a1 + a2 und b = b1 + b2.

• dann gilt nach Voraussetzung für alle x ∈ S:

aT1 x ≤ b1, aT

2 x ≤ b2 und deshalb aT x ≤ b.

• außerdem gilt für x ∈ S:

aT x = b ⇐⇒ aT1 x = b1 und aT

2 x = b2

• und somit F = S ∩ H(a, b).

50 / 112

Grundbegriffe

Bemerkung

Wie schon das Beispiel der Kreisscheibe zeigt, ist die VereinigungF1 ∪ F2 von zwei Seitenflächen im allgemeinen keine Seitenfläche.

51 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

52 / 112

Fourier-Motzkin

• wir diskutieren nun einen Algorithmus zum Lösen linearerUngleichungssysteme

• er ist natürlich nur bei endlichen Systemen praktisch durchführbar,

• aber doch auch bei unendlichen Systemen „im Prinzip“ anwendbar

• wir gehen aus von einem Ungleichungssystem

aTi x =

nXj=1

aij xj ≤ bi (i ∈ I).

• wir wollen nun (ähnlich wie beim Gauss-Verfahren) die Variablen xj derReihe nach eliminieren

• wegen der Ungleichungen können wir aber nur mit positiven Zahlenskalieren

• wir beginnen mit z.B. x1.

53 / 112

Fourier-Motzkin• seien

I+ = {i ∈ I | ai1 > 0},I− = {i ∈ I | ai1 < 0},I0 = {i ∈ I | ai1 = 0}.

• dividieren wir die Ungleichungen in I1 und I2 jeweils durch |ai1|, soerhalten wir das äquivalente System

x1 +Xj=2

a′rj xj ≤ b′r (r ∈ I+)

−x1 +Xj=2

a′sj xj ≤ b′s (s ∈ I−)Xj=2

atj xj ≤ bt (t ∈ I0)

(3)

54 / 112

Fourier-Motzkin

x1+Xj=2

a′rj xj ≤ b′r (r ∈ I+)

−x1+Xj=2

a′sj xj ≤ b′s (s ∈ I−) (3)

Xj=2

atj xj ≤ bt (t ∈ I0)

• x = (x1, x2, . . . , xn) ist also genau dann zulässige Lösung, wenn gilt:

(i) (x2, . . . , xn) erfülltnX

j=2

atj xj ≤ bt für alle t ∈ I0

(ii) −b′s +nX

j=2

a′sj xj ≤ x1 ≤ b′r −nX

j=2

a′rj xj für alle r ∈ I+, s ∈ I−

55 / 112

Fourier-MotzkinBeobachtung: Das System

(ii) −b′s +nX

j=2

a′sj xj ≤ x1 ≤ b′r −nX

j=2

a′rj xj für alle r ∈ I+, s ∈ I−

ist genau dann erfüllbar, wenn das folgende System erfüllbar ist:

(iii)nX

j=2

(a′rj + a′sj )xj ≤ b′r + b′s für alle r ∈ I+ und s ∈ I−.

denn:

• (ii)⇒ (iii): addiere je eine Ungleichung r ∈ I+, s ∈ I−• (iii)⇒ (ii): für alle r ∈ I+, s ∈ I− gilt

−b′s +nX

j=2

a′sj xj ≤ b′r −nX

j=2

a′rj xj

• und somit (mit inf ∅ = +∞, sup ∅ = −∞)

sups∈I−

`− b′s +

nXj=2

a′sj xj´≤ inf

r∈I+

`b′r −

nXj=2

a′rj xj´

56 / 112

Fourier-Motzkin• in diesem Fall können wir jedes x1 wählen mit

sups∈I−

`− b′s +

nXj=2

a′sj xj´≤ x1 ≤ inf

r∈I+

`b′r −

nXj=2

a′rj xj´

(4)

• somit:

• erfüllt (x2, . . . , xn) die Ungleichungen (i) und (iii),

• so lässt sich x1 per Rücksubstitution aus (4) bestimmen

• danach erfüllt (x1, . . . , xn) die Ungleichungen (i) und (ii)

57 / 112

Fourier-Motzkin

• zusammengefasst:

Lemma 6Das System (3) ist genau dann lösbar, wenn das System

(i)nX

j=2

atj xj ≤ bt (t ∈ I0)

(iii)nX

j=2

(a′rj + a′sj )xj ≤ br + bs (r ∈ I+, s ∈ I−)

lösbar ist.

58 / 112

Fourier-Motzkin

Lemma 6 führt auf eine rekursive Beschreibung des Eliminationsverfahrensbzgl. (3):

Fourier-Motzkin-Elimination

(1) berechne rekursiv eine Lösung (x2, . . . , xn) für das System (i) & (iii);

(2) wenn keine Lösung existiert: stop

(3) berechne x1 mit Rückwärtssubstitution nach (4)

59 / 112

Fourier-MotzkinBeispiel:

3x + y − 2z ≤ 1− 2y − 4z ≤ −14

−x + 3y − 2z ≤ −2y + 4z ≤ 13

2x − 5y + z ≤ 0

es ist:

I+ = {1, 5} I− = {3} I0 = {2, 4}Normierung ergibt:

x + 13 y − 2

3 z ≤ 13

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

− 2y − 4z ≤ −14y + 4z ≤ 13

60 / 112

Fourier-Motzkinx + 1

3 y − 23 z ≤ 1

3

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

− 2y − 4z ≤ −14y + 4z ≤ 13

Elimination von x ergibt:

103 y − 8

3 z ≤ − 53

12 y − 3

2 z ≤ −2− 2y − 4z ≤ −14

y + 4z ≤ 13

Normierung ergibt:

y − 810 z ≤ − 1

2

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

61 / 112

Fourier-Motzkiny − 8

10 z ≤ − 12

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

Elimination von y ergibt:

− 2810 z ≤ − 15

2

− 5z ≤ −112z ≤ 6

Normierung ergibt:

z ≤ 3

− z ≤ − 15056

− z ≤ − 115

62 / 112

Fourier-Motzkinz ≤ 3

− z ≤ − 15056

− z ≤ − 115

Somit äquivalent dazu:

• 15056 ≤ z ≤ 3

• eine möglich Lösung wäre z.B. z = 3

• ein weiterer Eliminationsschritt liefert:

0 ≤ 3 + 15656

0 ≤ 3− 115

63 / 112

Fourier-MotzkinBerechnung der anderen Komponenten:

• Einsetzen von z = 3 in

y − 810 z ≤ − 1

2

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

• lieferty ≤ 19

10

y ≤ 5y ≤ 1

− y ≤ −1

• und somit y = 1

64 / 112

Fourier-Motzkin• Einsetzen von y = 1 und z = 3 in

x + 13 y − 2

3 z ≤ 13

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

• liefert:

x ≤ 2x ≤ 2

− x ≤ 1

• und somit z.B. x = 2.

65 / 112

Fourier-MotzkinZusammenfassung:

• das FM-Verfahren führt nur zwei Operationen aus:

(i) Multiplikation einer Ungleichung mit einer positiven Zahl

(ii) Addition von zwei Ungleichungen

• damit gilt nach jeder Elimination einer Variablen:

• jede der neuen Ungleichungen ist eine Linearkombination vonhöchstens zwei Ungleichungen des vorigen Systems mit positivenKoeffizienten

• gilt für eine Variable I+ = ∅ (I− = ∅), so ist das System lösbar

• wenn alle Variablen eliminiert sind, sind die Koeffizienten auf der linkenSeite des Systems Null

• dann ist das System genau dann lösbar, wenn die Koeffizienten auf derrechten Seite alle nichtnegativ sind.

66 / 112

Fourier-MotzkinBemerkung:

• sei Ax ≤ b ein System mit m Ungleichungen

• nach der Elimination einer Variablen kann das resultierende Systemm2

4 Ungleichungen haben

• d.h. die Anzahl der Ungleichungen kann explodieren

• daher ist das Fourier-Motzkin-Verfahren nicht sehr effizient.

67 / 112

Fourier-MotzkinAnwendung: Projektionen

• wir betrachten die Projektionsabbildung π : Rn → Rn−1

• π ist gegeben durch

π(x1, x2, x3 . . . , xn) = (x2, x3, . . . , xn).

• Projektionen von konvexen Mengen sind konvex

• weiter ist π stetig

• daher ist die Projektion einer abgeschlossenen konvexen Menge wiederabgeschlossen und konvex

• d.h. die Projektion der Lösungsmenge eines linearenUngleichungssystems ist selber Lösungsmenge eines linearenUngleichungssystems

• die interessante Aussage des folgenden Lemmas ist der Erhalt derEndlichkeit

68 / 112

Fourier-Motzkin

Lemma 7 (Projektionslemma)

Sei A ∈ Rm×n und b ∈ Rm gegeben. Dann existiert eine endliche MatrixB ∈ Rk×(n−1) und ein Vektor d ∈ Rk derart, dass gilt

π[P(A, b)] = P(B, d).

Beweis:

• sei Bx ≤ d das lineare Ungleichungssystem, das sich ausAx ≤ b nach FM-Elimination von x1 ergibt

• aus der Rücksubstitutionsregel (4) ergibt sich

(x∗2 , . . . , x∗n ) ∈ P(B, d) ⇐⇒ es gibt ein x∗1 ∈ R mit (x∗1 , x∗2 , . . . , x∗n ) ∈ P(A, b)

• das ist aber genau die Behauptung P(B, d) = π[P(A, b)] .

69 / 112

Fourier-Motzkin

Bemerkung

• Der Beweis des Projektionslemmas ist konstruktiv

• mit dem FM-Verfahren kann man eine geeignete Matrix B und einen

geeigneten Vektor d berechnen.

70 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

71 / 112

Alternativsätze

• wir betrachten ein Ungleichungssystem Ax ≤ b

• Fourier-Motzkin liefert ein Verfahren, um die Lösbarkeit zu testen

• wir werden im folgenden die Lösbarkeit charakterisieren

72 / 112

Alternativsätze

Satz 8 (Alternativsatz)

Genau eine der Aussagen ist richtig:

(i) das System Ax ≤ b besitzt eine Lösung

(ii) es gibt einen nichtnegativen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass

yT A = 0T und yT b < 0 .

Bemerkung

• da nur endlich viele Komponenten von y von 0 verschieden sind,

• gibt es eine endliche Teilmenge I ′ ⊆ I derart, dass

yT A =Xi∈I′

yi aTi und yT b =

Xi∈I′

yi bi

• damit sind die Ausdrücke yT A und yT b im Satz wohldefiniert.73 / 112

AlternativsätzeSatz 8 (Alternativsatz)Genau eine der Aussagen ist richtig:

(i) Das System Ax ≤ b besitzt eine Lösung.

(ii) Es gibt nichtnegativen einen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass yT A = 0T und yT b < 0 .

Beweis:

• die Aussagen können nicht gleichzeitig gelten

• andernfalls würde folgen: 0 = 0T x = yT Ax ≤ yT b < 0

• angenommen (i) ist falsch

• nach der FM-Elimination aller Variablen existiert eine Ungleichung derForm 0 ≤ t mit t < 0

• diese Ungleichung ist nichtnegative Linearkombination von höchstenszwei Ungleichungen des Systems davor

74 / 112

Alternativsätze

• diese sind wiederum nichtnegative Linearkombinationen von höchstenszwei Ungleichungen des Systems davor

•...

• damit existiert ein nichtnegativer Vektor y mit höchstens 2n positivenEinträgen, so dass yT A = 0T und yT b < 0.

• ist das Systems Ax ≤ b endlich, so ist der obige Alternativsatz auchals Lemma von Farkas bekannt

• wir werden später noch eine andere Form des Lemmas von Farkasbehandeln

75 / 112

Alternativsätze

Korollar 9Das System Ax ≤ b ist nicht lösbar genau dann, wenn ein endlichesTeilsystem A′x ≤ b′ nicht lösbar ist.

Beweis:

• eine Lösung x∗ von Ax ≤ b ist natürlich auch eine Lösung desTeilsystems A′x ≤ b′

• ist Ax ≤ b nicht lösbar, so gilt Alternative (ii) im Satz 8

• die Alternative (ii) bezieht sich auf ein endliches Teilsystem

• also ist auch dieses nicht lösbar.

76 / 112

Alternativsätze

Korollar 10 (Gordan)

Sei A ∈ Rm×n eine Matrix. Dann gilt genau eine der Aussagen:

(i) Ax = 0, x ≥ 0 hat eine Lösung x∗ 6= 0.

(ii) yT A < 0T hat eine Lösung.

Beweis: Übung.

Bemerkung

x < y bedeutet, dass die Relation xj < yj für alle Komponenten gilt.

77 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

78 / 112

Seitenflächen

• sei S ⊆ Rn eine beliebige nicht-leere Teilmenge

• sei cT x ≤ z eine lineare Ungleichung

• S impliziert die Ungleichung cT x ≤ z , wenn gilt:

cT x ≤ z für alle x ∈ S

• ebenso sagt man, dass cT x ≤ z eine für S gültige Ungleichung ist

• diese Implikation erlaubt zwei Interpretationen:

79 / 112

SeitenflächenOptimierung:

(i) supx∈S cT x ≤ z .

(ii) F = {x ∈ S | cT x = z} ist die Menge aller Optimallösungen desentsprechenden Maximierungsproblems.

Geometrie:

(i) Der Halbraum P(c, z) = {x ∈ Rn | cT x ≤ z} enthält S.

(ii) F = {x ∈| cT x = z} ist eine Seitenfläche von S.

80 / 112

Seitenflächen

• analog:

• seien Ax ≤ b ein Ungleichungssystem und cT x ≤ z eine Ungleichung

• cT x ≤ z wird von Ax ≤ b impliziert, wenn gilt:

Ax∗ ≤ b =⇒ cT x∗ ≤ z für alle x∗ ∈ Rn .

• die zweite Form des Farkas-Lemmas ist nun:

Lemma 11 (Farkas)

Sei Ax ≤ b ein endliches lösbares lineares Ungleichungssystem. Dann wirdcT x ≤ z genau dann von Ax ≤ b impliziert, wenn es einen Vektory ≥ 0 gibt mit

cT = yT A und yT b ≤ z .

81 / 112

SeitenflächenBeweis:

(i) sei y ≥ 0 so, dass cT = yT A und yT b ≤ z

• für jede Lösung x von Ax ≤ b gilt dann yT (b− Ax) ≥ 0

• und somitcT x = yT Ax ≤ yT b ≤ z

• die Bedingung ist also hinreichend

• zum Beweis der Rückrichtung betrachten wir das System

Ax ≤ b−cT x ≤ −(z + ε)

• nach Annahme hat dieses System für kein ε > 0 eine Lösung

• führe FM-Elimination durch (unabhängig von ε)

• aus der Endlichkeit des Systems folgt:

82 / 112

Seitenflächen• es existiert ein Vektor y ≥ 0 und ein Skalar y0 ≥ 0 mit

yT A − y0c = 0 und yT b − y0(z + ε) < 0

• wäre y0 = 0, so hätten wir

yT A = 0 und yT b < 0

• nach dem Alternativsatz 8 hätte dann das System Ax ≤ b keineLösung, im Widerspruch zur Voraussetzung

• somit ist y0 > 0 und wir können nach Division durch y0 annehmen:

yT A = c und yT b < (z + ε)

• da dies für alle ε > 0 gilt, folgt yT b ≤ z .

83 / 112

Seitenflächen

Bemerkung

• das Farkas-Lemma kann auf unendliche Ungleichungssysteme mitkompakter Lösungsmenge S = P(A, b) verallgemeinert werden

• ohne diese Zusatzannahme ist das Farkas-Lemma bei unendlichenSystemen falsch:

Beispiel

• sei S = {(x , y ) ∈ R2 | x > 0, y ≥ 1/x}• S ist Lösungsmenge des unendlichen Ungleichungssystems

1r 2 x + y ≥ 2

r(r ∈ R, r > 0)

• die Ungleichung x ≥ 0 gilt offenbar für S

• sie lässt sich aber nicht als positive (endliche) Linearkombination ausdem System ableiten.

84 / 112

Seitenflächen

Die zweite Form des Farkas-Lemmas liefert eine Methode, wie man im Prinzipalle Seitenflächen von S = P(A, b) konstruieren kann:

• wir nehmen oBdA S 6= ∅ an

• sei AF x ≤ bF ein Teilsystem von Ax ≤ b

• sei cT = 1T AF der Summenvektor aller Zeilenvektoren von AF

• entsprechend sei z = 1T bF die Summe der rechten Seiten

• dann ist ist die Ungleichung cT x ≤ z für S gültig

• denn für alle x ∈ P(A, b) gilt:

cT x = 1T AF x ≤ 1T bF = z

85 / 112

Seitenflächen

• wegen AF x ≤ bF gilt:

1T AF x = 1T bF ⇐⇒ AF x = bF

• somit bestimmt die Teilmatrix AF eine Seitenfläche

F = {x ∈ S | cT x = z} = {x ∈ Rn | Ax ≤ b, AF x = bF }

• es bleibt zu zeigen, dass man auf diese Weise alle nichttrivialenSeitenflächen von P(A, b) erhält

• sei dazu F eine beliebige nichtleere Seitenfläche, d.h.

F = {x ∈ Rn | Ax ≤ b, cT x = z}

86 / 112

Seitenflächen

• nach dem Farkas-Lemma existiert ein Vektor y ≥ 0 derart, dass

cT = yT A und yT b ≤ z .

• wenn wir y auf seine positiven Komponenten einschränken, erhaltenwir eine endliche Teilmatix AF und ein y ≥ 0 derart, dass

cT = yT AF und yT bF ≤ z .

• da F 6= ∅, gilt z = yT bF , denn:

x ∈ F =⇒ z = cT x = yT AF x ≤ yT bF ≤ z .

• daraus folgt:

• F besteht genau aus den Punkten x ∈ P(A, b), die die GleichungAF x = bF erfüllen, d.h.

F = {x ∈ Rn | Ax ≤ b, AF x = bF }.

87 / 112

Seitenflächen

Beispiel

• das Standardsimplex in Rn ist die Menge

∆n = {(x1, . . . , xn) | x1 + . . . + xn = 1, x1 ≥ 0, . . . , xn ≥ 0}.

• ein Eckpunkt von ∆n entspricht einer einelementigen Seitenfläche

• und damit einer Auswahl von Ungleichungen derart, dass daszugeordnete Gleichungssystem nur eine einzige Lösung in∆n gestattet.

• also ergeben sich genau die n Einheitsvektoren als die Ecken von ∆n .

x

x

x

1

2

3

1

1

1

88 / 112

Seitenflächen

Satz 12Ist Ax ≤ b ein endliches Ungleichungssystem, so hat die abgeschlossenekonvexe Menge P(A, b) nur endlich viele verschiedene Seitenflächen.

Beweis: Ax ≤ b hat nur endlich viele verschiedene Teilsysteme AF x ≤bF .

Beispiel

Die KugelS = {(x , y , z) ∈ Rn | x 2 + y 2 + z2 ≤ R}

lässt sich nicht als Lösungsmenge eines endlichen linearenUngleichungssystem darstellen, denn S hat unendlich viele Extrempunkte.

89 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

90 / 112

konvexe Kegel

wir betrachten jetzt eine spezielle Klasse von Ungleichungssystemen

eine nichtleere Menge K ⊆ Rn ist ein (konvexer) Kegel, wenn gilt:

(K1) λx ∈ K für alle x ∈ K und Skalare λ ≥ 0

(K2) x + y ∈ K für alle x, y ∈ K

• ein konvexer Kegel ist also eine unter nichtnegativenLinearkombinationen abgeschlossene Menge

• ein nichtleerer Kegel enthält immer zumindest den Punkt 0 ∈ Rn

91 / 112

konvexe Kegel

Beispiel

x

x

x

1

2

3

x

x

x

1

2

3

• jeder nichtleeren Menge S ⊆ Rn kann man auf zwei (zueinander„duale“) Weisen einen Kegel zuordnen.

• zum einen betrachtet man die Menge aller nichtnegativenLinearkombinationen:

92 / 112

konvexe Kegel

• cone S ist die konische Hülle von S oder der von S erzeugteKegel:

cone S = {kX

i=1

λi si |, si ∈ S, λi ≥ 0} (5)

Beispiel

• sei A ∈ Rm×n eine Matrix mit Spalten A1, . . . , An

• dann bezeichnet cone A den von den Spalten von A erzeugten Kegel

cone A = {nX

i=1

λi Ai |, λi ≥ 0}

93 / 112

konvexe Kegel

• dual dazu definieren wir

S◦ = {x ∈ Rn | sT x ≤ 0 für alle s ∈ S}. (6)

• ist S ein Kegel, so ist S◦ ist der zu S duale Kegel

• S◦ ist Lösungsmenge eines linearen Ungleichungssystems und daherabgeschlossen (und konvex)

• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt

S◦ = P(S, 0).

• für konvexe Kegel sind die Polare und der duale Kegel identisch:

94 / 112

konvexe Kegel

Lemma 13Sei K ⊆ Rn ein konvexer Kegel. Dann gilt

K ◦ = K pol .

Beweis:

• es gilt K ◦ ⊆ K pol , denn

cT x ≤ 0 =⇒ cT x ≤ 1 für alle x ∈ K .

• sei umgekehrt c ∈ K pol , d.h. cT x ≤ 1 für alle x ∈ K

• mit x ∈ K ist auch λx ∈ K für alle λ ≥ 0

• d.h. λ(cT x) ≤ 1 für alle λ ≥ 0

• somit cT x ≤ 0 und K pol ⊆ K ◦.

95 / 112

konvexe Kegel

Analog der Argumentation bei der Polaren macht sich leicht klar:

• S ⊆ (S◦)◦.

• S ⊆ T =⇒ T ◦ ⊆ S◦.

• S◦ = (cone S)◦.

Satz 14Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt

(i) S ist ein konvexer Kegel ⇐⇒ S = cone S.

(ii) S ist ein abgeschlossener konvexer Kegel ⇐⇒ S = (S◦)◦.

Beweis:

• der Beweis von Behauptung (i) ist Routine

• Aussage (ii) ist der Spezialfall der analogen Aussage über die Polarekonvexer Kegel.

96 / 112

konvexe Kegel

Korollar 15Sei A ∈ Rm×n eine Matrix. Dann gilt:

cone A = P(AT , 0)◦.

Beweis:

• für eine beliebige Menge S haben wir gesehen:

• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt

S◦ = P(S, 0).

• speziell für S = cone A gilt dann:

(cone A)◦ = P(AT , 0).

• wegen K = (K ◦)◦ für konvexe Kegel, folgt:

cone A = ((cone A)◦)◦ = P(AT , 0)◦.

97 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

• das Erfüllbarkeitsproblem

• stochastische Matrizen

98 / 112

Zwei Anwendungen

Wir rechnen über dem Zahlenbereich {0, 1} mit den Operationen:

• „oder“

∨ 0 10 0 11 1 1

• „und“

∧ 0 10 0 01 0 1

• und der Negation:− 0 1

1 0

99 / 112

Zwei Anwendungen

• eine Boolesche Funktion ist eine Funktion ϕ : {0, 1}n → {0, 1}

• jede Boolesche Funktion ϕ(x1, . . . , xn) kann in konjuktiverNormalform (KNF) dargestellt werden

• d.h.ϕ(x1, . . . , xn) =

^Ci ,

• hierbei haben die Klauseln Ci die Form

Ci = ai1y1 ∨ . . . ∨ ainyn mit aij ∈ {0, 1} und yi ∈ {xi , xi}.

Beispiel

ϕ(x1, x2, x3) = (x1 ∨ x2) ∧ (x1 ∨ x2 ∨ x3) ∧ x3.

100 / 112

Zwei Anwendungen

Erfüllbarkeitsproblem

• gegeben eine Boolesche Funktion ϕ in KNF,

• entscheide, ob ϕ den Wert 1 annehmen kann.

• d.h.: kann eine Belegung der Variablen gefunden werden derart, dassjede Klausel Ci den Wert 1 annimmt?

• das Problem kann man mit Ungleichungssystemen modellieren:

• in der Klausel Ci = ai1y1 + . . . ainyn ersetzen wir xj durch 1− xj

• wir haben dann das Problem: gibt es eine Lösung mit ganzzahligenxj ∈ {0, 1} derart, dass

ai1y1 + . . . ainyn ≥ 1 ?

101 / 112

Zwei Anwendungen

Beispiel

• sei C = x2 ∨ x5 ∨ x7

• dann ist C erfüllbar, wenn es eine ganzzahlige {0, 1}-Lösung derUngleichung

x2 + (1− x5) + x7 ≥ 1 ←→ −x2 + x5 − x7 ≤ 0

gibt.

• Das Erfüllbarkeitsproblem fragt also nach einer ganzzahligen{0, 1}-Lösung des aus allen Klauseln gebildeten Ungleichungssystems.

102 / 112

Zwei AnwendungenWir betrachten folgenden Spezialfall:

2-Sat

• gegeben eine Boolesche Funktionen f in KNF mit höchstens2 Variablen pro Klausel

• ist f erfüllbar ?

2-SAT kann mit dem FM-Verfahren effizient gelöst werden:

• eine 2-SAT-KNF hat höchstens n2 Klauseln

• wir können annehmen, dass keine zwei Klauseln(xi ∨ xj ), (xi ∨ xj ) existieren

• die sind genau dann erfüllbar, wenn xj = 1

103 / 112

Zwei Anwendungen

Beispiel

• wann sind zwei Klauseln C1 = (xk ∨ xs) und C2 = (xk ∨ xl ) simultanerfüllbar?

• offensichtlich genau dann, wenn C = (xs ∨ xl ) erfüllbar ist

• die entspricht aber einem Schritt der FM-Elimination:

C1 = xk ∨ xs

C2 = xk ∨ xl

C = xs ∨ xl

←→−xk − xs ≤ −1xk − xl ≤ 0

− xs − xl ≤ −1

• C ist die sog. Resolvente der Klauseln C1 und C2

• offensichtlich sind C1 und C2 genau dann gleichzeitig erfüllt, wennihre Resolvente C erfüllt ist

• im Ungleichungssystem entspricht C der Summe der aus C1 undC2 gewonnenen Ungleichungen

104 / 112

Zwei Anwendungen

Dann gilt:

• bei jeder Addition von Ungleichungen bleiben die Koeffizienten imBereich {−1, 0, +1}

• die Elimination einer Variablen führt wieder auf ein 2-SAT-Problem

Für das allgemeine Erfüllbarkeitsproblem ist gegenwärtig kein effizienter Lö-sungsalgorithmus bekannt.

105 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

• das Erfüllbarkeitsproblem

• stochastische Matrizen

106 / 112

Zwei Anwendungen

• in Anwendungssimulationen betrachtet man Systeme, die sich zu jedem(diskreten) Zeitpunkt in einem von n Zuständen {Z1, . . . , Zn} befinden

Beispiel1 2

3 4

• ein Spieler hält sich in einem der vier Punkte auf

• in jedem Schritt

• bleibt er mit Wahrscheinlichkeit 12 da, wo er ist

• oder geht mit Wahrscheinlichkeit 14 entlang einer Kante

107 / 112

Zwei Anwendungen

• wir nehmen allgemein an, dass das System mit Wahrscheinlichkeit

mij = Pr (Zi |Zj )

in den Zustand Zi übergeht, wenn es vorher im Zustand Zj war.

• die entsprechende Übergangsmatrix

M = [mij ] ∈ Rn×n

hat nur nichtnegative Koeffizienten mij ≥ 0 und SpaltensummenPni=1 mij = 1.

• M ist eine stochastische Matrix: alle Spalten sindWahrscheinlichkeitsverteilungen

• in unserem Beispiel hätte M die Form

M =

0BBB@12

14

14 0

14

12 0 1

414 0 1

214

0 14

14

12

1CCCA108 / 112

Zwei Anwendungen• nehmen wir an, dass sich das System zum Zeitpunkt t mit der

Wahrscheinlichkeit πi im Zustand Zi befindet (i = 1, . . . , n).

• die Wahrscheinlichkeit, sich zum Zeitpunkt t + 1 im ZustandZk (k = 1, . . . , n) zu befinden ist:

π′k =nX

i=1

mki πi

• in Matrixnotation haben wir also:

π′ = Mπ (π = [π1, . . . , πn], π′ = [π′1, . . . , π

′n]).

109 / 112

Zwei Anwendungen• sei in unserem Beispiel π = [1, 0, 0, 0]

• dann ist π′ = [ 12 , 1

4 , 14 , 0]

• nach zwei Schritten π′′ = [ 38 , 2

8 , 28 , 1

8 ]

• d.h. die Wahrscheinlichkeiten verändern sich von Schritt zu Schritt

• dieser Prozess wirft zumindest zwei Fragen auf:

• existiert eine Grenzverteilung?

• existiert eine Startverteilung, die sich nicht ändert?

• wir beantworten die zweite Frage

• π heiße stationär, wenn π′ = Mπ = π

• eine stationäre Wahrscheinlichkeitsverteilung ist somit ein (rechter)Eigenvektor von M zum Eigenwert λ = 1

110 / 112

Zwei Anwendungen

Proposition 16

Die stochastische Matrix M = [mij ] besitzt eine stationäreWahrscheinlichkeitsverteilung.

Beweis:

• wir setzen A = M − I .

• es genügt zu zeigen, dass

Ax = 0, x ≥ 0, x 6= 0

eine Lösung hat

• diese können wir dann auf Koeffizientensumme 1 normieren underhalten das gewünschte π.

111 / 112

Zwei Anwendungen• wir nehmen an, dass keine solche Lösung existiert

• dann gäbe es nach dem Alternativsatz von Gordan (Korollar 10) einenVektor y mit der Eigenschaft

0T > yT A = yT M − yT d.h. yj >

nXi=1

mij yi für alle j = 1, . . . , n.

• für yk = min{y1, . . . , yn} gilt aber

nXi=1

mik yi ≥nX

i=1

mik yk = yk .

• somit muss eine stationäre Verteilung existieren.

• in unserem Beispiel ist π = [ 14 , 1

4 , 14 , 1

4 ] eine stationäre Verteilung.

112 / 112

top related