organisatorisches operations research · operations research gliederung der inhalte 1. theorie...

28
Operations Research Rainer Schrader Zentrum für Angewandte Informatik Köln 20. April 2007 1 / 112 Organisatorisches Dozent: Prof. Dr. Rainer Schrader Weyertal 80 Tel.: 470-6030 email: [email protected] Übungen: Dipl.-Inf. Anna Schulze Weyertal 80 el.: 470-6050 email: [email protected] url: www.zaik.uni-koeln.de/AFS 2 / 112 Organisatorisches Ort: Hörsaal Mathematisches Institut Zeit: Mo, Do 8–10 Teilnehmerkreis: Wirtschaftsmathematik Mathematik Voraussetzungen: Grundkenntnisse in linearer Algebra und Analysis Grundkenntnisse in Informatik hilfreich, aber nicht notwendig Vorlesung weitgehend aus sich selbst heraus verständlich Folien hängen im Netz (jeweils am Ende der Woche) 3 / 112 Organisatorisches Übungsorganisation: -→ Anna Schulze Anmeldung zu den Übungen über Homepage ab Mo, 2. April 2007 Scheinerwerb über Übungsteilnahme und Klausur Voraussetzungen für die Teilnahme an der Abschlussprüfung: aktive Teilnahme an den Übungen 50% der Punkte aus den Übungen 4 / 112

Upload: others

Post on 31-Aug-2019

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Operations Research

Rainer Schrader

Zentrum für Angewandte Informatik Köln

20. April 2007

1 / 112

Organisatorisches

• Dozent: Prof. Dr. Rainer Schrader

• Weyertal 80• Tel.: 470-6030• email: [email protected]

• Übungen: Dipl.-Inf. Anna Schulze

• Weyertal 80• el.: 470-6050• email: [email protected]

• url: www.zaik.uni-koeln.de/AFS

2 / 112

Organisatorisches

• Ort: Hörsaal Mathematisches Institut

• Zeit: Mo, Do 8–10

• Teilnehmerkreis:

• Wirtschaftsmathematik• Mathematik

Voraussetzungen:

• Grundkenntnisse in linearer Algebra und Analysis

• Grundkenntnisse in Informatik hilfreich, aber nicht notwendig

• Vorlesung weitgehend aus sich selbst heraus verständlich

• Folien hängen im Netz (jeweils am Ende der Woche)

3 / 112

Organisatorisches

• Übungsorganisation: −→ Anna Schulze

• Anmeldung zu den Übungen über Homepage ab Mo, 2. April 2007

• Scheinerwerb über Übungsteilnahme und Klausur

• Voraussetzungen für die Teilnahme an der Abschlussprüfung:

• aktive Teilnahme an den Übungen

• 50% der Punkte aus den Übungen

4 / 112

Page 2: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Organisatorisches

Literatur:

• U. Faigle, W. Kern und G. Still: Algorithmic Principles of MathematicalProgramming. Kluwer Academic Publishers 2002.

• David G. Luenberger: Linear and Nonlinear Programming,Addison-Wesley 1984

• A. Schrijver: Theory of Linear and Integer Programming, Wiley

5 / 112 6 / 112

7 / 112 8 / 112

Page 3: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

9 / 112 10 / 112

Operations Research

Gliederung der Inhalte

1. Theorie linearer Ungleichungen

2. Polyeder und Polytope

3. Konvexe Funktionen

4. die Simplexmethode

5. ganzzahlige lineare Programme

6. Flüsse in Netzwerken

11 / 112

Theorie linearer Ungleichungssysteme

12 / 112

Page 4: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

13 / 112

Grundbegriffe

• wir betrachten Ungleichungssysteme der Form

aTi x ≤ bi (i ∈ I)

• dabei ist I eine (endliche oder unendliche) Indexmenge

• die Parameter

aTi = [ai1,, . . . , ain] ∈ Rn und bi ∈ R

sind als gegeben vorausgesetzte Vektoren und reelle Zahlen

14 / 112

Grundbegriffe

• für die Anwendungen ist es oft notwendig, sich auf den rationalenZahlkörper Q zu beschränken.

15 / 112

Grundbegriffe

Wir betrachten das Problem:

• bestimme ein x ∈ Rn , das alle Ungleichungen

nXj=1

aij xj ≤ bi (i ∈ I)

erfüllt,

• oder stelle fest, dass kein solches x existiert.

16 / 112

Page 5: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

• mit A = [aij ] bezeichnen wir die (möglicherweise unendliche) Matrixmit den n-dimensionalen Zeilenvektoren aT

i

• d.h. A ist die Abbildung

A : I × {1, . . . , n} → R mit A(i , j) = aij

• entsprechend ist b = [bi ] ∈ RI der Koeffizientenvektor der rechtenSeite des Ungleichungssystems

• wir schreiben das Ungleichungssystem dann kurz als

Ax ≤ b ←→nX

j=1

aij xj ≤ bi (i ∈ I).

17 / 112

Grundbegriffe

• die Lösungsmenge des Ungleichungssystem ist

P(A, b) = {x ∈ Rn | Ax ≤ b}.

Beispiel

• ein lineares Gleichungssystem Ax = b mit A ∈ Rm×n und b ∈ Rm istäquivalent zu dem Ungleichungssystem

Ax ≤ b−Ax ≤ −b

• die Lösungsmenge A = {x ∈ Rn | Ax = b} ist ein affinerTeilraum von Rn

18 / 112

Grundbegriffe

Beispiel

• wir fassen eine Matrix X = [xij ] ∈ Rn×n als n2-dimensionalenKoordinatenvektor auf

• sei X = [xij ] eine Lösung des unendlichen Ungleichungssystems

nXi=1

nXj=1

ai aj xij ≥ 0 für alle [a1, . . . , an] ∈ Rn

xij − xji = 0 i , j = 1, . . . , n

• dann ist X = [xij ] eine positiv semidefinite Matrix

19 / 112

Grundbegriffe

• wir betrachten zunächst einen Spezialfall:

• A besteht nur aus einem einzigen Zeilenvektor aT

• Ist a 6= 0, so ist die Punktmenge

P(a, b) = {x ∈ Rn | aT x ≤ b}

ein (n-dimensionaler) Halbraum

• im Fall a = 0 erhalten wir Rn = P(0, 0) als „trivialen“ Halbraum

• ebenso ist die leere Menge ∅ = P(0,−1) ein trivialer Halbraum

• damit ist die Lösungsmenge eines linearen Ungleichungssystemsimmer Durchschnitt von Halbräumen

20 / 112

Page 6: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

Beispiel (Hyperebenen)

• sei H(a, b) = {x ∈ Rn | aT x = b} eine Hyperebene

• H ist Durchschnitt ihrer zugeordneten Halbräume

H(a, b) = P(a, b) ∩ P(−a,−b)

• bzw. Lösungsmenge des linearen Ungleichungssystemsa1x1 + . . . + anxn ≤ b−a1x1 − . . .− anxn ≤ −b

ff←→ a1x1 + . . . + anxn = b.

21 / 112

Grundbegriffe

• sei S ⊆ Rn

• S heißt konvex, falls

• für alle x, y ∈ S und alle reellen 0 ≤ λ ≤ 1 gilt:

λx + (1− λ)y ∈ S

xx

yy

konvex nicht konvex

22 / 112

Grundbegriffe

• ist P(a, b) ein Halbraum, so ist P(a, b) konvex

• außerdem ist P(a, b) (im Sinn der Analysis) abgeschlossen

• offensichtlich bleibt Abgeschlossenheit und Konvexität unterDurchschnittsbildung erhalten

• somit ist die Lösungsmenge eines linearen Ungleichungssystemskonvex und abgeschlossen

• wir wollen zeigen:

• die konvexen abgeschlossenen Mengen im Rn sind genau dieLösungsmengen von linearen Ungleichungssystemen

• dazu folgendes grundlegendes Lemma:

23 / 112

Grundbegriffe

Lemma 1 (Trennungslemma)

• sei S ⊆ Rn nichtleer, konvex und abgeschlossen

• dann existiert für jedes y ∈ Rn r S ein Vektor c ∈ Rn und einx0 ∈ S derart, dass

cT y > cT x0 ≥ cT x für alle x ∈ S.

y

S

y

Sc

y

S

x

c

0

24 / 112

Page 7: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

y

S

x

c

0

• mit z = cT x0 hat man S ⊆ P(c, z) und y /∈ P(c, z)

• d.h. die Hyperebene H = {x ∈ Rn | cT x = z} trennt den Punkty ∈ Rn von der Menge S ⊆ Rn

• H heißt Stützhyperebene von S im Punkt x0.

25 / 112

Grundbegriffe

Beweis des Trennungslemmas:

(i) das Minimierungsproblemminx∈S‖y − x‖

besitzt eine optimale Lösung x0 ∈ S:

• wir können dazu oBdA annehmen, dass S kompakt ist

• andernfalls beschränken wir uns auf die kompakte Menge

SR = {x ∈ S | ‖y − x‖ ≤ R},

(wobei R > 0 so groß gewählt ist, dass SR 6= ∅ gilt)

• die Funktion x 7→ ‖x − y‖ ist stetig auf Rn

• eine stetige Funktion nimmt auf einem Kompaktum ihre Extremwerte an

• damit existiert eine Minimallösung x0 ∈ S

26 / 112

Grundbegriffe

• für x0 ∈ S gilt‖y − x0‖ = min

x∈S‖y − x‖

• da y /∈ S, folgt x0 6= y

• sei c = y − x0

• wir zeigen, dass c die gewünschten Eigenschaften hat:

(ii) cT x0 < cT y:

• es gilt

cT y − cT x0 = cT (y − x0)

= ‖y − x0‖2

> 0

27 / 112

Grundbegriffe

(iii) cT x0 ≥ cT x für alle x ∈ S:

• sei x ∈ S ein beliebiger Punkt in S

• für 0 < λ < 1 setze z(λ) = x0 + λ(x − x0)

• da S konvex, gilt z(λ) ∈ S

• nach Wahl von x0 folgt

‖c‖2 = ‖y − x0‖2 ≤ ‖y − z(λ)‖2 = ‖c− λ(x − x0)‖2.

• ausmultiplizieren ergibt

−2λcT (x−x0)+λ2‖x−x0‖2 ≥ 0 bzw. −2cT (x−x0)+λ‖x−x0‖2 ≥ 0

• und liefert

cT x − cT x0 = cT (x − x0) ≤12

limλ→0

λ‖x − x0‖2 = 0.

28 / 112

Page 8: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

Bemerkung 1

• die Voraussetzung der Abgeschlossenheit von S im Trennungslemmaist wichtig:

• betrachte die konvexe Menge

S = {(x1, x2) | x 21 + x 2

2 < 1} ⊆ R2

• das Trennungslemma gilt aber nicht.

Bemerkung 2

• Für den Vektor c im Trennungslemma können wir oBdA eine normierteLänge ‖c‖ = 1 fordern.

29 / 112

Grundbegriffe

Satz 2Eine Teilmenge S ⊆ Rn ist genau dann konvex und abgeschlossen, wennS Lösungsmenge eines linearen Ungleichungssystems ist.

Beweis:

• die Lösungsmenge eines linearen Ungleichungssystems ist konvex undabgeschlossen

• zum Beweis der anderen Richtung:

• der Fall S = Rn oder S = ∅ ist trivial

• in allen anderen Fällen erhalten wir nach dem Trennungslemma

S =\y/∈S

Py,

• wobei die Py Halbräume mit S ⊆ Py und y /∈ Py sind.

30 / 112

Grundbegriffe

• sei S ⊆ Rn

• wir können S auf zweierlei Arten eine konvexe Menge zuordnen:

• einmal betrachten wir die Menge aller Konvexkombinationen:

conv S = {kX

i=1

λi si | si ∈ S, λi ≥ 0,

kXi=1

λi = 1}.

• d.h. Linearkombinationen mit nichtnegativen Koeffizienten, die sich zu1 aufsummieren

• conv S ist die konvexe Hülle von S

31 / 112

Grundbegriffe

Beispiel

S Sconv

Bemerkung

conv S ist die kleinste konvexe Menge, die S enthält.

32 / 112

Page 9: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

GrundbegriffeOffensichtlich gilt:

• S ⊆ conv S

• S ⊆ T =⇒ conv S ⊆ conv T

• conv S = conv(conv S)

Lemma 3Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt:

S ist konvex ⇐⇒ S = conv S.

Beweis: Übungsaufgabe

33 / 112

Grundbegriffe

• dual dazu definiert man:

Spol = {x ∈ Rn | sT x ≤ 1 für alle s ∈ S}. (1)

• Spol ist die Polare zu S

• Spol ist Lösungsmenge eines linearen Ungleichungssystems unddeshalb abgeschlossen (und konvex)

• stellen wir uns S als eine Matrix mit den Zeilenvektoren sT vor, so ist

Spol = P(S, 1),

• wobei b = 1 der Vektor mit allen Komponenten bi = 1 bedeutet

34 / 112

Grundbegriffe

Beispiel

(-1,2)

(-1,-1)

(1,0)

Spol

35 / 112

GrundbegriffeMotivation

• sei S ⊆ Rn mit 0 ∈ S

• sei cT x ≤ z eine lineare Ungleichung, die von allen s ∈ S erfüllt wird

• dann gilt z ≥ 0 (wegen 0 ∈ S)

• im Fall z > 0 kann man die Koeffizienten per Division durchz skalieren

• und enthält die äquivalente Ungleichung

cT x ≤ 1 (c = z−1c).

• Spol ist gerade die Menge aller solcher Koordinatenvektoren c.

36 / 112

Page 10: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

GrundbegriffeMan macht sich leicht klar:

• S ⊆ (Spol )pol

• S ⊆ T =⇒ T pol ⊆ Spol

• Spol = (conv S)pol

Satz 4Sei S ⊆ Rn eine beliebige nichtleere Menge mit 0 ∈ S. Dann gilt:

S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .

37 / 112

Grundbegriffe

S ist eine abgeschlossene konvexe Menge ⇐⇒ S = (Spol )pol .

Beweis:

• sei S = (Spol )pol ,

• dann ist ist S Durchschnitt von Halbräumen und somit konvex undabgeschlossen

• sei umgekehrt S konvex und abgeschlossen

• nach Satz 2 existiert ein Ungleichungssystem Ax ≤ b mit S = P(A, b)

• da 0 ∈ S, folgt bi ≥ 0 für jede Komponente bi von b

• nach Skalierung können wir annehmen, dass bi ∈ {0, 1}

38 / 112

Grundbegriffe

• d.h. S = P(A, b) mit bi ∈ {0, 1}

• wir ersetzen jede Ungleichung vom Typ aTi x ≤ 0 durch unendlich viele

Ungleichungen(kai )

T ≤ 1 (k ∈ N)

• dann können wir annehmen, dass S von der Form ist:

S = {x ∈ Rn | aTi x ≤ 1 (i ∈ I)}

• das bedeutet aber ai ∈ Spol für alle i ∈ I

• also A ⊆ Spol und somit

S ⊆ (Spol )pol ⊆ Apol ⊆ S

• d.h.S = (Spol )pol .

39 / 112

Grundbegriffe

• sei Ax ≤ b ein Ungleichungssystem

• als Dimension von Ax ≤ b bezeichnet man gewöhnlich die Anzahln der Variablen xj

• uns interessiert aber auch die Dimension der Lösungsmenge P(A, b)

• für einen Spezialfall ist dies bekannt:

40 / 112

Page 11: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

• die linearen Teilräume L von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:

L = {x ∈ Rn | Ax = 0}.

• die Dimension dimL von L ist:

dimL = max{k | es gibt k linear unabhängige Punkte x1, . . . , xk ∈ L}.

• bzw. dimL = −1 falls L = ∅

• es gilt die Dimensionsformel

dimL = n − rg A (2)

• mit rg A = (Zeilen/Spalten-)Rang von A

• bei Gleichungssystemen darf man (im Gegensatz zuUngleichungssystemen) immer A als endliche Matrix annehmen

41 / 112

Grundbegriffe

• etwas allgemeiner:

• die affinen Teilräume A von Rn sind genau die Lösungsmengen vonlinearen Gleichungssystemen:

A = {x ∈ Rn | Ax = b}.

• jeder nichtleere affine Teilraum A lässt sich schreiben als

A = p + L = {x | x = p + y, y ∈ L}

• hierbei ist p ∈ Rn und L ein linearer Teilraum

• die (affine) Dimension dimA von A ist:

dimA =

dimL, falls A 6= ∅−1, falls A = ∅

42 / 112

Grundbegriffe

• der allgemeine Fall:

• Idee: einer Teilmenge S ∈ Rn ordnen wir die Dimension des kleinstenaffinen Teilraums zu, der S enthält

• seiPk

i=1 λi si eine Linearkombination von Punkten aus S

• die Linearkombination heißt affine Linearkombinationen, wennzuätzlich gilt

kXi=1

λi = 1

• die affine Hülle aff S ist die Menge aller Punkte, die sich als affineLinearkombinationen aus S ausdrücken lassen

43 / 112

Grundbegriffe

• d.h.

aff S = {kX

i=1

λi si | si ∈ S,

kXi=1

λi = 1}.

• aff S ist der kleinste affine Teilraum von Rn , der S enthält

• die affine Dimension von S ist jetzt

dim S := dim aff S.

S

aff S

44 / 112

Page 12: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

• sei S ⊆ Rn eine abgeschlossene konvexe Menge

• sei F ⊆ S eine Teilmenge von S

• F heißt Berührfläche von S, wenn gilt:

(SF0) es gibt einen Vektor a 6= 0 und eine reelle Zahl b ∈ R mit:

(SF1) S ⊆ {x ∈ Rn | aT x ≤ b} = P(a, b)

(SF2) F = {x ∈ S | aT x = b} = S ∩ H(a, b)

• F heißt Seitenfläche von S, wenn F Berührfläche von S ist oderF = S oder F = ∅.

45 / 112

Grundbegriffe

• die Seitenflächen S und ∅ sind die trivialen Seitenflächen

• die anderen sind die nicht-trivialen Seitenflächen

• eine einelementige Seitenfläche F = {v} von S heißtExtrempunkt (oder Ecke) von S

• aus der Definition ergibt sich sofort, dass eine Seitenfläche F vonS selber eine abgeschlossene konvexe Menge ist

• es giltdim F ≤ dim S − 1 ⇐⇒ F 6= S.

• die Extrempunkte von S entsprechen den Seitenflächen F mitdim F = 0

46 / 112

Grundbegriffe

Beispiel

• sei S = {(x1, x2, x3) ∈ R3 | x 21 + x 2

2 + x 23 ≤ 1}.

• die nichttrivialen Seitenflächen von S sind genau die Punkte auf derKugeloberfläche

• dieses sind gleichzeitig auch die Extrempunkte von S

47 / 112

Grundbegriffe

Beispiel

A

B

C

D

E

48 / 112

Page 13: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Grundbegriffe

Beispiel (Stützhyperebenen)

• jede Stützhyperebene H = H(c, b) induziert eine nichtleereSeitenfläche von S, denn:

• sei x0 der Stützpunkt von H

• dann gilt (SF1) wegen

cT x ≤ b = cT x0 für alle x ∈ S

• die Seitenfläche F = S ∩ H enthält x0 und ist folglich nichtleer.

Seitenflächen sind unter Durchschnitten abgeschlossen:

49 / 112

Grundbegriffe

Proposition 5

Sind F1, F2 Seitenflächen der abgeschlossenen konvexen Menge S ⊆ Rn ,dann ist auch F = F1 ∩ F2 eine Seitenfläche von F .

Beweis:

• sei F1 = S ∩ H(a1, b1) und F2 = S ∩ H(a2, b2)

• wir setzen a = a1 + a2 und b = b1 + b2.

• dann gilt nach Voraussetzung für alle x ∈ S:

aT1 x ≤ b1, aT

2 x ≤ b2 und deshalb aT x ≤ b.

• außerdem gilt für x ∈ S:

aT x = b ⇐⇒ aT1 x = b1 und aT

2 x = b2

• und somit F = S ∩ H(a, b).

50 / 112

Grundbegriffe

Bemerkung

Wie schon das Beispiel der Kreisscheibe zeigt, ist die VereinigungF1 ∪ F2 von zwei Seitenflächen im allgemeinen keine Seitenfläche.

51 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

52 / 112

Page 14: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Fourier-Motzkin

• wir diskutieren nun einen Algorithmus zum Lösen linearerUngleichungssysteme

• er ist natürlich nur bei endlichen Systemen praktisch durchführbar,

• aber doch auch bei unendlichen Systemen „im Prinzip“ anwendbar

• wir gehen aus von einem Ungleichungssystem

aTi x =

nXj=1

aij xj ≤ bi (i ∈ I).

• wir wollen nun (ähnlich wie beim Gauss-Verfahren) die Variablen xj derReihe nach eliminieren

• wegen der Ungleichungen können wir aber nur mit positiven Zahlenskalieren

• wir beginnen mit z.B. x1.

53 / 112

Fourier-Motzkin• seien

I+ = {i ∈ I | ai1 > 0},I− = {i ∈ I | ai1 < 0},I0 = {i ∈ I | ai1 = 0}.

• dividieren wir die Ungleichungen in I1 und I2 jeweils durch |ai1|, soerhalten wir das äquivalente System

x1 +Xj=2

a′rj xj ≤ b′r (r ∈ I+)

−x1 +Xj=2

a′sj xj ≤ b′s (s ∈ I−)Xj=2

atj xj ≤ bt (t ∈ I0)

(3)

54 / 112

Fourier-Motzkin

x1+Xj=2

a′rj xj ≤ b′r (r ∈ I+)

−x1+Xj=2

a′sj xj ≤ b′s (s ∈ I−) (3)

Xj=2

atj xj ≤ bt (t ∈ I0)

• x = (x1, x2, . . . , xn) ist also genau dann zulässige Lösung, wenn gilt:

(i) (x2, . . . , xn) erfülltnX

j=2

atj xj ≤ bt für alle t ∈ I0

(ii) −b′s +nX

j=2

a′sj xj ≤ x1 ≤ b′r −nX

j=2

a′rj xj für alle r ∈ I+, s ∈ I−

55 / 112

Fourier-MotzkinBeobachtung: Das System

(ii) −b′s +nX

j=2

a′sj xj ≤ x1 ≤ b′r −nX

j=2

a′rj xj für alle r ∈ I+, s ∈ I−

ist genau dann erfüllbar, wenn das folgende System erfüllbar ist:

(iii)nX

j=2

(a′rj + a′sj )xj ≤ b′r + b′s für alle r ∈ I+ und s ∈ I−.

denn:

• (ii)⇒ (iii): addiere je eine Ungleichung r ∈ I+, s ∈ I−• (iii)⇒ (ii): für alle r ∈ I+, s ∈ I− gilt

−b′s +nX

j=2

a′sj xj ≤ b′r −nX

j=2

a′rj xj

• und somit (mit inf ∅ = +∞, sup ∅ = −∞)

sups∈I−

`− b′s +

nXj=2

a′sj xj´≤ inf

r∈I+

`b′r −

nXj=2

a′rj xj´

56 / 112

Page 15: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Fourier-Motzkin• in diesem Fall können wir jedes x1 wählen mit

sups∈I−

`− b′s +

nXj=2

a′sj xj´≤ x1 ≤ inf

r∈I+

`b′r −

nXj=2

a′rj xj´

(4)

• somit:

• erfüllt (x2, . . . , xn) die Ungleichungen (i) und (iii),

• so lässt sich x1 per Rücksubstitution aus (4) bestimmen

• danach erfüllt (x1, . . . , xn) die Ungleichungen (i) und (ii)

57 / 112

Fourier-Motzkin

• zusammengefasst:

Lemma 6Das System (3) ist genau dann lösbar, wenn das System

(i)nX

j=2

atj xj ≤ bt (t ∈ I0)

(iii)nX

j=2

(a′rj + a′sj )xj ≤ br + bs (r ∈ I+, s ∈ I−)

lösbar ist.

58 / 112

Fourier-Motzkin

Lemma 6 führt auf eine rekursive Beschreibung des Eliminationsverfahrensbzgl. (3):

Fourier-Motzkin-Elimination

(1) berechne rekursiv eine Lösung (x2, . . . , xn) für das System (i) & (iii);

(2) wenn keine Lösung existiert: stop

(3) berechne x1 mit Rückwärtssubstitution nach (4)

59 / 112

Fourier-MotzkinBeispiel:

3x + y − 2z ≤ 1− 2y − 4z ≤ −14

−x + 3y − 2z ≤ −2y + 4z ≤ 13

2x − 5y + z ≤ 0

es ist:

I+ = {1, 5} I− = {3} I0 = {2, 4}Normierung ergibt:

x + 13 y − 2

3 z ≤ 13

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

− 2y − 4z ≤ −14y + 4z ≤ 13

60 / 112

Page 16: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Fourier-Motzkinx + 1

3 y − 23 z ≤ 1

3

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

− 2y − 4z ≤ −14y + 4z ≤ 13

Elimination von x ergibt:

103 y − 8

3 z ≤ − 53

12 y − 3

2 z ≤ −2− 2y − 4z ≤ −14

y + 4z ≤ 13

Normierung ergibt:

y − 810 z ≤ − 1

2

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

61 / 112

Fourier-Motzkiny − 8

10 z ≤ − 12

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

Elimination von y ergibt:

− 2810 z ≤ − 15

2

− 5z ≤ −112z ≤ 6

Normierung ergibt:

z ≤ 3

− z ≤ − 15056

− z ≤ − 115

62 / 112

Fourier-Motzkinz ≤ 3

− z ≤ − 15056

− z ≤ − 115

Somit äquivalent dazu:

• 15056 ≤ z ≤ 3

• eine möglich Lösung wäre z.B. z = 3

• ein weiterer Eliminationsschritt liefert:

0 ≤ 3 + 15656

0 ≤ 3− 115

63 / 112

Fourier-MotzkinBerechnung der anderen Komponenten:

• Einsetzen von z = 3 in

y − 810 z ≤ − 1

2

y − 3z ≤ −4y + 4z ≤ 13

− y − 2z ≤ −7

• lieferty ≤ 19

10

y ≤ 5y ≤ 1

− y ≤ −1

• und somit y = 1

64 / 112

Page 17: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Fourier-Motzkin• Einsetzen von y = 1 und z = 3 in

x + 13 y − 2

3 z ≤ 13

x − 52 y + 1

2 z ≤ 0− x + 3y − 2z ≤ −2

• liefert:

x ≤ 2x ≤ 2

− x ≤ 1

• und somit z.B. x = 2.

65 / 112

Fourier-MotzkinZusammenfassung:

• das FM-Verfahren führt nur zwei Operationen aus:

(i) Multiplikation einer Ungleichung mit einer positiven Zahl

(ii) Addition von zwei Ungleichungen

• damit gilt nach jeder Elimination einer Variablen:

• jede der neuen Ungleichungen ist eine Linearkombination vonhöchstens zwei Ungleichungen des vorigen Systems mit positivenKoeffizienten

• gilt für eine Variable I+ = ∅ (I− = ∅), so ist das System lösbar

• wenn alle Variablen eliminiert sind, sind die Koeffizienten auf der linkenSeite des Systems Null

• dann ist das System genau dann lösbar, wenn die Koeffizienten auf derrechten Seite alle nichtnegativ sind.

66 / 112

Fourier-MotzkinBemerkung:

• sei Ax ≤ b ein System mit m Ungleichungen

• nach der Elimination einer Variablen kann das resultierende Systemm2

4 Ungleichungen haben

• d.h. die Anzahl der Ungleichungen kann explodieren

• daher ist das Fourier-Motzkin-Verfahren nicht sehr effizient.

67 / 112

Fourier-MotzkinAnwendung: Projektionen

• wir betrachten die Projektionsabbildung π : Rn → Rn−1

• π ist gegeben durch

π(x1, x2, x3 . . . , xn) = (x2, x3, . . . , xn).

• Projektionen von konvexen Mengen sind konvex

• weiter ist π stetig

• daher ist die Projektion einer abgeschlossenen konvexen Menge wiederabgeschlossen und konvex

• d.h. die Projektion der Lösungsmenge eines linearenUngleichungssystems ist selber Lösungsmenge eines linearenUngleichungssystems

• die interessante Aussage des folgenden Lemmas ist der Erhalt derEndlichkeit

68 / 112

Page 18: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Fourier-Motzkin

Lemma 7 (Projektionslemma)

Sei A ∈ Rm×n und b ∈ Rm gegeben. Dann existiert eine endliche MatrixB ∈ Rk×(n−1) und ein Vektor d ∈ Rk derart, dass gilt

π[P(A, b)] = P(B, d).

Beweis:

• sei Bx ≤ d das lineare Ungleichungssystem, das sich ausAx ≤ b nach FM-Elimination von x1 ergibt

• aus der Rücksubstitutionsregel (4) ergibt sich

(x∗2 , . . . , x∗n ) ∈ P(B, d) ⇐⇒ es gibt ein x∗1 ∈ R mit (x∗1 , x∗2 , . . . , x∗n ) ∈ P(A, b)

• das ist aber genau die Behauptung P(B, d) = π[P(A, b)] .

69 / 112

Fourier-Motzkin

Bemerkung

• Der Beweis des Projektionslemmas ist konstruktiv

• mit dem FM-Verfahren kann man eine geeignete Matrix B und einen

geeigneten Vektor d berechnen.

70 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

71 / 112

Alternativsätze

• wir betrachten ein Ungleichungssystem Ax ≤ b

• Fourier-Motzkin liefert ein Verfahren, um die Lösbarkeit zu testen

• wir werden im folgenden die Lösbarkeit charakterisieren

72 / 112

Page 19: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Alternativsätze

Satz 8 (Alternativsatz)

Genau eine der Aussagen ist richtig:

(i) das System Ax ≤ b besitzt eine Lösung

(ii) es gibt einen nichtnegativen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass

yT A = 0T und yT b < 0 .

Bemerkung

• da nur endlich viele Komponenten von y von 0 verschieden sind,

• gibt es eine endliche Teilmenge I ′ ⊆ I derart, dass

yT A =Xi∈I′

yi aTi und yT b =

Xi∈I′

yi bi

• damit sind die Ausdrücke yT A und yT b im Satz wohldefiniert.73 / 112

AlternativsätzeSatz 8 (Alternativsatz)Genau eine der Aussagen ist richtig:

(i) Das System Ax ≤ b besitzt eine Lösung.

(ii) Es gibt nichtnegativen einen Vektor y ∈ RI mit nur endlich vielenpositiven Komponenten derart, dass yT A = 0T und yT b < 0 .

Beweis:

• die Aussagen können nicht gleichzeitig gelten

• andernfalls würde folgen: 0 = 0T x = yT Ax ≤ yT b < 0

• angenommen (i) ist falsch

• nach der FM-Elimination aller Variablen existiert eine Ungleichung derForm 0 ≤ t mit t < 0

• diese Ungleichung ist nichtnegative Linearkombination von höchstenszwei Ungleichungen des Systems davor

74 / 112

Alternativsätze

• diese sind wiederum nichtnegative Linearkombinationen von höchstenszwei Ungleichungen des Systems davor

•...

• damit existiert ein nichtnegativer Vektor y mit höchstens 2n positivenEinträgen, so dass yT A = 0T und yT b < 0.

• ist das Systems Ax ≤ b endlich, so ist der obige Alternativsatz auchals Lemma von Farkas bekannt

• wir werden später noch eine andere Form des Lemmas von Farkasbehandeln

75 / 112

Alternativsätze

Korollar 9Das System Ax ≤ b ist nicht lösbar genau dann, wenn ein endlichesTeilsystem A′x ≤ b′ nicht lösbar ist.

Beweis:

• eine Lösung x∗ von Ax ≤ b ist natürlich auch eine Lösung desTeilsystems A′x ≤ b′

• ist Ax ≤ b nicht lösbar, so gilt Alternative (ii) im Satz 8

• die Alternative (ii) bezieht sich auf ein endliches Teilsystem

• also ist auch dieses nicht lösbar.

76 / 112

Page 20: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Alternativsätze

Korollar 10 (Gordan)

Sei A ∈ Rm×n eine Matrix. Dann gilt genau eine der Aussagen:

(i) Ax = 0, x ≥ 0 hat eine Lösung x∗ 6= 0.

(ii) yT A < 0T hat eine Lösung.

Beweis: Übung.

Bemerkung

x < y bedeutet, dass die Relation xj < yj für alle Komponenten gilt.

77 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

78 / 112

Seitenflächen

• sei S ⊆ Rn eine beliebige nicht-leere Teilmenge

• sei cT x ≤ z eine lineare Ungleichung

• S impliziert die Ungleichung cT x ≤ z , wenn gilt:

cT x ≤ z für alle x ∈ S

• ebenso sagt man, dass cT x ≤ z eine für S gültige Ungleichung ist

• diese Implikation erlaubt zwei Interpretationen:

79 / 112

SeitenflächenOptimierung:

(i) supx∈S cT x ≤ z .

(ii) F = {x ∈ S | cT x = z} ist die Menge aller Optimallösungen desentsprechenden Maximierungsproblems.

Geometrie:

(i) Der Halbraum P(c, z) = {x ∈ Rn | cT x ≤ z} enthält S.

(ii) F = {x ∈| cT x = z} ist eine Seitenfläche von S.

80 / 112

Page 21: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Seitenflächen

• analog:

• seien Ax ≤ b ein Ungleichungssystem und cT x ≤ z eine Ungleichung

• cT x ≤ z wird von Ax ≤ b impliziert, wenn gilt:

Ax∗ ≤ b =⇒ cT x∗ ≤ z für alle x∗ ∈ Rn .

• die zweite Form des Farkas-Lemmas ist nun:

Lemma 11 (Farkas)

Sei Ax ≤ b ein endliches lösbares lineares Ungleichungssystem. Dann wirdcT x ≤ z genau dann von Ax ≤ b impliziert, wenn es einen Vektory ≥ 0 gibt mit

cT = yT A und yT b ≤ z .

81 / 112

SeitenflächenBeweis:

(i) sei y ≥ 0 so, dass cT = yT A und yT b ≤ z

• für jede Lösung x von Ax ≤ b gilt dann yT (b− Ax) ≥ 0

• und somitcT x = yT Ax ≤ yT b ≤ z

• die Bedingung ist also hinreichend

• zum Beweis der Rückrichtung betrachten wir das System

Ax ≤ b−cT x ≤ −(z + ε)

• nach Annahme hat dieses System für kein ε > 0 eine Lösung

• führe FM-Elimination durch (unabhängig von ε)

• aus der Endlichkeit des Systems folgt:

82 / 112

Seitenflächen• es existiert ein Vektor y ≥ 0 und ein Skalar y0 ≥ 0 mit

yT A − y0c = 0 und yT b − y0(z + ε) < 0

• wäre y0 = 0, so hätten wir

yT A = 0 und yT b < 0

• nach dem Alternativsatz 8 hätte dann das System Ax ≤ b keineLösung, im Widerspruch zur Voraussetzung

• somit ist y0 > 0 und wir können nach Division durch y0 annehmen:

yT A = c und yT b < (z + ε)

• da dies für alle ε > 0 gilt, folgt yT b ≤ z .

83 / 112

Seitenflächen

Bemerkung

• das Farkas-Lemma kann auf unendliche Ungleichungssysteme mitkompakter Lösungsmenge S = P(A, b) verallgemeinert werden

• ohne diese Zusatzannahme ist das Farkas-Lemma bei unendlichenSystemen falsch:

Beispiel

• sei S = {(x , y ) ∈ R2 | x > 0, y ≥ 1/x}• S ist Lösungsmenge des unendlichen Ungleichungssystems

1r 2 x + y ≥ 2

r(r ∈ R, r > 0)

• die Ungleichung x ≥ 0 gilt offenbar für S

• sie lässt sich aber nicht als positive (endliche) Linearkombination ausdem System ableiten.

84 / 112

Page 22: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Seitenflächen

Die zweite Form des Farkas-Lemmas liefert eine Methode, wie man im Prinzipalle Seitenflächen von S = P(A, b) konstruieren kann:

• wir nehmen oBdA S 6= ∅ an

• sei AF x ≤ bF ein Teilsystem von Ax ≤ b

• sei cT = 1T AF der Summenvektor aller Zeilenvektoren von AF

• entsprechend sei z = 1T bF die Summe der rechten Seiten

• dann ist ist die Ungleichung cT x ≤ z für S gültig

• denn für alle x ∈ P(A, b) gilt:

cT x = 1T AF x ≤ 1T bF = z

85 / 112

Seitenflächen

• wegen AF x ≤ bF gilt:

1T AF x = 1T bF ⇐⇒ AF x = bF

• somit bestimmt die Teilmatrix AF eine Seitenfläche

F = {x ∈ S | cT x = z} = {x ∈ Rn | Ax ≤ b, AF x = bF }

• es bleibt zu zeigen, dass man auf diese Weise alle nichttrivialenSeitenflächen von P(A, b) erhält

• sei dazu F eine beliebige nichtleere Seitenfläche, d.h.

F = {x ∈ Rn | Ax ≤ b, cT x = z}

86 / 112

Seitenflächen

• nach dem Farkas-Lemma existiert ein Vektor y ≥ 0 derart, dass

cT = yT A und yT b ≤ z .

• wenn wir y auf seine positiven Komponenten einschränken, erhaltenwir eine endliche Teilmatix AF und ein y ≥ 0 derart, dass

cT = yT AF und yT bF ≤ z .

• da F 6= ∅, gilt z = yT bF , denn:

x ∈ F =⇒ z = cT x = yT AF x ≤ yT bF ≤ z .

• daraus folgt:

• F besteht genau aus den Punkten x ∈ P(A, b), die die GleichungAF x = bF erfüllen, d.h.

F = {x ∈ Rn | Ax ≤ b, AF x = bF }.

87 / 112

Seitenflächen

Beispiel

• das Standardsimplex in Rn ist die Menge

∆n = {(x1, . . . , xn) | x1 + . . . + xn = 1, x1 ≥ 0, . . . , xn ≥ 0}.

• ein Eckpunkt von ∆n entspricht einer einelementigen Seitenfläche

• und damit einer Auswahl von Ungleichungen derart, dass daszugeordnete Gleichungssystem nur eine einzige Lösung in∆n gestattet.

• also ergeben sich genau die n Einheitsvektoren als die Ecken von ∆n .

x

x

x

1

2

3

1

1

1

88 / 112

Page 23: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Seitenflächen

Satz 12Ist Ax ≤ b ein endliches Ungleichungssystem, so hat die abgeschlossenekonvexe Menge P(A, b) nur endlich viele verschiedene Seitenflächen.

Beweis: Ax ≤ b hat nur endlich viele verschiedene Teilsysteme AF x ≤bF .

Beispiel

Die KugelS = {(x , y , z) ∈ Rn | x 2 + y 2 + z2 ≤ R}

lässt sich nicht als Lösungsmenge eines endlichen linearenUngleichungssystem darstellen, denn S hat unendlich viele Extrempunkte.

89 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

90 / 112

konvexe Kegel

wir betrachten jetzt eine spezielle Klasse von Ungleichungssystemen

eine nichtleere Menge K ⊆ Rn ist ein (konvexer) Kegel, wenn gilt:

(K1) λx ∈ K für alle x ∈ K und Skalare λ ≥ 0

(K2) x + y ∈ K für alle x, y ∈ K

• ein konvexer Kegel ist also eine unter nichtnegativenLinearkombinationen abgeschlossene Menge

• ein nichtleerer Kegel enthält immer zumindest den Punkt 0 ∈ Rn

91 / 112

konvexe Kegel

Beispiel

x

x

x

1

2

3

x

x

x

1

2

3

• jeder nichtleeren Menge S ⊆ Rn kann man auf zwei (zueinander„duale“) Weisen einen Kegel zuordnen.

• zum einen betrachtet man die Menge aller nichtnegativenLinearkombinationen:

92 / 112

Page 24: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

konvexe Kegel

• cone S ist die konische Hülle von S oder der von S erzeugteKegel:

cone S = {kX

i=1

λi si |, si ∈ S, λi ≥ 0} (5)

Beispiel

• sei A ∈ Rm×n eine Matrix mit Spalten A1, . . . , An

• dann bezeichnet cone A den von den Spalten von A erzeugten Kegel

cone A = {nX

i=1

λi Ai |, λi ≥ 0}

93 / 112

konvexe Kegel

• dual dazu definieren wir

S◦ = {x ∈ Rn | sT x ≤ 0 für alle s ∈ S}. (6)

• ist S ein Kegel, so ist S◦ ist der zu S duale Kegel

• S◦ ist Lösungsmenge eines linearen Ungleichungssystems und daherabgeschlossen (und konvex)

• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt

S◦ = P(S, 0).

• für konvexe Kegel sind die Polare und der duale Kegel identisch:

94 / 112

konvexe Kegel

Lemma 13Sei K ⊆ Rn ein konvexer Kegel. Dann gilt

K ◦ = K pol .

Beweis:

• es gilt K ◦ ⊆ K pol , denn

cT x ≤ 0 =⇒ cT x ≤ 1 für alle x ∈ K .

• sei umgekehrt c ∈ K pol , d.h. cT x ≤ 1 für alle x ∈ K

• mit x ∈ K ist auch λx ∈ K für alle λ ≥ 0

• d.h. λ(cT x) ≤ 1 für alle λ ≥ 0

• somit cT x ≤ 0 und K pol ⊆ K ◦.

95 / 112

konvexe Kegel

Analog der Argumentation bei der Polaren macht sich leicht klar:

• S ⊆ (S◦)◦.

• S ⊆ T =⇒ T ◦ ⊆ S◦.

• S◦ = (cone S)◦.

Satz 14Sei S ⊆ Rn eine beliebige nichtleere Menge. Dann gilt

(i) S ist ein konvexer Kegel ⇐⇒ S = cone S.

(ii) S ist ein abgeschlossener konvexer Kegel ⇐⇒ S = (S◦)◦.

Beweis:

• der Beweis von Behauptung (i) ist Routine

• Aussage (ii) ist der Spezialfall der analogen Aussage über die Polarekonvexer Kegel.

96 / 112

Page 25: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

konvexe Kegel

Korollar 15Sei A ∈ Rm×n eine Matrix. Dann gilt:

cone A = P(AT , 0)◦.

Beweis:

• für eine beliebige Menge S haben wir gesehen:

• fassen wir S als Matrix mit den Zeilenvektoren sT auf, so gilt

S◦ = P(S, 0).

• speziell für S = cone A gilt dann:

(cone A)◦ = P(AT , 0).

• wegen K = (K ◦)◦ für konvexe Kegel, folgt:

cone A = ((cone A)◦)◦ = P(AT , 0)◦.

97 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

• das Erfüllbarkeitsproblem

• stochastische Matrizen

98 / 112

Zwei Anwendungen

Wir rechnen über dem Zahlenbereich {0, 1} mit den Operationen:

• „oder“

∨ 0 10 0 11 1 1

• „und“

∧ 0 10 0 01 0 1

• und der Negation:− 0 1

1 0

99 / 112

Zwei Anwendungen

• eine Boolesche Funktion ist eine Funktion ϕ : {0, 1}n → {0, 1}

• jede Boolesche Funktion ϕ(x1, . . . , xn) kann in konjuktiverNormalform (KNF) dargestellt werden

• d.h.ϕ(x1, . . . , xn) =

^Ci ,

• hierbei haben die Klauseln Ci die Form

Ci = ai1y1 ∨ . . . ∨ ainyn mit aij ∈ {0, 1} und yi ∈ {xi , xi}.

Beispiel

ϕ(x1, x2, x3) = (x1 ∨ x2) ∧ (x1 ∨ x2 ∨ x3) ∧ x3.

100 / 112

Page 26: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Zwei Anwendungen

Erfüllbarkeitsproblem

• gegeben eine Boolesche Funktion ϕ in KNF,

• entscheide, ob ϕ den Wert 1 annehmen kann.

• d.h.: kann eine Belegung der Variablen gefunden werden derart, dassjede Klausel Ci den Wert 1 annimmt?

• das Problem kann man mit Ungleichungssystemen modellieren:

• in der Klausel Ci = ai1y1 + . . . ainyn ersetzen wir xj durch 1− xj

• wir haben dann das Problem: gibt es eine Lösung mit ganzzahligenxj ∈ {0, 1} derart, dass

ai1y1 + . . . ainyn ≥ 1 ?

101 / 112

Zwei Anwendungen

Beispiel

• sei C = x2 ∨ x5 ∨ x7

• dann ist C erfüllbar, wenn es eine ganzzahlige {0, 1}-Lösung derUngleichung

x2 + (1− x5) + x7 ≥ 1 ←→ −x2 + x5 − x7 ≤ 0

gibt.

• Das Erfüllbarkeitsproblem fragt also nach einer ganzzahligen{0, 1}-Lösung des aus allen Klauseln gebildeten Ungleichungssystems.

102 / 112

Zwei AnwendungenWir betrachten folgenden Spezialfall:

2-Sat

• gegeben eine Boolesche Funktionen f in KNF mit höchstens2 Variablen pro Klausel

• ist f erfüllbar ?

2-SAT kann mit dem FM-Verfahren effizient gelöst werden:

• eine 2-SAT-KNF hat höchstens n2 Klauseln

• wir können annehmen, dass keine zwei Klauseln(xi ∨ xj ), (xi ∨ xj ) existieren

• die sind genau dann erfüllbar, wenn xj = 1

103 / 112

Zwei Anwendungen

Beispiel

• wann sind zwei Klauseln C1 = (xk ∨ xs) und C2 = (xk ∨ xl ) simultanerfüllbar?

• offensichtlich genau dann, wenn C = (xs ∨ xl ) erfüllbar ist

• die entspricht aber einem Schritt der FM-Elimination:

C1 = xk ∨ xs

C2 = xk ∨ xl

C = xs ∨ xl

←→−xk − xs ≤ −1xk − xl ≤ 0

− xs − xl ≤ −1

• C ist die sog. Resolvente der Klauseln C1 und C2

• offensichtlich sind C1 und C2 genau dann gleichzeitig erfüllt, wennihre Resolvente C erfüllt ist

• im Ungleichungssystem entspricht C der Summe der aus C1 undC2 gewonnenen Ungleichungen

104 / 112

Page 27: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Zwei Anwendungen

Dann gilt:

• bei jeder Addition von Ungleichungen bleiben die Koeffizienten imBereich {−1, 0, +1}

• die Elimination einer Variablen führt wieder auf ein 2-SAT-Problem

Für das allgemeine Erfüllbarkeitsproblem ist gegenwärtig kein effizienter Lö-sungsalgorithmus bekannt.

105 / 112

Theorie linearer Ungleichungen

Gliederung

• Grundbegriffe

• der Algortihmus von Fourier-Motzkin

• Alternativsätze

• Seitenflächen

• konvexe Kegel

• zwei Anwendungen

• das Erfüllbarkeitsproblem

• stochastische Matrizen

106 / 112

Zwei Anwendungen

• in Anwendungssimulationen betrachtet man Systeme, die sich zu jedem(diskreten) Zeitpunkt in einem von n Zuständen {Z1, . . . , Zn} befinden

Beispiel1 2

3 4

• ein Spieler hält sich in einem der vier Punkte auf

• in jedem Schritt

• bleibt er mit Wahrscheinlichkeit 12 da, wo er ist

• oder geht mit Wahrscheinlichkeit 14 entlang einer Kante

107 / 112

Zwei Anwendungen

• wir nehmen allgemein an, dass das System mit Wahrscheinlichkeit

mij = Pr (Zi |Zj )

in den Zustand Zi übergeht, wenn es vorher im Zustand Zj war.

• die entsprechende Übergangsmatrix

M = [mij ] ∈ Rn×n

hat nur nichtnegative Koeffizienten mij ≥ 0 und SpaltensummenPni=1 mij = 1.

• M ist eine stochastische Matrix: alle Spalten sindWahrscheinlichkeitsverteilungen

• in unserem Beispiel hätte M die Form

M =

0BBB@12

14

14 0

14

12 0 1

414 0 1

214

0 14

14

12

1CCCA108 / 112

Page 28: Organisatorisches Operations Research · Operations Research Gliederung der Inhalte 1. Theorie linearer Ungleichungen 2. Polyeder und Polytope 3. Konvexe Funktionen 4. die Simplexmethode

Zwei Anwendungen• nehmen wir an, dass sich das System zum Zeitpunkt t mit der

Wahrscheinlichkeit πi im Zustand Zi befindet (i = 1, . . . , n).

• die Wahrscheinlichkeit, sich zum Zeitpunkt t + 1 im ZustandZk (k = 1, . . . , n) zu befinden ist:

π′k =nX

i=1

mki πi

• in Matrixnotation haben wir also:

π′ = Mπ (π = [π1, . . . , πn], π′ = [π′1, . . . , π

′n]).

109 / 112

Zwei Anwendungen• sei in unserem Beispiel π = [1, 0, 0, 0]

• dann ist π′ = [ 12 , 1

4 , 14 , 0]

• nach zwei Schritten π′′ = [ 38 , 2

8 , 28 , 1

8 ]

• d.h. die Wahrscheinlichkeiten verändern sich von Schritt zu Schritt

• dieser Prozess wirft zumindest zwei Fragen auf:

• existiert eine Grenzverteilung?

• existiert eine Startverteilung, die sich nicht ändert?

• wir beantworten die zweite Frage

• π heiße stationär, wenn π′ = Mπ = π

• eine stationäre Wahrscheinlichkeitsverteilung ist somit ein (rechter)Eigenvektor von M zum Eigenwert λ = 1

110 / 112

Zwei Anwendungen

Proposition 16

Die stochastische Matrix M = [mij ] besitzt eine stationäreWahrscheinlichkeitsverteilung.

Beweis:

• wir setzen A = M − I .

• es genügt zu zeigen, dass

Ax = 0, x ≥ 0, x 6= 0

eine Lösung hat

• diese können wir dann auf Koeffizientensumme 1 normieren underhalten das gewünschte π.

111 / 112

Zwei Anwendungen• wir nehmen an, dass keine solche Lösung existiert

• dann gäbe es nach dem Alternativsatz von Gordan (Korollar 10) einenVektor y mit der Eigenschaft

0T > yT A = yT M − yT d.h. yj >

nXi=1

mij yi für alle j = 1, . . . , n.

• für yk = min{y1, . . . , yn} gilt aber

nXi=1

mik yi ≥nX

i=1

mik yk = yk .

• somit muss eine stationäre Verteilung existieren.

• in unserem Beispiel ist π = [ 14 , 1

4 , 14 , 1

4 ] eine stationäre Verteilung.

112 / 112