5.3 Lokale Extrema


5.3.1 Definition.
Es sei \bgroup\color{demo}$ f:E\supseteq U\to\mathbb{R}$\egroup und \bgroup\color{demo}$ \xi \in U$\egroup. Dann heißt \bgroup\color{demo}$ \xi $\egroup lokales Maximum (resp. Minimum) von \bgroup\color{demo}$ f$\egroup, genau dann wenn ein \bgroup\color{demo}$ \varepsilon >0$\egroup existiert, so daß für all \bgroup\color{demo}$ x\in U$\egroup mit \bgroup\color{demo}$ \vert x-\xi \vert<\varepsilon $\egroup die Ungleichung \bgroup\color{demo}$ f(x)\leq f(\xi )$\egroup (resp. \bgroup\color{demo}$ f(x)\geq f(\xi )$\egroup) gilt. Gilt sogar die strikte Ungleichung \bgroup\color{demo}$ f(x) < f(\xi )$\egroup (resp. \bgroup\color{demo}$ f(x)>f(\xi )$\egroup) für all jene \bgroup\color{demo}$ x\ne \xi $\egroup, so heißt \bgroup\color{demo}$ \xi $\egroup ein lokales striktes Maximum (resp. Minimum).




5.3.2 Lemma.
Es sei \bgroup\color{demo}$ \xi \in U$\egroup ein lokales Extremum (d.h. Maximum oder Minimum) von \bgroup\color{demo}$ f:E\supseteq U\to\mathbb{R}$\egroup und \bgroup\color{demo}$ f$\egroup sei differenzierbar bei \bgroup\color{demo}$ \xi $\egroup oder besitze zumindest die Richtungsableitungen \bgroup\color{demo}$ d_vf(\xi )$\egroup für alle \bgroup\color{demo}$ v\in E$\egroup.

Dann ist \bgroup\color{demo}$ \xi $\egroup ein kritischer Punkt von \bgroup\color{demo}$ f$\egroup, d.h. \bgroup\color{demo}$ f'(\xi )=0$\egroup.

\bgroup\color{demo}\includegraphics[scale=.7]{pic-5-02}\egroup

Beweis. Für \bgroup\color{demo}$ v\in E$\egroup besitzt auch \bgroup\color{demo}$ t\mapsto f(\xi +tv)$\egroup ein lokales Extremum bei \bgroup\color{demo}$ t=0$\egroup und somit z.B. im Falle eines lokalen Minimums \bgroup\color{demo}$ f(\xi +tv)\geq f(\xi )$\egroup für alle \bgroup\color{demo}$ t$\egroup und damit

\bgroup\color{demo}$\displaystyle \frac{f(\xi +tv)-f(\xi )}{t}
\left\{\begin{ar...
...l} \geq 0 &\text{für }t>0 \\
\leq 0 &\text{für }t<0 \end{array}\right.
$\egroup

also ist \bgroup\color{demo}$ f'(\xi )(v)=\d _v f(\xi )=0$\egroup.     []




5.3.3 Proposition (lokale Extrema).
Es sei \bgroup\color{demo}$ f:E\supseteq U\to\mathbb{R}$\egroup \bgroup\color{demo}$ C^2$\egroup, \bgroup\color{demo}$ f'(\xi )=0$\egroup und die symmetrische Form \bgroup\color{demo}$ f''(\xi ):E\times E\to\mathbb{R}$\egroup sei positiv definit. Dann hat \bgroup\color{demo}$ f$\egroup bei \bgroup\color{demo}$ \xi $\egroup ein striktes lokales Minimum.

Eine bilineare symmetrische Form \bgroup\color{demo}$ b$\egroup ist genau dann positiv definit, wenn \bgroup\color{demo}$ \exists\delta >0 \forall h:b(h,h)\geq \delta \Vert h\Vert^2$\egroup: Denn die Einheitssphäre \bgroup\color{demo}$ \{h:\Vert h\Vert=1\}$\egroup ist kompakt und somit existiert \bgroup\color{demo}$ \delta :=\min\{b(h,h):\Vert h\Vert=1\}>0$\egroup und für \bgroup\color{demo}$ 0\ne v\in E$\egroup gilt \bgroup\color{demo}$ v=\Vert v\Vert h$\egroup, wobei \bgroup\color{demo}$ h:=\frac1{\Vert v\Vert}v$\egroup und damit \bgroup\color{demo}$ b(v,v)=b(\Vert v\Vert h,\Vert v\Vert h)=\Vert v\Vert^2 b(h,h)\geq \Vert v\Vert^2 \delta $\egroup.

In der Mathematik 1 haben wir gezeigt, daß eine bilinear-Form \bgroup\color{demo}$ b:\mathbb{R}^n\times \mathbb{R}^n\to\mathbb{R}$\egroup genau dann positiv definit ist, wenn es die zugehörige quadratische Matrix \bgroup\color{demo}$ (b_{i,j})_{i,j=1}^n$\egroup mit \bgroup\color{demo}$ b_{i,j}:=b(e_i,e_j)$\egroup ist, d.h. die Determinante der Hauptminore \bgroup\color{demo}$ (b_{i,j})_{i,j=1}^k$\egroup positiv ist für jedes \bgroup\color{demo}$ 1\leq k\leq n$\egroup.

Beweis. O.B.d.A. sei \bgroup\color{demo}$ \xi =0$\egroup. Nach Taylor's Theorem 5.2.1 ist

\bgroup\color{demo}$\displaystyle f(x) = f(0) + f'(0)\cdot x + \int_0^1 (1-t)\,f''(tx)(x,x)\,dt
$\egroup

Die Menge der stetigen positiv definiten symmetrischen Bilinear-Formen ist offen in allen symmetrischen Bilinear-Formen, denn wenn \bgroup\color{demo}$ b_0(x,x)\geq \delta \Vert x\Vert^2$\egroup ist und \bgroup\color{demo}$ \Vert b-b_0\Vert<\delta $\egroup ist, so ist

$\displaystyle b(x,x)$ $\displaystyle = b_0(x,x) + \Bigl(b(x,x)-b_0(x,x)\Bigr)$    
  $\displaystyle \geq b_0(x,x) - \vert b(x,x)-b_0(x,x)\vert \geq \oversetbrace{>0}\to{(\delta - \Vert b-b_0\Vert)}\Vert x\Vert^2$    

Da \bgroup\color{demo}$ x\mapsto f''(x)$\egroup stetig ist und \bgroup\color{demo}$ f''(0)$\egroup positiv definit ist existiert ein \bgroup\color{demo}$ \delta >0$\egroup und ein \bgroup\color{demo}$ \varepsilon >0$\egroup, so daß alle \bgroup\color{demo}$ \Vert x\Vert<\varepsilon $\egroup in \bgroup\color{demo}$ U$\egroup liegen und \bgroup\color{demo}$ f''(x)(h,h)\geq \frac{\delta }2 \Vert h\Vert^2$\egroup für alle \bgroup\color{demo}$ h\in E$\egroup gilt. Somit ist für diese \bgroup\color{demo}$ x$\egroup

\bgroup\color{demo}$\displaystyle \int_0^1 (1-t)\,f''(tx)(x,x)\,dt
\geq \int_0^...
...\Vert x\Vert^2\frac{\delta }2 \,dt
\geq \Vert x\Vert^2\frac{\delta }4,
$\egroup

daher ist \bgroup\color{demo}$ f(x) > f(0)$\egroup für alle \bgroup\color{demo}$ 0\ne \Vert x\Vert<\varepsilon $\egroup.     []


5.3.4 Beispiele.

  1. $ f(x,y):=x^2-y^2$ hat nur $ (0,0)$ als kritischen Punkt. Dieser ist ein Sattelpunkt.
    \bgroup\color{demo}\includegraphics[scale=.5]{pic-5-03}\egroup

  2. $ f(x,y):=x^3+y^3-3xy$ hat nur $ (0,0)$ und $ (1,1)$ als kritische Punkte. Der erste ist ein Sattelpunkt (setze $ y=0$) und der zweite ein lokales striktes Minimum.
    \bgroup\color{demo}\includegraphics[scale=.7]{pic-5-04}\egroup

  3. $ f(x,y):=\sin(x)+\sin(y)+\sin(x+y)$ für $ 0\leq x,y\leq \frac{\pi}2$.
    \bgroup\color{demo}\includegraphics[scale=.5]{pic-5-05}\egroup

    Der einzige kritische Punkt im Inneren ist $ (\frac{\pi}3,\frac{\pi}3)$, ein globales Maximum. Am Rand sind $ (0,0)$ und $ (\frac{\pi}2,\frac{\pi}2)$ lokale Minima und $ (\frac{\pi}2,\frac{\pi}4)$ und $ (\frac{\pi}4,\frac{\pi}2)$ lokale Maxima, davon ist der erste Punkt ist ein globales Minimum von $ f$, und die beiden anderen Sattelpunkte.




5.3.5 Proposition über Lagrange Multiplikatoren.
Es sei \bgroup\color{demo}$ f:E\supseteq U\to\mathbb{R}$\egroup und \bgroup\color{demo}$ g:E\supseteq U\to F$\egroup, beide \bgroup\color{demo}$ C^1$\egroup. Falls \bgroup\color{demo}$ x\in U$\egroup ein lokales Extremum von \bgroup\color{demo}$ f$\egroup mit der Nebenbedingung \bgroup\color{demo}$ g(x)=0$\egroup ist und falls \bgroup\color{demo}$ g'(x)$\egroup surjektiv ist, so ist \bgroup\color{demo}$ f'(x)=\lambda \o g'(x)$\egroup für ein \bgroup\color{demo}$ \lambda \in L(F,\mathbb{R})$\egroup.

Beweis. O.B.d.A. sei \bgroup\color{demo}$ x=0$\egroup. Es sei \bgroup\color{demo}$ E_1$\egroup der Kern von \bgroup\color{demo}$ g'(0)$\egroup und \bgroup\color{demo}$ E_2$\egroup ein Komplementärraum zu \bgroup\color{demo}$ E_1$\egroup also z.B. das orthogonale Komplement \bgroup\color{demo}$ E_2:=E_1^\perp$\egroup. Dann ist \bgroup\color{demo}$ E\cong E_1\oplus E_2$\egroup und wir bezeichnen mit \bgroup\color{demo}$ \tilde g:E_1\times E_2\to F$\egroup die Abbildung \bgroup\color{demo}$ \tilde g(x_1,x_2):= g(x_1+x_2)$\egroup und analog \bgroup\color{demo}$ \tilde f(x_1,x_2):=f(x_1+x_2)$\egroup. Dann ist \bgroup\color{demo}$ \d _j\tilde g(0)=g'(0)\vert _{E_j}$\egroup und insbesonders ist \bgroup\color{demo}$ \d _2 g(0)$\egroup injektiv, da \bgroup\color{demo}$ g'(0)$\egroup nur auf \bgroup\color{demo}$ E_1$\egroup verschwindet, und ebenso surjektiv, denn aus \bgroup\color{demo}$ w=g'(0)(v)$\egroup folgt für \bgroup\color{demo}$ v_1+v_2:=v$\egroup die Gleichung \bgroup\color{demo}$ w=g'(0)(v_1+v_2) =0+g'(0)(v_2)=\d _2 \tilde g(0)(v_2)$\egroup (Man sieht auch leicht, daß \bgroup\color{demo}$ \d _1\tilde g(0)=0$\egroup). Aus dem Satz über implizite Abbildungen folgt die Existenz einer lokal eindeutigen \bgroup\color{demo}$ C^1$\egroup-Lösung \bgroup\color{demo}$ h:E_1 \to E_2$\egroup der impliziten Gleichung \bgroup\color{demo}$ \tilde g(x_1,h(x_1))=0$\egroup, d.h. \bgroup\color{demo}$ g^{-1}(0)$\egroup läßt sich lokal durch den Graph einer Abbildung \bgroup\color{demo}$ h:E_1 \to E_2$\egroup parametrisieren läßt. Damit ist das Extremalproblem für \bgroup\color{demo}$ f$\egroup mit Nebenbedingung \bgroup\color{demo}$ g$\egroup auf das gewöhnliche Extremalproblem für \bgroup\color{demo}$ x_1\mapsto \tilde f(x_1,h(x_1))$\egroup ohne Nebenbedingung zurückgeführt. Da \bgroup\color{demo}$ \d _2\tilde g(0)$\egroup invertierbar ist können wir \bgroup\color{demo}$ \lambda :=\d _2\tilde f(0)\o\d _2\tilde g(0)^{-1}:F\to E_2\to \mathbb{R}$\egroup setzen, und erhalten \bgroup\color{demo}$ \d _2 \tilde f(0) = \lambda \o\d _2 \tilde g(0)$\egroup Nach 5.3.3 die Ableitung \bgroup\color{demo}$ \d _1 \tilde f(0)+\d _2\tilde f(0)\o h'(0)$\egroup von \bgroup\color{demo}$ x_1\mapsto \tilde f(x_1,h(x_1))$\egroup bei 0 verschwinden. Ebenso folgt durch Differenzieren von \bgroup\color{demo}$ \tilde g(x_1,h(x_1))=0$\egroup, daß die Ableitung \bgroup\color{demo}$ \d _1 \tilde g(0)+\d _2\tilde g(0)\o h'(0)$\egroup verschwindet, und da \bgroup\color{demo}$ \d _2\tilde g(0)$\egroup invertierbar ist, ist \bgroup\color{demo}$ h'(0)=-\d _2\tilde g(0)^{-1}\o\d _1\tilde g(0)$\egroup (Wegen \bgroup\color{demo}$ \d _1\tilde g(0)=0$\egroup ist \bgroup\color{demo}$ h'(0)=0$\egroup). Somit ist \bgroup\color{demo}$ \d _1 \tilde f(0)= -\d _2\tilde f(0)\o h'(0)
=\d _2\tilde f(0)\o\d _2\tilde g(0)^{-1}\o\d _1\tilde g(0)=\lambda \o\d _1\tilde g(0)$\egroup (Und dies ist 0). Also ist insgesamt \bgroup\color{demo}$ \tilde f'(0) =\lambda \o\tilde g'(0)$\egroup, und somit auch \bgroup\color{demo}$ f'(0)=\lambda \o g'(0)$\egroup, da \bgroup\color{demo}$ (x_1,x_2)\mapsto x_1+x_2$\egroup ein linearer Isomorphismus \bgroup\color{demo}$ E_1\times E_2\to E$\egroup ist der \bgroup\color{demo}$ f$\egroup und \bgroup\color{demo}$ g$\egroup in \bgroup\color{demo}$ \tilde f$\egroup und \bgroup\color{demo}$ \tilde g$\egroup übersetzt.     []

Wenn \bgroup\color{demo}$ F=\mathbb{R}^n$\egroup ist, dann ist \bgroup\color{demo}$ \lambda $\egroup durch \bgroup\color{demo}$ (\lambda _i)_i\in \mathbb{R}^n$\egroup vermöge \bgroup\color{demo}$ \lambda (y_1,\dots,y_n):=\sum_{i=1}^n\lambda _i\,y_i$\egroup gegeben und somit muß ein relatives lokales Extremum \bgroup\color{demo}$ x$\egroup folgendes erfüllen

\bgroup\color{demo}$\displaystyle f'(x) = \sum_{i=1}^n \lambda _i g_i'(x)$\egroup    und \bgroup\color{demo}$\displaystyle g(x) = 0,
$\egroup

wobei \bgroup\color{demo}$ g(x)=:(g_1(x),\dots,g_n(x))$\egroup ist. Ist zusätzlich \bgroup\color{demo}$ E=\mathbb{R}^m$\egroup so bedeutet dies für ein lokales Extremum \bgroup\color{demo}$ x=(x_1,\dots,x_m)$\egroup folgendes (im allgemeinen nur bzgl. der \bgroup\color{demo}$ \lambda _i$\egroup lineare) Gleichungssystem von \bgroup\color{demo}$ n+m$\egroup Gleichungen in den \bgroup\color{demo}$ n+m$\egroup vielen Variablen \bgroup\color{demo}$ (x_1,\dots,x_m;\lambda _1,\dots,\lambda _n)$\egroup:

$\displaystyle \d _j f(x)$ $\displaystyle = \sum_{i=1}^n \lambda _i\, \d _j g_i(x)$   für $\displaystyle j=1,\dots,m$    
$\displaystyle g_i(x)$ $\displaystyle = 0$   für $\displaystyle i=1,\dots,n$    

Da der letzte Satz nur eine notwendige Bedingung liefert, benötigt man zusätzliche Argumente um den Nachweis eines lokalen Extremums zu liefern. Das kann z.B. sein, daß die Nebenbedingung eine kompakte Menge beschreibt und die stetige Funktion \bgroup\color{demo}$ f$\egroup somit ein Maximum und ein Minimum besitzen muß.


5.3.7 Beispiele.

  1. Die Extremalwerte von $ f(x,y,z):=5x+y-3z$ auf dem Durchschnitt der Ebene $ x+y+z=0$ mit der Sphäre $ x^2+y^2+z^2=1$. Die Abbildung $ g$ ist in diesem Beispiel $ g=(g_1,g_2):\mathbb{R}^3\to\mathbb{R}^2$ mit $ g_1(x,y,z):=x+y+z$ und $ g_2(x,y,z):=x^2+y^2+z^2-1$. Es ist somit folgendes Gleichungssystem im $ (x,y,z,\lambda _1,\lambda _2)$ zu lösen:

    $\displaystyle 5=\d _1 f(x,y,z)$ $\displaystyle = \lambda _1\,\d _1 g(x,y,z) + \lambda _2\,\d _1 g(x,y,z) = \lambda _1\,1+\lambda _2\,2x$    
    $\displaystyle 1=\d _2 f(x,y,z)$ $\displaystyle = \lambda _1\,\d _2 g(x,y,z) + \lambda _2\,\d _2 g(x,y,z) = \lambda _1\,1+\lambda _2\,2y$    
    $\displaystyle -3=\d _3 f(x,y,z)$ $\displaystyle = \lambda _1\,\d _3 g(x,y,z) + \lambda _2\,\d _3 g(x,y,z) = \lambda _1\,1+\lambda _2\,2z$    
    0 $\displaystyle = g_1(x,y,z) = x+y+z$    
    0 $\displaystyle = g_2(x,y,z) = x^2+y^2+z^2-1$    

    Die einzigen Lösungen sind $ (\pm \frac{1}{\sqrt{2}},0,\mp\frac{1}{\sqrt{2}};\pm 2\sqrt{2},1)$. Einsetzen in $ f$ zeigt, daß $ (\frac{1}{\sqrt{2}},0,-\frac{1}{\sqrt{2}})$ die Stelle eines lokalen (und somit auch globalen) Maximums und $ (-\frac{1}{\sqrt{2}},0,\frac{1}{\sqrt{2}})$ die eines globalen Minimums ist.
  2. Sei $ (x,y)\mapsto\langle Ax,y\rangle$ eine bilineare symmetrische Form. Gesucht sind ihre Extremalwerte unter der Nebenbedingung $ \Vert x\Vert=1$. Die Methode der Lagrangemultiplikatoren liefert:

    $\displaystyle \langle Ax,v\rangle+\langle Av,x\rangle$ $\displaystyle = \lambda (\langle x,v\rangle+\langle v,x\rangle)\forall v$    
    $\displaystyle \langle x,x\rangle$ $\displaystyle = 1$    

    Wegen der Symmetrie von $ A$ also $ Ax=\lambda \,x$ und $ \Vert x\Vert=1$ und somit ist $ x$ ein normierter Eigenvektor zum Eigenwert $ \lambda $. Ist $ \dim(E)=2$, dann liefert die beiden Eigenwerte $ \lambda $ das Maximum und das Minimum. Das sind gerade die Längen der Halbachsen des Ellipse oder Hyperbel $ \{\langle Ax,x\rangle:\Vert x\Vert=1\}$ und die zugehörigen Eigenvektoren sind die Richtungsvektoren der Halbachsen.

Andreas Kriegl 2001-07-01