3.3 Stetige Differenzierbarkeit


3.3.1 Definition.
Um ``stetig differenzierbar'' zu definieren, benötigen wir eine Distanz auf \bgroup\color{demo}$ L(E,F)$\egroup. Eine solche ist durch \bgroup\color{demo}$ d(a_0,a_1):=\Vert a_1-a_0\Vert$\egroup mit \bgroup\color{demo}$ \Vert a\Vert:=\sup\{\Vert a\cdot v\Vert:\Vert v\Vert\leq 1\}$\egroup gegeben. Es ist \bgroup\color{demo}$ L(E,F)$\egroup ein Euklidischer Raum falls \bgroup\color{demo}$ F$\egroup einer ist.

Es heißt \bgroup\color{demo}$ f:E\supseteq U\to F$\egroup stetig differenzierbar (kurz \bgroup\color{demo}$ C^1$\egroup), falls \bgroup\color{demo}$ f'(x)$\egroup für alle \bgroup\color{demo}$ x\in U$\egroup existiert und \bgroup\color{demo}$ f':E\supseteq U\to L(E,F)$\egroup stetig ist.

Da \bgroup\color{demo}$ \operatorname{ev}:L(E,F)\times E\to F$\egroup bilinear und somit stetig ist ( \bgroup\color{demo}$ \Vert\operatorname{ev}(a,x)\Vert=\Vert a(x)\Vert\leq \Vert a\Vert\cdot\Vert x\Vert$\egroup) folgt aus der Stetigkeit von \bgroup\color{demo}$ f':U\to L(E,F)$\egroup jene von \bgroup\color{demo}$ \widehat{f'}:U\times E\to L(E,F)\times
E\to F$\egroup.

Für endlich dimensionales \bgroup\color{demo}$ E\cong \mathbb{R}^m$\egroup gilt auch die Umkehrung, denn dann ist \bgroup\color{demo}$ L(E,F)\cong L(\mathbb{R}^m,F)\cong \mathbb{R}^m$\egroup und aus der Stetigkeit von \bgroup\color{demo}$ \widehat{f'}:U\times E\to F$\egroup folgt jene von \bgroup\color{demo}$ \operatorname{ev_{e_i}}\o f':U\to L(E,F)\to F$\egroup und somit auch von \bgroup\color{demo}$ f':U\to F$\egroup (punktweise Konvergenz).




3.3.2 Lemma.
Eine Abbildung \bgroup\color{demo}$ f:E\supseteq U\to F$\egroup ist genau dann \bgroup\color{demo}$ C^1$\egroup, wenn die Richtungsableitungen eine wohldefinierte und stetige Abbildung \bgroup\color{demo}$ E\supseteq U\to L(E,F)$\egroup, \bgroup\color{demo}$ x\mapsto (v\mapsto d_vf(x))$\egroup liefern.

Beweis. \bgroup\color{demo}$ (\Rightarrow)$\egroup Nach 3.1.9 existieren die Richtungsableitungen und \bgroup\color{demo}$ d_vf(x)=f'(x)$\egroup, also definieren sie gerade die Abbleitung \bgroup\color{demo}$ f':E\supseteq U\to L(E,F)$\egroup.

\bgroup\color{demo}$ (\Leftarrow)$\egroup Wegen Proposition 3.1.9 müssen wir nur zeigen, daß

\bgroup\color{demo}$\displaystyle \frac{f(x+tv)-f(x)}{t} - f'(x)(v)\to 0$\egroup for \bgroup\color{demo}$\displaystyle t\to 0+$\egroup glm. für \bgroup\color{demo}$\displaystyle \Vert v\Vert=1.
$\egroup

Nach dem Zwischenwertsatz angewendet auf \bgroup\color{demo}$ c:s\mapsto f(x+tsv)$\egroup mit Ableitung \bgroup\color{demo}$ c'(s)= d_{tv} f(x+tsv) = t\, d_v f(x+tsv)$\egroup ist

$\displaystyle \frac{f(x+tv)-f(x)}{t}$ $\displaystyle = \frac1t(c(1)-c(0)) = \frac1t c'(\vartheta)$    
  $\displaystyle = \frac1t d_{tv}(x+t\vartheta v) = d_vf(x+t\vartheta v).$    

Wegen der vorausgesetzen Stetigkeit existiert für jedes \bgroup\color{demo}$ \varepsilon >0$\egroup ein \bgroup\color{demo}$ \delta >0$\egroup, so daß für alle \bgroup\color{demo}$ \Vert w\Vert<\delta $\egroup folgendes gilt: \bgroup\color{demo}$ \Vert d_vf(x+w)-d_vf(x)\Vert\leq \varepsilon \Vert v\Vert$\egroup. Für \bgroup\color{demo}$ \Vert v\Vert=1$\egroup und \bgroup\color{demo}$ 0<t<\delta $\egroup erhalten wir also

\begin{multline*}
\Bigl\Vert\frac{f(x+tv)-f(x)}{t} - f'(x)(v) \Bigr\Vert \leq \\...
...a v)-d_vf(x)\Vert:0<\vartheta<1\} \leq \varepsilon .{\rm\quad[]}
\end{multline*}




3.3.3 Proposition.
Ein Abbildung \bgroup\color{demo}$ f:E_1\times \dots\times E_m\supseteq U\to F$\egroup ist genau dann stetig differenzierbar auf \bgroup\color{demo}$ U$\egroup, wenn sämtliche partielle Ableitungen \bgroup\color{demo}$ \d _jf:U\to L(E_j,F)$\egroup für \bgroup\color{demo}$ j\in\{1,\dots,m\}$\egroup existieren und stetig sind.

Beweis. \bgroup\color{demo}$ (\Rightarrow)$\egroup Dies folgt aus 3.2.10, denn \bgroup\color{demo}$ \d _j f(x) =
(f\o\operatorname{ins}_j^x)'(x^j)=f'(x)\o\ope...
...eratorname{ins}_j^*(f'(x))
=(\operatorname{ins}_j^*\o f')(x)\in L(E_j,F)$\egroup, und \bgroup\color{demo}$ (\operatorname{ins}_j^*):L(E_1\times \dots\times E_m,F)\to L(E_j,F)$\egroup ist eine stetige Kontraktion.

\bgroup\color{demo}$ (\Leftarrow)$\egroup O.B.d.A. sei \bgroup\color{demo}$ x=0\in U$\egroup und \bgroup\color{demo}$ v=(v_1,\dots,v_m)$\egroup. Dann ist nach dem Mittelwertsatz 3.1.4

  $\displaystyle \frac{f(t\,v_1,\dots,t\,v_m) - f(0,\dots,0)}{t} =$    
  $\displaystyle \qquad= \sum_{j=1}^m \frac{f(t\,v_1,\dots,t\,v_{j-1},t\,v_j,0,\dots,0) - f(t\,v_1,\dots,t\,v_{j-1},0,\dots,0)}{t}$    
  $\displaystyle \qquad= \sum_{j=1}^m \d _j f(t\,v_1,\dots,t\,v_{j-1},\vartheta_j\, t\,v_j,0,\dots,0)(v_j) \to$    
  $\displaystyle \qquad\to \sum_{j=1}^m \d _j f(0,\dots,0)(t\,v_j)$    for $\displaystyle t\to 0+$ glm. bzgl. $\displaystyle \Vert v\Vert\leq 1.$    

Also ist \bgroup\color{demo}$ f$\egroup differenzierbar nach 3.1.9.     []

Wir wollen Gleichungen der Form \bgroup\color{demo}$ f(x)=y$\egroup nach \bgroup\color{demo}$ x$\egroup auflösen. Sei also \bgroup\color{demo}$ g(y):=x$\egroup eine Lösung. Falls nicht nur \bgroup\color{demo}$ f$\egroup sondern auch \bgroup\color{demo}$ g$\egroup differenzierbar ist, so gilt wegen \bgroup\color{demo}$ f(g(y))=y$\egroup nach der Kettenregel 3.2.3 \bgroup\color{demo}$ f'(g(y))\cdot g'(y)=\operatorname{id}$\egroup. Wenn die Lösungen eindeutig sind, d.h. \bgroup\color{demo}$ f$\egroup injektiv ist, dann ist wegen \bgroup\color{demo}$ f(g(f(x)))=f(x)$\egroup auch \bgroup\color{demo}$ g(f(x))=x$\egroup also \bgroup\color{demo}$ g'(f(x))\cdot f'(x)=\operatorname{id}$\egroup und speziell für \bgroup\color{demo}$ x=g(y)$\egroup ist \bgroup\color{demo}$ g'(y)\cdot f'(g(y))=\operatorname{id}$\egroup, d.h. \bgroup\color{demo}$ g'(y)$\egroup ist die inverse (lineare Abbildung) zu \bgroup\color{demo}$ f'(g(y))$\egroup.

Im endlich dimensionalen können wir die Invertierbarkeit linearer Abbildungen mit der Determinante testen.

Die Idee des folgenden Satzes ist, daß, wenn die Gleichung \bgroup\color{demo}$ f'(x_0)(x)=y$\egroup die durch die lineare Approximation \bgroup\color{demo}$ f'(x_0)$\egroup gegeben ist, eindeutig für alle \bgroup\color{demo}$ y$\egroup lösbar ist, dann sollte auch die nicht-lineare Gleichung \bgroup\color{demo}$ f(x)=y$\egroup für \bgroup\color{demo}$ y$\egroup nahe \bgroup\color{demo}$ f(x_0)$\egroup eindeutig mit \bgroup\color{demo}$ x$\egroup nahe \bgroup\color{demo}$ x_0$\egroup lösbar sein.




3.3.4 Inverse-Funktionen Satz.
Es sei \bgroup\color{demo}$ f:E\supseteq U\to F$\egroup \bgroup\color{demo}$ C^1$\egroup, \bgroup\color{demo}$ x_0\in U$\egroup und \bgroup\color{demo}$ f'(x_0):E\to F$\egroup ein Isomorphismus. Dann ist \bgroup\color{demo}$ f$\egroup ein lokaler Diffeomorphismus, d.h. es gibt offene Umgebungen \bgroup\color{demo}$ V\subseteq U$\egroup von \bgroup\color{demo}$ x_0$\egroup und \bgroup\color{demo}$ W$\egroup von \bgroup\color{demo}$ f(x_0)$\egroup so daß \bgroup\color{demo}$ f:V\to W$\egroup bijektiv ist und die Inverse \bgroup\color{demo}$ f^{-1}:W\to V$\egroup \bgroup\color{demo}$ C^1$\egroup ist mit Ableitung \bgroup\color{demo}$ (f^{-1})'(y)=f'(f^{-1}(y))^{-1}$\egroup.

Eine Menge \bgroup\color{demo}$ U\subseteq E$\egroup heißt offene Umgebung von \bgroup\color{demo}$ x_0\in E$\egroup, wenn \bgroup\color{demo}$ U$\egroup offen ist und \bgroup\color{demo}$ x_0\in U$\egroup liegt.

Beweis. Zuerst vereinfachen wir das Problem. Durch eine Translation (wir ersetzen \bgroup\color{demo}$ f$\egroup durch \bgroup\color{demo}$ x\mapsto f(x_0+x)-f(x_0)$\egroup) erreichen wir \bgroup\color{demo}$ x_0=0$\egroup und \bgroup\color{demo}$ f(x_0)=0$\egroup. Durch Zusammensetzen mit \bgroup\color{demo}$ f'(x_0)^{-1}$\egroup erreichen wir \bgroup\color{demo}$ f'(x_0)=\operatorname{id}$\egroup. Da die lineare Approximation \bgroup\color{demo}$ \operatorname{id}$\egroup von \bgroup\color{demo}$ f$\egroup invertierbar ist, sollten wir das Restglied

\bgroup\color{demo}$\displaystyle r(x) := f(x_0+x) - f(x_0) - f'(x_0)(x) = f(x) - x
$\egroup

betrachten. Es ist \bgroup\color{demo}$ r(0)=0$\egroup und \bgroup\color{demo}$ r'(0)=f'(0)-\operatorname{id}=0$\egroup, also existiert ein \bgroup\color{demo}$ \delta >0$\egroup mit \bgroup\color{demo}$ \Vert x\Vert\leq \delta \Rightarrow x\in U$\egroup und \bgroup\color{demo}$ \Vert f'(x)-\operatorname{id}\Vert=\Vert r'(x)\Vert\leq 1/2$\egroup. Somit ist \bgroup\color{demo}$ f'(x)$\egroup invertierbar und außerdem ist nach dem Mittelwertsatz 3.1.4

\bgroup\color{demo}$\displaystyle \Vert r(x_1)-r(x_2)\Vert \leq \max\bigl\{\Vert r'(x_2+t(x_1-x_2))(x_2-x_1)\Vert\bigr\}
\leq \frac12\Vert x_1-x_2\Vert
$\egroup

für \bgroup\color{demo}$ \Vert x_j\Vert\leq \delta $\egroup. Speziell für \bgroup\color{demo}$ x_0:=0$\egroup erhalten wir \bgroup\color{demo}$ \Vert r(x)\Vert\leq \Vert x\Vert/2$\egroup für \bgroup\color{demo}$ \Vert x\Vert\leq \delta $\egroup. Wir behaupten nun, daß für alle \bgroup\color{demo}$ \Vert y\Vert< \delta /2$\egroup ein eindeutiges \bgroup\color{demo}$ \Vert x\Vert<\delta $\egroup mit \bgroup\color{demo}$ f(x)=y$\egroup existiert. Dazu wandeln wir diese Gleichung in die Fixpunktgleichung \bgroup\color{demo}$ x=g_y(x):=y+x-f(x)=y-r(x)$\egroup um. Für \bgroup\color{demo}$ \Vert y\Vert< \delta /2$\egroup und \bgroup\color{demo}$ \Vert x\Vert\leq \delta $\egroup ist \bgroup\color{demo}$ \Vert g_y(x)\Vert\leq \Vert y\Vert+\Vert r(x)\Vert< \delta /2 + \Vert x\Vert/2\leq \delta $\egroup und weiters ist \bgroup\color{demo}$ \Vert g_y(x_1)-g_y(x_2)\Vert= \Vert r(x_1)-r(x_2)\Vert\leq \Vert x_1-x_2\Vert/2$\egroup. Also folgt aus dem Banach'schen Fixpunktsatz 2.4.6 die Existenz eines eindeutig bestimmten Fixpunktes \bgroup\color{demo}$ \Vert x\Vert\leq \delta $\egroup und wegen \bgroup\color{demo}$ \Vert x\Vert=\Vert g_y(x)\Vert<\delta $\egroup liegt dieser im Inneren.

Es sei nun \bgroup\color{demo}$ W:=\{y:\Vert y\Vert<\delta /2\}$\egroup und \bgroup\color{demo}$ V:=f^{-1}(W)\cap\{x:\Vert x\Vert<\delta \}$\egroup. Dann existiert für jedes \bgroup\color{demo}$ y\in W$\egroup ein eindeutiges \bgroup\color{demo}$ \Vert x\Vert<\delta $\egroup mit \bgroup\color{demo}$ f(x)=y$\egroup, also liegt \bgroup\color{demo}$ x\in V$\egroup und \bgroup\color{demo}$ f:V\to W$\egroup ist bijektiv.

Es ist \bgroup\color{demo}$ f^{-1}$\egroup (Lipschitz-)stetig, denn für \bgroup\color{demo}$ y_j\in W$\egroup und \bgroup\color{demo}$ x_j\in V$\egroup mit \bgroup\color{demo}$ f(x_j)=y_j$\egroup gilt: \bgroup\color{demo}$ \Vert x_1-x_2\Vert \leq \Vert f(x_1)-f(x_2)\Vert + \Vert r(x_1)-r(x_2)\Vert
\leq \Vert y_1-y_2 \Vert + \frac12\Vert x_1-x_2\Vert$\egroup, also \bgroup\color{demo}$ \Vert x_1-x_2\Vert \leq 2 \Vert y_1-y_2\Vert$\egroup.
Und schließlich ist \bgroup\color{demo}$ f^{-1}$\egroup differenzierbar, denn

$\displaystyle \bigl\Vert f^{-1}(y_1) - f^{-1}(y_2)$ $\displaystyle - f'(x_2)^{-1}(y_1-y_2)\bigr\Vert = \bigl\Vert x_1-x_2-f'(x_2)^{-1}(f(x_1)-f(x_2)) \bigr\Vert$    
  $\displaystyle \leq \Vert f'(x_2)^{-1}\Vert\cdot \undersetbrace {\to 0}\to {\fra...
...2\Vert}} \cdot \undersetbrace{\leq 2\Vert y_1-y_2\Vert}\to{\Vert x_1-x_2\Vert}.$    

Beachte dabei, daß \bgroup\color{demo}$ f'(x_2)^{-1}$\egroup existiert und mittels geometrischer Reihe berechnet werden kann, da \bgroup\color{demo}$ \Vert f'(x_2)-\operatorname{id}\Vert<1$\egroup.

Daß \bgroup\color{demo}$ f^{-1}$\egroup \bgroup\color{demo}$ C^1$\egroup ist folgt, da \bgroup\color{demo}$ (f^{-1})' = \operatorname{inv}\o f'\o f^{-1}$\egroup und alle Komponenten stetig sind.     []


3.3.5 Beispiele.

  1. Es ist $ \sin:[-\pi/2,\pi/2]\to [-1,1]$ streng monoton wachsend mit Ableitung $ \sin'(x)=\cos(x)>0$ für $ -\pi/2<x<\pi/2$. Also existiert nach dem inversen Funktionensatz die Ableitung der Umkehrfunktion $ \arcsin$ und zwar ist

    $\displaystyle \arcsin'(y)$ $\displaystyle = \frac1{\sin'(\arcsin(y))}=\frac1{\cos(\arcsin(y))}$    
      $\displaystyle =\frac1{\sqrt{1-\sin(\arcsin(y))^2}} =\frac1{\sqrt{1-y^2}}.$    

    Analoges zeigt man für $ \cos:[0,\pi]\to[-1,1]$.
  2. Es ist $ \tan:(-\pi/4,\pi/4)\to \mathbb{R}$ streng monoton wachsend mit Ableitung

    $\displaystyle \tan'(x)$ $\displaystyle =\frac{\cos(x)\sin'(x)-\sin(x)\cos'(x)}{\cos(x)^2} =\frac{\cos(x)^2+\sin(x)^2}{\cos(x)^2}$    
      $\displaystyle =1+\tan(x)^2=\frac1{\cos(x)^2}\geq 1$    

    für alle $ x$. Also existiert nach dem inversen Funktionensatz die Ableitung der Umkehrfunktion $ \arctan$ und zwar ist

    $\displaystyle \arctan'(y) = \frac1{\tan'(\arctan(y))}=\frac1{1+\tan(\arctan(y))^2}
=\frac1{1+y^2}.
$

  3. Es ist die Exponentialfunktion $ \exp:\mathbb{R}\to\mathbb{R}^+$, $ x\mapsto e^x$ streng monoton wachsend mit Ableitung $ \exp'(x)=e^x>0$. Also existiert nach dem inversen Funktionensatz die Ableitung der Umkehrfunktion $ \ln$ und zwar ist

    $\displaystyle \ln'(y) = \frac1{\exp'(\ln(y))}=\frac1{\exp(\ln(y))}
=\frac1y.
$

  4. Quadrieren: Es sei $ f:\mathbb{C}\to\mathbb{C}$ geben durch $ f(z):=z^2$. Also ist $ f$ als Abbildung von $ \mathbb{R}^2\cong\mathbb{C}$ gegeben durch $ f(x,y)=(x^2-y^2,2xy)$. Die Jacobimatrix von $ f$ ist somit

    $\displaystyle [f'(x,y)]=\begin{pmatrix}2x & -2y \\ 2y & 2x \end{pmatrix}$

    mit Determinante $ \det(f'(x,y))=4(x^2+y^2)\ne 0$ für $ (x,y)\ne(0,0)$. Nach den inversen Funktionensatz existiert somit lokal um Punkte $ \ne 0$ die (eindeutig bestimmte) Umkehrfunktion $ \sqrt{\quad}$. Global ist jedoch zu jeder Lösung $ z$ von $ z^2=w$ auch $ -z$ eine weitere Lösung.
  5. Polarkoordinaten:
    Es sei $ f:\mathbb{R}^2\supseteq \mathbb{R}_+\times \mathbb{R}\to \mathbb{R}^2$, $ (r,\varphi )\mapsto (r\,\cos(\varphi ),r\,\sin(\varphi ))$. Dann ist $ f$ $ C^1$ und

    $\displaystyle f'(r,\varphi ) = \left(\begin{matrix}\cos(\varphi ) & -r\,\sin(\varphi ) \\ \sin(\varphi ) & r\,\cos(\varphi ) \end{matrix}\right)
$

    invertierbar, da $ \det(f'(r,\varphi ))=r>0$, aber

    $\displaystyle f(r,\varphi +2\,k\,\pi) = f(r,\varphi )$ für alle $\displaystyle k\in\mathbb{Z}.
$

    Also ist $ f$ nicht global injektiv, vergleiche das mit dem 1-dimensionalen Inversen-Funktionnen Satz 3.1.8.
  6. Ähnliches gilt auch für Kugelkoordinaten

    $\displaystyle f:(r,\varphi ,\theta)\mapsto r(\cos(\theta)\,\cos(\varphi ),\cos(\theta)\,\sin(\varphi ),\sin(\theta))
$

    mit Jacobimatrix

    $\displaystyle \begin{pmatrix}
\cos(\theta)\,\cos(\varphi ) & -r\,\cos(\theta)\,...
...theta)\,\sin(\varphi ) \\
\sin(\theta) & 0 & r\,\cos(\theta) \\
\end{pmatrix}$

    und Determinante

    $\displaystyle \det(f'(r,\varphi ,\theta))$ $\displaystyle = \sin(\theta)\,r^2\,\sin(\theta)\,\cos(\theta)\,(\sin(\varphi )^2+\cos(\varphi )^2) +$    
      $\displaystyle \quad + r\,\cos(\theta)\,r\,\cos(\theta)^2\,(\sin(\varphi )^2+\cos(\varphi )^2)$    
      $\displaystyle = r^2\,\cos(\theta)\ne 0,$    

    falls $ -\pi/2<\theta<\pi/2$ und $ r\ne 0$. Folglich existiert eine stetig differenzierbare Umkehrfunktion.
  7. Es sei $ f:\mathbb{R}^2\to\mathbb{R}^2$ gegeben durch $ f(x,y)=(\sin(x) - \cos(y),\sin(y) - \cos(x))$ mit Jacobimatrix

    $\displaystyle \begin{pmatrix}
\cos(x) & \sin(y) \\
\sin(x) & \cos(y)
\end{pmatrix}$

    und Determinante $ \cos(x)\,\cos(y)-\sin(x)\,\sin(y)=\cos(x-y)$. Dies ist $ \ne 0$ falls $ x$ nahe $ y$ liegt. Folglich gibt es lokale $ C^1$-Lösungen.




3.3.6 Implizite-Funktionen Satz.
Es sei \bgroup\color{demo}$ f:E\times F\to F$\egroup lokal um \bgroup\color{demo}$ (x_0,y_0)$\egroup \bgroup\color{demo}$ C^1$\egroup und \bgroup\color{demo}$ \d _2 f(x_0,y_0):F\to F$\egroup ein Isomorphismus. Dann existieren offene Umgebungen \bgroup\color{demo}$ U$\egroup von \bgroup\color{demo}$ x_0$\egroup, \bgroup\color{demo}$ V$\egroup von \bgroup\color{demo}$ y_0$\egroup und \bgroup\color{demo}$ W$\egroup von \bgroup\color{demo}$ f(x_0,y_0)$\egroup, so daß für jedes \bgroup\color{demo}$ z\in W$\egroup und \bgroup\color{demo}$ x\in U$\egroup ein eindeutiges \bgroup\color{demo}$ y\in V$\egroup existiert mit \bgroup\color{demo}$ f(x,y)=z$\egroup. Weiters ist die Abbildung \bgroup\color{demo}$ (x,z)\mapsto y$\egroup, \bgroup\color{demo}$ U\times W\to V$\egroup \bgroup\color{demo}$ C^1$\egroup.

Beachte, daß wir die Ableitungen von \bgroup\color{demo}$ (x,z)\mapsto y$\egroup durch Differenzieren der Gleichung \bgroup\color{demo}$ f(x,y)=z$\egroup unter Anwendung der Kettenregel errechnet werden können.

Beweis. Es sei \bgroup\color{demo}$ g:E\times F\to E\times F$\egroup gegeben durch \bgroup\color{demo}$ (x,y)\mapsto (x,f(x,y))$\egroup. Dann ist

\bgroup\color{demo}$\displaystyle g'(x,y) = \left(\begin{matrix}1 & 0 \\ \d _1f(x,y) & \d _2f(x,y) \end{matrix}\right)
$\egroup

invertierbar mit Inverser

\bgroup\color{demo}$\displaystyle \left(\begin{matrix}
1 & 0 \\
-\d _2f(x,y)^{-1}\cdot \d _1f(x,y) & \d _2f(x,y)^{-1}
\end{matrix}\right),
$\egroup

(Man erhält dies durch einen allgemeinen Ansatz), also existieren nach dem Inversen-Funktionen Satz Umgebungen \bgroup\color{demo}$ U$\egroup, \bgroup\color{demo}$ V$\egroup und \bgroup\color{demo}$ O$\egroup von \bgroup\color{demo}$ x_0$\egroup, \bgroup\color{demo}$ y_0$\egroup und \bgroup\color{demo}$ g(x_0,y_0)$\egroup, so daß \bgroup\color{demo}$ g:U\times V\to O$\egroup ein Diffeomorphismus ist.

Nun wähle Umgebungen \bgroup\color{demo}$ U_1$\egroup von \bgroup\color{demo}$ x_0$\egroup und \bgroup\color{demo}$ W$\egroup von \bgroup\color{demo}$ f(x_0,y_0)$\egroup mit \bgroup\color{demo}$ U_1\times W\subseteq O$\egroup. Dann ist für jedes \bgroup\color{demo}$ x\in U_1$\egroup und \bgroup\color{demo}$ z\in W$\egroup der Punkt \bgroup\color{demo}$ (x,z)\in O$\egroup, also existiert ein eindeutiger Punkt \bgroup\color{demo}$ (u,y)\in U\times V$\egroup mit \bgroup\color{demo}$ (x,z)=g(u,y)=(u,f(u,y))$\egroup, d.h. \bgroup\color{demo}$ u=x\in U_1$\egroup und \bgroup\color{demo}$ f(x,y)=z$\egroup, also ein eindeutiger Punkt \bgroup\color{demo}$ y\in V$\egroup mit \bgroup\color{demo}$ f(x,y)=z$\egroup. Weiters ist \bgroup\color{demo}$ (x,z)\mapsto y$\egroup durch \bgroup\color{demo}$ (u,y)=g^{-1}(x,z)=:(h^1(x,z),h^2(x,z))$\egroup gegeben, wobei \bgroup\color{demo}$ h^j$\egroup die Komponenten von \bgroup\color{demo}$ g^{-1}$\egroup bezeichnet. Folglich ist diese Zuordnung \bgroup\color{demo}$ C^1$\egroup.     []


3.3.7 Beispiele.

  1. Kreisgleichung: $ x^2+y^2=1$, d.h. die Lösungsmenge der impliziten Gleichung $ f(x,y):=x^2+y^2=1$. Die Ableitung von $ f$ ist $ f'(x,y)=(2x,2y)$ d.h. für $ y_0\ne 0$ ist $ y$ lokal um $ y_0$ nach $ x$ auflösbar und für $ x_0\ne 0$ ist $ x$ lokal um $ x_0$ nach $ y$ auflösbar. Wir können dies sogar explizit machen: $ y=\pm\sqrt{1-x^2}$ bzw. $ x=\pm\sqrt{1-y^2}$.
  2. Das kartesische Blatt ist durch $ x^3+y^3=3xy$ gegeben, d.h. als Lösung der impliziten Gleichung $ f(x,y):=x^3+y^3-3xy=0$. Die Ableitung von $ f$ ist $ f'(x,y)=(3(x^2-y),3(y^2-x))$, also ist nach dem impliziten Funktionensatz $ y$ lokal um $ y_0$ nach $ x$ auflösbar falls $ y_0^2\ne x_0^2$. Falls ein Punkt $ (x_0,y_0)$ mit $ y_0^2=x_0$ die Gleichung erfült, so gilt $ 0=f(x_0,y_0)=y_0^6+y_0^3-3y_0^2y_0=y_0^3(y_0^3-2)$, d.h. $ (x_0,y_0)=(0,0)$ oder $ (x_0,y_0)=(\root3\of4,\root3\of2)$.

    \bgroup\color{demo}\includegraphics[scale=.7]{pic-3-05}\egroup

    Ohne die Lösungskurve $ x\mapsto y(x)$ explizit zu kennen, können wir durch Differenzieren der impliziten Gleichung $ 0=f(x,y(x))$ dennoch deren Ableitung berechnen:

    0 $\displaystyle =\d _1 f(x,y(x)) + \d _2 f(x,y(x))\,y'(x)$    
      $\displaystyle =3x^2 -3y(x) + (3y(x)^2-3x)\,y'(x) \Rightarrow$    
    $\displaystyle y'(x)$ $\displaystyle =\frac{y(x)-x^2}{y(x)^2-x}.$    

  3. Es sei ein Polynom $ p(t,x):=x^n+a_{n-1}(t)\,x^{n-1}+\dots+a_1(t)\,x+a_0(t)$ mit variable Koeffizienten $ a_{n-1}(t)$,...,$ a_0(t)$ gegeben. Angenommen wir kennen für $ t=0$ eine Nullstelle $ x_0$ von $ p$, d.h. $ p(0,x_0)=0$. Wir wüßten gerne, daß für alle kleinen $ t$ auch Nullstelen $ x_t$ die nahe $ x_0$ liegen existieren, d.h. wir wollen in $ p(t,x)=0$ die Variable $ x$ nach $ t$ auflösen. Falls $ \d _2 p(0,x_0)\ne 0$ ist so geht dies auf stetig differenzierbare Weise wegen dem impliziten Funktionensatz. Es bedeutet $ 0=\d _2 p(0,x_0)$ gerade, daß $ x_0$ keine Mehrfachnullstelle ist.

  4. Es ist die Menge der Lösungen der impliziten Gleichung $ f(x,y,z):=z^2+(\sqrt{x^2+y^2}-5)^2=4^2$ gesucht, ein sogenannter Torus. Die Ableitung ist

    $\displaystyle f'(x,y,z)= ( 2(\sqrt{x^2+y^2}-5)\frac{x}{\sqrt{x^2+y^2}},
2(\sqrt{x^2+y^2}-5)\frac{y}{\sqrt{x^2+y^2}},2z)
$

    Für $ z_0\ne 0$ ist also $ z$ nahe $ z_0$ eindeutig aus $ (x,y)$ berechenbar, beschreibt also eine Fläche im $ \mathbb{R}^3$. Ist andererseits $ z_0=0$ und $ f(x_0,y_0,z_0)=0$, so ist $ \sqrt{x_0^2+y_0^2}=5\pm2\ne 0$ und somit $ f'(x,y,z)\ne (0,0,0)$ also sicher eine der 3 Variablen aus den anderen beiden auf $ C^1$-Weise berechenbar.

  5. Es ist die Schnittmenge 2 normal aufeinander stehende Zylinder, der Achsen sich nicht treffen, zu bestimmen.

    \bgroup\color{demo}\includegraphics[scale=.7]{pic-3-06}\egroup

    Der 1. Zylinder ist z.B. durch $ (x+1)^2+y^2=4$ gegeben und der 2. Zylinder durch $ (x-1)^2+z^2=4$. Gesucht sind also die Lösungen der impliziten Gleichung $ f(x,y,z):=((x+1)^2+y^2,(x-1)^2+z^2)=(4,4)$. Die Ableitung von $ f$ ist

    $\displaystyle f'(x,y,z) = \begin{pmatrix}2x+2 & 2y & 0 \\ 2x-2 & 0 & 2z \end{pmatrix}.
$

    Wir fassen $ f$ als Abbildung $ f:\mathbb{R}\times \mathbb{R}^2\to\mathbb{R}^2$ auf. Dann ist $ \d _2 f(x,y,z)=\begin{pmatrix}2y & 0 \\ 0 & 2z \end{pmatrix}$ genau dann invertierbar, wenn $ yz\ne 0$ ist. Andererseits folgt aus $ y=0$, daß $ (x+1)^2=4$, d.h. $ x=-1\pm 2$ und somit ist wegen $ (x-1)^2+z^2=4$ im $ +$-Fall $ z=\pm 2$ und sonst existiert kein passendes $ z$. Aus $ z=0$ folgt hingegen, daß $ (x-1)^2=4$, d.h. $ x=1\pm 2$ ist und somit ist wegen $ (x+1)^2+y^2=4$ im $ -$-Fall $ y=\pm 2$ und sonst existiert kein passendes $ y$. D.h. abgesehen von den 4 Punkten $ (1,0,\pm 2)$ und $ (-1,\pm 2,0)$ ist also $ y$ und $ z$ lokal eindeutig aus $ x$ ausrechenbar.

  6. Wir wollen nun die Differenzierbarkeit der Abbildung $ \iota :A\mapsto A^{-1}$ von $ GL(E):=\{A\in L(E,E):A$ ist invertierbar $ \}$ nach $ GL(E)$ beweisen. Es ist $ A^{-1}$ durch die Gleichung $ A\o A^{-1}=\operatorname{id}_E$ gegeben, also $ \iota $ durch die implizite Gleichung $ \mu(A,\iota (A))=\operatorname{id}_E$ wobei $ \mu:L(E,E)\times L(E,E)\to L(E,E)$ die Komposition ist. Da $ \mu$ bilinear ist, ist $ \d _2\mu (A,B)(C)=\mu(A,C)$ und somit ist $ \d _2\mu(A,B)$ invertierbar mit inverser $ C\mapsto \mu(A^{-1},C)$. Nach dem impliziten Funktionensatz ist also $ \iota :GL(E)\to GL(E)$ differenzierbar mit Ableitung $ \iota '(A)(B)=-((\d _2\mu(A,\iota (A)))^{-1}\o (\d _1\mu(A,\iota (A))))(B)
=-A^{-1}\o B\o A^{-1}$. Vergleiche dies mit der Ableitung von $ x\mapsto x^{-1}$, $ \mathbb{R}\to\mathbb{R}$.

Um eine Nullstelle der (nicht-linearen) Gleichung \bgroup\color{demo}$ f(x)=0$\egroup zu erhalten beginnen wir mit irgend einen Näherungswert \bgroup\color{demo}$ x_0$\egroup, betrachten die affine Funktion \bgroup\color{demo}$ x\mapsto f'(x_0)(x-x_0)+f(x_0)$\egroup die \bgroup\color{demo}$ f$\egroup am besten approximiert, bestimmen ihre Nullstelle \bgroup\color{demo}$ x_1$\egroup, d.h. lösen \bgroup\color{demo}$ f'(x_0)(x_1-x_0)+f(x_0)=0$\egroup und erhalten als neue Näherungsnullstelle von \bgroup\color{demo}$ f$\egroup den Punkt \bgroup\color{demo}$ x_1:=x_0-f'(x_0)^{-1}\,f(x_0)$\egroup. Das Newtonverfahren besteht nun darin auf rekursive Weise \bgroup\color{demo}$ x_{n+1}:=g(x_n):=x_n-f'(x_n)^{-1}\,f(x_n)$\egroup zu definieren und zu hoffen, daß \bgroup\color{demo}$ x_{\infty}:=\lim_{n\to{\infty}}x_n$\egroup existiert, weil dann \bgroup\color{demo}$ x_{\infty}=g(x_{\infty})$\egroup, also \bgroup\color{demo}$ f(x_{\infty})=0$\egroup ist (Verwende die stetige Differenzierbarkeit von \bgroup\color{demo}$ f$\egroup und damit die Stetigkeit von \bgroup\color{demo}$ g$\egroup). Da aber die Bestimmung der Inversen \bgroup\color{demo}$ f'(x_0)^{-1}$\egroup einer Matrix \bgroup\color{demo}$ f'(x_0)$\egroup sehr aufwendig ist, modifizieren wir dieses Verfahren derart, daß wir Anstelle von \bgroup\color{demo}$ f'(x_n)$\egroup immer das fixe \bgroup\color{demo}$ f'(x_0)$\egroup verwenden und erhalten:




3.3.8 Vereinfachtes Newtonverfahren.
Es sei \bgroup\color{demo}$ f:E\to F$\egroup stetig differenzierbar und \bgroup\color{demo}$ x_0\in E$\egroup. Es sei \bgroup\color{demo}$ f'(x_0)$\egroup invertierbar und es existiere ein \bgroup\color{demo}$ q<1$\egroup mit \bgroup\color{demo}$ \vert f'(x_0)^{-1}\vert\cdot\vert f'(x_0)-f'(x)\vert\leq q$\egroup für alle \bgroup\color{demo}$ x$\egroup in einer offenen Menge \bgroup\color{demo}$ U$\egroup. Weiters sei

\bgroup\color{demo}$\displaystyle B:=\Bigl\{x:\vert x-x_0\vert\leq\frac{\vert f'(x_0)^{-1}\cdot f(x_0)\vert}{1-q}\Bigr\}\subseteq U.
$\egroup

Dann konvergiert die vereinfachte Newtonfolge \bgroup\color{demo}$ x_{n+1}:=x_n-f'(x_0)^{-1}\cdot f(x_n)$\egroup gegen eine Nullstelle \bgroup\color{demo}$ \xi \in B$\egroup.

Beweis. Wir betrachten \bgroup\color{demo}$ g(x):=x-f'(x_0)^{-1}\cdot f(x)$\egroup. Für \bgroup\color{demo}$ x,y\in B$\egroup ist nach dem Mittelwertsatz \bgroup\color{demo}$ \vert g(x)-g(y)\vert\leq \sup\{\vert g'(\xi )\vert\,\vert x-y\vert:\xi \in B\}$\egroup. Es ist

\bgroup\color{demo}$\displaystyle g'(z)=\operatorname{id}- f'(x_0)^{-1}\, f'(z) = f'(x_0)^{-1}\,(f'(x_0)-f'(z))
$\egroup

und somit

\bgroup\color{demo}$\displaystyle \vert g'(z)\vert\leq \vert f'(x_0)^{-1}\vert\,\vert f'(x_0)-f'(z)\Vert\leq q<1.
$\egroup

Nach Aufgabe 105 ist \bgroup\color{demo}$ g(B)\subseteq B$\egroup, da \bgroup\color{demo}$ B=\{x:d(x,x_0)\leq \frac{d(g(x_0),x_0)}{1-q}\}$\egroup. Nach dem Banach'schen Fixpunktsatz 2.4.6 existiert somit \bgroup\color{demo}$ x_{\infty}:=\lim_{n\to{\infty}} x_n\in B$\egroup und somit ist \bgroup\color{demo}$ x_{\infty}=g(x_{\infty})=x_{\infty}-f'(x_0)^{-1}\cdot f(x_{\infty})$\egroup, also ist \bgroup\color{demo}$ f(x_{\infty})=0$\egroup.     []


3.3.9 Beispiel.
Die Menge der Startwerte, für die die Newtonfolge gegen eine fixe Nullstelle konvergiert, ist im allgemeinen schwer beschreibbar. Betrachten wir z.B. das Polynom \bgroup\color{demo}$ p(z):=z^3-1$\egroup als Abbildung \bgroup\color{demo}$ p:\mathbb{C}\to\mathbb{C}$\egroup. Dieses hat 3 komplexe Nullstellen \bgroup\color{demo}$ 1$\egroup, \bgroup\color{demo}$ -\frac12\pm i\,\frac{\sqrt{3}}2$\egroup. Wir können es auch als Abbildung \bgroup\color{demo}$ p:\mathbb{R}^2\to\mathbb{R}^2$\egroup auffassen. Die Ableitung von \bgroup\color{demo}$ p$\egroup ist gegeben durch (Multiplikation mit) \bgroup\color{demo}$ 3z^2$\egroup und die Newtonrekursion somit durch \bgroup\color{demo}$ g:z\mapsto z-\frac{p(z)}{p'(z)}=z-\frac{z^3-1}{3z^2}=\frac{2z^3+1}{3z^2}$\egroup. Färben wir die Punkte der Ebene in 3 Farbe entsprechend den 3 Nullstellen gegen welche die Newtonfolge mit diesen Startwerten konvergiert so erhalten wir folgendes fraktales Bild, eine Juliamenge:

\bgroup\color{demo}\includegraphics[scale=.3]{julia-1}\egroup

Wir werden später sehen, daß für die Konvergenz der allgemeinen Newtonfolge die Bedingungen \bgroup\color{demo}$ \vert f'(z)^{-1}\vert^2\,\vert f''(z)\vert\,\vert f(z)\vert\leq q<1$\egroup und \bgroup\color{demo}$ \vert f'(z)^{-1}\, f(z)\vert\leq (1-q)\,r$\egroup für alle \bgroup\color{demo}$ \vert z-z_0\vert\leq r$\egroup genügen. In diesen Beispiel sind diese Bedingungen für \bgroup\color{demo}$ q:=1/2$\egroup und \bgroup\color{demo}$ r:=1/2$\egroup erfüllt.

Andreas Kriegl 2001-07-01