close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Analysis 2 - am Institut für Mathematik der Universität Augsburg

EinbettenHerunterladen
Analysis 2
Vorlesungsskript
Sommersemester 2014
Bernd Schmidt∗
Version vom 15. Oktober 2014
∗
Institut f¨
ur Mathematik, Universit¨at Augsburg, Universit¨atsstr. 14, 86135 Augsburg, bschmidt@math.uni-augsburg.de
1
Inhaltsverzeichnis
Inhaltsverzeichnis
2
1 Einleitung
3
2 Das
2.1
2.2
2.3
Integral
Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . .
Integration und Differentiation . . . . . . . . . . . . . . . . . . . .
Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . .
4
4
15
21
3 Funktionenfolgen
3.1 Konvergenz von Funktionenfolgen
3.2 Potenzreihen . . . . . . . . . . . .
3.3 Taylor-Approximation . . . . . .
3.4 Fourier-Reihen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
27
27
34
37
43
4 Metrische und normierte R¨
aume
4.1 Topologische Begriffe . . . . . .
4.2 Folgen und Funktionen . . . . .
4.3 Kompaktheit . . . . . . . . . .
4.4 Der Banachsche Fixpunktsatz .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
65
73
80
5 Mehrdimensionale Differentialrechnung
5.1 Ableitungen in mehreren Variablen . . .
5.2 Lokale Inverse und implizite Funktionen
5.3 H¨ohere Ableitungen . . . . . . . . . . . .
5.4 Taylor-Approximation . . . . . . . . . .
5.5 Extrema . . . . . . . . . . . . . . . . . .
5.6 Parameter-abh¨angige Integrale . . . . . .
5.7 Kurven, Vektorfelder und Potentiale . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
87
87
95
102
111
114
119
122
Literaturverzeichnis
.
.
.
.
129
2
Kapitel 1
Einleitung
Diese Vorlesung setzt die Vorlesung Analysis 1 fort. Wir behandeln zun¨achst die
Riemannsche Integrationstheorie einer reeller Ver¨anderlicher mit dem zentralen
Hauptssatz der Differential- und Integralrechnung. Danach besch¨aftigen wir uns
mit Funktionenfolgen, insbesondere mit Potenzreihen, der Taylorapproximation
glatter Funktionen und den Fourier-Reihen. Etwas abstrakter behandeln wir anschließend die grundlegenden Aspekte der Theorie metrischer R¨aume. Die hier
vorgestellten topologischen Begriffe sind nicht nur Basis unseres Studiums von
Funktionen in mehreren Ver¨anderlichen, sondern gestatten in gewisser Hinsicht
auch einen allgemeineren Blickpunkt auf Wohlbekanntes. Schließlich widmen wir
uns ausf¨
uhrlich der mehrdimensionalen Differentialrechnung mit den grundlegenden S¨atzen u
¨ber differenzierbare Funktionen und Anwendungen insbesondere auf
die Diskussion von Extrema.
Vorkenntnisse: N¨otige Vorkenntnisse sind der Stoff der Vorlesung Analysis 1
und einige Grundlagen aus der Linearen Algebra.
Literatur: Es gibt eine ganze Menge an B¨
uchern zur Analysis. Den Stoff dieser
Vorlesung finden sie insbesondere in den empfehlenswerten B¨
uchern von Forster
[For1, For2] und K¨onigsberger [K¨o1, K¨o]. In den sp¨ateren Kapiteln ben¨otigen wir
auch ein paar Grundkenntnisse in der linearen Algebra, die Sie etwa in dem Buch
von Fischer [Fi] finden.
Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skript
per E-Mail mit.
Vielen Dank an alle, die mich auf Fehler in fr¨
uheren Versionen dieses Skripts
aufmerksam gemacht haben, insbesondere an Miguel de Benito Delgado, Anne
Gr¨
unzig, Martin Jesenko, Sabrina Maucher, Benedikt von Seelstrang und Caroline Ziegler.
3
Kapitel 2
Das Integral
b
In diesem Kapitel definieren wir das Integral a f (x) dx f¨
ur geeignete Funktionen
f : [a, b] → R und untersuchen dessen wichtigste Eigenschaften. Das Integral
misst die (signierte) Fl¨ache zwischen Funktionsgraph und x-Achse. Heuristisch
erh¨alt man das Integral, indem man die Strecke [a, b] in unendlich viele unendlich
feine Intervalle [x, x+dx) aufteilt und die entsprechend unendlich vielen unendlich
d¨
unnen Rechtecke mit signierter Fl¨ache f (x) dx aufsummiert: f (x) dx. Daher
auch das stilisierte S als Integrationszeichen. Unsere erste Aufgabe wird es sein,
diese heuristischen Ideen in sinnvolle Mathematik zu u
uren: Das geschieht in
¨berf¨
Abschnitt 2.1.
Der Integrationsbegriff ist von grundlegender Bedeutung f¨
ur die gesamte Analysis und viele weitere Bereiche innerhalb der Mathematik und den Anwendungen.
Vor allem der Zusammenhang zur Differentiation ist fundamental: Wir werden
sehen, dass die Integration in gewisser Hinsicht eine zur Differentiation inverse
Operation darstellt. Dies wird im Abschnitt 2.2 genauer erkl¨art.
2.1
Definition des Integrals
Die Strategie zur Definition des Integrals ist die folgende: Zun¨achst betrachten
wir besonders einfache Funktionen, f¨
ur die man das Integral einfach hinschreiben
kann. Dann verwenden wir einen Grenzprozess, um die Klasse der integrierbaren
Funktionen soweit auszudehnen, dass sie f¨
ur all unsere Belange ausreicht und
insbesondere alle stetigen Funktionen beinhaltet. F¨
ur diesen Grenzprozess gibt
es in der mathematischen Literatur mehrere Ans¨atze, die zu Integralbegriffen
unterschiedlicher Allgemeinheit f¨
uhren. Wir werden hier vor allem das RiemannIntegral behandeln und sp¨ater noch kurz auf das sogenannte Regelintegral eingehen. Beide dieser Ans¨atze haben ihre Vorz¨
uge und Nachteile, der Begriff des
Riemann-Integrals ist aber wohl der anschaulichere. Das wesentlich allgemeinere
Lebesgue-Integral werden wir erst in der Analysis 3 behandeln.
4
Das Integral fu
¨ r Treppenfunktionen
Es sei [a, b] ⊂ R ein kompaktes Intervall.
Definition 2.1 Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn es
eine Unterteilung a = x0 < x1 < . . . < xn = b derart gibt, dass f |(xi−1 ,xi ) konstant
ist f¨
ur alle i = 1, . . . , n. Eine solche Unterteilung heiße f zugeh¨orig. Die Menge
der Treppenfunktionen auf [a, b] wird mit T [a, b] bezeichnet.
(Sind M, N Mengen, f : M → N eine Abbildung und U ⊂ M , so bezeichnet
f |U : U → N die Einschr¨ankung von f auf U , die durch f |U (x) = f (x) f¨
ur x ∈ U
gegeben ist.)
Lemma 2.2 Sind f, g ∈ T [a, b] und λ ∈ R, so sind auch f + g und λf Treppenfunktionen.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
und
Z : a = x0 < x1 < . . . < xm = b
Zerlegungen, so dass f auf allen (xi−1 , xi ) und g auf allen (xj−1 , xj ) konstant ist.
Die gemeinsame Verfeinerung von Z und Z ist dann die Unterteilung
Z : a = x0 < x1 < . . . < xl = b
mit {x0 , . . . , xl } = {x0 , . . . , xl }∪{x0 , . . . , xl }. Da f +g und λf auf allen Intervallen
(xk−1 , xk ) konstant sind, ergibt sich die Behauptung.
Bemerkung: Da die Menge R[a,b] aller Abbildungen von [a, b] nach R ein Vektorraum ist und offensichtlich 0 ∈ T [a, b] gilt, besagt dieses Lemma gerade, dass
T [a, b] ein Vektorraum ist. Man spricht daher auch vom Raum der Treppenfunktionen auf [a, b].
Definition 2.3 Es sei f ∈ T [a, b] mit f (x) = ci f¨
ur x ∈ (xi−1 , xi ), i = 1, . . . , n,
f¨
ur die f zugeh¨orige Unterteilung a = x0 < x1 < . . . < xn = b. Das Integral von
f ist dann definiert durch
n
b
ci (xi − xi−1 ).
f (x) dx :=
a
i=1
b
a
Wir schreiben auch manchmal nur kurz
f.
Wir m¨
ussen zeigen, dass dieser Begriff wohldefiniert ist, also nicht von der speziell
gew¨ahlten Zerlegung abh¨angt.
Beweis. Es seien
Z : a = x0 < x1 < . . . < xn = b
und
5
Z : a = x0 < x1 < . . . < xm = b
zu f geh¨orige Zerlegungen, so dass f die Werte ci bzw. cj auf den entsprechenden
Intervallen annehme. Enth¨alt etwa Z nur einen zus¨atzlichen Punkt x , der im
Intervall (xk−1 , xk ) liegt, so ist
m
cj (xj − xj−1 )
j=1
k−1
n
ci (xi − xi−1 ) + ck (x − xk−1 ) + ck (xk − x ) +
=
i=1
n
ci (xi − xi−1 )
i=k+1
ci (xi − xi−1 ),
=
i=1
so dass diese Unterteilungen zum gleichen Integral f¨
uhren. Daraus ergibt sich
induktiv der Fall, dass Z eine Verfeinerung von Z ist, d.h., dass jeder Unterteilungspunkt von Z auch einer von Z ist, induktiv. Der allgemeine Fall folgt dann,
indem man die Werte f¨
ur Z und Z mit dem der gemeinsamen Verfeinerung Z
vergleicht.
Lemma 2.4 Das Integral ist linear und monoton auf T [a, b]:
(i) F¨
ur f, g ∈ T [a, b], λ ∈ R gilt
b
b
b
sowie
a
a
a
g(x) dx
f (x) dx +
f (x) + g(x) dx =
b
b
λf (x) dx = λ
a
f (x) dx.
a
(ii) F¨
ur f, g ∈ T [a, b] mit f ≤ g ist
b
b
f (x) dx ≤
a
g(x) dx.
a
Beweis. Indem wir ggf. zur gemeinsamen Verfeinerung u
urfen wir
¨bergehen, d¨
alle Integrale bez¨
uglich einer sowohl zu f als auch zu g geh¨origen Unterteilung
angeben. Die Behauptungen sind dann klar.
Das Riemann-Integral
Wir kommen nun zur wesentlichen Idee der Riemann-Integration: der Approximation von oben und unten durch Treppenfunktionen.
6
Definition 2.5 Ist f : [a, b] → R beschr¨ankt, so definieren wir das Ober- und
Unterintegral von f durch
∗
b
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≥ f
f (x) dx := inf
,
bzw.
a
b
ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≤ f
f (x) dx := sup
∗
.
a
Ist f selbst schon eine Treppenfunktion, so gilt nat¨
urlich
∗
b
f (x) dx =
f (x) dx =
f (x) dx.
∗
a
Des Weiteren ist offenbar f¨
ur jedes f
∗
f≤
∗
f
f =−
und
∗
(−f ).
∗
Lemma 2.6 Es seien f, g : [a, b] → R beschr¨ankt und λ ≥ 0. Dann gilt:
(i) Subadditivit¨at des Oberintegrals:
∗
∗
∗
(f + g) ≤
g.
f+
(ii) Superadditivit¨at des Unterintegrals:
(f + g) ≥
g.
f+
∗
∗
∗
(iii) Positive Homogenit¨at des Ober- und Unterintegrals:
∗
∗
λf = λ
f
und
λf = λ
∗
f.
∗
Beweis. (i) Es sei ε > 0. W¨ahle Treppenfunktionen ϕ, ψ mit ϕ ≥ f , ψ ≥ g und
∗
b
∗
b
f ≥ a ϕ − 2ε sowie
g ≥ a ψ − 2ε . Nach Lemma 2.4 ist dann
∗
b
(f + g) ≤
b
(ϕ + ψ) =
a
∗
b
ψ≤
ϕ+
a
a
Da ε beliebig war, folgt die Behauptung.
(ii) Das folgt direkt aus (i) und ∗ f = −
7
∗
(−f ).
∗
f+
g + ε.
(iii) Der Fall λ = 0 ist trivial, so dass wir λ > 0 annehmen. Zu ε > 0 w¨ahle
∗
b
eine Treppenfunktion ϕ mit ϕ ≥ f und
f ≥ a ϕ − λε . Da λf ≤ λϕ gilt, ergibt
sich
b
∗
∗
b
∗
ε
λϕ = λ
ϕ≤λ
=λ
f + ε.
λf ≤
f+
λ
a
a
Wieder weil ε beliebig war, folgt daraus nun
∗
∗
λf ≤ λ
f
und damit – angewendet auf λ−1 – auch
∗
λ
∗
f =λ
∗
λ−1 λf ≤ λλ−1
∗
λf =
λf.
¨
Die analoge Aussage f¨
ur Unterintegrale ergibt sich nun wieder durch Ubergang
von f zu −f .
Definition 2.7 Eine beschr¨ankte Funktion f : [a, b] → R heißt (Riemann-)integrierbar, wenn
∗
f=
f
∗
gilt. Ist f Riemann-integrierbar, so definiert man das (Riemann-)Integral von f
durch
b
a
∗
b
f :=
f (x) dx :=
f (x) dx.
a
Die Menge der Riemann-integrierbaren Funktionen auf [a, b] bezeichnen wir mit
R[a, b].
Nat¨
urlich kann man statt x auch andere Bezeichnungen f¨
ur die Integrationsvab
b
b
riable benutzen, etwa a f = a f (t) dt = a f (y) dy . . .
Beachte, dass dieses Integral f¨
ur Treppenfunktionen mit dem zuvor definierten
Integral u
¨bereinstimmt.
Beispiel: Es seien a = 0, b = 1 und f (x) = x. F¨
ur jedes n ∈ N sind die Funktionen ϕ, ψ mit
1
1
nx ,
ϕn (x) = ψn (x) +
ψn (x) =
n
n
Treppenfunktionen mit ψn ≤ f ≤ ϕn und Integralen
n−1
1
ψn (x) dx =
0
i=0
i 1
n−1
· =
,
n n
2n
1
1
ϕ(x) dx =
0
8
ψn (x) dx +
0
1
n+1
=
.
n
2n
Daher ist f¨
ur alle n
n−1
≤
2n
∗
f (x) dx ≤
f (x) dx ≤
∗
n+1
.
2n
Mit n → ∞ folgt f ∈ R[0, 1] und
1
0
1
x dx = .
2
Direkt aus der Definition ergibt sich das folgende Kriterium.
Lemma 2.8 Eine Funktion f : [a, b] → R liegt genau dann in R[a, b], wenn es
zu jedem ε > 0 Treppenfunktionen ψ, ϕ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
b
b
ψ≤ε
ϕ−
a
a
gibt.
Beweis. Klar.
Integrierbare Funktionen
Satz 2.9 Die Menge der Riemann-integrierbaren Funktionen R[a, b] bildet einen
Vektorraum. Das Riemann-Integral ist eine monotone lineare Abbildung von R[a, b]
nach R:
(i) F¨
ur f, g ∈ R[a, b], λ ∈ R sind auch f + g und λf ∈ R[a, b] mit
b
b
a
b
f (x) dx +
f (x) + g(x) dx =
g(x) dx
sowie
a
a
b
b
λf (x) dx = λ
a
f (x) dx.
a
(ii) F¨
ur f, g ∈ R[a, b] mit f ≤ g gilt
b
b
f (x) dx ≤
a
g(x) dx.
a
Beweis. (i) Die Additivit¨at folgt aus Lemma 2.6. Demnach ist
b
a
∗
b
g≤
f+
a
(f + g) ≤
∗
b
(f + g) ≤
a
9
b
f+
g,
a
so dass hier sogar Gleichheit gilt. Damit ist f + g integrierbar und das Integral
ist
∗
b
b
b
g.
f+
(f + g) =
(f + g) =
a
a
a
Die positive Homogenit¨at ergibt sich auch direkt aus Lemma 2.6. Dann gilt aber
auch f¨
ur λ < 0
∗
∗
λf = −
∗
b
∗
∗
a
b
f =−
f =λ
f =λ
(−λf ) = λ
(−λf ) =
λf,
∗
b
also λf ∈ R[a, b] mit a λf = λ a f .
(ii) F¨
ur jedes ϕ ∈ T [a, b] mit ϕ ≥ g ist auch ϕ ≥ f . Daher ist
∗
b
∗
f≤
f=
b
g=
a
g.
a
Des Weiteren erf¨
ullt R[a, b] die folgenden Eigenschaften.
Satz 2.10 Sind f, g ∈ R[a, b], so sind auch
(i) f+ , f− ∈ R[a, b],
(ii) |f |α ∈ R[a, b] f¨
ur alle α > 0 und
(iii) f g ∈ R[a, b].
Hierbei bezeichnet f± die Funktionen
f (x), falls f (x) ≥ 0,
0,
falls f (x) < 0
f+ (x) =
und
−f (x), falls f (x) ≤ 0,
0,
falls f (x) > 0.
f− (x) = (−f )+ (x) =
Beweis. (i) F¨
ur jedes ε > 0 gibt es ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und
ε. Dann aber sind auch ϕ± und ψ± Treppenfunktionen, die
ψ+ ≤ f+ ≤ ϕ+
ϕ− ≤ f− ≤ ψ−
und
erf¨
ullen. Die Behauptung folgt dann aus Lemma 2.8 mit
b
b
ϕ+ −
a
b
ψ+ ≤
a
(ϕ − ψ) < ε,
a
10
b
a
ψ−
b
a
ϕ<
denn es ist ϕ+ − ψ+ ≤ ϕ − ψ, und
b
b
ψ− −
b
ϕ− ≤
a
(ϕ − ψ) < ε,
a
a
denn es ist ψ− − ϕ− = (−ψ)+ − (−ϕ)+ ≤ −ψ − (−ϕ) = ϕ − ψ.
(ii) Wir u
¨berlegen uns zun¨achst, dass es zu jedem η > 0 und M > 0 eine
Konstante C gibt, so dass
|y α − xα | ≤ η + C|y − x| ∀ x, y ∈ [0, M ]
gilt. Dazu muss man nur beachten, dass es wegen der gleichm¨aßigen Stetigkeit der
Abbildung t → tα auf [0, M ] ein δ > 0 gibt, so dass |y α − xα | ≤ η f¨
ur |y − x| ≤ δ
α
gilt. Setzt man dann C = Mδ , so gilt diese Absch¨atzung f¨
ur alle x, y ∈ [0, M ].
ε
.
Es sei ε > 0 beliebig. Setze M = max{|f (x)| : x ∈ [a, b]} und η = 2(b−a)
b
b
ε
W¨ahle ϕ, ψ ∈ T [a, b] mit 0 ≤ ψ ≤ |f | ≤ ϕ ≤ M und a ϕ − a ψ < 2C
.
α
α
(Nach (i) ist |f | = f+ + f− ∈ R[a, b].) Dann sind einerseits ϕ , ψ ∈ T [a, b] mit
ψ α ≤ |f |α ≤ ϕα . Andererseits gilt
b
b
ϕα −
a
b
ψα <
a
(η + C(ϕ − ψ)) ≤
a
ε
+C
2
b
b
ϕ−
a
ψ
≤ ε.
a
(iii) Dies folgt aus (ii) und f g = 14 (|f + g|2 − |f − g|2 ).
Als direkte Folgerung halten wir noch eine elementare aber wichtige Absch¨atzung
fest.
Korollar 2.11 Ist f Riemann-integrierbar, so auch |f |. Dabei gilt
b
b
f (x) dx ≤
|f (x)| dx.
a
a
Beweis. Dies folgt direkt aus der Monotonie des Integrals und aus f, −f ≤ |f |.
In Abh¨angigkeit vom Integrationsbereich ergibt sich das folgende Lemma.
Lemma 2.12 Es sei a < b < c. Genau dann ist f ∈ R[a, c], wenn f |[a,b] ∈ R[a, b]
und f |[b,c] ∈ R[b, c] ist. In diesem Falle gilt
c
b
f=
a
c
f+
f.
a
b
Beweis. Klar.
Vereinbarungsgem¨aß setzen wir noch
a
b
f := −
b
f
a
f¨
ur a < b.
Besonders wichtig ist es nun nat¨
urlich zu wissen, ob gegebene Funktionen
integrierbar sind. Der folgende Satz garantiert dies f¨
ur alle stetigen Funktionen.
11
Satz 2.13 Jede stetige Funktion f : [a, b] → R ist Riemann-integrierbar.
Wir zeigen hierzu ein auch f¨
ur sich genommen interessantes Lemma u
¨ber die
Approximierbarkeit von stetigen Funktionen durch Treppenfunktionen.
Lemma 2.14 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis. Da f auf [a, b] gleichm¨aßig stetig ist, k¨onnen wir zu gegebenem ε > 0 ein
δ > 0 finden, so dass |f (x) − f (y)| ≤ ε f¨
ur alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.
Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :
k = 1, . . . , n} < δ, z.B. die ¨aquidistante Zerlegung mit xk = a + nk (b − a) mit
f¨
ur hinreichend große n. Wir definieren dann Treppenfunktionen
xk − xk−1 = b−a
n
ψ, ϕ durch
ψ(x) = min{f (ξ) : ξ ∈ [xi−1 , xi ]},
ϕ(x) = max{f (ξ) : ξ ∈ [xi−1 , xi ]}
f¨
ur x ∈ [xi−1 , xi ) und ψ(b) = ϕ(b) = f (b). Dann gilt ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.
Beweis von Satz 2.13. Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es nach
ε
Lemma 2.14 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ − ψ < b−a
.
Dann aber ist auch
b
b
ϕ−
a
b
ψ≤
a
a
ε
dx = ε,
b−a
und die Behauptung folgt aus Lemma 2.8.
Bemerkungen.
1. Es gibt noch mehr integrierbare Abbildungen. Eine weitere Klasse ist die
der monotonen Funktionen: Jede monotone Funktion f : [a, b] → R ist
¨
Riemann-integrierbar. (Ubung!)
2. Ohne Beweis und Relevanz f¨
ur unsere weiteren Untersuchungen geben wir
noch ein notwendig und hinreichendes Kriterium f¨
ur die Riemann-Integrierbarkeit an. Man nennt eine Teilmenge M ⊂ [a, b] eine Lebesguesche Nullmenge, wenn es zu jedem ε > 0 eine Folge von Intervallen (ai , bi ) gibt, die
M u
¨berdecken, d.h.
M ⊂ (ai , bi )
gilt, und die
(bi − ai ) < ε
i
erf¨
ullen. (Solche Mengen sind also in gewissem Sinne sehr klein.) Man kann
dann zeigen, dass eine beschr¨ankte Funktion f : [a, b] → R genau dann
Riemann-integrierbar ist, wenn sie außerhalb einer Lebesgueschen Nullmenge stetig ist.
12
Riemannsche Summen
Ist f : [a, b] → R eine Funktion,
Z : a = x0 < x1 < . . . < xn = b
eine Zerlegung von [a, b] und ξk ∈ [xk−1 , xk ], k = 1, . . . , n, so nennt man
n
f (ξk )(xk − xk−1 )
k=1
eine Riemannsche Summe. Man definiert die Feinheit von Z durch
ρ(Z) := max{xk − xk−1 : k = 1, . . . , n}.
In der Tat konvergieren Riemannsche Summen gegen das Integral von f , wenn
die Feinheit der Zerlegung gegen 0 strebt:
Satz 2.15 Es sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 ein δ > 0,
so dass f¨
ur jede Unterteilung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ und
jede Wahl von St¨
utzstellen ξk ∈ [xk−1 , xk ], k = 1, . . . , n,
n
b
f (x) dx −
a
f (ξk )(xk − xk−1 ) < ε
k=1
gilt.
Bemerkung: Der Satz gilt sogar f¨
ur alle f ∈ R[a, b], was wir hier aber nicht
beweisen.
Beweis. Zu gegebenem ε > 0 definieren wir genau wie im Beweis von Lemma 2.14
ε
(nur mit b−a
an Stelle von ε) zu einer Zerlegung Z : a = x0 < x1 < . . . < xn = b
mit ρ(Z) ≤ δ die Treppenfunktionen ψ und ϕ. Es ist dann einerseits
b
b
ψ≤
a
b
f≤
a
b
ϕ≤
ψ + ε.
a
a
Andererseits ergibt sich wegen ψ(x) ≤ f (ξk ) ≤ ϕ(x) f¨
ur x ∈ [xk−1 , xk ) auch
n
b
ψ≤
a
b
f (ξi )(xi − xi−1 ) ≤
a
i=1
b
ϕ≤
ψ + ε.
a
Hieraus folgt die Behauptung.
Als Anwendung dieses Satzes k¨onnen wir nun die H¨older- und die MinkowskiUngleichung vom Rn auf Funktionen u
¨bertragen.
13
Definition 2.16 F¨
ur f ∈ R[a, b] und 1 ≤ p < ∞ definiert man die p-Norm von
f durch
1
p
b
f
p
|f (x)|p dx
:=
.
a
Satz 2.17 Es sei f : [a, b] → R stetig.
1
p
(i) H¨oldersche Ungleichung: F¨
ur p, q ∈ (1, ∞) mit
fg
1
≤ f
p
+
1
q
= 1 ist
g q.
(ii) Minkowski-Ungleichung: F¨
ur p ∈ [1, ∞) ist
f +g
p
≤ f
p
+ g p.
Beweis. Wir zerlegen das Intervall [a, b] ¨aquidistant in n ∈ N Strecken der L¨ange
∆n = b−a
und w¨ahlen entsprechende St¨
utzstellen ξ1 , . . . , ξn . Indem man die
n
1/p
n
H¨oldersche Ungleichung f¨
ur den R auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und
1/q
∆n (g(ξ1 ), . . . , g(ξn )) anwendet, ergibt sich
n
1
p
n
|f (ξk )|p ∆n
|f (ξk )g(ξk )|∆n ≤
k=1
k=1
1
q
n
|g(ξk )|q ∆n
.
k=1
Die hier auftretenden Summen sind nun Riemannsche Summen, so dass sich die
Behauptung (i) mit n → ∞ ergibt.
¨
Ahnlich
sieht man mit der Minkowski-Ungleichung f¨
ur den Rn angewendet
1/p
1/p
auf die Vektoren ∆n (f (ξ1 ), . . . , f (ξn )) und ∆n (g(ξ1 ), . . . , g(ξn ))
1
p
n
|f (ξk ) + g(ξk )|p ∆n
i=1
1
p
n
|f (ξk )|p ∆n
≤
k=1
1
p
n
|g(ξk )|p ∆n
+
,
k=1
so dass sich im Limes n → ∞ auch (ii) aus Satz 2.15 ergibt.
Bemerkung: Auch dieser Satz gilt sogar auf R[a, b].
Integration vektorwertiger Funktionen
Die Integration vektorwertiger Funktionen f : [a, b] → Rn , insbesondere die Integration komplexwertiger Funktionen f : [a, b] → C kann ganz einfach auf die
Integration reeller Funktionen zur¨
uckgespielt werden, indem man das Integral
komponentenweise definiert:
14
Definition 2.18 Eine Funktion f : [a, b] → Rn , x → f (x) = (f1 (x), . . . , fn (x))
heißt Riemann-integrierbar, wenn jede Komponente fk : [a, b] → R, k = 1, . . . , n,
Riemann-integrierbar ist. Wir schreiben dann f ∈ R([a, b]; Rn ) und setzen
b
b
b
f (x) dx :=
fn (x) dx .
f1 (x) dx, . . . ,
a
a
a
F¨
ur eine komplexwertige Funktion f : [a, b] → C, x → f (x) = u(x) + iv(x)
mit u, v : [a, b] → R erh¨alt man gem¨aß C ∼
= R2 , dass f Riemann-integrierbar ist
(d.h. f ∈ R([a, b]; C)), wenn u, v ∈ R[a, b] ist. Es ist dann
b
b
f (x) dx :=
a
2.2
b
u(x) dx + i
a
v(x) dx.
a
Integration und Differentiation
Wir tragen zun¨achst noch eine Notation nach: Ist D ⊂ R eine Menge, k ∈ N0
und f : D → R eine k-mal differenzierbare Funktion, so sagt man f sei k-mal
stetig differenzierbar, wenn die k-te Ableitung f (k) : D → R stetig ist. Die Menge
der k-mal stetig diferenzierbaren Funktionen auf D wird mit C k (D) bezeichnet.
F¨
ur k = 0 ist das die Menge der stetigen Funktionen auf D, die man auch einfach
mit C(D) bezeichnet.
Der Hauptsatz
Wir untersuchen nun das Integral einer Funktion in Abh¨angigkeit von den Integrationsgrenzen, indem wir die obere Integrationsgrenze variieren.
Satz 2.19 Es sei f ∈ R[a, b], c ∈ [a, b]. Definiere F : [a, b] → R durch
x
F (x) =
f (t) dt.
c
Ist x ∈ [a, b], so dass f bei x stetig ist, so ist F in x differenzierbar und es gilt
F (x) = f (x).
Beweis. Ist h ∈ R \ {0} mit x + h ∈ [a, b], so gilt
1
F (x + h) − F (x)
− f (x) =
h
h
1
=
h
x+h
x
f (t) dt −
c
x+h
f (t) dt − f (x)
c
(f (t) − f (x)) dt
x
15
und daher
F (x + h) − F (x)
1
− f (x) ≤
h
h
x+h
|f (t) − f (x)| dt.
x
F¨
ur h > 0 folgt das direkt aus der Monotonie des Integrals, f¨
ur h < 0 beachte
x+h
x
1
zus¨atzlich, dass h1 x (· · · ) = |h|
(·
·
·
)
ist.
x+h
Zu ε > 0 gegeben w¨ahle nun δ > 0, so dass |f (t) − f (x)| < ε f¨
ur alle t mit
|t − x| < δ ist. Dann ergibt sich f¨
ur |h| < δ
F (x + h) − F (x)
1
− f (x) ≤
h
h
x+h
ε dt = ε.
x
(x)
Dann aber ist F bei x differenzierbar mit F (x) = limh→0 F (x+h)−F
= f (x).
h
Bemerkung: Die Voraussetzung, dass f in x stetig ist, ist wesentlich, wie das
Beispiel f (t) = χ{x} (t) zeigt.
Definition 2.20 Sind f, F : [a, b] → R mit F differenzierbar, so nennt man F
eine Stammfunktion von f , wenn F = f gilt.
x
Satz 2.19 zeigt also, dass F definiert durch F = c f (t) dt eine Stammfunktion
von f ist, wenn f stetig ist. Hierdurch motiviert schreibt man auch allgemein eine
Stammfunktion einer Funktion f bisweilen als unbestimmtes Integral in der Form
f (x) dx, obwohl der Hauptssatz nur f¨
ur stetige Funktionen gilt und Stammfunktionen, wie wir gleich sehen werden, nicht eindeutig sind.
Zu einer gegebenen Funktion f : [a, b] → R kann es mehrere Stammfunktionen
geben, die sich aber h¨ochstens um eine Konstante unterscheiden k¨onnen:
Lemma 2.21 Es seien f, F, G : [a, b] → R, so dass F eine Stammfunktion von
f ist. Genau dann ist auch G eine Stammfunktion von f , wenn G − F konstant
ist.
Beweis. Ist F − G konstant, so ist auch G differenzierbar mit G = F = f . Ist
umgekehrt G eine Stammfunktion von f , so gilt G = f = F , also (G − F ) = 0.
Dann aber ist G − F konstant. (Mittelwertsatz!)
Wir kommen nun zum zentralen Ergebnis dieses Abschnitts:
Satz 2.22 (Hauptsatz der Differential- und Integralrechnung) Ist f ∈ C[a, b]
und F eine Stammfunktion von f , so gilt
b
f (x) dx = F (b) − F (a).
a
16
Die rechte Seite F (b) − F (a) dieser Formel wird oft mit F (x)|ba abgek¨
urzt.
Beweis. Definiere Fa : [a, b] → R durch
x
Fa (x) =
f (t) dt.
a
(Beachte C[a, b] ⊂ R[a, b].) Nach Satz 2.19 ist dann Fa eine Stammfuktion von f
und nach Konstruktion gilt
b
f (t) dt = Fa (b) = Fa (b) − Fa (a).
a
Nach Lemma 2.21 ist aber F (b) − F (a) = Fa (b) − Fa (a).
Dieser Satz erleichtert die Bestimmung von Integralen nun ganz erheblich.
Beispiele:
1. Es ist
1
0
x2
x dx =
2
1
0
1
= .
2
2. F¨
ur a, b > 0 und α = −1 ist
b
xα+1
x dx =
α+1
b
α
a
=
a
bα+1 − aα+1
.
α+1
3. F¨
ur α = −1 und a, b > 0 ist
b
b
x−1 dx = log x a .
a
F¨
ur a, b < 0 dagegen ist
b
a
b
x−1 dx = log(−x) a .
Zusammengefasst erh¨alt man
b
a
4. Es gilt
1
b
dx = log |x| a .
x
π
sin x dx = − cos x
0
17
π
0
= cos 0 − cos π = 2.
Rechnen mit Integralen
Genauso wie jede Differentiationsformel die explizite Bestimmung eines Integrals
erm¨oglicht, ergibt jede Differentiationsregel eine Integrationsregel:
Aus der Produktregel erhalten wir die Formel der partiellen Integration:
Satz 2.23 (Partielle Integration) Sind f, g ∈ C 1 [a, b], so gilt
b
a
b
b
f (x) g (x) dx = f (x) g(x) a −
f (x) g(x) dx.
a
Beweis. Wegen (f g) = f g +f g ist f g eine Stammfunktion der stetigen Funktion
f g + f g . Nach dem Hauptsatz ist also
b
a
b
(f (x)g(x) + f (x)g (x)) dx = f (x)g(x) a .
Beispiele:
1. F¨
ur alle a, b gilt
b
x ex dx = x ex
a
b
a
b
ex dx = x ex
−
a
b
a
− ex
b
a
b
= (x − 1)ex a .
2. F¨
ur x > 0 ist
x
x
1 · log t dt = t log t −
log t dt =
1
x
x
1
1
t·
1
1
dt = x log x − x + 1.
t
Also ist x → x log x − x eine Stammfunktion von log.
Aus der Kettenregel ergibt sich die Substitutionsformel:
Satz 2.24 (Substitutionsregel) Es seien I ein Intervall, f : I → R stetig und
g ∈ C 1 [a, b] mit Werten in I. Dann ist
b
g(b)
f (g(x)) g (x) dx =
a
f (y) dy.
g(a)
Beweis. Es sei F : g([a, b]) → R eine Stammfunktion von f . (Beachte, dass
g([a, b]) ein abgeschlossenes beschr¨anktes Intervall ist.) Nach der Kettenregel ist
F ◦ g eine Stammfunktion der stetigen Abbildung [a, b] x → f (g(x))g (x). Aus
dem Hauptsatz folgt nun
b
g(b)
f (g(x)) g (x) dx = F (g(b)) − F (g(a)) =
a
f (y) dy.
g(a)
18
Beispiele:
1. F¨
ur −1 < a < b < 1 ist
b√
b
1 − x2 dx =
a
1 − sin2 (arcsin x) dx
a
b
1 − sin2 (arcsin x) cos(arcsin x)
=
a
arcsin b
1
dx
cos(arcsin x)
arcsin b
cos2 y dy.
2
1 − sin y cos y dy =
=
arcsin a
arcsin a
Mit a → −1 und b → 1 ergibt sich die Fl¨ache des Einheitshalbkreises zu
1
√
1−
x2
π
2
π
2
2
dx =
cos y dy =
− π2
−1
− π2
π
cos2 y + sin2 y
dy = ,
2
2
wobei wir ausgenutzt haben, dass cos2 (y + π2 ) = sin2 y gilt und cos2 periodisch mit Periode π ist.
2. Ist f ∈ C 1 [a, b] mit f = 0 auf [a, b], so gilt
b
a
f (x)
b
dx = log |f (x)| a .
f (x)
Zum Schluss dieses Paragraphen beweisen wir noch zwei theoretische Ergebnisse. Zun¨achst eines, mit dem man durch eine nicht negative Funktion w gewichtete Integrale behandeln kann.
Satz 2.25 (Mittelwertsatz der Integralrechnung) Es seien f ∈ C[a, b], w ∈
R[a, b] mit w ≥ 0. Dann gibt es ein ξ ∈ [a, b] derart, dass
b
b
f (x) w(x) dx = f (ξ)
w(x) dx.
a
a
Beweis. Mit m = inf{f (x) : x ∈ [a, b]}, M = sup{f (x) : x ∈ [a, b]} gilt mw ≤
f w ≤ M w auf [a, b] und daher
b
b
w(x) dx ≤
m
a
b
f (x) w(x) dx ≤ M
a
w(x) dx
a
wegen der Monotonie des Integrals. Es gibt also ein µ ∈ [m, M ], so dass
b
b
f (x) w(x) dx = µ
a
w(x) dx
a
ist. Die Behauptung folgt nun aus dem Zwischenwertsatz, nach dem es ein ξ ∈
[a, b] mit f (ξ) = µ gibt.
Das zweite Resultat ist insbesondere zur approximativen Bestimmung von
Integralen wichtig.
19
Satz 2.26 (Trapez-Regel) Ist f ∈ C 2 [0, 1], so gibt es ein ξ ∈ [0, 1] mit
1
f (x) dx =
0
1
1
f (0) + f (1) − f (ξ).
2
12
Beweis. Mit partieller Integration berechnet man
1
1
x−
2
f (x) dx =
0
1
1
x−
f (x) −
0
2
0
1
2
f (x) dx
1
1 2
x −x
1
x −x
= f (1) + f (0) −
f (x) +
f (x) dx
2
2
2
0
0
1
1
x − x2
= f (1) + f (0) − 0 −
f (x) dx.
2
2
0
Nach dem Mittelwertsatz der Integralrechung existiert nun ein ξ ∈ [0, 1] mit
1
1
1
x − x2
f (1) + f (0) − f (ξ)
dx
2
2
0
1
1
= f (1) + f (0) − f (ξ).
2
12
f (x) dx =
0
Eine Anwendung
Wir diskutieren nun noch eine Anwendung, die sp¨ater von Nutzen sein wird. Als
Vorbereitung bestimmen wir die Werte
π
2
ak :=
sink x dx
0
f¨
ur k ∈ N0 rekursiv: Offenbar ist a0 =
ist
π
2
ak+2 =
π/2
π
2
und a1 = − cos x|0
= 1. Des Weiteren
sink+2 x dx
0
π
2
=
sin x sink+1 x dx
0
= − cos x sin
k+1
x
π
2
0
π
2
=0+
π
2
+
cos x (k + 1) sink x cos x dx
0
(k + 1) sink x (1 − sin2 x) dx
0
= (k + 1)ak − (k + 1)ak+2 ,
20
so dass sich nach Aufl¨osen nach ak+2 die Rekursionsformel
ak+2 =
k+1
ak
k+2
ergibt. Es folgt
(2k − 1) · (2k − 3) · . . . · 3 · 1 π
·
2k · (2k − 2) · . . . · 4 · 2
2
2k · (2k − 2) · . . . · 4 · 2
=
(2k + 1) · (2k − 1) · . . . · 5 · 3
a2k =
a2k+1
und
und insbesondere
a2k+1
(2k)2
(2k − 2)2
42
22 2
=
·
· ... ·
·
· .
a2k
(2k + 1) · (2k − 1) (2k − 1) · (2k − 3)
5·3 3·1 π
Lemma 2.27 (Wallissches Produkt) Es gilt
∞
4m2
π
= .
2
4m − 1
2
m=1
Beweis. F¨
ur x ∈ [0, π2 ] ist (sink x)k und daher auch (ak ) monoton fallend. Damit
ist
a2k+2
a2k+1
a2k
2k + 1
=
≤
≤
=1
2k + 2
a2k
a2k
a2k
und folglich limk→∞
a2k+1
a2k
= 1. Nach unseren Vorbereitungen ist dann jedoch
k
4m2
a2k+1 π
π
= lim
· = .
2
k→∞
4m − 1 k→∞ a2k 2
2
m=1
lim
2.3
Uneigentliche Integrale
Durch einen Grenzprozess gelingt es, auch gewisse Funktionen, die auf unbeschr¨ankten Intervallen definiert sind oder die selbst unbeschr¨ankt sind, zu integrieren. Man spricht in diesem Falle von uneigentlichen Integralen.
Definition 2.28 Es sei f : [a, b) → R eine Funktion, wobei a ∈ R und b ∈
R ∪ {+∞}, b > a sei. Ist f ∈ R[a, r] f¨
ur alle r ∈ R mit a < r < b, so setzen wir
b
r
f (x) dx = lim
a
r→b
21
f (x) dx,
a
falls dieser Grenzwert existiert. Analog definieren wir f¨
ur f : (a, b] → R, wobei
a ∈ R ∪ {−∞} und b ∈ R, b > a sei, so dass f ∈ R[r, b] f¨
ur alle r ∈ R mit
a < r < b ist,
b
b
f (x) dx = lim
r→a
a
f (x) dx,
r
falls dieser Grenzwert existiert.
Man sagt dann, dass das uneigentliche Integral existiert oder dass diese Integrale konvergieren.
Beispiele:
1. Das Integral
∞
xα dx
1
konvergiert genau f¨
ur α < −1, denn genau dann existiert der Grenzwert
von
r
α
x dx =
1
f¨
ur r
rα+1 −1
α+1
log r
f¨
ur α = −1,
f¨
ur α = −1
∞.
2. Umgekehrt konvergiert
1
xα dx
0
genau dann, wenn α > −1, denn dann und nur dann existiert der Grenzwert
von

α+1
 lim r α+1−1 f¨
1
ur α = −1,
+
lim+
xα dx = r→0
 lim log r
r→0
f¨
ur α = −1
r
+
r→0
f¨
ur r
0.
Ist f an beiden Integrationsgrenzen nicht erkl¨art, so definiert man:
Definition 2.29 Es sei f : (a, b) → R eine Funktion, wobei a ∈ R ∪ {−∞} und
b ∈ R ∪ {+∞}, b > a sei. W¨ahle c ∈ (a, b). Ist f ∈ R[r, s] f¨
ur alle r, s ∈ R mit
a < r < s < b, so setzen wir
b
a
c
f (x) dx = lim+
r→a
r
r
f (x) dx + lim−
r→b
f (x) dx,
c
falls die beiden uneigentlichen Integrale auf der rechten Seite existieren.
22
Bemerkung: Man sieht leicht, dass diese Definition unabh¨angig von der Wahl
von c ist und mit der vorigen u
¨bereinstimmt, falls schon f ∈ R[a, b] gilt. Beachten
∞
Sie auch, dass die Existenz von −∞ f (x) dx nicht ¨aquivalent zur Existenz von
r
limr→∞ −r f (x) dx ist, wie das Beispiel f (x) = x zeigt!
Als Beispiel betrachten wir die sogenannte Gamma-Funktion Γ : (0, ∞) → R,
die definiert ist als
∞
Γ(x) :=
tx−1 e−t dt.
0
Dieses Integral konvergiert, denn es ist tx−1 e−t ≤ tx−1 , so dass das uneigentliche
Integral u
ur eine von
¨ber (0, 1] existiert, und zudem tx−1 e−t ≤ Ct−2 auf [1, ∞) f¨
t unabh¨angige Konstante C, so dass auch das uneigentliche Integral u
¨ber [1, ∞)
existiert.
Die Gamma-Funktion ist deshalb von großer Bedeutung, weil sie die Fakult¨at
auf den reellen Zahlen interpoliert.
Satz 2.30 Es gilt
(i) Γ(n + 1) = n! f¨
ur alle n ∈ N0 und
(ii) Γ(x + 1) = xΓ(x) f¨
ur alle x ∈ R mit x > 0.
Beweis. (ii) F¨
ur x > 0 und 0 < r < R < ∞ ergibt partielle Integration
R
R
R
tx e−t dt = −tx e−t
xtx−1 e−t dt.
+
r
r
r
Mit r → 0 und R → ∞ folgt in der Tat Γ(x + 1) = 0 + xΓ(x) = xΓ(x).
(i) F¨
ur n = 0 ist
∞
e−t dt = lim −e−t
Γ(1) =
r→∞
0
r
= 1.
0
Die Behauptung folgt nun induktiv aus (ii).
Das asymptotische Verhalten von n! f¨
ur große n kann man mit der Stirlingschen Formel bestimmen. Dabei sagen wir, dass zwei Folgen (an ) und (bn ) asymptotisch gleich sind und schreiben an ∼ bn , wenn limn→∞ abnn = 1 gilt.
Satz 2.31 (Formel von Stirling) Es gilt
n! ∼
√
2πn
n
e
n
.
Beweis. Nach der Trapezregel ist
k+1
log x dx =
k
1
1
log k + log(k + 1) +
2
12ξk2
23
f¨
ur geeignete ξk ∈ [k, k + 1], wobei wir log (x) = −x−2 ausgenutzt haben. Einerseits liefert nun Summation u
¨ber k = 1, . . . , n − 1
n
1
n
1
1
log x dx =
log k − log n +
2
12
k=1
n−1
k=1
1
.
ξk2
Andererseits ist, da x → x log x − x Stammfunktion von log ist,
n
log x dx = n log n − n + 1,
1
so dass
n
log k =
k=1
1
n+
2
1
log n − n + 1 −
12
n−1
k=1
1
ξk2
folgt. Anwenden der Exponentialfunktion f¨
uhrt auf
1
n! = cn nn+ 2 e−n
n−1 1
1
mit cn = exp 1 − 12
k=1 ξk2 . Wegen
ment, so dass c = limn→∞ cn existiert.
Es bleibt, c zu berechnen:
1
ξk2
≤
1
k2
konvergiert die Summe im Argu-
√
1
c2n
(n!n−n− 2 en )2
c2
2 22n (n!)2
√
= lim
= lim
c=
=
lim
·
1
n→∞ c2n
n→∞ (2n)!(2n)−(2n)− 2 e2n
n→∞
c
(2n)!
n
√
√
2 22 · 42 · 62 · . . . · (2n)2
2
2 · 4 · 6 · . . . · 2n
= lim √ ·
= lim √ ·
n→∞
n→∞
1 · 2 · 3 · . . . · 2n
n
n 1 · 3 · 5 · . . . · (2n − 1)
√ √
2 · 2n + 1
22 · 42 · 62 · . . . · (2n)2
√
= lim
·
n→∞
1 · 3 · 3 · 5 · 5 · . . . · (2n − 1) · (2n − 1) · (2n + 1)
n
1
√ √
n
2
2
4k
2 · 2n + 1
π √
√
= lim
·
=
2
= 2π
n→∞
4k 2 − 1
2
n
k=1
1
2
nach Lemma 2.27. Daher ist tas¨achlich
n!
cn
lim √
= lim √ = 1.
n+ 12 −n
n→∞
n→∞
2π
2π n
e
Mit Hilfe von uneigentlichen Integralen l¨asst sich auch ein n¨
utzliches Konvergenzkriterium f¨
ur Reihen herleiten:
Satz 2.32 (Integralvergleichskriterium) ist f : [1, ∞) → R, f ≥ 0 eine
monoton fallende Funktion, so konvergiert die Reihe ∞
k=1 f (k) genau dann, wenn
das uneigentliche Integral
∞
f (x) dx
1
existiert.
24
Beweis. Wegen der Monotonie des Integrals gilt
k+1
f (x) dx ≥ f (k + 1),
f (k) ≥
k = 1, 2, . . . .
k
Summation u
¨ber k = 1, . . . , n − 1 liefert
n−1
n
n
f (x) dx ≥
f (k) ≥
1
k=1
f (k).
k=2
R
1
Damit ist der in R monotone Ausdruck
f (x) dx genau dann beschr¨ankt, wenn
die monotone Folge der Partialsummen ( nk=1 f (k))n beschr¨ankt ist. Daraus folgt
die Behauptung.
α
Beispiel: Die Reihe ∞
k=1 k konvergiert genau dann, wenn α < −1 ist.
Schließlich bemerken wir noch – im Vorgriff auf die in der Analysis 3 zu behandelnde Integrationstheorie im Mehrdimensionalen, dass sich auch jetzt schon
gewisse Bogenl¨angen von ‘gekr¨
ummten Kurven’ sowie Oberfl¨achen und Volumina spezieller dreidimensionaler K¨orper berechnen lassen, wobei wir eine rigorose
Rechtfertigung dieser Formeln auf sp¨ater vertagen.
Ist [a, b] ein kompaktes Intervall und f ∈ C 1 [a, b], so beschreibt der Graph
{(x, f (x)) : x ∈ [a, b]} eine Kurve im R2 . Ist a = x0 < x1 < . . . < xn = b
eine Zerlegung von [a, b], so l¨asst sich die L¨ange dieser Kurve mit dem Satz von
Pythagoras durch
n
(xk − xk−1 )2 + (f (xk ) − f (xk−1 ))2
k=1
n
f (xk ) − f (xk−1 )
xk − xk−1
1+
=
k=1
n
2
(xk − xk−1 )
1 + (f (xk ))2 (xk − xk−1 )
≈
k=1
approximieren. Geht nun die Feinheit der Zerlegung gegen 0, so konvergiert dieser
Ausdruck gegen
b
1 + (f (x))2 dx,
a
weshalb hierdurch die Bogenl¨ange des Graphen gegeben ist.
√
Beispiel. Wie im Beispiel 1 von Seite 19 sei −1 < a < b < 1 und f (x) = 1 − x2
x
mit f (x) = − √1−x
2 und
b
b
1 + (f (x))2 dx =
a
1+
a
b
√
=
a
x2
dx
1 − x2
1
dx = arcsin b − arcsin a.
1 − x2
25
Im Limes a → −1, b → +1 folgt hieraus, dass die Bogenl¨ange des halben Einheitskreises gegeben ist durch
1
1 + (f (x))2 dx = π.
−1
Wir nehmen nun zus¨atzlich an, dass f ≥ 0 gilt, und betrachten den K¨orper,
der dadurch entsteht, dass der Graph von f im dreidimensionalen Raum um die
x-Achse rotiert wird. Genauer:
K = (x, y, z) ∈ R3 :
y 2 + z 2 ≤ f (x) .
Das Volumen dieses K¨orpers l¨asst sich durch Aufteilung in d¨
unne Kreisscheiben
durch
n
π(f (xk ))2 (xk − xk−1 )
k=1
approximieren, so dass sich im Limes unendlich feiner Zerlegung der Ausdruck
b
(f (x))2 dx
π
a
f¨
ur das Volumen von K ergibt. Die Oberfl¨ache dieses K¨orpers ist gegeben durch
die zwei Kreisscheiben in {a, b} × R2 sowie eine gekr¨
ummte Rotationsfl¨ache, die
sich durch
n
2πf (xk ) 1 +
k=1
f (xk ) − f (xk−1 )
xk − xk−1
2
(xk − xk−1 )
ann¨ahern l¨asst, so dass sich ihre Oberfl¨ache entsprechend zu
b
2π
f (x)
1 + (f (x))2 dx
a
ergibt.
26
Kapitel 3
Funktionenfolgen
In diesem Kapitel fassen wir einige Themen zusammen, die auf die Diskussion
einer Funktionenfolge zur¨
uckgef¨
uhrt werden k¨onnen. Eine Klasse besonders gutartiger Funktionen sind die sogenannten Potenzreihen, die wir im Abschnitt 3.2
behandeln. Definierende Eigenschaft dieser Funktionen ist es, dass sie sich lokal durch eine spezielle Reihenentwicklung (und also als Grenzwert bestimmter
Funktionenfolgen) darstellen lassen.
Ein wesentlicher Aspekt bei der Untersuchung von Funktionenfolgen ist es,
eine gegebene Funktion f durch eine Folge einfacherer Funktionen fn zu approximieren. Die in Abschnitt 3.3 vorgestellte Taylor-Approximation liefert etwa
eine m¨oglichst gute lokale Approximation mittels Polynomen fn an eine gegebene Funktion in der Umgebung eines zuvor festgelegten Punktes. Die FourierReihen, die wir dann in Abschnitt 3.4 besprechen werden, geben dagegen globale
Approximationen an periodische Abbildungen mit Hilfe von trigonometrischen
Funktionen fn .
Anders als bei den Zahlenfolgen aus der Analysis 1 gibt es unterschiedliche,
nicht ¨aquivalente Konzepte der Konvergenz einer Funktionenfolge, weshalb wir
uns im ersten Abschnitt 3.1 zun¨achst etwas eingehender mit diesen Begriffen auseinandersetzen werden. Dabei ist es nat¨
urlich insbesondere von Interesse, welche
Eigenschaften der Funktionen fn sich auf die Grenzfunktion f u
¨bertragen lassen.
3.1
Konvergenz von Funktionenfolgen
Punktweise und gleichm¨
aßige Konvergenz
Wir definieren nun zun¨achst wichtige Konvergenzbegriffe f¨
ur Funktionenfolgen
und untersuchen dann, wie sich Eigenschaften von Funktionen wie etwa die Stetigkeit und Operationen auf Funktionen wie etwa das Integral unter Grenzwertbildung verh¨alt.
Im Folgenden sei M eine nicht leere Menge. Die Wertemenge der betrachteten
27
Funktionen kann R oder C sein. Um dies nicht spezifizieren zu m¨
ussen, schreiben
wir K und behandeln damit die F¨alle K = R und K = C synchron.
Definition 3.1 (Punktweise Konvergenz) Eine Folge (fn ) von Funktionen
fn : M → K konvergiert punktweise gegen f : M → K, wenn f¨
ur jedes x ∈ M gilt
fn (x) → f (x).
Mit anderen Worten: fn → f punktweise genau dann, wenn
∀ x ∈ M ∀ ε > 0 ∃ N ∈ N : n ≥ N =⇒ |fn (x) − f (x)| < ε.
Obwohl dies eine nat¨
urliche Bedingung f¨
ur die Konvergenz von Funktionenfolgen
darstellt, ist sie – wie wir sehen werden – f¨
ur viele interessante Anwendungen
nicht stark genug. Das Problem ist, das die Konvergenzgeschwindigkeit beliebig
langsam werden kann, wenn man die betrachtete Stelle x variiert. Wenn das nicht
passiert, wenn man also das N unabh¨angig von x (d.h. gleichm¨aßig) w¨ahlen kann,
spricht man von gleichm¨aßiger Konvergenz:
Definition 3.2 (Gleichm¨
aßige Konvergenz) Eine Folge (fn ) von Funktionen
fn : M → K konvergiert gleichm¨aßig gegen f : M → K, wenn
∀ ε > 0 ∃ N ∈ N ∀ x ∈ M : n ≥ N =⇒ |fn (x) − f (x)| < ε.
Beispiele: Es sei M = [0, 1], K = R.
1. fn mit fn (x) = xn konvergiert punktweise aber nicht gleichm¨aßig gegen f
mit
0 f¨
ur x < 1,
f (x) =
1 f¨
ur x = 1.
2. Es sei fn ∈ C[0, 1] diejenige st¨
uckweise affine Funktion, die fn (0) = fn ( n1 ) =
1
fn (1) = 0 und fn ( 2n
) = n erf¨
ullt und dazwischen, d.h. auf den Intervallen
1 1
1
1
[0, 2n ], [ 2n , n ] und [ n , 1] affin ist. Dann gilt fn → 0 punktweise aber nicht
gleichm¨aßig.
3. fn mit fn (x) =
1
n
sin nx konvergiert gleichm¨aßig gegen 0.
4. fn mit fn (x) = sin nx konvergiert weder gleichm¨aßig noch punktweise.
Offensichtlich imliziert die gleichm¨aßige Konvergenz die punktweise Konvergenz. Die Beispiele 1 und 2 von eben zeigen, dass die Umkehrung jedoch nicht
gilt.
Bevor wir Eigenschaften dieser Konvergenzbegriffe studieren, geben wir noch
eine oft benutzte Umformulierung der gleichm¨aßigen Konvergenz an und f¨
uhren
dazu zun¨achst die folgende Notation eon.
28
Definition 3.3 F¨
ur f : M → K definieren wir die Supremumsorm von f durch
f
∞
:= sup |f (x)|.
x∈M
Offensichlich ist f
∞
< ∞ genau dann, wenn f beschr¨ankt ist.
Lemma 3.4 Es seien fn , f : M → K, n ∈ N. Genau dann konvergiert fn
gleichm¨aßig gegen f , wenn
lim fn − f
n→∞
∞
=0
ist.
Beweis. Ist limn→∞ fn − f ∞ = 0, so gibt es zu jedem ε > 0 ein N ∈ N mit
supx∈M |fn (x) − f (x)| < ε. Insbesondere ist also f¨
ur jedes x ∈ M und n ≥ N auch
|fn (x) − f (x)| < ε.
Gilt umgekehrt fn → f gleichm¨aßig, so gibt es zu jedem ε > 0 ein N ∈ N mit
|fn (x) − f (x)| < 2ε f¨
ur alle n ≥ N und x ∈ M . Dann aber ist
fn − f
∞
= sup |fn (x) − f (x)| ≤
x∈M
ε
<ε
2
f¨
ur diese n.
Mit Hilfe der Supremumsnorm l¨asst sich ein n¨
utzliches Kriterium f¨
ur die
gleichm¨aßige Konvergenz von Funktionenreihen herleiten:
Satz 3.5 (Das Weierstraß-Kriterium) Es seien fk : M → K Funktionen, so
dass die reelle Reihe ∞
k=1 fk ∞ konvergiert. Dann konvergiert die Funktionenreihe
∞
fk
k=1
absolut und gleichm¨aßig gegen eine Funktion f : M → K.
(Das heißt nat¨
urlich, dass f¨
ur jedes x die Reihe ∞
k=1 |fk (x)| konvergiert und die
n
Funktionenfolge der Partialsummen k=1 fk gleichm¨aßig gegen f konvergiert f¨
ur
n → ∞.)
Beweis. F¨
ur alle x ∈ M ist
∞
∞
|fk (x)| ≤
k=1
so dass
f (x) =
∞
k=1 fk (x) absolut
∞
n=1 fn (x).
fk
∞
< ∞,
k=1
konvergiert. Wir bezeichnen den Wert der Reihe mit
29
Zu ε > 0 w¨ahle N ∈ N, so dass
aber ist
∞
k=n+1
fn
∞
n
fk (x) − f (x) =
k=1
< ε f¨
ur alle n ≥ N ist. Dann
∞
fk (x) ≤
k=n+1
f¨
ur diese n und alle x ∈ M .
Beispiel: Die Reihe
∞
∞
|fk (x)| ≤
k=n+1
∞
k=1
fk
∞
<ε
k=n+1
eikx
k2
konvergiert absolut und gleichm¨aßig auf M = R, denn es ist
eik·
k2 ∞
=
1
.
k2
Eigenschaften gleichm¨
aßig konvergenter Funktionenfolgen
Eine wichtige Eigenschaft der gleichm¨aßigen Konvergenz ist, dass sie Stetigkeit
erh¨alt:
Satz 3.6 Es seien M ⊂ R und fn , f : M → K. Konvergiert fn gleichm¨aßig gegen
f und sind die fn stetig, so ist auch f stetig.
Beweis. Der Beweis ist ein typisches ‘ 3ε -Argument’. Sei ε > 0, x0 ∈ M . W¨ahle
N ∈ N so groß, dass |fn (x) − f (x)| < 3ε gilt f¨
ur alle x ∈ M und n ≥ N . Da
insbesondere fN stetig ist, k¨onnen wir δ > 0 w¨ahlen, so dass |fN (x) − fN (x0 )| < 3ε
ist, wenn |x − x0 | < δ ist. Damit gilt jedoch f¨
ur |x − x0 | < δ:
|f (x) − f (x0 )| = |f (x) − fN (x) + fN (x) − fN (x0 ) + fN (x0 ) − f (x0 )|
≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )|
ε ε ε
≤ + + = ε.
3 3 3
Bemerkung: Beispiel 1 von Seite 28 zeigt, dass Stetigkeit unter punktweiser
Konvergenz im Allgemeinen nicht erhalten bleibt.
Auch Integrale verhalten sich gutartig unter gleichm¨aßiger Konvergenz:
Satz 3.7 Es seien fn ∈ R[a, b] gleichm¨aßig konvergent gegen f : [a, b] → K.
Dann ist auch f ∈ R[a, b] und es gilt
b
b
fn (x) dx →
a
f (x) dx
a
mit n → ∞.
30
Beweis. Indem wir gegebenenfalls den Real- und Imagin¨arteil separat betrachten,
d¨
urfen wir o.B.d.A. annehmen, dass K = R ist.
ε
Zu ε > 0 w¨ahle N ∈ N, so dass |fn (x) − f (x)| < 3(b−a)
f¨
ur alle n ≥ N und
x ∈ [a, b] gelte. Einerseits gibt es nun nach Lemma 2.8 ϕ, ψ ∈ T [a, b] mit
b
ϕ ≤ fN ≤ ψ
und
a
Dann aber gilt f¨
ur ϕε = ϕ −
ε
3(b−a)
ε
(ψ − ϕ) < .
3
und ψε = ψ +
ε
3(b−a)
auch
b
ϕε ≤ f ≤ ψε
(ψε − ϕε ) < ε,
und
a
was wiederum nach Lemma 2.8 f ∈ R[a, b] beweist. Andererseits ergibt sich
hiermit nun
b
b
fn (x) dx −
a
b
f (x) dx ≤
a
b
|fn (x) − f (x)| dx ≤
a
a
ε
dx < ε
3(b − a)
f¨
ur alle n ≥ N .
Bemerkungen:
1. Konvergiert fn nur punktweise gegen f , so muss die Aussage dieses Satzes
nicht gelten. Ein Gegenbeispiel ist die Funktionenfolge aus Beispiel 2 von
Seite 28. Hier ist
1
1
1
fn = = 0 =
0.
2
0
0
2. Ableitungen verhalten sich nicht so gutartig unter gleichm¨aßiger Konvergenz. Das Beispiel 3 von Seite 28 zeigt, dass fn → f gleichm¨aßig nicht
fn → f impliziert: Dort ist fn (x) = cos nx, was noch nicht mal punktweise
gegen irgendeine Funktion konvergiert.
Auch die Differenzierbarkeit von f allein folgt nicht aus der Differenzierbarkeit
¨
der fn , wenn fn gleichm¨aßig gegen f konvergiert. (Ubung!)
Wir haben aber den
folgenden Satz.
Satz 3.8 Es seien fn ∈ C 1 [a, b] und g : [a, b] → R. Es gelte
(i) fn → g gleichm¨aßig auf [a, b] und es gebe
(ii) ein c ∈ [a, b], so dass die reelle Folge fn (c) konvergiert.
Dann existiert ein f ∈ C 1 [a, b], so dass fn → f gleichm¨aßig konvergiert, und es
ist f = g.
31
Beweis. Nach dem Hauptsatz ist
x
fn (t) dt
fn (x) = fn (c) +
c
f¨
ur alle n ∈ N und x ∈ I. Aus Satz 3.6 ergibt sich, dass g stetig ist. Setzen wir
daher γ = limn→∞ fn (c) und
x
f (x) := γ +
g(t) dt,
c
so folgt einerseits aus Satz 2.19, dass f = g und somit f stetig differenzierbar
ist. Andererseits haben wir
x
|fn (x) − f (x)| ≤ fn (c) +
x
fn (t) dt − γ −
c
g(t) dt
c
max{c,x}
|fn (t) − g(t)| dt
≤ |fn (c) − γ| +
min{c,x}
≤ |fn (c) − γ| + (b − a) fn − g
∞
≤ |fn (c) − γ| + (b − a) fn − g
∞
f¨
ur alle x und damit
fn − f
∞
→0
mit n → ∞.
Konvergenz im p-ten Mittel
Speziell f¨
ur Funktionenfolgen auf Intervallen M = [a, b] k¨onnen wir mit Hilfe
der p-Normen aus dem vorigen Kapitel noch eine weitere Art der Konvergenz
einf¨
uhren:
Definition 3.9 (Konvergenz im p-ten Mittel) Es sei p ∈ [1, ∞). Eine Folge
fn ∈ R[a, b] konvergiert im p-ten Mittel gegen f ∈ R[a, b], wenn
lim fn − f
n→∞
p
=0
gilt.
Bemerkungen:
1. Achtung! Die Grenzfunktion f im p-ten Mittel ist nicht eindeutig. Ist z.B.
g eine Funktion, die von f an nur einem Punkt abweicht, so gilt mit fn −
f p → 0 auch fn − g p → 0. (Es gibt aber h¨ochstens eine stetige Funktion
¨
¨
f mit fn − f p → 0. Ubung:
Uberlegen
Sie sich das!)
32
2. Mit Hilfe von uneigentlichen Integralen lassen sich die p-Normen und die
Konvergenz im p-ten Mittel auch f¨
ur Funktionen auf unbeschr¨ankten Intervallen definieren.
3. Das Beispiel 2 von Seite 28 zeigt, dass es punktweise konvergente Folgen
gibt, die nicht im p-ten Mittel konvergieren. Umgekehrt stimmt das auch:
Es gibt eine Funktionenfolge fn mit fn → 0 im p-ten Mittel, die nicht
¨
punktweise gegen 0 strebt. (Ubung!)
Auf beschr¨ankten Intervallen wird die Konvergenz im p-ten Mittel mit wachsendem p immer st¨arker und die gleichm¨aßige Konvergenz ist st¨arker als jede
Konvergenz im p-ten Mittel:
Satz 3.10 Es seien fn , f ∈ R[a, b].
(i) Ist p > p und gilt fn → f im p -ten Mittel, so folgt auch fn → f im p-ten
Mittel.
(ii) Gilt fn → f gleichm¨aßig, so folgt fn → f im p-ten Mittel f¨
ur alle 1 ≤ p <
∞.
Beweis. (i) Wir wenden die H¨oldersche Ungleichung aus Satz 2.17 mit Exponenten
p˜
auf die konstante Funktion 1 und die Funktion |fn − f |p an,
p˜ = pp und q˜ = p˜−1
um
b
b
1 · |fn − f |p
|fn − f |p =
a
a
1
q˜
b
1
p
˜
b
q˜
≤
p˜
p
|fn − f |
1
a
= (b − a)
p
p
b
1
q˜
p
|fn − f |
a
a
zu erhalten. Zieht man hier die p-te Wurzel, so ergibt sich
fn − f
1
p
≤ (b − a) p˜q fn − f
p
,
woraus die Behauptung folgt.
(ii) Mit fn → f gleichm¨aßig konvergiert auch |fn − f |p gleichm¨aßig gegen 0.
Die Behauptung folgt dann aus Satz 3.7.
Die Konvergenz im p-ten Mittel garantiert insbesondere die Konvergenz von
Integralen.
Satz 3.11 Es seien fn , f ∈ R[a, b] mit fn − f
b
lim
n→∞
1
→ 0. Dann ist
b
fn =
a
f.
a
Beweis. Dies folgt sofort aus
b
b
fn −
a
b
f ≤
a
|fn − f | = fn − f
a
33
1.
3.2
Potenzreihen
In diesem Abschnitt sei M ⊂ C und K = C. Wir untersuchen nun die schon in
der Analysis 1 betrachteten Potenzreihen
∞
ck (z − z0 )k
k=0
mit Koeffizienten ck ∈ C, Entwicklungspunkt z0 ∈ C und Variable z ∈ C genauer.
Zun¨achst erinnern wir daran, dass der Konvergenzradius r einer solchen Reihe
durch
∞
ck (z − z0 )k konvergiert
r = sup |z − z0 | :
=
k=0
1
lim supk→∞
k
|ck |
gegeben ist und dass diese Reihe f¨
ur jedes z mit |z − z0 | < r absolut konvergiert,
w¨ahrend sie f¨
ur jedes z mit |z − z0 | > r divergiert, vgl. [Ana 1, Satz 4.41]. Durch
diese Reihe wird also eine Funktion f : Br (z0 ) → C definiert, wobei die durch
die Partialsummen gegebenen Funktionen Br (z0 ) → C, z → nk=0 ck (z − z0 )k
punktweise gegen f konvergieren.1 Es gilt sogar wesentlich mehr:
Satz 3.12 Es seien z0 , c0 , c1 , . . . ∈ C. F¨
ur jedes 0 ≤ ρ < r konvergiert die Potenzreihe
∞
ck (z − z0 )k
k=0
gleichm¨aßig auf B ρ (z0 ) gegen f : B ρ (z0 ) → C.
Beweis. O.B.d.A. sei r > ρ > 0. Setze fk : B ρ (z0 ) → C, fk (z) = ck (z − z0 )k , so
dass fk ∞ = |ck |ρk ist. Wegen
lim sup
k→∞
k
|ck |ρk = ρ lim sup
k→∞
k
|ck | =
ρ
< 1,
r
konvergiert dann die Reihe ∞
k=0 fk ∞ nach dem Wurzelkriterium (s. [Ana 1,
Satz 4.36]), so dass die Behauptung aus dem Weierstraßkriterium 3.5 folgt.
k
Sind z0 = x0 und alle ck reell, so stellt die reelle Potenzreihe ∞
k=0 ck (x − x0 )
mit Konvergenzradius r eine reelle Funktion f : (x0 − r, x0 + r) → R dar (vgl.
[Ana 1, S. 79]). Im Folgenden werden wir zeigen, dass diese Funktionen besonders gutartig sind. Dabei beschr¨anken wir uns auf reelle Potenzreihen. Ein umfassendes Studium der Potenzreihen im Komplexen ist Thema in der sogenannten
Funktionentheorie (der ‘komplexen Analysis’).
1
Erinnerung: F¨
ur r ≥ 0 und p ∈ C ist Br (p) := {z ∈ C : |z − p| < r} und B r (p) := {z ∈ C :
|z − p| ≤ r}.
34
k
Satz 3.13 Es seien x0 , c0 , c1 , . . . ∈ R. Die Potenzreihe ∞
k=0 ck (x−x0 ) habe den
Konvergenzradius r, so dass sie eine Funktion f : (x0 − r, x0 + r) → R darstellt.
Dann ist f unendlich oft differenzierbar und es gilt
∞
f
(n)
ck k (k − 1) · . . . · (k − n + 1)(x − x0 )k−n
(x) =
k=n
f¨
ur n ∈ N0 .
Man darf Potenzreihen also gliedweise differenzieren.
Beweis. F¨
ur n = 0 ist nichts zu zeigen.
Im Fall n = 1 ist zu zeigen, dass f stetig differenzierbar mit f (x) =
x0 )k−1 ist. Dazu beobachten wir zun¨achst, dass wegen
1
lim supk→∞
k
|kck |
=
1
lim supk→∞
k
|ck |
∞
k=1
kck (x−
=r
k−1
den Konvergenzradius r hat und somit
auch die Potenzreihe ∞
k=1 ck k(x − x0 )
eine Funktion g : (x0 − r, x0 + r) → R definiert. Nach Satz 3.12 konvergiert diese
Potenzreihe nun f¨
ur jedes 0 ≤ ρ < r gleichm¨aßig auf [x0 − ρ, x0 + ρ] gegen g.
Da die Partialsummen dieser Reihe gerade die Ableitungen der entsprechenden
Partialsumme der urspr¨
unglichen Reihe sind, folgt nun aus Satz 3.8, dass f auf
[x0 − ρ, x0 + ρ] stetig differenzierbar mit f = g ist. Da dies f¨
ur jedes ρ < r gilt,
folgt hieraus nun die Bahauptung.
Der Fall n ≥ 2 folgt nun induktiv: Ist schon gezeigt, dass f n-mal stetig
differenzierbar ist und f (n) von der angegebenen Form
∞
f
(n)
ck k (k − 1) · . . . · (k − n + 1)(x − x0 )k−n
(x) =
k=n
∞
ck+n (k + n)(k + n − 1) · . . . · (k + 1)(x − x0 )k
=
k=0
mit Konvergenzradius r ist, so zeigt der Fall n = 1 angewandt auf f (n) , dass auch
f (n) stetig differenzierbar ist und
∞
f
(n+1)
ck+n (k + n)(k + n − 1) · . . . · (k + 1)k (x − x0 )k−1
(x) =
k=1
∞
ck k (k − 1) · . . . · (k − (n + 1) + 1)(x − x0 )k−(n+1)
=
k=n+1
erf¨
ullt, wbei diese Reihe wieder den Konvergenzradius r hat.
Nat¨
urlich kann es vorkommen, dass eine Potenzreihe auch bei einem Punkt auf
dem Rand ihres Konvergenzkreises konvergiert, so dass die durch die Potenzreihe
35
dargestellte Funktion auch an diesem Randpunkt erkl¨art werden kann. Die bislang
bewiesenen S¨atze, die alle nur Aussagen u
¨ber das Innere des Konvergenzkreises
machen, garantieren dann allerdings nicht mehr, dass diese Funktion dort dann
auch noch stetig ist. Dass dies – zumindest im Reellen – tats¨achlich stimmt,
besagen der folgende Satz und sein Korollar.
Satz 3.14 (Abelscher Grenzwertsatz) Es seien c0 , c1 , . . . ∈ R. Die Potenz∞
k
reihe ∞
k=0 ck x habe den Konvergenzradius 1. Falls auch
k=0 ck konvergiert,
so ist die Funktion
∞
f : (−1, 1] → R,
ck x k
f (x) =
k=0
stetig.
Da wir schon wissen, dass f auf (−1, 1) stetig ist, besagt dieser Satz lediglich,
dass
lim f (x) = f (1)
x
1
gilt. Daher die Bezeichnung ‘Grenzwertsatz’.
Beweis. Wir leiten zun¨achst eine alternative Darstellung von f (x) f¨
ur 0 ≤ x < 1
her. Sei dazu sn = nk=0 ck die n-te Partialsumme und s−1 := 0. Nach Voraussetzung konvergiert (sn )n≥−1 gegen f (1), ist also insbesondere beschr¨ankt, so dass
n
ur |x| < 1 nach dem Wurzelkriterium konvergiert. F¨
ur
auch die Reihe ∞
n=0 sn x f¨
0 ≤ x < 1 ist dann
∞
∞
(sn − sn−1 )xn
cn x n =
f (x) =
n=0
∞
n=0
∞
∞
n
sn x − x
=
n=0
sn−1 x
n−1
s n xn .
= (1 − x)
n=0
n=0
Mit der Formel f¨
ur die geometrische Reihe folgt hieraus
∞
∞
n
|f (x) − f (1)| = (1 − x)
xn
sn x − f (1)(1 − x)
n=0
∞
n=0
(sn − f (1))xn
= (1 − x)
n=0
∞
|sn − f (1)|xn .
≤ (1 − x)
n=0
Ist nun ε > 0 gegeben, so k¨onnen wir wegen f (1) = limn→∞ sn ein N ∈ N w¨ahlen,
so dass |sn − f (1)| < 2ε f¨
ur n ≥ N ist. Damit ergibt sich
∞
∞
∞
ε
ε
ε
(1 − x)
|sn − f (1)|x ≤ (1 − x)
xn ≤ (1 − x)
xn = .
2
2
2
n=0
n=N
n=N
n
36
W¨ahlen wir nun C = 1 + max{|sn − f (1)| : 0 ≤ n < N } und dann δ =
haben wir f¨
ur 1 − δ < x < 1
ε
,
2CN
so
N −1
(1 − x)
ε
|sn − f (1)|xn ≤ δN C = .
2
n=0
Zusammengefasst folgt
∞
|sn − f (1)|xn < ε
|f (x) − f (1)| ≤ (1 − x)
n=0
f¨
ur 1 − δ < x < 1 wie gew¨
unscht.
Korollar 3.15 (Abelscher Grenzwertsatz) Es seien x0 , c0 , c1 , . . . ∈ R. Die
∞
k
k
Potenzreihe ∞
k=0 ck r oder
k=0 ck (x − x0 ) habe den Konvergenzradius r. Falls
∞
k
k=0 ck (−r) konvergiert, so ist die durch
∞
ck (x − x0 )k
f (x) =
k=0
definierte Funktion auf (x0 − r, x0 + r] bzw. [x0 − r, x0 + r) stetig.
Beweis. Dies folgt sofort, indem man Satz 3.14 auf
∞
f˜(x) =
c˜k xk
k=0
0
mit c˜k = ck rk bzw. c˜k = ck (−r)k anwendet und beachtet, dass f (x) = f˜( x−x
)
r
x
−x
0
bzw. f (x) = f˜( r ) gilt.
Bemerkung: Im Komplexen gilt der Satz 3.14 in dieser Form nicht. Der (fast)
gleiche Beweis zeigt aber, dass f¨
ur z → 1 mit |z| < 1 und | Im z| ≤ C(1 − Re z)
f¨
ur eine Konstante C > 0 tats¨achlich wieder f (z) → f (1) gilt. Die Bedingung
| Im z| ≤ C(1 − Re z) schließt aus, dass sich z im Grenzwert tangential am Einheitskreis der 1 n¨ahert.
2
3
Beispiel: Durch f (x) = x− x2 + x3 −+ . . . wird eine stetige Funktion f : (−1, 1] →
R definiert. – Wir werden gleich im n¨achsten Abschnitt sehen, welche!
3.3
Taylor-Approximation
k
Ist f (x) = ∞
k=0 ck (x − x0 ) eine Potenzreihe mit Konvergenzradius r, so ergibt
sich aus Satz 3.13, indem wir x = x0 setzen, insbesondere, dass
f (n) (x0 ) = cn n!
37
f¨
ur n ∈ N0 ist, also
∞
f (k) (x0 )
(x − x0 )k
k!
f (x) =
k=0
gilt. Die Koeffizienten (und damit die gesamte Potenzreihe!) sind also eindeutig
durch f in einer beliebig kleinen Umgebung von x0 bestimmt.
Die Idee der Taylor-Approximation ist es nun, eine gegebene Funktion f durch
die Partialsummen dieser Reihe zu approximieren. Genauer:
Definition 3.16 Es seien I ein Intervall, x0 ∈ I und f ∈ C n (I). Dann heißt
n
Tnf,x0 (x)
f (k) (x0 )
(x − x0 )k
k!
=
k=0
f,x0
das n-te Taylorpolynom von f bei x0 . Das Restglied Rn+1
: I → R ist so definiert,
dass
f,x0
f (x) = Tnf,x0 (x) + Rn+1
(x)
gilt. Ist sogar f ∈ C ∞ (I)so nennt man
∞
f (k) (x0 )
(x − x0 )k
k!
T f,x0 (x) =
k=0
die Taylorreihe von f bei x0 .
Bemerkung: Wenn insbesondere f durch eine Potenzreihe mit Entwicklungspunkt x0 gegeben ist, dann zeigt die Diskussion vom Beginn dieses Abschnitts,
dass diese Potenzreihe gerade die Taylorreihe von f bei x0 ist. Aber Achtung!
Wir werden unten sehen, dass selbst wenn f unendlich oft differenzierbar ist, die
Taylorreihe nicht konvergieren muss. Selbst wenn sie konvergiert, muss sie nicht
gegen f konvergieren!
Der wesentliche Punkt wird nun sein abzusch¨atzen, wie gut die Approximation
mit Taylorpolynomen ist. Dazu zeigen wir zun¨achst die folgende Darstellung des
Restglieds f¨
ur (n + 1)-mal stetig differenzierbare Funktionen:
Satz 3.17 Es seien I ein Intervall, x0 ∈ I und f ∈ C n+1 (I), n ∈ N0 . Dann gilt
Rn+1 (x) =
d.h.
n
f (x) =
k=0
1
n!
x
(x − t)n f (n+1) (t) dt,
x0
f (k) (x0 )
1
(x − x0 )k +
k!
n!
38
x
(x − t)n f (n+1) (t) dt.
x0
Beweis. Wir zeigen dies durch Induktion nach n. F¨
ur n = 0 ist dies gerade der
Hauptssatz der Differential- und Integralrechnung:
x
f (t) dt.
f (x) = f (x0 ) +
x0
Ist nun der Fall n schon gezeigt und f ∈ C n+2 (I), so erhalten wir mit partieller
Integration
n
f (x) =
k=0
n
=
k=0
k=0
x0
t=x
(x − t)n+1 (n+1)
f
(t)
−
n+1
=
n+1
(x − t)n f (n+1) (t) dt
f (k) (x0 )
(x − x0 )k
k!
1
+
n!
=
x
f (k) (x0 )
1
(x − x0 )k +
k!
n!
x
+
x0
t=x0
(x − t)n+1 (n+2)
f
(t) dt
n+1
(x−x0 )n+1 (n+1)
f
(x0 )
n+1
f (k) (x0 )
1
(x − x0 )k +
k!
(n + 1)!
x
(x − t)n+1 f (n+2) (t) dt.
x0
Es gibt verschiedene M¨oglichkeiten, das Restglied umzuformen. Wir beschr¨anken
uns hier darauf, die sogenannte Lagrangesche Form des Restglieds anzugeben:
Satz 3.18 Es seien I ein Intervall, x0 ∈ I und f ∈ C n+1 (I), n ∈ N0 . Dann gibt
es zu jedem x ∈ I ein ξ ∈ [min{x0 , x}, max{x0 , x}], so dass
f,x0
Rn+1
(x) =
f (n+1) (ξ)
(x − x0 )n+1
(n + 1)!
gilt.
Beweis. Nach dem Mittelwertsatz der Integralrechnung gibt es ein ξ zwischen x0
und x, das
Rn+1 (x) =
1
n!
x
(x − t)n f (n+1) (t) dt =
x0
1 (n+1)
f
(ξ)
n!
n+1 x
=
1 (n+1)
−(x − t)
f
(ξ) ·
n!
n+1
(x − t)n dt
x0
(n+1)
=
x0
x
f
(ξ)
(x − x0 )n+1
(n + 1)!
erf¨
ullt. Beachte hierbei, dass die Funktion t → (x−t)n auf [min{x0 , x}, max{x0 , x}]
das Vorzeichen nicht wechselt.
Bislang haben wir zur Absch¨atzung des Restglieds Rn+1 angenommen, dass
f (n + 1)-mal stetig differenzierbar ist. In diesem Falle zeigt Satz 3.18, dass Rn+1
39
f¨
ur x nahe x0 durch C|x − x0 |n+1 , C > 0 eine Konstante, abgesch¨atzt werden
kann. Das Taylorpolynom n-ter Ordnung ist aber auch schon dann definiert, wenn
nur f ∈ C n (I) gilt. Unsere bisherigen Absch¨atzungen machen dann jedoch nur
Aussagen u
¨ber die Approximation mit dem Taylorpolynom der Ordnung (n − 1)
und Fehlerterm Rn . Das n-te Taylorpolynom liefert nun eine Approximation,
deren Fehler Rn+1 zwar nicht mehr wie |x−x0 |n+1 skalieren muss, der aber immer
noch viel kleiner als |x − x0 |n und also Rn ist.
Satz 3.19 Es seien I ein Intervall, x0 ∈ I und f ∈ C n (I), n ∈ N0 . Dann gibt es
eine Funktion η : I → R mit η(x) → 0 f¨
ur x → x0 , so dass
Rn+1 (x) = η(x) (x − x0 )n
gilt.
Beweis. F¨
ur n = 0 k¨onnen wir einfach Rn+1 (x) = f (x) − f (x0 ) =: η(x) setzen.
Es sei nun n ≥ 1. Zu jedem x ∈ I gibt es dann nach Satz 3.18 ein ξ(x)
zwischen x0 und x mit
n
f (x) −
k=0
f (k) (x0 )
f (n) (x0 )
(x − x0 )k = Rnf,x0 (x) −
(x − x0 )n
k!
n!
=
f (n) (ξ(x)) − f (n) (x0 )
(x − x0 )n .
n!
(n)
(n)
(x0 )
setzen. Da
Die Behauptung ergibt sich also, indem wir η(x) = f (ξ(x))−f
n!
ξ(x) zwischen x0 und x liegt und f (n) stetig ist, gilt tats¨achlich limx→x0 η(x) = 0.
Um die G¨
ute von Approximationen zu quantifizieren, sind die folgenden Notationen sehr n¨
utzlich.
Definition 3.20 Es seien f, g : M → R Funktionen und x0 ∈ R∪{−∞}∪{+∞}
ein H¨aufungspunkt von M ⊂ R.
(i) Gilt |f (x)| ≤ C|g(x)| f¨
ur eine Konstante C > 0 und alle x hinreichend
nahe2 an x0 , so schreibt man
f (x) = O(g(x))
(sprich: ‘f (x) ist Groß-O von g(x)’).
(ii) Gilt g(x) = 0 f¨
ur x nahe x0 und limx→x0
f (x) = o(g(x))
2
|f (x)|
|g(x)|
= 0, so schreibt man
(sprich: ‘f (x) ist Klein-o von g(x)’).
F¨
ur x0 = ±∞ bedeutet ‘x hinreichend nahe x0 ’ nat¨
urlich ‘x hinreichend groß bzw. klein’.
40
In beiden F¨allen muss man eigentlich noch noch ‘bei x0 ’ dazusagen, wenn sich
dies nicht aus dem Zusammenhang ergibt.
Damit k¨onnen wir nun die G¨
ute der Restgliedabsch¨atzungen aus Satz 3.18
und Satz 3.19 pr¨agnant ausdr¨
ucken:
f,x0
(x) = O((x − x0 )n+1 ),
f ∈ C n+1 =⇒ Rn+1
f,x0
(x) = o((x − x0 )n ).
f ∈ C n =⇒ Rn+1
Bemerkungen:
1. Achtung! Auch wenn eine Funktion unendlich oft differenzierbar ist, muss
ihre Taylorreihe (außer bei x0 ) nicht konvergieren. So ist etwa die Funktion
f : R → R definiert durch
∞
e−n cos(n2 x)
f (x) =
n=0
unendlich oft differenzierbar, ihre Taylorreihe mit Entwicklungspunkt x0 =
¨
0 jedoch hat den Konvergenzradius 0. (Ubung!)
2. Achtung!! Es kann passieren, dass T f,x0 einen positiven Konvergenzradius
hat, doch dort nicht gegen f (sondern gegen eine andere Funktion) konvergiert. Ein Beispiel hierf¨
ur ist die Funktion f : R → R,
f (x) =
0,
wenn x ≤ 0,
−1/x
e
, wenn x > 0,
¨
(Ubung!).
Wegen f ≡ 0 auf (−∞, 0] muss dann f (n) (0) = 0 f¨
ur alle n ∈ N0
f,0
sein. Damit ist T (x) = 0 f¨
ur alle x ∈ R konvergent. F¨
ur x > 0 ist dann
aber T f,0 (x) = f (x).
Zum Schluss diskutieren wir noch zwei Beispiele: die Reihenentwicklung des
log um x0 = 1 und die Reihenentwicklung des arctan um x0 = 0, die zu zwei
recht h¨
ubschen Formeln f¨
uhren.
Satz 3.21 F¨
ur x ∈ (−1, 1] gilt
log(1 + x) = x −
x2 x3 x4
+
−
+ −....
2
3
4
Beweis. F¨
ur |x| < 1 ist
x
log(1 + x) =
0
1
dt =
1+t
x ∞
∞
xk+1
(−t) dt =
(−1)
,
k+1
k=0
k=0
k
0
41
k
k
wobei wir ausgenutzt haben, dass ∞
k=0 (−t) auf [min{0, x}, max{0, x}] gleich1
m¨aßig gegen 1+t konvergiert, was sich direkt aus dem Weierstraßkriterium ergibt.
Aus dem Abelschen Grenzwertsatz folgt nun, dass diese Darstellung auch noch
(−1)k
f¨
ur x = 1 gilt. Da n¨amlich die Reihe ∞
k=0 k+1 eine konvergente alternierende
Reihe darstellt, ist die rechte Seite dieser Gleichung nach Satz 3.14, genau wie
die linke Seite auf ganz (−1, 1] stetig.
Korollar 3.22 Es gilt
1−
1 1 1
+ − + − . . . = log 2.
2 3 4
Beweis. Setze x = 1 in Satz 3.21.
Satz 3.23 F¨
ur x ∈ [−1, 1] gilt
arctan x = x −
x3 x5 x7
+
−
+ −....
3
5
7
Beweis. F¨
ur |x| < 1 ist
x
arctan x =
0
1
dt =
1 + t2
∞
x ∞
(−1)k
2 k
(−t ) dt =
0
k=0
k=0
x2k+1
.
2k + 1
2 k
Hierbei haben wir ausgenutzt, dass ∞
k=0 (−t ) auf [min{0, x}, max{0, x}] gleich1
m¨aßig gegen 1+t
2 konvergiert, was sich wieder direkt aus dem Weierstraßkriterium
ergibt.
Aus dem Abelschen Grenzwertsatz folgt nun, dass diese Darstellung auch noch
k x2k+1
f¨
ur x = ±1 gilt. Da n¨amlich die Reihe ∞
ur jedes x ∈ [−1, 1] eine
k=0 (−1) 2k+1 f¨
konvergente alternierende Reihe darstellt, ist die rechte Seite dieser Gleichung
nach Korollar 3.15, genau wie der arctan, auf ganz [−1, 1] stetig.
Korollar 3.24 Es gilt
1−
1 1 1
π
+ − + ... = .
3 5 7
4
Beweis. Setze x = 1 in Satz 3.23.
Bemerkung: Aus dem Wurzelkriterium ergibt sich leicht, dass die in den vorigen
Beispielen auftretenden Reihen den Konvergenzradius 1 haben. F¨
ur die um 0
entwickelte Funktion x → log(1 + x) u
¨berrracht dass auch nicht, da ja log(1 + x)
1
f¨
ur x → −1 divergiert. Dem arctan selbst oder der Funktion x → 1+x
2 , die wir
im Beweis zur Konstruktion der Reihe ja verwendet haben, kann man dies aber
nicht so leicht ansehen. Schließlich sind diese Abbildungen unendlich oft auf ganz
1
1
R differenzierbar. Der Umweg u
¨ber C zeigt jedoch, dass 1+z
2 = (z−i)(z+i) Pole
42
bei z = ±i hat, so dass die Taylorreihe, selbst wenn sie auf B1 (0) gegen diese
Funktion konvergiert, auf einer gr¨oßeren Kreisscheibe nicht konvergieren kann.
(Sonst m¨
usste sie dort ja eine stetige Funktion darstellen.) Auch f¨
ur den arctan
direkt sieht man, dass etwa
i−
i3 i5 i7
i
i
i
+ − + ... = i + + + + ...
3
5
7
3 5 7
nicht konvergieren kann. (W¨
urde 1 + 13 + 51 + . . . konvergieren, so a fortiori auch
1
+ 41 + 16 + . . . und mit diesen beiden auch die harmonische Reihe.)
2
3.4
Fourier-Reihen
Im letzten Abschnitt dieses Kapitels wenden wir uns den Fourier-Reihen zu. Unser Ziel ist es hier, periodische Funktionen von R nach C durch trigonometrische
Polynome, die “Prototypen” der periodischen Funktionen, zu approximieren. Dabei wollen wir o.B.d.A. immer 2π-periodische Funktionen betrachten. Allgemeine
Perioden kann man durch eine geeignete Streckung im Urbildbereich ja immer
darauf zur¨
uckf¨
uhren: Ist f l-periodisch, also f (x + l) = f (x) f¨
ur alle x ∈ R, so ist
x → f ( 2πl x) 2π-periodisch.
Da sich jede Funktion f : [0, l) → C eindeutig zu einer l-periodischen Funktion
fortsetzen l¨asst, kann man den ¨aquivalenten Blickpunkt w¨ahlen, dass es in diesem
Kapitel um die Approximation von Funktionen auf endlichen Intervallen, deren
L¨ange o.B.d.A. 2π sei, geht.
Im Gegensatz zu den Taylorreihen suchen wir nun nach globalen Approximationen, die also f auf ganz R approximieren. Dabei werden wir auch nicht glatte
Funktionen f zulassen.
Definition
¨
Die Idee der Fourier-Reihen ist es, eine 2π-periodische Funktin f durch “Uberlaikx
gerung” der Funktionen x → e zu approximieren, also durch ein sogenanntes
trigonometrisches Polynom
n
ck eikx
k=−n
(hier vom Grad n). Die Funktionen x → eikx sind nicht nur mathematisch besonders gut zu behandeln. In der Physik etwa beschreiben sie ebene Wellen und
harmonische Schwingungen.
Definition 3.25 Es sei f : R → C 2π-periodisch und Riemann-integrierbar u
¨ber
[0, 2π].
43
(i) F¨
ur k ∈ Z heißt
ck :=
2π
1
2π
f (x)e−ikx dx
0
der k-te Fourier-Koeffizient von f .
(ii) F¨
ur n ∈ N0 ist
n
ck eikx
Sn f =
k=−n
das n-te Fourier-Polynom von f .
(iii) Die Summe
∞
ck eikx
Sf =
k=−∞
(also die Folge der Partialsummen (Sn f )) heißt Fourier-Summe von f .
Bemerkungen:
1. Warum die ck gerade wie hier angegeben definiert werden, werden wir in
Lemma 3.30 beleuchten.
2. Insbesondere wenn f reellwertig ist, ist es bisweilen n¨
utzlich, die Relation
¨
eikx = cos kx + i sin kx auszunutzen, um Sn f als Uberlagerung
von cos kx
und sin kx zu schreiben:
n
n
ikx
ck e
c−k e−ikx + ck eikx
= c0 +
k=1
n
k=−n
(ck + c−k ) cos kx + i(ck − c−k ) sin kx
= c0 +
k=1
n
=
(ak cos kx + bk sin kx) ,
k=0
wobei a0 = c0 , b0 = 0 und ak = ck + c−k , bk = i(ck − c−k ) f¨
ur k ≥ 1 ist.
Auch die ak und bk nennt man Fourier-Koeffizienten. Ist nun f reellwertig,
so sind alle ak , bk ∈ R.
Wie wir im Anschluss an den Beweis gleich sehen werden, zeigt das folgende Ergebnis insbesondere, dass die Fourierkoeffizienten ck einer Funktion eine
‘beidseitige Nullfolge’ bilden in dem Sinne, dass limk→−∞ ck = limk→+∞ ck = 0
gilt.
44
Lemma 3.26 (Lemma von Riemann-Lebesgue) Ist f : [a, b] → C Riemannintegrierbar, so gilt
b
lim
f (x) sin(αx) dx = 0.
|α|→∞
a
Beweis. 1. Es sei zun¨achst f eine Treppenfunktion mit zugeh¨origer Zerlegung
a = x0 < x1 < . . . < xn = b und Werten f (x) = zj f¨
ur x ∈ (xj−1 , xj ), j = 1, . . . , n.
Dann ist
n
b
f (x) sin(αx) dx =
a
n
xj
zj
j=1
cos(αx)
sin(αx) dx = −
zj
α
xj−1
j=1
xj
→0
xj−1
mit |α| → ∞.
2. Es sei nun allgemein f Riemann-integrierbar. Ist ε > 0, so k¨onnen wir gem¨aß
Lemma 2.8 ϕ1 , ϕ2 , ψ1 , ψ2 ∈ T [a, b] w¨ahlen mit ψ1 ≤ Re f ≤ ϕ1 , ψ2 ≤ Im f ≤ ϕ2
b
b
und a (ϕ1 − ψ1 ) < 3ε sowie a (ϕ2 − ψ2 ) < 3ε , womit auch
b
b
|f (x) − ψ(x)| dx
f (x) − ψ1 (x) − iψ2 (x) sin(αx) dx ≤
a
a
b
| Re f (x) − ψ1 (x)| + | Im f (x) − ψ2 (x)| dx <
≤
a
≤ϕ1 (x)−ψ1 (x)
2ε
3
≤ϕ2 (x)−ψ2 (x)
ist. Nach 1. ist dann aber f¨
ur hinreichend große |α|
b
b
f (x) sin(αx) dx ≤
a
ψ1 (x) + iψ2 (x) sin(αx) dx
a
b
f (x) − ψ1 (x) − iψ2 (x) sin(αx) dx < ε
+
a
wie gew¨
unscht.
Ein v¨ollig analoger Beweis zeigt, dass auch lim|α|→∞
gilt. Wegen eiαx = cos(αx) + i sin(αx) ist daher auch
b
a
f (x) cos(αx) dx = 0
b
f (x) eiαx dx = 0.
lim
|α|→∞
a
Die Fourier-Polynome einer Funktion f lassen sich auch mit Hilfe des sogenannten Dirichlet-Kerns
n
1
Dn (t) :=
eikt
2π k=−n
schreiben:
45
Lemma 3.27 Es gilt
2π
Dn (x − y)f (y) dy.
(Sn f )(x) =
0
Dabei gilt
sin((n+ 12 )t)
2π sin( 12 t)
2n+1
2π
Dn (t) =
2π
0
Des Weiteren ist
f¨
ur t ∈
/ 2πZ,
f¨
ur t ∈ 2πZ.
Dn (t) dt = 1 f¨
ur alle n ∈ N.
Beweis. Die erste Behauptung folgt aus
n
2π
1
2π
k=−n
(Sn f )(x) =
2π
e−iky f (y) dy eikx =
0
0
1
2π
n
e−ik(y−x) f (y) dy.
k=−n
Die angegebene Darstellung f¨
ur Dn (t) ist trivial f¨
ur t ∈ 2πZ. F¨
ur t ∈
/ 2πZ
ergibt sie sich durch Berechnung der geometrischen Summe
n
2n
ikt
e
=e
−int
k=−n
e
ikt
=e
−int 1
k=0
1
=
1
e−i(n+ 2 )t − ei(n+ 2 )t
1
− ei(2n+1)t
1 − eit
=
1
e−i 2 t − ei 2 t
1
1
ei(n+ 2 )t − e−i(n+ 2 )t
1
2i
1
2i
1
1
ei 2 t − e−i 2 t
sin((n + 12 )t)
=
.
sin( 12 t)
Schließlich ist
2π
0
1
Dn (t) dt =
2π
2π
n
2π
e
k=−n
ikt
0
ikt
1
dt =
2π
2π
1 dt = 1,
0
2π
denn f¨
ur k = 0 ist 0 eikt dt = eik 0 = 0.
iαx b
b
¨
¨
(Ubung:
Uberlegen
Sie sich, dass f¨
ur α = 0 tats¨achlich a eiαx dx = eiα a
gilt.)
Die wesentliche Frage, die wir nun beantworten wollen, lautet: Konvergiert
Sn f gegen f ? Wenn ja, auf welche Weise?
Punktweise Konvergenz
Selbst f¨
ur eine stetige Funktion f muss die Fourier-Reihe Sf nicht punktweise
konvergieren, erst recht also nicht gleichm¨aßig. Um die Konvergenz bei einem
Punkt x zu garantieren, muss man außerdem fordern, dass f bei x0 nicht zu
stark oszilliert.
46
Satz 3.28 Es sei f : R → C 2π-periodisch und Riemann-integrierbar auf [0, 2π].
Es sei x ∈ R, so dass die einseitigen Grenzwerte
f (x−) = lim f (y)
y
x
und
f (x+) = lim f (y)
und
lim sup
y
x
existieren. Des Weiteren sei
lim sup
y
x
f (y) − f (x−)
<∞
y−x
y
x
f (y) − f (x+)
<∞
y−x
(x+)
Dann gilt Sn f (x) → f (x−)+f
.
2
Ist außerdem f bei x stetig, so folgt Sn f (x) → f (x).
Bemerkungen:
1. Die Beschr¨ankungen an die Oszillationen bei x k¨onnen noch etwas abgeschw¨acht werden.
2. Gibt es eine Unterteilung 0 = x0 < x1 < . . . < xn = 2π, so dass f |(xj−1 ,xj )
f¨
ur jedes j = 1, . . . , n zu einer stetig differenzierbaren Funktion auf [xj−1 , xj ]
fortgesetzt werden kann, so ist die Voraussetzung aus Satz 3.28 f¨
ur alle
x ∈ R erf¨
ullt.
Beweis. Wegen
x+π
x
π
−π
Dn (t) dt = 1 und Dn (−t) = Dn (t) ist
f (x+)
f (y)Dn (x − y) dy −
=
2
π
f (x + t)Dn (−t) dy −
0
f (x+)
2
π
f (x + t) − f (x+) Dn (t) dt
=
0
π
=
g(t) sin
n+
0
wobei wir
g : [0, π] → C,
g(t) :=
1
t dt
2
f (x + t) − f (x+)
.
2π sin( 12 t)
gesetzt haben.
(x)
t
Schreibt man g(t) = f (x+t)−f
· 2π sin(
1 , so sieht man, dass die Funktion g
t
t)
2
unter den gemachten Voraussetzungen beschr¨ankt ist. Andererseits ist f¨
ur jedes
ε > 0 die Einschr¨ankung g|[ε,π] als Produkt der Riemann-integrierbaren Abbil1
dungen t → f (x + t) − f (x) und t → 2π sin(
nach Satz 2.10(iii) wieder Riemann1
t)
2
integrierbar. Dann aber ist g selbst Riemann-integrierbar. Nach Lemma 3.26 folgt
somit
x+π
f (y)Dn (x − y) dy =
lim
n→∞
x
47
f (x+)
.
2
Ein v¨ollig analoges Argument ergibt
x
f (y)Dn (x − y) dy =
lim
n→∞
x−π
f (x−)
.
2
¨
(Uberlegen
Sie sich das!) Mit Hilfe von Lemma 3.27 und der Periodizit¨at von f
und Dn k¨onnen wir nun
x+π
f (y) Dn (x − y) dy =
lim Sn f (x) =
n→∞
x−π
f (x+) + f (x−)
2
schließen.
Offensichtlich ist dies gerade f (x), falls f bei x stetig ist.
Beispiel: Betrachte die 2π-periodische “Zickzack-Funktion” f mit
f¨
ur 0 ≤ x ≤ π,
f¨
ur π ≤ x ≤ 2π.
x
2π − x
f (x) =
die den Voraussetzungen von Satz 3.28 offenbar an jedem Punkt x ∈ R gen¨
ugt,
so dass ihre Fourier-Reihe punktweise gegen f konvergiert. Wegen
2π
π
2π
−ikx
f (x)e
−ikx
xe
dx =
dx +
π
−ikx
0
0
−ikπ
(2π − x)e−ikx dx
π
πe
e
πe−ikπ
−
dx −
+
−ik
−ik
−ik
0
e−ikπ
1
1
e−ikπ
=−
+
+
−
−k 2
−k 2 −k 2
−k 2
(−1)k − 1
=2
k2
2π
=
f¨
ur k = 0 und
2π
0
π
e−ikx
dx
−ik
f (x) dx = π 2 sind die Fourier-Koeffizienten ck von f furch
c0 =
π
2
und ck =
(−1)k − 1
f¨
ur k = 0
πk 2
gegeben. Es ist also
f (x) = Sf (x) =
=
π
4
−
2 π
π 1
+
2 π
k∈N
k ungerade
k∈Z
(−1)k − 1 ikx π
2
e
=
−
k2
2 π
cos(kx)
π
4
= −
2
k
2 π
48
k∈N
k∈Z
k ungerade
eikx
k2
cos((2k − 1)x)
.
(2k − 1)2
Speziell f¨
ur x = 0 ergibt sich aus f (0) = 0
1
π2
.
=
k2
8
k∈N
k ungerade
Daraus erhalten wir nun wegen
k∈N
1
=
k2
k∈N
k gerade
1
+
k2
k∈N
k ungerade
1
=
k2
k∈N
1
1
π2
=
+
2
(2k)
8
4
k∈N
1
π2
+
k2
8
die h¨
ubsche Formel
k∈N
1
π2
=
.
k2
6
Konvergenz im quadratischen Mittel
Der Behandlung mit Fourier-Reihen besonders zug¨anglich ist der Raum
Rper := {f : R → C : f 2π-periodisch mit f |[0,2π] Riemann-integrierbar}.
F¨
ur f ∈ Rper setzen wir
1
f := √
f |[0,2π]
2π
2
=
1
2π
2π
|f (x)|2 dx.
0
Es gilt dann f¨
ur f, g ∈ Rper und λ ∈ C
(i) Nicht-Negativit¨at: f ≥ 0,
(ii) Homogenit¨at: λf = |λ| f und
(iii) Dreiecksungleichung: f + g ≤ f + g ,
Letzteres nach der Minkowski-Ungleichung. Aus diesen Gr¨
unden nennt man ·
eine Norm, obwohl das – wie wir im n¨achsten Kapitel sehen werden – nicht ganz
korrekt ist. (Zur Erinnerung: Aus f = 0 folgt noch nicht, dass auch f ≡ 0 ist.
Diese Eigenschaft fehlt · , um eine echte Norm zu sein.) Gilt fn − f → 0, so
sagen wir wieder, fn konvergiere gegen f im quadratischen Mittel.
F¨
ur f, g ∈ Rper setzen wir außerdem
f, g :=
1
2π
2π
f (x) g(x) dx.
0
F¨
ur f, f1 , f2 , g, g1 , g2 ∈ Rper und λ, µ ∈ C ist dann
49
2
(i) Nicht-Negativit¨at: f, f = f
≥ 0.
(ii) Linearit¨at im ersten Eintrag: λf1 + µf2 , g = λ f1 , g + µ f2 , g ,
Semilinearit¨at im zweiten Eintrag: f, λg1 + µg2 = λ f, g1 + µ f, g2 ,
(iii) Kommutativit¨at bis auf komplexe Konjugation: f, g = g, f .
Wir nennen die Abbildung ·, · : Rper × Rper → C daher – wieder etwas lax – ein
Skalarprodukt. (Um ein echtes Skalarprodukt zu sein, m¨
usste in (i) zudem noch
f, f > 0 f¨
ur f = 0 gelten, was hier i.A. nicht der Fall ist.)
Der k-te Fourier-Koeffizient ck von f ist damit gerade
ck = f, eik·
und die Funktion f, eik· eik· l¨asst sich interpretieren als die Projektion von f auf
eik· .
Lemma 3.29 Bez¨
uglich ·, · sind die Funktionen (eik· )k∈Z ein Orthonormalsystem, d.h.:
eik· , eim· = δkm ,
wobei δkm das ‘Kronecker-delta’ bezeichnet, das abk¨
urzend f¨
ur
δkm =
1, falls k = m,
0, falls k = m,
steht.
Beweis. Es ist
eik· , eim· =
=
1
2π

1
2π
eikx e−imx dx =
0
ei(k−m)x
1
2π
2π
ei(k−m)x dx
0
2π
= 0 f¨
ur k = m,
2π i(k−m)
0
 1 · 2π
2π
= 1 f¨
ur k = m.
n
ik· ik·
Nach diesem Lemma l¨asst sich das n-te Fourierpolynom
e
k=−n f, e
ik·
gerade als die Orthogonalprojektion auf den durch {e : −n ≤ k ≤ n} aufgespannten Raum verstehen. Wir zeigen nun, dass die Fourier-Polynome bestapproximierend unter allen trigonometrischen Polynomen sind und leiten eine
explizite Fehlerabsch¨atzung her:
50
Lemma 3.30 Es sei f ∈ Rper , ck der k-te Fourier-Koeffizient von f . Dann ist
n
2
f − Sn f
2
= f
|ck |2
−
k=−n
und
f − Sn f < f − p
f¨
ur jedes trigonometrische Polynom p = Sn f vom Grad ≤ n.
Beweis. F¨
ur jedes trigonometrische Polynom p(x) =
ma 3.29
n
k=−n
dk eikx ist nach Lem-
f − p, f − p
n
n
= f
2
ik·
−
dk e , f
− f,
= f
2
−
2
−
2
dk dm eik· , eim·
k=−n m=−n
ck ck − dk ck − dk ck + dk dk
ck ck +
k=−n
n
|ck − dk |2 .
|ck |2 +
−
k=−n
n
k=−n
n
= f
dk eik·
dk e ,
+
k=−n
dk ck + dk ck +
k=−n
n
= f
dk e
ik·
k=−n
n
n
k=−n
n
n
n
ik·
k=−n
k=−n
Dieser Ausdruck ist minimal genau dann, wenn dk = ck f¨
ur alle k ist was die
zweite Behauptung zeigt. Die erste ergibt sich, indem man dk = ck setzt.
Bemerkungen:
1. Im Limes n → ∞ ergibt sich hieraus die sogenannte Besselsche Ungleichung
∞
|ck |2 ≤ f
2
.
k=−∞
Wir werden gleich zeigen, dass in der Tat Gleichheit gilt.
2. Nach Lemma 3.29 ist Sn f
2
=
n
k=−n
|ck |2 .
Satz 3.31 Es sei f ∈ Rper mit Fourier-Koeffizienten ck , k ∈ Z. Dann gilt
f − Sn f → 0
mit n → ∞, und es ist
∞
f
2
|ck |2 .
=
k=−∞
51
Die letzte Gleichung nennt man die Parsevalsche Gleichung oder auch die
Vollst¨andigkeitsrelation.
Der Beweis l¨asst sich im Wesentlichen auf die folgenden beiden – auch f¨
ur sich
interessanten - Ergebnisse zur¨
uckf¨
uhren.
Satz 3.32 Ist f 2π-periodisch, stetig und st¨
uckweise stetig differenzierbar, so
konvergiert Sf sogar gleichm¨aßig gegen f .
Hierbei bedeutet f stetig und st¨
uckweise stetig differenzierbar, dass f stetig
ist und es eine Unterteilung 0 = x0 < x1 < . . . < xn = 2π gibt, so dass f¨
ur jedes
j die Einschrankung f |[xj−1 ,xj ] stetig differenzierbar ist.
Beweis. Bezeichnet dk die Fourier-Koeffizienten von f , ck diejenigen von f , so
folgt f¨
ur k = 0
ck =
=
1
2π
1
2π
n
j=1
n
xj
xj−1
f (x)
j=1
f (x)e−ikx dx
e−ikx
−ik
−ikx 2π
=f (x) e −ik
0
xj
−
xj−1
1
2π
2π
0
e−ikx
dk
f (x) dx = ,
−ik
ik
=0
wobei wir ausgenutzt haben, dass die die Summe u
¨ber die Randterme eine Teleskopsumme ist, deren Wert wegen der Periodizit¨at verschwindet.
Da nach Satz 3.28 Sf punktweise gegen f konvergiert, ergibt sich
f − Sn f
∞
|ck e−ikx | =
= sup |Sf (x) − Sn f (x)| ≤ sup
x∈[0,2π]
x∈[0,2π]
|k|≥n+1
|k|≥n+1
dk
.
k
Mit der elementaren Ungleichung ab ≤ 12 (a2 + b2 ) f¨
ur a, b ∈ R (die ja zu a2 −
2ab + b2 = (a − b)2 ≥ 0 ¨aquivalent ist) erhalten wir f¨
ur a = k −1 und b = |dk |
daraus nun die Absch¨atzung
f − Sn f
∞
k −2 +
≤
|k|≥n+1
|dk |2 .
|k|≥n+1
Da aber sowohl die Summe k∈Z\{0} k −2 als auch die Summe k∈Z |dk |2 nach
der Besselschen Ungleichung f¨
ur f konvergieren, ergibt sich schließlich
lim f − Sn f
n→∞
∞
= 0.
Das zweite Resultat besagt, dass die stetig und st¨
uckweise differenzierbaren
Funktionen in Rper “dicht liegen”:
52
Proposition 3.33 Ist f ∈ Rper , so gibt es zu jedem ε > 0 ein stetiges und
st¨
uckweise differenzierbares fε ∈ Rper mit
f − fε ≤ ε.
Beweis. Wir gehen in drei Schritten vor:
1. Ist f eine (reellwertige) Treppenfunktion, so ist das leicht zu sehen: Ist
0 = x0 < x1 < . . . < xn = 2π eine Unterteilung mit f (x) = cj f¨
ur x ∈ (xj−1 , xj )
uckweise lineare Funktion
und δ < 12 min1≤j≤n xj − xj − 1, so kann man fε als st¨
mit
f (xn ) =f (x0 ) = f (x1 − δ) = c1 ,
f (x1 ) = f (x2 − δ) = c2 ,
..
.
f (xn−1 ) = f (xn − δ) = cn
w¨ahlen, wobei dann
f − fε =
2π
1
2π
2
|f (x) − fε (x)| dx
1
2
≤
0
1
nδ f
2π
1
2
<ε
∞
ist, wenn δ hinreichend klein gew¨ahlt ist.
2. Ist f ∈ Rper reellwertig, so gibt es Treppenfunktionen ψ, ϕ, die wir o.B.d.A.
2π
2π-periodisch w¨ahlen d¨
urfen, mit − f ∞ ≤ ψ ≤ f ≤ ϕ ≤ f ∞ und 0 ϕ − ψ <
πε
. Es folgt
f ∞
f −ψ
2
1
2π
1
≤
2π
1
≤
2π
2π
|f (x) − ψ(x)|2 dx
=
0
2π
|ϕ(x) − ψ(x)|2 dx
0
2π
2 f
∞ |ϕ(x)
− ψ(x)| dx < ε.
0
3. Ist schließlich f ∈ Rper komplexwertig, so wenden wir 2. jeweils auf den
Real- und den Imagin¨arteil an.
Bemerkung: Indem man diese Approximationen aus dem ersten Beweisschritt
ein ener kleinen Umgebung der ‘Knickstellen’ geeignet ab¨andert, l¨asst sich erreichen, dass fε sogar auf ganz R stetig differenzierbar ist.
Beweis von Satz 3.31. Nach Lemma 3.30 gilt f − Sn f → 0 genau dann, wenn
2
f 2= ∞
ugt die erste Behauptung nachzupr¨
ufen.
k=−∞ |ck | ist, so dass es gen¨
Ist f stetig und st¨
uckweise stetig differenzierbar, so gilt die Behauptung nach
Satz 3.32, da ja
Sn f − f
2
=
1
2π
2π
|Sn f (x) − f (x)|2 dx ≤ Sn f − f
0
53
2
∞
gilt.
F¨
ur allgemeines f ∈ Rper und ε > 0 beliebig w¨ahlen wir fε wie in Proposition
3.33. F¨
ur jedes g ∈ Rper ist nach der Besselschen Ungleichung und der darauf
folgenden Bemerkung
Sn g ≤ g .
Insbesondere f¨
ur g = f − fε und Sn g = Sn f − Sn fε folgt daher
f − Sn f ≤ f − fε + fε − Sn fε + Sn fε − Sn f
≤ 2 f − fε + fε − Sn fε ≤ 3ε
f¨
ur n hinreichend groß.
Beispiel: Mit der Zickzack-Funktion f aus dem Beispiel von Seite 48, f¨
ur die ja
f (x) =
π
2
−
2 π
k∈Z
kungerade
eikx
k2
war, lautet die Vollst¨andigkeitsrelation
f
2
=
π2
4
+ 2
4
π
wobei
f
2
=
1
2π
k∈Z
k ungerade
π2
8
1
=
+ 2
4
k
4
π
2π
|f (x)|2 dx =
0
1
π
k∈N
k ungerade
π
x2 dx =
0
1
,
k4
π2
3
ist. Dies zeigt
k∈Z
k ungerade
π4
1
=
.
k4
96
Aus
k∈N
1
=
k4
k∈N
k gerade
1
+
k4
k∈N
k ungerade
1
=
k4
k∈N
1
π4
1
+
=
4
(2k)
96
16
k∈N
1
π4
+
k 4 96
folgt damit die wieder sehr h¨
ubsche Formel
k∈N
1
π4
=
.
k4
90
Bemerkung: F¨
ur s > 1 (allgemeiner f¨
ur s ∈ C mit Re s > 1) definiert man
durch
∞
1
ζ(s) :=
ks
k=1
54
die sogenannte Riemannsche Zetafunktion. Wir haben gezeigt, dass insbesondere
ζ(2) =
π2
6
und ζ(4) =
π4
90
¨
gilt. Allgemeiner kann man ζ(n) f¨
ur jedes gerade n explizit angeben. Uber
die
Werte von ζ(n) f¨
ur ungerade n ist fast nichts bekannt.
Der Weierstraßsche Approximationssatz
Wir diskutieren zum Schluss noch zwei weitere Anwendungen von Satz 3.32 u
¨ber
die gleichm¨aßige Approximierbarkeit stetiger Funktionen durch besonders einfache Abbildungen. Vorbereitend ben¨otigen wir die Boebachtung, dass sich stetige
Funktionen immer durch st¨
uckweise lineare Funktionen ann¨ahern lassen. Der Beweis hierzu ist ganz ¨ahnlich wie der des entsprechenden Resultats aus Lemma
2.14 mit Treppenfunktionen.
Lemma 3.34 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es eine stetige
st¨
uckweise lineare Funktion fε mit f − fε ∞ ≤ ε und fε (a) = f (a), fε (b) = f (b).
Beweis. Da f auf [a, b] gleichm¨aßig stetig ist, k¨onnen wir zu gegebenem ε > 0 ein
ur alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.
δ > 0 finden, so dass |f (x) − f (y)| ≤ 2ε f¨
Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :
k = 1, . . . , n} < δ, z.B. die ¨aquidistante Zerlegung mit xk = a + nk (b − a) mit
f¨
ur hinreichend große n. Wir definieren fε dann durch
xk − xk−1 = b−a
n
fε (xk ) = f (xk ),
k = 0, 1, . . . , n
und die Bedingung, dass fε |[xk−1 ,xk ] f¨
ur jedes k = 1, . . . , n affin ist. Dann gilt in
der Tat
ε ε
|f (x) − fε (x)| ≤ |f (x) − f (xk−1 )| + |f (xk−1 ) − fε (x)| ≤ + = ε,
2 2
=≤|fε (xk−1 )−fε (xk )|
f¨
ur x ∈ [xk−1 , xk ] und damit |f (x) − fε (x)| ≤ ε f¨
ur alle x ∈ [a, b].
Obwohl f¨
ur nur stetige Funktionen f nicht garantiert ist, dass deren FourierReihe Sf gegen f konvergiert, l¨asst sich f doch immer gleichm¨aßig durch trigonometrische Polynome approximieren:
Satz 3.35 Ist f ∈ Rper stetig, so gibt es zu jedem ε > 0 ein trigonometrisches
Polynom fε mit f − fε ∞ < ε.
Beweis. Nach Lemma 3.34 gibt es zu gegebenem ε > 0 ein stetiges und st¨
uckweise
differenzierbares fε : [0, 2π] → R, das sich zu einer ebensolchen Funktion auf
ganz R fortsetzen l¨asst, so dass f − fε ∞ ≤ 2ε ist. Nach Satz 3.32 wiederum
55
konvergiert Sn fε f¨
ur n → ∞ gleichm¨aßig gegen fε , womit f¨
ur hinreichend große
n auch fε − Sn fε ∞ < 2ε erf¨
ullt ist. Damit aber ist
f− S n fε
∞
≤ f − fε
∞
+ fε − Sn fε
∞
< ε,
was die Behauptung zeigt.
Bemerkung Man nennt dieses Ergebnis auch den Weierstraßschen Approximationssatz f¨
ur trigonometrische Polynome. Obwohl Sn f nicht gleichm¨aßig gegen f
konvergieren muss, besagt Satz von Fej´er, dass, falls f stetig ist, immerhin noch
n
1
Sm = f
lim
n→∞ n
m=1
als gleichm¨aßiger Limes ist. D.h. die Folge der arithmetischen Mittel der ersten
Fourier-Polynome konvergiert gleichm¨aßig gegen f . Man sagt daher auch, die
Folge der Fourier-Polynome konvergiert gleichm¨aßig im Sinne von Ces`aro gegen
f.
Tats¨achlich lassen sich stetige Funktionen auf kompakten Intervallen sogar
durch Polynome gleichm¨aßig approximieren.
Satz 3.36 (Weierstraßscher Approximationssatz) Ist f ∈ C[a, b], so gibt
es zu jedem ε > 0 ein Polynom fε mit f − fε ∞ < ε.
Beweis. Indem wir ggf. zu x → f ((1 − x)a + xb) u
urfen wir o.B.d.A.
¨bergehen, d¨
[a, b] = [0, 1] annehmen. Wir setzen dann f zu einer stetigen Funktion aus Rper
fort, die wir der Einfachheit halber wieder mit f bezeichnen. Ist nun ε > 0
gegeben, so gibt es nach Satz 3.35 ein trigonometrisches Polynom g, etwa
n
ak cos(kx) + bk sin(kx)
g(x) = a0 +
k=1
mit f − g ∞ < 2ε . Ersetzt man nun g durch sein N -tes Taylorpoynom TNg,0 , so
g,0
erh¨alt man den Fehlerterm RN
mit
n
g,0
|RN
(x)|
=
k=1
g (n+1) (0) n+1
x
≤
(N + 1)!
n
k=1
|ak |k + |bk |k
(N + 1)!
f¨
ur 0 ≤ x ≤ 1, was f¨
ur N → ∞ gegen 0 konvergiert, so dass f¨
ur hinreichend große
N auch
ε
sup |g(x) − TNg,0 (x)| <
2
0≤x≤1
gilt. Zusammengefasst ergibt sich
sup |f (x) − TNg,0 (x)| < ε.
0≤x≤1
wie gew¨
unscht.
56
Kapitel 4
Metrische und normierte R¨
aume
Normierte R¨aume sind K-Vektorr¨aume, auf denen eine Norm, also insbesondere
ein Begriff der Gr¨oße eines Vektors definiert ist. Metrische R¨aume hingegen sind
einfach Mengen, auf denen ein Abstandsbegriff erkl¨art ist. Die Beispiele (Teilmengen des Rn , gewisse Mengen von Funktionen u.v.m.) werden zeigen, dass Sie viele
metrische R¨aume schon kennen. Wichtige Beispiele sind die normierten R¨aume.
Die Metrik bedarf im Gegensatz zur Norm jedoch keiner Vektorraumstruktur der
zugrunde liegenden Menge. Indem wir uns uns nun mit dem abstrakten Begriff
eines allgemeinen metrischen Raumes besch¨aftigen, gelingt es, f¨
ur all diese Beispiele einen allgemeinen Rahmen anzugeben und alle Ph¨anomene, die sich auf
eine geeignete Abstandsmessung zur¨
uckf¨
uhren lassen, einheitlich zu diskutieren.
Viele Konzepte werden durch den etwas abstrakteren Rahmen klarer und damit
letztlich einfacher.
4.1
Topologische Begriffe
Grundlegende Definitionen
Wir beginnen mit den normierten R¨aumen.
Definition 4.1 Sei X ein K-Vektorraum. Eine Abbildung
ur alle x, y ∈ X, λ ∈ K die Bedingungen
heißt Norm, falls f¨
·
: X → [0, ∞)
(i) positive Definitheit: x = 0 ⇔ x = 0,
(ii) absolute Homogenit¨at: λx = |λ| x und
(iii) Dreiecksungleichung: x + y ≤ x + y
erf¨
ullt sind. Man nennt dann (X, · ) (oder auch einfach X selbst) einen normierten
Raum.
57
Beispiele:
1. Aus den entsprechenden Eigenschaften des Absolutbetrags ergibt sich, dass
insbesondere (R, | · |) und (C, | · |) normierte R¨aume sind.
2. Allgemeiner ist f¨
ur p ∈ [1, ∞] die p-Norm, definiert durch
1
x
p
( ni=1 |xi |p ) p
max1≤i≤n |xi |
=
f¨
ur p ∈ [1, ∞),
f¨
ur p = ∞,
tats¨achlich eine Norm auf dem Kn . Im Fall p = 2, wo
x
2
=
|x1 |2 + . . . + |xn |2 ,
spricht man von der euklidischen Norm auf Kn .
3. Ist (X, · ) ein normierter Raum und V ⊂ X ein Untervektorraum, so
die Einschr¨ankung von · auf V , die man meist einfach wieder mit ·
bezeichnet, eine Norm auf V .
4. Es sei D eine Menge und
B(D; K) := {f : D → K : f ist beschr¨ankt}.
(Dies ist ein Untervektorraum der Menge aller Abbildungen KD von D nach
K.) Die Supremumsnorm · ∞ : B(D; K) → [0, ∞) mit
f
:= sup |f (x)|
∞
x∈D
ist eine Norm auf B(D; K): F¨
ur alle f, g ∈ B(D; K) und λ ∈ K ist
(i) sup |f (x)| = 0 ⇔ |f (x)| = 0 ∀ x ∈ D ⇔ f ≡ 0,
x∈D
(ii) sup |λf (x)| = |λ| sup |f (x)| und
x∈D
x∈D
(iii) sup |f (x) + g(x)| ≤ sup |f (x)| + |g(x)| ≤ sup |f (x)| + sup |g(x)|.
x∈D
x∈D
x∈D
x∈D
5. F¨
ur ein kompaktes Intervall [a, b] ist (C[a, b], · ∞ ) ein normierter Raum.
Dies ergibt sich direkt aus den vorigen Beispielen, wenn man beachtet, dass
C[a, b] ein Unterraum von B([a, b], K) ist.
6. Auch f¨
ur p ∈ [1, ∞) ist (C[a, b], ·
sich das!)
7. Auf R[a, b] ist
·
p
p)
¨
ein normierter Raum. (Uberlegen
Sie
f¨
ur p < ∞ jedoch – wie schon bemerkt – keine Norm.
58
8. Auf C 1 [a, b] wird durch
f = |f (a)| + f
∞
¨
eine Norm definiert. (Ubung!)
Durch die Norm wird jedem Vektor x eines normierten Raumes X eine L¨ange
x zugeordnet. Insbesondere ist dann f¨
ur zwei Vektoren x, y ∈ X durch die Norm
der Differenz x − y der Abstand zwischen x und y gegeben. Viele der nun zu
diskutierenden Eigenschaften h¨angen tats¨achlich nicht von der linearen Struktur
von X als Vektorraum sondern lediglich dem Begriff des Abstandes zweier Punkte
aus X ab. Dies f¨
uhrt dazu, allgemeiner das Konzept eines metrischen Raumes zu
definieren.
Im folgenden sei M eine Menge.
Definition 4.2 Ist d : M × M → [0, ∞) eine Abbildung, so dass f¨
ur alle x, y, z ∈
M
(i) Definitheit: d(x, y) = 0 ⇔ x = y,
(ii) Symmetrie: d(x, y) = d(y, x) sowie
(iii) Dreiecksungleichung: d(x, z) ≤ d(x, y) + d(y, z)
gilt, dann nennt man d eine Metrik auf M und (M, d) einen metrischen Raum.
d(x, y) stellt dann einen Abstand zwischen x, y ∈ M dar. (iii) besagt, dass
der Abstand d(x, z) zwischen zwei Punkten x, z kleiner oder gleich der Summe
der Abst¨ande d(x, y) + d(y, z) ist, die sich ergibt, wenn man den ‘Umweg u
¨ber y
nimmt’.
Beispiele
1. Jeder normierte Raum (X, · ) ist ein metrischer Raum (X, d) bez¨
uglich
der von der Norm induzierten Metrik
d(x, y) = x − y .
Dabei sind (i) und (ii) klar und (iii) folgt aus
d(x, z) = x − z = x − y + y − z
≤ x − y + y − z = d(x, y) + d(y, z).
2. Ist (M, d) ein metrischer Raum und M ⊂ M , so wird M zum metrischen
Raum (M , d|M ×M ) bez¨
uglich der auf M × M eingeschr¨ankten Metrik.
(Beachte: Selbst wenn M ein normierter Raum war, muss M noch nicht
einmal ein Vektorraum sein.)
59
3. Auf jeder Menge M kann man die sogenannte diskrete Metrik
d(x, y) =
0,
1,
falls x = y,
falls x = y
definieren.
4. Auf M = {0, 1}n , n ∈ N, wird durch
d (x1 , . . . , xn ), (y1 , . . . , yn ) = # i ∈ {1, . . . , n} : xi = yi
eine Metrik definiert, der sogenannte Hamming-Abstand, der z.B. in der
Codierungstheorie eine wichtige Rolle spielt. (Hierbei bezeichnet #A die
Anzahl der Elemente einer endlichen Menge A.)
Wie in C definieren wir ‘Kugeln’ in einem metrischen Raum (M, d) durch
Br (x) := {y ∈ M : d(x, y) < r}
und
B r (x) := {y ∈ M : d(x, y) ≤ r}
f¨
ur x ∈ M, r ≥ 0.
Definition 4.3 Es sei (M, d) ein metrischer Raum.
(i) Ist U ⊂ M , x ∈ U , so dass es ein ε > 0 gibt mit Bε (x) ⊂ U , so nennt man
U eine Umgebung von x.
(ii) Eine Teilmenge U ⊂ M heißt offen in M , wenn es zu jedem x ∈ U ein ε > 0
gibt, so dass Bε (x) ⊂ U gilt. (Also wenn U Umgebung all ihrer Punkte ist.)
(iii) Eine Teilmenge U ⊂ M heißt abgeschlossen in M , wenn M \ U offen ist.
Beispiele Es sei (M, d) ein metrischer Raum, x ∈ M , r > 0.
1. Br (x) ist eine offene Menge: Ist y ∈ Br (x), so gilt ε := r − d(y, x) > 0 und
jedes z ∈ Bε (y) erf¨
ullt
d(z, x) ≤ d(x, y) + d(y, z) < d(x, y) + ε = r,
so dass tats¨achlich Bε (y) ⊂ Br (x) gilt.
2. B r (x) ist abgeschlossen: Ist y ∈ M \ B r (x), so gilt ε := d(y, x) − r > 0 und
jedes z ∈ Bε (y) erf¨
ullt
d(x, z) ≥ d(x, y) − d(z, y) > d(x, y) − ε = r,
so dass tats¨achlich Bε (y) ⊂ M \ B r (x) gilt und daher M \ B r (x) offen ist.
60
3. Ist d die diskrete Metrik auf M , so ist jede Teilmenge von M offen und
damit auch jede Teilmenge von M abgeschlossen.
4. In R mit der u
¨blichen (von | · | induzierten) Metrik sind offene Intervalle
(a, b) tats¨achlich offen und abgeschlossene Intervalle [a, b] tats¨achlich abgeschlossen.
5. [0, 1] ist eine abgeschlossene aber nicht offene Teilmenge und (0, 1) ist eine
offene aber nicht abgeschlossene Teilmenge von R mit der u
¨blichen, von | · |
induzierten Metrik d. Als Teilmenge des metrischen Raums ([0, 1], d|[0,1]×[0,1] )
ist [0, 1] jedoch auch offen und als Teilmenge von ((0, 1), d|(0,1)×(0,1) ) ist (0, 1)
auch abgeschlossen.
Das letzte Beispiel zeigt, dass ‘Offenheit’ und ‘Abgeschlossenheit’ immer relativ
zum umgebenden metrischen Raum zu verstehen ist.
Der folgende Satz zeigt insbesondere, wie sich offene Mengen unter Vereinigungen und Schnitten verhalten:
Satz 4.4 Es sei (M, d) ein metrischer Raum
(i) ∅ und M sind offene Mengen.
(ii) Sind U1 , . . . , Un offen, so ist auch U1 ∩ . . . ∩ Un offen.
(iii) Ist (Ui )i∈I eine Familie offener Mengen, so ist auch
i∈I
Ui offen.
W¨ahrend also beliebige Vereinigungen offener Mengen wieder offen sind, muss
man bei der Schnittbildung darauf achten, dass i.A. nur endliche Schnitte offener
Mengen wieder offen sind.
Beweis. (i) ist klar.
(ii) Ist x ∈ U1 ∩ . . . ∩ Un so gibt es εi > 0 mit Bεi (x) ⊂ Ui f¨
ur i = 1, . . . , n.
Mit ε := min{εi : i = 1, . . . , n} > 0 ist dann aber Bε (x) ⊂ U1 ∩ . . . ∩ Un .
(iii) Ist x ∈ i∈I Ui , so gibt es ein i ∈ I mit x ∈ Ui und somit ein ε > 0 mit
Bε (x) ⊂ Ui ⊂ i∈I Ui .
Korollar 4.5 Es sei (M, d) ein metrischer Raum
(i) ∅ und M sind abgeschlossene Mengen.
(ii) Sind U1 , . . . , Un abgeschlossen, so ist auch U1 ∪ . . . ∪ Un abgeschlossen.
(iii) Ist (Ui )i∈I eine Familie abgeschlossener Mengen, so ist auch
schlossen.
61
i∈I
Ui abge-
Beweis. Dies folgt direkt aus den entsprechenden Eigenschaften f¨
ur offene Mengen
durch Komplementbildung.
Beispiel: Der unendliche Schnitt n∈N (−1− n1 , 1+ n1 ) = [−1, 1] der offenen Intervalle (−1 − n1 , 1 + n1 ) ist nicht offen, die unendliche Vereinigung n∈N [−1 + n1 , 1 −
1
] = (−1, 1) der abgeschlossenen Intervalle [−1+ n1 , 1− n1 ] ist nicht abgeschlossen.
n
Bemerkung: Verschiedene Metriken auf M k¨onnen das gleiche System von offenen (und daher auch abgeschlossenen) Mengen induzieren. F¨
ur viele Untersuchungen kommt es im Folgenden tats¨achlich nicht auf die genaue Form der Metrik
¨
an; es gen¨
ugt zu wissen, welche Mengen offen sind. Diese Uberlegungen
f¨
uhren
dazu das System der offenen Mengen in gewisser Weise als noch grundlegenderes
Konzept als die Metrik zu verstehen und den Begriff des topologischen Raumes einzuf¨
uhren: Ist M eine Menge und O ein System von Teilmengen mit den
Eigenschaften
(i) ∅, M ∈ O,
(ii) U1 , . . . , Un ∈ O =⇒ U1 ∩ . . . ∩ Un ∈ O und
(iii) Ui ∈ O ∀ i ∈ I =⇒
i∈I
Ui ∈ O, wobei I eine beliebige Indexmenge ist,
so nennt man (M, O) einen topologischen Raum und O das System der offenen
Mengen auf M. Jeder metrische Raum l¨asst sich also als topologischer Raum
auffassen. Es gibt jedoch, insbesondere in der fortgeschritteneren Analysis, wichtige Beispiele von topologischen R¨aumen, die nicht durch eine Metrik induziert
werden. (Ein nicht sehr spannendes Beispiel ist O = {∅, M } f¨
ur eine mindestens
zweielementige Menge M .)
Mengen, die selbst nicht unbedingt offen oder abgeschlossen sind, kann man
auf die folgende, in gewisser Weise bestm¨ogliche Art offene und abgeschlossene
Mengen zuordnen.
Definition 4.6 Es sei (M, d) ein metrischer (oder nur topologischer) Raum, U ⊂
M.
(i) Das Innere von U ist
U ◦ :=
{V ⊂ U : V ist offen}.
(ii) Der Abschluss von U ist
U :=
{V ⊃ U : V ist abgeschlossen}.
(iii) Der Rand von U ist
∂U := U \ U ◦ .
62
Aus Satz 4.4 und Korollar 4.5 ergibt sich leicht, dass U ◦ die gr¨oßte in U
enthaltene offene Menge ist, w¨ahrend U die kleinste abgeschlossene U enthaltende
Menge ist. Insbesondere ist U ◦ = U genau dann, wenn U selbst offen ist und
U = U genau dann, wenn U abgeschlossen ist.
Lemma 4.7 Es seien (M, d) ein metrischer Raum, U ⊂ M . Dann ist
U ◦ = M \ (M \ U )
und
U = M \ (M \ U )◦ .
Der Rand ∂U ist abgeschlossen.
Beweis. Die Darstellungen von U ◦ und U ergeben sich direkt aus den Definitionen f¨
ur U ◦ und U durch Komplementbildung. Die Abgeschlossenheit des Randes
¨
ergibt sich dann daraus leicht. (Ubung!)
Zum Arbeiten ist oft die folgende Umformulierung von Nutzen:
Lemma 4.8 Es seien (M, d) ein metrischer Raum, U ⊂ M , x ∈ M . Dann ist
(i) x ∈ U ◦ genau dann, wenn Bε (x) ⊂ U f¨
ur ein ε > 0 ist (wenn also U eine
Umgebung von x ist),
ur alle ε > 0 gilt, und
(ii) x ∈ U genau dann, wenn Bε (x) ∩ U = ∅ f¨
(iii) x ∈ ∂U genau dann, wenn Bε (x) ∩ U = ∅ und Bε (x) ∩ (M \ U ) = ∅ f¨
ur alle
ε > 0 gilt.
Beweis. (i) Ist x ∈ U ◦ , so gibt es, da U ◦ offen ist, ein ε > 0 mit Bε (x) ⊂ U ◦ ⊂ U .
Umgekehrt folgt aus Bε (x) ⊂ U f¨
ur ein ε > 0, dass x ∈ Bε (x) ⊂ U ◦ gilt, denn
Bε (x) ist offen.
(ii) Nach (i) und Lemma 4.7 gilt
Bε (x) ∩ U = ∅ ∀ ε > 0 ⇐⇒ Bε (x) ⊂ M \ U ∀ ε > 0
⇐⇒ x ∈
/ (M \ U )◦ ⇐⇒ x ∈ U .
(iii) Nach Definition des Randes und nach (i) und (ii) gilt x ∈ ∂U genau
dann, wenn Bε (x) ∩ U = ∅ f¨
ur alle ε > 0 und Bε (x) ⊂ U f¨
ur alle ε > 0, also auch
Bε (x) ∩ (M \ U ) = ∅ f¨
ur alle ε > 0 ist.
Bemerkung: Achtung! Obwohl unsere Notation f¨
ur offene und abgeschlossene
Kugeln das nahezulegen scheint, muss in allgemeinen metrischen R¨aumen der
Abschluss Br (x) von Br (x) nicht B r (x) sein. Ist z.B. M mit der diskreten Metrik
d versehen, so gilt B1 (x) = {x} = B1 (x) aber B 1 (x) = M f¨
ur alle x ∈ M . In
normierten R¨aumen kann so etwas jedoch nicht passieren:
¨
Ubung:
Es seien (X, · ) ein normierter Raum, x ∈ X, r > 0. Zeigen Sie, dass
Br (x) = B r (x) gilt.
Insbesondere gilt in normierten R¨aumen also ∂Br (x) = {x ∈ X : x = r}.
Speziell in (Rn , · 2 ) schreibt man die ‘Einheitssph¨are’ ∂B1 (0) auch als S n−1 .
63
Lemma und Definition 4.9 (Produktmetrik) Es seien (M1 , d1 ), . . . , (Mn , dn )
metrische R¨aume.
(i) Die Abbildung
d(x, y) = max{di (xi , yi ) : i = 1, . . . , n}
f¨
ur x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) definiert eine Metrik auf dem Produktraum1 ni=1 Mi = M1 × . . . × Mn : die sogenannte Produktmetrik.
(ii) In (
n
i=1
Mi , d) gilt
n
n
Br(Mi ,di ) (xi )
Br (x) =
und
(Mi ,di )
B r (x) =
i=1
Br
(xi ).
i=1
(iii) Sind Ui offen in (Mi , di ), Ai abgeschlossen in (Mi , di ), i = 1, . . . , n, so ist
n
n
n
i=1 Ai abgeschlossen in ( i=1 Mi , d).
i=1 Ui offen und
¨
Beweis. Ubung!
Mit Hilfe einer Metrik lassen sich in einem metrischen Raum (M, d) auch
der Abstand eines Punktes zu einer Menge sowie der Abstand zweier Mengen
definieren:
• Ist x ∈ M und U ⊂ M , so nennt man
dist(x, U ) := inf d(x, a)
a∈U
¨
den Abstand von x zu U . Insbesondere gilt dann (Ubung!)
U = {x ∈ M : dist(x, U ) = 0}.
• F¨
ur U, V ⊂ M setzt man
dist(U, V ) = inf d(u, v)
u∈U
v∈V
= inf dist(u, V ) = inf dist(v, U )
u∈U
v∈V
(Achtung! Dies definiert keine Metrik auf den (nicht leeren) Teilmengen von
M .)
1
Erinnerung: Der Produktraum bzw. das kartesische Produkt von Mengen M1 , . . . , Mn ist
Mi = M1 × . . . × Mn = {(x1 , . . . , xn ) : x1 ∈ M1 , . . . , xn ∈ Mn }.
n
i=1
64
4.2
Folgen und Funktionen
Konvergenz
Im Folgenden sei (M, d) ein metrischer Raum. Wie in R oder C k¨onnen wir
Folgen (xk )k∈N in M (also Abbildungen N → M , k → xk ) auf ihre Konvergenz
untersuchen.
Definition 4.10 Es sei (xk ) eine Folge in M , x ∈ M .
(i) Wir sagen, (xk ) konvergiere gegen x ∈ M , und schreiben limk→∞ xk = x
oder einfach xk → x, wenn limk→∞ d(xk , x) = 0 gilt.
(ii) Wir sagen, dass x ein H¨aufungspunkt von (xk ) ist, wenn es eine gegen x
konvergente Teilfolge gibt.
Beispiel: Es seien (Mi , di ) metrische R¨aume, i = 1, . . . , n, und (x(k) )k eine Folge
in M = ni=1 Mi , versehen mit der Produktmetrik d. (Wir schreiben den Folgenindex oben, um unten Platz f¨
ur die Komponentenindizes zu haben.) Dann
gilt
(k)
x(k) → x in (M, d) ⇐⇒ xi → xi in (Mi , di ) ∀ i ∈ {1, . . . , n},
denn
(k)
d(x(k) , x) → 0 ⇐⇒ max{d(xi , xi ) : i = 1, . . . , n} → 0
(k)
⇐⇒ d(xi , xi ) → 0 ∀ i ∈ {1, . . . , n}.
Insbesondere konvergiert eine Folge (x(k) ) aus Kn gegen x, wenn alle Komponen(k)
ten xi gegen xi , i = 1, . . . , n, konvergieren.
Lemma 4.11 Es sei (xk ) eine konvergente Folge in M . Dann ist der Grenzwert
x ∈ M eindeutig bestimmt und x ist der einzige H¨aufungspunkt von (xk ).
Beweis. Sind x, x ∈ M Grenzwerte von (xk ), so gilt
d(x, x ) ≤ d(x, xk ) + d(xk , x )
f¨
ur alle k. Mit k → ∞ folgt d(x, x ) = 0, also x = x . Des Weiteren ist mit
d(xk , x) → 0 auch d(xkm , x) → 0 f¨
ur jede Teilfolge (xkm ).
Mit Hilfe von Folgen lassen sich abgeschlossene Mengen alternativ wie folgt
beschreiben:
Lemma 4.12 Es sei U ⊂ M .
(i) x ∈ M liegt in U genau dann, wenn es eine Folge (xk ) in U gibt, die gegen
x konvergiert.
65
(ii) U ist abgeschlossen genau dann, wenn f¨
ur jede konvergente Folge (xk ) aus
U auch deren Grenzwert limk→∞ xk in U liegt.
Beweis. (i) Ist x ∈ U , so gibt es nach Lemma 4.8(ii) zu jedem k ein xk ∈ B1/k (x)∩
U , so dass xk → x folgt. Gilt umgekehrt xk → x f¨
ur eine Folge (xk ) ⊂ U , so gibt
es zu jedem ε > 0 ein k mit xk ∈ Bε (x), so dass Bε (x) ∩ U = ∅ ist. Wieder nach
Lemma 4.8(ii) ist dann x ∈ U .
(ii) Ist U abgeschlossen, (xk ) ⊂ U mit xk → x, so folgt x ∈ U = U nach (i).
Ist umgekehrt U nicht abgeschlossen, so gibt es ein x ∈ U \ U , f¨
ur das nach (i)
eine Folge aus U existiert, die gegen x konvergiert.
Definition 4.13 Eine Teilmenge U ⊂ M heißt beschr¨ankt, wenn
diam(U ) := sup{d(x, x ) : x, x ∈ U } < ∞
ist. diam(U ) heißt der Durchmesser von U .
Beispiele:
1. Ist d die diskrete Metrik auf U , so sind alle Teilmengen von M beschr¨ankt.
2. Eine Teilmenge U eines normierten Raums (M, · ), der ja bzgl. der induzierten Metrik d auch ein metrischer Raum ist, ist beschr¨ankt genau dann,
wenn
sup{ x : x ∈ U } < ∞
ist. Um dies einzusehen, fixieren wir ein x0 ∈ U . Dann ist
sup{ x : x ∈ U } ≤ x0 + sup{ x − x0 : x ∈ U } ≤ x0 + diam(U )
und andererseits
diam(U ) = sup{ x − x : x, x ∈ U }
≤ sup{ x − x0 : x ∈ U } + sup{ x − x0 : x ∈ U }
= 2 sup{ x − x0 : x ∈ U }
≤ 2 ( x0 + sup{ x : x ∈ U }) .
Definition 4.14
(i) Eine Folge (xk ) in (M, d) heißt Cauchyfolge, wenn
∀ ε > 0 ∃ N ∈ N ∀ k, m ≥ N : d(xk , xm ) < ε.
(ii) Ein metrischer Raum, in dem jede Cauchyfolge konvergiert heißt vollst¨andig.
(iii) Ein normierter Raum, in dem jede Cauchyfolge konvergiert (der also vollst¨andig ist), wird Banachraum genannt.
66
Entsprechende Definitionen macht man auch f¨
ur Teilmengen U ⊂ M , was
wir hier allerdings nicht extra behandeln m¨
ussen, da die ja bez¨
uglich dU ×U selbst
wieder metrische R¨aume sind.
Beispiele:
1. K (mit der u
¨blichen Metrik bzw. Norm) ist vollst¨andig und also ein Banachraum.
2. Q ist nicht vollst¨andig.
3. Jede Menge M versehen mit der diskreten Metrik d ist vollst¨andig, denn
dort sind genau solche Folgen Cauchyfolgen, die ab einem bestimmten Index
konstant sind.
4. Ist (M, d) vollst¨andig und U ⊂ M abgeschlossen, so ist auch (U, d|U ×U )
vollst¨andig. Jede Cauchyfolge in U konvergiert n¨amlich in M und ihr Grenzwert muss in U selbst liegen, wenn U abgeschlossen ist.
Lemma 4.15 Jede konvergente Folge ist eine Cauchyfolge und jede Cauchyfolge
ist beschr¨ankt.
Beweis. Gilt xk → x, so gibt es zu ε > 0 ein N ∈ N mit d(xk , x) <
k ≥ N und somit auch
ε
2
f¨
ur alle
d(xk , xm ) ≤ d(xk , x) + d(xm , x) < ε ∀ k, m ≥ N.
Ist nun (xk ) als Cauchy-Folge vorausgesetzt, so gibt es zu ε = 1 ein N ∈ N
mit d(xk , xm ) ≤ 1 f¨
ur alle k, m ≥ N . Damit ist aber
diam{xk : k ∈ N} ≤ sup d(xk , xN ) + d(xm , xN ) ≤ 2 sup d(xk , xN )
k,m∈N
k∈N
≤ 2 max d(xk , xN ) + 2 < ∞.
1≤k≤N −1
Lemma 4.16 Es seien (Mi , di ) vollst¨andige metrische R¨aume, i = 1, . . . , n.
Dann ist auch M = ni=1 Mi versehen mit der Produktmetrik d vollst¨andig.
Beweis. Ist (x(k) ) eine Cauchyfolge in M , so gibt es zu jedem ε > 0 ein N ∈ N
mit
(k)
(m)
di (xi , xi ) ≤ d(x(k) , x(m) ) < ε ∀ k, m ≥ N
(k)
f¨
ur alle i = 1, . . . , n. Daher gibt es xi ∈ Mi mit di (xi , xi ) → 0 f¨
ur alle i und
somit auch
(k)
(m)
d(x(k) , x(m) ) = max{di (xi , xi ) : i = 1, . . . , n} → 0
mit k, m → ∞ f¨
ur x = (x1 , . . . , xn ).
67
Korollar 4.17 (Kn , ·
∞)
ist ein Banachraum.
·
Beweis. Dies folgt unmittelbar aus dem vorigen Lemma, da die von
zierte Metrik
d(x, x ) = x − x
∞
∞
indu-
= max{|xi − xi | : i = 1, . . . , n}
gerade die Produktmetrik der u
¨blichen Metrik auf K ist.
Eine wesentliche Verallgemeinerung des (Kn , · ∞ ) ist durch in Beispiel 4 von
Seite 58 eingef¨
uhrten normierten Raum (B(D; K), · ∞ ) gegeben. Wir bemerken
zun¨achst, dass nach Lemma 3.4 fk → f in B(D; K) genau dann gilt, wenn die
Folge (fk ) gleichm¨aßig gegen f konvergiert.
Satz 4.18 (B(D; K), ·
∞)
ist ein Banachraum.
Beweis. Es sei (fk ) eine Cauchyfolge in B(D, K). F¨
ur jedes x ∈ D gilt dann
|fk (x) − fm (x)| ≤ fk − fm
∞
→ 0 mit k, m → ∞
und da K vollst¨andig ist, gibt es ein f (x) ∈ K mit fk (x) → f (x). Dies definiert
eine Funktion x → f (x), von der wir nun noch zeigen m¨
ussen, dass 1. f ∈ B(D, K)
ist und 2. fk − f ∞ → 0 gilt.
Zu 1. Da (fk ) als Cauchyfolge beschr¨ankt in B(D, K) ist, gibt es ein C > 0
mit
|fk (x)| ≤ fk ∞ ≤ C
f¨
ur alle k ∈ N und alle x ∈ D. Daher muss auch |f (x)| ≤ C sein.
Zu 2. Es sei ε > 0. W¨ahle N ∈ N, so dass f¨
ur alle k, m ≥ N
fk − fm
∞
≤
ε
2
gilt. F¨
ur jedes x ∈ D k¨onnen wir wegen fk (x) → f (x) außerdem ein (von x
abh¨angiges) n ≥ N w¨ahlen, so dass
ε
|fn (x) − f (x)| ≤ .
2
Dann folgt f¨
ur m ≥ N (indem wir oben k = n w¨ahlen):
|fm (x) − f (x)| ≤ |fm (x) − fn (x)| + |fn (x) − f (x)| ≤ fm − fn
∞
+
Bildet man nun das Supremum u
¨ber alle x ∈ D, erh¨alt man fm − f
68
ε
≤ ε.
2
∞
≤ ε.
Stetigkeit
Wir wollen nun Funktionen zwischen metrischen R¨aumen untersuchen.
Definition 4.19 Es seien (M, d), (M , d ) metrische R¨aume, U ⊂ M . Eine Funktion f : U → M heißt stetig bei x f¨
ur ein x ∈ U , wenn f¨
ur jede Folge (xk ) aus
U
xk → x in (M, d) =⇒ f (xk ) → f (x) in (M , d ).
gilt.
f heißt stetig, wenn f bei allen x ∈ U stetig ist,
Auf (Teilmengen von) K stimmt dies nat¨
urlich mit unserer fr¨
uheren Definition
u
¨berein. Indem wir (M, d) ggf. durch (U, dU ×U ) ersetzen, k¨onnen wir im Folgenden
o.B.d.A. annehmen, dass U = M ist.
Satz 4.20 Es seien (M, d), (M , d ) metrische R¨aume, f : M → M und x0 ∈ M .
Dann sind aquivalent:
(i) f ist stetig bei x0 .
(ii) F¨
ur alle ε > 0 gibt es ein δ > 0, so dass
d(x, x0 ) < δ =⇒ d (f (x), f (x0 )) < ε
(M,d)
m.a.W.: f (Bδ
(x0 )) ⊂ Bε(M ,d ) (f (x0 )) .
(iii) F¨
ur jede Umgebung V von f (x0 ) gibt es eine Umgebung U von x0 mit
f (U ) ⊂ V .
Beweis. (i) =⇒ (iii): G¨abe es eine Umgebung V von f (x0 ), so dass f¨
ur keine Umgebung U von x0 f (U ) ⊂ V gilt, so g¨abe es insbesondere in jeder Kugel B1/k (x0 ) ein xk mit f (xk ) ∈
/ V . F¨
ur diese xk gilt dann d(xk , x0 ) → 0 aber
d (f (xk ), f (x0 )) → 0, weil f¨
ur ein hinreichend kleines ε > 0 ja Bε (f (x0 )) ⊂ V ist.
(iii) =⇒ (ii): F¨
ur ε > 0 gibt es eine Umgebung U von x0 mit f (U ) ⊂
Bε (f (x0 )). W¨ahlt man nun δ > 0 so klein, dass Bδ (x0 ) ⊂ U ist, folgt f (Bδ (x0 )) ⊂
f (U ) ⊂ Bε (f (x0 )), was zu zeigen war.
(ii) =⇒ (i): Gilt xk → x0 und ist δ zu gegebenem ε wie angegeben gew¨ahlt,
so ergibt sich f¨
ur k so groß, dass d(xk , x0 ) < δ erf¨
ullt ist,
d (f (xk ), f (x0 )) < ε,
was d (f (xk ), f (x0 )) → 0 zeigt.
Kriterien f¨
ur globale Stetigkeit liefert der folgende Satz:
Satz 4.21 Es seien (M, d), (M , d ) metrische R¨aume, f : M → M . Dann sind
¨aquivalent:
69
(i) f ist stetig.
(ii) F¨
ur jede offene Menge V in M ist das Urbild f −1 (V ) offen in M .
(iii) F¨
ur jede abgeschlossene Menge V in M ist das Urbild f −1 (V ) abgeschlossen
in M .
Beweis. (ii) ⇐⇒ (iii): F¨
ur alle A ⊂ M gilt f −1 (M \ A) = M \ f −1 (A).
−1
Damit ist f (V ) offen f¨
ur alle offenen V ⊂ M genau dann wenn M \ f −1 (V ) =
f −1 (M \ V ) offen f¨
ur alle abgeschlossenen V ⊂ M , also f −1 (V ) abgeschlossen
f¨
ur alle abgeschlossenen V ⊂ M ist.
(i) =⇒ (ii): Es sei nun V ⊂ M offen und f stetig. Dann gibt es zu jedem
x ∈ f −1 (V ) eine Umgebung U von x mit f (U ) ⊂ V und daher U ⊂ f −1 (V ). Das
zeigt, dass f −1 (V ) offen ist.
(ii) =⇒ (i): Ist umgekehrt x ∈ M beliebig und f −1 (V ) offen f¨
ur alle offenen
−1
V ⊂ M , so enth¨alt insbesondere jedes f (Bε (f (x))), ε > 0, mit x auch eine
Kugel Bδ (x), δ > 0, weshalb f bei x stetig ist.
Bemerkung: Die beiden letzten S¨atze zeigen, dass auch die Stetigkeit einer
Funktion nur von der Topologie der zugrunde liegenden R¨aume abh¨angt.
Definition 4.22 Es seien (M, d), (M , d ) metrische R¨aume. Eine Funktion f :
ur alle ε > 0 ein δ > 0 existiert, so
M → M heißt gleichm¨aßig stetig, wenn f¨
dass f¨
ur alle x, x ∈ M gilt
d(x, x ) < δ =⇒ d (f (x), f (x )) < ε.
Beispiele:
1. Ist (M, d) ein metrischer Raum, so ist die Metrik d selbst eine gleichm¨aßig
¯ nach R.
stetige Abbildung von M × M , versehen mit der Produktmetrik d,
Um dies zu zeigen, beobachten wir zun¨achst, dass f¨
ur (x, x ), (y, y ) ∈ M ×M
gilt
d(y, y ) ≤ d(y, x) + d(x, x ) + d(x , y ) ≤ d(x, x ) + 2d¯ (x, x ), (y, y ) .
Vertauscht man die Rollen von (x, x ) und (y, y ), erh¨alt man analog
d(x, x ) ≤ d(y, y ) + 2d¯ (x, x ), (y, y ) ,
insgesamt also
|d(y, y ) − d(x, x )| ≤ 2d¯ (x, x ), (y, y ) .
Das Kriterium der gleichm¨aßigen Stetigkeit ist demnach mit δ =
70
ε
2
erf¨
ullt.
2. Ist (M, d) ein metrischer Raum und A ⊂ M , so ist die Abbildung dist :
M → R, x → dist(x, A) gleichm¨aßig stetig. Wegen
dist(x, A) = inf d(x, a) ≤ inf d(x, x ) + d(x , a) = d(x, x ) + dist(x , A)
a∈A
a∈A
und – analog –
dist(x , A) = inf d(x , a) ≤ inf d(x , x) + d(x, a) = d(x, x ) + dist(x, A)
a∈A
a∈A
ist n¨amlich
|dist(x, A) − dist(x , A)| ≤ d(x, x ).
f¨
ur alle x, x ∈ M , woraus die Behauptung folgt.
F¨
ur einen metrischen Raum M wird der Raum der beschr¨ankten stetigen
K-wertigen Funktionen mit Cb (M ; K) bezeichnet. Offensichtlich ist dies ein Unterraum von B(M ; K). Durch Einschr¨ankung definiert · ∞ eine Norm auf
Cb (M ; K).
Ganz analog zum Fall M = R (s. Satz 3.6) zeigt man, dass gleichm¨aßige
Limites stetiger Funktionen wieder stetig sind. Somit gilt:
Satz 4.23 Sind fk ∈ Cb (M ; K), f : M → K mit fk − f
f ∈ Cb (M ; K).
∞
→ 0, so ist auch
¨
Beweis. Ubung!
Dies zeigt, dass Cb (M ; K) abgeschlossen in B(M ; K) liegt, und wir erhalten
als Folgerung:
Korollar 4.24 (Cb (M ; K), ·
∞)
ist ein Banachraum.
Beweis. Das folgt direkt aus Satz 4.23, Beispiel 4 von Seite 67 und Satz 4.18.
Wir untersuchen nun noch, wie sich Operationen auf Funktionen mit der
Stetigkeit vertragen.
Satz 4.25 Es seien (M, d), (M , d ), (M , d ) metrische R¨aume. Sind f : M →
M und g : M → M stetig, so ist auch g ◦ f : M → M stetig.
Beweis. f¨
ur xk , x ∈ M , k = 1, 2, . . . ergibt sich
xk → x =⇒ f (xk ) → f (x) =⇒ g(f (xk )) → g(f (x)).
Satz 4.26 Es seien (M, d), (Mi , di ) metrische R¨aume, fi : M → Mi , i = 1, . . . n.
f : M → ni=1 Mi sei die Abbildung f (x) = (f1 (x), . . . , fn (x)). Dann ist f genau
dann stetig, wenn alle fi stetig sind.
71
Beweis. Dies folgt daraus, dass f (xk ) → f (x) genau dann gilt, wenn fi (xk ) →
fi (x) f¨
ur alle i gilt (vgl. das Beispiel auf Seite 65).
Satz 4.27 Die Addition (x, x ) → x + x , Subtraktion (x, x ) → x − x und Multiplikation (x, x ) → xx sind stetige Abbildungen von (K2 , · ∞ ) nach (K, | · |).
Die Division (x, x ) → x/x ist eine stetige Abbildungen von ({(x, x ) ∈ K2 : x =
0}, · ∞ ) nach (K, | · |).
ullt ist, wenn
Beweis. Das folgt daraus, dass (xk , xk ) → (x, x ) genau dann erf¨
xk → x und xk → x gilt und aus den Grenzwerts¨atzen (s. Analysis 1).
Satz 4.28 Sind f, g : M → K stetig in x0 ∈ M , so sind auch f + g, f − g, f g
und, wenn g(x0 ) = 0 ist, f /g bei x0 stetig.
Beweis. Einfach. (Vgl. die analogen Ergebnisse f¨
ur M ⊂ K aus der Analysis 1.)
Beispiel:. Unter einer Polynomfunktion f : Kn → K vom Grad d ∈ N0 in den n
Variablen x1 , . . . , xn verstehen wir eine Funktion der Form
cα xα1 1 · . . . · xαnn ,
f (x) =
α∈Nn
0
α1 +...+αn ≤d
wobei die cα ∈ K Koeffizienten sind. Jede solche Polynomfunktion ist stetig.
Als Spezialfall dieses Beispiels ergibt sich, dass jede lineare Abildung Kn → K
stetig ist. Im Unendlichdimensionalen muss das nicht mehr stimmen. Es gibt aber
eine einfache Charakterisierung der stetigen linearen Abbildungen:
Satz 4.29 Es seien (X, · X ), (X , ·
linear. Dann sind ¨aquivalent:
X
) normierte R¨aume u
¨ber K, A : X → X
(i) A ist stetig.
(ii) A ist stetig bei 0.
(iii) Es existiert ein C > 0 mit A(x)
≤C x
X
X
f¨
ur alle x ∈ X.
Beweis. (i) =⇒ (ii): klar.
(ii) =⇒ (iii): Es gibt ein δ > 0, so dass f¨
ur alle x ∈ X mit x
A(x) X < 1 ist. Dann aber ist f¨
ur alle x ∈ X
A(x)
X
=
2 x
δ
X
δx
2 x X
A
≤
X
2
x
δ
X.
(iii) =⇒ (i): Mit xk → x in X folgt
A(xk ) − A(x)
X
= A(xk − x)
72
X
≤ C xk − x
X
→ 0.
X
< δ auch
Beispiele:
1. Auf (C[a, b], ·
∞)
ist die Abbildung I : C[a, b] → R
b
I(f ) =
f (x) dx
a
stetig. Es gilt ja
b
|f (x)| dx ≤ (b − a) f
|I(f )| ≤
∞.
a
2. Auch die sogenannte Auswertungsabbildung Ax0 : C[a, b] → R,
A(f ) = f (x0 )
f¨
ur ein x0 ∈ [a, b] ist stetig, wenn C[a, b] mit der ·
denn es ist
|Ax0 (f )| = |f (x0 )| ≤ f ∞ .
∞ -Norm
versehen ist,
3. Ist dagegen C[a, b] mit der p-Norm · p f¨
ur p ∈ [1, ∞) versehen, so ist die
Integration I aus dem ersten Beispiel immer noch stetig, die Auswertungs¨
abbildung aus Beispiel 2 jedoch nicht. (Ubung!)
4.3
Kompaktheit
Der Begriff der kompakten Menge ist zentral in der gesamten Analysis. In den endlichdimensionalen R¨aumen Kn – und (Achtung!!) im Wesentlichen nur dort – sind
die kompakten Mengen gerade die beschr¨ankten abgeschlossenen Mengen. Wichtige Aussagen, die in der Analysis 1 auf beschr¨ankten abgeschlossenen Intervallen
gezeigt wurden (insbesondere etwa der Satz von Bolzano-Weierstraß) u
¨bertragen
n
sich damit auf beschr¨ankte abgeschlossene Teilmengen von K . Ein wesentlicher
Punkt bei der abstrakteren Einf¨
uhrung sogenannter kompakter Mengen in allgemeinen metrischen R¨aumen ist es nun, eine Charakterisierung von Mengen zu
erhalten, die ¨ahnlich weitreichende Konsequenzen hat. In unendlichdimensionalen
Banachr¨aumen etwa wird es dazu nicht mehr gen¨
ugen, nur Beschr¨anktheit und
Abgeschlossenheit zu fordern. Man ben¨otigt außerdem noch eine Bedingung die
sicherstellt, dass es nicht unendlich viele Punkte gibt, die alle einen gemeinsamen
positiven Mindestabstand voneinander haben. (In gewisser Weise, was wir hier
jedoch nicht weiter ausf¨
uhren, sind kompakte Mengen in Banachr¨aumen gerade
diejenigen beschr¨ankten und abgeschlossenen Mengen, die sich durch endlichdimensionale Mengen gut approximieren lassen.)
Im Folgenden sei wieder (M, d) ein metrischer Raum.
73
Definition 4.30 Eine Teilmenge A ⊂ M heißt kompakt, wenn jede Folge (xk ) ⊂
A eine in A konvergente Teilfolge besitzt.
Beispiele:
1. Nach dem Satz von Bolzano-Weierstraß sind beschr¨ankte abgeschlossene
Intervalle in R kompakt.
2. In (M, d) mit der diskreten Metrik d sind genau die endlichen Teilmengen
kompakt: Ist (xk ) eine Folge in A ⊂ M mit #A < ∞, so gibt es ein x ∈ A
mit xk = x f¨
ur unendlich viele Indizes k. Diese indizieren eine konstante
Teilfolge, die gegen x konvergiert. Ist umgekehrt #A = ∞, so gibt es eine
Folge (xk ) ⊂ A, mit xk = xm f¨
ur k = m. Diese Folge ist keine Cauchyfolge,
kann also erst recht nicht konvergieren.
3. In (B([0, 1]; K), ·
∞)
ist die (beschr¨ankte und abgeschlossene) Menge
B 1 (0) = {f ∈ B[0, 1] : f
∞
≤ 1}
nicht kompakt: Die Folge (fk ) aus B 1 (0), gegeben durch
fk (x) =
1 f¨
ur x = k1 ,
0 sonst,
hat keine konvergente Teilfolge, ja noch nicht einmal eine Cauchyfolge als
Teilfolge, da f¨
ur alle k = m
fk − fm
∞
=1
gilt.
4. Auch in (C[0, 1], ·
∞)
ist die (beschr¨ankte und abgeschlossene) Menge
B 1 (0) = {f ∈ C[0, 1] : f
∞
≤ 1}
¨
nicht kompakt. Ubung!
Der folgende wichtige Satz, den wir hier allerdings nicht beweisen werden,
gibt ¨aquivalente Umformulierungen der Kompaktheit an.
Satz 4.31 Es sei (M, d) ein metrischer Raum, A ⊂ M . Dann sind ¨aquivalent:
(i) A ist kompakt.
¨
(ii) A erf¨
ullt die endliche Uberdeckungseigenschaft:
Aus jeder Familie (Ui )i∈I
offener Mengen, die A u
berdecken,
d.h.
A
⊂
ullen, k¨onnen end¨
i∈I Ui erf¨
lich viele Mengen Ui1 , . . . , Uin ausgew¨ahlt werden, die A auch schon u
¨berdecken: A ⊂ Ui1 ∪ . . . ∪ Uin .
¨
Kurz: Jede offene Uberdeckung
besitzt eine endliche Teil¨
uberdeckung.
74
(iii) A ist vollst¨andig und zu jedem ε > 0 gibt es endliches ε-Netz: Dies bedeutet,
dass es zu jedem ε > 0 endlich viele Punkte x1 , . . . , xn ∈ A gibt, so dass A
von Bε (x1 ) ∪ . . . ∪ Bε (xn ) u
¨berdeckt wird.
Bemerkungen:
1. (ii) zeigt, dass die Kompaktheit einer Menge A tats¨achlich nicht von der
genauen Art der Metrik, sondern wieder nur von der erzeugten Topologie,
also davon, welches die offenen Mengen sind, abh¨angt.
¨
2. Durch Komplementbildung sieht man sofort, dass die endliche Uberdeckungseigenschaft offener Mengen zur endlichen Durchschnittseigenschaft abgeschlossener Mengen ¨aquivalent ist: Aus jeder Familie (Ui )i∈I abgeschlossener Mengen mit A ∩ i∈I Ui = ∅ k¨onnen endlich viele Ui1 , . . . , Uin mit
A ∩ Ui1 ∩ . . . ∩ Uin = ∅ ausgew¨ahlt werden. Diese Bedingung wird oft in
Form ihrer Kontraposition angewandt: Gilt A ∩ Ui1 ∩ . . . ∩ Uin = ∅ f¨
ur je
endlich viele Ui1 , . . . , Uin , so folgt A ∩ i∈I Ui = ∅.
3. (iii) zeigt, dass – solange A vollst¨andig ist – die Kompaktheit gerade heißt,
dass man zu jeder ‘Approximationsg¨
ute’ ε > 0 die Menge A durch nur
endlich viele Punkte ann¨ahern kann. Diese Eigenschaft bezeichnet man auch
als Totalbeschr¨anktheit von A.
Beweis von Satz 4.31.2 Zun¨achst bemerken wir, dass wir o.B.d.A. A = M annehmen d¨
urfen, indem wir sonst zu (A, d|A×A ) u
¨bergehen.
(ii) ⇒ (i): Ist (xn ) ⊂ M eine Folge ohne H¨aufungspunkt, so gibt es zu jedem
y ∈ M ein ε(y) > 0, f¨
ur das Bε(y) (y) nur endlich viele Folgenpunkte xn enth¨alt.
Nach Annahme gibt es nun endlich viele y1 , . . . , yN ∈ M , so dass die Kugeln
Bε(yi ) (yi ), i = 1, . . . , N , ganz M u
¨berdecken. Das aber impliziert, dass die Menge
der Folgenglieder {xn : n ∈ N} endlich ist, weshalb mindestens ein Folgenglied
f¨
ur unendlich viele Indizes n angenommen wird. Durch diese Indizes wird nun
eine konstante und folglich konvergente Teilfolge definiert.
(i) ⇒ (iii): Vollst¨andigkeit: Ist (xn ) ⊂ M eine Cauchy-Folge, die eine gegen x
konvergente Teilfolge (xnk ) besitzt, so folgt schon xn → x, denn zu ε > 0 lassen
sich N ∈ N und k ∈ N mit nk ≥ N w¨ahlen, so dass
d(xn , xm ) <
ε
2
∀ n, m ≥ N
und
d(xnk , x) <
gelten, weshalb f¨
ur n ≥ N (w¨ahle m = nk ) auch
d(xn , x) ≤ d(xn , xnk ) + d(xnk , x) < ε
ist.
2
Dieser Beweis wurde in der Vorlesung weggelassen.
75
ε
2
Totalbeschr¨anktheit: G¨abe es zu einem ε > 0 kein endliches ε-Netz, so ließen sich induktiv Punkte x1 , x2 , . . . ∈ M w¨ahlen mit xn+1 ∈
/ ni=1 Bε (xi ), also
d(xj , xi ) ≥ ε f¨
ur i = j. Dann aber ist keine Teilfolge von (xn ) eine Cauchy-Folge
geschweige denn konvergent.
¨
(iii) ⇒ (ii): Angenommen es g¨abe eine offene Uberdeckung
M = i∈I Ui ,
die keine endliche Teil¨
uberdeckung besitzt. Wir konstruieren dann induktiv eine
Folge von abgeschlossenen Mengen V1 ⊃ V2 ⊃ . . ., so dass f¨
ur jedes n gilt:
• Vn = ∅,
• diamVn ≤
1
n
und
• Vn wird nicht von endliche vielen Ui u
¨berdeckt.
n = 1: Nach Voraussetzung gibt es Punkte x1 , . . . , xN mit M = N
k=1 B 1/2 (xk ).
F¨
ur mindestens ein xk kann dann nach Annahme V1 := B 1/2 (xk ) nicht von endlich
vielen Ui u
¨berdeckt werden.
n ≥ 2: Es seien nun V1 , . . . , Vn−1 bereits definiert. Nach Voraussetzung gibt
es Punkte y1 , . . . , yN , so dass M = N
k=1 B 1/2n (yk ) und damit
N
Vn−1 = Vn−1 ∩
N
Vn−1 ∩ B 1/2n (yk )
B 1/2n (yk ) =
k=1
k=1
ist. F¨
ur mindestens ein yk mit Vn−1 ∩ B 1/2n (yk ) = ∅ kann dann wieder nach
Annahme Vn := Vn−1 ∩ B 1/2n (yk ) nicht von endlich vielen Ui u
¨berdeckt sein.
W¨ahlen wir nun zn ∈ Vn , so ist (zn ) eine Cauchy-Folge, denn f¨
ur m ≥ n ist ja
1
zm , zn ∈ Vn , also d(zm , zn ) ≤ diamVn ≤ n . Nach Annahme konvergiert sie, etwa
zn → z f¨
ur n → ∞. Da die Vn alle abgeschlossen sind, gilt außerdem z ∈ Vn f¨
ur
alle n. Nun gibt es aber ein i ∈ I mit z ∈ Ui und aus der Offenheit von Ui und
diamVn ≤ n1 folgt
Vn ⊂ B 1/n (z) ⊂ B2/n (z) ⊂ Ui
f¨
ur n hinreichend groß, im Widerspruch dazu, dass Vn nicht durch ein einziges Ui
u
¨berdeckt werden kann.
Satz 4.32 Es sei A ⊂ M kompakt.
(i) Dann ist A beschr¨ankt und abgeschlossen.
(ii) Ist B ⊂ A abgeschlossen, so ist auch B kompakt.
Beweis. (i) Gilt xk → x f¨
ur xk ∈ A, so ist x ∈ A, denn es gibt eine in A
konvergente Teilfolge, deren Limes auch x sein muss. Daher ist A abgeschlossen.
76
Angenommen A sei nicht beschr¨ankt. Fixiere x0 ∈ A. Dann gibt es zu jedem
k ∈ N ein xk ∈ A mit d(xk , x0 ) ≥ k, denn anderenfalls w¨are f¨
ur ein k ∈ N und
alle x, x ∈ A
d(x, x ) ≤ d(x, x0 ) + d(x , x0 ) ≤ 2k.
Ist nun (xkm ) eine Teilfolge von (xk ), so gilt
d(xkm , xk1 ) ≥ d(xkm , x0 ) − d(xk1 , x0 ) ≥ km − d(xk1 , x0 ) → ∞
mit m → ∞, weshalb (xkm ) nicht beschr¨ankt und erst recht nicht konvergent ist.
Dann aber kann A nicht kompakt gewesen sein.
(ii) Jede Folge (xk ) in B ist auch eine Folge in A, so dass eine f¨
ur eine Teilfolge
xkm → x ∈ A gilt. Da B abgeschlossen ist, folgt nun, dass sogar x ∈ B ist.
Satz 4.33 Es seien (Mi , di ) metrische R¨aume, Ai ⊂ Mi kompakt, i = 1, . . . , n.
Dann ist A := A1 × . . . × An kompakt in M = ni=1 Mi mit der Produktmetrik.
Beweis. Sei (x(k) ) eine Folge in A. Da A1 kompakt ist, gibt es eine Teilfolge
(k )
(x(km ) ) und ein x1 ∈ A1 mit x1 m → x1 . Da A2 kompakt ist, k¨onnen wir aus
dieser Teilfolge eine weitere Teilfolge (x(kml ) ) und ein x2 ∈ A2 ausw¨ahlen, so
(km )
(km )
urlich gilt dann auch noch x1 l → x1 . Indem wir so
dass x2 l → x2 gilt. Nat¨
fortfahrend zu immer weiteren Teilfolgen u
¨bergehen, erhalten wir nach n Schritten
(k)
eine Teilfolge (˜
x(k) ) von (x(k) ) mit x˜i → xi ∈ Ai f¨
ur alle i. Dann aber gilt
(k)
x˜ → (x1 , . . . , xn ) ∈ A.
Korollar 4.34 F¨
ur alle ai , bi ∈ R, ai ≤ bi , i = 1, . . . , n, ist [a1 , b1 ] × . . . × [an , bn ]
n
kompakt in (R , · ∞ ).
Beweis. Das folgt direkt aus dem Beispiel 1 auf Seite 74 und Satz 4.33.
Im Endlichdimensionalen (und niemals auf unendlichdimensionalen R¨aumen)
l¨asst sich Satz 4.32(i) auch umkehren:
Satz 4.35 Eine Teilmenge A ⊂ Rn ist kompakt in (Rn , ·
sie beschr¨ankt und abgeschlossen ist.
∞)
genau dann, wenn
Beweis. Die eine Richtung haben wir schon in Satz 4.32(i) gezeigt. Es sei nun A
beschr¨ankt und abgeschlossen. Aus der Beschr¨anktheit folgt, dass A ⊂ [−R, R]n
f¨
ur hinreichend großes R > 0 gilt. Die Behauptung folgt nun aus Satz 4.33 und
Satz 4.32(ii).
Stetige Funktionen verhalten sich auf Kompakta besonders gutartig.
Satz 4.36 Es seien (M, d), (M , d ) metrische R¨aume, A ⊂ M kompakt und f :
A → M stetig. Dann gilt:
(i) Auch f (A) ist kompakt.
77
(ii) f ist gleichm¨aßig stetig.
Beweis. (i) Es sei (xk ) eine Folge in f (A). W¨ahle xk ∈ A mit f (xk ) = xk .
Dann gibt es eine konvergente Teilfolge xkm → x ∈ A. Da f stetig ist, folgt
xkm = f (xkm ) → f (x) ∈ f (A).
(ii) W¨are f nicht gleichm¨aßig stetig, so g¨abe es ein ε > 0, so dass f¨
ur alle k ∈ N
1
Elemente xk , xk mit d(xk , xk ) < k und d (f (xk ), f (xk )) ≥ ε existierten. W¨ahlt
man dann aber eine Teilfolge xkm → x ∈ A, so gilt wegen d(xkm , xkm ) < k1m → 0
auch xkm → x und, da f stetig ist, damit auch
d f (xkm ), f (xkm ) ≤ d f (xkm ), f (x) + d f (xkm ), f (x) → 0,
ur alle km .
im Widerspruch zu d (f (xkm ), f (xkm )) ≥ ε f¨
Korollar 4.37 Ist f : A → R stetig, A ⊂ M kompakt, so nimmt f auf A sein
Minimum und sein Maximum an.
Beweis. f (A) ⊂ R ist kompakt nach Satz 4.36(i). Da es damit beschr¨ankt ist, gilt
m = inf f (A) ∈ R und m = sup f (A) ∈ R. Es gibt Folgen (xk ) und (xk ) in f (A)
mit xk → m und xk → m . Da f (A) als Kompaktum aber auch abgeschlossen ist,
folgt daraus nun tats¨achlich m, m ∈ f (A).
Beispiele:
1. Ist A ⊂ M , so nimmt die nach dem Beispiel 2 von Seite 71 stetige Funktion
x → dist(x, A) auf kompakten Mengen ihr Maximum sowie ihr Minimum
an.
2. Sind A, B ⊂ M kompakt, so ist nach Satz 4.33 A × B in M × M mit der
Produktmetrik kompakt. Da nach dem Beispiel 1 von Seite 71 d : M ×M →
R bez¨
uglich dieser Metrik stetig ist, gibt es Punkte a0 ∈ A und b0 ∈ B mit
dist(A, B) =
inf
(a,b)∈A×B
d(a, b) = d(a0 , b0 ).
Zum Schluss dieses Abschnitts kommen wir noch einmal auf die Beobachtung
zur¨
uck, dass viele der hier vorgestellten Konzepte gar nicht von der genauen Form
der Metrik, sondern nur der induzierten Topologie abh¨angen.
Lemma und Definition 4.38 Es sei M eine Menge. Man nennt zwei Metriken
d, d auf M ¨aquivalent (oder topologisch ¨aquivalent), wenn eine (und damit alle)
der folgenden ¨aquivalenten Bedingungen erf¨
ullt ist:
(i) U ⊂ M ist offen in (M, d) genau dann, wenn U offen in (M, d ) ist.
78
(ii) Zu jedem x ∈ M und r > 0 gibt es s, s > 0, so dass
(M,d )
Bs
(x) ⊂ Br(M,d) (x) und
Bs(M,d) (x) ⊂ Br(M,d ) (x)
gilt.
(iii) Die Identit¨at id : M → M ist d-d -stetig und d -d-stetig (also f¨
ur jede Wahl
der Metrik in Bild- und Urbildraum).
¨
¨
Beweis. Die Aquivalenz
von (i) und (iii) folgt direkt aus Satz 4.21, die Aquivalenz
von (ii) und (iii) folgt direkt aus Satz 4.20.
Bemerkungen:
1. Bez¨
uglich ¨aquivalenter Metriken sind die gleichen Mengen offen, abgeschlossen oder kompakt, die gleichen Folgen konvergent und die gleichen Abbil¨
dungen stetig. (Uberlegen
Sie sich das!)
¨
2. Zus¨atzlich zur topologischen Aquivalenz
definiert man auch: Zwei Metriken
d1 , d2 auf M heißen stark ¨aquivalent, wenn es Konstanten c, C > 0 gibt, so
dass
c d2 (x, x ) ≤ d1 (x, x ) ≤ C d2 (x, x )
f¨
ur alle x, x ∈ M gilt. Bez¨
uglich stark ¨aquivalenter Metriken sind außerdem
die gleichen Folgen Cauchy-Folgen und die gleichen Mengen vollst¨andig.
¨
Nat¨
urlich werden durch die topologische bzw. starke Aquivalenz
von Metriken
¨
auf einer Menge M Aquivalenzrelationen auf der Menge der Metriken auf M
definiert.
F¨
ur normierte R¨aume definiert man:
Definition 4.39 Zwei Normen · 1 und · 2 auf einem K-Vektorraum X nennt
man ¨aquivalent, wenn es Konstanten c, C > 0 gibt, so dass
c x
2
≤ x
1
≤C x
2
gilt.
¨
Es ist leicht zu sehen, dass dies zur starken Aquivalenz
der induzierten Metri¨
ken ¨aquivalent ist und dass hierdurch eine Aquivalenzrelation auf der Menge der
Normen auf X definiert wird. Nach Satz 4.29 und Lemma und Definition 4.38 sind
zwei Normen jedoch schon genau dann ¨aquivalent, wenn die induzierten Metriken
topologisch a¨quivalent sind.
Da wir nun schon einiges u
¨ber den Raum (Rn , · ∞ ) bewiesen haben, ist das
folgende Ergebnis besonders beruhigend:
Satz 4.40 Auf dem Rn sind alle Normen ¨aquivalent.
79
Bemerkung: Das heißt: Egal welche Norm auf Rn gegeben ist: Es sind immer
die gleichen Mengen offen, abgeschlossen, kompakt oder vollst¨andig, die gleichen
Folgen konvergent oder Cauchyfolgen und die gleichen Funktionen stetig.
Beweis. Es gen¨
ugt zu zeigen, dass jede Norm · zur Maximumsnorm · ∞
ur alle x ∈ Rn
¨aquivalent ist. Bezeichnet ei den i-ten Einheitsvektor, so gilt f¨
n
n
xi e i ≤
x =
i=1
n
|xi | ei ≤
ei
i=1
max{|xi | : 1 ≤ i ≤ n} = C x
∞
i=1
mit C = ni=1 ei .
Betrachte nun die Abbildung x → x von (Rn , · ∞ ) nach R. Nach der eben
gewonnenen Absch¨atzung ist die stetig, denn es gilt ja
xk → x =⇒
xk − x
≤ xk − x ≤ C xk − x
∞
→ 0.
Nun ist K := {x ∈ Rn : x ∞ = 1} offenbar abgeschlossen und beschr¨ankt und
somit eine kompakte Menge von (Rn , · ∞ ), so dass f dort sein Minimum annimt.
Dies kann nicht 0 sein, da mit x = 0 ja x = 0 ∈
/ K w¨are. Es gibt also ein c > 0
mit
x ≥ c ∀x ∈ Rn mit x ∞ = 1.
Dann aber gilt f¨
ur alle x ∈ Rn auch
x = x
∞
x
≥c x
x ∞
∞.
Bemerkung: Die S¨atze 4.35 und 4.40 gelten auch auf Cn . Dies ergibt sich leicht
daraus, dass wegen C ∼
= R2n gilt und damit jede Norm · auf
= R2 auch Cn ∼
Cn auch eine Norm auf R2n definiert.
Damit erweisen sich nun alle Normen auf Cn als ¨aquivalent. Da außerdem
Teilmengen abgeschlossen, beschr¨ankt bzw. kompakt genau dann sind, wenn sie
dies aufgefasst als Teilmegen von R2n sind, sind die kompakten Teilmengen von
Cn gerade die beschr¨ankten und abgeschlossenen.
4.4
Der Banachsche Fixpunktsatz
Ein immer wiederkehrendes Problem in fast allen Bereichen der Mathematik ist
das L¨osen von Gleichungen F (x) = y, wobei F : M → M eine Funktion, y
gegeben und x gesucht ist. (M und M beliebige Mengen.) Ist M = M ein
Vektorraum, so kann man die Gleichung als F (x) − y = 0 oder auch
f (x) := F (x) − y + x = x
80
umformulieren. In letzterem Fall f (x) = x spricht man auch von einer Fixpunktgleichung. In diesem Abschnitt werden wir f¨
ur allgemeine vollst¨andige metrische
R¨aume eine wichtige Klasse von Abbildungen f angeben, f¨
ur die wir Existenz
und Eindeutigkeit von L¨osungen der Fixpunktgleichung garantieren k¨onnen.
Definition 4.41 Ist M eine Menge, f : M → M , so nennt man ein x mit
f (x) = x einen Fixpunkt von f .
Wir untersuchen Funktionen mit besonders guten Stetigkeitseigenschaften:
Definition 4.42 Es seien (M, d), (M , d ) metrische R¨aume, f : M → M . f
heißt Lipschitz-stetig, wenn es ein L > 0 mit
d (f (x1 ), f (x2 )) ≤ Ld(x1 , x2 ) ∀ x1 , x2 ∈ M
gibt. Ein solches L heißt Lipschitzkonstante von f .
Ist M = M , d = d und kann man L < 1 w¨ahlen, so nennt man f eine
Kontraktion.
Man sieht leicht, dass jede Lipschitz-stetige Abbildung gleichm¨aßig stetig ist.
Satz 4.43 (Der Banachsche Fixpunktsatz) Es seien (M, d) ein nicht leerer
vollst¨andiger metrischer Raum, f : M → M eine Kontraktion. Dann gilt:
(i) f hat genau einen Fixpunkt x.
(ii) F¨
ur jeden Startwert x0 ∈ M konvergiert die Folge (xk )k∈N0 , definiert durch
xk+1 = f (xk ) (die sogenannte Fixpunktiteration) gegen x.
(iii) Es gelten die Fehlerabsch¨atzungen
L
d(xk−1 , xk )
d(xk , x) ≤
1−L
und
Lk
d(xk , x) ≤
d(x1 , x0 ),
1−L
wenn L eine Lipschitzkonstante von f ist.
Beweis. Betrachte die Fixpunktiteration (xk ). Aus
d(xj+1 , xj ) = d(f (xj ), f (xj−1 )) ≤ Ld(xj , xj−1 ) ∀ j ∈ N
folgt induktiv
d(xk+i+1 , xk+i ) ≤ Li d(xk+1 , xk ) ∀ k, i ∈ N0 .
Aus dieser Ungleichung ergibt sich nun f¨
ur alle k, i ∈ N0 zun¨achst
d(xk+i , xk ) ≤ d(xk+i , xk+i−1 ) + . . . + d(xk+1 , xk )
1
≤ (Li−1 + . . . + 1)d(xk+1 , xk ) ≤
d(xk+1 , xk )
1−L
81
und dann, nach nochmaliger Anwendung,
d(xk+i , xk ) ≤
Lk
d(x1 , x0 ),
1−L
so dass (xk ) eine Cauchyfolge und also konvergent ist, etwa xk → x.
In der Tat ist x der einzige Fixpunkt von f , denn, da f stetig ist, gilt
x = lim xk = lim f (xk−1 ) = f (x),
und jeder Fixpunkt x von f erf¨
ullt
d(x, x ) = d(f (x), f (x )) ≤ Ld(x, x ) =⇒ (1 − L)d(x, x ) = 0 =⇒ x = x .
Schließlich erhalten wir aus den beiden oben gewonnenen Absch¨atzungen f¨
ur
d(xk+i , xk ), indem wir i → ∞ gehen lassen:
d(x, xk ) = lim d(xk+i , xk ) ≤
i→∞
1
L
d(xk+1 , xk ) ≤
d(xk , xk−1 )
1−L
1−L
sowie
d(x, xk ) = lim d(xk+i , xk ) ≤
i→∞
Lk
d(x1 , x0 ).
1−L
Eine Anwendung auf Differentialgleichungen
Mit Hilfe des Banachschen Fixpunktsatzes lassen sich Existenzresultate f¨
ur Difn
ferentialgleichungen beweisen. Gesucht sei eine Funktion y : I → R , t → y(t) =
(y1 (t), . . . , yn (t)), I ein Intervall, die f¨
ur gegebenes f der Differentialgleichung
y (t) = f (t, y)
gen¨
ugt. Hierbei ist die Ableitung y = (y1 , . . . , yn ) komponentenweise zu verstehen. f ist eine auf (evtl. einer geeigneten Teilmenge von) R × Rn definierte
Funktion mit Werten in Rn . Solche Gleichungen kommen in vielen Anwendungen, insbesondere der Physik, Chemie, Biologie und den Wirtschaftswissenschaften vor. t wird dabei oft als Zeit interpretiert, so dass die Differentialgleichung
¨
angibt, wie sich die Anderungsrate
y (t) der untersuchten Gr¨oße y(t) in Abh¨angigkeit des Wertes y(t) und der gegebenen Zeit t verh¨alt. Typischerweise geht man
davon aus, das System zu einer Startzeit t = t0 zu kennen. Das Ziel ist es nun,
aus y0 := y(t0 ) und der Differentialgleichung y zu bestimmen.
Wir beschr¨anken uns hier auf ein Existenzresultat f¨
ur ‘gutartige’ rechte Seiten
f.
82
Satz 4.44 Es sei f : Rn+1 → Rn Lipschitz-stetig. Dann gibt es zu jedem (t0 , y0 ) ∈
R × Rn eine eindeutige L¨osung y ∈ C 1 (R; Rn ) des sogenannten Anfangswertproblems
y (t) = f (t, y(t)) ∀ t ∈ R,
y(t0 ) = y0 .
Beweis. Aus dem Hauptsatz der Differential- und Integralrechnung ergibt sich,
dass y : R → Rn genau dann eine L¨osung des Anfansgwertproblems ist, wenn y
stetig ist und
t
f (τ, y(τ )) dτ
y(t) = y0 +
t0
f¨
ur alle t ∈ R erf¨
ullt.
Es gen¨
ugt zu zeigen, dass f¨
ur jedes Intervall I = [t0 − R, t0 + R], R > 0,
n
genau eine Funktion y ∈ C(I; R ) existiert, welche dieser Gleichung f¨
ur alle t ∈ I
gen¨
ugt. Den Wert der gesuchten globalen L¨osung auf ganz R zur Zeit t definiert
man dann als y(t), wenn |t − t0 | ≤ R und y die L¨osung auf I ist. Da diese L¨osungen f¨
ur verschiedene R wegen der Eindeutigkeit auf dem gemeinsamen Definitionbereich u
ussen, ist dies wohldefiniert. Die Eindeutigkeit der
¨bereinstimmen m¨
globalen L¨osung ersieht man dann leicht daraus, dass zwei verschiedene L¨osungen
der Differentialgleichung auf R ja schon auf einem geeigneten endlichen Intervall
verschieden sein m¨
ussten.
Wir betrachten nun den Raum X = C(I; Rn ). Dies ist bez¨
uglich der Supremumsnorm
u ∞ = sup{|u(t)|∞ : t ∈ I}
ein Banachraum. (Zur besseren Unterscheidung bezeichnen wir die Maximumsnorm auf dem Rn in diesem Beweis mit | · |∞ .) Das zeigt man entweder wie im
skalarwertigen Fall oder man bemerkt, dass dieser Raum ja gerade das n-fache
Produkt von C(I; R) mit der Produktmetrik ist. Auf X definieren wir nun eine
neue Norm durch
u := sup{e−2L|t−t0 | |u(t)|∞ : t ∈ I},
wobei L eine Lipschitz-Konstante (bzgl. der Supremumsnormen auf Rn+1 und
Rn ) f¨
ur f sei. Es ist leicht zu sehen, dass dies wirklich eine Norm ist. Tats¨achlich
ist · ¨aquivalent zu · ∞ , denn es gilt
u ≤ u
≤ e2LR u
∞
f¨
ur alle u ∈ X. (X, · ) ist also auch ein Banachraum.
Betrachte nun die Abbildung T : X → X, gegeben durch
t
T (u)(t) = y0 +
f (τ, u(τ )) dτ.
t0
83
T ist wohldefiniert, denn T (u) ist stetig. Wegen
t
|f (τ, u(τ )) − f (τ, v(τ ))|∞ dτ
|T (u)(t) − T (v)(t)|∞ ≤
t0
t
L|(τ, u(τ )) − (τ, v(τ ))|∞ dτ
≤
t0
t
Le2L|τ −t0 | e−2L|τ −t0 | |u(τ ) − v(τ )|∞ dτ
=
t0
t
e2L|τ −t0 | dτ
≤L
=L
e
t0
2L|t−t0 |
−1
2L
u−v
u−v
und somit
T (u)(t) − T (v)(t) = sup e−2L|t−t0 | |T (u)(t) − T (v)(t)|∞ ≤
|t−t0 |≤R
1
u−v
2
f¨
ur alle u, v ∈ X ist T eine Kontraktion auf X. Nach dem Banachschen Fixpunktsatz gibt es nun genau ein y mit y = T (y) wie behauptet.
Die Theorie der Differentialgleichungen ist ein gr¨oßeres Gebiet in der Mathematik. Nach Existenz- und Eindeutigkeitsresultaten, von denen wir gerade ein
Beipiel gesehen haben, interessiert man sich insbesondere f¨
ur das qualitative Verhalten von L¨osungen. Das f¨
uhrt auf die Theorie der dynamischen Systeme. F¨
ur
einige spezielle f lassen sich die L¨osungen y sogar explizit berechnen. All diese
Fragestellungen werden in einer eigenen Vorlesung u
¨ber Differentialgleichungen
behandelt.
Eine Anwendung auf Fraktale
Wir beschreiben nun noch eine Anwendung des Banachschen Fixpunktsatzes auf
die Konstruktion sogenannter Fraktale. Fraktale sind Teilmengen des Rn , die typischerweise selbst¨ahnliche Muster aufweisen. Es soll hier keine allgemeine Definition dieses Begriffs angegeben werden. Stattdessen konzentrieren wir uns auf eine
beosondere Klasse von selbst¨ahnlichen Fraktalen: Mengen, die aus einer bestimmten Anzahl verkleinerter Kopien ihrer selbst bestehen. Diese Fraktale k¨onnen als
Fixpunkt eines sogenannten iterierten Funktionensystems dargestellt werden.
¨
Allgemeiner als verkleinernde Ahnlichkeitsabbildungen
(Abbildungen von der
Form x → ax + c mit |a| < 1) betrachten wir hierzu n Kontraktionen w1 , . . . , wn
von einem vollst¨andigen metrischen Raum (M, d) in sich. Da die wi stetig sind,
ist dann durch
n
W : K → K,
W (K) :=
wi (K),
i=1
84
wobei K die Menge der nichtleeren kompakten Teilmengen von M bezeichnet,
eine Abbildung von K in sich wohldefiniert.
Wir versehen K nun mit einer Metrik, indem wir
dH (A, B) := max sup d(a, B), sup d(b, A)
a∈A
b∈B
setzen. Man nennt dH auch den (symmetrischen) Hausdorffabstand von A und
B.
¨
Ubung:
Zeigen Sie dass (K, dH ) ein vollst¨andiger metrischer Raum ist. Insbesondere ist f¨
ur eine Cauchyfolge (Kn ) in (K, dH )
∞
∞
Kl
K=
n=1 l=n
wieder kompakt und dH (Kn , K) → 0 f¨
ur n → ∞.
Ist 0 ≤ Li < 1 eine Lipschitzkonstante f¨
ur wi , i = 1, . . . , n, so folgt, dass auch
W eine Kontraktion mit Lipschitzkonstante max1≤i≤n Li ist.
¨
¨
Ubung:
Zeigen Sie dies. Uberlegen
Sie sich dazu zun¨achst, dass
a) f¨
ur eine Lipschitz-stetige Abbildung w : M → M mit Lipschitzkonstante L
auch die Abbildung
K → K, K → w(K)
Lipschitz mit Lipschitzkonstante L ist und
b) f¨
ur A1 , . . . , Am , B1 , . . . Bm gilt
dH (A1 ∪ . . . ∪ Am , B1 ∪ . . . Bm ) ≤ max dH (Aj , Bj ).
1≤j≤m
Aus dem Banachschen Fixpunktsatz folgt nun, dass es genau eine Menge
K ∈ K gibt, so dass W (K) = K ist. Mehr noch: F¨
ur jedes K0 ∈ K konvergiert
die Fixpunktiteration (Km )m mit Km+1 := W (Km ) gegen die Menge K.
Beispiele:
1. Auf R mit den Kontraktionen
w1 (x) =
x
,
3
w2 (x) =
2+x
3
ergibt sich als Fixpunkt von W die Cantormenge. Speziell f¨
ur K0 = [0, 1]
sehen die ersten vier Iterationen wie folgt aus:
K0
K1
K2
K3
85
2. Auf R2 mit den Kontraktionen
w1 (x) =
x
,
2
w2 (x) =
1
x
,0 + ,
2
2
w2 (x) = 0,
1
x
+
2
2
ergibt sich als Fixpunkt von W das Sierpinski-Dreieck. Speziell f¨
ur K0 =
2
{(x1 , x2 ) ∈ R : x1 ≥ 0, x2 ≥ 0, x1 +x2 ≤ 1} sehen die ersten vier Iterationen
wie folgt aus:
K0
K1
K2
86
K3
Kapitel 5
Mehrdimensionale
Differentialrechnung
In diesem Kapitel besch¨aftigen wir uns mit Funktionen f : U → Rm , U eine Teilmenge des Rn . W¨ahrend lineare Abbildungen, die sich ja einfach durch Matrizen
beschreiben lassen, relativ einfach zu behandeln sind, k¨onnen solche Funktionen
im Allgemeinen nat¨
urlich beliebig komliziert aussehen. Wenn jedoch f gutartig
und – in einem noch genauer zu definierenden Sinne – differenzierbar ist, so lassen sich viele Eigenschaften der Funktion f dadurch besser verstehen, dass man
f ‘linearisiert’, d.h. lokal durch eine lineare Abbildung approximiert.
Tats¨achlich bedeutet Differenzierbarkeit (oder auch ‘totale Differenzierbarkeit’) in der mehrdimensionalen Differentialrechnung gerade, dass es eine ‘lineare
Best-Approximation’ von f gibt, die f lokal beschreibt. Andererseits kann man
– in Anlehnung an die Differentialrechung einer Ver¨anderlicher – die Funktion f
auch dadurch untersuchen, dass man sie auf eindimensionale Geraden einschr¨ankt
und somit wie in der Analysis 1 in feste Richtungen ableitet. In den ersten Abschnitten untersuchen wir diese M¨oglichkeiten, Ableitungen zu bilden und ihren
engen Zusammenhang. Damit studieren wir dann lokale Taylor-Approximationen,
Extrema und das lokale Aufl¨osen nichtlinearer Gleichungen.
5.1
Ableitungen in mehreren Variablen
Die Ableitung
Im Folgenden sei, wenn nicht anders angegeben, U ⊂ Rn eine offene Menge und
f : U → Rm eine Funktion. Im Folgenden ist es von Vorteil, genau zwischen
Spalten- und Zeilenvektoren zu unterscheiden, so dass die Elemente x von Rk ,
87
k ∈ N, Spaltenvektoren x und deren Transponierte Zeilenvektoren xT sind:
 
x1
 .. 
x =  . ,
xT = (x1 , . . . , xk ).
xk
Wie im Eindimensionalen wollen wir auch f¨
ur solche Funktionen in mehreren Ver¨anderlichen die Ableitung and einer Stelle x0 ∈ U definieren. Das kann
nat¨
urlich nicht einfach ein Differentialquotient sein. Die folgende Charakterisierung der Ableitung im Eindimensionalen (vgl. [Ana 1, Satz 6.2]), die zeigt, dass
die Ableitung f (x0 ) eigentlich die Linearisierung einer Funktion nahe x0 darstellt,
weist den Weg zur Verallgemeinerung:
Erinnerung: Genau dann ist f : (a, b) → R differenzierbar in x0 mit Ableitung
f (x0 ) = a ∈ R bei x0 , wenn
f (x) = f (x0 ) + a(x − x0 ) + o(|x − x0 |)
f¨
ur x nahe x0 gilt. M.a.W.: a definiert durch z → l(z) = az eine best-approximierende
lineare Abbildung f¨
ur f nahe x0 gem¨aß
f (x) = f (x0 ) + l(x − x0 ) + o(|x − x0 |).
Dadurch motiviert definieren wir:
Definition 5.1 Es sei U ⊂ Rn offen, f : U → Rm .
(i) f heißt differenzierbar bei x0 ∈ U , wenn es eine lineare Abbildung A : Rn →
Rm gibt, so dass
f (x) = f (x0 ) + A(x − x0 ) + o( x − x0 )
f¨
ur x nahe x0 gilt. Die Ableitung von f bei x0 ist dann Df (x0 ) := A.
(ii) Ist f bei allen x0 ∈ U differenzierbar, so nennen wir f differenzierbar.
Die Ableitung von f ist dann eine Abbildung Df : U → L(Rn ; Rm ), wobei
L(Rn ; Rm ) den Raum der linearen Abbidungen von Rn nach Rm bezeichnet.
(iii) Ist f differenzierbar und Df : U → L(Rn ; Rm ) stetig, so heißt f stetig
differenzierbar und wir schreiben f ∈ C 1 (U ; Rm ).
Bemerkungen:
1. Beachte, dass Df (x0 ), falls existent, eindeutig ist, denn f¨
ur A = Df (x0 ) =
A ergibt sich f¨
ur jedes v ∈ Rn und hinreichend kleines h > 0 mit x =
x0 + hv:
(A − A )v = h−1 (A − A )(hv) = h−1 o( hv ),
also Av = A v f¨
ur h → 0, so dass A = A ist.
88
2. Da auf dem Rn alle Normen ¨aquivalent sind, h¨angt Df (x0 ) nicht von der
speziellen Wahl der Norm in Definition 5.1 ab.
3. Da auch auf dem L(Rn ; Rm ) ∼
= Rm×n ∼
= Rmn alle Normen a¨quivalent sind,
h¨angt die Stetigkeit der Ableitung Df : U → L(Rn ; Rm ) ebenfalls nicht von
der speziellen Wahl der Norm ab.
Beispiele:
1. Ist A ∈ L(Rn ; Rm ) und f (x) = Ax, so ist
Df (x0 ) = A ∀ x0 ∈ U,
denn f (x) = Ax0 + A(x − x0 ). Also ist Df : U → L(Rn ; Rm ) die konstante
Abbildung x → A.
2. Es sei f (x) = x 22 . Dann ist
f (x) = xT x = (x − x0 + x0 )T (x − x0 + x0 )
= xT0 x0 + 2xT0 (x − x0 ) + (x − x0 )T (x − x0 )
= f (x0 ) + 2xT0 (x − x0 ) + o( x − x0 ).
Deshalb ist
∈ L(Rn ; R) = (Rn )∗ .
Df (x0 ) = 2xT0
3. F¨
ur n = 1, U = (a, b) und f (t) = (f1 (t), . . . , fm (t))T gilt
f (t) = f (t0 ) + A(t − t0 ) + o(|t − t0 |)
f¨
ur ein A ∈ Rm×1 ∼
= Rm genau dann, wenn alle fi bei t0 differenzierbar sind
und A = ((f1 (t0 ), . . . , fm (t0 ))T ist. In diesem Fall ist also


f1 (t0 )


f (t0 ) := Df (t0 ) =  ...  .
fm (t0 )
Bemerkungen:
1. Man schreibt auch ∂f (x0 ) oder df (x0 ) f¨
ur Df (x0 ).
2. Statt ‘differenzierbar’ sagt man auch ‘total differenzierbar’ oder ‘Frechetdifferenzierbar’. (Wir werden gleich sehen, dass es noch andere ‘nicht totale’
Ableitungsbegriffe gibt.)
89
3. Definition 5.1 l¨asst sich auf Abbildungen f : U → Y , U offen in X zwischen
allgemeinen normierten R¨aumen (X, · X ) und (Y, · Y ) verallgemeinern.
Die Definition ist ganz analog, wobei man allerdings zus¨atzlich fordert, dass
die lineare Abbildung Df (x0 ) : X → Y stetig sein muss. (Im Unendlichdimensionalen ist das ja nicht automatisch der Fall, vgl. Satz 4.29 und Beispiel
3 von Seite 73.) Der Raum der (stetigen) linearen Abbildungen L(X; Y ) ist
selbst wieder ein normierter Raum bez¨
uglich der Operatornorm
A
L(X;Y )
= sup{ Ax
Y
: x
X
= 1}
f¨
ur A ∈ L(X; Y ). Beachte, dass sich direkt aus dieser Definition
Ax
Y
= A
x
x X
x
Y
X
≤ A
L(X;Y )
x
X
f¨
ur alle A ∈ L(X; Y ) und x ∈ X ergibt. (Die beiden folgenden S¨atze gelten
auch in diesem algemeineren Rahmen.)
¨
Ubung:
Zeigen sie, dass dies tats¨achlich eine Norm definiert.
¨
Ubung:
Es sei (Z, · Z ) ein weiterer normierter Raum, A ∈ L(Y ; Z),
B ∈ L(X; Y ). Zeigen Sie, dass dann AB L(X;Z) ≤ A L(Y ;Z) B L(X;Y )
gilt.
Wie auf R hat man:
Satz 5.2 Ist f : U → Rm differenzierbar bei x0 ∈ U , so ist f stetig bei x0 .
Beweis. Mit xk → x0 folgt
f (xk ) = f (x0 ) + Df (x0 )(xk − x0 ) + o( xk − x0 ) → f (x0 ).
Satz 5.3 (Kettenregel) Es seien f : U → V ⊂ Rm differenzierbar bei x0 ∈ U ,
g : V → Rl differenzierbar bei f (x0 ). Dann ist auch g ◦ f bei x0 differenzierbar
und es gilt
D(g ◦ f )(x0 ) = Dg(f (x0 ))Df (x0 ).
Beweis. Es gilt
g(f (x)) = g(f (x0 )) + Dg(f (x0 ))(f (x) − f (x0 )) + o( f (x) − f (x0 ) )
= g(f (x0 )) + Dg(f (x0 ))(Df (x0 )(x − x0 ) + o( x − x0 ))
+ o( Df (x0 )(x − x0 ) + o( x − x0 ) )
= g(f (x0 )) + Dg(f (x0 ))Df (x0 )(x − x0 ) + o( x − x0 ).
Daraus folgt die Behauptung.
90
Richtungsableitungen
Die totale Ableitung Df (x0 ) beschreibt die Funktion lokal in einer kleinen Umgebung von x0 approximativ. Manchmal gen¨
ugt es jedoch zu wissen, wie sich f (x)
entlang einer Richtung v ∈ R ver¨andert: Will man f (x) und f (x0 ) vergleichen,
so gen¨
ugt es die Funktion t → f (x0 + t(x − x0 )) zu untersuchen. Dies f¨
uhrt auf
die folgende Definition:
Definition 5.4 Es sei f = (f1 , . . . , fm )T : U → Rm , x0 ∈ U , v ∈ Rn . Man nennt
Dv f (x0 ) = lim
h→0
h=0
f (x0 + hv) − f (x0 )
d
= f (x0 + tv)
h
dt
t=0
die Richtungsableitung in Richtung (oder entlang) v bei x0 , falls dieser Grenzwert
existiert.
(Beachte, dass x0 + tv ∈ U f¨
ur hinreichend kleine t gilt und nach Beispiel 3
df
von Seite 89 die Ableitung dt komponentenweise zu nehmen ist. Statt Dv f (x0 )
schreibt man auch ∂v f (x0 ).)
Satz 5.5 Ist f : U → Rm differenzierbar bei x0 , so existieren die Richtungsableitungen Dv f (x0 ) entlang v f¨
ur jedes v ∈ Rn . Es gilt
Dv f (x0 ) = Df (x0 )v.
Beweis. F¨
ur x = x0 + tv ist, wenn Df (x0 ) existiert,
f (x) = f (x0 ) + tDf (x0 )v + o(|t|)
und somit
d
f (x0 + tv)
dt
t=0
= Df (x0 )v.
Die Umkehrung muss nicht gelten, wie das folgende Beispiel zeigt. Dieses
Beispiel zeigt dar¨
uber hinaus, dass aus der Existenz aller Richtungsableitungen
noch nicht einmal die Stetigkeit folgt.
Beispiel: Es sei f : R2 → R definiert durch
f (x1 , x2 ) =
x1 x22
x21 +x42
f¨
ur x = 0,
0
f¨
ur x = 0.
Dann existieren alle Richtungsableitungen bei 0, f ist dort aber noch nicht einmal
stetig! F¨
ur jedes v ∈ R2 ist n¨amlich
f (tv1 , tv2 ) =
v1 v22 t
,
v12 +v24 t2
falls v1 = 0,
0,
falls v1 = 0,
91
differenzierbar bei t = 0. Jedoch ist f¨
ur (t2 , t) → (0, 0) mit t → 0
lim
f (t2 , t) = lim
t→0
t→0
t=0
t=0
t4
1
= = 0 = f (0, 0).
4
4
t +t
2
Von besonderem Interesse ist nat¨
urlich die Abh¨angigkeit von f (x1 , . . . , xn )
von den einzelnen Eintr¨agen xi .
Definition 5.6 Es sei f = (f1 , . . . , fm ) : U → Rm , x0 ∈ U . Die Richtungsableitung entlang der i-ten Koordinatenrichtung ei , i = 1, . . . , n,
Di f (x0 ) := Dei f (x0 ) = lim
h→0
h=0
d
f (x0 + hei ) − f (x0 )
= f (x0 + tei )
h
dt
t=0
heißt, falls sie existiert, die i-partielle Ableitung bei x0 .
Existieren alle partielle Ableitungen f¨
ur jedes x0 ∈ U , so nennt man f partiell
differenzierbar.
∂f
Man schreibt auch Di f (x0 ) = Dxi f (x0 ) = ∂i f (x0 ) = ∂xi f (x0 ) = ∂x
(x0 ) =
i
fxi (x0 ) = f,xi (x0 ).
Beispiel: Es sei f : R3 → R gegeben als f (x, y, z) = x + y 2 + sin(xz). Dann ist
Dx f (x, y, z) = 1 + z cos(xz),
∂y f (x, y, z) = 2y,
∂f
(x, y, z) = x cos(xz).
∂z
Die Bedingung, dass alle partiellen Ableitungen bei x0 existieren, ist nat¨
urlich
schw¨acher als die Existenz aller Richtungsableitungen. Das folgende Beispiel
zeigt, dass sie sogar echt schw¨acher ist:
Beispiel: Es sei f : R2 → R definiert durch
f (x, y) =
xy
x4 +y 4
f¨
ur (x, y) = (0, 0),
f¨
ur (x, y) = (0, 0).
0
Dann existieren die partiellen Ableitungen bei (0, 0), denn f ≡ 0 auf den Koordinatenachsen. In der Diagonalenrichtung ist aber
f (t, t) =
t2
1
= 2
4
2t
2t
sogar unbeschr¨ankt nahe 0, also noch nicht einmal stetig, geschweige denn differenzierbar.
Mit Hilfe der partiellen Ableitungen der Komponentenfunktionen l¨asst sich
Df (x0 ) bestimmen. Genauer: Bez¨
uglich der kanonischen Basen auf Rn und Rm
ist Df (x0 ) durch die folgende Matrix aus partiellen Ableitungen gegeben.
92
Satz 5.7 Ist f : U → Rm differenzierbar bei x0 , so gilt


∂1 f1 (x0 ) · · · ∂n f1 (x0 )


..
..
...
Df (x0 ) = 
.
.
.
∂1 fm (x0 ) · · ·
∂n fm (x0 )
ur skaMan nennt (∂j fi (x0 )) 1≤i≤m auch die Jacobimatrix von f bei x0 . Speziell f¨
1≤j≤n
larwertige Funktionen f : U → R schreibt man auch
grad f (x0 ) = ∇f (x0 ) = (∂1 f (x0 ), . . . , ∂n f (x0 ))T .
(Sprich: ‘Gradient von f bei x0 ’ bzw. ‘Nabla-f von x0 ’.)
Beweis. Da f bei x0 differenzierbar ist, existieren dort alle Richtungsableitungen
und insbesondere ist


∂i f1 (x0 )
d


..
Df (x0 )ei = Dei f (x0 ) = f (x0 + tei )
=

.
dt
t=0
∂i fm (x0 )
f¨
ur i = 1, . . . , n nach Satz 5.5 und Beispiel 3 von Seite 89.
Beobachtung: Eine skalarwertige Funktion f : U → R l¨asst sich als ‘H¨ohe u
¨ber
Normal-Null’ einer Landschaft u
ber
U
veranschaulichen.
Ist
f
bei
x
differenzier¨
0
bar, so gibt ∇f (x0 ) gerade die Richtung und den Betrag des steilsten Anstiegs
von x0 aus an: Unter allen Richtungen v ∈ Rn mit v 2 = 1 ist
lim
h→0
h=0
f (x0 + hv) − f (x0 )
= Dv f (x0 ) = ∇f (x0 ) · v
h
genau dann maximal (bzw. minimal), wenn v parallel und gleich (bzw. entge∇f (x0 )
∇f (x0 )
gengesetzt) orientiert zu ∇f (x0 ) ist, also v = ∇f
(bzw. v = − ∇f
)
(x0 ) 2
(x0 ) 2
gilt. In diesem Fall ist der Betrag des Anstiegs (bzw. Abstiegs) ∇f (x0 ) · v gerade
∇f (x0 ) 2 (bzw. − ∇f (x0 ) 2 ).
Die Funktion l¨asst sich auch mit Hilfe der Niveaumengen Nc (f ) = {x ∈
U : f (x) = c}, c ∈ R beschreiben. (F¨
ur n = 2 sind das die ‘H¨ohenlinien der
Landschaft’, auch wenn sie i.A. keine eindimensionalen Linien sein m¨
ussen.) Ist
x ∈ Nc (f ), so gilt f¨
ur jeden differenzierbaren ‘Weg’ γ : (−ε, ε) → U mit γ(0) = x,
der ganz in Nc (f ) verl¨auft, d.h. g(t) ∈ Nc (f ) f¨
ur alle t erf¨
ullt, f ◦ γ = c und somit
0 = (f ◦ γ) (0) = ∇f (x) · γ (t).
In diesem Sinne steht ∇f orthogonal auf Nc (f ).
Um Df (x0 ) zu bestimmen, gen¨
ugt es also, alle partiellen Ableitungen ∂j fi zu
kennen. Wie oben gesehen, ist es jedoch wichtig, darauf zu achten, dass Df (x0 )
auch tas¨achlich existiert! Gl¨
ucklicherweise gibt ein ein gutes hinreichendes Kriterium. Ist f sogar stetig differenzierbar, so sind nach Satz 5.7 auch alle partiellen
Ableitungen stetig. Tats¨achlich gilt sogar die Umkehrung:
93
Satz 5.8 Es sei f : U → Rm partiell differenzierbar mit stetigen partiellen Ableitungen ∂j fi , i = 1, . . . , m, j = 1, . . . , n. Dann ist f stetig differenzierbar.
Beweis. Definiere A(x) ∈ Rm×n durch


∂1 f1 (x) · · · ∂n f1 (x)


..
..
...
A(x) = 
.
.
.
∂1 fm (x) · · · ∂n fm (x)
Da A nach Voraussetzung stetig von x abh¨angt, gen¨
ugt es zu zeigen, dass Df (x)
existiert und gleich A(x) ist, d.h.
f (x + h) = f (x) + A(x)h + o( h
∞)
gilt.
Es sei also x ∈ U und δ > 0 so klein, dass x + h ∈ U sei f¨
ur h ∈ Rn mit
(j)
h ∞ ≤ δ. Setze x := x + (h1 , . . . , hj , 0, . . . 0) und fixiere i ∈ {1, . . . , m}. Der
Mittelwertsatz angewandt auf die Abbildungen t → fi (x(j−1) + tej ) liefert dann
τj zwischen 0 und hj , j = 1, . . . , n, mit
fi (x + h) = fi (x(n) )
= fi (x(n−1) ) + ∂n fi (x(n−1) + τn en )hn
= fi (x(n−2) ) + ∂n−1 fi (x(n−2) + τn−1 en−1 )hn−1 + ∂n fi (x(n−1) + τn en )hn
= ...
n
∂j fi (x(j−1) + τj ej )hj .
= fi (x) +
j=1
Damit ist
n
∂j fi (x(j−1) + τj ej ) − ∂j fi (x) hj
|fi (x + h) − fi (x) − (A(x)h)i | =
j=1
n
≤ h
∂j fi (x(j−1) + τj ej ) − ∂j fi (x) .
∞
j=1
Da die ∂j fi stetig sind und x(j−1) + τj ej − x
tats¨achlich
∞
≤ h
|f (x + h) − f (x) − A(x)h| = o( h
94
∞
∞ ).
ist, folgt f¨
ur h → 0
5.2
Lokale Inverse und implizite Funktionen
In diesem Abschnitt wenden wir uns zwei verwandten Problemen beim L¨osen
nichtlinearer Gleichungen zu. In beiden F¨allen wird es uns gelingen, diese Probleme durch lokale Linearisierung (also Ableiten) auf einfach zu analysierende
Probleme der linearen Algebra zu reduzieren.
Lokale Inverse
Beim ersten Problem geht es darum, f¨
ur eine Funktion f : Rn → Rn , U ⊂ Rn
offen, die Gleichung
f (x) = y,
wenn man f¨
ur ein y0 schon eine L¨osung x0 mit f (x0 ) = y0 kennt, nun auch f¨
ur
y nahe y0 mit x nahe x0 zu l¨osen. M.a.W.: Man m¨ochte f lokal (d.h. in kleinen
Umgebungen von x0 und y0 ) invertieren.
Ist f (x) = Ax + c affin-linear, so geht das nat¨
urlich genau dann, wenn
Df (x0 ) = A invertierbar ist. Da sich nun aber auch differenzierbare nichtlineare
Funktionen f zumindest lokal im Wesentlichen wie eine affine Abbildung verhalten, k¨onnen wir hoffen (und werden wir zeigen), dass f lokal invertierbar ist,
wenn nur die Linearisierung Df (x0 ) invertierbar ist.
Wir untersuchen zun¨achst die Menge
GL(n) := {A ∈ Rn×n : det A = 0}
der invertierbaren Matrizen etwas genauer. Da die Determinante det A einer Matrix A = (aij ) ∈ Rn×n – wie aus der linearen Algebra bekannt – gegeben ist
durch
det A =
sign(π)a1π(1) · . . . · anπ(n) ,
π∈Σn
wobei Σn die Menge der Permutationen auf {1, . . . , n} bezeichnet, ist die Abbildung det : Rn×n → R ja sogar ein Polynom in den Matrixeintr¨agen und damit
differenzierbar. Insbesondere ist die Menge GL(n) = det−1 (R \ {0}) als stetiges
Urbild einer offenen Menge selbst offen.
Daraus ergibt sich, dass der Prozess des Invertierens einer Matrix selbst differenzierbar ist:
Lemma 5.9 Die Abbildung Inv : GL(n) → Rn×n , A → A−1 ist differenzierbar.
Beweis. Wir erinnern zun¨achst an den Begriff der Kofaktormatrix aus der linearen
Algebra. Ist A ∈ Rn×n und bezeichnet man mit A(i, j) ∈ R(n−1)×(n−1) diejenige
Matrix, die dadurch entsteht, dass man die i-te Zeile und die j-te Spalte in A
streicht, so ist die Kofaktormatrix cof A definiert als die n × n-Matrix mit den
Eintr¨agen
(cof A)ij = (−1)i+j det A(i, j).
95
In der linearen Algebra zeigt man (‘Cramersche Regel’), dass
det A Id = AT cof A = A(cof A)T
gilt, wobei hier und im Folgenden Id (oder auch Idn ) die n × n-Einheitsmatix
bezeichnet. Damit ist A−1 = det1 A (cof A)T stetig nach A differenzierbar.
Lemma 5.10 Es seien V, W ⊂ Rn offen, f : V → W bijektiv und sowohl f als
auch f −1 differenzierbar. Dann gilt
Df −1 (f (x)) = (Df (x))−1
f¨
ur alle x ∈ V .
Beweis. Wir bezeichnen die identische Abbildung auf V mit idV . Wegen f −1 ◦f =
idV ist nach der Kettenregel
Id = Df −1 (f (x))Df (x)
und damit Df −1 (f (x)) die Inverse von Df (x).
Bemerkung: Differenzierbare Funktionen mit differenzierbarer Inverser kann es
nur auf offenen Mengen der gleichen Dimension geben: Sind f¨
ur eine solche Funktion f : V → W die Mengen V offen in Rn , W offen im Rm , so folgt wie im
gerade gef¨
uhrten Beweis aus f −1 ◦ f = idV und f ◦ f −1 = idW
Df −1 (y)Df (x) = Idn
und
Df (x)Df −1 (y) = Idm
f¨
ur f (x) = y, so dass m = n ist. (Das gilt sogar schon, wenn nur f und f −1 stetig
sind, was jedoch wesentlich schwieriger zu beweisen ist.)
Definition 5.11 Es seien V, W ⊂ Rn offen und f : V → W bijektiv. Sind
sowohl f als auch die Umkehrung f −1 stetig differenzierbar, so nennt man f
einen (C 1 -)Diffeomorphismus. Sind f und f −1 nur stetig, so nennt man f einen
Hom¨oomorphismus.
Das folgende Lemma zeigt, dass unter der sich aus Lemma 5.10 ergebenden
notwendigen Bedingung die Inverse eines stetig differenzierbaren Hom¨oomorphismus wieder stetig differenzierbar ist.
Lemma 5.12 Es seien V, W ⊂ Rn offen, f : V → W ein stetig differenzierbarer
Hom¨oomorphismus, so dass alle Ableitungen Df (x) ∈ L(Rn ; Rn ) invertierbar
sind. Dann ist f sogar ein Diffeomorphismus.
96
Beweis. Fixiere x0 ∈ V, y0 = f (x0 ) ∈ W . Da Df (x0 ) invertierbar ist, gilt
x − x0 − (Df (x0 ))−1 (f (x) − f (x0 ))
= (Df (x0 ))−1 f (x) − f (x0 ) − Df (x0 )(x − x0 )
≤ (Df (x0 ))−1
L(Rn ;Rn )
f (x) − f (x0 ) − Df (x0 )(x − x0 ) .
(Vgl. die Bemerkung 3 auf Seite 90 f¨
ur die letzte Absch¨atzung.) Des Weiteren ist
f¨
ur x hinreichend nahe an x0
f (x) − f (x0 ) = Df (x0 )(x − x0 ) + o( x − x0 ) ≥ c x − x0
f¨
ur eine Konstante c > 0. Auf dem Kompaktum ∂B1 (0) n¨amlich nimmt v →
Df (x0 )v sein Minimum 2c > 0 an, so dass f¨
ur alle v ∈ Rn folgt Df (x0 )v +
o( v ) ≥ 2c v + o( v ) ≥ c v , Letzteres f¨
ur v klein genug.
Setzt man nun y = f (x), so zeigen diese Absch¨atzungen
−1
f −1 (y) − f −1 (y0 ) − (Df (f −1 (y0 ))) (y − y0 )
y − y0
−1
(Df (x0 ))
x − x0
L(Rn ;Rn ) f (x) − f (x0 ) − Df (x0 )(x − x0 )
≤
·
x − x0
f (x) − f (x0 )
→0
mit y → y0 und damit x → x0 . Dies zeigt, dass Df −1 (y0 ) existiert und durch
−1
Df −1 (y0 ) = (Df (f −1 (y0 ))) gegeben ist.
Nach Lemma 5.9 schließlich ist dann
Df −1 = Inv ◦Df ◦ f −1
auch stetig.
Wir kommen nun zum Hauptresultat dieses Abschnitts: dem Satz von der
lokalen Inversen.
Satz 5.13 Es sei U ⊂ Rn offen, x0 ∈ U , f ∈ C 1 (U ; Rn ), so dass Df (x0 ) invertierbar ist. Dann gibt es eine offene Umgebung V ⊂ U von x0 derart, dass
W := f (V ) eine offene Umgebung von f (x0 ) ist und f |V : V → W ein Diffeomorphismus ist.
Das heißt: Aus der Umkehrbarkeit des Differentials Df (x0 ) folgt die lokale
Umkehrbarkeit von f selbst.
Beweis. Zuerst u
¨berlegen wir uns, dass wir o.B.d.A. x0 = 0, f (x0 ) = 0 und
Df (x0 ) = Id annehmen d¨
urfen: F¨
ur jedes allgemeine f erf¨
ullt die Abbildung
−1
˜
˜
f (x) := (Df (x0 )) (f (x+x0 )−f (x0 )) die Bedingungen f (0) = 0 und Df˜(0) = Id
97
˜ Nullumgebungen, so dass f˜ : V˜ → W
˜ ein Diffeo(Kettenregel!). Sind dann V˜ , W
morphisums ist, so ist f mit f (x) = Df (x0 )f˜(x−x0 )+f (x0 ) ein Diffeomorphismus
˜.
von V = x0 + V˜ nach W = f (x0 ) + Df (x0 )W
n
Wir versehen den R mit der Maximumsnorm · := · ∞ .
Um f umzukehren, suchen wir f¨
ur gegebenes y mit Ty : U → Rn eine L¨osung
x der Fixpunktgleichung
x = Ty (x) := y + x − f (x).
Da Df stetig ist, k¨onnen wir ε > 0 so klein w¨ahlen, dass
x ≤ ε =⇒
Id −Df (x)
L(Rn ;Rn )
≤
1
2
gilt. Damit gilt dann f¨
ur alle x, x ∈ B ε (0)
Ty (x ) − Ty (x) = x − f (x ) − (x − f (x))
1
=
0
1
≤
d
(1 − t)x + tx − f ((1 − t)x + tx ) dt
dt
x − x − Df ((1 − t)x + tx )(x − x) dt
0
≤ sup
Id −Df ((1 − t)x + tx )
L(Rn ;Rn )
x −x
t∈[0,1]
≤
1
x −x .
2
Dies zeigt, dass Ty eine Kontraktion ist. Setzt man x = 0 in dieser Absch¨atzung,
ergibt sich
1
Ty (x) ≤ y − Ty (x) + y ≤ x + y ,
2
so dass Ty f¨
ur y ≤ 2ε die Kugel B ε (0) in sich abbildet.
Der Banachsche Fixpunktsatz f¨
ur Ty : B ε (0) → B ε (0) liefert nun, dass f¨
ur
jedes y mit y ≤ 2ε genau ein x ∈ B ε (0) existiert, so dass f (x) = y gilt. F¨
ur
dieses x gilt nach der letzten Gleichung
x ≤
1
x + y
2
=⇒
x ≤2 y .
Wir setzen daher
W := Bε/2 (0)
V = f −1 (W ) ∩ Bε (0).
und
W ist offen und damit, da f stetig ist, auch V . Da x ∈ B ε eindeutig durch y
gegeben ist, ist f |V : V → W injektiv und da mit y < 2ε auch x ≤ 2 y < ε
gilt, ist f |V tats¨achlich auch surjektiv.
98
Mit V ⊂ Bε (0) ist Id −Df L(Rn ;Rn ) ≤ 12 auf V und daher Df auf V invertierbar. (Sonst g¨abe es ein v ∈ ∂B1 (0) mit Df (x)v = 0 und daher (Id −Df (x))v =
v = 1 > 21 .) Schließlich ist auch (f |V )−1 : W → V stetig: Mit der Absch¨atzung
von oben folgt f¨
ur y, y ∈ W mit y = f (x), y = f (x ), x, x ∈ V , n¨amlich
x−x
= T0 (x) + f (x) − T0 (x ) − f (x )
≤ T0 (x) − T0 (x ) + f (x) − f (x )
1
≤ x − x + f (x) − f (x )
2
und daher
(f |V )−1 (y) − (f |V )−1 (y ) ≤ 2 y − y .
Die Behauptung folgt nun aus Lemma 5.12.
Beispiel: Insbesondere in zwei und drei Dimensionen definiert man Polarkoordinaten durch die folgenden Transformationen: Die Abbildungen
Φ : (0, ∞) × (−π, π) → R2 \ ((−∞, 0] × {0}),
(r, φ) →
r cos φ
r sin φ
und

Ψ : (0, ∞)×(−π, π)×(0, π) → R3 \((−∞, 0]×R×{0}),

r sin θ cos φ
(r, φ, θ) →  r sin θ sin φ 
r cos θ
sind Diffeomorphismen.
Tats¨achlich u
¨berzeugt man sich leicht davon, dass Φ und Ψ bijektiv und differenzierbar sind. Anstelle die Umkehrfunktionen – was auch m¨oglich w¨are –
explizit zu bestimmen, argumentieren wir nun mit Satz 5.13: Da
det DΦ(r, φ) = r = 0 und
det DΨ(r, φ, θ) = −r sin θ = 0
gilt, ist f u
¨berall lokal glatt invertierbar und damit f −1 , deren gobale Existenz
ja schon gesichert ist, stetig differenzierbar.
Implizite Funktionen
In diesem Paragraphen diskutieren wir ein verwandtes Problem beim L¨osen von
nichtlinearen Gleichungen. Es sei eine Funktion f : Rn × Rm → Rm gegeben und
f¨
ur jedes x ∈ Rn ein y ∈ Rm gesucht, so dass
f (x, y) = 0
gilt. (x spielt also die Rolle eines Parameters.) Setzt man wieder voraus, eine
L¨osung y0 zu x0 mit f (x0 , y0 ) = 0 schon zu kennen, so m¨ochte man m¨oglichst
99
eine Funktion x → y(x) definieren, die – zumindest in geeigneten Umgebungen
von x0 und y0 – alle L¨osungen f (x, y(x)) = 0 dieser Gleichung angibt.
Beispiel: Ist f : R2 → R, f (x, y) = x2 + y 2 − 1, k¨onnen wir nach y durch
√
y(x) = ± 1 − x2
aufl¨osen, wenn |x| ≤ 1 ist. Es sei nun f (x0 , y0 ) = 0. Ist |x0 | < 1, so gibt es f¨
ur
hinreichend kleine Umgebungen V von x0 und W von y0 sogar eine eindeutige
L¨osung mit y(x) ∈ W f¨
ur x ∈ V . Ist dagegen |x0 | = 1 und also y0 = 0, so gibt
es gar keine L¨osungen f¨
ur |x| > |x0 | und keine eindeutige nahe y0 f¨
ur |x| < |x0 |.
Das Problem hier bei |x0 | = 1 ist, dass dort ∂y f (x0 , y0 ) = 0 ist und daher die
Nullstellenmenge {(x, y) ∈ R2 : f (x, y) = 0} ‘unendlich steil’ in (x0 , y0 ) einlaufen
kann.
Wir betrachten nun Funktionen f ∈ C 1 (U ; Rm ), U ⊂ Rn × Rm offen. Dabei
bezeichnen wir die Variablen aus Rn mit x = (x1 , . . . , xn ) und die aus Rm mit
y = (y1 , . . . , ym ), so dass wir


f1 (x1 , . . . , xn , y1 , . . . , ym )


..
f (x, y) = f (x1 , . . . , xn , y1 , . . . , ym ) = 

.
fm (x1 , . . . , xn , y1 , . . . , ym )
schreiben. Die Ableitungen nach x und y schreiben wir als


∂x1 f1 (x, y) · · · ∂xn f1 (x, y)


..
..
n
m
..
Dx f (x, y) = 
 ∈ L(R ; R ),
.
.
.
∂x1 fm (x, y) · · · ∂xn fm (x, y)


∂y1 f1 (x, y) · · · ∂ym f1 (x, y)


..
..
m
m
..
Dy f (x, y) = 
 ∈ L(R ; R ),
.
.
.
∂y1 fm (x, y) · · · ∂ym fm (x, y)
so dass sich in Blockschreibweise
Df (x, y) = Dx f (x, y) Dy f (x, y) ∈ L(Rn+m ; Rm )
ergibt.
Zur Motivation betrachten wir den affin-linearen Fall f (x) = Ax + c, A =
Ax Ay ∈ R(n+m)×m , c ∈ Rm : Genau dann gibt es zu jedem x ∈ Rn ein (sogar
genau ein) y mit
A
x
+ c = Ax x + Ay y + c = 0 ⇐⇒ Ay y = −Ax x − c,
y
100
wenn Ay invertierbar ist. Es gilt dann
y = −A−1
y (Ax x + c) .
Im nichtlinearen Fall lautet der wesentliche Satz u
¨ber implizite Funktionen,
der auch noch eine Formel f¨
ur die Ableitung von y angibt:
Satz 5.14 Es seien f ∈ C 1 (U ; Rm ), U ⊂ Rn × Rm offen, (x0 , y0 ) ∈ U mit
f (x0 , y0 ) = 0. Ist Dy f (x0 , y0 ) invertierbar, so gibt es eine offene Umgebung V
von x0 , eine offene Umgebung W von y0 und eine C 1 -Funktion g : V → W , so
dass f¨
ur alle (x, y) ∈ V × W
f (x, y) = 0 ⇐⇒ y = g(x)
gilt und Dg gegeben ist durch
Dg(x) = − Dy f (x, g(x))
−1
Dx f (x, g(x))
f¨
ur x ∈ V .
Beweis. Wir betrachten die Hilfsfunktion F : U → Rn × Rm , definiert durch
F (x, y) := (x, f (x, y)). Dann ist (in Blockschreibweise)
DF (x0 , y0 ) =
Idn
0
Dx f (x0 , y0 ) Dy f (x0 , y0 )
∈ L(Rn × Rm ; Rn × Rm )
invertierbar, denn det DF (x0 , y0 ) = det Idn · det Dy f (x0 , y0 ) = det Dy f (x0 , y0 ) =
˜ ⊂
0. Nach dem Satz von der lokalen Inversen 5.13 gibt es also Umgebungen V˜ , W
˜ ein DiffeomorRn × Rm von (x0 , y0 ) bzw. F (x0 , y0 ) = (x0 , 0), so dass F : V˜ → W
phismus ist.
Schreiben wir F −1 (x, y) = (G1 (x, y), G2 (x, y)) ∈ Rn ×Rm , so gilt G1 (x, y) = x,
˜ ). F¨
G2 ∈ C 1 (W
ur alle (x, y) ∈ V˜ ist außerdem
f (x, y) = 0 ⇐⇒ F (x, y) = (x, 0) ⇐⇒ (x, y) = F −1 (x, 0) ⇐⇒ G2 (x, 0) = y.
Wir w¨ahlen nun die Umgebungen V ⊂ Rn und W ⊂ Rm von x0 bzw. y0 so klein,
dass erstens V × W ⊂ V˜ und zweitens G2 (x, 0) ⊂ W f¨
ur alle x ∈ V gilt. Letzteres
k¨onnen wir aufgrund der Stetigkeit von G2 und G2 (x0 , 0) = y0 erreichen. Setzt
man nun
g : V → W,
g(x) = G2 (x, 0),
so ist tats¨achlich g ∈ C 1 (V ; W ) und es gilt
f (x, y) = 0 ⇐⇒ G2 (x, 0) = y ⇐⇒ y = g(x)
f¨
ur (x, y) ∈ V × W ⊂ V˜ .
101
Da f (x, g(x)) = 0 f¨
ur alle x ∈ V ist, folgt außerdem aus der Kettenregel f¨
ur
f ◦ ϕ mit ϕ(x) =
x
g(x)
0 = D f (x, g(x)) = Df (x, g(x))
Idn
Dg(x)
= Dx f (x, g(x)) + Dy f (x, g(x))Dg(x)
und damit, weil DF (x, y) und somit Dy f (x, y) f¨
ur (x, y) ∈ V˜ invertierbar ist,
Dg(x) = − Dy f (x, g(x))
5.3
−1
Dx f (x, g(x)).
H¨
ohere Ableitungen
Auch im Mehrdimensionalen kann man Ableitungen h¨oherer Ordnung ganz einfach iterativ definieren. Schon die zweite Ableitung D2 f einer Funktion f : U →
Rm ist jedoch ein wenig unanschaulich: Mit Df : U → L(Rn ; Rm ) ist dann ja
D2 f : U → L(Rn ; L(Rn ; Rm )).
Da es keinen extra Aufwand macht, geben wir die folgende Definition gleich
auf allgemeinen normierten R¨aumen an, wobei im Folgenden insbesondere der
Fall X = Rn und Y = Rm von Interesse ist.
Definition 5.15 F¨
ur normierte R¨aume (X, · X ), (Y, ·
L(X; Y ) und Lk+1 (X; Y ) := L(X; Lk (X; Y )) f¨
ur k ∈ N.
Es sei nun f : U → Y eine Funktion, U ⊂ X offen.
Y)
sei L1 (X; Y ) :=
(i) F¨
ur k ∈ N, k ≥ 2 definieren wir iterativ die k-te Aleitung bei x0 ∈ U als
Dk f (x0 ) = D(Dk−1 f )(x0 ) ∈ L(X; Lk−1 (X; Y )) = Lk (X; Y ),
falls Dk−1 : U → Lk−1 (X; Y ) bei x0 differenzierbar ist.
(ii) Existiert Dk f (x0 ) f¨
ur alle x0 ∈ U , so sagen wir, f sei k-mal differenzierbar,
und nennen die Abbildung Dk : U → Lk (X; Y ) die k-te Ableitung von f .
(iii) Ist Dk f stetig, so sagen wir, f ist k-mal stetig differenzierbar.
Da die R¨aume Lk (X; Y ) f¨
ur X = Rn , Y = Rm zwar zu einem RNk isomorph,
zun¨achst aber nat¨
urlicherweise nur als normierte R¨aume gegeben sind, ist es
konzeptionell in der Tat einfacher, die Ableitung – wie hier geschehen – gleich
auf allgemeinen normierten R¨aumen zu definieren.
Wir erinnern daran, dass die Norm auf R¨aumen von linearen Abbildungen
zwischen normierten R¨aumen – und damit auf allen Lk (X; Y ) – gegeben ist durch
die Operatornorm, hier
A
Lk (X;Y )
= sup{ Ax
Lk−1 (X;Y )
102
: x ∈ X, x
X
= 1}.
Da die R¨aume Lk (X; Y ) so unanschaulich sind, werden wir nun kurz zeigen,
dass sie zu den wesentlich anschaulicheren und besser zu handhabenden R¨aumen
Mk (X; Y ) (s.u.) von multilinearen Abbildungen X k → Y isometrisch isomorph
sind: Es existieren nat¨
urlich gegebene normerhaltende Vektorraumisomorphismen Φk : Lk (X; Y ) → Mk (X; Y ). In diesem Sinne handelt es sich bei h¨oheren
Ableitungen also einfach um multilineare Abbildungen.
Wir ben¨otigen zun¨achst eine kleine Vor¨
uberlegung:
Lemma und Definition 5.16 Es seien (X, · X ), (Y, · Y ) normierte R¨aume,
k ∈ N. Eine multilineare Abbildung A : X k → Y , also eine in jeder Komponente
lineare Abbildung A : X k → Y , ist stetig (bzgl. der Produktmetrik auf X k ) genau
dann, wenn
A
Mk (X;Y )
:= sup{ A(x1 , . . . , xk )
Y
: x1
X, . . . ,
xk
X
= 1} < ∞
ist.
Wir setzen
Mk (X; Y ) := {A : X k → Y : A ist multilinear und stetig}.
·
Mk (X;Y )
definiert dann eine Norm auf Mk (X; Y ).
Dieses Lemma ist die Verallgemeinerung von Satz 4.29 auf multilineare Abbildungen. Wie dort wird der Beweis zeigen, dass die Stetigkeit von A sogar zur
Stetigkeit von A im Nullpunkt ¨aquivalent ist.
Beweis. Dass · Mk (X;Y ) tats¨achlich eine Norm auf Mk (X; Y ) definiert, ist einfach.
¨
(Ubung!)
Ist A stetig, so ist A insbesondere bei 0 stetig und wegen A(0) = 0 gibt es zu
ε = 1 ein δ > 0 mit
max{ x1
X, . . . ,
xn
X}
≤ δ =⇒ A(x1 , . . . , xk )
Damit folgt f¨
ur alle x1 , . . . , xk mit x1
A(x1 , . . . , xk )
Y
X, . . . ,
xk
X
Y
≤ 1.
= 1:
= δ −k A(δx1 , . . . , δxk )
Y
≤1
und also A Mk (X;Y ) ≤ δ −k .
(m)
(m)
Es sei nun umgekehrt A Mk (X;Y ) < ∞ vorausgesetzt, x(m) = (x1 , . . . , xk ) ∈
(m)
X k mit x(m) → x = (x1 , . . . , xk ) ∈ X k , also xi → xi f¨
ur alle i = 1, . . . , k. Dann
ist (Teleskopsumme!)
k
(m)
A(x(m) ) − A(x) =
(m)
(m)
A(x1 , . . . , xi−1 , xi , xi+1 , . . . , xk )
i=1
(m)
(m)
− A(x1 , . . . , xi−1 , xi , xi+1 . . . , xk )
k
(m)
=
(m)
(m)
A(x1 , . . . , xi−1 , xi
i=1
103
− xi , xi+1 , . . . , xk )
und damit
A(x(m) ) − A(x)
Y
k
≤
A
(m)
Mk (X;Y )
x1
(m)
X
· . . . · xi−1
(m)
X
xi
− xi
X
xi+1
· . . . · xk
X
X
i=1
→ 0,
wobei wir ausgenutzt haben, dass f¨
ur (z1 , . . . , zk ) ∈ X k gilt
A(z1 , . . . , zk )
Y
≤ A
Mk (X;Y )
z1
X
· . . . · zk
X.
Dies ist klar, wenn nur ein zi = 0 ist; ansonsten folgt es aus
z1
z1
,...,
z1 X · . . . · zk
A(z1 , . . . , zk ) Y = A
z1 X
z1 X Y
X.
Lemma 5.17 Die R¨aume (Lk (X; Y ), · Lk (X;Y ) ) und (Mk (X; Y ), · Mk (X;Y ) )
sind isometrisch isomorph, d.h. es gibt einen Vektorraumisomorphismmus Φk :
Lk (X; Y ) → Mk (X; Y ) mit Φk A Mk (X;Y ) = A Lk (X;Y ) f¨
ur alle A ∈ Lk (X; Y ).
Beweis. F¨
ur k = 1 ist sogar
(L1 (X; Y ), ·
L1 (X;Y ) )
= (M1 (X; Y ), ·
M1 (X;Y ) ),
so dass Φ1 einfach die identische Abbildung ist. F¨
ur k = 2 wird durch
(Ax1 )x2 = B(x1 , x2 )
∀x1 , x2 ∈ X
und allgemein f¨
ur k ≥ 2 durch
(. . . ((Ax1 )x2 ) . . .)xk = B(x1 , . . . , xk )
ein normerhaltender Isomorphismus Φk zwischen Elementen A ∈ Lk (X; Y ) und
B ∈ Mk (X; Y ) definiert, denn
B
Mk (X;Y )
= sup
(. . . ((Ax1 )x2 ) . . .)xk
Y
= sup (. . . ((Ax1 )x2 ) . . .)xk−1
= ...
= A Lk (X;Y ) .
: x1
X
L1 (X;Y )
= . . . = xk
: x1
X
X
=1
= . . . = xk−1
X
=1
Wir beschr¨anken uns nun wieder auf den Fall X = Rn , Y = Rm . Lemma 5.17
und insbesondere die in dessen Beweis konstruierten Isomorphismen Φk erlauben
es uns, von nun an die k-te Ableitung als die multilineare Abbildung
(Rn )k → Rm ,
(v1 , . . . , vk ) → Φk (Dk f (x0 ))(x1 , . . . , xk )
104
aufzufassen, f¨
ur die wir k¨
unftig einfach wieder Dk f (x0 ) schreiben.
Expliziter ist diese multilineare Abbildung als iterierte Richtungsableitung
gegeben:
Satz 5.18 Ist f k-mal differenzierbar, so existieren alle Richtungsableitungen
der Ordnung k und es gilt
Dk f (x)(v1 , . . . , vk ) = ∂v1 · · · ∂vk f (x)
f¨
ur alle x ∈ U und v1 , . . . , vk ∈ Rn .
Beweis. Das ist klar f¨
ur k = 1 nach Satz 5.5. F¨
ur k ≥ 2 folgt induktiv aus
∂v2 · · · ∂vk f (x) = Dk−1 f (x)(v2 , . . . , vk )
durch Differentiation entlang v1 wieder nach Satz 5.5
∂v1 ∂v2 · · · ∂vk f (x) = ∂v1 Dk−1 f (x)(v2 , . . . , vk )
= D Dk−1 f (x)(v2 , . . . , vk ) v1
= Dk f (x)(v1 , . . . , vk ),
wobei wir im letzten Schritt ausgenutzt haben, dass
Dk−1 f (x + h) = Dk−1 f (x) + Dk f (x)h + o( h )
insbesondere
Dk−1 f (x+h)(v2 , . . . , vk ) = Dk−1 f (x)(v2 , . . . , vk )+(Dk f (x)h)(v2 , . . . , vk )+o( h )
impliziert, so dass also
D Dk−1 f (x)(v2 , . . . , vk ) v1 = (Dk f (x)v1 )(v2 , . . . , vk ) = Dk f (x)(v1 , . . . , vk )
gilt.
Da eine multilineare Abbildung A ∈ Mk ((Rn )k ; Rm ) schon durch ihr Wirken
auf alle k-Tupel von kanonischen Einheitsvektoren eindeutig bestimmt ist, legen
nach Satz 5.18 schon die iterierten partiellen Ableitungen
Dk f (x)(ej1 , . . . , ejk ) = ∂j1 · · · ∂jk f (x).
f¨
ur alle j1 , . . . , jk = 1, . . . , n die Ableitung Dk f (x), falls existent, fest. F¨
ur v1 , . . . , vk ∈
Rn mit vi = nj=1 vij ej , vij ∈ R, ist dann ja
n
k
Df (x0 )(ej1 , . . . ejk )v1j1 · · · vkjk
D f (x0 )(v1 , . . . , vk ) =
j1 ,...,jk =1
n
(5.1)
∂j1 · · · ∂jk f (x0 )v1j1 · · · vkjk .
=
j1 ,...,jk =1
Allgemeiner definiert man induktiv:
105
Definition 5.19 f : U → Rm heißt k-mal partiell differenzierbar, k ≥ 2, wenn
alle partiellen Ableitungen ∂i1 · · · ∂ik−1 f der Ordnung k − 1 existieren und partiell
differenzierbar sind.
Aus (5.1) ergibt sich, dass Dk f : U → Mk ((Rn )k ; Rm ) genau dann stetig ist,
wenn alle k-fachen partiellen Ableitungen ∂i1 · · · ∂ik f stetig sind. Wie im Falle
k = 1 sieht man außerdem:
Satz 5.20 f : U → Rm , x → (f1 (x), . . . , fm (x)) ist genau dann k-mal stetig
differenzierbar, wenn alle fi k-mal partiell differenzierbar sind und alle partiellen
Ableitungen der Ordnung k stetig sind.
Beweis.1 Zun¨achst ist klar, dass wegen


∂j1 · · · ∂jk f1 (x)


..
∂j1 · · · ∂jk f (x) = 

.
∂j1 · · · ∂jk fm (x)
(vgl. Beispiel 3 auf Seite 89) genau dann alle fi stetig partiell differenzierbar sind,
wenn f dies ist.
=⇒: Das folgt direkt aus Satz 5.18 und Gleichung (5.1).
⇐=: Der Fall k = 1 folgt aus Satz 5.8. Es sei nun die Behauptung f¨
ur k − 1
schon gezeigt und f k-mal partiell differenzierbar mit stetigen partiellen Ableitungen. Nach (5.1) ist dann f¨
ur jede Wahl von j1 , . . . , jk ∈ {1, . . . , n} und zugeh¨origen
Standard-Einheitsvektoren ej1 , . . . , ejk
Dk−1 f (x)(ej1 , . . . , ejk−1 ) = ∂j1 · · · ∂jk−1 f (x)
f¨
ur jedes i nach xi stetig differenzierbar. Es existiert also ein Fehlerterm rj1 ...jk (h)
mit limh→0 |h|−1 rj1 ...jk (h) = 0, so dass
Dk−1 f (x + hei )(ej1 , . . . , ejk−1 )
= Dk−1 f (x)(ej1 , . . . , ejk−1 ) + ∂i ∂j1 · · · ∂jk−1 f (x)h + rj1 ...jk (h)
gilt.
F¨
ur Vektoren v1 , . . . , vk−1 ∈ Rn mit v1 ∞ = . . . = vk−1 ∞ gilt dann vi =
n
j=1 vij ej mit Komponenten |vij | ≤ 1. Multiplikation mit v1j1 · · · vk−1jk−1 und
Summation u
uhrt nun auf
¨ber alle m¨oglichen Auswahlen von Indizes f¨
Dk−1 f (x + hei )(v1 , . . . , vk−1 ) − Dk−1 f (x)(v1 , . . . , vk−1 )
n
−
∂i ∂j1 · · · ∂jk−1 f (x)h v1j1 · · · vk−1jk−1 ≤ R(h)
j1 ,...,jk−1 =1
1
Bonusmaterial. Der Beweis wurde in der VL nicht behandelt.
106
mit limh→0 |h|−1 R(h) = 0, da diese Summe endlich ist. Geht man nun auf der
linken Seite zum Supremum u
¨ber all diese v1 , . . . , vk−1 u
¨ber, zeigt sich, dass
k−1
∂i D f (x) existiert und, gegeben durch
n
∂i D
k−1
∂i ∂j1 · · · ∂jk−1 f (x)h v1j1 · · · vk−1jk−1 ,
f (x)(v1 , . . . , vk−1 ) =
j1 ,...,jk−1 =1
stetig von x abh¨angt. Wieder nach Satz 5.8 ist daher Dk−1 f stetig differenzierbar.
Bemerkung: Dieser Satz erlaubt es, eine Funktion f : U → Rm als k-mal stetig
differenzierbar zu erkennen, ohne auf den eigentlichen Begriff der h¨oheren Ableitung aus Definition 5.15 zur¨
uckzugreifen, und die Ableitung sogar explizit durch
partielle Ableitungen zu bestimmen: f ist genau dann k-mal stetig differenzierbar, wenn alle partiellen Ableitungen ∂j1 · · · ∂jk fi (x) existieren und stetig sind.
Die Ableitung Dk f ist dann durch (5.1) gegeben.
Definition 5.21 Ist f : U → Rm k-mal stetig differenzierbar, so schreiben wir
f ∈ C k (U ; Rm ). Ist f k-mal stetig differenzierbar f¨
ur jedes k ∈ N, so schreiben
∞
m
wir f ∈ C (U ; R ).
Beispiel: Da die Determinantenabbildung det : Rn×n → R als Polynom in den
Matrixeintr¨agen C ∞ -glatt ist, zeigt der Beweis von Lemma 5.9, dass die Invertierungsabbildung Inv : GL(n) → Rn×n auch C ∞ -glatt ist.
Bemerkungen:
1. Insbesondere ist f¨
ur einen Diffeomorphismus f ∈ C k (U ; Rn ) (k ∈ N ∪ {∞})
auch f −1 ∈ C k (f (U ); Rn ). Nach Lemma 5.10 ist n¨amlich Df = Inv ◦ Df ◦
f −1 , woraus die Behauptung durch Induktion nach k folgt. Man nennt f
daher in diesem Fall auch einen C k -Diffeomorphismus.
2. Des Weiteren ergibt sich, dass unter den Voraussetzungen des Satzes 5.14
u
¨ber implizite Funktionen die Abbildung g ∈ C k (V ; Rm ) ist, wenn f ∈
C k (U ; Rn+m ) ist. Dies folgt aus der Formel f¨
ur Dg mit Induktion nach k.
Der wichtige Satz von Schwarz besagt nun, dass es beim partiellen Ableiten
nicht auf die Reihenfolge ankommt, wenn die partiellen Ableitungen stetig sind:
Satz 5.22 Es sei f ∈ C 2 (U ; Rm ). Dann gilt
∂i ∂j f = ∂j ∂i f
f¨
ur alle i, j = 1, . . . , n.
107
Beweis. Indem wir komponentenweise argumentieren und f auf die von ei = ej
aufgespannte Ebene (der Fall i = j ist trivial) einschr¨anken, d¨
urfen wir o.B.d.A.
m = 1, n = 2 und i = 1, j = 2 annehmen. Um die Gleichheit bei x ∈ U
(R2 , · ∞ )
nachzupr¨
ufen, w¨ahlen wir δ > 0 so klein, dass Bδ
(x) ⊂ U . Durch etwaige
Verschiebung k¨onnen wir außerdem x = 0 voraussetzen.
Betrachte nun f¨
ur h ∞ < δ die Differenzen
∆1 f (x2 ) = f (h1 , x2 ) − f (0, x2 ),
∆2 f (x1 ) = f (x1 , h2 ) − f (x1 , 0)
und die zweiten Differenzen
∆2 ∆1 f := ∆1 f (h2 ) − ∆1 f (0)
= f (h1 , h2 ) − f (0, h2 ) − f (h1 , 0) − f (0, 0)
= f (h1 , h2 ) − f (h1 , 0) − f (0, h2 ) − f (0, 0)
= ∆2 f (h1 ) − ∆2 f (0)
=: ∆1 ∆2 f.
Nach dem eindimensionalen Mittelwertsatz existieren nun ξ1 , ξ2 ∈ R mit |ξ1 | ≤
|h1 |, |ξ2 | ≤ |h2 | und
d∆1 f
(ξ2 )h2
dx2
= ∂2 f (h1 , ξ2 ) − ∂2 f (0, ξ2 )
∆2 ∆1 f =
= ∂1 ∂2 f (ξ1 , ξ2 ) h1 h2 .
Ganz analog ergeben sich ξ1 , ξ2 ∈ R mit |ξ1 | ≤ |h1 |, |ξ2 | ≤ |h2 | und
∆1 ∆2 f = ∂2 ∂1 f (ξ1 , ξ2 ) h1 h2 .
Es gilt also
∂1 ∂2 f (ξ1 , ξ2 ) = ∂2 ∂1 f (ξ1 , ξ2 ).
Mit h → 0 folgt nun erstens (ξ1 , ξ2 ), (ξ1 , ξ2 ) → 0 und damit zweitens aus der
Stetigkeit der partiellen Ableitungen schließlich
∂1 ∂2 f (0) = ∂2 ∂1 f (0).
Bemerkung: Induktiv ergibt sich daraus, dass f¨
ur f ∈ C k (U ; Rm ) alle partiellen
Ableitungen bis zur Ordnung k kommutieren.
Ohne Stetigkeit der zweiten partiellen Ableitungen muss dieser Satz nicht
gelten:
108
Beispiel: Die Funktion f : R2 → R,
f (x, y) =
x3 y−xy 3
x2 +y 2
0
f¨
ur (x, y) = (0, 0),
f¨
ur (x, y) = (0, 0)
hat partielle Ableitungen ∂x ∂y f und ∂y ∂x f auf ganz R2 , die sich am Nullpunkt
¨
unterscheiden. (Ubung!)
Wir schließen diesen Abschnitt mit dem besonders wichtigen Fall der skalarwertigen Funktionen und ihren Ableitungen bis zur zweiten Ordnung:
Beispiel: Es sei f ∈ C 2 (U ; R). Dann ist, wie oben gesehen, Df : U → L(Rn ; R) =
(Rn )∗ , also bei x ∈ U der Zeilenvektor
Df (x) = (∂1 f (x), . . . , ∂n f (x)).
Die zweite Ableitung D2 f : U → M2 (Rn ; R) ist dann bei x ∈ U die Bilinearform
n
2
D f (x)(v, w) =
∂i ∂j f (x)vi wj .
i,j=1
Die n × n-Matrix


∂1 ∂1 f (x) · · · ∂n ∂1 f (x)


..
..
..
Hf (x) := 
 = (∂j ∂i f (x))1≤i,j≤n
.
.
.
∂1 ∂n f (x) · · · ∂n ∂n f (x)
nennt man die Hesse-Matrix von f bei x. Mit Hilfe dieser Matrix l¨asst sich dann
schreiben:
D2 f (x)(v, w) = v T Hf (x)w.
Hf (x) ist also gerade die die Bilinearform Df (x) darstellende Matrix bez¨
uglich
n
der kanonischen Basis des R . Beachte, dass nach dem Satz von Schwarz Hf (x)
symmetrisch ist.
Bemerkung: Hf ergibt sich durch zweimaliges Ableiten direkt wie folgt. Es gilt
f : U → R, Df : U → L(Rn ; R) = (Rn )∗ und somit (Df )T : U → Rn und
Hf (x) = D (Df )T (x) ∈ L(Rn ; Rn )
in der Standardbasis des Rn , denn f¨
ur v, w ∈ Rn ist nach den S¨atzen 5.18 und 5.5
v T Hf (x)w = D2 f (v, w) = Dw Dv f (x) = Dw (Df (x)v)
= Dw v T (Df )T (x) = v T Dw (Df )T (x) = v T D (Df (x))T w.
Wie im Eindimensionalen lassen sich aus der Positivit¨at der zweiten Ableitung
R¨
uckschl¨
usse auf die Konvexit¨at einer Funktion ziehen. Dabei ist im Mehrdimensionalen unter Positivit¨at positive Definitheit zu verstehen. Wir werden sp¨ater
109
bei der Untersuchung von Extrema noch genauer darauf eingehen (vgl. Definition 5.31) und erinnern hier nur kurz an die fragliche Definition aus der linearen
Algebra:
Erinnnerung: Eine symmetrische Matrix A ∈ Rn×n heißt positiv (semi-)definit,
wenn
v T Av > 0 ∀ v ∈ Rn \ {0}
(bzw. v T Av ≥ 0 ∀ v ∈ Rn )
gilt.
Definition 5.23 (i) Eine Menge U ⊂ Rn heißt konvex, wenn mit je zwei
Punkten x, x ∈ U auch deren Verbindungsstrecke [x, x ] := {(1 − t)x + tx :
t ∈ [0, 1]} in U liegt.
(ii) Eine Funktion f : U → R, U ⊂ Rn konvex, heißt konvex, wenn
f ((1 − t)x + tx ) ≤ (1 − t)f (x) + tf (x )
∀ t ∈ [0, 1]
gilt. Sie heißt strikt konvex, wenn diese Ungleichung f¨
ur t ∈ (0, 1) strikt ist.
Konvexit¨at bedeutet also dass die Verbindungsstrecke zwischen zwei Punkten
(x, f (x)), (x , f (x )) immer oberhalb des Graphen von f in Rn × R verl¨auft.
Satz 5.24 Es sei f : U → R, U ⊂ Rn offen und konvex, zweimal differenzierbar.
Dann gilt:
(i) f ist genau dann konvex, wenn Hf (x) positiv semidefinit f¨
ur alle x ∈ U ist.
(ii) Ist Hf (x) sogar positiv definit f¨
ur alle x ∈ U , so ist f strikt konvex.
Bemerkung: Die Umkehrung in Teil (ii) dieses Satz gilt nicht, wie schon das
eindimensionale Beispiel x → x4 zeigt.
Beweis. Im eindimensionalen Fall, wenn U ein Intervall ist, ist dieser Satz aus der
Analysis 1 bekannt. Nun ist im allgemeinen Fall f genau dann (strikt) konvex,
wenn die Einschr¨ankung von f auf jeden eindimensionalen Schnitt U ∩ (x + Rv),
x ∈ U, v ∈ Rn , d.h. jede der Abbildungen t → f (x + tv), (strikt) konvex ist.
Hierf¨
ur ist
d2
f (x + tv) = ∂v ∂v f (x + tv) = v T Hf (x + tv)v.
dt2
Dies zeigt nun erstens, dass f genau dann konvex ist, wenn v T Hf (x)v ≥ 0 f¨
ur
n
alle x ∈ U, v ∈ R ist, d.h. Hf u
¨berall positiv semidefinit ist. Zweitens folgt, dass
wenn Hf u
ur alle x ∈ U, v ∈ Rn
¨berall positiv definit ist, also v T Hf (x)v > 0 f¨
gilt, f strikt konvex ist.
110
5.4
Taylor-Approximation
Wir wollen nun auch differenzierbare Funktionen mehrerer Ver¨anderlicher durch
Polynome lokal approximieren. Wir behandeln hier skalarwertige Funktionen f :
U → R, U ⊂ Rn offen. F¨
ur vektorwertige f kann man diese Ergebnisse dann auf
die einzelnen Komponenten anwenden.
Ist x0 ∈ U gegeben und x hinreichend nahe an x0 , so dass auch die ganze
Strecke [x0 , x] := {(1 − t)x0 + tx : t ∈ [0, 1]} in U liegt, so ergibt sich aus dem
eindimensionalen Fall direkt:
Satz 5.25 Es sei [x, x0 ] ⊂ U .
(i) Ist f ∈ C m+1 (U ; R), so gibt es ein ξ ∈ [x0 , x] mit
m
f (x) =
k=0
+
1 k
D f (x0 )(x − x0 , . . . , x − x0 )
k!
1
Dm+1 f (ξ)(x − x0 , . . . , x − x0 ).
(m + 1)!
(ii) F¨
ur f ∈ C m (U ; R) gilt immer noch
m
f (x) =
k=0
1 k
D f (x0 )(x − x0 , . . . , x − x0 ) + o( x − x0
k!
n
).
Beweis. (i) Das folgt unmittelbar aus Satz 3.18 angewandt auf die Funktion t →
g(t) := f (x0 + t(x − x0 )), die nach der Kettenregel dann auch (m + 1)-mal stetig
differenzierbar ist, denn nach Satz 5.18 ist ja
g (k) (t) = ∂x−x0 · · · ∂x−x0 f (x0 + t(x − x0 ))
= Dk f (x0 + t(x − x0 ))(x − x0 , . . . , x − x0 )
f¨
ur k = 1, . . . m + 1.
(ii) Wie im Beweis von Satz 3.19 erhalten wir daraus f¨
ur f ∈ C m (U ; R)
m
f (x) =
k=0
+
1 k
D f (x0 )(x − x0 , . . . , x − x0 )
k!
1
(Dm f (ξ) − Dm f (x0 )) (x − x0 , . . . , x − x0 )
(m + 1)!
f¨
ur ein ξ ∈ [x0 , x] und damit die Behauptung wegen
(Dm f (ξ) − Dm f (x0 )) (x − x0 , . . . , x − x0 )
≤ Dm f (ξ) − Dm f (x0 ) Mm (Rn ;R) x − x0 n = o( x − x0
111
n
).
Zur besseren Buchhaltung u
uhren wir eine
¨ber iterierte partielle Ableitungen f¨
neue Notation ein: Die Multiindizes.
Definition 5.26 Ein α = (α1 , . . . , αn ) ∈ Nn0 heißt Multiindex. F¨
ur diese α ∈ Nn0
definiert man
|α| := α1 + . . . + αn
Ist x ∈ Rn , so setzt man
und
α! := α1 ! · . . . · αn !.
xα := xα1 1 · . . . · xαnn .
Ist schließlich f ∈ C |α| , so sei
∂ α f (x) := ∂1α1 · · · ∂nαn f (x),
wobei ∂jp die p-fache partielle Ableitung nach xj bezeichnet.
F¨
ur zwei Multiindizes α, β ∈ Nn0 schreibt man α ≤ β, wenn αi ≤ βi f¨
ur jedes
i ∈ {1, . . . , n} gilt.
Da nach dem Satz von Schwarz alle partiellen Ableitungen kommutieren, kann
man f¨
ur f ∈ C |α| jede partielle Ableitung der Ordnung |α| auf diese Weise schreiben.
Das folgende Lemma macht es m¨oglich, die oben bewiesene Taylorformel mit
partiellen Ableitungen zu formulieren:
Lemma 5.27 Es sei x ∈ U , f ∈ C k (U ). Dann ist
Dk f (x)(h, . . . , h) =
α∈Nn
0
|α|=k
k! α
∂ f (x)hα .
α!
Beweis. Nach (5.1) gilt
n
k
∂j1 · · · ∂jk f (x) hj1 · . . . · hjk
D f (x)(h, . . . , h) =
j1 ,...,jk =1
Jeder Summand ist nach Umsortieren und Zusammenfassen von der Form ∂ α f (x) hα
k!
Summanden
f¨
ur einen Multiindex α ∈ Nn0 mit |α| = k. Dabei f¨
uhren genau α!
auf denselben Multiindex α: Von den k Indizes i1 , . . . , ik m¨
ussen genau αi gleich
i sein und eine solche Auswahl ist auf genau
k
α1
k − α1
k − α1 − . . . − αn−1
···
α2
αn
=
k!
k!
=
α1 ! · · · αn !
α!
Weisen m¨oglich. Es folgt
Dk f (x)(h, . . . , h) =
α∈Nn
0
|α|=k
112
k! α
∂ f (x)hα .
α!
Korollar 5.28 Es sei [x, x0 ] ⊂ U .
(i) Ist f ∈ C m+1 (U ; R), so gibt es ein ξ ∈ [x0 , x] mit
f (x) =
α∈Nn
0
|α|≤m
∂ α f (x0 )
(x − x0 )α +
α!
α∈Nn
0
|α|=m+1
∂ α f (ξ)
(x − x0 )α .
α!
(ii) F¨
ur f ∈ C m (U ; R) gilt immer noch
f (x) =
α∈Nn
0
|α|≤m
∂ α f (x0 )
(x − x0 )α + o( x − x0
α!
n
).
Beweis. Klar nach Satz 5.25 und Lemma 5.27.
Die Taylorpolynome Tmf,x0 sind nun also die Polynome auf dem Rn mit
Tmf,x0 (x) :=
α∈Nn
0
|α|≤m
∂ α f (x0 )
(x − x0 )α .
α!
Beispiele:
1. F¨
ur m = 1 ist
n
T1f,x0 (x) = f (x0 ) +
∂j f (x0 )(x − x0 )
j=1
= f (x0 ) + ∇f (x0 ) · (x − x0 ).
(Beachte, dass |α| = 1 ⇐⇒ α = ej f¨
ur ein j.)
2. F¨
ur m = 2 ist
n
n
T2f,x0 (x)
1
∂i ∂j f (x0 )(x − x0 )i (x − x0 )j
= f (x0 ) +
∂j f (x0 )(x − x0 ) +
2
i,j=1
j=1
1
= f (x0 ) + ∇f (x) · (x − x0 ) + (x − x0 )T Hf (x0 )(x − x0 ).
2
(Beachte, dass |α| = 2 ⇐⇒ α = ei + ej f¨
ur ein (i, j), wobei f¨
ur i = j
das Paar (i, j) eindeutig ist und α! = 2 ist, f¨
ur i = j dagegen zwei Paare,
n¨amlich (i, j) und (j, i), auf das gleiche α mit α! = 1 f¨
uhren.)
113
5.5
Extrema
Wir wollen nun Funktionen f : U → R, U ⊂ Rn offen, auf lokale Extrema
untersuchen.
Definition 5.29 Es sei x0 ∈ U . x0 heißt lokales Minimum bzw. lokales Maximum,
wenn es eine Umgebung V ⊂ U von x0 gibt, so dass
f (x) ≥ f (x0 )
bzw.
f (x) ≤ f (x0 )
f¨
ur alle x ∈ V gilt. L¨asst sich V so finden, dass sogar
f (x) > f (x0 )
bzw.
f (x) < f (x0 )
f¨
ur alle x ∈ V \ {x0 } gilt, so heißt x0 isoliertes lokales Minimum bzw. isoliertes
lokales Maximum.
Zusammenfassend nennt man x0 ein (isoliertes) lokales Extremum, wenn x0
ein (isoliertes) lokales Minimum oder Maximum ist.
Der folgende Satz gibt eine notwendige Bedingung f¨
ur lokale Extrema an.
Satz 5.30 Ist f partiell differenzierbar und x ∈ U lokales Extremum, so gilt
∇f (x) = (∂1 f (x), . . . , ∂n f (x))T = 0.
Beweis. Sei i ∈ {1, . . . , n}. F¨
ur hinreichend kleines ε > 0 ist [x − εei , x + εei ] ⊂ U
und die Funktion g : (−ε, ε) → R, g(t) = f (x + tei ) hat ein lokales Extremum
bei t = 0. Da f partiell differenzierbar ist, ist g differenzierbar, und nach einem
Satz aus der Analysis 1 folgt
0 = g (0) = ∂i f (x) = 0.
Ein x ∈ U mit ∇f (x) = 0 nennt man auch einen kritischen Punkt.
Um weitere Kriterien f¨
ur f ∈ C 2 (U ) aus der zweiten Ableitung, die ja durch
die Hesse-Matrix Hf gegeben ist, abzuleiten, erinnern wir zun¨achst an einige
Begriffe aus der linearen Algebra:
Definition 5.31 Es sei A ∈ Rn×n symmetrisch. A heißt
(i) positiv definit, wenn v T Av > 0 f¨
ur alle v ∈ Rn \ {0} ist,
(ii) positiv semidefinit, wenn v T Av ≥ 0 f¨
ur alle v ∈ Rn ist,
(iii) negativ (semi-)semidefinit, wenn −A positiv (semi-)definit ist, und
(iv) indefinit, wenn weder A noch −A positiv semidefinit sind.
114
Bemerkung: In der linearen Algebra wird gezeigt, dass es zu jeder symmetrischen Matrix A ∈ Rn×n eine orthogonale Koordinatentransformation, gegeben
durch eine Matrix O ∈ Rn×n mit O−1 = OT , derart gibt, dass


λ1 0 · · · 0
. . . .. 

.
 0 λ2
T
O AO =  . .

.
..
.. 0 
 ..
0 · · · 0 λn
gilt, wobei λi ∈ R die Eigenvektoren von A sind. Insbesondere ist f¨
ur alle v ∈ Rn
dann mit w = OT v (also v = Ow)
n
v T Av = wT OT AOw =
λi wi2 .
i=1
Hieraus ersieht man:
• A ist positiv (semi-)definit genau dann, wenn alle Eigenwerte von A gr¨oßer
als (bzw. gr¨oßer gleich) 0 sind.
• A ist negativ (semi-)definit genau dann, wenn alle Eigenwerte von A kleiner
als (bzw. kleiner gleich) 0 sind.
• A ist indefinit genau dann, A sowohl negative als auch positive Eigenwerte
besitzt.
Ohne Beweis erw¨ahnen wir auch das folgende Kriterium: Eine Matrix A =
(aij )1≤i,j≤n ∈ Rn×n ist positiv definit genau dann, wenn die Determinanten aller
linken oberen Untermatrizen (aij )1≤i,j≤m ∈ Rm×m positiv sind.
Eine weitere notwendige Bedingung f¨
ur Extrema ist:
Satz 5.32 Ist f ∈ C 2 (U ) und x ∈ U lokales Minimum (bzw. Maximum), so ist
Hf (x) positiv semidefinit (bzw. negativ semidefinit).
Beweis. Ist x ein lokales Minimum, h ∈ Rn fest und ε > 0 hinreichend klein, so
hat die Funktion g : (−ε, ε) → R, g(t) = f (x + th) hat ein lokales Minimum bei
t = 0. Daher ist
0 ≤ g (0) = ∂h ∂h f (x) = hT Hf (x)h.
Ist nun x ein lokales Maximum, so wenden wir das eben Gezeigte auf −f an.
Eine hinreichende Bedingung sogar f¨
ur isolierte Extrema liefert der folgende
Satz:
Satz 5.33 Ist f ∈ C 2 (U ), x0 ∈ U mit ∇f (x0 ) = 0 und Hf (x0 ) positiv definit
(bzw. negativ definit), so ist x0 ein isoliertes lokales Minimum (bzw. Maximum).
115
Beweis. Wieder gen¨
ugt es, indem man ggf. zu −f u
¨bergeht, nur den Fall, dass
Hf (x) positiv definit ist, zu behandeln.
Da die nicht-negative stetige Funktion Rn → R, v → v T Hf (x0 )v auf dem
Kompaktum S n−1 := {v ∈ Rn : v 2 = 1} ihr Minimum annimmt, gilt
c := min{v T Hf (x0 )v : v ∈ S n−1 } > 0,
denn f¨
ur kein v ∈ S n−1 ist v T Hf (x0 )v = 0. Damit ist aber f¨
ur alle v ∈ Rn
T
v Hf (x0 )v =
v
v
T
Hf (x0 )
2
v
v
v
2
2
2
≥ c v 22 .
Nun ist nach Satz 5.25 (vgl. Beispiel 2 auf Seite 113) wegen ∇f (x0 ) = 0
1
f (x) = f (x0 ) + (x − x0 )T Hf (x0 )(x − x0 ) + o( x − x0 2 )
2
c o( x − x0 2 )
≥ f (x0 ) +
+
x − x0 2
2
2
x − x0
c
≥ f (x0 ) + x − x0 2
4
f¨
ur x − x0 hinreichend klein und insbesondere f (x) > f (x0 ) f¨
ur x = x0 nahe
x0 .
Wenn Hf (x0 ) positiv oder negativ semidefinit ist, so l¨asst sich keine allgemeine Aussage machen, ob x0 ein Extremum ist, wie die Beispiele x → x3 und
x → x4 auf R zeigen. Es gilt aber:
Satz 5.34 Ist f ∈ C 2 (U ), x0 ∈ U mit ∇f (x0 ) = 0 und Hf (x0 ) indefinit, so ist
x0 kein lokales Extremum.
Beweis. Es seien v, w ∈ Rn mit v T Hf (x0 )v < 0 < wT Hf (x0 )w fixiert. Da nach
Satz 5.25 (vgl. Beispiel 2 auf Seite 113)
1
f (x) = f (x0 ) + (x − x0 )T Hf (x0 )(x − x0 ) + o( x − x0 2 )
2
gilt, folgt f¨
ur |t| = 0 hinreichend klein
1
f (x0 + tv) = f (x0 ) + v T Hf (x0 )v t2 + o(t2 )
2
v T Hf (x0 )v
= f (x0 ) +
+ o(1) t2 < f (x0 )
2
und genauso
f (x0 + tw) = f (x0 ) +
wT Hf (x0 )w
+ o(1) t2 > f (x0 ).
2
116
Beliebig nahe bei x0 liegen also sowohl Punkte mit gr¨oßerem als auch Punkte mit
kleinerem Funktionswert.
Beispiel: F¨
ur gegebene Vektoren a1 , . . . , ak ∈ Rn suchen wir ein x ∈ Rn , das
m¨oglichst gut zwischen diesen Vektoren interpoliert, genauer: so dass die Summe
der quadratischen Abst¨ande
k
x − aj
f (x) :=
2
2
j=1
minimal wird.
Zun¨achst stellen wir fest, dass das Minimum existiert, denn f ist stetig und
es gilt f (x) → ∞ f¨
ur x → ∞, so dass inf f = inf{f (x) : x ∈ B R (0)} f¨
ur ein
hinreichend großes R > 0 gilt, und damit, weil B R (0) kompakt ist, ein x0 ∈ B R (0)
existiert mit f (x0 ) = min f .
Es gilt
k
∇f (x) =
k
∇
x − aj
2
2
j=1
k
x − aj = 2 kx −
=2
j=1
aj
.
j=1
Der einzige kritische Punkt – und damit das eindeutige Minimum – ist also
1
x0 =
k
k
aj ,
j=1
das arithmetische Mittel der aj . (Die Hessematrix ist dort das 2k-fache der Einheitsmatrix, also tats¨achlich positiv definit.)
Extrema mit Nebenbedingungen
Wir kommen auf die Untersuchung von Extermalstellen einer Funktion f : U →
R, U ⊂ Rn offen, aus Abschnitt 5.5 zur¨
uck. In vielen Anwendungen sind zus¨atzliche Nebenbedingungen zu ber¨
ucksichtigen. m Nebenbedingungen lassen sich durch
m Gleichungen, die von den zul¨assigen x erf¨
ullt sein m¨
ussen, formulieren oder aber
einfach durch eine vektorielle Nebenbedingung der Form


b1 (x)


b(x) =  ...  = 0
bm (x)
f¨
ur die Funktion b : U → Rm . Diese Gleichungen sollen (lokal) unabh¨angig sein.
F¨
ur differenzierbares b fordern wir deshalb, dass Db ∈ L(Rn ; Rm ) surjektiv ist,
d.h. dass m ≤ n sein muss und Db maximalen Rang hat, also m. Dies ist –
wie aus der linearen Algebra bekannt – ¨aquivalent dazu, dass schon eine m × mUntermatrix von Db vom Rang m und somit invertierbar ist.
117
Definition 5.35 Es seien U ⊂ Rn , f : U → R, b : U → Rm . Ein Punkt x0
heißt lokales Minimum (Maximum) von f unter der Nebenbedingung b, wenn es
eine Umgebung V von x0 gibt, so dass
f (x) ≥ f (x0 )
(bzw. f (x) ≤ f (x0 ))
∀x ∈ V mit b(x) = 0
gilt.
F¨
ur lokale Minima und Maxima, also ‘Extrema’ unter Nebenbedingungen gibt
es das folgende notwendige Kriterium.
Satz 5.36 Es seien U ⊂ Rn offen, f ∈ C 1 (U ), b ∈ C 1 (U ; Rm ), m ≤ n. Ist x0
ein lokales Extremum unter der Nebenbedingung b und ist der Rang von Db(x0 )
maximal (also gleich m), so gilt
∇f (x0 ) ⊥ Kern Db(x0 ).
(D.h.: Es gilt ∇f (x0 ) · v = 0 f¨
ur alle v ∈ Rn mit Db(x0 )v = 0.)
Korollar 5.37 Unter den Voraussetzungen des Satzes 5.36 gibt es m Zahlen,
sogenannte Lagrangesche Multiplikatoren, λ1 , . . . , λm , mit
∇f (x0 ) = λ1 ∇b1 (x0 ) + . . . + λm ∇bm (x0 ).
Beweis. Das ergibt sich direkt aus Satz 5.36, da das ‘orthogonale Komplement’
{w ∈ Rn : w ⊥ v ∀ v ∈ Kern Db(x0 )} des Kerns von Db(x0 ) von den Zeilen der
Matrix Db(x0 ) aufgespannt wird.
Beweis von Satz 5.36. F¨
ur x ∈ Rn schreiben wir x = (x , y) ∈ Rn−m × Rm ,
inbesondere x0 = (x0 , y0 ) ∈ Rn−m × Rm . Durch Umnumerieren der Koordinaten
k¨onnen wir erreichen, dass die hintere m×m-Untermatrix Dy b(x0 , y0 ) von Db(x0 )
invertierbar ist.
Nach dem Satz u
¨ber implizite Funktionen 5.14 gibt es dann eine Umgebung
n−m
ur
V ×W ⊂ R
× Rm von (x0 , y0 ) und ein g ∈ C 1 (V ; W ), so dass b(x , y) = 0 f¨
(x , y) ∈ V ×W genau dann gilt, wenn y = g(x ) ist. Da nun V x → f (x , g(x ))
ein lokales Extremum bei x0 hat, folgt mit Satz 5.30
0 = D f (x0 , g(x0 )) = Df (x0 , g(x0 ))
= Df (x0 )
Idn−m
Dg(x0 )
Idn−m
.
−1
− Dy b(x0 ) Dx f (x0 )
Das aber heißt, dass ∇f (x0 ) auf allen n − m Spalten von
Idn−m
−1
− (Dy b(x0 )) Dx b(x0 )
orthogonal steht. Die sind, wie man leicht sieht, linear unabh¨angig. Um den Beweis abzuschließen, gen¨
ugt es nun zu zeigen, dass diese Vektoren Kern Db(x0 )
aufspannen, was wegen
dim Kern Db(x0 ) = n − dim Bild Db(x0 ) = n − m
118
dazu ¨aquivalent ist, dass sie alle in Kern Db(x0 ) liegen. Das aber folgt aus
Db(x0 )
Idn−m
− (Dy b(x0 ))−1 Dx b(x0 )
= Dx b(x0 ) − Dy b(x0 ) (Dy b(x0 ))−1 Dx b(x0 ) = 0.
Beispiel: Es seien f, b : Rn → R gegeben durch f (x) = xT Ax, A eine o.B.d.A.
symmetrische Matrix, und b(x) = x 22 − 1. (Da S n−1 = {x : b(x) = 0} kompakt
ist, nimmt f dort sein Minimum und sein Maximum an.)
Eine notwendige Bedingung, dass f unter der Nebenbedingung b bei x lokal
extremal ist, ist
∇f (x) = 2Ax = λ∇b(x) = 2λx
f¨
ur ein λ ∈ R. (Beachte, dass ∇b(x) = 2x auf S n−1 nicht veschwindet, also Rang
1 hat.) x ist also wegen
Ax = λx
ein Eigenvektor zum Eigenwert λ von A. Der Funktionswert von f bei einem
Eigenvektor x ∈ S n−1 zu λ ist xT Ax = λxT x = λ. Wir sehen so, dass f unter
der Nebenbedingung b genau durch Eigenvektoren zum maximalen (minimalen)
Eigenwert maximiert (bzw. minimiert) wird.
Bemerkung: Im Fall m = 1 einer Nebenbedingung b besagen Satz 5.36 und
Korollar 5.37, dass ∇f (x0 ) und ∇b kollinear sein m¨
ussen. Geometrisch l¨asst sich
dies wie folgt interpretieren: W¨are das nicht der Fall, so k¨onnte man den Punkt
x0 innerhalb der Menge {x ∈ U : b(x) = 0} in einer Richtung (infinitesimal)
variieren, die nicht orthogonal zu ∇f (x0 ) ist. Da dies jedoch die Richtung des
steilsten An- bzw. Abstiegs von f angibt, findet man beliebig nahe an x0 sowohl
g¨oßere als auch kleinere Werte von f .
5.6
Parameter-abh¨
angige Integrale
In diesem Abschnitt untersuchen wir Integrale, die von Parametern abh¨angen
und geben insbesondere Kriterien an, wann solche Gr¨oßen stetig oder sogar differenzierbar in diesen Parametern sind.
Satz 5.38 Es seien (M, d) ein metrischer Raum, [a, b] ⊂ R ein kompaktes Intervall, f : [a, b] × M → R stetig (bzgl. der Produktmetrik). Dann ist die Abbildung
g : M → R, definiert durch
b
g(x) :=
f (t, x) dt,
a
stetig.
119
Beweis. Zun¨achst einmal ist g wohldefiniert, da f¨
ur jedes x ∈ M gilt
tk → t =⇒ (tk , x) → (t, x) =⇒ f (tk , x) → f (t, x)
f¨
ur alle x, so dass f (·, x) stetig ist.
Es sei nun xk → x0 in M . Da die Menge A := {xk : k ∈ N0 } ⊂ M kompakt
ist, ist auch [a, b]×A kompakt (s. Satz 4.33) und somit f |[a,b]×A gleichm¨aßig stetig
(s. Satz 4.36(ii)). Zu gegebenem ε > 0 l¨asst sich demnach ein δ > 0 w¨ahlen, so
dass
ε
max{|t − t |, d(x, x )} < δ =⇒ |f (t, x) − f (t , x )| <
b−a
ur alle hinreichend
f¨
ur alle t, t ∈ [a, b] und x, x ∈ A gilt. Insbesondere ist dann f¨
großen k mit d(xk , x0 ) < δ
b
b
|f (t, xk ) − f (t, x0 )| dt ≤
|g(xk ) − g(x0 )| ≤
a
a
ε
≤ ε.
b−a
Der folgende Satz zeigt, dass parameterabh¨angige Integrale unter geeigneten
Voraussetzungen sogar nach dem Parameter differenziert werden d¨
urfen und sich
die Ableitung dadurch ergibt, dass man einfach unter dem Integral differenziert.
Satz 5.39 Es seien U ⊂ Rn offen, [a, b] ⊂ R ein kompaktes Intervall, f : [a, b] ×
U → R stetig (bzgl. der Produktmetrik) und i ∈ {1, . . . , n}. f sei f¨
ur jedes (t, x) ∈
[a, b] × U partiell nach xi differenzierbar und die Abbildung ∂xi f : [a, b] × U →
R, (t, x) → ∂xi f (t, x) sei stetig. Dann ist die Abbildung g : U → R, definiert durch
b
g(x) :=
f (t, x) dt
a
nach xi partiell differenzierbar mit stetiger partieller Ableitung
b
∂xi g(x) =
∂xi f (t, x) dt.
a
Beweis. Da die x1 , . . . , xi−1 , xi+1 , . . . , xn die Rolle von festen Parametern spielen,
d¨
urfen wir o.B.d.A. U ⊂ R annehmen. Um die Behauptung f¨
ur gegebenes x0 ∈ U
nachzupr¨
ufen, w¨ahlen wir ein kompaktes Intervall [c, d] ⊂ U mit x0 ∈ (c, d).
Dann ist ∂x f gleichm¨aßig stetig auf [a, b] × [c, d]. F¨
ur x0 , x0 + h ∈ [c, d] gibt es
nach dem Mittelwertsatz (von t abh¨angige) ξ(t) zwischen x0 und x0 + h, so dass
f (t, x0 + h) − f (t, x0 )
− ∂x f (t, x0 ) = |∂x f (t, ξ(t)) − ∂x f (t, x0 )|
h
≤ sup{|∂x f (t, ξ) − ∂x f (t, x0 )| : |ξ − x0 | ≤ h} → 0
120
gleichm¨aßig in t mit h → 0. Nach Satz 3.7 ist dann aber
g(x0 + h) − g(x0 )
=
h
b
a
b
f (t, x0 + h) − f (t, x0 )
dt →
h
∂x f (t, x0 ) dt
a
f¨
ur h → 0 und damit tats¨achlich
b
∂x f (t, x0 ) dt.
g (x0 ) =
a
Nach Satz 5.38 h¨angt dies stetig von x0 ab.
Als Anwendung zeigen wir einen Satz f¨
ur mehrfache Integrale, der eine M¨oglichkeit aufzeigt, Funktionen u
¨ber h¨oherdimensionale Mengen zu integrieren.
Satz 5.40 Es seien [a, b], [c, d] kompakte Intervalle, f : [a, b] × [c, d] → R stetig.
Dann ist
b
d
d
f (x, y) dy
a
b
f (x, y) dx
dx =
c
c
dy.
a
d
(Beachte, dass nach Satz 5.38 die Abbildungen x → c f (x, y) dy und y →
b
f (x, y) dx stetig und also integrierbar sind.)
a
Bemerkung: Dies ist ein Spezialfall des Satzes von Fubini, den wir in viel allgemeinerer Form in der Vorlesung Analysis 3 besprechen werden.
Beweis. Betrachte die stetige Abbildung g : [a, b] × [c, d] → R,
z
g(x, z) =
f (x, y) dy.
c
Nach Satz 5.392 ist ϕ : [c, d] → R mit
b
ϕ(z) =
g(x, z) dx
a
stetig differenzierbar, und es gilt
b
ϕ (z) =
b
∂z g(x, z) dx =
f (x, z) dx.
a
a
Damit ist nach dem Hauptsatz
b
d
d
f (x, y) dy dx = ϕ(d) = ϕ(d) − ϕ(c) =
a
c
2
d
ϕ (y) dy =
c
f (x, y) dx dy.
c
Genauer, da [c, d] ja nicht offen ist: Nach dem Beweis von Satz 5.39 . . .
121
b
a
Bemerkung: Ganz analog (bzw. induktiv aus Satz 5.40) ergibt sich, dass das
n-fache Integral
bn
b1
f (x1 , . . . , xn ) dxn · · · dx1
···
a1
an
einer stetigen Funktion f : Q := [a1 , b1 ] × . . . × [an , bn ] → R nicht von der
Reihenfolge der Integrationen abh¨angt. Dieses Integral nennt man auch schlicht
das Integral von f u
¨ber Q und schreibt
f (x) dx.
Q
Tats¨achlich gibt diese Gr¨oße gerade das (signierte) (n + 1)-dimensionale Volumen
der Menge zwischen dem Funktionsgraphen und Q an. In der Vorlesung Analysis 3
werden wir uns (wesentlich grundlegender und allgemeiner) mit solchen Integralen
im Mehrdimensionalen besch¨aftigen.
5.7
Kurven, Vektorfelder und Potentiale
Im letzten Abschnitt dieser Vorlesung betrachten wir zwei Spezialf¨alle und deren
Zusammenhang genauer: Abbildungen von einem Intervall nach Rn und Abbildungen von einer offenen Teilmenge des Rn in den Rn (derselben Dimension).
Ist I ⊂ R ein Intervall, so nennt man eine Abbildung γ : I → Rn auch
eine Kurve im Rn . In vielen Anwendungen beschreibt eine solche Abbildung die
Bewegung eines Punktes (Teilchens) im Rn , weshalb man hier als Variable gerne
t verwendet und diese als Zeit (engl.: time) interpretiert. Ist γ differenzierbar, so
schreibt man f¨
ur die Ableitung statt γ auch γ.
˙ Dann ist
γ(t)
˙
= lim
h→0
h=0
γ(t + h) − γ(t)
,
h
der Geschwindigkeitsvektor zur Zeit t, tangential zur Kurve γ bei γ(t), weshalb
man die skalaren Vielfachen von γ˙ auch Tangentialvektoren nennt.
Eine Abbildung f : U → Rn , wobei U eine offene Teilmenge von Rn ist, nennt
man ein Vektorfeld. Solche Abbildungen kommen vor allem in der Physik h¨aufig
vor, z.B. als Kraftfeld (etwa der Gravitation), elektrisches Feld, magnetisches Feld,
Geschwindigkeitsfeld der Str¨omung von Gasen und Fl¨
ussigkeiten. Dabei gibt f (x)
gerade den betrachteten physikalischen Wert im Raumpunkt x ∈ U an.
Kurvenintegrale und zwei klassische Differentialoperatoren
Wir beschreiben nun zun¨achst, wie sich Vektorfelder entlang Kurven integrieren
lassen, und danach zwei spezielle Ableitungsoperationen f¨
ur Vektorfelder.
122
Es sei γ : I → Rn , I ein Intervall, eine (st¨
uckweise) stetig differenzierbare
Kurve und f : U → Rn ein stetiges Vektorfeld. Ganz allgemein definieren wir:
Definition 5.41 Das (orientierte) Kurvenintegral von f l¨angs γ ist
f (x) · dx :=
γ
f (γ(s)) · γ(s)
˙
ds.
I
Es geht also darum, nur den zur Kurve tangentialen Anteil von f aufzuintegrieren.
Das folgende Lemma zeigt, dass das Kurvenintegral unabh¨angig von der Parametrisierung ist und bei Orientierungsumkehr das Vorzeichen wechselt, genauer:
Lemma 5.42 Es sei γ : [a, b] → U , U ⊂ Rn offen, eine st¨
uckweise stetig diffen
renzierbare Kurve und f ∈ C(U ; R ) ein stetiges Vektorfeld. Ist nun ϕ : [a , b ] →
[a, b] stetig differenzierbar mit ϕ(a ) = a und ϕ(b ) = b, so gilt
f (x) · dx =
γ◦ϕ
f (x) · dx.
γ
Ist dagegen ϕ : [a , b ] → [a, b] stetig differenzierbar mit ϕ(a ) = b und ϕ(b ) = a,
so gilt
f (x) · dx = −
γ◦ϕ
f (x) · dx.
γ
¨
Beweis. Ubung!
Beispiel: Als motivierendes Beispiel f¨
ur diese Begriffsbildung nehmen wir an,
dass γ die Bahn eines physikalischen Teilchens in einem Kraftfeld f sei. Gem¨aß
dem physikalischen Gesetz
Arbeit = Kraft × Weg,
wobei hier nur der in Richtung des Wegs zeigende Anteil der Kraft zu nehmen
ist, gibt γ f (x) · dx nun tats¨achlich die verrichtete Arbeit des Teilchens an.
F¨
ur Vektorfelder sind die beiden folgenden Operationen besonders wichtig:
Definition 5.43 Ist f : U → Rn ein differenzierbares Vektorfeld, so bezeichnen
wir mit
(i) div f : U → R,
n
div f =
∂i fi
(= Spur Df = “ ∇ · f ”),
i=1
die Divergenz von f und,
123
(ii) falls außerdem n = 3 ist, mit rot f : U → R3 ,


∂2 f3 − ∂3 f2
rot f = ∂3 f1 − ∂1 f3  (= “ ∇ × f ”),
∂1 f2 − ∂2 f1
die Rotation von f . (Im Englischen: curl f.)
∇, div und rot kann man dann als Abbildungen auf Funktionenr¨aumen (“Operatoren”) interpretieren:
∇ : C α (U ) → C α−1 (U ; Rn ),
div : C α (U ; Rn ) → C α−1 (U ),
rot : C α (U ; R3 ) → C α−1 (U ; R3 )
f¨
ur α ≥ 1.
¨
Ubung:
Zeigen Sie rot ◦∇ = 0 und div ◦ rot = 0, genauer: F¨
ur U ⊂ R3 offen und
2
2
3
f ∈ C (U ), g ∈ C (U ; R ) gilt
rot ∇f = 0,
div rot g = 0.
Potentiale
Eine wichtige Beispielklasse von Vektorfeldern sind die sogenannten konservativen
Vektorfelder:
ur
Definition 5.44 Ein stetiges Vektorfeld f : U → Rn heißt konservativ, wenn f¨
jede st¨
uckweise stetig differenzierbare Kurve γ : [0, 1] → U mit γ(0) = γ(1) gilt
f (x) · dx = 0.
γ
Beispiel: Viele Kraftfelder in der Mechanik sind konservativ: Wenn ein Teilchen
wieder am Ausgangspunkt angekommen ist, ist dann die gesamte geleistete Arbeit
gleich Null.
Außer im Eindimensionalen hat nicht jedes Vektorfeld f eine Stammfunktion,
d.h. eine differenzierbare skalarwertige Funktion F mit ∇F = f . Ist z.B. f (x) =
(−x2 , x1 ), so kann es kein solches F geben, da nach dem Satz von Schwarz sonst
−1 = ∂2 f1 = ∂2 ∂1 F = ∂1 ∂2 F = ∂1 f2 = 1
124
w¨are. Physikalisch motiviert, nennt man ein F mit −∇F = f auch ein Potential f¨
ur f . Aus dem Satz von Schwarz ergibt sich also allgemein die notwendige
Integrabilit¨atsbedingung
∂i fj = ∂j fi
∀ i, j ∈ {1, . . . , n}
(5.2)
daf¨
ur, dass f ∈ C 1 (U ; Rn ) ein Potential besitzt.
Bemerkung: Ist n = 3, so bedeutet (5.2) gerade rot f = 0.
Der folgende Satz 5.46 besagt insbesondere, dass konservative Vektorfelder
gerade solche mit Stammfunktionen sind. Vorbereitend zeigen wir, dass sich je
zwei Punkte einer zusammenh¨angenden offenen Menge3 durch besonders einfache
Wege verbinden lassen.
Lemma 5.45 Es sei V ⊂ Rn eine offene zusammenh¨angende Menge. Dann gibt
es f¨
ur alle x, y ∈ V einen st¨
uckweise stetig differenzierbaren Weg γ : [0, 1] → V
mit γ(0) = x und γ(1) = y.
Beweis.4 Es sei γ˜ : [0, 1] → V ein stetiger Weg mit γ˜ (0) = x und γ˜ (1) = y.
Da γ˜ ([0, 1]) kompakt und Rn \ V abgeschlossen ist, gibt es ein ε > 0, so dass
|˜
γ (t) − y| ≥ ε f¨
ur alle t ∈ [0, 1] und y ∈
/ V ist. Wir definieren nun γ als den durch
lineare Interpolation der Punkte γ˜ (0), γ˜ ( m1 ), . . . , γ˜ (1) entstehenden Polygonzug:
γ(t) = (1 + k − mt)˜
γ
k
m
+ (mt − k)˜
γ
k+1
m
f¨
ur
k+1
k
≤t≤
.
m
m
Aus der gleichm¨aßigen Stetigkeit von γ˜ folgt, dass |γ(t)−˜
γ (t)| < ε f¨
ur alle t ∈ [0, 1]
gilt, wenn nur m gen¨
ugend groß gew¨ahlt ist. Das aber zeigt, dass tats¨achlich γ
ganz in V verl¨auft.
Satz 5.46 Es sei U ⊂ Rn zusammenh¨angend und offen und f ∈ C(U ; Rn ) ein
Vektorfeld. Dann sind ¨aquivalent:
(i) f ist konservativ.
(ii) Es existiert ein F ∈ C 1 (U ) mit ∇F = f .
(iii) F¨
ur alle st¨
uckweise stetig differenzieraren Kurven γ : [a, b] → U h¨angt
f (x) · dx nur von den Endpunkten γ(a) und γ(b) ab.
γ
¨
Erinnerung (vgl. die Ubungen):
Eine Menge V ⊂ Rn heißt zusammenh¨
angend, wenn sie
˙ 2 von nicht leeren Mengen V1 , V2 geschrieben werden
nicht als disjunkte Vereinigung V = V1 ∪V
kann, die offen in V sind, d.h. f¨
ur die Vi = V ∩ Ui mit in Rn offenen Mengen Ui gilt, i = 1, 2.
Man nennt V wegzusammenh¨
angend, wenn es f¨
ur alle x, y ∈ V einen stetigen Weg γ : [0, 1] → V
mit γ(0) = x und γ(1) = y gibt. Ist V ⊂ Rn offen, so fallen diese Begriffe zusammen.
4
Dieser Beweis wurde in der Vorlesung weggelassen.
3
125
Beweis. (i) ⇒ (iii): Sind γ : [a, b] → U und γ : [a , b ] → U st¨
uckweise stetig
differenzierbare Kurven mit γ(a) = γ (a ) und γ(b) = γ (b ), so ist auch γ˜ :
[0, 1] → U mit
f¨
ur 0 ≤ t ≤ 12 ,
f¨
ur 21 ≤ t ≤ 1
γ(a + 2(b − a)t)
γ (b + 2(a − b )(t − 12 ))
γ˜ (t) =
st¨
uckweise stetig differenzierbar, und es gilt γ˜ (0) = γ(a) = γ (a) = γ˜ (1), also
f (x) · dx =
0=
γ
˜
f (x) · dx −
γ
f (x) · dx
γ
nach Lemma 5.42.
(iii) ⇒ (ii): Nach Lemma 5.45 gibt es f¨
ur alle x, y ∈ U einen st¨
uckweise stetig
differenzierbaren Weg γx,y : [0, 1] → U mit γx,y (0) = x und γx,y (1) = y. Wir
fixieren x0 ∈ U und setzen
f (y) · dy
F (x) :=
∀ x ∈ U.
γx0 ,x
Da Kurvenintegrale u
¨ber f nur von den Endpunkten der Kurve abh¨angen, k¨onnen
wir im folgenden Ausdruck nun erstens γx0 ,x+h durch die Kurve
[0, 2] → U,
γx0 ,x (t)
f¨
ur 0 ≤ t ≤ 1,
γx,x+h (t) f¨
ur 1 ≤ t ≤ 2
t→
ersetzen und zweitens f¨
ur h hinreichend klein γx,x+h (t) = x + th w¨ahlen, um
F (x + h) − F (x) =
f (y) · dy −
γx0 ,x+h
f (y) · dy
γx0 ,x
1
f (y) · dy =
=
γx,x+h
f (x + th) · h dt
0
zu erhalten, so dass sich
F (x + h) − F (x) − f (x) · h
= h
h
= h
1
−1
f (x + th) · h dt − f (x) · h
0
1
−1
f (x + th) − f (x) · h dt,
0
ergibt, was f¨
ur h → 0 gegen 0 konvergiert. Dies zeigt, dass ∇F (x) = f (x) gilt.
(ii) ⇒ (i): Es sei γ : [0, 1] → U eine st¨
uckweise stetig differenzierbare Kurve
mit γ(0) = γ(1) und f = ∇F . Dann ist
1
f (x) · dx =
γ
∇F (γ(t)) · γ(t)
˙ dt
0
1
=
0
d
(F (γ(t)) dt = F (γ(1)) − F (γ(0)) = 0.
dt
126
Bemerkung: Dieser Satz gilt auch f¨
ur nicht zusammenh¨angende offene Mengen
U . Um (ii) ⇒ (i) ⇒ (iii) zu schließen, haben wir diese Voraussetzung ja gar nicht
gebraucht. Um (ii) aus (iii) zu folgern, u
¨berlegt man sich zun¨achst, dass (ganz
allgemein in metrischen R¨aumen) jede Menge V ⊂ Rn in disjunkte sogenannte (Weg-)Zusammenhangskomponenten Vj zerf¨allt, wobei die Vj die maximalen
(weg-)zusammenh¨angenden Teilmengen von V sind: V = ˙ j∈J . Ist V offen, so
auch jedes Vj . Dann l¨asst sich Lemma 5.45 einfach auf jeder Zusammenhangskomponenten separat angewenden.
F¨
ur besonders gutartige Gebiete, stellt sich nun heraus, dass die Integrabilit¨atsbedingung (5.2) sogar schon hinreichend f¨
ur die Existenz eines Potentials
ist.
uglich x0 ∈
Definition 5.47 Wir nennen eine Teilmenge U ⊂ Rn sternf¨ormig bez¨
U , wenn mit x ∈ U auch die Verbindungsstrecke
[x0 , x] = {(1 − t)x0 + tx : t ∈ [0, 1]}
uglich eines
ganz in U liegt. U heißt schlicht sternf¨ormig, wenn es sternf¨ormig bez¨
x0 ∈ U ist.
Satz 5.48 (Das Lemma von Poincar´
e) Es sei U ⊂ Rn offen und sternf¨ormig
und f ∈ C 1 (U ; Rn ) ein Vektorfeld. Dann sind ¨aquivalent:
(i) Es gilt ∂i fj = ∂j fi f¨
ur i, j = 1, . . . , n.
(ii) Es existiert ein F ∈ C 2 (U ) mit ∇F = f .
Bemerkung: Es gen¨
ugt anzunehmen, dass U einfach zusammenh¨angend ist, was
wir hier aber nicht vertiefen wollen.
Beweis. (ii) ⇒ (i): Das ist der Satz von Schwarz.
(i) ⇒ (ii): Es sei U sternf¨ormig bez¨
uglich x0 . Setze
1
f (1 − t)x0 + tx · (x − x0 ) dt.
f (y) · dy =
F (x) =
[x0 ,x]
0
Nach Satz 5.39 ist dann F ∈ C 1 (U ) mit
n
1
∂i F (x) =
0
1
fk (1 − t)x0 + tx (xk − x0k ) dt
∂i
k=1
n
(∂i fk ) (1 − t)x0 + tx t (xk − x0k ) + fk (1 − t)x0 + tx ∂i (xk − x0k ) dt.
=
0
k=1
127
Mit Hilfe der Integrabilit¨atsbedingung und ∂i xk = δik (“Kronecker-delta”) folgt
n
1
(∂k fi ) (1 − t)x0 + tx t (xk − x0k ) + fk (1 − t)x0 + tx δik dt
∂i F (x) =
0
k=1
1
d
fi (1 − t)x0 + tx + fi (1 − t)x0 + tx dt
dt
d
tfi (1 − t)x0 + tx dt = fi (x).
dt
t
=
0
1
=
0
Also ist ∇F = f und F ∈ C 2 (U ).
−x2
, x1
x21 +x22 x21 +x22
Beispiel: Das Vektorfeld f (x1 , x2 ) =
gen¨
ugt der Integrabilit¨ats-
bedingung (5.2) auf der (nicht sternf¨ormigen(!) Menge) R2 \ {0}. Es besitzt aber
kein Potential.
¨
Ubung:
Zeigen Sie dies!
Bemerkung: Es sei U ⊂ R3 offen und sternf¨ormig.
1. Dann ist die wegen rot ◦∇ = 0 notwendige Integrabilit¨atsbedingung rot f =
0 (vgl. die Bemerkung nach (5.2)) f¨
ur ein stetig differenzierbares Vektorfeld
f nach Satz 5.48 auch hinreichend f¨
ur die Existenz eine Potentials F mit
−∇F = f .
2. Die Bedingung div f = 0 ist notwendig f¨
ur die Existenz eines Vektorfeldes
g mit rot g = f , denn rot ◦ div = 0. In der Tat gibt es auch f¨
ur jedes
3
stetig differenzierbare divergenzfreie Vektorfeld f auf U ⊂ R offen und
sternf¨ormig ein Vektorpotential g mit rot g = f .
¨
Ubung:
Zeigen Sie dies! Tipp: O.B.d.A. sei U sternf¨ormig bez¨
uglich 0. Setze dann
1
tf (tx) × x dt.
g(x) =
0
128
Literaturverzeichnis
[Fi] G. Fischer: Lineare Algebra. Vieweg + Teubner, Wiesbaden, 2009.
[For1] O. Forster: Analysis 1. Vieweg + Teubner, Wiesbaden, 2011.
[For2] O. Forster: Analysis 2. Vieweg + Teubner, Wiesbaden, 2011.
[K¨o1] K. K¨onigsberger: Analysis 1. Springer, Berlin, 2009.
[K¨o] K. K¨onigsberger: Analysis 2. Springer, Berlin, 2009.
[Ana 1] B. Schmidt: Analysis 1. Vorlesungsskript, Augsburg, 2014.
129
Document
Kategorie
Seele and Geist
Seitenansichten
114
Dateigröße
854 KB
Tags
1/--Seiten
melden