close

Anmelden

Neues Passwort anfordern?

Anmeldung mit OpenID

Dipl. Sozialarbeiter/in (80

EinbettenHerunterladen
Ralf Gerkmann
Mathematisches Institut der
Ludwig-Maximilians-Universität München
Analysis mehrerer Variablen
(Version vom 18. November 2014)
Inhaltsverzeichnis
§ 1.
Abstände und Winkel im Rn
.................................
3
§ 2.
Bilinearformen und allgemeine Skalarprodukte . . . . . . . . . . . . . . . . . . . .
10
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation . .
18
§ 4.
Normen und Metriken
26
§ 5.
Konvergenz in metrischen Räumen
§ 6.
Stetigkeit
§ 7.
Offene und abgeschlossene Teilmengen
§ 8.
Kompaktheit
.....................................
............................
33
..............................................
39
.........................
49
............................................
56
§ 1. Abstände und Winkel im Rn
Motiviert durch unsere Diskussion im Einleitungsteil stellen wir uns in diesem Abschnitt das Problem, jedem Vektor
v ∈ Rn auf möglichst „natürliche“ Weise eine Zahl v zuzuordnen, die dann als „Länge“ des Vektors v interpretiert
werden kann. Das soll bedeuten, dass die Zuordnung v → v eine Reihe von Bedingungen erfüllt, die durch die
anschauliche Vorstellung nahegelegt werden. Dazu könnte man u.a. die folgenden Bedingungen zählen.
(L 1 ) Für die Einheitsvektoren e 1 , ..., e n ∈ Rn gilt jeweils e i = 1 (1 ≤ i ≤ n).
(L 2 ) Für alle v ∈ Rn gilt v = 0 genau dann, wenn v = 0 ist.
(L 3 ) Skalieren wir einen Vektor v mit einer reellen Zahl λ, dann ändert sich die Länge um den Faktor |λ|. Es gilt also
λv = |λ| v für alle λ ∈ R und v ∈ Rn .
(L 4 ) Es gilt die sog. Dreiecksungleichung v + w ≤ v + w für alle v, w ∈ Rn .
Die Dreiecksungleichung ist durch das folgende Bild motiviert. Offenbar sind die Vektoren v und w zusammen mindestens so lang wie der Vektor v + w.
w
v
v +w
Zugleich werden wir auf dem Rn eine Relation ⊥ definieren, die angibt, ob zwei vorgegebene Vektoren v, w ∈ Rn
senkrecht aufeinander stehen. Auch hier stellen wir eine Reihe von Forderungen, die durch die Anschauung begründet
sind.
(O 1 ) Es gilt e i ⊥ e j für 1 ≤ i < j < n. Die Einheitsvektoren stehen also senkrecht aufeinander. Außerdem gilt v ⊥ 0Rn
für alle v ∈ Rn .
(O 2 ) Die Relation ⊥ ist symmetrisch, d.h. für alle v, w ∈ Rn gilt die Äquivalenz v ⊥ w ⇔ w ⊥ v.
(O 3 ) Sind u, v, w ∈ Rn mit u ⊥ v und u ⊥ w, dann folgt u ⊥ (v + w).
(O 4 ) Sind v, w ∈ Rn mit v ⊥ w, dann gilt v ⊥ (λw) für alle λ ∈ R.
Zum Schluss formulieren wir noch eine Bedingung, die sowohl die Längenfunktion · als auch die Relation ⊥ betrifft:
Für alle v, w ∈ Rn gelte die Äquivalenz
v ⊥w
⇔
v +w
2
= v
2
+ w
—– 3 —–
2
(Satz des Pythagoras)
§ 1.
Abstände und Winkel im Rn
Wir werden nun sehen, dass alle diese Bedingungen nur für eine mögliche Längenfunktion und eine Relation ⊥ gültig
sind. Setzen wir von nun an voraus, dass es sich bei · : Rn → R+ und ⊥ um eine Funktion bzw. Relation handelt, die
alle genannten Bedingungen einschließlich des Satzes von Pythagoras erfüllt.
Lemma 1.1
Sei ⊥ eine Relation auf Rn , die (O 1 ) bis (O 4 ) erfüllt. Für 0 ≤ k < n sei jeweils der
Unterraum Uk von Rn jeweils gegeben durch
Uk
=
〈e 1 , ..., e k 〉R
=
Rk × {0}n−k .
Dann gilt e r ⊥ w für alle w ∈ Uk und k < r ≤ n.
Beweis:
Wir beweisen die Aussage durch vollständige Induktion über k. Im Fall k = 0 ist Uk = {0Rn }, und nach (O 1 )
gilt e r ⊥ 0Rn für 1 ≤ r ≤ n. Sei nun k ∈ {0, ..., n − 1}, und setzen wir die Aussage für k voraus. Sei r > k + 1 und w ∈ Uk+1 .
Dann besitzt w eine Darstellung als Linearkombination der Form w = u + λk+1 e k+1 mit u =
k
i =1 λk e k .
Es gilt u ∈ Uk
und damit nach Induktionsvoraussetzung e r ⊥ u. Außerdem ist nach Bedingung (O 1 ) e r ⊥ e k+1 erfüllt, damit auch
e r ⊥ λk+1 e k+1 nach (O 4 ) und schließlich e r ⊥ (u + λk+1 e k+1 ) ⇔ e r ⊥ w nach (O 3 ).
Der folgende Satz wird durch die untenstehende Zeichnung plausibel: Die Länge
Satz des Pythagoras die Gleichung
des oberen Pfeils die Gleichung
2
3
2
2
des unteren Pfeil erfüllt nach dem
= v 12 + v 22 . Durch nochmalige Anwendung des Satzes erhält man für die Länge
3
= v 12 + v 22 + v 32 .
(v 1 , v 2 , v 3 )
(v 1 , v 2 , 0)
(v 1 , 0, 0)
(0,0,0)
In Dimension n gilt nun entsprechend
Satz 1.2
Für alle v ∈ Rn , v = (v 1 , ..., v n ) gilt v
2
n
=
k=1
Beweis:
v k2 .
Wir beweisen für 0 ≤ k ≤ n durch vollständige Induktion jeweils die Gleichung
v
2
k
=
i =1
λ2i
k
für v =
λi e i .
i =1
k+1
i =1 λi e i . Dann zerlegen
= λk+1 e k+1 . Nach Induktionsvoraussetzung gilt u 2 = ki=1 λ2i . De-
Im Fall k = 0 ist v = 0Rn somit v = 0 nach (L 2 ). Sei nun die Aussage für k bewiesen und v =
wir v = u + w in die Vektoren u =
k
i =1 λi e i
und w
finieren wir Uk = 〈e 1 , ..., e k 〉R , dann steht e k+1 nach Lemma 1.1 senkrecht auf Uk , und nach (O 4 ) folgt u ⊥ w. Außerdem
—– 4 —–
§ 1.
Abstände und Winkel im Rn
gilt w
2
= λk+1 e k+1
2
= λ2k+1 nach (L 1 ) und (L 3 ). Mit dem Satz des Pythagoras erhalten wir
v
2
u
=
2
k
2
+ w
=
i =1
n
i =1 v i e i
Ist nun v ∈ Rn , v = (v 1 , ..., v n ), dann gilt v =
k+1
λ2i + λ2k+1
und damit v
2
=
i =1
λ2i .
n
2
i =1 v i .
=
Gehen wir also davon aus, dass eine Längenfunktion · die Bedingungen (L 1 ) bis (L 4 ) und eine Orthogonalitätsrelation ⊥ die Bedingungen (O 1 ) bis (O 4 ) erfüllen und außerdem der Satz des Pythagoras gelten muss, dann bleibt uns
nichts anderes übrig, als die Länge v eines Vektors v = (v 1 , ..., v n ) ∈ Rn durch
n
v
=
k=1
v k2
zu definieren.
Der nächste Satz zeigt, dass es auch für die Definition der Orthogonalitäts-Relation ⊥ nur eine Möglichkeit gibt.
Satz 1.3
Seien v, w ∈ Rn mit v = (v 1 , ..., v n ) und w = (w 1 , ..., w n ). Unter den oben aufgezählten
Voraussetzungen an die Funktion · und die Relation ⊥ gilt dann
n
v ⊥w
v k w k = 0.
⇔
k=1
Beweis:
Nach dem Satz des Pythagoras gilt v ⊥ w genau dann, wenn v + w
2
= v
2
+ w
2
erfüllt ist. Auf Grund
der bereits gefundenen Formel für die Längenfunktion ist das wiederum äquivalent zu
n
k=1
(v k + w k )2
n
=
k=1
n
v k2 +
k=1
w k2
n
=
k=1
(v k2 + 2v k w k + w k2 )
n
=
k=1
v k2 +
n
k=1
w k2
n
vk wk
=
=
0.
k=1
Das euklidische Standard-Skalarprodukt zweier Vektoren v, w ∈ Rn , v =
Definition 1.4
(v 1 , ..., v n ) und w = (w 1 , ..., w n ) ist gegeben durch
n
〈v, w〉
vk wk .
=
k=1
Wir sagen, die Vektoren v und w stehen senkrecht aufeinander und schreiben v ⊥ w, wenn
〈v, w〉 = 0 gilt. Die euklidische Länge des Vektors v ∈ Rn ist gegeben durch v =
〈v, v〉.
Trotz ähnlicher Schreibweise hat das euklische Skalarprodukt 〈v, w〉 nichts mit dem von {v, w} aufgespannten Untervektorraum zu tun. Um Verwechselungen auszuschließen, werden wir für den erzeugten Untervektorraum von nun
an nur noch die Schreibweise
〈v, w〉R
=
{λv + µw | λ, µ ∈ R}
mit dem Symbol R im Index verwenden.
Proposition 1.5
Das euklidische Standard-Skalarprodukt erfüllt für alle v, v , w, w und λ ∈ R
die folgenden Rechenregeln.
(i)
〈v + v , w〉 = 〈v, w〉 + 〈v , w〉
(iv)
〈v, w〉 = 〈w, v〉
(ii)
〈v, w + w 〉 = 〈v, w〉 + 〈v, w 〉
(v)
〈v, v〉 > 0 falls v = 0Rn
(iii)
〈λv, w〉 = 〈v, λw〉 = λ〈v, w〉
—– 5 —–
§ 1.
Abstände und Winkel im Rn
Beweis: Sämtliche Gleichungen beweist man durch Einsetzen der Definition und einfaches Nachrechnen. Wir führen
dies hier exemplarisch für die Gleichung (i) durch und überlassen die anderen Teile dem Leser als Übung. Seien also
v, v , w ∈ Rn vorgegeben, mit v = (v 1 , ..., v n ), v = (v 1 , ..., v n ) und w = (w 1 , ..., w n ). Dann gilt v + v = (v 1 + v 1 , ..., v n + v n )
und somit
n
n
n
〈v + v , w〉
=
k=1
(v k + v k )w k
vk wk +
=
k=1
k=1
vk wk
=
〈v, w〉 + 〈v , w〉.
Man überprüft unmittelbar, dass die zu Anfang aufgezählten Bedingungen (L 1 ) bis (L 3 ) für die euklidische Länge und
die Bedingungen (O 1 ) bis (O 4 ) von der in Def. 1.4 angegebenen Relation ⊥ erfüllt werden. Auch der Beweis des Satzes
von Pythagoras ist auf Grund der bereits bewiesenen Rechenrgeln für das euklidische Skalarprodukt reine Routine:
Sind v, w ∈ Rn vorgegeben, dann gilt
v +w
2
=
〈v + w, v + w〉
〈v, v〉 + 〈w, v〉 + 〈v, w〉 + 〈w, w〉
Also ist v + w
2
= v
2
+ w
2
〈v + w, v〉 + 〈v + w, w〉
=
v
=
2
+ 2〈v, w〉 + w
=
2
.
genau dann erfüllt, wenn 〈v, w〉 = 0 ist, und dies ist nach Definition äquivalent zu
v ⊥ w. Die einzige Aussage, die sich rechnerisch nicht so leicht überprüfen lässt, ist die Dreiecksungleichung (L 4 ). Wir
werden weiter unten darauf zurückkommen.
Zunächst beschäftigen wir uns hier mit dem Problem, auf möglichst natürliche Weise den Winkel zwischen zwei Vektoren v, w ∈ Rn , v, w = 0Rn zu definieren. Jedem solchen Paar von Vektoren soll eine Zahl ∠(v, w) im Intervall [0, π]
zugeordnet werden. Durch die aus der Elementargeometrie bekannten Gesetze scheint es naheliegend, folgende Eigenschaften von einer solchen Winkelfunktion ∠ zu fordern.
(W1 ) ∠(v, v) = 0, ∠(v, w) = ∠(w, v)
(W2 ) v ⊥ w ⇔ ∠(v, w) = 12 π
w
(W3 ) ∠(v, −w) = π − ∠(v, w)
w −v
(W4 ) ∠(v, λw) = ∠(v, w) für alle λ ∈ R+
(W5 ) Gilt v = w und v ⊥ (w − v), dann gilt cos ∠(v, w) =
v
w
α
.
v
Die Aussage (W5 ) bezeichnen wir auch als Satz am rechtwinkligen Dreieck. Ihre Gültigkeit wird durch die aus der
Schulmathematik bekannte Aussage nahelegt, dass bei in einem rechtwinkligen Dreieck der Kosinus eines nichtrechten Winkels α gleich dem Quotienten aus der Länge der Ankathete des Winkels und der Länge der Hypothenuse
ist. Dies ist auch die geometrisch naheliegendste Möglichkeit, den Kosinus eines Winkels zu definieren.
Wie bei der Längenfunktion kommen wir auch hier wieder zu dem Ergebnis, dass es für die Definition der Winkelfunktion unter diesen Bedingungen nur eine Möglichkeit gibt.
—– 6 —–
§ 1.
Abstände und Winkel im Rn
Sind die vier angegebenen Bedingungen an die Abbildung ∠ erfüllt, dann gilt für alle
Satz 1.6
n
v, w ∈ R mit v, w = 0 die Gleichung
cos ∠(v, w)
Beweis:
〈v, w〉
.
v w
=
Wir unterscheiden beim Beweis der Gleichung insgesamt drei Fälle.
(i) Es gilt w = λv für ein λ > 0.
(ii) Es gilt w = λv für ein λ < 0.
(iii) Die Vektoren v, w sind linear unabhängig.
zu (i) Auf Grund der Bedingungen (W1 ) und (W4 ) gilt ∠(v, w) = ∠(v, λv) = ∠(v, v) = 0. Außerdem gilt 〈v, w〉 = 〈v, λv〉 =
λ v
2
und v
w = |λ| v
2
=λ v
2
, der Bruch auf der rechten Seite der Gleichung hat also den Wert 1. Wegen
cos(0) = 1 ist die Gleichung somit erfüllt.
zu (ii) Sei µ = −λ > 0. Mit den Bedingungen (W1 ), (W3 ) und (W4 ) erhalten wir
∠(v, w)
∠(v, λv)
=
∠(v, µ(−v))
=
Weiter gilt 〈v, w〉 = 〈v, λv〉 = λ〈v, v〉 und v
w = |λ| v
2
=
∠(v, −v)
= −λ v
2
π − ∠(v, v)
=
=
π.
. Der Bruch auf der rechten Seite hat also diesmal
den Wert −1, und wegen cos(π) = −1 ist die Gleichung auch hier erfüllt.
zu (iii) Setzen wir λ = 〈v, w〉/ v
〈v, w 〉
2
, dann steht der Vektor w = w − λv senkrecht auf v, denn es gilt
〈v, w − λv〉
=
=
〈v, w〉 − λ〈v, v〉
〈v, v〉〈v, w〉 〈v, v〉〈v, w〉
−
v 2
v 2
=
=
〈v, w〉 −
〈v, v〉〈v, w〉
v 2
0.
w = w − λv
w
λv
v
Damit steht w auch senkrecht auf λv. Ist nun λ > 0, dann können wir den Satz vom rechtwinkligen Dreieck auf die
Vekoren λv und w anwenden und erhalten
cos ∠(v, w)
=
cos ∠(λv, w)
λv
w
=
=
〈v, w〉 v
·
v 2
w
=
〈v, w〉
.
v w
Im Fall λ = 0 ist die rechte Seite der Gleichung gleich Null, und dasselbe gilt wegen cos( 12 π) = 0 auch für die linke Seite.
Setzen wir nun λ < 0 voraus. Dann ist µ = −λ > 0, und es gilt
∠(v, w)
=
π − ∠(−v, w)
=
π − ∠(−µv, w)
—– 7 —–
=
π − ∠(λv, w).
§ 1.
Abstände und Winkel im Rn
Mit Hilfe der Rechenregeln cos x = cos(−x) und cos(x + π) = − cos x erhalten wir nun
cos ∠(v, w)
− cos ∠(λv, w)
Definition 1.7
=
cos(π − ∠(λv, w))
=
−
λv
w
=
v
w
−(−λ)
=
− cos(−∠(λv, w))
=
〈v, w〉 v
·
v 2
w
=
=
〈v, w〉
.
v w
Der Winkel zwischen zwei Vektoren v, w ∈ Rn , v, w = 0Rn ist die eindeutig be-
stimmte Zahl ∠(v, w) ∈ [0, π] mit
cos ∠(v, w)
〈v, w〉
v w
=
,
wobei auf der rechten Seite 〈v, w〉 das euklidische Standard-Skalarprodukt und v , w jeweils
die euklidische Länge der Vektoren v, w bezeichnet.
Damit der Winkel ∠(v, w) definiert ist, muss die Zahl auf der rechten Seite zwischen −1 und 1 liegen. Dies ist äquivalent
dazu, dass die Cauchy-Schwarzsche Ungleichung |〈v, w〉| ≤ v
w für v, w erfüllt ist. Diese werden wir gleich als
nächstes beweisen. Setzt man diese Ungleichung als bekannt voraus, dann ist die Überprüfung der Eigenschaften
(W1 ) bis (W5 ) für die so definierte Winkelfunktion kein Problem.
Das folgende Lemma wird auch an anderer Stelle noch für uns nützlich sein. Es zeigt, wie man für einen Vektor v 0 der
Längle 1 jeden Vektor w in einen zu v 0 parallelen Anteil u und einen zu v 0 orthogonalen Anteil w − u zerlegen kann.
w
w −u
v0
Lemma 1.8
Beweis:
u
Seien v 0 , w ∈ Rn , wobei v 0 = 1 und u = 〈v 0 , w〉v 0 ist. Dann gilt v 0 ⊥ (w − u).
Dies erhält man unmittelbar durch die Rechung
〈v 0 , w − u〉
=
〈v 0 , w〉 − 〈v 0 , u〉
〈v 0 , w〉 − 〈v 0 , w〉〈v 0 , v 0 〉
Proposition 1.9
=
=
〈v 0 , w〉 − 〈v 0 , 〈v 0 , w〉v 0 〉
〈v 0 , w〉 − 〈v 0 , w〉 · 1
=
=
0.
(Cauchy-Schwarzsche Ungleichung)
Seien v, w ∈ Rn . Dann gilt |〈v, w〉| ≤ v · w mit Gleichheit genau dann, wenn die Vektoren v, w
linear abhängig sind.
—– 8 —–
§ 1.
Abstände und Winkel im Rn
Beweis:
Wir unterscheiden zwei Fälle. Ist v = 0, dann ist die Ungleichung auf jeden Fall erfüllt. Ebenso gilt die
Äquivalenzaussage, denn die Vektoren v, w sind linear abhängig, und es gilt |〈v, w〉| = v · w , weil beide Seiten der
Gleichung Null sind.
Setzen wir nun v = 0 voraus und definieren wir v 0 =
〈v 0 , v 0 〉
1
1
v,
v
v
v
=
1
v
v. Dann gilt
1
〈v, v〉
v 2
=
=
1
〈v, v〉
〈v, v〉
1.
=
Sei nun u = 〈v 0 , w〉v 0 wie in Lemma 1.8. Dann gilt
0
≤
〈w − u, w − u〉
=
〈w, w〉 − 2〈u, w〉 + 〈u, u〉
=
〈w, w〉 − 2〈〈v 0 , w〉v 0 , w〉 + 〈〈v 0 , w〉v 0 , 〈v 0 , w〉v 0 〉
=
〈w, w〉 − 2〈v 0 , w〉〈v 0 , w〉 + 〈v 0 , w〉2 〈v 0 , v 0 〉
〈w, w〉 − 〈v 0 , w〉2
=
=
〈w, w〉 − 2〈v 0 , w〉2 + 〈v 0 , w〉2
〈w, w〉 −
=
〈v, w〉2
〈v, v〉
Dies kann umgeformt werden zu
〈v, w〉2
≤ 〈w, w〉
〈v, v〉
⇔
〈v, w〉2 ≤ 〈v, v〉〈w, w〉
⇔
|〈v, w〉| ≤ v · w
Nun beweisen wir noch die Äquivalenzaussage. Sind v, w linear abhängig, dann gibt es ein λ ∈ R mit w = λv. Es folgt
dann |〈v, w〉| = |λ|〈v, v〉 = λ v
2
λv = v · w . Setzen wir nun voraus, dass die Gleichung erfüllt ist. Durch
= v
die Äquivalenzumformung von oben erhalten wir
〈w − u, w − u〉
⇔
w −u = 0
⇔
w = u = 〈v 0 , w〉v 0 .
Somit ist w ein skalares Vielfaches von v, und v, w sind linear abhängig.
Nun können wir den noch fehlenden Beweis der Dreiecksungleichung ergänzen.
Folgerung 1.10
Die Längenfunktion
· : Rn → R definiert durch v =
〈v, v〉 erfüllt die
n
Ungleichung v + w ≤ v + w für alle v, w ∈ R .
Beweis:
Seien v.w ∈ Rn vorgegeben. Mit Hilfe der Cauchy-Schwarzschen Ungleichung erhalten wir
v +w
2
〈v + w, v + w〉
=
v
2
+2 v
w + w
=
〈v, v〉 + 2〈v, w〉 + 〈w, w〉
2
=
( v + w )2
,
und das Ziehen der Quadratwurzel auf beiden Seiten liefert v + w ≤ v + w .
—– 9 —–
≤
§ 2. Bilinearformen und allgemeine Skalarprodukte
Die Definition des euklidischen Skalarprodukts aus dem letzten Abschnitt ist nur im Rn sinnvoll. Um die damit zusammenhängenden geometrischen Konzepte auf beliebigen R-Vektorräumen zur Verfügung zu haben, müssen wir
die Definition verallgemeinern.
Definition 2.1
Sei V ein R-Vektorraum. Eine Bilinearform auf V ist eine Abbildung b : V ×V →
R, so dass für v, v , w, w ∈ V und λ ∈ R die folgende Bedingungen erfüllt sind.
(i) b(v + v , w) = b(v, w) + b(v , w)
(iii)
b(λv, w) = λb(v, w)
(ii) b(v, w + w ) = b(v, w) + b(v, w )
(iv)
b(v, λw) = λb(v, w)
Die Definition lässt sich auch folgendermaßen formulieren: Eine Bilinearform auf einem R-Vektorraum V ist eine
Abbildung b : V × V → R, so dass
(i) für jedes v ∈ V die Abbildung w → b(v, w) und
(ii) für jedes w ∈ V die Abbildung v → b(v, w)
eine lineare Abbildung V → R ist. Unter anderem lassen sich die folgende Beispiele für Bilinearformen angeben.
(i) Das euklidische Skalarprodukt 〈·, ·〉 : Rn × Rn → R ist eine Bilinearformen auf dem Rn , denn die Rechenregeln
aus Definition Def. 2.1 entsprechen genau den Regeln (i) bis (iii) aus Proposition 1.5.
(ii) Ist A ∈ Mm×n,R und bezeichnet 〈·, ·〉 das euklidische Skalarprodukt auf dem Rm , dann ist durch b(v, w) =
〈Av, Aw〉 eine Bilinearform auf dem Rn definiert. Denn für v, v , w ∈ Rn gilt
b(v + v , w)
=
〈A(v + v ), Aw〉
=
〈Av + Av , Aw〉
〈Av, Aw〉 + 〈Av , Aw〉
=
b(v, w) + b(v , w).
=
Genauso überprüft man die Gültigkeit der Bedingungen (ii) bis (iv).
(iii) Seien V,W zwei R-Vektorraum, b eine Bilinearform auf W und φ : V → W eine lineare Abbildung. Dann
˜ w) = b(φ(v), φ(w)) eine Bilinearform auf V definiert. Hier verifziert man die Bedingung (i) für
ist durch b(v,
v, v , w ∈ V durch die Rechnung
˜ + v , w)
b(v
=
b(φ(v + v ), φ(w))
b(φ(v), φ(w)) + b(φ(v ) + φ(w))
b(φ(v) + φ(v ), φ(w))
=
=
=
˜ w) + b(v,
˜ w ).
b(v,
(iv) Sei V der R-Vektorraum der differenzierbaren Funktionen auf R. Dann ist durch b( f , g ) = f (0)g (0) eine Bilinearform auf V definiert. Hier beweist man die Bedingung (ii) für f , g , h ∈ V durch die Rechnung
b( f , g + h)
=
f (0)(g + h) (0)
=
f (0) g (0) + h (0)
=
f (0)g (0) + f (0)h (0)
Der Beweis der übrigen drei Bedingungen läuft wiederum vollkommen analog.
—– 10 —–
=
b( f , g ) + b( f , h).
§ 2.
Bilinearformen und allgemeine Skalarprodukte
(v) Seien a, b ∈ R mit a < b und V der R-Vektorraum der Riemann-integrierbaren Funktionen auf dem abgeschlossenen Intervall [a, b]. Dann ist durch
b
b( f , g )
f (x)g (x) d x
=
a
eine Bilinearform auf V definiert. Für f , g , h ∈ V gilt beispielsweise
b
b( f + g , h)
=
a
b
( f + g )(x)h(x) d x
b
a
=
f (x) + g (x) h(x) d x
a
=
b
f (x)h(x) d x +
g (x)h(x) d x
a
b( f , h) + b(g , h).
=
Aus der Linearen Algebra ist bekannt, dass eine lineare Abbildung φ : V → W zwischen R-Vektorräumen V,W Linearkombinationen in V auf Linearkombinationen in W abbildet, genau gilt
n
φ
n
λk v k
λk φ(v k )
=
k=1
k=1
für beliebige n ∈ N, v 1 , ..., v n ∈ V und λ1 , ..., λn ∈ R. Ist nun b eine Bilinearform auf V und bezeichnen v, w ∈ V beliebige weitere Vektoren, dann gilt
n
b
n
λk v k , w =
k=1
λk b(v k , w)
n
b v,
und
k=1
n
λk v k =
k=1
λk b(v, v k ).
k=1
Durch zweimalige Anwendung dieser Rechenregel erhält man
n
λk v k ,
b
k=1
n
µ v
n
n
=
λk µ b(v k , v )
k=1 =1
=1
für beliebige λ1 , ..., λn , µ1 , ..., µn ∈ R. Ist insbesondere v 1 , ..., v n eine Basis von V , dann ist b also durch die Werte
b(v k , v ) mit 1 ≤ k, ≤ n bereits eindeutig festgelegt. Dies liefert uns die Möglichkeit, eine Bilinearform auf einem
endlich-dimensionalen R-Vektorraum auf kompakte Art und Weise durch Angabe einer Matrix zu definieren.
Definition 2.2
Sei V ein endlich-dimensionaler R-Vektorrau, B = (v 1 , ..., v n ) eine geordnete
Basis und b eine Bilinearform auf V . Dann nennt man die reelle n × n-Matrix A = (a i j ) mit den
Einträgen
ai j
=
b(v i , v j )
für 1 ≤ i , j ≤ n
die Darstellungsmatrix M B (b) von b bezüglich B.
Wir illustrieren den Begriff der Darstellungsmatrix an einer Reihe von Beispielen.
(i) Sei V = Rn und E die Basis bestehend aus den Einheitsvektoren e 1 , ..., e n . Dann ist die Darstellungsmatrix
des euklidischen Skalarprodukts 〈·, ·〉 bezüglich E die Einheitsmatrix. Denn für alle k,
(n)
〈e k , e 〉 = δk , und dies sind genau die Einträge der Einheitsmatrix I
—– 11 —–
.
mit 1 ≤ k, ≤ n gilt
§ 2.
Bilinearformen und allgemeine Skalarprodukte
(ii) Sei V = R3 . Diesmal betrachten wir das euklidische Skalarprodukt bezüglich einer anderen Basis, nämlich
B = (v 1 , v 2 , v 3 ) bestehend aus den Vektoren v 1 = (1, 0, 2), v 2 = (3, 3, −1) und v 3 = (5, −1, 2). Die erste Zeile der
Darstellungsmatrix M B (b) = (a i j ) erhält man durch die Berechung der Skalarprodukte
a 11 = 〈v 1 , v 1 〉 ,
a 12 = 〈v 1 , v 2 〉 und a 13 = 〈v 1 , v 3 〉 = 9.
Berechnet man nach demselben Schema auch die zweite und dritte Zeile, so erhält man insgesamt die Matrix


5 1
9



M B (b) = 
1 19 10 .
9 10 30
(iii) Sei V der Vektorraum der Polynomfunktionen vom Grad ≤ 1 und die Bilinearform b : V ×V → R definiert durch
1
b( f , g )
f (x)g (x) d x
=
für
0
f , g ∈ V.
Seien nun f 1 , f 2 ∈ V definiert durch f 1 (x) = x und f 2 (x) = x + 1. Dann ist B = ( f 1 , f 2 ) eine geordnete Basis von
V . Es gilt
1
b( f 1 , f 1 )
=
0
f 1 (x)2 d x =
1
=
b( f 2 , f 1 )
=
1
b( f 2 , f 2 )
=
0
0
1
f 1 (x) f 2 (x) d x
f 2 (x)2 d x
1
=
0
=
0
1 3 1
3x 0
=
0
1
b( f 1 , f 2 )
x2 d x
(x 2 + x) d x
(x 2 + 2x + 1) d x
=
=
,
1 3
1 2 1
3x + 2x 0
1
2
1 3
3x +x +x 0
=
1
3
=
=
1
3
1
3
+ 21
+1+1
5
6
=
=
und
8
3.
Wir erhalten somit die Darstellungsmatrix
M B (b)
=
1
6
2
5
5
16
.
Jeder Bilinearform auf einem endlich-dimensionalen R-Vektorraum kann also (nach Wahl einer geordneten Basis)
eine Matrix zugeordnet werden. Umgekehrt existiert zu jeder Matrix eine entsprechende Bilinearform.
Sei V ein n-dimensionaler R-Vektorraum und B = (v 1 , ..., v n ) eine geordnete Ba-
Satz 2.3
sis. Dann gibt es für jede Matrix A ∈ Mn,R eine eindeutig bestimmte Bilinearform b auf V mit
M B (b) = A.
Beweis:
Existenz: Zu einer vorgegebenen n ×n-Matrix A = (a i j ) definieren wir eine Abbildung b : V ×V → R, indem
wir einem Paar von Vektoren (v, w) ∈ V × V mit den (eindeutig bestimmten) Basisdarstellungen v =
w=
n
j =1 µ j v j , λi , µ j
n
i =1 λi v i
und
∈ R für 1 ≤ i , j ≤ n das Bild
n
b(v, w)
n
=
λi µ j a i j
zuordnen.
i =1 j =1
Dann gilt insbesondere b(v i , v j ) = a i j für 1 ≤ i , j ≤ n. Es muss nun überprüft werden, dass auf diese Weise tatsächlich
eine Bilinearform auf V definiert ist. Wir beschränken uns auf den Nachweis der Gleichung b(v + v , w) = b(v, w) +
—– 12 —–
§ 2.
Bilinearformen und allgemeine Skalarprodukte
n
i =1 λi v i ,
b(v , w) für alle v, v , w ∈ V . Seien also v, v , w ∈ V mit den Basisdarstellungen v =
n
j =1 µ j v j . Dann besitzt der Vektor
v + v die Basisdarstellung
n
b(v + v , w)
n
i =1 (λi
n
=
i =1 j =1
n
(λi + λi )µ j a i j
v =
n
i =1 λi v i ,
w =
+ λi )v i , und es folgt
n
λi µ j a i j +
=
n
n
i =1 j =1
i =1 j =1
λi µ j a i j
b(v, w) + b(v , w).
=
Der Beweis der Gleichungen b(v, w + w ) = b(v, w) + b(v, w ) und b(λv, w) = b(v, λw) = λb(v, w) für v, v , w ∈ V und
λ ∈ R funktioniert nach demselben Schema.
Eindeutigkeit: Seien b, b zwei Bilinearformen mit b(v i , v j ) = b (v i , v j ) = a i j für 1 ≤ i , j ≤ n. Seien v, w ∈ V mit Basisdarstellungen v =
n
i =1 λi v i
n
j =1 µ j v j .
und w =
Durch Anwendung der der Bilinearität der Abbildung b erhalten
wir
n
b(v, w)
=
λi v i , w
b
n
=
=
i =1
i =1
n
n
=
λi µ j b(v i , v j )
und überprüft man die Gleichung b (v, w) =
λi b v i ,
n
n
=
λi µ j a i j
n
µj v j
j =1
i =1
i =1 j =1
Definition 2.4
n
λi b(v i , w)
,
i =1 j =1
n
i =1
n
j =1 λi µ j a i j .
Eine Bilinearform b auf einem R-Vektorraum V wird symmetrisch genannt,
wenn b(v, w) = b(w, v) für alle v, w ∈ V gilt.
Alle bisher behandelten Beispiele von Bilinearformen, insbesondere das euklidische Standard-Skalarprodukt auf dem
Rn , sind symmetrisch. Eine Matrix A ∈ Mn,R bezeichnet man als symmetrisch, wenn A = t A gilt.
Proposition 2.5
Sei V ein n-dimensionaler R-Vektorraum und b eine Bilinearform auf V . Sei
B eine beliebige Basis von V und A = M B (b). Unter diesen Voraussetzungen ist b genau dann
symmetrisch, wenn A symmetrisch ist.
Beweis:
Sei A = (a i j ) und B = (v 1 , ..., v n ). Nach Definition der Darstellungsmatrix gilt b(v i , v j ) = a i j für 1 ≤ i , j ≤ n.
Sei die Abbildung b˜ : V × V → R gegeben durch
˜ w)
b(v,
=
b(w, v)
für alle v, w ∈ V.
Man überprüft unmittelbar, dass auch b˜ eine Bilinearform ist. Offenbar ist b genau dann symmetrisch, wenn b = b˜
˜ i , v j ) = b(v j , v i ) = a j i für 1 ≤ i , j ≤ n gilt MB (b)
˜ = t A. Nach Satz 2.3 stimmen zwei Bilinearformen
gilt. Wegen b(v
genau dann überein, wenn ihre Darstellungsmatrizen gleich sind. Also ist b = b˜ äquivalent zu A = t A.
Definition 2.6
Eine symmetrische Bilinearform b auf einem R-Vektorraum V wird positiv defi-
nit genannt, wenn b(v, v) > 0 für alle v ∈ V mit v = 0 gilt. Man bezeichnet eine solche Bilinearform
auch als Skalarprodukt auf V . Ein Paar (V, b) bestehend aus einem R-Vektorraum V und einem
Skalarprodukt b auf V ist ein euklidischer Vektorraum.
—– 13 —–
§ 2.
Bilinearformen und allgemeine Skalarprodukte
Nach Proposition 1.5 (v) ist das euklidische Standard-Skalarprodukt positiv definit. Wir zeigen, dass auch die symmetrische Bilinearform b aus Beispiel (iii) auf dem R-Vektorraum der Polynomfunktionen vom Grad ≤ 1 positiv definit
ist. Sei f ∈ V , f (x) = ax + b mit a, b ∈ R. Dann gilt
1
b( f , f )
=
f (x)2 d x
0
1
=
2
2 1
1 2 3
3 a x + abx + b x 0
0
1
(ax + b)2 d x
=
=
0
2
1 2
3 a + ab + b
3 2
1 2
1 2
3 a + ab + 4 b + 4 b
a
=
3
=
+
(a 2 x 2 + 2abx + b 2 ) d x
2
1 2
3 a + ab + b
b 3
2
=
=
2
+ 14 b 2 .
Es ist also stets b( f , f ) ≥ 0, und aus b( f , f ) = 0 folgt a = b = 0 und somit f = 0.
Euklidische Vektorräume (V, b) besitzen in vielerlei Hinsicht ähnliche Eigenschaften wie der Rn mit dem euklidischen
Standard-Skalarprodukt. Beispielsweise kann durch v
b
b(v, v) auf V eine Längenfunktion und durch v ⊥b w ⇔
=
b(v, w) = 0 eine Orthogonalitätsrelation auf V definiert werden. Auch die Cauchy-Schwarzsche Ungleichung bleibt,
wie wir gleich sehen werden, gültig. Allerdings können euklidische Vektorräume auch unendlich-dimensional sein.
Lemma 2.7 Sei V ein R-Vektorraum und b eine symmetrische Bilinearform auf V . Seien v 0 , w ∈
V , wobei v 0
Beweis:
b
= 1 und u = b(v 0 , w)v 0 ist. Dann gilt v 0 ⊥b (w − u).
Genau wie in Lemma 1.8 folgt dies aus der Rechnung
b(v 0 , w − u)
=
b(v 0 , w) − b(v 0 , u)
b(v 0 , w) − b(v 0 , w)b(v 0 , v 0 )
Satz 2.8
=
=
b(v 0 , w) − b(v 0 , b(v 0 , w)v 0 )
b(v 0 , w) − b(v 0 , w) · 1
=
0.
=
In jedem euklidischen Vektorraum (V, b) gilt für alle v, w ∈ V
(i) die Cauchy-Schwarzsche Ungleichung |b(v, w)| ≤ v
(ii) die Dreiecksungleichung v + w
b
≤ v
b
+ w
b
w
b
b.
Dabei ist die Ungleichung (i) genau dann mit Gleichheit erfüllt, wenn v, w linear abhängig sind.
Beweis:
Die Beweise stimmen fast wortwörtlich mit denen in Proposition 1.9 und Folgerung 1.10 überein. Wieder
unterscheiden zwei Fälle. Ist v = 0, dann ist |b(v, w)| ≤ v
b
w
b
sogar mit Gleichheit erfüllt, weil beide Seiten gleich
Null sind. Ebenso gilt hier die Äquivalenzaussage, denn die Vektoren v, w sind linear abhängig. Setzen wir nun v = 0
voraus und definieren wir v 0 =
v
b
1
v b
v; dies ist möglich, weil aus v = 0 die Ungleichung b(v, v) > 0 und damit auch
= 0 folgt. Es gilt nun
b(v 0 , v 0 )
=
b
1
1
v,
v
v b
v b
=
—– 14 —–
1
b(v, v)
b(v, v)
=
1.
§ 2.
Bilinearformen und allgemeine Skalarprodukte
Sei nun u = b(v 0 , w)v 0 wie in Lemma 2.7. Dann gilt
0
≤
b(w − u, w − u)
=
b(w, w) − 2b(u, w) + b(u, u)
b(w, w) − 2b(b(v 0 , w)v 0 , w) + b(b(v 0 , w)v 0 , b(v 0 , w)v 0 )
b(w, w) − 2b(v 0 , w)2 + b(v 0 , w)2 b(v 0 , v 0 )
b(w, w) − b(v 0 , w)2
=
=
=
=
b(w, w) −
b(v, w)2
b(v, v)
Dies kann umgeformt werden zu
b(v, w)2
≤ b(w, w)
b(v, v)
b(v, w)2 ≤ b(v, v)b(w, w)
⇔
|b(v, w)| ≤ v
⇔
b
w
b.
Auch der Beweis der Äquivalenzaussage läuft wieder vollkommen analog. Wenden wir uns nun der Dreiecksungleichung zu. Es gilt
b(v + w, v + w)
=
b(v, v) + 2b(v, w) + b(w, w)
≤
v
b
+2 v
b
w
2
b
+ w
2
b
=
( v
b
+ w
2
b)
,
und die Dreiecksungleichung folgt durch Wurzelziehen auf beiden Seiten.
Definition 2.9
Eine Norm auf einem R-Vektorraum V ist eine Abbildung · : V → R+ , die
folgende Bedingungen erfüllt.
(i) Für alle v ∈ V gilt v = 0 genau dann, wenn v = 0V ist.
(ii) Es gilt λv = |λ| v für alle λ ∈ R und v ∈ V .
(iii) Für alle v, w ∈ V gilt v + w ≤ v + w .
Das Paar (V, · ) bezeichnet man als normierten Vektorraum.
Viele Normen kommen durch Skalarprodukte zu Stande.
Satz 2.10
Ist (V, b) ein euklidischer Vektorraum, dann ist durch v
V definiert. Man bezeichnet ·
Beweis:
b
b
=
b(v, v) eine Norm auf
als die durch b induzierte euklidische Norm.
Die Dreiecksungleichung, also Teil (iii) der Definition einer Norm, haben wir für ·
b
in Satz 2.8 bereits
verifiziert. Weil b positiv definit ist, gilt für alle v ∈ V auch die Äquivalenz
v
b
=0
⇔
v
also (i). Für alle λ ∈ R und v ∈ V gilt auch λv
liefert λv
b
= |λ| v
b
2
b
2
b
=0
⇔
b(v, v) = 0
⇔
v = 0V
= b(λv, λv) = λ2 b(v, v) = λ2 v
2
.
b
Wurzelziehen auf beiden Seiten
und somit Bedingung (ii).
Nicht jede Norm auf einem Vektorraum V wird durch ein Skalarprodukt induziert. Ob dies für eine vorgegebene Norm
der Fall ist, kann mit Hilfe des folgenden geometrischen Kriteriums überprüft werden.
—– 15 —–
§ 2.
Bilinearformen und allgemeine Skalarprodukte
Satz 2.11
Sei V ein R-Vektorraum. Eine Norm · auf V wird genau dann durch ein Skalarpro-
dukt b induziert, wenn für alle v, w ∈ V die sog. Parallelogrammgleichung
v +w
2
+ v −w
2
2( v
=
2
+ w
2
)
erfüllt ist.
v +w
w
v −w
v
Beweis:
„⇒“ Sei b ein Skalarprodukt mit · = ·
b . Wir müssen überprüfen, dass die Parallelogrammgleichung in
diesem Fall gültig ist. Tatsächlich gilt für alle v, w ∈ V die Gleichung
v +w
2
+ v −w
2
b(v + w, v + w) + b(v − w, v − w)
=
b(v, v) + 2b(v, w) + b(w, w) + b(v, v) − 2b(v, w) + b(w, w)
2b(v, v) + 2b(w, w)
=
2
v
2
+ w
2
=
=
.
Der Beweis der Richtung „⇐“ ist deutlich aufwändiger und wird deshalb hier nicht wiedergegeben.
Sei (V, b) ein euklidischer Vektorraum. Dann gilt für beliebige Vektoren 0V = v, w ∈ V jeweils −1 ≤
b(v,w)
v b w b
≤ 1. Aus
diesem Grund ist nun auch hier die folgende Definition sinnvoll.
Definition 2.12
Sei (V, b) ein euklidischer Vektorraum. Der Winkel zwischen zwei Vektoren
v, w ∈ V mit v, w = 0V ist die eindeutig bestimmte Zahl
cos (v, w)
=
(v, w) ∈ [0, π] mit
b(v, w)
.
v b w b
Zwei Vektoren v, w ∈ V sind bezüglich b orthogonal (v ⊥b w), wenn b(v, w) = 0 ist.
Zum Ende dieses Abschnitts kommen wir noch einmal auf die Darstellungsmatrizen einer Bilinearform zurück und
betrachten diese bezüglich unterschiedlicher Basen. Zunächst führen wir die folgende Konvention ein: Ist K ein Körper, dann werden alle Elemente im K n als Spaltenvektoren, also als (n × 1)-Matrix, aufgefasst. Für jedes v ∈ K n bezeichnet t v dann den zugehörigen Zeilenvektor, also eine (1 × n)-Matrix.
Sei nun V ein endlich-dimensionaler R-Vektorraum mit einer Basis b und B = (v 1 , ..., v n ) eine geordnete Basis von
V . In der Linearen Algebra haben wir jedem v ∈ V einen Koordinatenvektor ΦB (v) = t (λ1 , ..., λn ) ∈ Rn zugeordnet,
dessen Einträge λk ∈ R die Gleichung v =
Proposition 2.13
n
λ v
k=1 k k
erfüllen.
Unter den angegebenen Voraussetzungen gilt für alle v, w ∈ V jeweils
b(v, w)
=
t
ΦB (v)MB (b)ΦB (w).
—– 16 —–
§ 2.
Bilinearformen und allgemeine Skalarprodukte
Beweis:
Diese Gleichung kann direkt nachgerechnet werden. Sei ΦB (v) = t (λ1 , ..., λn ) und ΦB (w) = t (µ1 , ..., µn ).
Dann gilt v =
n
λ v
k=1 k k
und w =
n
µ
=1
t
v , und die Einträge a k der Darstellungsmatrix MB (b) sind durch b(v k , v )
gegeben, für 1 ≤ k, ≤ n. Das Produkt ΦB (v)MB (b) ist ein Zeilenvektor der Länge n. Bezeichnen wir dessen Einträge
mit λ˜ 1 , ..., λ˜ n , dann gilt nach Definition des Matrix-Vektor-Produkts jeweils
n
λ˜
λk b(v k , v )
=
für 1 ≤ ≤ n.
k=1
Für die rechte Seite der Gleichung erhalten wir damit insgesamt den Wert
n
λ˜ µ
n
n
n
λk b(v k , v ) µ
=
λk µ b(v k , v ).
k=1 =1
=1 k=1
=1
n
=
Auf der linken Seite der Gleichung gilt
n
b(v, w)
=
b
λk v k ,
k=1
n
n
µ w
n
=
λk µ b(v k , v ).
k=1 =1
=1
Also stimmen die beiden Seiten überein.
Im Beispiel (ii) auf Seite 12 oben hat der Vektor v = v 1 +v 2 +v 3 bezüglich der Basis B = (v 1 , v 2 , v 3 ) den Darstellungsvektor ΦB (v) = t (1, 1, 1). Mit Hilfe der Darstellungsmatrix des euklidischen Standard-Skalarprodukts bezüglich B können
wir den Wert 〈v, v〉 ausrechnen. Es gilt
〈v, v〉
t
=
ΦB (v)MB (b)ΦB (v)
=
1

5


1 1
9
1
1
 
1
 


10 1

30 1
 
1
 

49 1

1
9
19
10
=
15
30
=
94.
Andererseits können wir 〈v, v〉 natürlich auch direkt ausrechnen. Es gilt v = v 1 + v 2 + v 3 = (9, 2, 3) und somit 〈v, v〉 =
92 + 22 + 32 = 94.
Satz 2.14
(Transformationsformel für Bilinearformen)
Sei V ein n-dimensionaler R-Vektorraum und b eine Bilinearform auf V . Seien A und B zwei
geordnete Basen von V und A = M A (b), B = M B (b) die Darstellungsmatrizen von b bezüglich
A
dieser Basen. Sei T = TB
die Matrix des Basiswechsels von A nach B. Dann gilt A = t T BT .
Beweis:
Sei A = (a i j ), B = (b i j ) und T = (t i j ). Wir überprüfen, dass t T BT die Darstellungsmatrix von b bezüglich
A ist und beweisen auf diesem Weg die Gleichung A = t T BT . Der Eintrag der Matrix C = BT an der Stelle (k, ) ist
ck =
n
j =1 b k j t j
. Der Eintrag von t T C = t T BT an der Stelle (k, ) ist folglich durch die Summe
n
n
ti k ci
i =1
n
n
ti k bi j t j
=
n
ti k t j bi j
=
i =1 j =1
gegeben.
i =1 j =1
Sei A = (v 1 , ..., v n ) und B = (w 1 , ..., w n ). Weil T die Matrix des Basiswechsels von A nach B ist, gilt v k =
1 ≤ k ≤ n. Für 1 ≤ k, ≤ n ist somit
n
b(v k , v )
=
b
n
ti k w i ,
i =1
n
tj wj
j =1
n
n
t i k t j b(w i , w j )
=
k=1 =1
Also ist t T BT tatsächlich die Darstellungsmatrix von b bezüglich der Basis A .
—– 17 —–
n
ti k t j bi j .
=
k=1 =1
n
i =1 t i k w i
für
§ 3. Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
Definition 3.1 Sei V ein n-dimensionaler R-Vektorraum und b eine symmetrische Bilinearform
auf V . Eine Basis B = (v 1 , ..., v n ) von V wird Orthonormalbasis (kurz ON -Basis) genannt, wenn
b(v k , v )
δk
=
für 1 ≤ k, ≤ n
erfüllt ist.
Mit anderen Worten, die Darstellungsmatrix MB (b) ist die Einheitsmatrix.
Die Einheitsvektoren e 1 , ..., e n bilden eine ON -Basis des Rn bezüglich des euklidischen Standard-Skalarprodukts,
denn es gilt 〈e i , e j 〉 = δi j für 1 ≤ i , j ≤ n. Für den trivialen R-Vektorraum V = {0V } mit der Bilinearform gegeben
durch b(0V , 0V ) = 0 sehen wir das leere Tupel
als ON-Basis an. Wir werden nun zeigen, dass in jedem endlich-
dimensionalen euklidischen Vektorraum eine ON -Basis exisiert.
Sei (V, b) ein R-Vektorraum mit einer symmetrischen Bilinearform und U ein
Definition 3.2
Untervektorraum. Eine Orthogonalprojektion von V auf U ist eine lineare Abbildung πU : V → U
mit der Eigenschaft πU |U = idU und (v − πU (v)) ⊥b U für alle v ∈ V .
Dabei bedeutet w ⊥b U für einen Vektor w ∈ V und einen Untervektorraum U , dass v ⊥b u für alle u ∈ U gilt.
v
πU (v)
U
Sei (V, b) ein R-Vektorraum mit einer symmetrischen Bilinearform. Sei U ⊆ V
Proposition 3.3
ein Untervektorraum der endlichen Dimension n und (u 1 , ..., u n ) eine ON-Basis von U . Dann ist
durch
πU (v)
n
b(u k , v)u k
=
eine Orthogonalprojektion auf U definiert.
k=1
Beweis:
Als erstes überprüfen wir, dass πU linear ist. Seien v, w ∈ V und λ ∈ R vorgegeben. Dann gilt
πU (v + w)
n
n
b(u k , v + w)u k
=
k=1
n
(b(u k , v) + b(u k , w))u k
=
k=1
k=1
πU (v) + πU (w)
=
und ebenso
πU (λv) =
n
k=1
b(u k , λv)u k =
n
b(u k , v)u k +
=
n
λb(u k , v)u k = λ
k=1
—– 18 —–
n
k=1
b(u k , v)u k = λπU (v).
b(u k , w)u k
k=1
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
Sei nun v ∈ V vorgegeben. Zunächst zeigen wir, dass v − πU (v) auf jedem Basisvektor u mit 1 ≤ ≤ n senkrecht steht.
Es gilt
b(u , v − πU (v))
n
n
=
b(u k , v)u k
b u ,v −
=
=
b(u , v) − b(u , v)
=
k=1
k=1
n
n
b(u k , v)b(u , u k )
b(u , v) −
b(u , b(u k , v)u k )
b(u , v) −
b(u k , v)δ
b(u , v) −
=
n
λ
=1
Ist nun u ∈ U beliebig, dann gibt es λ1 , ..., λn ∈ R mit u =
b(u, v − πU (v))
k
=
0.
k=1
k=1
n
=
λ u , v − πU (v)
b
u . Wir erhalten
n
=
λ b(u , v − πU (v))
n
=
0.
=1
=1
=1
λ ·0
=
Es gilt also (v − πU (v)) ⊥ U . Zum Beweis der zweiten Eigenschaft einer Orthogonalprojektion sei u ∈ U vorgegeben.
Dann gibt es λ1 , ..., λn ∈ R mit u =
πU (u)
n
=
k=1
λk πU (u k )
n
λ u . Auf Grund der Linearität von πU
k=1 k k
n
=
λk
k=1
n
n
b(u , u k )u
=
λk
k=1
=1
n
erhalten wir
δ ku
=1
n
1λk u k
=
=
u
,
k=1
also πU (u) = u = idU (u) wie gewünscht.
Satz 3.4
(Gram-Schmidt-Orthonormalisierung)
Sei (V, b) ein euklidischer Vektorraum.
(i) Sei U ein Untervektorraum der endlichen Dimension n ∈ N0 von V , (u 1 , ..., u n ) eine ONBasis und U ⊇ U ein (n + 1)-dimensionaler Untervektorraum. Dann existiert ein Vektor
u n+1 ∈ U , so dass (u 1 , ..., u n , u n+1 ) eine ON-Basis von U ist.
(ii) Jeder endlich-dimensionale euklidische Vektorraum besitzt eine ON-Basis.
Beweis:
zu (i) Sei v ∈ U \ U beliebig gewählt und w = v − πU (v). Dann gilt w ⊥b U nach Proposition 3.3. Setzen
wir u n+1 =
1
|w| w,
dann gilt b(u n+1 , u n+1 ) = 1 = δn+1,n+1 . Weil mit w auch u n+1 auf U senkrecht steht, gilt außerdem
b(u k , u n+1 ) = b(u n+1 , u k ) = 0 = δk,n+1 für 1 ≤ k ≤ n. Für alle k, mit 1 ≤ k, ≤ n ist b(u k , u ) = δk erfüllt, weil (v 1 , ..., v n )
eine ON-Basis von U ist. Insgesamt ist (u 1 , ..., u n+1 ) also eine ON-Basis von U .
zu (ii) Wir beweisen die Aussage durch vollständige Induktion über die Dimension. Die nulldimensionalen euklidischen Vektorräume besitzen das leere Tupel
als ON-Basis. Sei nun n ∈ N0 , und setzen wir die Aussage für n voraus.
Sei (V, b) ein euklidischer Vektorraum mit dimV = n + 1. Bezeichnen wir mit U einen beliebigen n-dimensionalen
Untervektorraum von V , dann existiert nach Induktionsvoraussetzung eine ON-Basis von U . Nach Teil (i) können wir
diese zu einer ON-Basis von V erweitern.
Der Beweis von Satz 3.4 enthält bereits eine Anleitung, wie man ON-Basen von endlich-dimensionalen euklidischen
Vektorräumen konkret ausrechnet. Als konkretes Beispiel schauen wir uns an, wie man im Vektorraum V = R3 mit
dem euklidischen Standard-Skalarprodukt den Vektor u 1 =
1 t
3 (1, 2, 2) ∈ V
—– 19 —–
zu einer ON-Basis von V erweitert.
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
Wegen b(u 1 , u 1 ) = 91 (12 + 22 + 22 ) = 1 ist das Tupel (u 1 ) eine ON-Basis von U1 = 〈u 1 〉. Die Orthogonalprojektion auf πU1
ist nach Proposition 3.3 durch πU1 (v) = 〈u 1 , v〉u 1 gegeben. Der Vektor w 2 = e 2 − πU1 (e 2 ) ist gegeben durch
e 2 − 〈u 1 , e 2 〉u 1
=
 
1
 
2 
 
2
   
0
1
   
2 , 1
   
0
2
 
0
  1
1  −
  9
0
 
 
0
1
  2 
1  − 2 
  9 
0
2
=

1
9
=
−2

 
 5 .
 
−4
Die Rechnung zeigt auch, dass e 2 nicht in U1 enthalten ist, weil sonst πU1 (e 2 ) = e 2 wäre. Für den Vektor w 2 gilt w 2
1
45
2
2
2
81 ((−2) + 5 + (−4) ) = 81
=
5
9,
also w 2 =
1
3
5. Setzen wir u 2 =
1
w2
w2 =
3 t
(−2, 5, −4),
5
2
=
dann ist (u 1 , u 2 ) eine ON-
Basis von U2 = 〈u 1 , u 2 〉, und die Orthogonalprojektion auf U2 ist durch πU2 (v) = 〈u 1 , v〉u 1 + 〈u 2 , v〉u 2 gegeben.
Um (u 1 , u 2 ) zu einer Basis von V zu vervollständigen, setzen wir w 3 = e 3 − πU3 (e 3 ). Es gilt
w3
=
e 3 − 〈u 1 , e 3 〉u 1 − 〈u 2 , e 3 〉u 2
=
 
 
 
0
1
−2
  1
 
 
0 − · 2 · 2 − 1 · (−4) ·  5 
  9
  45
 
1
2
−4
 
 


0
10
8
  1   1 

0 − 20 − −20
  45   45 

1
20
16
Es gilt b(w 3 , w 3 ) =
1
2
2
2
25 ((−2) + 0 + 1 )
3
   
0
1
   
2  , 0 
   
1
2
 
0
  1
0 −
  9
1
= 15 , also w 3 =
 
1
  1
2  −
  45
2
  
0
   
 5  , 0 
   
1
−4

−2
=
 
 


0
2
8
  1  1 

0 − 4 − −20
  9   45 

1
4
16
=


−18


1 

45  0 
9
1
.
5

=
1
5
Setzen wir u 3 =
1
w3
−2
 
−2
 
5
 
−4
=
=

 
 0 .
 
1
w3 =
5w 3 =
1 t
(−2, 0, 1),
5
dann ist
(u 1 , u 2 , u 3 ) eine ON-Basis von R . Es empfiehlt sich, zur Sicherheit die Gleichungen 〈u k , u 〉 = δk für 1 ≤ k, ≤ 3 am
Ende der Rechnung noch einmal zu überprüfen.
Bisher haben wir noch kein Kriterium zur Verfügung, mit dem sich anhand der Darstellungsmatrix feststellen lässt, ob
eine Bilinearform ein Skalarprodukt definiert. Mit Hilfe der Orthogonalprojektionen sind wir nun in der Lage, dafür
ein Kriterium anzugeben.
Definition 3.5
Eine Matrix A ∈ Mn,R wird als positiv definit bezeichnet, wenn die (eindeutig
bestimmte) Bilinearform b auf Rn mit der Darstellungsmatrix ME n (b) = A bezüglich der Einheitsbasis E n positiv definit ist.
Nach Proposition 2.13 ist A genau dann positiv definit, wenn t v Av > 0 für alle v ∈ Rn mit v = 0 gilt.
Satz 3.6
(Hurwitz-Kriterium)
Sei A ∈ M (n, R) eine symmetrische Matrix und A k jeweils die linke obere k × k-Teilmatrix, für
1 ≤ k ≤ n. Genau dann ist A positiv definit, wenn det(A k ) > 0 für 1 ≤ k ≤ n erfüllt ist.
—– 20 —–
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
Zunächst zeigen wir an einem Beispiel, wie man das Kriterium anwendet. Die Matrix A ∈ M3,R gegeben durch
A

5

1

9
=

1
9
19

10

10
30
ist positiv definit, denn es gilt
det((5)) = 5 > 0 ,
det
5
1
1
19
det A = 961 > 0.
> 0 und
Beweis des Hurwitz-Kriteriums:
Wir führen folgende Bezeichnungen ein: Für k ∈ {1, ..., n} sei E k = (e 1 , ..., e k ) jeweils das k-Tupel bestehend aus den
ersten k Einheitsvektoren im Rn . Dann spannt E k jeweils den Untervektorraum Uk = 〈E k 〉 = Rk × {0}n−k von Rn auf.
Wir bezeichnen mit b die eindeutig bestimmte Bilinearform auf Rn mit der Darstellungsmatrix A und mit b k jeweils
die Einschränkung von b auf den Untervektorraum Uk . Nach Definition der Darstellungsmatrix gilt A k = M E k (b k ) für
1 ≤ k ≤ n.
„⇒“ Ist A positiv definit, dann gibt es nach dem Satz Satz 3.4 eine Basis B = (v 1 , ..., v n ), so dass Bk = (v 1 , ..., v k ) jeweils
eine ON-Basis von Uk ist, für 1 ≤ k ≤ n. Nach Definition gilt I(k) = MBk (b k ) für 1 ≤ k ≤ n, die Darstellungsmatrizen
E
bezüglich Bk sind also die Einheitsmatrizen. Setzen wir nun Tk = TBk für jedes k, dann erhalten wir nach Satz 2.14
k
jeweils
Ak
=
ME k (b k )
t
=
E
E
TBk M Bk (b k )TBk
k
k
t
=
Tk I(k) Tk
t
=
Tk Tk
und folglich det(A k ) = det(Tk )2 > 0. Denn als Matrix des Basiswechsels ist Tk invertierbar und deshalb det(Tk ) = 0.
„⇐“ Hier zeigen wir durch vollständige Induktion über k, dass die Bilinearform b k auf Uk positiv definit ist. Setzen
wir A = (a k ), dann gilt A 1 = (a 11 ), und aus det(A 1 ) > 0 folgt a 11 > 0. Dies wiederum bedeutet, dass b 1 positiv definit ist.
Für jeden Vektor v ∈ U1 mit v = 0 gibt es nämlich ein λ ∈ R× mit v = λe 1 , und es folgt b(v, v) = λ2 b(e 1 , e 1 ) = λ2 a 11 > 0.
Damit ist der Induktionsanfang abgeschlossen.
Sei nun k ∈ N mit 1 ≤ k < n und setzen wir voraus, dass b k positiv definit ist. Nach Satz 3.4 besitzt Uk eine ON-Basis
(u 1 , ..., u k ) bezüglich b k . Setzen wir nun w = e k+1 − πUk (e k+1 ), dann gilt w ⊥bk Uk nach Definition der Orthogonalprojektion πUk . Mit e k+1 ist außerdem auch w in Uk+1 \Uk enthalten. Dies zeigt, dass durch B = (u 1 , ..., u k , w) eine Basis
von Uk+1 gegeben ist. Auf Grund der ON-Eigenschaft von (u 1 , ..., u k ) und wegen w ⊥bk Uk hat b k+1 bezüglich B die
Darstellungsmatrix
MB (b k+1 )
=
I(k)
0
0
a
,
E
mit einem geeigneten a ∈ R. Setzen wir nun T = TBk+1 , dann gilt wegen Satz 2.14 die Gleichung
A k+1
=
ME k+1 (b k+1 )
=
t
E
E
TBk+1 MB (b k+1 )TBk+1
=
t
T
I(k)
0
0
a
T.
Es folgt det(A k+1 ) = det(T )2 a. Nach Voraussetzung ist det(A k+1 ) > 0, daraus folgt a > 0. Damit können wir nun zeigen,
dass b k+1 positiv definit ist. Sei v ∈ Uk+1 mit v = 0. Setzen wir t (λ1 , ..., λk+1 ) = ΦB (v), dann ist mindestens ein λ
—– 21 —–
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
ungleich Null, und folglich gilt nach Proposition 2.13 dann

λ1
 . 

0 
 .. 



a 
 λk 
b k+1 (v, v)
=
λ1
···
λk
I(k)
λk+1
0
λ1
=
···
λk
aλk+1
λk+1
k
=
λ2 + aλ2k+1
>

λ1
 . 
 . 
 . 


 λ 
 k 
λk+1


0.
=1
Eine Matrix A ∈ Mn,R wird orthogonal genannt, wenn t A A = I(n) gilt.
Eine Matrix A ∈ Mn,C heißt unitär, wenn t A¯ A = I(n) und hermitesch, wenn t A¯ = A gilt.
Definition 3.7
Wie man leicht überprüft, ist für zwei orthogonale Matrizen A, B auch das Produkt AB und die inverse Matrix A −1
orthogonal. Die orthogonalen Matrizen bilden also eine Gruppe, die sogenannte orthogonale Gruppe. Ebenso bilden
die unitären Matrizen die sogenannte unitäre Gruppe.
Das euklidische Skalarprodukt, das wir zu Beginn eingeführt haben, lässt sich durch
n
〈v, w〉
v¯k w k
=
für v = (v 1 , ..., v n ), w = (w 1 , ..., w n )
k=1
zu einer Abbildung Cn × Cn → C ausdehnen. Wie man durch Nachrechnen unmittelbar überprüft, hat diese die Eigenschaft
〈v + v , w〉〈v, w〉 + 〈v , w〉 ,
〈v, w + w 〉 = 〈v, w〉 + 〈v, w 〉 ,
〈v, λw〉 = λ〈v, w〉
und
¯ w〉 ,
〈λv, w〉 = λ〈v,
〈w, v〉 = 〈v, w〉
für alle v, v , w, w ∈ Cn und λ ∈ C, wobei λ¯ jeweils die zu λ konjugiert-komplexe Zahl bezeichnet. Auf Grund dieser
Rechenregeln spricht man von einer hermiteschen Sesquilinearform auf dem komplexen Vektorraum Cn .
Satz 3.8
(i) Eine Matrix A ∈ Mn,R ist genau dann orthogonal, wenn 〈Av, Aw〉 = 〈v, w〉 und symmetrisch genau dann, wenn 〈Av, w〉 = 〈v, Aw〉 für alle v, w ∈ Rn gilt.
(ii) Eine Matrix A ∈ Mn,C ist genau dann unitär, wenn 〈Av, Aw〉 = 〈v, w〉 und hermitesch,
wenn 〈Av, w〉 = 〈v, Aw〉 für alle v, w ∈ Cn gilt.
Wir beschränken uns auf den komplexen Fall. Sei A ∈ Mn,C mit Spaltenvektoren a 1 , ..., a n ∈ Cn . Offenbar ist
eine Matrix A genau dann unitär, es gilt also t A¯ A = I(n) genau dann, wenn für 1 ≤ k, ≤ n jeweils
Beweis:
〈Ae k , Ae 〉
=
〈a k , a 〉
—– 22 —–
=
δk
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
erfüllt ist, denn die komplexe Zahl 〈a k , a 〉 ist genau der Eintrag der Produktmatrix t A¯ A an der Stelle (k, ). Setzen wir
n
λ e
k=1 k k
diese Gleichung für alle k, voraus, dann folgt für v, w ∈ Cn mit v =
n
〈Av, Aw〉
n
λk e k , A
A
=
k=1
n
n
n
µ e
n
n
k=1
λ¯ k µ 〈Ae k , Ae 〉δk
=
n
µ
=1
µ Ae
e jeweils
=
=1
n
λ¯ k µ
=
=
〈v, w〉.
k=1
k=1 =1
k=1 =1
n
λk Ae k ,
=
=1
λ¯ k µ 〈Ae k , Ae 〉
und w =
Setzen wir umgekehrt voraus, dass 〈Av, Aw〉 = 〈v, w〉 für alle v, w ∈ Cn gilt, dann ist insbesondere
〈Ae k , Ae 〉
〈e k , e 〉
=
=
δk
für 1 ≤ k, ≤ n.
Zum Nachweis der zweiten Äquivalenz bezeichnen wir die Einträge der Matrix A ∈ Mn,C mit a k für 1 ≤ k, ≤ n, so
dass die Spaltenvektoren jeweils durch a = (a 1 , ..., a n ) gegeben sind. Die Matrix A ist genau dann hermitesch, wenn
a
k
= a¯k für alle k, erfüllt ist. Wegen 〈Ae k , e 〉 = 〈a k , e 〉 = a¯
k
und 〈e k , Ae 〉 = 〈e k , a 〉 = a k sind diese Gleichungen
äquivalent zu
〈Ae k , e 〉
=
〈e k , Ae 〉
für 1 ≤ k, ≤ n. Setzen wir diese Gleichungen voraus, dann erhalten wir für beliebige v, w ∈ Cn mit v =
w=
n
µ
=1
n
λ e
k=1 k k
und
e die Gleichung
n
〈Av, w〉
=
A
n
λk e k ,
k=1
n
n
λ¯ k µ 〈Ae k , e 〉
n
=
n
n
λk e k , A
=
k=1
λk e k ,
k=1
n
µ e
=
n
µ e
=
=1
n
λ¯ k µ 〈e k , Ae 〉
k=1 =1
n
λk Ae k ,
k=1
=1
=
k=1 =1
µ e
n
µ Ae
=
=1
〈v, Aw〉.
=1
Setzen wir dies umgekehrt für alle v, w voraus, dann gilt insbesondere 〈Ae k , e 〉 = 〈e k , Ae 〉 für 1 ≤ k, ≤ n.
Durch den soeben bewiesenen Satz wird die folgende Verallgemeinerung der gerade eingeführten Begriffe nahegelegt:
Sei (V, b) ein euklidischer Vektorraum. Ein Endomorphismus φ ist orthogonal, wenn b(φ(v), φ(w)) = b(v, w) für alle
v, w ∈ V gilt, und symmetrisch (man sagt auch selbstadjungiert), wenn b(φ(v), w) = b(v, φ(w)) für alle v, w ∈ V gilt.
Wie wir im Beweis gesehen haben, ist eine Matrix A ∈ Mn,R genau dann orthogonal, wenn ihre Spaltenvektoren eine
ON-Basis bilden. Diese Beobachtungen wird im weiter unten folgenden Beweis des Satzes über die Hauptachsentransformation eine Rolle spielen.
Proposition 3.9
Sei (V, b) ein euklidischer Vektorraum, B eine ON-Basis von V , φ : V → V ein
Endomorphismus und A = MB (φ). Der Endomorphismus φ ist genau dann orthogonal, wenn A
orthogonal ist und genau dann selbstadjungiert, wenn A symmetrisch ist.
Beweis:
Sei ΦB : V → Rn die Koordinatenabbildung. Weil B eine ON-Basis bezüglich b ist, gilt MB (b) = I(n) . Nach
Proposition 2.13 gilt damit
b(v, w)
=
t
ΦB (v)I(n) ΦB (w)
—– 23 —–
=
〈ΦB (v), ΦB (w)〉
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
für alle v, w ∈ V . Nach Definition der Darstellungsmatrix eines Endomorphismus gilt φ(v) = AΦB (v) für alle v ∈ V .
Insgesamt zeigt dies, dass die Gleichung b(φ(v), φ(w)) = b(v, w) für alle v, w ∈ V äquivalent ist zu 〈Av, Aw〉 = 〈v, w〉 für
alle v, w ∈ Rn . Ebenso ist b(φ(v), w) = b(v, φ(w)) äquivalent zu 〈Av, w〉 = 〈v, Aw〉 für alle v, w ∈ V .
Jede symmetrische Matrix A ∈ Mn,R besitzt einen reellen Eigenwert.
Proposition 3.10
Beweis:
Aus der Linearen Algebra ist bekannt, dass jedes Polynom in C[x] vom Grad ≥ 1 eine Nullstelle besitzt.
Fassen wir das charakteristische Polynom χ A von A als komplexes Polynom auf, dann liefert uns das die Existenz
einer Nullstelle λ ∈ C von χ A . Daraus folgt, dass der Endomorphismus φ : Cn → Cn , v → Av den Wert λ als Eigenwert
besitzt. Sei v ∈ Cn ein beliebiger zugehöriger Eigenvektor.
Als reelle symmetrische Matrix ist A auch hermitesch. Mit Satz 3.8 erhalten wir
¯ v〉
λ〈v,
=
〈Av, v〉
=
〈v, Av〉
=
〈v, λv〉
=
λ〈v, v〉.
Division dieser Gleichung durch 〈v, v〉 = 0 liefert λ¯ = λ. Die Nullstelle λ von χ A ist also reell.
Satz 3.11
(Satz von der Hauptachsentransformation)
Sei A ∈ Mn,R symmetrisch. Dann gibt es eine orthogonale Matrix T , so dass D = t T AT eine
Diagonalmatrix ist.
Beweis: Sei (V, b) ein endlich-dimensionaler euklidischer R-Vektorraum. Wir beweisen durch vollständige Induktion
über n = dimV die folgende Aussage: Ist φ : V → V ein selbstadjungierter Endomorphismus, dann gibt es eine ONBasis B von V bestehend aus Eigenvektoren von φ. Für n = 1 ist jeder Vektor v ∈ V mit v = 0V zwangsläufig ein
Eigenvektor. Setzen wir v 1 =
1
v b
v und B = (v 1 ), so ist B eine Basis mit der gewünschten Eigenschaft.
Sei nun n ∈ N und dimV = n + 1, und setzen wir die Aussage für n voraus. Sei B eine ON-Basis von V . Weil φ selbstadjungiert ist, ist A = MB (φ) nach Proposition 3.9 eine symmetrische Matrix. Nach Proposition 3.10 besitzt A einen
reellen Eigenwert λ; damit gilt dasselbe auch für die Abbildung φ. Sei v ∈ V ein zugehöriger Eigenvektor und v 1 =
1
v
v.
Offenbar ist durch
U
=
{w ∈ V | b(v 1 , w) = 0}
ein Untervektorraum V gegeben. Es gilt φ(U ) ⊆ U , denn für alle w ∈ U gilt b(v 1 , φ(w)) = b(φ(v 1 ), w) = b(λv 1 , w) =
λb(v 1 , w) = λ0 = 0 und somit φ(w) ∈ U . Damit ist durch φ|U ein selbstadjungierter Endomorphismus von U gegeben.
Außerdem ist dimU = n. Denn die lineare Abbildung ψ : V → R, w → b(v, w) hat U als Kern und ist wegen ψ(αv 1 ) =
b(v 1 , αv 1 ) = αb(v 1 , v 1 ) = α für alle α ∈ R surjektiv. Damit folgt dimU = dim ker(ψ) = dimV − dim R = (n + 1) − 1 = n.
Wir können nun die Induktionsvoraussetzung auf den Endomorphismus φ|U anwenden und erhalten eine ON-Basis
(v 2 , ..., v n+1 ) von U bestehend aus Eigenvektoren von φ|U . Wegen v 1 ⊥b v k für 2 ≤ k ≤ n + 1 ist B = (v 1 , ..., v n ) eine
ON-Basis von V mit der gewünschten Eigenschaft.
Sei nun φ der Endmorphismus von Rn gegeben durch φ : Rn → Rn , v → Av mit der vorgegebenen Matrix A. Es
gilt dann A = ME (φ) bezüglich der Einheitsbasis E = (e 1 , ..., e n ) von Rn . Nach Proposition 3.9 ist φ selbstadjungiert
—– 24 —–
§ 3.
Orthonormalbasen, Hurwitz-Kriterium und Hauptachsentransformation
bezüglich des euklidischen Standard-Skalarprodukts. Durch Anwendung der soeben bewiesenen Aussage erhalten wir
eine ON-Basis B = (v 1 , ..., v n ) bestehend aus Eigenvektoren von φ. Damit ist D = MB (φ) dann eine Diagonalmatrix.
Tragen wir die Vektoren v 1 , ..., v n als Spalten in eine Matrix T ein, so gilt T = TEB , und T ist orthogonal, weil die Spalten
von T eine ON-Basis von Rn bilden. Es gilt also t T = T −1 = TBE . Wir erhalten damit
D
=
MB (φ)
=
TBE M E (φ)TEB
—– 25 —–
=
t
T AT.
§ 4. Normen und Metriken
Den Begriff der Norm auf einem R-Vektorraum V haben wir bereits im letzten Abschnitt kennengelernt, und dort
sind uns auch schon die ersten Beispiele begegnet: die Normen der Form ·
b,
die durch ein Skalarprodukt b auf V
induziert werden. Wir werden nun zunächst einige weitere Beispiele für Normen angeben, die in der Analysis eine
wichtige Rolle spielen. In diesem Abschnitt bezeichnet n stets eine natürliche Zahl, und mit (x 1 , ..., x n ) bezeichnen wir
stets die Standard-Koordinaten eines Vektors x ∈ Rn .
Satz 4.1
Auf dem R-Vektorraum V = Rn ist für jedes p ∈ R, p ≥ 1 durch
n
x
|x i |p
p
=
p
x = (x 1 , ..., x n ) ∈ V
,
i =1
eine Norm definiert, die sogenannte p-Norm. Eine weitere Norm erhält man durch
x
Beweis:
=
∞
die Supremumsnorm.
max{|x 1 |, ..., |x n |} ,
Wir überprüfen zunächst die Normeigenschaften der Supremumsnorm. Offenbar gilt x
∞
= 0 genau dann,
wenn |x 1 | = ... = |x n | = 0 gilt, und dies wiederum genau dann der Fall, wenn x = 0Rn ist. Sei nun x ∈ V und λ ∈ R. Für
den Beweis der Gleichung λx
∞
= |λ| x
∞
sei i ∈ {1, ..., n} so gewählt, dass |x i | ≥ |x j | für 1 ≤ j ≤ n erfüllt ist. Dann
gilt auch |λx i | ≥ |λx j | für alle j , und es folgt λx
∞
= |λx i | = |λ||x i | = |λ| x
∞.
Zum Beweis der Dreiecksungleichung
n
seien x, y ∈ R vorgegeben. Für 1 ≤ i ≤ n gilt jeweils
|x i + y i |
also auch x + y
∞
≤ x
∞+
y
≤
∞ . Damit ist
·
|x i | + |y i |
∞
x
≤
∞+
y
,
∞
tatsächlich eine Norm auf V .
Wenden wir uns nun dem Beweis der Norm-Eigenschaften für die p-Norm zu, wobei p ∈ R und p ≥ 1 ist. Für jedes
x ∈ V gilt auch hier x
p
= 0 genau dann, wenn die Beträge |x i | der Koordinaten alle gleich Null sind, und dies ist
wiederum äquivalent zu x = 0Rn . Für alle x ∈ Rn und λ ∈ R gilt
λx
n
=
p
n
|λx i |p
p
=
|x i |p
|λ| p
i =1
=
|λ| x
p.
(1)
i =1
Also ist auch die zweite Bedingung erfüllt. Der Beweis der Dreiecksungleichung ist leider nur für p = 1 einfach. Hier
folgt sie durch die Rechung
n
x+y
1
n
|x i + y i |
=
i =1
≤
n
|x i | +
i =1
|y i |
=
x
1+
y
1.
i =1
Für den Beweis der Dreiecksungleichung im Fall p > 1 benötigen wir als zusätzliches Hilfsmittel die Höldersche Ungleichung. Der Beweis dieser Ungleichung erfordert allerdings ein wenig Vorbereitung.
—– 26 —–
§ 4.
Normen und Metriken
Seien p, q ∈ R, p, q > 1 mit
Lemma 4.2
1
p
+ q1 = 1 und x, y ∈ R+ . Dann gilt
x 1/p y 1/q
Beweis:
x y
+ .
p q
≤
Wir können voraussetzen, dass x, y = 0 sind, denn im Fall x = 0 oder y = 0 ist die Ungleichung offensichtlich
erfüllt. Aus Symmetriegründen können wir außerdem x ≥ y annehmen, da wir ansonsten die Aussage durch Vertauschung von x und y bzw. p und q auf diesen Fall zurückführen können. Schließlich können wir auch noch x > y
voraussetzen, denn im Fall x = y reduziert sich die Aussage auf die ebenfalls offensichtliche Ungleichung x ≤ x.
Dividieren wir die Ungleichung durch y und setzen wir ξ = xy , dann erhalten wir auf der rechten Seite den Term
1
1
p ξ+ q
1
1
p ξ+1− p
=
1
p (ξ − 1) + 1
=
,
auf der linken Seite x 1/p y 1/q−1 = ( xy )1/p y 1/p+1/q−1 = ξ1/p . Es genügt also, für ξ > 1 die Ungleichung ξ1/p ≤ p1 (ξ−1)+1 zu
beweisen. Setzen wir η = ξ − 1, so erhalten wir nach Subtraktion von 1 auf beiden Seiten die äquivalente Ungleichung
(η + 1)1/p − 1
1
pη
≤
für η > 0
Diese kann nun durch den Mittelwertsatz der Differentialrechnung bewiesen werden. Dazu betrachten wir die Funktion φ(t ) = (t + 1)1/p auf dem abgeschlossenen Intervall [0, η]. Auf Grund des Mittelwertsatzes gibt es ein t 0 ∈ ]0, η[
mit φ(η) − φ(0) = ηφ (t 0 ). Die linke Seite dieser Gleichung ist gleich (η + 1)1/p − 1, die rechte Seite ist wegen φ (t ) =
1
p (t
+ 1)1/p−1 gleich η · p1 (t 0 + 1)1/p−1 . Wegen t 0 + 1 > 1 und
1
p
− 1 < 0 kann die rechte Seite durch
1
1/p−1
p (t 0 + 1)
abgeschätzt werden.
Proposition 4.3 (Höldersche Ungleichung)
Seien x, y ∈ Rn , x = (x 1 , ..., x n ) und y = (y 1 , ..., y n ), und seien p, q ∈ R mit p, q > 1 und
1
p
+ q1 = 1
vorgegeben. Dann gilt
n
|x i | · |y i |
≤
x
p
y
q
i =1
Beweis:
Nach Lemma 4.2, angewendet auf die nicht-negativen Zahlen
|x i | |y i |
xi p y i q
≤
1 |x i |p
1 |y i |q
p +
p x i p q y i qq
|x i |p
p
xi p
und
|y i |q
q
yi q
gilt
für 1 ≤ i ≤ n.
Daraus folgt
n
i =1
1 1
p x pp
n
i =1
|x i |p +
n
|x i | |y i |
·
x p y q
1 1
q y qq
n
|y i |p
≤
i =1
1 1
x
p x pp
=
i =1
Durch Multiplikation dieser Ungleichung mit x
p
1 |x i |p 1 |y i |q
+
p x pp q y qq
y
q
p
p
+
1 1
y
q y qq
≤
q
q
=
1 1
+
p q
=
erhalten wir die Höldersche Ungleichung.
—– 27 —–
1.
≤
1
pη
§ 4.
Normen und Metriken
Beweis der Dreiecksungleichung für die p-Norm, für p > 1:
Seien x, y ∈ Rn vorgegeben. Wir können x + y = 0Rn annehmen, weil die Dreiecksungleichung ansonsten offensichtlich sogar mit Gleichheit erfüllt ist. Sei q ∈ R die eindeutig bestimmte (positive) reelle Zahl mit
q=
p
p−1 . Außerdem sei
x+y
=
n
|x i + y i |p
p
z
q
1/p
+ y
p
z
|x i |
≤
q
|x i + y i |
1/p
|x i |p
i =1
n
(p−1)/p
|x i + y i |p
1/q
|x i + y i |p
n
+
1/p
|y i |p
i =1
i =1
1/q
n
|x i + y i |p
(p−1)/p
n
|y i |p
|x i + y i |
|x i + y i |p
x
=
p
den. Division durch x + y
p−1
+
p
· x+y
y
p
· x+y
p−1
p
i =1
wobei im vierten Schritt die Höldersche Ungleichung und im siebten Schritt die Gleichung
p−1
p
(p−1)q
i =1
i =1
1/p
n
+
i =1
|y i |
+
1/q
n
p
i =1
i =1
i =1
n
n
|x i |p
i =1
1/p
n
i =1
1/p
n
=
(p−1)q
|y i ||z i |
|x i ||z i | +
=
i =1
1/q
n
p
i =1
=
= 1, nämlich
n
n
|y i ||x i + y i |p−1
i =1
i =1
n
x
n
|x i ||x i + y i |p−1 +
≤
i =1
≤
1
q
+
z ∈ Rn der Vektor mit den Komponenten z i = (x i + y i )p−1 für 1 ≤ i ≤ n. Es gilt dann
n
p
p
1
p
1
q
=
p−1
p
verwendet wur-
auf beiden Seiten liefert das gewünschte Ergebnis.
Die Verwendung vom Index ∞ bei der Supremumsnorm ist auf Grund der folgenden Beziehung zwischen p-Norm
und Supremumsnorm gerechtfertigt.
Proposition 4.4
Beweis:
Für alle x ∈ Rn gilt lim x
p→∞
p
= x
∞.
Für x = 0 ist die Gleichung offensichtlich erfüllt, denn dann gilt x
∞
= 0 und x
nun x = 0 und x i die Komponente von x mit dem größten Betrag. Dann können wir x
|x k |p
p
k=1 |x i |
n
|x i |
p
p
= 0 für alle p ∈ N. Sei
auch in der Form
1/p
schreiben. Alle Summanden mit |x k | < |x i | laufen für p → ∞ gegen Null. Die Summe konvergiert also gegen die Anzahl
der Summanden mit |x k | = |x i |, der Ausdruck in der Klammer also gegen lim
p
p→∞
gegen |x i | = x
= 1 und der Gesamtausdruck
∞.
Häufig lassen sich Normen durch eine Konstante gegeneinander abschätzen. So gilt für alle x ∈ Rn zum Beispiel
1/2
n
x
2
=
|x k |
2
≤
(n|x i |2 )1/2
=
n x
,
∞
k=1
wobei x i wieder eine Komponente von x mit maximalem Betrag |x i | bezeichnet. Eine ebenso einfache Rechnung zeigt
x
∞
≤ x
2 . Zwischen der 1- und der Supremumsnorm hat man die Abschätzungen
Definition 4.5
Zwei Normen · und ·
x
≤
x
≤
≤n x
∞
und x
auf einem R-Vektorraum V werden als äquivalent
bezeichnet, wenn reelle Konstanten γ1 , γ2 > 0 mit der Eigenschaft
γ1 x
1
γ2 x
für alle x ∈ V existieren.
—– 28 —–
∞
≤ x
1.
§ 4.
Normen und Metriken
Offenbar gleichwertig mit dieser Bedingung ist die Existenz von reellen Konstanten δ1 , δ2 > 0 mit x ≤ δ1 x
x
und
≤ δ2 x für alle x ∈ V .
Es ist nicht schwer zu sehen, dass jede Norm auf einem R-Vektorraum V zu sich selbst äquivalent ist. Ist eine Norm
· auf V äquivalent zu · , dann ist auch ·
äquivalent zu ·
und ·
äquivalent zu ·
äquivalent zu · . Sind · , · , ·
drei Normen auf V , wobei ·
, dann ist auch · äquivalent zu ·
. Die Ausarbeitung der Details
ist eine leichte Übungsaufgabe. Man fast die drei Aussagen zusammen in der Feststellung, dass durch den Begriff der
Äquivalenz auf der Menge der Normen von V eine Äquivalenzrelation gegeben ist.
Dem Begriff der Äquivalenz lässt sich folgendermaßen eine anschauliche Bedeutung geben. Für alle r ∈ R+ und a ∈ V
bezeichnen wir mit
B
· ,r (a)
{x ∈ V | x − a < r }
=
¯
B
bzw.
· ,r (a)
=
{x ∈ V | x − a ≤ r }
den offenen bzw. abgeschlossenen Ball vom Radius r um den Punkt a bezüglich der Norm · . Ebenso definieren wir
¯ · ,r für die Norm · . Die folgende Graphik zeigt die abgeschlossenen Bälle einiger Normen auf dem R2 ,
B · ,r und B
wobei der blaue Punkt jeweils den Koordinatenursprung kennzeichnet.
{x ∈ R2 | x
1
{x ∈ R2 | x
≤ 1}
2
Proposition 4.6 Sei δ ∈ R+ . Dann ist die Ungleichung x
mit B
·
,r (a) ⊆ B
·
{x ∈ R2 | x
≤ 1}
∞
≤ 1}
≤ δ x für alle x ∈ V gleichbedeutend
+
,δr (a) für a ∈ V und r ∈ R . Eine entsprechende Aussage gilt auch für die
abgeschlossenen Bälle.
Beweis:
„⇒“
Wir beschränken uns darauf, die Äquivalenzaussage für die offenen Bälle zu beweisen.
Setzen wir x
≤ δ x für alle x ∈ V voraus. Ist nun x ∈ B
δ x − a < δr und x − a
„⇐“
x
< δr . Es folgt x ∈ B
Nehmen wir an, dass B
· ,r (a)
⊆B
· ,r (a)
vorgegeben, dann gilt x − a < r , damit
· ,δr (a).
· ,δr (a)
für alle r ∈ R+ und a ∈ V erfüllt ist, zugleich aber ein x ∈ V mit
> δ x existiert. Setzen wir r = x , dann gilt δx = δ x < r und somit δx ∈ B
also δx
= δr und damit δx ∉ B
·
· ,r (a).
Andererseits ist x
,δr (a). Dies steht zur angenommenen Inklusion im Widerspruch.
—– 29 —–
= r,
§ 4.
Normen und Metriken
Dem folgenden Resultat kommt für die Analysis endlich-dimensionaler Vektorräume eine zentrale Bedeutung zu.
Satz 4.7
Auf einem endlich-dimensionalen R-Vektorraum V sind je zwei Normen äquivalent.
Wir schicken dem Beweis von Satz 4.7 ein einfaches Lemma voraus.
Lemma 4.8
Seien V,W zwei R-Vektorräume, φ : W → V eine injektive lineare Abbildung und
= φ(w) eine Norm auf W definiert.
· eine Norm auf V . Dann ist durch w
Beweis:
Wir überprüfen, dass die Abbildung
Norm-Eigenschaften von
w
die Eigenschaften einer Norm besitzt, indem wir diese auf die
·
= φ(0W ) = 0V
zurückführen. Zunächst gilt 0W
·
= 0. Ist w ∈ W ein Vektor mit
= 0, dann folgt φ(w) = 0 ⇒ φ(w) = 0V und somit w = 0W auf Grund der Injektivität von φ. Für alle w ∈ V und
λ ∈ R gilt λw
= φ(λw) = λφ(w) = |λ| φ(w) = |λ| w , und für vorgegebene w 1 , w 2 ∈ V ist wegen w 1 + w 2
φ(w 1 + w 2 ) = φ(w 1 ) + φ(w 2 ) ≤ φ(w 1 ) + φ(w 2 ) = w 1 + w 2
=
die Dreiecks-Ungleichung erfüllt.
Beweis von Satz 4.7:
Seien · und ·
zwei Normen auf V . Beim Nachweis der Äquivalenz beschränken wir uns zunächst auf den Fall
V = Rd , für beliebiges d ∈ N. Es genügt zu zeigen, dass · äquivalent zur 1-Norm ·
beliebig gewählte Norm ist, folgt aus dem Beweis dann auch die Äquivalenz von ·
1
ist. Weil · nämliche eine
und ·
1,
und auf Grund der
Bemerkungen von oben erhalten wir somit insgesamt die Äquivalenz von · und · .
Sei δ1 = max{ e 1 , ..., e d }, wobei e i ∈ Rd jeweils den i -ten Einheitsvektor bezeichnet. Für einen beliebigen Vektor
v ∈ Rn mit v = (v 1 , ..., v n ) gilt dann
d
v
d
vi ei
=
|v i | e i
≤
i =1
i =1
|v i |
=
δ1 v
1.
i =1
Um zu zeigen, dass auch eine Konstante δ2 mit der Eigenschaft v
S = {w ∈ Rd | w
d
δ1
≤
1
≤ δ2 v existiert, betrachten wir die Menge
1 = 1} und definieren γ = inf{ w | w ∈ S}. Angenommen, wir können zeigen, dass γ > 0 ist. Für einen
Vektor v ∈ Rd , v = 0Rd ist w = v
−1
1 v in S
−1
enthalten, es gilt also v
−1
1
v = w ≥ γ und somit v
1
≤ γ−1 v . Im Fall
v = 0Rd ist die Ungleichung v 1 ≤ γ
v offenbar auch erfüllt. Setzen wir also δ2 = γ−1 , dann gilt v
alle v ∈ Rd , und die Äquivalenz der beiden Normen ist damit bewiesen.
1
≤ δ2 v für
Die Ungleichung γ > 0 erhalten wir durch den folgenden Widerspruchsbeweis. Angenommen, es ist γ = 0. Dann gibt
es eine Folge (w (n) )n∈N von Vektoren w (n) ∈ S mit limn w (n) = 0. Wegen w (n)
1
= 1 gilt jeweils |w i(n) | ≤ 1 für die Kom-
ponenten von w (n) (für alle n ∈ N, 1 ≤ i ≤ d ). Insbesondere die Folge (w 1(n) )n∈N ist also ganz im Intervall [−1, 1] enthalten. Nach dem Satz von Bolzano-Weierstraß aus der Analysis einer Variablen gibt es eine Teilfolge von (w 1(n) )n∈N , die
gegen eine Zahl a 1 ∈ R konvergiert. Durch Übergang zu einer Teilfolge von (w n )n∈N können wir also erreichen, dass
limn w 1(n) = a 1 erfüllt ist. Indem wir die Folge noch weiter ausdünnen, können wir sogar
lim w i(n)
n→∞
=
ai
für 1 ≤ i ≤ d
Setzen wir a = (a 1 , ..., a d ) ∈ Rd , so folgt limn a − w (n)
1
= limn
annehmen.
d
i =1 |a i
− w i(n) | = 0. Aus w (n) ∈ S folgt nun einerseits
w (n) = 1 für alle n ∈ N und somit auch
d
a
1
=
d
|a i |
i =1
=
lim
n→∞
i =1
|w i(n) |
—– 30 —–
=
lim w (n)
n→∞
1
=
1.
§ 4.
Normen und Metriken
Also ist auch a in S enthalten. Betrachten wir andererseits für jedes n ∈ N die Ungleichung a ≤ a − w (n) + w (n) ≤
δ1 a − w (n)
1+
w (n) und lassen wir n gegen Unendlich laufen, so folgt a = 0. Auf Grund der Norm-Eigenschaft
von · müsste a = 0Rd gelten. Aber in diesem Fall kann a kein Element von S sein, denn es gilt 0Rd 1 = 0. Wir haben
die Annahme γ = 0 auf einen Widerspruch geführt. Damit ist der Beweis für V = Rd insgesamt abgeschlossen.
Sei nun V ein beliebiger d -dimensionaler R-Vektorraum, und seien · und ·
zwei Normen auf V . Aus der Linearen
Algebra ist bekannt, dass je zwei R-Vektorräume derselben Dimension isomorph sind. Es gibt also einen Isomorphismus φ : Rd → V von R-Vektorräumen. Nach Lemma 4.8 sind durch v
∗
= φ(v) und v
∗
= φ(v) Normen auf Rd
definiert. Wie wir bereits gezeigt haben, sind zwei Normen auf Rd äquivalent, also gibt es Konstanten δ1 , δ2 ∈ R+ mit
v
∗
≤ δ1 v
∗
und v
∗
≤ δ2 v
∗
für alle v ∈ Rd . Für ein beliebig vorgegebenes w ∈ V setzen wir v = φ−1 (w). Es gilt
dann φ(v) = w und folglich
w
=
φ(v)
=
v
≤
∗
δ1 v
∗
=
δ1 φ(v)
=
δ1 w .
Genauso beweist man die Abschätzung w ≤ δ2 w .
Wie bereits erwähnt, liefert eine Norm · auf einem R-Vektorraum V einen Abstandsbegriff: Sind x, y ∈ V , dann kann
y −x als Abstand der Punkte x und y interpretiert werden. Für die folgende Theorie ist es aber wünschenswert, auch
auf allgemeineren Mengen einen Abstandsbegriff zur Verfügung zu haben. Eine solche allgemeinere Fassung erhält
man durch den Begriff der Metrik.
Definition 4.9
Sei X eine Menge. Eine Metrik auf X ist eine Abbildung d : X × X → R+ mit den
folgenden Eigenschaften.
(i) Für alle x, y ∈ X gilt d (x, y) = 0 genau dann, wenn x = y ist.
(ii) Es gilt d (x, y) = d (y, x) für alle x, y ∈ X .
(iii) Für alle x, y, z gilt d (x, z) ≤ d (x, y) + d (y, z).
(Dreiecksungleichung)
Das Paar (X , d ) bezeichnet man als metrischen Raum.
Genau wie bei den normierten Vektorräumen definieren wir
Sei (X , d ) ein metrischer Raum. Für jeden Punkt x ∈ X und jede Zahl r ∈ R+
¯ r (x) = {y ∈ X | d (x, y) ≤ r } als den offenen bzw.
bezeichnet man Br (x) = {y ∈ X | d (x, y) < r } bzw. B
Definition 4.10
den abgeschlossenen Ball vom Radius r um den Punkt x.
Durch die folgende Bemerkung können die normierten Vektorräume den metrischen Räumen untergeordnet werden.
Proposition 4.11
Sei (V, · ) ein normierter Raum und X ⊆ V eine Teilmenge. Dann ist durch
die Definition d (x, y) = x − y für x, y ∈ X eine Metrik auf X gegeben. Man nennt sie die von der
Norm · induzierte Metrik.
—– 31 —–
§ 4.
Normen und Metriken
Beweis:
Wir überprüfen die Bedingungen (i) bis (iii) aus der Definition. Für alle x ∈ X gilt d (x, x) = x −x = 0V = 0.
Sind umgekehrt x, y ∈ X mit d (x, y) = x − y = 0, dann folgt x − y = 0V aus der Normdefinition und somit x = y. Damit
ist (i) bewiesen. Für alle x, y ∈ X gilt
d (x, y)
=
x−y
=
(−1)(y − x)
=
| − 1| y − x
=
y −x
=
d (y, x) ,
also ist auch Bedingung (ii) gültig. Seien schließlich x, y, z ∈ X vorgegeben. Aus der Dreiecksungleichung für die Norm
folgt dann d (x, z) = x − z = (x − y) + (y − z) ≤ x − y + y − z = d (x, y) + d (y, z).
Ist speziell V = Rd für ein d ∈ N und · = ·
p
für ein p ∈ R mit p ≥ 1 oder p = ∞, dann bezeichnen wir die induzierte
Metrik mit d p . Ein wichtiger Spezialfall ist die von der 1-Norm (und auch von der gewöhnlichen euklidischen Norm)
auf R induzierte Metrik gegeben durch d 2 (x, y) = |x − y| für x, y ∈ R. Aber nicht jede Metrik wird von einer Norm
induziert, selbst dann nicht, wenn die unterliegende Menge X Teilmenge eines R-Vektorraums ist.
Definition 4.12
Auf jeder Menge X ist die diskrete Metrik δ X folgendermaßen definiert: Für alle
x ∈ X ist δ X (x, x) = 0, und für alle x, y ∈ X mit x = y setzt man δ X (x, y) = 1.
Die Überprüfung der Metrik-Eigenschaften von δ X ist dem Leser als Übungsaufgabe überlassen. Ist nun V ein mindestens eindimensionaler R-Vektorraum, dann wird δV nicht durch eine Norm · auf V induziert. Denn nehmen wir
an, dies wäre doch der Fall. Für einen beliebigen Vektor v = 0V gilt dann δV (v, 0V ) = v und δV (2v, 0V ) = 2v = 2 v .
Aus der ersten Gleichung und der Definition der diskreten Metrik folgt dann v = δV (v, 0V ) = 1. Durch erneute Anwendung der Definition erhalten wir dann aber den Widerspruch 1 = δV (2v, 0V ) = 2v = 2 v = 2.
Für das Verständnis ist es noch hilfreich sich zu überlegen, wie die offenen bzw. abgeschlossenen Bälle bezüglich der
diskreten Metrik auf einer Menge X aussehen. Für alle x ∈ X und r < 1 ist B r (x) = B¯r (x) = {x}. Für r = 1 gilt B r (x) = {x}
und B¯r (x) = X . Im Fall r > 1 gilt schließlich B r (x) = B¯r (x) = X .
—– 32 —–
§ 5. Konvergenz in metrischen Räumen
In der Analysis einer Variablen haben wir die Schreibweise (x n )n∈N für Folgen reeller Zahlen verwendet. Als mathematisches Objekt ist eine solche Folge lediglich eine Abbildung N → R. Unter einer Folge in einem metrischen Raum
(X , d ) verstehen wir nun entsprechend eine Abbildung N → X und verwenden für solche Folgen Bezeichnungen der
Form (x (n) )n∈N für Folgen in beliebigen metrischen Räumen. Den Index n des Folgengliedes setzen wir nach oben, da
es sich bei unseren metrischen Räumen hauptsächlich um Teilmengen endlich-dimensionaler R-Vektorräume handelt und wir den unteren Index zur Bezeichnung der Komponenten des Vektors benötigen. Die Komponenten eines
Folgenglieds x (n) im Vektorraum Rm bezeichnen wir üblicherweise mit x k(n) für 1 ≤ k ≤ m. In dieser Schreibeweise gilt
(n)
).
dann x (n) = (x 1(n) , ..., x m
Definition 5.1
Sei (X , d ) ein metrischer Raum, (x (n) )n∈N eine Folge in X und a ∈ X ein Punkt.
Man sagt, die Folge konvergiert in (X , d ) gegen a und schreibt
lim x (n)
n→∞
=
a
,
wenn für jedes ε ∈ R+ ein N ∈ N existiert, so dass x ∈ B ε (a) für alle n ≥ N gilt. Der Punkt a
wird in diesem Fall ein Grenzwert der Folge genannt. Eine Folge, die gegen keinen Punkt von X
konvergiert, bezeichnet man als divergent.
Nach Definition ist die Bedingung x ∈ B ε (a) äquivalent zu d (x, a) < ε. Die Konvergenz der Folge (x (n) )n∈N ist also
äquivalent dazu, dass
lim d (x (n) , a)
n→∞
=
0
gilt.
(1)
Die folgende Abbildung zeigt, wie man sich die Konvergenz im R2 aussehen könnte: Egal wie klein die graue Umgebung des rot eingezeichneten Grenzpunktes a gewählt wird, es liegen immer alle bis auf endlich viele Punkte innerhalb der Umgebung und nur endlich viele außerhalb.
x (4)
x (3)
x (2)
x (1)
Im speziellen metrischen Raum (R, d 1 ) ist die Konvergenz einer Folge (x (n) )n∈N gegen einen Punkt a ∈ R gleichbedeutend mit der Konvergenz, wie wir sie in der Analysis einer Variablen definiert haben. In diesem Fall hat die Bedingung
(1) einfach die Form limn |x (n) − a| = 0. Wie in der Analysis einer Variablen gilt auch hier
—– 33 —–
§ 5.
Konvergenz in metrischen Räumen
Proposition 5.2
Beweis:
Jede Folge in einem metrischen Raum hat höchstens einen Grenzwert.
Sei (X , d ) ein metrischer Raum und (x (n) )n∈N eine Folge in X . Nehmen wir an, dass die Folge in (X , d )
die beiden Grenzwerte a, b ∈ X besitzt, wobei a = b ist. Sei ε = d (a, b). Dann gibt es ein N ∈ N, so dass zugleich
d (x (n) , a) < 21 ε und d (x (n) , b) < 21 ε für alle n ≥ N erfüllt ist. Dies führt nun zu dem Widerspruch
ε
=
d (a, b)
≤
d (a, x (N ) ) + d (x (N ) , b)
<
1
1
2ε+ 2ε
=
ε.
Bezüglich der diskreten Metrik lässt sich die Konvergenz einer Folge besonders einfach beschreiben.
Proposition 5.3
Sei X eine beliebige Menge. Eine Folge (x (n) )n∈N im metrischen Raum (X , δ X )
ausgestattet mit der diskreten Topologie konvergiert genau dann gegen einen Punkt a ∈ X , wenn
ein N ∈ N mit x (n) = a für alle n ≥ N existiert.
Beweis:
„⇐“ Sei N eine natürliche Zahl mit der angegebenen Eigenschaft und ε > 0 vorgegeben. Für alle n ≥ N gilt
dann δ X (x (n) , a) = δ X (a, a) = 0 < ε, also ist die Konvergenzbedingung erfüllt. „⇒“ Nach Voraussetzung gibt es für
ε = 1 ein N ∈ N, so dass δ X (x (n) , a) < 1 für alle n ≥ N gilt. Weil δ X nur die Werte 0 und 1 annimmt, ist δ X (x (n) , a) = 0 für
alle n ≥ N . Nach Definition der diskreten Metrik bedeutet dies wiederum x (n) = a für alle n ≥ N .
Sei V ein R-Vektorraum mit zwei äquivalenten Normen · und · , und
Proposition 5.4
seien d , d die beiden von den Normen induzierten Metriken. Sei a ∈ V und (x (n) )n∈N eine Folge.
Genau dann konvergiert die Folge (x (n) )n∈N gegen a im metrischen Raum (V, d ), wenn sie im
metrischen Raum (V, d ) gegen a konvergiert.
Beweis:
Nach Definition der Äquivalenz gibt es Konstanten δ, δ ∈ R+ mit v
Aus Symmetriegründen genügt es zu zeigen: Konvergiert (x
(n)
≤ δ v und v ≤ δ v
für alle v ∈ V .
)n∈N im Raum (V, d ) gegen a, dann auch im Raum (V, d ).
Setzen wir ersteres also voraus. Dann gibt es für jedes ε > 0 ein N ∈ N mit x (n) − a = d (x (n) , a) < δ−1 ε für alle n ≥ N .
Es folgt dann
d (x (n) , a)
=
x (n) − a
≤
δ x (n) − a
<
δδ−1 ε
=
ε
für alle n ≥ N .
Dies zeigt, dass (x (n) )n∈N im metrischen Raum (X , d ) konvergiert.
Nach Satz 4.7 sind je zwei Normen auf einem endlich-dimensionalen R-Vektorraum äquivalent. Sei V ein solcher
Vektorraum, · eine beliebige Norm, d die induzierte Metrik und X ⊆ V eine Teilmenge. Bezeichnen wir die Einschränkung der Abbildung d auf die Teilmenge X × X ⊆ V × V ebenfalls mit d , so ist (X , d ) ein metrischer Raum. Eine
Folge in X bezeichnen wir als konvergent gegen einen Punkt a ∈ X , wenn sie im metrischen Raum (X , d ) gegen a
konvergiert. Nach Proposition 5.4 ist diese Definition von der Wahl der Norm · unabhängig.
Satz 5.5
Sei m ∈ N. Eine Folge (x (n) )n∈N im Rm konvergiert genau dann gegen einen Punkt
a ∈ R , wenn lim x k(n) = a k für 1 ≤ k ≤ m erfüllt ist.
m
n→∞
—– 34 —–
§ 5.
Konvergenz in metrischen Räumen
Beweis: „⇐“ Wie im Absatz zuvor erläutert wurde, genügt es zu zeigen, dass (x (n) )n∈N im metrischen Raum (Rm , d ∞ )
gegen a konvergiert. Sei ε ∈ R+ vorgegeben. Auf Grund der Voraussetzung gibt es für jedes k ∈ {1, ..., m} ein Nk ∈ N,
so dass jeweils |x k(n) − a k | < ε für alle n ≥ Nk erfüllt ist. Setzen wir N = max{N1 , ..., Nm }, dann gilt für alle n ≥ N die
Abschätzung
d ∞ (x (n) , a)
x (n) − a
=
=
∞
(n)
max{|x 1(n) − a 1 |, ..., |x m
− a m |}
<
ε.
Nach Definition bedeutet das, dass (x (n) )n∈N im metrischen Raum (Rm , d ∞ ) konvergiert.
„⇒“ Sei (x (n) )n∈N eine Folge, die im metrischen Raum (Rm , d ∞ ) gegen a konvergiert. Zu zeigen ist limn→∞ x k(n) = a k
für 1 ≤ k ≤ m. Sei dazu ε ∈ R+ vorgegeben und N ∈ N so gewählt, dass d ∞ (x (n) , a) < ε für alle n ≥ N gilt. Dann folgt
|x k(n) − a k |
(n)
max{|x 1(n) − a 1 |, ..., |x m
− a m |}
≤
=
x (n) − a
=
∞
d ∞ (x (n) , a)
<
ε
für alle n ≥ N und 1 ≤ k ≤ m. Damit ist die Behauptung bewiesen.
Beispielsweise ist die Folge (a n )n∈N im R2 gegeben durch a n = ( n1 , (−1)n ) divergent, weil die zweite Komponente (−1)n
der Folge divergiert. Die Folge (b n )n∈N gegeben durch
bn = 1 +
2 3n 2 − 7n + 6
,
n
4n 2 − 5
ist dagegen konvergent, es gilt
lim b n
n→∞
Definition 5.6
=
lim 1 +
n→∞
3n 2 − 7n + 6
2
, lim
n n→∞ 4n 2 − 5
=
(1, 34 ).
Eine Folge (x (n) )n∈N ein einem metrischen Raum (X , d ) wird Cauchyfolge ge-
nannt, wenn für jedes ε ∈ R+ ein N ∈ N existiert, so dass d (x (m) , x (n) ) < ε für alle m, n ∈ N mit
m, n ≥ N gilt.
Proposition 5.7 Sei V ein R-Vektorraum mit zwei äquivalenten Normen · und · , und seien
d , d die beiden von den Normen induzierten Metriken. Sei (x (n) )n∈N eine Folge. Genau dann ist
die Folge (x (n) )n∈N eine Cauchyfolge in (V, d ), wenn sie eine Cauchyfolge in (V, d ) ist.
Beweis:
Dieser Beweis ist dem Beweis von Proposition 5.4 über die Konvergenz sehr ähnlich. Die Ausführung der
Details ist eine leichte Übungsaufgabe.
Da je zwei Normen auf einem endlich-dimensionalen R-Vektorraum V äquivalent sind, können wir in Teilmengen
X ⊆ V von Cauchyfolgen schlechthin sprechen, ohne Festlegung einer Metrik. Gemeint ist dann immer die Cauchyfolgen-Eigenschaft bezüglich der von einer (beliebig gewählten) Norm induzierten Metrik.
Jede konvergente Folge (x (n) )n∈N in einem metrischen Raum (X , d ) mit einem Grenzwert a ∈ X ist auch eine Cauchyfolge. Sei nämlich ε ∈ R+ vorgegeben und N ∈ N so gewählt, dass d (x (n) , a) < 12 ε für alle n ≥ N erfüllt ist. Dann folgt
d (x (m) , x (n) ) ≤ d (x (m) , a) + d (a, x (n) ) < 21 ε + 12 ε = ε für alle m, n ≥ N .
—– 35 —–
§ 5.
Konvergenz in metrischen Räumen
Ein metrischer Raum (X , d ) heißt vollständig, wenn jede Cauchyfolge in (X , d )
Definition 5.8
konvergiert. Ein normierter R-Vektorraum, der vollständig bezüglich der induzierten Metrik ist,
wird Banachraum genannt.
Satz 5.9
Jeder normierte, endlich-dimensionale R-Vektorraum (V, · ) ist ein Banachraum.
Zunächst betrachten wir den Fall V = Rd für ein d ∈ N. Sei (x (n) )n∈N eine Cauchyfolge in V . Dann ist
Beweis:
(x (n) )n∈N insbesondere eine Cauchyfolge im metrischen Raum (Rd , d ∞ ). Wir zeigen, dass die Folgen (x k(n) )n∈N ) für
1 ≤ k ≤ d Cauchyfolgen im Sinne der Analysis einer Variablen sind. Sei dazu k ∈ {1, ..., d } beliebig gewählt und ε ∈ R+
vorgegeben. Weil (x (n) )n∈N eine Cauchyfolge ist, gibt es ein N ∈ N, so dass d ∞ (x (m) , x (n) ) < ε für alle m, n ≥ N erfüllt
ist. Es folgt
|x k(m) − x k(n) |
max{|x 1(m) − x 1(n) |, ..., |x d(m) − x d(n) |}
≤
x (m) − x (n)
=
∞
=
d ∞ (x (m) , x (n) )
<
ε
für alle m, n ≥ N . Also ist jede Folge (x k(n) )n∈N ) tatsächlich eine Cauchyfolge in R. Aus der Analysis einer Variablen ist
bekannt, dass jede Cauchyfolge in R konvergiert. Es gibt also a 1 , ..., a d ∈ R, so dass
lim x (n)
n→∞ k
=
ak
für 1 ≤ k ≤ d
erfüllt ist. Nach Satz 5.5 konvergiert die Folge (x (n) )n∈N im metrischen Raum (Rd , d ∞ ) gegen den Punkt a = (a 1 , ..., a d ).
Sei nun V ein beliebiger endlich-dimensionaler R-Vektorraum. Dann gibt es ein d ∈ R und einen Isomorphismus
φ : Rd → V von R-Vektorräumen. Nach Lemma 4.8 ist auf V durch v = φ−1 (v)
nun (y
(n)
)n∈N eine Cauchyfolge in V . Dann ist (y
(n)
∞
auf V eine Norm definiert. Sei
)n∈N auch eine Cauchyfolge bezüglich der durch · induzierten
Metrik, die wir mit dV bezeichnen. Für jedes n ∈ N sei x (n) = φ−1 (y (n) ). Für alle m, n ∈ N gilt
d ∞ (x (m) , x (n) )
=
d ∞ (φ−1 (y (m) ), φ−1 (y (n) ))
y (m) − y (n)
=
=
φ−1 (y (m) ) − φ−1 (y (n) )
=
∞
dV (y (m) , y (n) )
nach Definition, also ergibt sich aus der Cauchyfolgen-Eigenschaft von (y (n) )n∈N in (V, dV ) dieselbe Eigenschaft für
die Folge (x (n) )n∈N in (Rd , d ∞ ). Wie bereits gezeigt, konvergiert die Cauchyfolge (x (n) )n∈N in (Rd , d ∞ ) gegen einen
Grenzwert a ∈ Rd . Sei nun b = φ(a) ∈ V . Für alle n ∈ N gilt dann
d ∞ (x (n) , a)
=
d ∞ (φ−1 (y (n) ), φ−1 (b))
=
φ−1 (y (n) ) − φ−1 (b)
∞
=
y (n) − b
=
dV (y (n) , b).
Aus der Konvergenz von (x (n) )n∈N gegen a im metrischen Raum (Rd , d ∞ ) ergibt sich also die Konvergenz von (y (n) )n∈N
gegen b in (V, dV ).
Definition 5.10
Sei (X , d ) ein metrischer Raum. Eine Abbildung φ : X → X wird Kontraktion
genannt, wenn eine Konstante γ ∈ ]0, 1[ existiert, so dass d (φ(x), φ(y)) ≤ γd (x, y) für alle x, y ∈ X
erfüllt ist.
—– 36 —–
§ 5.
Konvergenz in metrischen Räumen
Satz 5.11
(Banachscher Fixpunktsatz)
Sei (X , d ) ein vollständiger metrischer Raum. Dann besitzt jede Kontraktion φ : X → X genau
einen Fixpunkt. Es gibt also ein eindeutig bestimmtes z ∈ X mit φ(z) = z.
Beweis:
Existenz: Sei x 0 ∈ X beliebig gewählt und γ ∈ R+ eine Konstante mit γ < 1 und d (φ(x), φ(y)) ≤ γd (x, y) für
alle x, y ∈ X . Wir wählen x (0) ∈ X beliebig und definieren rekursiv x (n+1) = φ(x (n) ) für alle n ∈ N. Als erstes schätzen wir
nun die Abstände d (x (n) , x (n+p) ) für beliebige n, p ∈ N ab. Für jedes n ∈ N gilt
d (x (n+1) , x (n+2) )
d (φ(x (n) ), φ(x (n+1) ))
=
γd (x (n) , x (n+1) ) ,
≤
und durch vollständige Induktion über p zeigt man leicht
d (x (n+p) , x (n+p+1) )
Mit der Summenformel
p−1 k
γ
k=0
≤
γp d (x (n) , x (n+1) ).
= (1 − γp )/(1 − γ) aus der Analysis einer Variablen und der Dreiecksungleichung er-
halten wir für alle p ∈ N jeweils
p−1
d (x (n) , x (n+p) )
p−1
d (x (n+k) , x (n+k+1) )
≤
k=0
1 − γp
d (x (n) , x (n+1) )
1−γ
γk d (x (n) , x (n+1) )
≤
=
k=0
≤
1
d (x (n) , x (n+1) )
1−γ
≤
γn
d (x (0) , x (1) ).
1−γ
Wegen limn γn = 0 ist (x (n) )n∈N somit eine Cauchyfolge in X . Auf Grund der Vollständigkeit von (X , d ) existiert der
Grenzwert z = lim x (n) .
n→∞
Um zu zeigen, dass z ein Fixpunkt von φ ist, beweisen wir, dass die Folge (x (n) )n∈N auch gegen φ(z) konvergiert. Ist
ε ∈ R+ vorgegeben, dann existiert ein N ∈ N mit d (x (n) , z) < ε für alle n ≥ N . Daraus folgt
d (x (n+1) , φ(z))
d (φ(x (n) ), φ(z))
=
=
γd (x (n) , z)
γε
<
<
ε
für alle n ≥ N . Aus der Eindeutigkeit des Grenzwertes von (x (n) )n∈N folgt φ(z) = z.
Eindeutigkeit: Angenommen, z ∈ X ist ein weiterer Fixpunkt von φ. Aus φ(z) = z und φ(z ) = z folgt dann d (z, z ) =
d (φ(z), φ(z )) ≤ γd (z, z ). Wegen γ < 1 ist dies nur für d (z, z ) = 0 möglich, und wir erhalten z = z .
Proposition 5.12
Für den Abstand der Folgenglieder zum Fixpunkt z hat man die „a priori“-
Abschätzung
d (x (n) , z)
Beweis:
d (x (n) , z)
≤
γn
d (x (0) , x (1) ).
1−γ
Dies folgt aus der Rechnung
≤
d (x (n) , x (n+1) ) + d (x (n+1) , z)
=
d (x (n) , x (n+1) ) + d (φ(x (n) ), φ(z))
≤
die nach Umformung den Ausdruck (1 − γ)d (x (n) , z) ≤ γn d (x (0) , x (1) ) ⇔ d (x (n) , z) ≤
Als Anwendungsbeispiel setzen wir uns zum Ziel, den Wert von
γn
(0) (1)
1−γ d (x , x ) liefert.
2 numerisch durch Anwendung des Banachschen
Fixpunktsatzes mit hoher Genauigkeit zu bestimmen. Der naheliegende Ansatz,
—– 37 —–
γn d (x (0) , x (1) ) + γd (x (n) , z) ,
2 als Fixpunkt der Abbildung φ(x) =
§ 5.
2
x
Konvergenz in metrischen Räumen
zu betrachten, führt nicht zum Ziel, weil diese Abbildung in einer Umgebung von
dessen definieren wir φ : R → R durch φ(x) =
+
1
2
Kontraktion ist. Es gilt φ (x) = −
1
x2
2
1
2 (x + x ).
+
2 keine Kontraktion ist. Statt
Zunächst zeigen wir, dass φ auf dem Intervall X = [1, 32 ] eine
für alle x ∈ R . Auf dem offenen Intervall ]1, 32 [ gilt die Abschätzung
− 12
=
φ (1)
<
φ (x)
<
1
18
=
φ ( 23 ).
Seien nun x, y ∈ [1, 32 ] vorgegeben. Nach dem Mittelwertsatz der Differentialrechung gibt es ein x 0 ∈ ]1, 32 [ mit
φ (x 0 ) =
φ(x) − φ(y)
x−y
⇔
φ(x) − φ(y) = φ (x 0 )(x − y).
Es folgt |φ(x) − φ(y)| = |φ (x 0 )||x − y| ≤ 21 |x − y|. Also ist φ auf X tatsächlich eine Kontraktion, und mit der Konstanten
γ=
1
2
ist die Abschätzung |φ(x)−φ(y)| ≤ γ|x − y| erfüllt. Definieren wir nun x (0) = 1.5 und x (n+1) = φ(x (n) ) für alle n ∈ N,
dann erhalten wir die Werte
n
x (n)
0
1.5
1
1.41666666666666667
2
1.41421568627450980
3
1.41421356237468991
4
1.41421356237309505
Die Abstand |x (0) −x (1) | kann durch den Wert 0.084 nach oben abgeschätzt werden. Auf Grund der oben beschriebenen
Fehlerabschätzung gilt nach vier Schritten |x (4) − 2| < 0.105, nach zwanzig Schritten |x (20) − 2| < 1.6·10−7 . Die Tabelle
zeigt aber, dass die Approximation in der Praxis deutlich besser ist: Es gilt
—– 38 —–
2 ≈ 1.414213562373095048801.
§ 6. Stetigkeit
Definition 6.1 Seien (X , d X ) und (Y , d Y ) metrische Räume. Eine Abbildung f : X → Y wird stetig
in einem Punkt a ∈ X bezüglich der Metriken d X und d Y genannt, wenn für jede Folge (x (n) )n∈N
die Implikation
lim x (n) = a in (X , d X )
n→∞
lim f (x (n) ) = f (a) in (Y , d Y )
⇒
n→∞
gilt.
Wir bezeichnen f insgesamt als stetig, wenn f in jedem Punkt x ∈ X stetig ist.
Funktionsgraph einer unstetigen und eine stetigen Funktion auf dem R2 . Die unstetige Funktion besitzt unendlich viele
Unstetigkeitsstellen, nämlich alle (x, 0) und (0, y) mit x ≤ 0 und y ≤ 0
Eine Funktion f : X → R auf einem metrischen Raum (X , d X ) bezeichnen wir als stetig, wenn sie bezüglich d X und der
von der 1-Norm induzierten Metrik d 1 (a, b) = |a − b| auf R stetig ist. Ist auch X eine Teilmenge von R und d X = d 1 ,
dann stimmt der Stetigkeitsbegriff mit dem Begriff aus der Analysis einer Variablen überein.
Proposition 6.2
Seien (X , d X ), (Y , d Y ) und (Z , d Z ) metrische Räume.
(i) Jede konstante Funktion auf X ist stetig.
(ii) Seien f : X → Y und g : Y → Z Abbildungen und a ∈ X ein Punkt, so dass f in a und g in
f (a) stetig ist. Dann ist auch g ◦ f in a stetig.
Beweis:
zu (i) Sei c ∈ R und f : X → R gegeben durch f (x) = c für alle x ∈ X . Sei außerdem a ∈ X ein beliebig
gewählter Punkt und (x (n) )n∈N eine Folge mit limn x (n) = a. Dann gilt
lim f (x (n) )
n→∞
=
lim c
n→∞
=
—– 39 —–
c
=
f (a).
§ 6.
Stetigkeit
zu (ii) Sei (x (n) )n∈N eine Folge in X mit limn x (n) = a. Weil f in a stetig ist, gilt f (a) = limn f (x (n) ), und auf Grund der
Stetigkeit von g im Punkt f (a) erhalten wir
(g ◦ f )(a)
=
g ( f (a))
lim g ( f (x (n) ))
=
=
n→∞
lim (g ◦ f )(x (n) ).
n→∞
Damit ist die Stetigkeit von g ◦ f in a bewiesen.
Auch der Grenzwertbegriff für Funktionen lässt sich auf beliebige metrische Räume übertragen.
Definition 6.3
Seien (X , d X ) und (Y , d Y ) metrische Räume, f : D → Y eine Abbildung auf einer
Teilmenge D ⊆ X und a ein Punkt in X \ D. Wir bezeichnen b ∈ Y als Grenzwert von f für x → a,
wenn eine Folge (x (n) ) in D existiert, so dass limn x (n) = a in (X , d X ) gilt und außerdem für jede
solche Folge jeweils
lim f (x (n) ) = b
n→∞
in (Y , d Y ) erfüllt ist.
Sind X und Y Teilmengen von endlich-dimensionalen R-Vektorräumen, dann bezeichnen wir eine Funktion f : X →
Y als stetig in einem Punkt a ∈ X , wenn sie bezüglich der induzierten Metriken von beliebig gewählten Normen auf
X und Y stetig ist. Wegen Proposition 5.4 (Unabhängigkeit der Konvergenz von der gewählten Norm) hat die Wahl
der Norm keinen Einfluss auf die Stetigkeitseigenschaft. Wichtig ist nur, dass die Metriken d X und d Y überhaupt von
einer Norm induziert werden.
Proposition 6.4
Die Abbildung πi : Rm → R, (x 1 , ..., x m ) → x i ist stetig, für 1 ≤ i ≤ m.
Beweis: Sei a ∈ Rm und (x (n) )n∈N eine Folge mit limn→∞ x (n) = a. Nach Satz 5.5 gilt dann insbesondere lim x i(n) = a i ,
n→∞
also insgesamt
lim πi (x (n) )
n→∞
Satz 6.5
=
lim x (n)
n→∞ i
=
ai
=
πi (a).
(ε-δ-Kriterium)
Seien (X , d X ) und (Y , d Y ) metrische Räume. Eine Abbildung f : X → Y ist genau dann stetig im
Punkt a bezüglich d X und d Y , wenn für jedes ε ∈ R+ ein δ ∈ R+ existiert, so dass die Implikation
d X (a, x) < δ
Beweis:
⇒
d Y ( f (a), f (x)) < ε
für alle x ∈ X erfüllt ist.
„⇐“ Sei (x (n) )n∈N eine Folge mit limn x (n) = a. Zu zeigen ist limn f (x (n) ) = f (a). Sei ε ∈ R+ vorgegeben und
δ ∈ R so gewählt, dass die Implikation d X (a, x) < δ ⇒ d Y ( f (a), f (x)) < ε erfüllt ist. Auf Grund der Konvergenz von
+
(x (n) )n∈N gibt es ein N ∈ N, so dass d X (a, x n ) < δ für alle n ≥ N erfüllt ist. Es folgt dann d Y ( f (a), f (x n )) < ε für alle
n ≥ N.
„⇒“ Nehmen wir an, dass die Funktion f in a stetig, aber das ε-δ-Kriterium nicht erfüllt ist. Dann gibt es ein ε ∈ R+
mit der Eigenschaft, dass für jedes δ ∈ R+ ein x ∈ X mit d X (a, x) < δ aber d Y ( f (a), f (x)) ≥ ε existiert. Insbesondere gibt
—– 40 —–
§ 6.
Stetigkeit
es für n ∈ N ein x (n) ∈ X mit d X (a, x (n) ) <
1
n
und d Y ( f (a), f (x (n) )) ≥ ε. Es ist dann (x (n) )n∈N eine Folge mit limn x (n) = a,
aber die Folge ( f (x (n) ))n∈N konvergiert nicht gegen f (a), im Widerspruch zur Stetigkeit.
Proposition 6.6
Sei (X , d X ) ein metrischer Raum, r ∈ N und f : X → Rd eine Funktion mit den
Komponenten f 1 , ..., f d : X → R, so dass also f (x) = ( f 1 (x), ..., f d (x)) für alle x ∈ X gilt. Genau dann
ist f in einem Punkt a ∈ X stetig, wenn die Funktionen f 1 , ..., f d alle in a stetig sind.
Beweis: „⇒“ Sei (x (n) )n∈N eine Folge, die in (X , d X ) gegen a konvergiert. Weil f in a stetig ist, gilt limn f (x (n) ) = f (a).
Nach Satz 5.5 folgt daraus limn f k (x (n) ) = f k (a) für 1 ≤ k ≤ d . Dies wiederum bedeutet, dass die Funktionen f 1 , ..., f d in
a stetig sind. „⇐“ Sei wieder (x (n) )n∈N eine Folge mit limn x (n) = a. Nach Voraussetzung sind die Funktionen f 1 , ..., f d
in a stetig, es gilt also limn f k (x (n) ) = f k (a) für 1 ≤ k ≤ n. Nach Satz 5.5 folgt daraus limn f (x (n) ) = a. Also ist f im Punkt
a stetig.
Proposition 6.7
Die folgenden Abbildungen α : R2 → R, (x, y) → x + y, µ : R2 → R, (x, y) → x y
und δ : R × R× → R, (x, y) →
Beweis:
x
y
sind stetig.
Sei (a, b) ∈ R × R und ((x (n) , y (n) ))n∈N eine Folge in R × R mit limn→∞ (x (n) , y (n) ) = (a, b). Nach Satz 5.5 gilt
dann limn x (n) = a und limn y (n) = b. Auf Grund der Grenzwertsätze aus der Analysis einer Variablen gilt
lim α(x (n) , y (n) )
n→∞
=
lim (x (n) + y (n) )
=
n→∞
lim x (n) + lim y (n)
n→∞
n→∞
=
a +b
=
α(a, b)
und ebenso
lim µ(x (n) , y (n) )
n→∞
=
lim x (n) y (n) )
n→∞
=
lim x (n) · lim y (n)
n→∞
n→∞
=
ab
=
µ(a, b)
Genauso leitet man die Stetigkeit von δ aus dem Grenzwertsatz für Quotientenfolgen ab.
Folgerung 6.8
Sei (X , d X ) ein metrischer Raum, und seien f , g : X → R stetige Funktionen.
Dann sind auch die Funktionen
( f + g )(x) = f (x) + g (x)
und
( f g )(x) = f (x)g (x)
stetig.
Gilt zusätzlich g (x) = 0 für alle x ∈ X , dann ist auch ( f /g )(x) = f (x)/g (x) stetig.
Beweis:
Nach Proposition 6.6 ist die Abbildung ( f , g ) : X → R2 gegeben durch ( f , g )(x) = ( f (x), g (x)) stetig. Nach
Definition gilt f + g = α ◦ ( f , g ), f g = µ ◦ ( f , g ) und f /g = δ ◦ ( f , g ). Weil die Komposition stetiger Abbildungen nach
Proposition 6.2 (ii) stetig ist, sind also f + g , f g und f /g stetige Funktionen.
Als Anwendungsbeispiel zeigen wir
Proposition 6.9
Beweis:
Die Funktion f : R2 → R, (x, y) →
x 3 y + 5x y
ist stetig.
x2 + y 4 + 1
Wie wir in Proposition 6.4 gezeigt haben, sind die Abbildungen (x, y) → x und (x, y) → y stetig. Ebenso
ist nach Proposition 6.2 (i) die konstante Abbildung (x, y) → 5 eine stetige Funktion. Weil die Abbildung (x, y) → x 2
—– 41 —–
§ 6.
Stetigkeit
durch punktweise Multiplikation der Abbildung (x, y) → x mit sich selbst zu Stande kommt, können wir Folgerung
6.8 anwenden und erhalten die Stetigkeit von (x, y) → x 2 . Die Abbildung (x, y) → x 3 kommt durch punktweise Multiplikation von (x, y) → x 2 und (x, y) → x zu Stande. Durch eine weitere Anwendung der Folgerung erhält man die
Stetigkeit von (x, y) → x 3 . Indem man weiter so vorgeht, beweist man nacheinander die Stetigkeit von (x, y) → x 3 y,
(x, y) → 5x, (x, y) → 5x y und (x, y) → x 3 y + 5x y. Genauso beweist man die Stetigkeit der Funktion (x, y) → x 2 + y 4 + 1
im Nenner. Diese ist offenbar für alle (x, y) ∈ R2 ungleich Null. Durch eine letzte Anwendung von Folgerung 6.8 erhält
man schließlich die Stetigkeit von f .
Lemma 6.10
Sei (V, · ) ein normierter R-Vektorraum. Dann gilt
| v − w |
Beweis:
v −w
≤
für alle v, w ∈ V.
Seien v, w ∈ V . Dann gilt auf Grund der Dreiecksungleichung einerseits v = w +(v − w) ≤ w + v − w ,
also v − w ≤ v − w . Andererseits gilt auch w = v − (w − v) ≤ v + w − v = v + v − w und somit
w − v ≤ v − w . Da der Betrag | v − w | immer mit v − w oder w − v übereinstimmt, erhalten wir
insgesamt | v − w | ≤ v − w .
Folgerung 6.11
Sei (V, · ) ein normierter R-Vektorraum. Dann ist V → R, x → x
eine stetige Funktion.
Beweis:
Sei v ∈ V und (x (n) ) eine Folge in V mit limn x (n) = v. Zu zeigen ist limn x (n) = v . Sei ε ∈ R+ vorgegeben.
Nach Definition gibt es ein N ∈ N mit x (n) −v < ε für alle n ≥ N . Durch Lemma 6.10 folgt | x (n) − v | ≤ x (n) −v < ε
für alle n ≥ N .
Definition 6.12
Eine Abbildung f : X → Y zwischen metrischen Räumen (X , d X ) und (Y , d Y )
wird Homöomorphismus genannt, wenn sie bijektiv, stetig und die Umkehrabbildung f −1 : Y →
X ebenfalls stetig ist. Metrische Räume, zwischen denen ein Homöomorphismus existiert, nennt
man homöomorph.
Proposition 6.13
Sei · eine beliebige Norm auf V = Rn . Dann ist der offene Ball B 1 (0V ) vom
Radius 1 um den Ursprung homöomorph zum Rn .
Beweis:
Die Abbildungen f : B 1 (0V ) → Rn und g : Rn → B 1 (0V ) gegeben duch
f (x)
=
1
x
1− x
und
g (x)
=
1
x
1+ x
sind nach Folgerung 6.11 beide stetig. Wir überprüfen, dass sie außerdem zueinander invers sind, woraus dann die
Bijektivität folgt. Für alle x ∈ B 1 (0V ) gilt einerseits
(g ◦ f )(x)
=
=
g ( f (x))
1 + (1 − x )−1 x
=
=
−1
(1 + f (x) )−1 f (x)
1
x
1− x
(1 − x )
1+
1
x
1− x
(1 − x )−1 (1 − x + x )
=
1
x
1− x
=
=
x
—– 42 —–
=
idB 1 (0V ) (x).
−1
1
x
1− x
−1
1
x
1− x
§ 6.
Stetigkeit
Andererseits erhalten wir für x ∈ Rn jeweils
( f ◦ g )(x)
=
=
f (g (x))
=
1 − (1 + x )−1 x
−1
(1 + x )
=
(1 − g (x) )−1 g (x)
1
x
1+ x
=
1
x
1+ x
=
=
1−
1
x
1+ x
(1 + x )−1 (1 + x − x )
x
=
−1
1
x
1+ x
−1
1
x
1+ x
idB 1 (0V ) (x).
Die Umkehrabbildung einer bijektiven, stetigen Abbildung ist im allgemeinen nicht stetig, wie folgendes Beispiel zeigt.
Proposition 6.14 Sei die Abbildung φ : R → R2 gegeben durch φ(t ) = (cos t , sin t ) für alle
t ∈ [0, 2π[ und ∂B¯ = {(x, y) ∈ R2 | (x, y) 2 = 1}. Dann gilt:
(i) Die Abbildung φ ist stetig.
(ii) Sie bildet das halboffene Intervall [0, 2π[ bijektiv auf ∂B¯ ab.
(iii) Die Umkehrabbildung φ−1 : ∂B¯ → [0, 2π[ ist im Punkt (1, 0) unstetig.
Beweis:
zu (i) Aus der Analysis einer Variablen ist bekannt, dass die Sinus- und die Kosinusfunktion auf ganz R
stetig sind. Nach Proposition 6.6 ist eine Funktion auf einem metrischen Raum nach R2 genau dann stetig, wenn ihre
beiden Komponentenfunktionen stetig sind.
(cos t )2 + (sin t )2 = 1. Dies zeigt, dass φ eine Abbildung von [0, 2π[ nach ∂B¯ ist.
Zum Nachweis der Surjektivität sei (x, y) ∈ ∂B¯ vorgegeben. Dann gilt x 2 + y 2 = 1 und insbesondere −1 ≤ x, y ≤ 1. Die
zu (ii) Für alle t ∈ [0, 2π[ gilt φ(t )
2
=
Kosinusfunktion bildet das Intervall [0, π] bijektiv und streng monoton fallend auf [−1, 1] ab. Es gibt also ein eindeutig
bestimmtes t ∈ [0, π] mit cos(t ) = x. Außerdem gilt | sin(t )| =
1 − (cos t )2 =
1 − x 2 = |y|, also sin t = y oder sin t = −y.
Im Fall sin t = y ist φ(t ) = (x, y) erfüllt. Ansonsten setzen wir t = 2π − t . Wir erhalten cos t = cos(2π − t ) = cos(−t ) =
cos t = x und sin(2π − t ) = sin(−t ) = − sin t = −(−y) = y, insgesamt also φ(t ) = (x, y).
Für den Beweis der Injektivität seien t , t ∈ [0, 2π[ mit φ(t ) = φ(t ) vorgegeben. Dann gilt cos t = cos t und sin t = sin t .
Nehmen wir an, dass t = t ist. Dann folgt aus cos t = cos t die Gleichung t = 2π − t . Es folgt − sin t = sin(−t ) =
sin(2π−t ) = sin t = sin t , also sin t = 0 und somit t = 0 oder t = π. Der Fall t = 0 ist ausgeschlossen, weil sonst t = 2π−t
nicht im Intervall [0, 2π[ liegen würde. Im Fall t = π erhalten wir t = 2π − t = 2π − π = π = t , im Widerspruch zur
Annahme t = t .
zu (iii) Sei (t (n) )n∈N gegeben durch t (n) = 2π − n1 , und sei die Folge (a (n) )n∈N in ∂B¯ gegeben durch a (n) = φ(t (n) ) für
alle n ∈ N. Dann konvergiert die Folge (t (n) )n∈N gegen 2π. Weil die Abbildung φ nach Teil (i) stetig ist, gilt
lim a (n)
n→∞
=
lim φ(t (n) )
n→∞
=
φ(2π)
=
(cos 2π, sin 2π)
=
(1, 0).
Wegen φ(0) = (cos 0, sin 0) = (1, 0) ist die Umkehrfunktion φ−1 an der Stelle (1, 0) durch φ−1 (1, 0) = 0 gegeben. Wäre φ−1
im Punkt (1, 0) stetig, dann müsste wegen limn a (n) = (1, 0) die Folge der Werte φ−1 (a (n) ) gegen φ−1 (1, 0) = 0 konvergieren. Statt dessen aber gilt limn φ−1 (a n ) = limn t n = 2π.
—– 43 —–
§ 6.
Stetigkeit
In vielen physikalischen Anwendungen spielen die folgenden Abbildungen eine wichtige Rolle.
ρ pol : R+ × [0, 2π[ −→ R2 ,
(r, ϕ) → (r cos ϕ, r sin ϕ)
ρ zyl : R+ × R × [0, 2π[ −→ R3 ,
(r, h, ϕ) → (r cos ϕ, r sin ϕ, h)
ρ kug : R+ × [− π2 , π2 [ × [0, 2π[ −→ R3 ,
(r, ϑ, ϕ) → (r cos ϑ cos ϕ, r cos ϑ sin ϕ, r sin ϑ)
Man bezeichnet die Abbildung ρ pol als Polar-, die Abbildung ρ zyl als Zylinder- und die Abbildung ρ kug als Kugelkoordinaten-Abbildung. Diese Abbildungen sind offenbar stetig, und bei geeigneter Einschränkung ihres Definitionsbereichs werden sie zu Homöomorphismen.
(Koordinatenabbildungen als Homöomorphismen)
Satz 6.15
(i) Die Abbildungen ρ pol , ρ zyl und ρ kug sind auf ihrem gesamten Definitionsbereich stetig.
(ii) Die Abbildung ρ pol bildet die Menge R+ × [0, 2π[ bijektiv auf R2 \ {(0, 0)} ab.
Sie definiert einen Homöomorphismus zwischen R+ × ]0, 2π[ und R2 \ (R+ × {0}).
(iii) Die Abbildung ρ zyl bildet die Menge R+ × R × [0, 2π[ bijektiv auf R3 \ ({0} × {0} × R) ab.
Sie definiert einen Homöomorphismus zwischen R+ × R× ]0, 2π[ und R3 \ (R+ × {0} × R).
(iv) Die Abbildung ρ kug bildet die Menge R+ × ] − π2 , π2 [ × [0, 2π[ bijektiv auf R3 \ ({0} × {0} × R)
ab. Sie definiert einen Homöomorphismus zwischen R+ × ]− π2 , π2 [ × ]0, 2π[ und der Menge
R3 \ (R+ × {0} × R).
Beweis:
Die Stetigkeit der drei Abbildungen folgt mit Proposition 6.6 aus der Tatsache, dass ihre Komponenten-
funktionen jeweils stetig sind. Im weiteren Verlauf beschränken wir uns auf den Beweis der Aussagen (ii) und (iv) und
zeigen hier jeweils nur die Bijektivität der genannten Abbildungen. Dazu werden wir die bereits in Proposition 6.14 bewiesene Bijektivität der Abbildung φ : [0, 2π[ → B¯ , t → (cos t , sin t ) verwenden. Den Nachweis der HomöomorphismusEigenschaft verschieben wir auf später, weil er sich mit den dann zur Verfügung stehenden Hilfsmitteln wesentlich
einfacher bewerkstelligen lässt.
zu (ii) Die Bildmenge von R+ × [0, 2π[ ist in R2 \ {(0, 0)} enthalten, denn für alle (r, ϕ) in R+ × [0, 2π[ gilt ρ pol (r, ϕ)
(r cos ϕ, r sin ϕ)
2
2
2
2
2
2
2
=
2
= r ((cos ϕ) +(sin ϕ) ) = r > 0 und somit ρ pol (r, ϕ) = (0, 0). Nun zeigen wir, dass ρ pol als Abbildung
von R × [0, 2π[ nach R2 \ {(0, 0)} surjektiv ist. Sei dazu (x, y) ∈ R2 \ {(0, 0)} vorgegeben. Setzen wir r = x 2 + y 2 =
y
(x, y) 2 , dann ist ( x , ) in B¯ 1 enthalten. Auf Grund der Surjektivität von φ gibt es ein ϕ ∈ [0, 2π[ mit (cos ϕ, sin ϕ) =
+
y
r
r
φ(ϕ) = ( xr , r ). Es folgt ρ pol (r, ϕ) = (r cos ϕ, r sin ϕ) = (x, y).
Zum Nachweis der Injektivität seien (r, ϕ), (r , ϕ ) ∈ R+ × [0, 2π[ mit ρ pol (r, ϕ) = ρ pol (r , ϕ ) vorgegeben. Dann gilt
(r cos ϕ, r sin ϕ) = (r cos ϕ , r sin ϕ ) und somit r 2 = (r cos ϕ, r sin ϕ)
2
2
= (r cos ϕ , r sin ϕ )
2
2
= r 2 , also r = r . Es
folgt φ(ϕ) = (cos ϕ, sin ϕ) = (cos ϕ , sin ϕ ) = φ(ϕ ), und aus der Injektivität von φ folgt ϕ = ϕ .
Nun zeigen wir, dass man durch weitere Einschränkung von ρ pol auf die Teilmenge R+ × ]0, 2π[ eine Bijektion auf
R2 \ (R+ × {0}) erhält. Dafür genügt es zu zeigen, dass für die Menge A = R+ × {0} und B = R+ × {0} die Gleichung
ρ pol (A) = B erfüllt ist. Aus der bereits bewiesenen Bijektivität von ρ pol folgt dann nämlich
ρ(R+ × ]0, 2π[)
=
ρ(R+ × [0, 2π[ \ A)
(R2 \ {(0, 0)}) \ B
=
=
ρ(R+ × [0, 2π[) \ ρ(A)
R2 \ (R+ × {0}) ,
—– 44 —–
=
§ 6.
Stetigkeit
also ist ρ pol als Abbildung zwischen R+ × ]0, 2π[ und R2 \ (R+ × {0}) surjektiv. Natürlich ist die Einschränkung von ρ pol
auf die Teilmenge R+ × ]0, 2π[ auch injektiv.
zu (iv) Zunächst zeigen wir, dass das Bild der Menge R+ × ] − π2 , π2 [ × [0, 2π[ unter ρ kug in R3 \ ({0} × {0} × R) ent-
halten ist. Nehmen wir an, es gibt ein Tupel (r, ϑ, ϕ) ∈ R+ × ] − π2 , π2 [ × [0, 2π[ mit ρ kug (r, ϑ, ϕ) ∈ {0} × {0} × R, also
ρ kug (r, ϑ, ϕ) = (0, 0, z) für ein z ∈ R. Dann gilt (cos ϕ)(cos ϑ) = (sin ϕ)(cos ϑ) = 0, somit (cos ϑ)2 = (cos ϑ)2 ((cos ϕ)2 +
(sin ϕ)2 ) = (cos ϑ cos ϕ)2 + (cos ϑ sin ϕ)2 = 0, also cos ϑ = 0. Da aber ϑ im Intervall ] − π2 , π2 [ liegt, ist das nicht möglich.
Nun beweisen wir die Surjektivität von ρ kug . Sei (x, y, z) ∈ R3 \({0}×{0}× R) vorgegeben. Dann gilt (x, y) = (0, 0). Setzen
wir r =
x 2 + y 2 + z 2 , dann gilt folglich | rz | < 1. Weil die Abbildung sin : ] − π2 , π2 [ → ] − 1, 1[ bijektiv ist, gibt es ein
ϑ ∈ ] − π2 , π2 [ mit sin ϑ = rz . Aus (sin ϑ)2 = ( rz )2 folgt (cos ϑ)2 = ( xr )2 + ( r )2 . Setzen wir
y
x =
x
r cos ϑ
y =
,
y
r sin ϑ
,
dann gilt also (x )2 + (y )2 = 1, was zu (x , y ) ∈ B¯ äquivalent ist. Die Surjektivität der Abbildung φ : [0, 2π[ → B¯ zeigt,
dass es ein ϕ ∈ [0, 2π[ mit cos ϕ = x und sin ϕ = y gibt. Insgesamt erhalten wir
ρ kug (r, ϑ, ϕ)
=
(r cos ϕ cos ϑ, r sin ϕ cos ϑ, r sin ϑ)
(r x cos ϑ, r y cos ϑ, r sin ϑ)
=
=
(x, y, z).
Zum Beweis der Injektivität seien (r, ϑ, ϕ), (r , ϑ , ϕ ) ∈ R+ × ] − π2 , π2 [ × [0, 2π[ vorgegeben, die von ρ kug auf denselben
Punkt (x, y, z) ∈ R3 \ ({0} × {0} × R) abgebildet werden. Dann gilt also
x = r cos ϕ cos ϑ = r cos ϕ cos ϑ
Dann gilt zunächst r 2 = x 2 + y 2 + z 2 = r
2
,
y = r sin ϕ cos ϑ = r sin ϕ cos ϑ
und z = r sin ϑ = r sin ϑ .
und somit r = r . Aus r sin ϑ = r sin ϑ = r sin ϑ erhalten wir darüber hin-
aus sin ϑ = sin ϑ , und auf Grund der Injektivität von sin : ] − π2 , π2 [ → ] − 1, 1[ folgt ϑ = ϑ . Die Kosinusfunktion hat
im Intervall ] − π2 , π2 [ keine Nullstelle. Aus der Gleichung r cos ϕ cos ϑ = r cos ϕ cos ϑ folgt also cos ϕ = cos ϕ , und aus
r sin ϕ cos ϑ = r sin ϕ cos ϑ erhalten wir ebenso sin ϕ = sin ϕ . Die Injektivität der Abbildung φ zeigt, dass aus den Gleichungen cos ϕ = cos ϕ und sin ϕ = sin ϕ insgesamt ϕ = ϕ folgt. Insgesamt haben wir damit (r, ϑ, ϕ) = (r , ϑ , ϕ ) nachgerechnet.
Um zu zeigen, dass auch die eingeschränkte Abbildung R+ × ] − π2 , π2 [ × ]0, 2π[→ R3 \ (R+ × {0} × R) noch bijektiv ist,
genügt es wie unter (ii) nachzurechnen, dass ρ kug (A) = B für die beiden Mengen A = R+ × ] − π2 , π2 [×{0} und B = R+ ×
{0} × R erfüllt ist. Zum Nachweis von „⊆“ sei (r, ϑ, 0) ∈ A vorgegeben. Dann gilt ρ kug (r, ϑ, 0) = (r cos ϑ, 0, r sin ϑ). Wegen
r cos ϑ > 0 liegt ρ kug (r, ϑ, 0) in B . Sei nun umgekehrt (x, 0, z) ∈ B , also insbesondere x > 0. Setzen wir r =
x 2 + z 2 , dann
gilt
x
r
2
+
z
r
2
=
1,
y
also ( xr , rz ) ∈ B¯ . Auf Grund der Surjektivität von φ finden wir ein ϑ ∈ [0, 2π[ mit cos ϑ = xr , sin ϑ = r . Aus cos ϑ =
x
r
>0
folgt ϑ ∈ [0, π2 [ oder ϑ ∈ ] − 23 π, 2π[. Im ersten Fall setzen wir ϑ = ϑ , im zweiten Fall ϑ = ϑ − 2π. Auf jeden Fall gilt dann
ϑ ∈ ] − π2 , π2 [ , also (r, ϑ, 0) ∈ A und
ρ kug (r, ϑ, 0)
=
(r cos ϑ, 0, r sin ϑ)
=
(r cos ϑ , 0, r sin ϑ )
—– 45 —–
=
(x, 0, z).
§ 6.
Stetigkeit
Im letzten Teil dieses Abschnitts untersuchen wir die Stetigkeit von linearen Funktionen.
Satz 6.16
Eine lineare Abbildung φ : V → W zwischen normierten R-Vektorräumen ist genau
dann stetig, wenn eine Konstante γ ∈ R+ mit φ(v) ≤ γ v für alle v ∈ V existiert.
Beweis:
„⇒“ Auf Grund der Stetigkeit von φ in 0V gibt es für ε = 1 ein δ ∈ R+ mit v < δ ⇒ φ(v) < 1 für alle
v ∈ V . Sei nun γ = 2δ−1 und v ∈ V mit v = 0V vorgegeben. Dann ist v =
1
γ v
v ein Vektor mit v
φ(v ) < 1 und wegen v = γ v v und der Linearität von φ schließlich φ(v) = φ(γ v v ) = γ v
= 12 δ < δ. Es folgt
φ(v ) < γ v .
„⇐“ Sei γ ∈ R+ eine Konstante wie angegeben und a ∈ V beliebig. Für alle v ∈ V mit dann
φ(v) − φ(a)
φ(v − a)
≤
≤
γ v −a .
Ist nun (v (n) )n∈N eine Folge mit limn v (n) = a, dann gilt limn v (n) − a = 0. Aus den Ungleichungen
0 ≤ φ(v (n) ) − φ(a) ≤ γ v (n) − a für n ∈ N folgt limn φ(v (n) ) − φ(a) = 0 und somit limn φ(v (n) ) = φ(a).
Proposition 6.17
Sei V der R-Vektorraum der Polynomfunktionen auf dem Intervall [0, 1],
ausgestattet mit der Supremumsnorm f
∞
= sup{ | f (x)| | x ∈ [0, 1]}. Dann ist die Ableitungsab-
bildung
φ1 : V −→ V
Beweis:
,
f →f
unstetig.
Angenommen, es ist γ ∈ R+ eine Konstante mit der Eigenschaft φ1 ( f )
∞
≤γ f
∞
für alle f ∈ V . Dann
n
betrachten wir die Folge ( f n )n∈N gegeben durch f n (x) = x für alle n ∈ N. Der betragsmäßig größte Funktionswert,
der von f n im Intervall [0, 1] angenommen wird, ist | f n (1)| = 1, also gilt f n
∞
genglieder sind gegeben durch φ1 ( f n ) = f n mit f n (x) = nx n−1 . Es gilt φ1 ( f n )
= 1 für alle n ∈ N. Die Bilder der Fol-
∞
= fn
∞
= | f n (1)| = n für alle n ∈ N.
Setzen wir nun die Funktionen f n in die Abschätzung von oben ein, dann erhalten wir φ1 ( f n )
∞
≤ γ fn
∞ , also n
≤γ
für alle n ∈ N. Dies aber widerspricht der Unbeschränktheit der Menge N der natürlichen Zahlen. Also existiert keine
Konstante γ mit der angegebenen Eigenschaft.
Seien V,W zwei normierte R-Vektorräume. Dann bezeichnen wir mit L (V,W ) den Untervektorraum vom R-Vektorraum HomR (V,W ) bestehend aus den stetigen linearen Abbildungen V → W .
Satz 6.18
Für jedes φ ∈ L (V,W ) existiert das Supremum
φ
=
sup{ φ(v) | v ∈ V , v ≤ 1}.
Durch die Zuordnung L (V,W ) → R+ , φ → φ ist auf dem R-Vektorraum L (V,W ) eine Norm
definiert, die sogenannte Operatornorm.
Beweis:
Das Supremum existiert, weil die angegebene Menge nichtleer und auf Grund des vorherigen Satzes nach
oben beschränkt ist. Für die Nullabbildung gilt offenbar 0L(V,W ) = 0. Sei umgekehrt φ ∈ L(V,W ) mit φ = 0. Für
jeden Vektor 0V = v ∈ V gilt dann
φ(v)
=
v
φ
v
v
≤
—– 46 —–
v ·0
=
0
§ 6.
Stetigkeit
und somit φ(v) = 0, d.h. φ ist die Nullabbildung. Die Gleichung λφ = |λ| φ für alle λ ∈ R und φ ∈ L (V,W ) ist
offensichtlich, denn der Übergang von φ zu λφ bewirkt, dass die Zahlen in der Menge { φ(v) | v ∈ V |
v ≤ 1} mit
dem Wert |λ| multipliziert werden. Seien nun φ, ψ ∈ L (V,W ) vorgegeben und v ∈ V mit v ≤ 1. Dann gilt
φ(v) + ψ(v)
φ(v) + ψ(v)
≤
φ + ψ
≤
,
also φ + ψ ≤ φ + ψ nach Definition der Operatornorm.
Wir bemerken noch, dass die Operatornorm so definiert ist, dass φ(v) ≤ φ
v für alle φ ∈ L (V,W ) und v ∈ V gilt.
Seien V = Rn , W = Rm jeweils mit der Supremums-Norm ·
Proposition 6.19
∞
ausgestattet
und A ∈ M (m × n, R) eine Matrix. Dann ist die Operatornorm von φ A : V → W , v → Av gegeben
durch
n
φA
|a i j | 1 ≤ i ≤ m
max
=
(1)
j =1
Man bezeichnet diese Norm auch als Zeilensummennorm.
Beweis:
Wir zeigen, dass der Wert φ A (v) für alle v ∈ V mit v
(1) beschränkt ist, und dass es Vektoren v ∈ V mit v
∞
∞
≤ 1 durch die Zahl γ A auf der rechten Seite von
= 1 gibt, für die φ A (v)
∞
= γ A erfüllt ist. Beide Aussagen
zusammen beweisen die Gleichung φ A = γ A .
Sei also v ∈ V mit v
∞
≤ 1 vorgegeben. Dann sind die Komponenten von w = φ A (v) durch w i =
und können durch
n
n
ai j v j
≤
j =1
n
j =1 a i j v j
gegeben
n
|a i j ||v j |
|a i j | ,
≤
j =1
j =1
also insbesondere durch das Maximum dieser Zahlen abgeschätzt werden. Andererseits wird das Maximum auch
durch Vektoren v ∈ V mit v
∞
= 1 angenommen: Ist i 0 der Index der Zeile mit der maximalen Betragssumme, al-
so
n
n
|a i j | 1 ≤ i ≤ m
max
|a i 0 j | ,
=
j =1
j =1
dann definieren wir v = (v 1 , ..., v n ) durch v j = |a i 0 j |/a i 0 j falls a i 0 j = 0 und v j = 1 sonst, für 1 ≤ j ≤ n. Die Gleichung
v
∞
= 1 ist dann offensichtlich, denn die Einträge des Vektors sind alle gleich 1 oder −1. In der Summe
sind alle Summanden nicht-negativ, und es gilt
Folgerung 6.20
n
j =1 a i 0 j v j
=
n
j =1 |a i 0 j | =
n
j =1 a i 0 j v j
φA .
Jede lineare Abbildung von einem endlich-dimensionalen in einen beliebigen
normierten R-Vektorraum ist stetig. Jeder Isomorphismus zwischen R-Vektorräumen derselben
endlichen Dimension ist ein Homöomorphismus.
Beweis:
Sei V endlich-dimensional, W beliebig und (v 1 , ..., v n ) eine Basis von V . Da sich an der Stetigkeit einer
Abbildung bei Übergang zu einer äquivalenten Norm nichts ändert, können wir annehmen, dass die Norm auf V
durch
n
λi v i
=
max{|λ1 |, ..., |λn |}
i =1
—– 47 —–
§ 6.
Stetigkeit
gegeben ist. Sei nun v ∈ V beliebig, v =
n
i =1 λi v i . Setzen wir γ = max{
n
φ(v)
=
n
λi φ(v i )
≤
i =1
φ(v 1 ) , ..., φ(v n ) }, dann gilt
|λi | φ(v i )
≤
nγ v .
i =1
Die zweite Aussage folgt unmittelbar aus der ersten.
Satz 6.21
Sei X ein metrischer Raum, und seien V,W zwei endlich-dimensionale, normierte
R-Vektorräume. Eine Abbildung ϕ : X → L (V,W ) ist genau dann stetig, wenn die Zuordnung
ϕv : X → W , x → ϕ(x)(v) für jeden Vektor v ∈ V stetig ist.
Beweis:
„⇒“ Sei x ∈ X und (x (n) )n∈N eine Folge in X mit limn x (n) = x. Für jeden Vektor v ∈ V ist limn ϕ(x (n) )(v) =
ϕ(x)(v) nachzuweisen. Für v = 0V ist dies offensichtlich, weil dann ϕ(x)(v) = 0W und ϕ(x (n) )(v) = 0W für alle n ∈ N
erfüllt ist. Also können wir von nun an v = 0V voraussetzen. Auf Grund der Stetigkeit von ϕ finden wir für jedes ε ein
N ∈ N mit ϕ(x (n) ) − ϕ(x) < ε/ v für alle n ≥ N . Nach Definition der Operatornorm folgt daraus
ϕ(x (n) )(v) − ϕ(x)(v)
(ϕ(x (n) ) − ϕ(x))(v)
=
≤
ϕ(x n ) − ϕ(x)
v
ε
v
<
v
=
ε
für alle n ≥ N . Also ist die Gleichung limn ϕ(x (n) )(v) = ϕ(x)(v) erfüllt.
„⇐“ Sei B = (v 1 , ..., v d ) eine Basis von V . Der Raum L (V,W ) ist endlich-dimensional, deshalb sind je zwei Normen
darauf äquivalent. Wir können also die Norm auf V und damit auch die Operatornorm auf L (V,W ) abändern, ohne
dass sich dadurch an der Stetigkeit von ϕ etwas ändert. Deshalb können wir davon ausgehen, dass die Norm auf V
durch
d
λi v i
=
max{|λ1 |, ..., |λd |}
i =1
definiert ist. Sei nun x ∈ X und (x (n) )n∈N eine Folge in X mit limn x (n) = x. Zu zeigen ist, dass die Folge ψn = ϕ(x (n) )
bezüglich der Operatornorm gegen das Element ψ = ϕ(x) ∈ L (V,W ) konvergiert. Weil nach Voraussetzung die Zuordnungen x → ϕ(x)(v i ) für 1 ≤ i ≤ d stetig sind, existiert für jedes ε ∈ R+ ein N ∈ N mit der Eigenschaft, dass
ψn (v i )−ψ(v i ) ≤
ε
d
für alle n ≥ N und 1 ≤ i ≤ d erfüllt ist. Sei nun v ∈ V beliebig vorgegeben, v =
ψn (v) − ψ(v)
d
≤
|λi | ψn (v i ) − ψ(v i )
d
<
i =1
|λi |
i =1
ε
d
d
v
≤
i =1
ε
d
=
d
i =1 λi v i . Dann gilt
ε v .
Insbesondere gilt (ψn − ψ)(v) ≤ ε für alle v ∈ V mit v ≤ 1 und alle n ≥ N . Nach Definition der Operatornorm gilt
also ψn − ψ ≤ ε für alle n ≥ N .
—– 48 —–
§ 7. Offene und abgeschlossene Teilmengen
Definition 7.1
Sei (X , d ) ein metrischer Raum. Eine Teilmenge U ⊆ X wird offen genannt, wenn
für jedes x ∈ U ein ε ∈ R+ mit B ε (x) ⊆ U existiert.
Offene Intervalle sind offen. Gleichgültig wo die Punkte x 1 , x 2 , ... innerhalb des Intervalls gewählt
werden, es gibt immer eine ε-Umgebung, die ganz innerhalb des Intervalls liegt.
Proposition 7.2
Beweis:
Jedes offene Intervall ]a, b[ ⊆ R ist offen bezüglich der Metrik d (x, y) = |x − y|.
Ist x ∈ ]a, b[ vorgegeben, dann setzen wir ε = min{x − a, b − x}. Es gilt dann B ε (x) ⊆ ]a, b[, denn für jedes
y ∈ B ε (x) gilt |y − x| < ε ⇔ x − ε < y < x + ε, also insbesondere a = x − (x − a) < y < x + (b − x) = b.
Zur Offenheit der offenen Bälle in einem metrischen Raum. Egal wo die
Punkte y 1 , y 2 , ... innerhalb von B r (x) gewählt werden, eine hinreichend kleine offene Kreisscheibe um y n ist vollständig in B r (x) enthalten.
Proposition 7.3
Ist (X , d ) ein metrischer Raum, dann ist jeder offene Ball B r (x) eine offene
Teilmenge von X .
Beweis:
Sei y ∈ B r (x) beliebig und ε = r − d (y, x). Dann gilt B ε (y) ⊆ B r (x), denn für alle u ∈ X gilt
u ∈ B ε (y)
⇒
d (u, y) < ε
⇒
d (u, x) ≤ d (u, y) + d (y, x) < ε + d (y, x) = r.
und somit u ∈ B r (x).
—– 49 —–
§ 7.
Offene und abgeschlossene Teilmengen
Ist d die diskrete Metrik auf einer Menge X , dann ist jede Teilmenge U ⊆ X offen, denn für jedes x ∈ X ist der offene
Ball B 1 (x) = {x} in U enthalten.
Proposition 7.4
Sei (V, · ) ein normierter R-Vektorraum und ·
eine zu · äquivalente
Norm. Eine Teilmenge U ⊆ V ist genau dann offen bezüglich der Norm · , wenn sie bezüglich
der Norm ·
Beweis:
offen ist.
Sei U eine bezüglich · offene Menge und x ∈ U . Weil U offen ist, gibt es ein ε ∈ R+ mit B ε (x) ⊆ U . Auf
Grund der Äquivalenz der Normen gibt es eine Konstante γ ∈ R+ mit v ≤ γ v
mit B = B γ−1 ε (x) den offenen Ball um x vom Radius γ
−1
y ∈ B gilt y − x
< γ−1 ε, damit y − x ≤ γ y − x
für alle v ∈ V . Bezeichnen wir nun
ε bezüglich · . Es gilt nun B ⊆ B ε (x) ⊆ U , denn für jedes
< γγ−1 ε = ε und somit y ∈ B ε (x).
Sei X eine Menge und P(X ) seine Potenzmenge, also die Menge aller Teilmengen von X . In den folgenden Abschnitt
werden wir des öfteren mit Familien von Teilmengen arbeiten. Ein Familie von Teilmengen der Menge X über einer
Indexmenge I ist einfach eine Abbildung φ : I → P(X ). Jedem Element aus I wird also eine Teilmenge von X zugeordnet.
In der Regel verwendet man an Stelle der Abbildung- die Indexschreibweise, wobei dann (X i )i ∈I für die Abbildung I →
P(X ), i → X i steht. Beispiele für Familien von Teilmengen der Menge X = R sind ( ]n, n + 1[)n∈N oder ({a, a + 13 })a∈Z .
Elemente der zweiten Familie sind zum Beispiel {0, 31 } oder {−2, − 53 }. Ein Element der ersten Familie ist das offene
Intervall ]7, 8[.
Satz 7.5
Sei (X , d ) ein metrischer Raum. Dann gilt
(i) Die Teilmengen ∅ und X sind offen.
(ii) Sind U und V offen, dann auch die Schnittmenge U ∩ V .
(iii) Ist (Ui )i ∈I eine Familie offener Teilmengen, dann ist auch die Vereinigung
Beweis:
i ∈I Ui
offen.
zu (i) Die Menge Y = ∅ ist offen, da in diesem Fall kein Punkt x ∈ Y existiert, für den die Existenz eines
ε ∈ R mit B ε (x) ⊆ Y gefordert wird. Die Menge X ist offen, weil in diesem Fall für jedes x ∈ X und jedes ε ∈ R+ die
+
Bedingung B ε (x) ⊆ X offensichtlich erfüllt ist; denn nach Definition ist B ε (x) eine Teilmenge von X .
zu (ii) Sei x ∈ U ∩ V . Weil U offen ist, gibt es ein ε ∈ R+ mit B ε (x) ⊆ U . Weil V offen ist, existiert ein η ∈ R+ mit
B η (x) ⊆ V . Setzen wir ξ = min(ε, η), dann folgt B ξ (x) ⊆ B ε (x) ⊆ U und B ξ (x) ⊆ B η (x) ⊆ V , insgesamt also B ξ (x) ⊆ U ∩ V .
zu (iii) Sei U =
i ∈I Ui
und x ∈ U vorgegeben. Dann gibt es ein i ∈ I mit x ∈ Ui . Weil Ui offen ist, existiert ein ε ∈ R+
mit B ε (x) ⊆ Ui . Wegen Ui ⊆ U folgt B ε (x) ⊆ U .
Aus Teil (ii) von Satz 7.5 kann mit vollständiger Induktion gefolgert werden, dass der Durchschnitt U1 ∩ ... ∩ Ur von
endlich vielen offenen Mengen offen ist. Für unendliche Durschnitte gilt dies aber nicht mehr. Betrachtet man im
metrischen Raum X = R beispielsweise das System (Un )n∈N gegeben durch Un = − n1 , n1 , so ist jedes einzelne Un
eine offene Teilmenge von R, ihr Durchschnitt
n∈N Un
= {0} aber nicht.
—– 50 —–
§ 7.
Offene und abgeschlossene Teilmengen
Sei X eine Menge. Ein Mengensystem U ⊆ P(X ) mit den Eigenschaften ∅, X ∈ U und U ,V ∈ U ⇒ U ∩ V ∈ U und
i ∈I Ui
∈ U für jede Familie (Ui )i ∈I bestehend aus Menge Ui ∈ U wird Topologie auf X genannt. Der soeben bewie-
sene Satz zeigt also, dass die offenen Mengen in einem metrischen Raum X eine Topologie auf X bilden. Es gibt aber
auch Topologien, die sich nicht durch eine Metrik definieren lassen.
Definition 7.6 Sei (X , d ) ein metrischer Raum und x ∈ X . Eine Teilmenge U ⊆ X wird Umgebung
von x genannt, wenn ein ε ∈ R+ mit B ε (x) ⊆ U existiert.
Proposition 7.7
Seien die Bezeichnungen wie in der Umgebungsdefinition gewählt. Eine Teil-
menge U von X ist genau dann eine Umgebung von x ∈ X , wenn eine offene Menge V mit V ⊆ U
und x ∈ V existiert.
Beweis:
„⇒“ Nach Voraussetzung gilt B ε (x) ⊆ U für ein ε ∈ R+ . Die Menge B ε (x) ist offen, wir können also V = B ε (x)
setzen. „⇐“ Sei V eine offene Teilmenge mit V ⊆ U und x ∈ V . Nach Definition der Offenheit gibt es ein ε ∈ R+ mit
B ε (x) ⊆ V . Es folgt B ε (x) ⊆ U . Also ist U eine Umgebung von x.
Die Konvergenz von Folgen kann auch mit Hilfe von Umgebungen beschrieben werden: Eine Folge (x n )n∈N in einem
metrischen Raum (X , d ) konvergiert genau dann gegen einen Punkt a ∈ X , wenn für jede Umgebung U von a ein
N ∈ N existiert, so dass x n ∈ U für alle n ≥ N erfüllt ist. (Beweis als Übung)
Proposition 7.8
Sei X ein metrischer Raum, und seien x, y ∈ X mit x = y. Dann gibt es Umge-
bungen U von x und V von y mit U ∩V = . Man bezeichnet dieses Phänomen als Hausdorffsche
Trennungseigenschaft.
Beweis:
Sei r = d (x, y); wegen x = y gilt r ∈ R+ . Dann sind U = B r /2 (x) und V = B r /2 (y) Umgebungen von x bzw.
y mit der gewünschten Eigenschaft. Wäre nämlich z ∈ U ∩ V , dann würde sich daraus der Widerspruch r = d (x, y) ≤
d (x, z) + d (z, y) < r2 + r2 = r ergeben.
Satz 7.9
Sei f : X → Y eine Abbildung zwischen metrischen Räumen (X , d X ) und (Y , d Y ), und
sei a ∈ X . Genau dann ist f stetig in a, wenn für jede Umgebung V von f (a) die Urbildmenge
f −1 (V ) eine Umgebung von a ist.
Beweis:
„⇐“
Wir zeigen, dass f unter der gegebenen Voraussetzung das ε-δ-Kriterium erfüllt. Sei also ε ∈ R+
vorgegeben. Setzen wir V = B ε ( f (a)), dann ist f −1 (V ) auf Grund des Voraussetzung eine Umgebung von a. Es gibt also
ein δ ∈ R+ mit B δ (a) ⊆ f −1 (B ε ( f (a))). Sei nun x ∈ X mit d X (a, x) < δ. Dann gilt x ∈ B δ (a) und somit f (x) ∈ B ε ( f (a)),
also d Y ( f (a), f (x)) < ε. Dies zeigt, dass das ε-δ-Kriterium erfüllt ist.
„⇒“ Sei V eine Umgebung von f (a). Dann gibt es ein ε ∈ R+ mit B ε ( f (a)) ⊆ V . Weil f in a stetig ist, können wir
das ε-δ-Kriterium anwenden. Demnach existiert ein δ ∈ R+ , so dass die Implikation d X (a, x) < δ ⇒ d Y ( f (a), f (x)) < ε
für alle x ∈ X erfüllt ist. Aus x ∈ B δ (a) folgt also f (x) ∈ B ε ( f (a)), d.h. es gilt f (B δ (a)) ⊆ B ε ( f (a)) und somit B δ (a) ⊆
f −1 (B ε ( f (a))) ⊆ f −1 (V ). Dies zeigt, dass f −1 (V ) eine Umgebung von a ist.
—– 51 —–
§ 7.
Offene und abgeschlossene Teilmengen
Folgerung 7.10
Eine Abbildung f : X → Y zwischen metrischen Räumen ist genau dann stetig,
wenn das Urbild f −1 (V ) jeder offenen Menge V ⊆ Y offen ist.
Beweis:
„⇒“ Sei f stetig und V ⊆ Y eine offene Menge. Wir müssen zeigen, dass U = f −1 (V ) offen ist. Sei dazu a ∈ U
beliebig vorgegeben. Als offene Teilmenge ist V eine Umgebung von f (a). Nach Satz 7.9 ist U damit eine Umgebung
von a. Es gibt also ein ε ∈ R+ mit B ε (a) ⊆ U . Weil a beliebig gewählt war, folgt daraus die Offenheit von U .
„⇐“
Nach Voraussetzung ist das Urbild jeder offenen Teilmenge von Y eine offene Teilmenge von X . Sei a ∈ X
vorgegeben. Zu zeigen ist, dass f in a stetig ist. Dafür wiederum genügt es nach Satz 7.9 zu zeigen, dass für jede
Umgebung V von f (a) die Menge U = f −1 (V ) eine Umgebung von a ist. Seien also V und U wie angegeben. Da V
eine Umgebung von f (a) ist, gibt es eine offene Menge V mit V ⊆ V und f (a) ∈ V . Auf Grund der Voraussetzung ist
U = f −1 (V ) offen, und aus V ⊆ V folgt U ⊆ U . Wegen f (a) ∈ V gilt a ∈ U . Dies zeigt, dass U eine Umgebung von a
ist.
Definition 7.11
Sei (X , d ) ein metrischer Raum. Eine Teilmenge V ⊆ X wird (genau dann) als
abgeschlossen bezeichnet, wenn ihr Komplement U = X \ V offen ist.
Proposition 7.12
Die abgeschlossenen Intervalle in R der Form [a, b] ⊆ R mit a, b ∈ R, a < b
sind abgeschlossen.
Beweis:
Zu zeigen ist, dass die Menge U = R \ [a, b] offen ist. Sei x ∈ U vorgegeben. Dann gilt entweder x < a
oder x > b. Setzen wir im ersten Fall ε = a − x, dann ist B ε (x) ⊆ U erfüllt, denn aus y ∈ B ε (x) folgt |y − x| < ε, damit
insbesondere y < x + ε = x + (a − x) = a. Also ist y nicht im Intervall [a, b] enthalten und liegt somit in U . Im zweiten
Fall setzt man ε = x − b und überprüft genauso, dass B ε (x) ⊆ U gilt.
Zur Abgeschlossenheit der abgeschlossenen Bälle in einem metrischen Raum. Egal wie nahe die
Punkte y 1 , y 2 , ... an B¯r (x) gewählt werden, eine hinreichend kleine offene Kreisscheibe um y n ist zu
B¯r (x) disjunkt.
—– 52 —–
§ 7.
Offene und abgeschlossene Teilmengen
Proposition 7.13 Sei (X , d ) ein metrischer Raum, a ∈ X und r ∈ R+ . Dann ist der abgeschlossene
Ball B¯r (a) um a vom Radius r abgeschlossen.
Beweis:
Zu zeigen ist, dass es sich bei U = X \ B¯r (a) um eine offene Menge handelt. Sei x ∈ U vorgegeben. Dann gilt
d (a, x) > r . Setzen wir ε = d (a, x) − r , dann ist B ε (x) ⊆ U erfüllt. Wäre dies nicht der Fall, dann gäbe es einen Punkt
y ∈ B ε (x) ∩ B¯r (a). Daraus würde sich aber der Widerspruch d (a, x) ≤ d (a, y) + d (y, x) < r + ε = r + d (x, a) − r = d (x, a)
ergeben.
Die Aussage, dass jede Teilmenge eines metrischen Raums X entweder offen oder abgeschlossen sein muss, ist in
mehrfacher Hinsicht falsch, auch wenn dies durch die Wahl der Begriffe nahegelegt wird. Es gibt im allgemeinen sehr
viele Teilmengen, die weder offen noch abgeschlossen sind, in R zum Beispiel die halboffenen Intervalle der Form
[a, b[. Ebenso gibt es in metrischen Räumen X immer Teilmengen, die sowohl offen als auch abgeschlossen sind,
zumindest die Teilmengen
Satz 7.14
oder X , wie wir gleich sehen werden.
Sei (X , d ) ein metrischer Raum. Dann gilt
(i) Die Teilmengen
und X sind abgeschlossen.
(ii) Sind U und V abgeschlossen, dann auch U ∪ V .
(iii) Ist (Vi )i ∈I eine Familie abgeschlossener Teilmengen, dann ist auch
Beweis:
zu (i) Nach Satz 7.5 sind die Mengen
und X offen, also sind X = X \
i ∈I
und
Vi abgeschlossen.
= X \ X abgeschlossen.
zu (ii) Die Mengen U = X \U und V = X \ V sind nach Voraussetzung offen. Wegen Satz 7.5 ist damit auch U ∩ V =
X \ (U ∪ V ) eine offene Menge. Also ist U ∩ V abgeschlossen.
zu (iii) Sei Ui = X \Vi für alle i ∈ I . Dann ist jedes Ui offen, nach Satz 7.5 also auch die Vereinigungsmenge U =
Wegen
i ∈I
Vi = X \U ist
Satz 7.15
i ∈I
i ∈I Ui .
Vi damit abgeschlossen.
ine Abbildung f : X → Y zwischen metrischen Räumen ist genau dann stetig, wenn
das Urbild f −1 (V ) jeder abgeschlossenen Teilmenge V ⊆ Y selbst abgeschlossen ist.
Beweis:
„⇒“ Ist f stetig, dann ist nach Folgerung 7.10 das Urbild jeder offenen Menge offen. Sei nun V ⊆ Y abge-
schlossen. Setzen wir U = Y \V , dann ist f −1 (U ) also offen. Wegen f −1 (V ) = X \ f −1 (U ) ist f −1 (V ) damit abgeschlossen.
„⇐“
Sei U ⊆ Y offen. Dann ist V = Y \ U abgeschlossen, und auf Grund der Voraussetzung ist f −1 (V ) ebenfalls
abgeschlossen. Daraus folgt, dass f −1 (U ) = X \ f −1 (V ) offen ist. Wir haben somit gezeigt, dass das Urbild jeder offenen
Menge offen ist. Nach Folgerung 7.10 folgt daraus die Stetigkeit von f .
Satz 7.16
Eine Teilmenge A ⊆ X in einem metrischen Raum (X , d X ) ist genau dann abge-
schlossen, wenn mit jeder Folge (x (n) )n∈N in A, die in (X , d X ) konvergiert, auch der Grenzwert
a = lim x (n) in A enthalten ist.
n→∞
—– 53 —–
§ 7.
Offene und abgeschlossene Teilmengen
Beweis: „⇒“ Setzen wir voraus, dass A ⊆ X eine abgeschlossene Teilmenge von X ist. Sei (x (n) )n∈N eine in A liegende,
konvergente Folge und a = limn x (n) ihr Grenzwert. Angenommen, es gilt a ∉ A. Weil A abgeschlossen ist, handelt es
sich bei U = X \ A um eine Umgebung von a. Es gibt also ein N ∈ N mit x (n) ∈ U für alle n ≥ N , im Widerspruch zur
Voraussetzung x (n) ∈ A für alle n ∈ N.
„⇐“ Nehmen wir an, dass für jede in A liegende, in (X , d X ) konvergente Folge auch der Grenzwert in A liegt, dass
aber A nicht abgeschlossen ist. Dann gibt es ein a ∈ X \ A, so dass für jedes ε ∈ R+ der Durchschnitt A ∩B ε (a) nichtleer
ist. Insbesondere finden wir für jedes n ∈ N ein x (n) ∈ A ∩ B 1 (a). Wir erhalten so eine Folge (x (n) )n∈N mit lim x (n) = a,
n
deren Folgenglieder alle in A liegen, mit einem Grenzwert außerhalb von A. Dies widerspricht unserer Annahme.
Beispielsweise ist das Intervall I = [0, 1[ nicht abgeschlossen in R. Die Zahlen x (n) = 1 − n1 bilden eine Folge (x (n) )n∈N
in I , aber deren Grenzwert lim x (n) = 1 ist nicht in I enthalten.
n→∞
Definition 7.17
Eine Teilmenge A ⊆ X eines metrischen Raums (X , d X ) wird beschränkt ge-
nannt, wenn die Menge D(A) = {d X (a, b) | a, b ∈ A} ⊆ R+ beschränkt ist. Ist dies der Fall, dann
bezeichnen wir d (A) = sup D(A) als den Durchmesser der Teilmenge A. Der leeren Menge
wird
der Durchmesser d ( ) = 0 zugeordnet.
Eine Teilmenge A eines metrischen Raums (X , d X ) ist genau dann beschränkt, wenn ein Punkt a ∈ A und ein γ ∈ R+
mit d X (a, x) < γ für alle x ∈ A existiert. Ist nämlich a ein solcher Punkt, dann folgt d (x, y) ≤ d (a, x) + d (a, y) < 2γ für
alle x, y ∈ A. Die Umkehrung ist offensichtlich.
Satz 7.18
(Schachtelungsprinzip)
Sei (X , d X ) ein vollständiger metrischer Raum und (A n )n∈N eine Folge nichtleerer, abgeschlossener, beschränkter Teilmengen von X mit A n ⊇ A n+1 für alle n ∈ N. Gilt limn d (A n ) = 0, dann gibt
es einen eindeutig bestimmten Punkt a ∈ X mit
Beweis:
n∈N
A n = {a}.
Zunächst beweisen wir die Eindeutigkeit. Sind a, a ∈ A zwei verschiedene Punkte mit a, a ∈ A n für alle
n ∈ N, dann gilt d (a, a ) ≤ d (A n ) für alle n ∈ N. Aus limn d (A n ) = 0 folgt d (a, a ) = 0 und a = a , im Widerspruch zur
Voraussetzung.
Zum Nachweis der Existenz wählen wir in jeder Menge A n einen Punkt x (n) . Sei ε ∈ R+ vorgegeben und N ∈ N so groß
gewählt, dass d (A n ) < ε für alle n ≥ N erfüllt ist. Sind nun m, n ∈ N mit n ≥ m ≥ N , dann folgt d (x (n) , x (m) ) ≤ d (A m ) < ε,
also ist (x (n) )n∈N eine Cauchyfolge. Auf Grund der Vollständigkeit von (X , d X ) konvergiert diese gegen einen Punkt
a ∈ X . Ist m ∈ N beliebig, dann gilt x (n) ∈ A n ⊆ A m für alle n ≥ m. Weil A m abgeschlossen ist, liegt nach Satz 7.16 auch
der Grenzwert a der Folge in A m . Weil m beliebig vorgegeben war, haben wir somit a ∈ A m für alle m ∈ N und somit
a∈
n∈N
A n nachgewiesen.
—– 54 —–
§ 7.
Offene und abgeschlossene Teilmengen
Sei (X , d X ) ein metrischer Raum und Y ⊆ X eine Teilmenge. Dann erhalten
Definition 7.19
wir durch Einschränkung von d X auf Y × Y eine Metrik d Y auf Y mit d Y (a, b) = d X (a, b) für alle
a, b ∈ Y . Wir bezeichnen eine Teilmenge U ⊆ Y als relativ offen bzw. abgeschlossen in Y , wenn
U bezüglich d Y offen bzw. abgeschlossen ist.
Satz 7.20
Sei (X , d X ) ein metrischer Raum, Y ⊆ X eine Teilmenge und U ⊆ Y .
(i) Genau dann ist U relativ offen in Y , wenn eine offene Teilmenge U˜ ⊆ X mit der Eigenschaft
U = U˜ ∩ Y existiert.
(ii) Genau dann ist U relativ abgeschlossen in Y , wenn eine abgeschlossene Teilmenge U˜ ⊆ X
mit U = U˜ ∩ Y existiert.
Beweis:
Wir beschränken uns auf den Beweis von (i), weil der Beweis des anderen Teils weitgehend analog verläuft.
Es sei d Y die Metrik auf Y , die man durch Einschränkung von d X auf Y × Y erhält.
„⇐“ Sei U˜ ⊆ X eine Menge mit den angegebenen Eigenschaften und a ∈ U . Weil U˜ offen ist, gibt es ein ε ∈ R+ mit
B ε (a) ⊆ U˜ , wobei B ε (a) den offenen Ball vom Radius ε um U bezüglich der Metrik d X bezeichnet. Für alle x ∈ Y gilt
die Äquivalenz x ∈ B ε (a) ⇔ d X (a, x) < ε ⇔ d Y (a, x) < ε, also ist B ε (a) ∩ Y der offene Ball vom Radius ε um a bezüglich
d Y . Die Inklusion B ε (a) ∩ Y ⊆ U˜ ∩ Y = U zeigt, dass U in Y relativ offen ist.
„⇒“ Sei U ⊆ Y eine in Y relativ offene Teilmenge. Dann gibt es für jedes a ∈ U ein ε(a) ∈ R+ , so dass der offene Ball
B ε(a),Y (a)
=
{y ∈ Y | d Y (a, y) < ε(a)}
=
{y ∈ Y | d X (a, y) < ε(a)}
=
B ε(a) (a) ∩ Y
um a vom Radius ε(a) bezüglich d Y in U enthalten ist. Es gilt also B ε(a) (a) ∩ Y = B ε(a),Y (a) ⊆ U für alle a ∈ U . Die
Menge U˜ = a∈U B ε(a) ist offen in (X , d X ), und es gilt
U˜ ∩ Y
B ε(a) (a) ∩ Y
=
a∈U
(B ε(a) (a) ∩ Y )
=
=
U.
a∈U
Die Teilmenge X = ]−1, 1[ × {0} ⊆ R2 ist zwar keine offene Menge in R2 , da zum Beispiel keine ε-Umgebung B ε ((0, 0))
von (0, 0) in X enthalten ist. Sie ist aber relativ offen in Y = R × {0}, denn sie kann als Durchschnitt von Y und der in
R2 offenen Menge ]−1, 1[ × R dargestellt werden.
—– 55 —–
§ 8. Kompaktheit
In diesem Abschnitt definieren wir einen weiteren topologischen Grundbegriff, der es uns ermöglicht, das Maximumsprinzip für stetige Funktionen auf metrische Räume zu verallgemeinern.
Sei I eine Menge, (X , d ) ein metrischer Raum und A ⊆ X eine Teilmenge. Eine
Definition 8.1
offene Überdeckung von A ist eine Familie (Ui )i ∈I offener Teilmengen Ui ⊆ X mit der Eigenschaft
i ∈I Ui
⊇ A.
Überdeckung einer Menge Q durch drei offene Mengen U1 ,U2 ,U3
Für n ∈ Z sei beispielsweise Un = ]n, n + 2[ und Vn = ]n, n + 1[. Dann ist (Un )n∈Z eine offene Überdeckung von R, die
Familie (Vn )n∈Z aber nicht, denn die Teilmenge Z ⊆ R ist in
n∈Z Vn
nicht enthalten.
Sei (X , d X ) ein metrischer Raum. Eine Teilmenge A ⊆ X wird kompakt genannt,
Definition 8.2
wenn zu jeder offenen Überdeckung (Ui )i ∈I von A eine endliche Teilmenge J ⊆ I existiert, so dass
bereits
i ∈J Ui
⊇ A erfüllt ist. Den metrischen Raum selbst bezeichnen wir als kompakt, wenn die
Teilmenge A = X in (X , d X ) kompakt ist.
Häufig verwendet man für die Kompaktheit von A die Formulierung „In jeder offenen Überdeckung von A gibt es eine endliche Teilüberdeckung.“ Dies ist aber nicht einfach damit gleichbedeutend, dass A eine endliche offene Überdeckung besitzt. Letzteres trifft für jede Teilmenge A ⊆ X zu: Die einelementige Familie (Ui )i ∈{1} gegeben durch U1 = X
ist offensichtlich eine Überdeckung von A. Bei der Definition der Kompaktheit liegt die Betonung darauf, dass in jeder
offenen Überdeckung von A eine endliche Teilüberdeckung gewählt werden kann.
Schauen wir uns nun einige Beispiele und Gegenbeispiele für kompakte Mengen an.
Proposition 8.3
Sei (X , d X ) ein metrischer Raum und A ⊆ X eine endliche Teilmenge.
Dann ist A kompakt.
Beweis:
Sei r ∈ N0 , und seien a 1 , ..., a r die verschiedenen Elemente von A. Sei außerdem (Ui )i ∈I eine offene Über-
deckung von A. Wegen a k ∈ A und A ⊆
J = {i (1), ..., i (r )}, dann ist
i ∈I Ui
gibt es für jedes k ∈ {1, ..., r } ein i (k) ∈ I mit a k ∈ Ui (k) . Setzen wir
i ∈J Ui ⊇ A offenbar erfüllt.
—– 56 —–
§ 8.
Kompaktheit
Proposition 8.4
Die Menge R im metrischen Raum (R, d ) mit der Metrik d (x, y) = |x − y| für
x, y ∈ R ist nicht kompakt.
Beweis:
Die Familie (Un )n∈Z gegeben durch Un = ]n, n + 2[ ist eine offene Überdeckung von R. In (Un )n∈Z kann
aber keine endliche Teilüberdeckung gewählt werden, denn jede Vereinigung der Form Un1 ∪ ... ∪Unr mit r ∈ N0 und
n 1 , ..., n r ∈ Z hat nur endlichen Durchmesser und enthält somit nicht ganz R.
Proposition 8.5
Sei (x (n) )n∈N eine konvergente Folge in einem metrischen Raum (X , d ) mit
Grenzwert a = limn x (n) . Dann ist die Menge A = {x (n) | n ∈ N} ∪ {a} kompakt.
Beweis:
Sei (Ui )i ∈I eine offene Überdeckung von A. Dann gibt es insbesondere ein i 0 ∈ I mit a ∈ Ui 0 , und Ui 0 ist
eine Umgebung von a. Auf Grund der Konvergenz finden wir somit ein N ∈ N mit x (n) ∈ Ui 0 für alle n ≥ N . Für jedes
n ∈ N mit n < N gibt es außerdem auf Grund der Überdeckungseigenschaft ein i n ∈ I mit x (n) ∈ Ui n . Ein Folgenglied
x (n) liegt für n < N also in Ui n und für n ≥ N in Ui 0 . Dies zeigt, dass die endliche Indexmenge J = {i 0 , i 1 , ..., i N −1 } eine
endliche Teilüberdeckung von (Ui )i ∈I definiert.
Nimmt man aus der Menge A den Grenzwert a heraus, so erhält man im allgemeinen keine kompakte Menge mehr.
Ist die Folge beispielsweise durch x (n) =
1
n
für alle n ∈ N gegeben, dann in der Überdeckung (Un )n∈N mit Un =
1
3
2n , 2n
für n ∈ N keine endliche Teilüberdeckung.
Definition 8.6
Ein abgeschlossener Quader in Rn ist eine Teilmenge Q ⊆ Rn der Form Q =
I 1 × ... × I n , wobei I k ⊆ R für 1 ≤ k ≤ n jeweils ein abgeschlossenes Intervall [a k , b k ] mit a k < b k
bezeichnet.
Man überprüft leicht, dass jeder abgeschlossene Quader dieser Form eine abgeschlossene Teilmenge von Rn ist. Der
Durchmesser d (Q) von Q bezüglich der Maximums-Norm ·
Satz 8.7
Beweis:
∞
ist gegeben durch d (Q) = max{b k − a k | 1 ≤ k ≤ n}.
Jeder abgeschlossene Quader Q ⊆ Rn ist kompakt.
Nehmen wir an, dass Q nicht kompakt ist. Dann gibt es in Rn eine offene Überdeckung (Ui )i ∈I von Q, in der
aber keine endliche Teilüberdeckung existiert. Wir definieren nun eine absteigende Folge
Q
=
Q0
⊇
Q1
⊇
Q2
Q3
⊇
⊇
...
von abgeschlossenen Quadern in Rn mit d (Q m ) = 2−m d (Q), so dass keiner dieser Quader in (Ui )i ∈I eine endliche
Teilüberdeckung besitzt. Sei m ∈ N0 und Q m bereits definiert, wobei Q m = 2−m d (Q) gilt und Q m keine endliche Teilüberdeckung in (Ui )i ∈I besitzt. Dann erhalten wir Q m+1 durch das folgende Verfahren: Ist Q m = I 1 × ... × I n mit abgeschlossenen Intervallen I k = [a k , b k ], dann zerlegen wir das Intervall I k jeweils in die beiden Teilstücke
I k(1)
=
[a k , m k ]
und
I k(2)
=
[m k , b k ] ,
(s )
wobei m k = 21 (a k + b k ) den Mittelpunkt von I k bezeichnet. Für jedes Tupel s = (s 1 , ..., s n ) ∈ {1, 2}n sei Q (s) = I 1 1 × ... ×
(s )
I n n . Auf diese Weise haben wir Q m in insgesamt 2n Teilquader zerlegt. Weil die Intervalle, aus denen Q (s) gebildet
—– 57 —–
§ 8.
Kompaktheit
wird, jeweils halb so lang wie die Intervalle von Q m sind, gilt d (Q (s) ) = 12 d (Q m ) = 2−(m+1) d (Q) für alle s ∈ {1, 2}n . Es
gibt mindestens ein t ∈ {1, 2}n , so dass Q (t ) in (Ui )i ∈I keine endliche Teilüberdeckung besitzt. Ansonsten könnten wir
nämlich die 2s endlichen Überdeckungen der Quader Q (s) zu einer endlichen Überdeckung von Q m zusammenfügen.
Definieren wir nun Q m+1 = Q (t ) , dann erfüllt Q m+1 alle angegebenen Bedingungen.
Nun zeigen wir, dass diese Konstruktion zu einem Widerspruch führt. Nach dem Schachtelungsprinzip (Satz 7.18) gibt
es ein a ∈ Q mit
m∈N Q m
= {a}. Weil (Ui )i ∈I eine Überdeckung von Q ist, gibt es ein i 0 ∈ I mit a ∈ Ui 0 . Sei ε ∈ R+ so
klein gewählt, dass B ε (a) in Ui 0 enthalten ist, wobei B ε (a) den offenen Ball bezüglich ·
2
−m
∞
bezeichnet. Sei m ∈ N mit
< ε. Wir zeigen, dass Q m in Ui 0 liegt. Sei x ∈ Q m vorgegeben. Aus a, x ∈ Q m und d (Q m ) < 2−m < ε folgt d (a, x) < ε.
Dies wiederum bedeutet x ∈ B ε (a) ⊆ Ui 0 . Aber die Inklusion Q m ⊆ Ui 0 widerspricht der Annahme, dass Q m nicht durch
endlich viele Mengen aus der Familie (Ui )i ∈I überdeckt werden kann.
Satz 8.8
Sei A eine abgeschlossene Teilmenge eines kompakten metrischen Raums (X , d X ).
Dann ist A kompakt.
Beweis:
Sei (Ui )i ∈I eine offene Überdeckung von A. Weil U = X \ A offen ist, bildet (Ui )i ∈I zusammen mit U eine
offene Überdeckung von X . Weil X kompakt ist, können wir eine endliche Teilmenge J ⊆ I wählen, so dass (Ui )i ∈J
zusammen mit U eine endliche Überdeckung von X bildet. Es gilt also
A
⊆
X
=
Uj
U∪
=
Die Gleichung zeigt A ⊆
·
∞
j ∈J
j ∈J U j , wir haben also eine endliche Teilüberdeckung von
Folgerung 8.9
Beweis:
Uj .
(X \ A) ∪
j ∈J
A in (Ui )i ∈I gefunden.
Jede beschränkte und abgeschlossene Teilmenge A ⊆ Rn ist kompakt.
Weil A beschränkt ist, gibt es ein r ∈ R+ , so dass A im offenen Ball B r (0Rn ) bezüglich der Maximums-Norm
enthalten ist. Nach Definition ist B r (0Rn ) gerade der abgeschlossene Quader [−r, r ]n , und dieser ist nach Satz 8.7.
eine kompakte Teilmenge von Rn . Als abgeschlossene Teilmenge von B r (0Rn ) ist A nach Satz 8.8 ebenfalls kompakt.
Kompakte Teilmengen metrischer Räume lassen sich auch durch das Konvergenzverhalten von Folgen beschreiben.
Definition 8.10
Ein Punkt x in einem metrischen Raum (X , d X ) wird Häufungspunkt einer
Teilmenge A ⊆ X genannt, wenn in jeder Umgebung von x jeweils unendlich viele Elemente aus
A liegen.
In Analogie zu den endlichen, abgeschlossenen Intervallen von I gilt nun
Satz 8.11
(Satz von Bolzano-Weierstraß)
Jede Folge in einem kompakten metrischen Raum (X , d X ) besitzt eine konvergente Teilfolge.
Beweis:
Sei (x (n) )n∈N eine Folge in X . Ist die Menge A = {x (n) | n ∈ N} der Folgenglieder endlich, dann gibt es ein
a ∈ A mit x (n) = a für unendlich viele n ∈ N. Wir finden dann eine Folge (n k )k∈N natürlicher Zahlen mit x (nk ) = a für
alle k ∈ N. Damit ist (x (nk ) )k∈N eine konstante, insbesondere eine konvergente Teilfolge von (x (n) )n∈N .
—– 58 —–
§ 8.
Kompaktheit
Setzen wir von nun an voraus, dass A eine unendliche Menge ist. Wir beweisen, dass A unter dieser Voraussetzung
einen Häufungspunkt besitzt. Wäre dies nicht der Fall, dann gäbe es für jedes x ∈ X eine Umgebung U x ⊆ X , so dass
die Menge U x ∩ A jeweils endlich ist. Die Familie (U x )x∈X bildet eine Überdeckung von A. Auf Grund der Kompaktheit
existiert eine endliche Teilmenge J ⊆ X , so dass A bereits von (U x )x∈J überdeckt wird. Aber dies würde bedeuten, dass
A
=
Ux
A∩
(A ∩U x )
=
x∈J
x∈J
eine endliche Menge ist, im Widerspruch zur Annahme. Sei a ∈ X also ein Häufungspunkt von A. Dann enthält B 1/k (a)
für jedes k ∈ N jeweils unendlich viele Folgenglieder, wir finden also ein n k ∈ N mit x (nk ) ∈ B 1/k (a). Nach Konstruktion
konvergiert die Teilfolge (x (nk ) )k∈N dann gegen den Punkt a.
Folgerung 8.12
Beweis:
Jede beschränkte Folge in Rn besitzt eine konvergente Teilfolge.
Dies folgt aus dem Satz von Bolzano-Weierstraß, weil jede beschränkte Folge in einem hinreichend groß
gewählten kompakten Quader enthalten ist.
Folgerung 8.13 Jede kompakte Teilmenge A ⊆ X eines metrischen Raums (X , d X ) ist beschränkt
und abgeschlossen.
Beweis: Nehmen wir an, A wäre nicht beschränkt. Dann wählen wir einen beliebigen Punkt a ∈ A und definieren eine
offene Überdeckung von A durch (Un )n∈N durch Un = B n (a) für alle n ∈ N. Da A unbeschränkt ist, gibt es in dieser
offenen Überdeckung keine endliche Teilüberdeckung. Also ist A nicht kompakt, im Widerspruch zur Annahme.
Gehen wir nun davon aus, dass A nicht abgeschlossen ist. Dann gibt es nach Satz 7.16 eine Folge (x (n) )n∈N mit einem
Grenzwert x ∈ X , der außerhalb von A liegt. Jede Teilfolge von (x (n) )n∈N konvergiert dann ebenfalls gegen x. Aber nach
dem Satz von Bolzano-Weierstraß gibt es eine Teilfolge, die gegen einen Punkt in A konvergiert. Weil eine Folge nicht
gegen zwei verschiedene Punkt konvergieren kann (siehe Proposition 5.2), erhalten wir auch hier einen Widerspruch.
Zusammen mit Folgerung 8.9 erhalten wir
Satz 8.14
Eine Teilmenge A ⊆ Rn ist genau dann kompakt, wenn sie beschränkt und abge-
schlossen ist.
Abeschlossene und beschränkte Teilmengen allgemeiner metrischer Räume sind nicht notwendigerweise auch kompakt. Beispielsweise gilt
Proposition 8.15
Sei X eine unendliche Menge und d X die diskrete Topologie auf X . Dann ist
X zwar beschränkt und abgeschlossen, aber nicht kompakt.
Beweis:
Weil d X nur die Werte 0 und 1 annimmt, gilt d (X ) = 1 für den Durchmesser von X . Also ist X beschränkt.
Wie in jedem metrischen Raum ist die Gesamtmenge X abgeschlossen. Darüber hinaus ist, wie wir in §7 gesehen
—– 59 —–
§ 8.
Kompaktheit
haben, jede Teilmenge eines diskreten metrischen Raums offen und damit auch abgeschlossen. Andererseits ist X
nicht kompakt. Weil nämlich jede Teilmenge von X offen ist, erhalten wir durch ({x})x∈X eine offene Überdeckung
von X . Weil aber X unendlich ist, können wir in ({x})x∈X keine endliche Teilüberdeckung wählen.
Satz 8.16 Sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen, wobei X kompakt
sei. Dann ist auch die Bildmenge f (X ) kompakt.
Beweis:
Sei (Vi )i ∈I eine offene Überdeckung von f (X ). Dann sind die Urbildmengen Ui = f −1 (Vi ) auf Grund der
Stetigkeit von f offen (siehe Folgerung 7.10), und sie bilden eine Überdeckung des Definitionsbereichs X der Abbildung. Weil X kompakt ist, gibt es eine endliche Teilmenge J ⊆ I , so dass X bereits von (Ui )i ∈J überdeckt wird. Dann
ist (Vi )i ∈J eine Überdeckung von f (X ). Ist nämlich y ∈ f (X ) vorgegeben, dann existiert ein x ∈ X mit f (x) = y und ein
i ∈ J mit x ∈ Ui = f −1 (Vi ). Es folgt dann y = f (x) ∈ Vi .
Satz 8.17
(Maximumsprinzip)
Jede stetige, reellwertige Funktion f : X → R auf einem kompakten metrischen Raum X ist beschränkt und nimmt auf X ihr Maximum und Minimum an.
Beweis:
Nach Satz 8.16 ist f (X ) ⊆ R beschränkt und abgeschlossen. Weil f (X ) beschränkt ist, besitzt diese Menge
ein Infimum m − und ein Supremum m + . Nehmen wir an, dass m + nicht in f (X ) liegt. Dann gibt es nach Definition
des Supremums eine Folge (y (n) )n∈N in f (X ) mit limn y (n) = m + . Aber weil f (X ) abgeschlossen ist, muss nach Satz
7.16 auch der Grenzwert m + in f (X ) liegen. Genauso beweist man m − ∈ f (X ).
Definition 8.18
Eine Abbildung f : X → Y zwischen metrischen Räumen (X , d X ) und (Y , d Y )
wird gleichmäßig stetig auf X genannt, wenn für jedes ε ∈ R+ ein δ ∈ R+ existiert, so dass die
Implikation d X (x, y) < δ ⇒ d Y ( f (x), f (y)) < ε für alle x, y ∈ X erfüllt ist.
Satz 8.19 Sei f : X → Y eine stetige Abbildung zwischen metrischen Räumen, wobei X kompakt
sei. Dann ist f sogar gleichmäßig stetig auf X .
Beweis:
Sei ε ∈ R+ vorgegeben. Weil f auf X stetig ist, können wir für jeden Punkt a ∈ X das ε-δ-Kriterium (Satz 6.5)
anwenden und erhalten ein δa ∈ R+ , so dass die Implikation d X (a, x) < δa ⇒ d Y ( f (a), f (x)) < 12 ε für alle x ∈ X erfüllt
ist. Lassen wir a die gesamte Menge X durchlaufen, dann bilden die offenen Bälle U a = B 1 δa (a) bilden einen offene
2
Überdeckung von X . Weil X kompakt ist, können wir eine endliche Teilmenge J ⊆ X wählen, so dass X bereits durch
die Mengen U a mit a ∈ J überdeckt wird.
Sei nun δ = min{ 21 δa a ∈ J }, und seien x, y ∈ X mit d X (x, y) < δ vorgegeben. Auf Grund der Überdeckungseigenschaft finden wir ein a ∈ J mit x ∈ U a . Es folgt d X (a, x) < 12 δa , und zusammen mit d X (x, y) < δ ≤ 12 δa erhalten wir
d X (a, y) < δa . Aus d X (a, x) < 21 δa < δa folgt d Y ( f (a), f (x)) < 12 ε, und aus d X (a, y) < δa folgt d Y ( f (a), f (y)) < 12 ε. Mit
der Dreiecksungleichung erhalten wir insgesamt d Y ( f (x), f (y)) ≤ d Y ( f (a), f (x)) + d Y ( f (a), f (y)) < 12 ε + 21 ε = ε.
—– 60 —–
Document
Kategorie
Gesundheitswesen
Seitenansichten
23
Dateigröße
4 284 KB
Tags
1/--Seiten
melden