Pokročilé partie numerické lineární algebry ⬩ Adamátorovy zápisky

Úvod

reálný problém
matematický popis (chyba modelu)
matematický model
diskretizace (chyba diskretizace)
numerický model
linearizace (chyba linearizace)
lineární algebraický problém
výpočet na počítači (zaokrouhlovací chyba)
aproximace řešení

Matematický model může být třeba nějaká diferenciální rovnice, která se často nedá exaktně řešit a navíc její řešení je prvek nekonečněrozměrného prostoru, takže se ani nedá popsat. Diskretizací – například pomocí metody sítí – to převedeme do konečněrozměrného prostoru. Tím ale často vznikne nelineární problém, takže ho ještě musíme linearizovat, například pomocí Newtonovy metody.

Předmětem tohoto kurzu bude:

numerické řešení soustav lineárních algebraických rovnic
výpočet vlastních čísel matice
řešení problému nejmenších čtverců
hledání rozkladů matic

Při výběru vhodné metody je nutné přihlížet k:

počtu iterací
paměťové náročnosti
možnosti paralelizace
odolnosti vůči šíření zaokrouhlovacích chyb

Aritmetika s pohyblivou řádovou čárkou

β, t, e_{min}, e_{max} \in ℤ, β \geq 2, t \geq 1, e_{min} \leq e_{max}

y_{1}, y_{2} \in ℱ

ε_{M}

V praxi se množina $ℱ$ rozšiřuje o subnormální čísla, k jejichž reprezentaci se používá nulový exponent:

𝒮 ≔ {\pm m \cdot β^{e_{min} - t} | m \in ℤ, 0 < m < β^{t}} .

Navíc jsou-li exponent i mantisa nulové, máme reprezentaci nuly. Dokonce máme kladnou i zápornou nulu, které se rovnají, ale nejsou shodné. Nejvyšší exponent se potom používá k reprezentaci nekonečna a neplatných hodnot.

Přesnost zobrazení reálného čísla v $ℱ$

x \in ℝ

x \in [min ℱ, max ℱ]

Vliv zaokrouhlovacích chyb v aritmetice s konečnou přesností

f (x) ≔ \frac{1 - cos x}{x^{2}}

a_{0} ≔ 1, a_{1} ≔ \frac{1}{11}, a_{n} ≔ \frac{34}{11} a_{n - 1} - \frac{3}{11} a_{n - 2} .

To, co v těchto příkladech způsobuje absurdně velké chyby, se nazývá katastrofické krácení (cancellation effect), k němuž dochází, když odčítáme dvě téměř stejná čísla zatížená chybou. Mějme nějaká čísla $x, y$ a jejich aproximace $\tilde{x} = x \cdot (1 + δ_{x}), \tilde{y} = y \cdot (1 + δ_{y})$ . Potom

\tilde{x} - \tilde{y} = x + x \cdot δ_{x} - y - y \cdot δ_{y} = (x - y) \cdot (1 + \frac{x \cdot δ_{x} - y \cdot δ_{y}}{x - y}) .

Tedy relativní chyba rozdílu je $\frac{x \cdot δ_{x} - y \cdot δ_{y}}{x - y}$ , což může být velké číslo, i když $δ_{x}, δ_{y}$ jsou malé.

Z toho plyne poučení, že bychom se měli vyhýbat odčítání podobně velkých čísel. Ale to se lehko řekne. Například při aproximaci derivace počítáme

f^{'} (x) = lim_{h \to 0} \frac{f (x + h) - f (x)}{h} \approx \frac{f (x + h) - f (x)}{h} .

Kdybychom tuto aproximaci počítali přesně, výsledek by pro menší $h$ byl lepší. Ale při počítání se zaokrouhlováním to díky zmíněnému efektu nefunguje a pod určitou mezí už se přesnost bude zhoršovat. Ukazuje se, že optimální hodnota je přibližně $h ≔ \sqrt{ε_{M}}$ .

Často je ale možné se nebezpečnému odčítání nějak vyhnout. Například pokud si u příkladu s $1 - cos x$ funkci rozvineme do Taylorova polynomu, dokážeme ji spočíst mnohem přesněji.

Přímá a zpětná stabilita algoritmu

Mějme například úlohu řešení soustavy lineárních algebraických rovnic $A x = b$ . Použijeme nějaký algoritmus, například Gaussovu eliminaci, který by nám v teorii vrátil nějaký výsledek $C (A, b)$ v závislosti na vstupních parametrech $A, b$ . Při počítání v aritmetice s konečnou přesností ale dostaneme výsledek $fl (C (A, b))$ . (Pozor, tím se nemyslí skutečná hodnota $C (A, b)$ zaokrouhlená na nejbližší pohyblivé číslo, ale výsledek algoritmu, který celou dobu počítá s konečnou přesností.) Chceme najít absolutní chybu $fl (C (a, b)) - C (a, b)$ .

Mohli bychom to zkusit analyzovat přímo, ale to je pro naprostou většinu algoritmů neproveditelné, jenom u hodně jednoduchých operací jako výpočet skalárního součinu. Místo toho provedeme zpětnou analýzu chyby. Budeme hledat vstupní data $\tilde{A}, \tilde{b}$ taková, že řešení původní úlohy algoritmem v konečné aritmetice bylo stejné jako přesné řešení pro $\tilde{A}, \tilde{b}$ . Tedy má platit

fl (C (A, b)) = C (\tilde{A}, \tilde{b}) .

Definice Algoritmus je zpětně stabilní, jestliže se chyby vzniklé v průběhu výpočtu promítnou do malé změny vstupních dat. Jinými slovy, algoritmus dává malou zpětnou chybu .

Přímou chybu můžeme potom spočítat jako

fl (C (A, b)) - C (A, b) = C (\tilde{A}, \tilde{b}) - C (A, b) .

Stačí už nám tedy jen odhad na citlivost úlohy.

Citlivost vlastních čísel

Mějme matice $A, E \in ℂ^{N \times N}$ , kde $E$ vyjadřuje chybu. Zajímá nás vztah mezi $σ (A)$ a $σ (A + E)$ . Budeme značit

A^{*} ≔ \bar{A^{𝖳}},

⟨ x, y ⟩ ≔ y^{*} x = \sum_{i = 1}^{N} x_{i} \bar{y_{i}},

‖ x ‖ = {‖ x ‖}_{2} ≔ \sqrt{⟨ x, x ⟩} = \sqrt{\sum_{i = 1}^{N} {| x_{i} |}^{2}},

σ (A) ≔ {λ \in ℂ | \exists x \neq 0 : A x = λ x},

ρ (A) ≔ max_{λ \in σ (A)} | λ |,

‖ A ‖ = {‖ A ‖}_{2} ≔ max_{‖ x ‖ = 1} ‖ A x ‖ = \sqrt{ρ (A^{*} A)},

ϰ (A) ≔ ‖ A ‖ \cdot ‖ A^{- 1} ‖ .

ϰ (A)

ϰ (A) \geq 1

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

A

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

A \in ℂ^{N \times N}

ℂ^{N \times N}

A_{0} ≔ (\begin{matrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{matrix}), A_{1} ≔ (\begin{matrix} 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \end{matrix}), E ≔ (\begin{matrix} 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \\ ε & 0 & 0 & 0 \end{matrix}) .

A \in ℂ^{N \times N}

Měření vzdálenosti spekter

Budeme značit ${λ_{i}}$ vlastní čísla matice $A \in ℂ^{N \times N}$ a ${{\tilde{λ}}_{i}}$ vlastní čísla matice $\tilde{A} ≔ A + E$ .

\tilde{A}

A, \tilde{A}

A, \tilde{A}

{sv}_{A} (\tilde{A}) \leq hd (A, \tilde{A}) \leq md (A, \tilde{A}) .

| det A | \leq \prod_{j = 1}^{N} ‖ A_{\cdot, j} ‖,

hd (A, \tilde{A}) \leq {(‖ A ‖ + ‖ \tilde{A} ‖)}^{1 - \frac{1}{N}} \cdot {‖ E ‖}^{\frac{1}{N}} .

A, E \in ℂ^{N \times N}, \tilde{A} ≔ A + E

Q \in ℂ^{N \times N}

α_{i} ≔ \sum_{j = 1}^{N} | A_{i, j} |, σ_{i} (A) ≔ {ξ \in ℂ | | ξ - A_{i, i} | < α_{i}} .

A ≔ (\begin{matrix} 1 & 0 \\ 0 & 2 \end{matrix}), E ≔ (\begin{matrix} 0 & 10^{- 4} \\ 10^{- 4} & 0 \end{matrix}) .

Citlivost vlastních čísel diagonalizovatelných a normálních matic

A

Zpětná analýza citlivosti vlastních čísel

p < N, A \in ℂ^{N \times N}, M \in ℂ^{p \times p}, X \in ℂ^{N \times p}, R ≔ A X - X M, Y^{*} \in ℂ^{p \times N}, Y^{*} X = 𝐈, \tilde{A} ≔ A - R Y^{*}

A \in C^{N \times N}

Citlivost řešení soustav lineárních algebraických rovnic

Mějme soustavu $A x = b$ , kde $A \in ℂ^{N \times N}$ je regulární a $b \in ℂ^{N}, b \neq 0$ . Chceme porovnat její řešení s řešením perturbované soustavy $\tilde{A} \tilde{x} = \tilde{b}$ , kde $\tilde{A} = A + δ A$ , $\tilde{x} = x + δ x$ a $\tilde{b} = b + δ b$ . Rozlišíme tři případy:

$\tilde{A} = A, \tilde{b} \neq b$ ,
$\tilde{A} \neq A, \tilde{b} = b$ ,
$\tilde{A} \neq A, \tilde{b} \neq b$ .

\tilde{A} = A

\frac{‖ δ A ‖}{‖ A ‖} < \frac{1}{ϰ (A)},

\tilde{b} = b

\frac{‖ δ A ‖}{‖ A ‖} < \frac{1}{ϰ (A)},

Zpětná analýza citlivosti řešení soustav lineárních algebraických rovnic

\tilde{x}

QR rozklady matic

Velká část této sekce bude opakování z Numerické matematiky 1.

Definice Flop (floating-point operation) je jedna operace s čísly s pohyblivou řádovou čárkou, přičemž jedno sčítání/odčítání může být provedeno dohromady s jedním násobením/dělením.

A \in ℝ^{N \times N}

u \in ℝ^{N}, ‖ u ‖ = 1

x, y \in ℝ^{N}, x \neq y, ‖ x ‖ = ‖ y ‖

A \in ℝ^{N \times N}

A \in ℝ^{N \times M}, N > M

A \in ℝ^{N \times M}, N \geq M, h (A) = M

Metoda nejmenších čtverců

Mějme $A \in ℝ^{N \times M}, N \geq M, h (A) = M, b \in ℝ^{N}$ . Řešíme soustavu $A \cdot x = b$ , tedy soustavu, která má víc rovnic než proměnných. Jelikož řešení nemusí existovat, chceme se alespoň dostat co nejblíž, tedy minimalizovat ${| b - A \cdot x |}^{2}$ .

K řešení použijeme QR rozklad. Nechť $A = Q \cdot R$ , kde $R = (\begin{matrix} \hat{R} \\ 0 \end{matrix})$ s $\hat{R}$ čtvercovou. Potom

{‖ a ‖}^{2} ≔ {‖ b - A \cdot x ‖}^{2} = {‖ Q^{𝖳} (b - A \cdot x) ‖}^{2} = {‖ Q^{𝖳} \cdot b - R \cdot x ‖}^{2} .

Označíme-li $c$ prvních $M$ řádků $Q^{𝖳} \cdot b$ a $d$ zbylých $N - M$ řádků, dostáváme podle Pythagorovy rovnosti

{‖ a ‖}^{2} = {‖ c - \hat{R} \cdot x ‖}^{2} + {‖ d ‖}^{2} .

Tento výraz nabývá minima, právě když $\hat{R} \cdot x = c$ . Tato soustava má jednoznačné řešení, takže tím dostáváme jednoznačné řešení problému nejmenších čtverců.

Metody Krylovových podprostorů

A \in ℝ^{N \times N}

K_{n} (A, v)

A \cdot x = b

K_{n} (A, v)

Metody Krylovových podprostorů pro řešení soustav rovnic (přehled)

Řešíme soustavu $A x = b$ , kde $A \in ℝ^{N \times N}$ je regulární. Zvolíme počáteční aproximaci $x_{0} \in ℝ^{N}$ a spočeteme reziduum $r_{0} ≔ b - A x_{0}$ . Poté budeme postupně nějakým způsobem hledat $x_{n} \in x_{0} + K_{n} (A, r_{0})$ . K tomu jsou různé přístupy podle toho, čeho chceme dosáhnout:

Ritzova–Galerkinova projekce: Hledáme $x_{n}$ takové, že $b - A x_{n} ⟂ K_{n} (A, r_{0})$ . Druhy: FOM (Full Orthogonalization Method), Lanczosova metoda, CG (metoda sdružených gradientů)
Minimalizace rezidua: Hledáme takové $x_{n}$ , pro které je $‖ b - A x_{n} ‖$ minimální. Druhy: GMRES, MINRES (pro symetrické matice), ORTHODIR
Petrovova–Galerkinova projekce: Hledáme takové $x_{n}$ , že $b - A x_{n} ⟂ S_{n}$ , kde $S_{n}$ je nějaký podprostor dimenze $n$ . Druhy: BiCG (metoda bikonjugovaných gradientů), QMR (kvazi-minimální reziduum)
Minimalizace chyby: Hledáme takové $x_{n}$ , aby $‖ x - x_{n} ‖$ bylo minimální na $A^{𝖳} K_{n} (A^{𝖳}, r_{0})$ . Druhy: SYMMLQ, GMERR

Co se týče rychlosti konvergence, všechny metody konvergují rychle, pokud $A \approx 𝐈$ . Pro dosažení tohoto můžeme řešit ekvivalentní (předpodmíněnou) soustavu:

levá: $M^{- 1} A x = M^{- 1} b$
pravá: $A M^{- 1} y = b, x = M^{- 1} y$

Jak najít matici

M

tak, aby se úloha řešila co nejlépe a zároveň se dala snadno najít?

Pokročilé partie numerické lineární algebry

Úvod

Obsah přednášky

Citlivost úlohy

Aritmetika s pohyblivou řádovou čárkou

Přesnost zobrazení reálného čísla v $ℱ$

Vliv zaokrouhlovacích chyb v aritmetice s konečnou přesností

Přímá a zpětná stabilita algoritmu

Citlivost vlastních čísel

Měření vzdálenosti spekter

Citlivost vlastních čísel diagonalizovatelných a normálních matic

Zpětná analýza citlivosti vlastních čísel

Citlivost řešení soustav lineárních algebraických rovnic

Zpětná analýza citlivosti řešení soustav lineárních algebraických rovnic

QR rozklady matic

Metoda nejmenších čtverců

Metody Krylovových podprostorů

Metody Krylovových podprostorů pro řešení soustav rovnic (přehled)

Singulární rozklady matic

Pokročilé partie numerické lineární algebry

Úvod

Obsah přednášky

Citlivost úlohy

Aritmetika s pohyblivou řádovou čárkou

Přesnost zobrazení reálného čísla v ℱ

Vliv zaokrouhlovacích chyb v aritmetice s konečnou přesností

Přímá a zpětná stabilita algoritmu

Citlivost vlastních čísel

Měření vzdálenosti spekter

Citlivost vlastních čísel diagonalizovatelných a normálních matic

Zpětná analýza citlivosti vlastních čísel

Citlivost řešení soustav lineárních algebraických rovnic

Zpětná analýza citlivosti řešení soustav lineárních algebraických rovnic

QR rozklady matic

Metoda nejmenších čtverců

Metody Krylovových podprostorů

Metody Krylovových podprostorů pro řešení soustav rovnic (přehled)

Singulární rozklady matic

Přesnost zobrazení reálného čísla v $ℱ$