Metody pro řídké matice ⬩ 01MRMMI ⬩ Adamátorovy zápisky

Na konci se bude psát zápočtový test prověřující praktické znalosti. Není potřeba umět důkazy.

Reprezentace řídkých matic v počítači

Chceme řídkou matici uložit tak, aby zabrala co nejméně paměti a efektivně se s ní počítalo.

Souřadnicový formát

Jedno pole reálných řísel obsahující hodnoty všech $k$ nenulových prvků;
dvě celočíselná pole délky $k$ obsahující jejich indexy.

(\begin{matrix} 1 & 0 & 0 & 2 & 0 \\ 3 & 4 & 0 & 5 & 0 \\ 6 & 0 & 7 & 8 & 9 \\ 0 & 0 & 10 & 11 & 0 \\ 0 & 0 & 0 & 0 & 12 \end{matrix})

Nevýhoda je, že v takové reprezentaci je těžké například najít prvek na dané pozici.

Komprimované řídké řádky (CSR)

Jedno pole reálných řísel obsahující hodnoty všech $k$ nenulových prvků seřazené po řádcích;
jedno celočíselné pole délky $k$ obsahující jejich sloupcové indexy;
jedno celočíselné pole délky $n + 1$ , kde $i$ -tý prvek obsahuje index začátku $i$ -tého řádku v předchozích dvou polích. Ten jeden navíc ukazuje za konec pole (tím se zjednoduší algoritmy iterující přes daný řádek).

(\begin{matrix} 1 & 0 & 0 & 2 & 0 \\ 3 & 4 & 0 & 5 & 0 \\ 6 & 0 & 7 & 8 & 9 \\ 0 & 0 & 10 & 11 & 0 \\ 0 & 0 & 0 & 0 & 12 \end{matrix})

Oproti souřadnicovému formátu to šetří paměť. Nevýhodou ovšem je, že je obtížné přidávat nové nenulové prvky, což může být důležité třeba u metod založených na Gaussově eliminaci.

Analogicky můžeme mít komprimované řídké sloupce (CSC).

Modifikované komprimované řídké řádky (MSR)

Motivací je, že často potřebujeme efektivnější přístup k prvkům na hlavní diagonále.

Jedno pole reálných řísel obsahující hodnoty všech $k$ nenulových prvků počínaje diagonálními, poté zarážku a zbylé prvky po řádcích;
jedno celočíselné pole délky $k + 1$ obsahující nejprve indexy začátků řádků a poté sloupcové indexy nediagonálních prvků.

(\begin{matrix} 1 & 0 & 0 & 2 & 0 \\ 3 & 4 & 0 & 5 & 0 \\ 6 & 0 & 7 & 8 & 9 \\ 0 & 0 & 10 & 11 & 0 \\ 0 & 0 & 0 & 0 & 12 \end{matrix})

Kromě efektivního přístupu k diagonále má stejné výhody a nevýhody jako CSR.

Ellpack

Tento formát je populární na vektorových počítačích.

Využívá se pro matice, kde počet nenulových prvků v jednom řádku je omezený nějakou konstantou $N_{d}$ .

Jedno pole reálných čísel velikosti $n \times N_{d}$ obsahující hodnoty nenulových prvků v jednotlivých řádcích;
jedno celočíselné pole velikosti $n \times N_{d}$ obsahující jejich indexy.

(\begin{matrix} 1 & 0 & 2 & 0 & 0 \\ 3 & 4 & 0 & 5 & 0 \\ 0 & 6 & 7 & 0 & 8 \\ 0 & 0 & 9 & 10 & 0 \\ 0 & 0 & 0 & 11 & 12 \end{matrix})

Formát je jednoduchý a většinou se s ním dobře pracuje, akorát nejde použít, když má matice nějaké husté řádky.

Diagonální uložení

Vhodné pro matice, které mají nenulové prvky pouze podél několika málo diagonál (například ty vzniklé z metody konečných diferencí).

Prostě uložíme hodnoty těchto diagonál a k tomu si poznamenáme, kolikáté jsou.

(\begin{matrix} 1 & 0 & 2 & 0 & 0 \\ 3 & 4 & 0 & 5 & 0 \\ 0 & 6 & 7 & 0 & 8 \\ 0 & 0 & 9 & 10 & 0 \\ 0 & 0 & 0 & 11 & 12 \end{matrix})

Přeuspořádání matic

A ≔ (\begin{matrix} \times & \times & \times & \times & \times & \times & \times \\ \times & \times & 0 & 0 & 0 & 0 & 0 \\ \times & 0 & \times & 0 & 0 & 0 & 0 \\ \times & 0 & 0 & \times & 0 & 0 & 0 \\ \times & 0 & 0 & 0 & \times & 0 & 0 \\ \times & 0 & 0 & 0 & 0 & \times & 0 \\ \times & 0 & 0 & 0 & 0 & 0 & \times \end{matrix}) .

A

Je otázkou, jakou permutaci zvolit, abychom si usnadnili práci co nejvíce. K tomu je několik různých přístupů.

Algoritmy pro vytvoření pásu/profilu

A \in ℝ^{n \times n}

x

Uspořádání minimalizující zaplněnost

Chceme najít permutační matici $P$ takovou, že $| struct (L_{P A P^{𝖳}}) |$ je minimální.

Není známý efektivní algoritmus, který by vždy nalezl optimální řešení.

G_{0} ≔ G (A), A_{0} ≔ A

Uspořádání přizpůsobující matici počítačové architektuře

Máme paralelní počítač a chceme vrcholy eliminovat v takovém pořadí, aby se to dalo dobře paralelizovat.

Mějme graf, který se po odstranění nějaké malé podmnožiny vrcholů (separátoru $S$ ) rozdělí na dvě podobně velké komponenty $C_{1}$ a $C_{2}$ . Potom coloki, co budeme dělat s jednou z komponent, ovlivní jen tuto komponentu a separátor. Pro paralelizaci se tedy vyplatí očíslovat vrcholy v pořadí $C_{1} \to C_{2} \to S$ , takže $C_{1}$ a $C_{2}$ potom můžeme eliminovat paralelně.

Rozdělování můžeme rekurzivně opakovat, dokud jsou komponenty dostatečně velké, aby se to vyplatilo. Tomu se říká metoda vnořených řezů (nested dissection method).

Frontální metoda

Místo abychom uspořádání stanovili předem, budeme ho hledat dynamicky za běhu eliminace.

V každém kroku přehodíme řádky a sloupce tak, aby nenulové prvky šly co nejblíž k diagonále.

Často tím vzniknou malé husté podmatice, které můžeme řešit standardními metodami.

Nevýhoda je, že permutování za běhu může být náročné.

Výhoda je, že můžeme konstruovat Choleského rozklad matice, i když ji ještě nemáme celou spočtenou. To se může vyplatit například u metody konečných prvků, kde počítání matice je náročné.

Poznámky k obecnějším systémům

Zatím jsme se zabývali metodami pro pozitivně definitní matice. Jak se tyto poznatky dají zobecnit na jiné třídy matic?

Indefinitní symetrické matice

(\begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix})

Symetrické indefinitní matice v praxi vznikají při použití smíšené formulace metody konečných prvků na eliptickou úlohu druhého řádu nebo také při hledání vázaných extrémů metodou Lagrangeových multiplikátorů. V obou těchto případech vznikne matice tvaru $A = (\begin{matrix} B & C \\ C^{𝖳} & 0 \end{matrix})$ , kde $B \in ℝ^{m \times m}$ je pozitivně definitní, $C \in ℝ^{m \times (n - m)}, m \geq n - m, h (C) = n - m$ . Soustava je tedy ve tvaru

\begin{align} B x + C y & = b_{1}, \\ C^{𝖳} x & = b_{2} . \end{align}

Jelikož $B$ je pozitivně definitní, můžeme najít její Choleského rozklad $B = L \cdot L^{𝖳}$ . Podle první rovnice je $x = B^{- 1} (b_{1} - C y)$ . Dosazením do druhé rovnice máme

C^{𝖳} B^{- 1} (b_{1} - C y) = b_{2};

\underset{S}{\underset{⏟}{C^{𝖳} B^{- 1} C}} y = - b_{2} + C^{𝖳} B^{- 1} b_{1},

kde $S \in ℝ^{(n - m) \times (n - m)}$ je Schurův doplněk. Dokážeme, že $S$ je pozitivně definitní. Pro $y \in ℝ^{m} s - {0}$ je

⟨ y | S y ⟩ = ⟨ C^{𝖳} B^{- 1} C y | y ⟩ = ⟨ B^{- 1} C y | C y ⟩ = ⟨ L^{- 𝖳} L^{- 1} C y | C y ⟩ = ⟨ L^{- 1} C y | L^{- 1} C y ⟩ = {‖ L^{- 1} C y ‖}^{2} > 0 .

Soustavu s maticí $S$ tedy můžeme řešit Choleského rozkladem. Akorát je problém v tom, že může být hustá, i když $A$ je řídká. Vyplatí se to tedy, jenom když je malá. V opačném případě je možné to nějak prokletě zkombinovat s iterační metodou (typicky konjugované gradienty). Potom nemusíme $S$ explicitně sestavovat, ale stačí s ní umět násobit vektory. K tomu nám stačí na vektor postupně aplikovat $C, L^{- 1}, L^{- 𝖳}, C^{𝖳}$ .

Obecné regulární matice

U matice, která není symetrická, nemáme Choleského rozklad, ale jen LU rozklad. Ten navíc nnexistuje, když matice není silně regulární; v takovém případě ještě navíc potřebujeme pivotaci. Pivotace by ideálně neměla způsobit velké zaplnění, což je ale často v rozporu s požadavky výše uvedených metod. Navíc výběr pivota obvyklým způsobem závisí na numerických hodnotách, takže není možné analyzovat strukturu předem.

Místo pivotace za běhu můžeme zkusit najít takovou permutaci, která přesune absolutně velké prvky na diagonálu.

(\begin{matrix} \times & 0 & 0 & 0 & 0 & 0 & \times \\ \times & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & \times & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & \times & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & \times & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & \times & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & \times & \times \end{matrix}) .

A = (\begin{matrix} A & 0 \\ B & C \end{matrix})

K nalezení permutace řádků a sloupců, které nám umožní matici převést na blokově trojúhelníkový tvar, použijeme orientovaný graf matice. Najdeme silně souvislé komponenty, topologicky je seřadíme a z každé uděláme blok, přičemž je řadíme v opačném pořadí.

C_{3}

K rozkladu jednotlivých bloků se dá použít částečná pivotace (pivota hledáme jen v příslušném řádku/sloupci) nebo úplná pivotace (pivota hledáme v celé podmatici).

TBD

Iterační metody

Z 01NMA známe stacionární metody: prostá iterace, Jacobi, Gauss-Seidel, SOR. Z 01PNL známe nestacionární krylovské metody: konjugované gradienty, minimální reziduum, zobecněné minimální reziduum, bikonjugované gradienty, kvadratické minimální reziduum.

Všechny tyto metody rychle konvergují, pokud $A \approx 𝐈$ . Když to neplatí, můžeme si soustavu upravit levým předpodmíněním

M^{- 1} A X = M^{- 1} b

nebo pravým předpodmíněním

A M^{- 1} y = b, M^{- 1} y = x .

Matici $M$ potřebujeme zvolit tak, aby bylo $M^{- 1} A \approx 𝐈$ nebo $A M^{- 1} \approx 𝐈$ a zároveň šla snadno najít.

Je-li $A$ pozitivně definitní, musíme si dávat pozor, aby se to předpodmíněním neporušilo. Toho docílíme tím, že předpodmíníme oboustranně: máme-li Choleského rozklad $M = L \cdot L^{𝖳}$ , potom budeme řešit

L^{- 1} A L^{- 𝖳} y = L^{- 1} b, L^{- 𝖳} y = x .

Předpodmiňování stacionárních metod

Nechť $A = M - N$ , kde $M$ je regulární matice. Potom

A x = b ⟺ M x = N x + b .

Budeme hledat posloupnost $(x_{k})$ takovou, že $M x_{k + 1} = N x_{k} + b$ . Z toho máme

x_{k + 1} = M^{- 1} N x_{k} + M^{- 1} b = x_{k} + M^{- 1} \underset{r_{k}}{\underset{⏟}{(b - A x_{k})}},

kde $r_{k}$ je reziduum $k$ -té aproximace. Stačí tedy vždy spočítat reziduum $r ≔ b - A x$ , spočítat opravu $M z = r$ a opravit $x \leftarrow x + z$ . Tato iterace konverguje pro $ρ (M^{- 1} N) = ρ (𝐈 - M^{- 1} A) < 1$ .

M, N

A = M - N

A

Rychlost konvergence stacionárních metod

Nechť $A = M - N$ je regulární rozklad a $G ≔ M^{- 1} N$ . Máme aproximaci $x_{k + 1} = G x_{k} + M^{- 1} b$ a chceme určit, jak se liší od přesného řešení $x = G x + M^{- 1} b$ . Označme $e_{k} ≔ x_{k} - x$ . Podle předpisu iterace je $e_{k + 1} = G x_{k} - G x = G e_{k}$ . Rozvinutím dostáváme

e_{k} = G e_{k - 1} = G^{2} e_{k - 2} = \dots = G^{k} e_{0},

kde $e_{0}$ je počáteční chyba. Z toho plyne odhad $‖ e_{k} ‖ \leq ‖ G ‖ ‖ e_{0} ‖$ . Podle nějaké věty je $lim_{n \to \infty} \sqrt[n]{‖ G^{n} ‖} = ρ (G)$ . Když to rozepíšeme z definice, máme

\forall ε > 0, \exists n_{0} \in ℝ, \forall n > n_{0} : | \sqrt[n]{‖ G^{n} ‖} - ρ (G) | < ε .

Jednoduchými úpravami dostaneme $‖ G^{n} ‖ \leq {(ρ (G) + ε)}^{n}$ . Pokud $ρ (G) < 1$ , můžeme zvolit $ε$ takové, aby $ρ (G) + ε < 1$ , takže od nějakého členu dál bude chyba exponenciálně klesat. Nevíme ovšem, jak se to bude chovat na začátku. Konvergence dokonce ani nemusí být monotónní, tedy může se stát, že na začátku bude chyba růst.

Speciálně je-li $G$ normální, máme $ρ (G) = {‖ G ‖}_{2}$ , takže v tomto případě máme monotónní konvergenci zaručenou. Počet iterací potřebný k dosažení chyby nanejvýš $δ$ v poměru k počáteční chybě je potom ${log}_{{‖ G ‖}_{2}} δ$ .

Volba předpodmínění u stacionární metody

Vezmeme-li $M ≔ 𝐈$ , máme metodu prosté iterace, která konverguje, pokud $ρ (𝐈 - A) < 1$ . Ideálně $ρ (𝐈 - A) ≪ 1$ , tedy vlastní čísla $A$ jsou všechna blízká $1$ . Pokud tomu tak není, musíme předpodmiňovat.

Richardsonovo předpodmínění: $M ≔ \frac{1}{ω} 𝐈$ , kde $ω > 0$ je relaxační parametr. Potom o konvergenci rozhoduje $ρ (𝐈 - ω A)$ . Často je možné vhodně zvolit $ω$ tak, aby konvergence fungovala, i když může být pomalá.
Jacobiho předpodmínění: $M ≔ D$ , kde $D$ je diagonální matice se stejnou diagonálou jako $A$ . O konvergenci potom rozhoduje $ρ (𝐈 - D^{- 1} A)$ . O tom obecně nemůžeme říct, ale občas se to hodí a je to hodně jednoduché na výpočet.
Gaussovo–Seidelovo předpodmínění: $M ≔ D - L$ , kde $L$ je dolní trojúhelník (i s diagonálou) $A$ . $M^{- 1}$ potom získáme řešením soustavy s trojúhelníkovou maticí, což se taky počítá snadno, ale na rozdíl od Jacobiho nejde snadno paralelizovat.
SOR metoda: $M ≔ \frac{1}{ω} D - L$ , kde $ω > 0$ je relaxační parametr. Ten volíme tak, aby $ρ (𝐈 - {(\frac{1}{ω} D - L)}^{- 1} A)$ bylo minimální. Ještě se dostaneme k tomu, jak to udělat.

Chceme-li předpodmínění použít u krylovských metod pracujících se symetrickou maticí (např. metoda sdružených gradientů), musíme ho zvolit tak, aby se symetrie zachovala. U Richardsona nebo Jacobiho to není problém, ale SOR musíme upravit, čímž vznikne SSOR (Symmetric SOR). Definujme $M_{1} ≔ \frac{1}{ω} D - L, M_{2} ≔ \frac{1}{ω} D - U$ , kde $U$ je horní trojúhelníková část $A$ . Potom budeme střídavě řešit

M_{1} x_{k + \frac{1}{2}} = N_{1} x_{k} + b,

M_{2} x_{k + 1} = N_{1} x_{k + \frac{1}{2}} + b,

kde $N_{1, 2} ≔ M_{1, 2} - A$ . Ve výsledku máme

M = \frac{ω}{2 - ω} (\frac{1}{ω} D - L) D^{- 1} (\frac{1}{ω} D - U) .

Předpodmínění metody sdružených gradientů

Je-li $M$ symetrická, existuje Choleského rozklad $M = L \cdot L^{𝖳}$ . Potom můžeme metodu sdružených gradientů aplikovat na rovnici

L^{- 1} A \underset{x}{\underset{⏟}{L^{- 𝖳} y}} = L^{- 1} b .

Mějme pozitivně definitní matici $A \in ℝ^{n \times n}$ a počáteční reziduum $r_{0} ≔ b - A x_{0}$ . Vyřešíme si rovnici $M z_{0} = r_{0}$ . Následně v metodě budeme na některých místech místo $r_{i}$ používat $z_{i}$ a po každém kroku si dopočteme další $z_{i}$ . Rychlost konvergence bude

{‖ x_{n} - x ‖}_{A} \leq 2 {(\frac{\sqrt{ϰ (A)} - 1}{\sqrt{ϰ (A)} + 1})}^{n} {‖ x_{0} - x ‖}_{A} .

Všimněme si, že to vždy bude konvergovat, i když pro velké $ϰ (A)$ hodně pomalu.

n \times n

Neúplné LU rozklady

Při úplném LU rozkladu vzniká hodně zaplnění. Místo toho můžeme spočítat jen nějakou jeho aproximaci a tu následně použít pro předpodmínění.

Klasický LU rozklad (řádková varianta) vypadá takto:

Pro každé i=2,…,n:
1. Pro každé k=1,…,i−1:
  1. $a_{i, k} \leftarrow \frac{a_{i, k}}{a_{k, k}}$
  2. Pro každé j=k+1,…,n:
    1. $a_{i, l} \leftarrow a_{i, j} - a_{i, k} \cdot a_{k, j}$

Neúplný LU rozklad bude vypadat stejně, ale s tím, že přepisujeme jen některé prvky. Základní varianta je ILU(0), kde přepisujeme jen ty prvky, které už jsou nenulové. Obecněji si můžeme předepsat množinu pozic $P$ , u kterých ignorujeme zaplnění. Jelikož diagonální pozice jsou důležité, do $P$ je nikdy nebudeme zahrnovat, tedy

P \subset {(i, j) \in \hat{n} \times \hat{n} | i \neq j} .

A

P

Chceme-li přesnější neúplný LU rozklad, můžeme připustit i nějaké větší zaplnění.

A_{i, j}

k

Metody pro řídké matice ⬩ 01MRMMI

Úvod