Komprimované snímání

Stránka předmětu.

Místo zkoušky je možnost něco naprogramovat.

Definice Nosič vektoru xN je suppx{jN^|xj0}. Jeho řídkost je x0#suppx. Pozor, to není norma!
Definice Pro p(0,) definujeme
xpj=1N|xj|pp,
a také
xmaxjN^|xj|.
Poznámka Toto značení dává smysl, protože
limp0xp=x,
limp0xpp=x0.
Poznámka Pro p(1,) je p norma, tedy speciálně platí trojúhelníková nerovnost
x+ypxp+yp.
Pro p(0,1) je p kvazinorma, tedy pro nějaké C+ platí
x+ypC(xp+yp),
a také p-norma, tedy platí
x+yppxpp+ypp.
Definice Pro SN^ definujme
SN{xN|suppxS}.
Pro sN^ definujme množinu s-řídkých vektorů
sN{xN|x0s}={SN|SN^,#S=s}.
Příklad {1}2 je osa x, {2}2 je osa y a 12 je jejich sjednocení.
Poznámka Je-li x,ysN, potom x+y2sN, ale nemusí být x+ysN.
Definice Pro vektor xn vezměme permutaci π:N^N^ takovou, že
|xπ(1)||xπ(2)||xπ(N)|.
Nerostoucí přerovnání je vektor xj*|xπ(j)|.
Poznámka Permutace nemusí být určena jednoznačně, ale x* je jednoznačné.
Příklad Nerostoucí přerovnání vektoru x=(1,3,2,4,1,4) je x*=(4,4,3,2,1,1).
Definice Pro vektor xN a SN^ definujme (xS)j[jS]xj. Pokud S sestává z indexů s absolutně nejvyšších složek vektoru, jde o s-term aproximaci.
Příklad Pro x=(1,3,2,4,1,4) je x{1,3,5}=(1,0,2,0,1,0).
Definice Pro p[0,] definujme jednotkovou kouli:
BpN{xN|xp1}.
Poznámka Pro p1 je BpN konvexní, pro p<1 není.
Definice Pro xN,sN^,p(0,] definujme
σs(x)pinf{xyp|ysN}.
Poznámka Zřejmě σs(x)p=xxsp, kde xs je s-term aproximace.
Věta Nechť sN^, 0<p<q a xN. Potom
σs(x)qxps1p1q.
Důkaz Všimněme si, že σs(x)q a xp jsou invariantní vůči přerovnání a negaci složek, takže bez újmy na obecnosti můžeme předpokládat, že x1x2xN0. Máme
σs(x)q=j=s+1Nxjqq=j=s+1Nxjpxjqpqxsqpqj=s+1Nxjpqxsqpqxppq=xsp(1p1q)xppqxppq(1sj=1sxjp)1p1qxppq1s1p1qxpp(1p1q)=xps1p1q.
Poznámka Byl dokázán i vylepšený odhad
σs(x)qCp,qxps1p1q,
kde
Cp,q=(pq)pq(1pq)1pqp.
Nevíc toto je nejmenší multiplikativní konstanta, pro kterou odhad platí.
Poznámka Pro každé jN^ platí
j(xj*)pk=1j(xk*)pxpp.
Z toho plyne
x*j1pxp.
Lemma Nechť x,yN,k,sN^,k>s. Potom
  1. x*y*xy,
  2. |σs(x)1σs(y)1||xy|1,
  3. (ks)xk*xy1+σs(y)1.
Důkaz
  1. Pro každé kN^ platí
    xk*=minTN^,#T<kmaxjN^T|xj|=minTN^,#T<kmaxjN^T|xjyj|+|yj|=xy+minTN^,#T<kmaxjN^T|yj|=xyyk*.
  2. Nechť z je s-term aproximace y. Máme
    σs(x)1=inf{xw1|wsN}xz1xy1+yz1=xy1+σs(y)1.
  3. TBD
Poznámka Máme-li součin Ax=b s maticí Am×N, můžeme ho interpretovat jako sérii m měření, kde každé nám vrátí skalární součin nějakého řádku A s vektorem x. Cílem je zjistit, kolik měření je nutné provést, abychom byli schopni rekonstruovat každé řídké x.
Věta Nechť xN,sx0,Am×N,y=Ax. Potom následující dvě tvrzení jsou ekvivalentní:
  1. x je jediné s-řídké řešení rovnice Ax=y.
  2. x má ze všech řešení rovnice Ax=y ostře nejmenší řídkost.
Důkaz Triviální; ukážeme si ho jen proto, abychom viděli, jak důkazy takovýchto tvrzení obecně vypadají.
(⇐)
Nechť Az=y pro nějaké zx. Podle předpokladu je z0>x0=s, takže zsN.
(⇒)
Nechť Az=y pro nějaké zx. Podle předpokladu je zsN, takže z0>s=x0.
Definice Nechť Am×N a SN^. Potom označme AS matici, kde z A vybereme sloupce odpovídající S.
Věta Nechť Am×N a sN^. Potom následující tvrzení jsou ekvivalentní:
  1. Každé xsN je jediné řešení rovnice Az=Ax,zsN. Jinými slovy, A jako zobrazení sNm je injektivní.
  2. kerA2sN={0}.
  3. Pro každé SN^,#S2s je matice AS jako zobrazení #Sm injektivní.
  4. Každých 2s sloupců A je lineárně nezávislých.
Důkaz
(3) ⇔ (4)
Známe z lineární algebry.
(1) ⇒ (2)
Nechť ukerA2sN. Jistě můžeme zapsat u=xz, kde x,zsN. Potom 0=Au=A(xz)=AxAzAx=Az, takže podle předpokladu u=0.
(2) ⇒ (1)
Nechť x,zsN,Ax=Az. Potom uxzkerA2sN, takže x=z.
(2) ⇔ (3)
Z lineární algebry víme, že AS je injektivní, právě když kerAS={0}. Takže stačí pro každé S vzít přirozenou bijekci mezi #S a SN.
Poznámka Špatná zpráva je, že všechny tyto podmínky jsou těžké na ověření.
Poznámka Ze čtvrté podmínky je vidět, že minimálně potřebujeme m2s. Zároveň intuitivně vidíme, že když si vezmeme matici 2s×N a naflákáme do ní úplně náhodná čísla, tak podmínku splníme s pravděpodobností 1. Ale můžeme si sestrojit i jednu konkrétní, viz následující věta.
Věta Nechť N2s=m. Potom existuje matice Am×N taková, že každých m sloupců je lineárně nezávislých, takže každé xsN lze jednoznačně rekonstruovat z Ax=y.
Důkaz Stačí vzít Vandermondovu matici s libovolnými čísly 0<t1<<tN:
A(t10tN0t1m1tNm1).
To, že libovolná podmatice m×m je regulární, už jsme si dokazovali asi milionkrát na jiných předmětech.
Poznámka Determinant této matice je sice nenulový, ale může být blízký nule, takže při numerických výpočtech máme smůlu. A pokud naopak ti zvolíme tak, aby byla daleko od sebe, dostaneme v matici obrovská čísla, což taky způsobí numerickou nestabilitu.
Poznámka Už víme, že pokud si vhodně zvolíme A, tak Ax=y bude vždy mít jednoznačné řešení xsN. Ale jak ho najít? Omezíme se jen na taková y, pro které řešení exisuje. Budeme postupně zkoušet, jestli existuje 0-řídké řešení, 1-řídké řešení, 2-řídké řešení, a tak dále. Kdybychom to dělali hrubou silou, máme v i-tém kroku (Ni) možností, což pro is může celkem být hodně. Zkusme to chytřeji. Máme tedy otázku: Existuje pro daná (s,m,N,A,y) s-řídké x takové, že Ax=y? Najít řešení může být těžké, ale ověřit, že to skutečně je řešení, je jednoduché. Dá se dokázat, že obecně je to NP-úplný problém.
Definice Označme si problémy:
(P1)
Najděte vektor zN splňující Az=y s minimálním z1.
(P1,ξ)
Najděte vektor zN splňující Azy2ξ s minimálním z1.
(P*)
Najděte vektor zN s minimálním λz1+Azy22.
(L)
Najděte vektor zN splňující z1τ s minimálním Azy22.
Věta Nechť Am×n,ym. Potom
  1. Pokud x# je řešení (P*) pro nějaké λ>0, potom je řešením (P1,ξ) pro nějaké ξ.
  2. Pokud x# je řešení (P1,ξ) pro nějaké ξ, potom je řešením (L) pro nějaké τ.
  3. Pokud x# je řešení L pro nějaké τ, potom je řešením (P*) pro nějaké λ.
Důkaz Ne.
Definice Matice Anull space property vzhledem k SN^ (NSPS), pokud pro všechny vkerA{0} je vS1<vN^S1.
Definice Matice Anull space property řádu sN^ (NSPs), pokud má NSPS pro všechny SN^,#Ss.
Poznámka Podmínku zjevně stačí ověřit pro S sestávající z indexů, kde má v nejvyšších s hodnot.
Poznámka vS1<vN^S12vS1<v1v1<2vN^S1.
Poznámka Sečtením ekvivalentních vyjádření v předchozí poznámce dostáváme, že podmínka NSPs je ekvivalentní s tím, že pro všechny vkerA{0} je v1<2σs(v)1.
Věta Nechť Am×N,SN^. Potom každý vektor xSN je jediné řešení (P1) s yAx, právě když ANSPS.
Důkaz
(⇒)
Nechť vkerA{0}. Podle předpokladu (kde volíme xvS) je
vS=arg minzn,Az=AvSz.
a toto minimum je ostré. Také máme A(vN^S)=A(vSv)=y. Z toho plyne vS1<vN^S1, což mělo být dokázáno.
(⇐)
Nechť xSN a zn,zx splňují Az=Ax. Označme vxzkerA{0}. Podle předpokladu je vS1<vN^S1. Potom
x1=xS1xSzS1+zS1=vS1+zS1<vN^S1+zS1=zN^S1+zS1=z1,
kde první nerovnost je trojúhelníková a druhá plyne z předpokladu. Jelikož z bylo voleno libovolně, dokázali jsme, že x1 je ostře minimální.
Věta Nechť Am×N,sN^. Potom každý vektor xsN je jediné řešení (P1) s yAx, právě když ANSPs.
Důkaz Analogický předchozí větě.
Poznámka Pokud Am×NNSPs a Gm×m je regulární, potom GANSPs. Ovšem je-li G špatně podmíněná, může tím vzniknout numerická nestabilita.
Definice Matice Am×Nstabilní null space property s konstantou ρ(0,1) vzhledem k SN^ (SNSPSρ), pokud pro všechny vkerA je vS1ρvN^S1.
Definice Matice Am×Nstabilní null space property s konstantou ρ(0,1) řádu sN^ (SNSPsρ), pokud má SNSPSρ pro všechny SN^,#Ss.
Věta Nechť Am×N,ρ(0,1),SN^. Potom ASNSPSρ, právě když pro všechny z,xn,Az=Ax platí
zx11+ρ1ρ(z1x1+2xN^S).
Důsledek Pokud ASNSPSρ a x# je řešením (P1) s yAx, potom
x#x121+ρ1ρσs(x)1.
Důkaz Ve větě zvolíme zx#.
Definice Matice Am×NRIP pro s s δ+, pokud xsN:(1δ)x22Ax22(1+δ)x22. δs je nejmenší takové δ.
Věta Nechť Am×N,sN2. Je-li δ2s<13, potom každé xsN lze zrekonstruovat z y=Ax pomocí l1-minima.
Důkaz Ukážeme, že ANSPs. Nechť vsN. Ukážeme, že
vs2<δ2s1δs1sv1.
TBD
Věta Nechť Am×N,s,δ2sδ*=0.49. Potom každé xsN lze rekonstruovat z A a ym s Axy2η pomocí (P1,η). Navíc označíme-li řešení X#, potom
xx#1Cσs(x)1+Dsη,
xx#2Csσs(x)1+Dη.
Důkaz Ne.

RIP pro náhodné matice

Lemma Nechť ω𝒩︀(0,1),λ(,12). Potom
𝐄(expλω2)=112λ.
Důkaz
𝐄(expλω2)=12πexpλt2exp(t22)dt=12πexp(λ12)t2dt=[s12λtds=12λdt]=12πexp(s22)12λds=112λ.
Lemma 2-stabilita normálního rozdělení Nechť m, w1,,wm𝒩︀(0,1) jsou nezávislé a λ1,,λm. Potom
i=1mλ1ωiλ2𝒩︀(0,1)=𝒩︀(0,λ22).
Důkaz Dokážeme pro m=2, poté už to indukcí bude plynout pro všechna m. Zkusme se pro dané t podívat, jaká je 𝐏(λ1ω1+λ2ω2t). Zajímá nás tedy, na jaké straně od přímky λ1x+λ2y=t je bod (ω1,ω2). Jelikož víme, že rozdělení dvou nezávislých gaussovských veličin je symetrické vůči rotaci kolem počátku, můžeme si tuto přímku orotovat, aby byla svislá. Potom už to půjde snadno.
Lemma Nechť ω1,,ωm jsou nezávislé s rozdělením 𝒩︀(0,1) a ε(0,1). Potom
𝐏(i=1mωi2(1+ε)m)exp(m2(ε22ε33)).
Důkaz Laplaceovou metodou Označme β1+ε a zvolme nějaké λ(0,12).
𝐏(i=1mωi2βm)=𝐏(i=1mωi2βm0)=𝐏(λi=1mωi2λβm0)=𝐏(exp(λi=1mωi2λβm)1)Markov𝐄exp(λi=1mωi2λβm)=exp(λβm)𝐄i=1mexp(λωi2)=nezávislostexp(λβm)(𝐄exp(λω12))m=exp(λβm)(12λ)m2
Pomocí derivace snadno zjistíme, že tento výraz nabývá maxima pro λ=ε2β. To je skutečně v intervalu (0,12), takže to můžeme dosadit a dostaneme
𝐏(i=1mωi2βm)=exp(mε2)(1+ε)m2=exp(m2(εln(1+ε))).
Použitím odhadu ln(1+ε)εε22+ε33 dostaneme kýženou rovnost.
Poznámka Toto lemma se občas označuje jako „neasymptotické“, protože nás nezajímá, co se děje, když m.
Poznámka Analogicky se dá dokázat
𝐏(i=1mωi2(1ε)m)exp(m2(ε22ε33)).
Lemma můžeme přeformulovat jako
𝐏(|i=1mωi2m|εm)2exp(m2(ε22ε33))
nebo
𝐏(|1mi=1mωi21|ε)2exp(m2(ε22ε33)).
Věta RIP pro jeden bod Nechť ω je náhodná matice řádu m×N s nezávislými prvky s rozdělením 𝒩︀(0,1), Aωm a xN,x2=1. Potom
𝐏(|Ax221|t)2exp(m2(t22t33)).
Důkaz Máme
Ax22=1mi=1mj=1N(ωi,jxj)21mi=1m(x2ωi,1)2.
Nyní stačí použít lemma.
Poznámka Snadno odhadneme
2exp(m2(t22t33))2exp(mt224).
Definice Jednotková sféra dimenze d1 je 𝕊d1{xd|x2=1}.
Definice Nechť t>0. Množina 𝒩︁M je t-síť množiny M, pokud zM,x𝒩︁:zx2t.
Lemma Nechť t>0. Potom existuje t-síť 𝒩︁𝕊d1 s #𝒩︁(1+2t)d.
Důkaz Síť budeme konstruovat hladovým algoritmem – postupně přidáváme body x1,x2, tak, že bod xi není pokrytý body x1,,xi1. Jelikož 𝕊d1 je kompaktní, jistě někdy skončíme. Nechť N je počet bodů sítě. Koule B(xi,t2), jsou zjevně disjunktní podmnožiny B(0,1+t2). Jelikož objem d-rozměrného tělesa je úměrná d-té mocnině jeho velikosti, máme
NV(B(0,t2))=i=1NV(B(xi,t2))V(B(0,1+t2))=(1+t2t2)dV(B(0,t2))=(1+2t)dV(B(0,t2)).
Podělením dostaneme kýženou nerovnost.
TBD: doplnit zápisky

Optimalita

Je zřejmé, že k rekonstrukci vektorů z sN potřebujeme minimálně ms. Zároveň jsme si již dokázali, že stačí mCslnN. Ale nemohlo by to jít i lépe?
Lemma Nechť sN. Potom existují množiny T1,,TMN^ takové, že
Důkaz Použijeme hladový algoritmus. Budeme postupně volit libovolné množiny tak, aby poslední dvě vlastnosti zůstaly zachované. Skončíme, až nebude existovat další množina, kterou bychom mohli použít. Stačí dokázat, že jsme jich vybrali aspoň (N4s)s2. Počet množin, které se zablokují po vybrání každé nové množiny, je nanejvýš
j=s2s(sj)(Nssj)(j=s2s(sj))maxs2js(Nssj)2s(Nss2).
Tedy po vybrání m množin jich stále zbývá alespoň
(Ns)m2s(Nss2).
Z toho plyne
M(Ns)2s(Nss2)2s(Ns)(Ns2s2)=2sn!s!s2!(Ns2)!=2sN(N1)(Ns2+1)s(s1)(ss2+1)2s(Ns)s2(N4s)s2.
Věta Nechť smN,Am×N a zobrazení Δ:mN splňuje
xN:xΔ(Ax)2Cσs(x)1s.
Potom mCslneNs.
Důkaz Předpokládejme, že C1,sN8. Najdeme množiny T1,,TM podle předchozího lemmatu. Definujeme body
x1,,xMsN,xiχTi1s.
Z konstrukce plyne xi2=1, xi1=s a xixj2>1. Definujme
{zN|z1s4Cz214}.
Máme xi4C. Dokážeme, že množiny A(xi+) jsou po dvou disjunktní. Nechť pro spor existují ij a zi,zj taková, že A(xi+zi)=A(xj+zj). Potom
1<xixj2=((xi+zi)Δ(A(xi+zi)))((xj+zj)Δ(A(xj+zj)))zi+zj2(xi+zi)Δ(A(xi+zi))2+(xj+zj)Δ(A(xj+zj))2+zi2+zj214+14+14+14=1.
Dále A(xi+)A((4C+1)). Nechť bez újmy na obecnosti je h(A)=m. Použijeme objemový argument:
i=1MVm(A(xi+))Vm(A((4C+1)))
neboli
MVm(A())Vm((4C+1)A())(4C+1)mVm(A()).
Podělením a drobnými úpravami dostaneme kýženou nerovnost.

Kashinův rozklad

Věta Existují konstanty α,β>0 takové, že pro každé m1 lze v 2m najít E,E2m,dimE=m takové, že pro všechna xEE je
αmx2x1βmx2.