Pravděpodobnost a statistika

Přednášející: Tomáš Hobza

Zápočet: účast na cvičení (v úterý, 7 účastí), zápočtový test (součást zkoušky, polovina bodů) – stačí napsat jednou

Zkouška: ústní – definice, věty, důkazy, porozumění

Obsah

  1. Historický model pravděpodobnosti
  2. Pravděpodobnostní prostory
  3. Náhodné veličiny a distribuční funkce
  4. Diskrétní náhodné veličiny
  5. Diskrétní náhodné vektory
  6. Absolutně spojité náhodné veličiny
  7. Absolutně spojité náhodné vektory
  8. Funkce náhodných veličin
  9. Konkrétní absolutně spojitá rozdělení
    1. Rozdělení používaná v matematické statistice
  10. Charakteristiky náhodných veličin
  11. Limitní věty
  12. Matematická statistika
    1. Bodové odhady
      1. Metoda momentů
    2. Intervalové odhady
    3. Testování hypotéz
      1. Testy o parametrech normálního rozdělení
    4. Testy dobré shody
      1. Pearsonův χ2-test
      2. Pearsonův χ2-test pro složenou hypotézu
  13. Vzorová písemka

Historický model pravděpodobnosti

Definice (Laplace). Mějme náhodný pokus, který může vykázat n různých „stejně možných“ výsledků a jev A zahrnuje m z nich. Potom pravděpodobnost jevu A je P(A)mn
Cvičení. Z balíčku 32 karet náhodně vybereme 5. Určete pravděbodobnost, že mezi nimi budou právě dva králové.
Věta (základní kombinatorické vzorečky). Mějme n vzájemně rozlišitelných prvků. Potom
Cvičení. Určete pravděpodobnost, že při hodu dvěma kostkami bude součet (A) 9, (B) 10.
Cvičení. Spočtěte pravděpodobnost, že při šesti hodech kostkou (A) nepadne ani jedna šestka, (B) padne alespoň jedna šestka, (C) padne právě jedna šestka, (D) padne nejvýše jedna šestka.
Cvičení. 2n sportovních družstev bylo náhodně rozděleno do dvou stejně početných podskupin. Jaká je pravděpodobnost, že dvě nejsilnější družstva budou v (A) různých, (B) stejných podskupinách?
Definice (geometrická definice pravděpodobnosti). Je-li výsledek stejně možný v každém bodě geometrického objektu S, potom pravděpodobnost jevu A reprezentovaného podobjektem SA je P(A)μ(SA)μ(S)
Cvičení. Dva vlaky mají přijet k rampě na vykládku. Mohou přijet kdykoli během dne se stejnou pravděpodobností. Jaká je pravděpodobnost, že jeden bude muset čekat, když vykládka jednoho trvá dvě hodiny a druhého tři hodiny?
Cvičení (Bertrandův paradox). K dané kružnici náhodně zvolíme tětivu. Určete pravděpodobnost, že tětiva bude delší než strana vepsaného rovnostranného trojúhelníka.

Pravděpodobnostní prostory

Definice. Základní pravděpodobnostní prostor Ω je množina všech možných, navzájem se vylučujících výsledků (také jistý jev)
Definice. Elementární jev ωΩ je nejjednodušší možný výsledek.
Definice. Jev je množina elementárních jevů AΩ.
Definice. Jev A nastal, pokud nastal libovolný elementární jev ωA.
Definice. Komplementární (opačný) jev k jevu A je AΩA.
Definice. Sjednocení/průnik jevů je jejich sjednocení/průnik jakožto množin. Zkráceně značíme ABAB.
Definice. Jevy A,B jsou disjunktní, pokud AB=. V takovém případě značíme A+BAB.
Definice. Jev A implikuje (má za následek) jev B, pokud AB.
Definice. Nechť Ω je množina. 𝒜2Ω je σ-algebra, pokud Ω,𝒜 se poté nazývá pozorovací prostor.
Věta. Je-li 𝒜 σ-algebra nad Ω, potom 𝒜.
Věta. Je-li 𝒜 σ-algebra nad Ω a A1,,An𝒜, potom i=1nAi𝒜.
Věta. Je-li 𝒜 σ-algebra nad Ω a A1,A2,𝒜, potom i=1Ai𝒜.
Definice. Nechť Ω=. Minimální σ-algebru, která obsahuje všechny intervaly, nazveme systém borelovských množin ().
Definice. Nechť (Ω,𝒜) je pozorovací prostor. Funkce P:𝒜0+ je pravděpodobnostní míra, pokud (Ω,𝒜,P) se poté nazývá pravděpodobnostní prostor.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Potom P()=0.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A1,,An jsou disjunktní jevy. Potom P(k=1nAk)=k=1nP(Ak).
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A,B jsou jevy. Potom P(AB)=P(A)+P(B)P(AB).
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A,B jsou jevy. Potom ABP(A)P(B).
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A je jev. Potom P(A)=1P(A).
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A,B𝒜,P(B)>0. Potom podmíněná pravděpodobnost A za podmínky B je P(A|B)P(AB)P(B)
xkcd 795
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a B𝒜,P(B)>0. Potom funkce AP(A|B) je pravděpodobnostní míra.
Věta (součinové pravidlo). Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A0,,An𝒜,P(k=0n1Ak)>0. Potom P(k=0nAk)=k=0nP(Ak|j=0k1Aj)
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Jevy B1,,Bn𝒜 tvoří úplný soubor jevů, pokud
Věta (o úplné pravděpodobnosti). Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, {B1,,Bn} je úplný soubor jevů a A𝒜. Potom P(A)=i=1nP(A|Bi)P(Bi)
Věta (Bayesova). Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a {B1,,Bn} je úplný soubor jevů a A𝒜,P(A)>0. Potom pro každé in^ platí P(Bi|A)=P(A|Bi)P(Bi)k=1nP(A|Bk)P(Bk)
xkcd 1236
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Jevy A,B𝒜 jsou nezávislé, pokud P(AB)=P(A)P(B).
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. A,B𝒜,P(B)>0 jsou nezávislé právě tehdy, pokud P(A|B)=P(A).
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Jevy A1,,An jsou sdruženě nezávislé, pokud pro každá {i1,,ik}n^ platí P(j=1kAij)=j=1kP(Aij).
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Jevy A1,,An jsou párově nezávislé, pokud pro každá i,jn^,ij jsou Ai,Aj nezávislé.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Pokud jsou jevy A,B𝒜 nezávislé, potom A,B jsou také nezávislé.

Náhodné veličiny a distribuční funkce

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodná veličina je 𝒜-měřitelná funkce X:Ω. Pro daný výrok Q(X) značíme [Q(X)]{ωΩ|Q(X(ω))}.

Vlastnosti náhodných veličin jsou vlastnosti měřitelných funkcí, které již známe z ANA4, takže je tady nebudu vypisovat.

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a X je náhodná veličina. Distribuční funkce náhodné veličiny X je funkce FX(x)P[Xx].
Poznámka. Definujeme-li funkci μ:𝒫(),μ(A)P(X1(A)), potom zřejmě μ je Lebesgue-Stieltjesova pravděpodobnostní míra a FX je distribuční funkce této míry.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a X je náhodná veličina. Potom
  1. FX:(0,1)
  2. FX je neklesající
  3. limFX=0
  4. limFX=1
  5. FX je zprava spojitá
Zároveň pokud funkce F: splňuje tyto vlastnosti, potom je to distribuční funkce nějaké náhodné veličiny.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a X je náhodná veličina. Potom funkce FX má nanejvýš spočetně mnoho bodů nespojitosti.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a A,B𝒜. Je-li AB, potom P(BA)=P(B)P(A).
Definice. Náhodný vektor je měřitelná funkce Z:Ωn.
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a X,Y jsou náhodné veličiny. Potom jejich sdružená distribuční funkce je FX,Y(x,y)P[XxYy] a FX,FY jsou marginální distribuční funkce.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a X,Y jsou náhodné veličiny. Potom Analogicky pro vyšší dimenze.
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodné veličiny X,Y jsou nezávislé, pokud pro všechna a,b,c,d,ab,cd jsou jevy [a<Xb],[c<Yd] nezávislé.
Věta. Náhodné veličiny X,Y jsou nezávislé právě tehdy, pokud pro všechna x,y je FX,Y(x,y)=FX(x)FY(y).

Diskrétní náhodné veličiny

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodná veličina Xdiskrétní rozdělení, pokud existuje nejvýše spočetná množina H={x1,x2,} taková, že xjH:P[X=xj]>0 a jP[X=xj]=1.
Poznámka. Pro diskrétní náhodnou veličinu má distribuční funkce „schodovitý“ tvar: na intervalu xj,xj+1) je konstantní.
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a p[0,1]. Bernoulliovo (alternativní) rozdělení je diskrétní rozdělení, kde P[X=1]=p,P[X=0]=1p. Značíme XBe(p). (Intuitivně vyjadřuje pokus s jedním binárním výsledkem.)
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a p[0,1],n. Binomické rozdělení je diskrétní rozdělení, kde P[X=k]=(nk)pk(1p)nk. Značíme XBi(n,p). (Intuitivně vyjadřuje pokus s jedním binárním výsledkem, který provedeme n-krát a zaznamenáme počet úspěchů.)
Poznámka. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, p[0,1],n a X1,,Xn jsou nezávislé náhodné veličiny takové, že jn^:XjBe(p). Potom XjXjBi(n,p).
Věta. 165=90.
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a p[0,1]. Pascalovo (geometrické) rozdělení je diskrétní rozdělení, kde P[X=k]=p(1p)k. Značíme XGeom(p). (Intuitivně vyjadřuje pokus s jedním binárním výsledkem, který zkoušíme, dokud nevyjde, a zaznamenáme počet neúspěšných pokusů.)
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodná veličina X má Pascalovo rozdělení Geom(p). Potom FX(x)=[x0](1(1p)x+1).
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a λ+. Poissonovo rozdělení je diskrétní rozdělení, kde P[X=k]=[k0](exp(λ)λkk!). Značíme XPo(λ). (Intuitivně vyjadřuje počet událostí, které nastanou během časového intervalu, kde λ je průměrný počet událostí, nebo počet částic na ploše, kde λ je průměrný počet částic.)
Poznámka. Pro p<0.1 a n>30 lze aproximovat Bi(n,p)Po(np). To lze odůvodnit jako speciální případ následující věty.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a Xn,n jsou náhodné veličiny s rozdělením Bi(n,pn),pn0,npnλ+. Potom limn(nk)pnk(1pn)nk=exp(λ)λkk! tedy limnP[Xn=k]=P[X=k],XPo(λ).

Diskrétní náhodné vektory

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodný vektor X=(X1,,Xk)diskrétní rozdělení, pokud existuje spočetná množina vektorů taková, že může být jen z té množiny.
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, n a p1,,pk(0,1),jpj=1. Náhodný vektor X=(X1,,Xk)multinomické rozdělení, pokud P[jk^:Xj=xj]=n!jxj!jpjxj
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a (X,Y) je diskrétní náhodný vektor. Potom můžeme spočítat jeho marginální distribuční funkci pomocí sdružené distribuční funkce jako P[X=x]=yP[X=xY=y]
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Diskrétní náhodné veličiny X,Y jsou nezávislé právě tehdy, pokud x,y:P[X=xY=y]=P[X=x]P[Y=y]
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a (X,Y) je diskrétní náhodný vektor. Jestliže pro dané y je P[Y=y]>0, potom podmíněná pravděpodobnostní funkce náhodné veličiny X za podmínky Y=y je P[X=x|Y=y]P[X=xY=y]P[Y=y]=P[X=xY=y]sP[X=sY=y]

Absolutně spojité náhodné veličiny

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodná veličina Xabsolutně spojité rozdělení, pokud existuje funkce fX(x): taková, že FX(x)=xfX fX je poté pravděpodobnostní hustota náhodné veličiny X.
Poznámka. Vzhledem k definici je fX určena až na množinu nulové míry.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodná veličina X má absolutně spojité rozdělení. Potom pro skoro všechna x platí fX(x)=FX(x).
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodná veličina X má absolutně spojité rozdělení. Potom pro každou množinu A() platí P[XA]=AfX
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, náhodná veličina X má absolutně spojité rozdělení a a. Potom P[X=a]=0.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodná veličina X má absolutně spojité rozdělení. Potom a:fX(a)0fX=1.

Absolutně spojité náhodné vektory

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Náhodné veličiny X1,,Xn mají sdružené absolutně spojité rozdělení, pokud existuje funkce fX1,,Xn:n taková, že FX1,,Xn(x1,,xn)=x1xnfX1,,Xn Funkce fx1,,xn je pak jejich sdružená hustota pravděpodobnosti.
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodné veličiny X1,,Xn mají sdružené absolutně spojité rozdělení. Potom skoro všude platí fX1,,Xn=1nFX1,,Xn
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor. Mají-li náhodné veličiny X,Y,Z sdružené absolutně spojité rozdělení, potom také X,Z mají sdružené absolutně spojité rozdělení a platí fX,Z(x,z)=fX,Y,Z(x,y,z)dy
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodné veličiny X1,,Xn mají sdružené absolutně spojité rozdělení. Potom X1,,Xn jsou nezávislé, právě pokud skoro všude platí x1,,xn:fX1,,Xn(x1,,xn)=j=1nfXj(xj)
Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, X,Y jsou náhodné veličiny a y. Potom podmíněná distribuční funkce veličiny X za podmínky Y=y je FX|Y(x|y)limε0+P[Xx|yε<Yy+ε]
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a náhodné veličiny X,Y mají sdružené absolutně spojité rozdělení. Potom skoro všude platí fX|Y(x|y)=fX,Y(x,y)fY(y)

Funkce náhodných veličin

Máme pravděpodobnostní prostor, nějakou náhodnou veličinu X a odvozenou náhodnou veličinu Y=h(X). Zajímalo by nás, jak určit rozdělení Y na základě rozdělení X.

Je-li X diskrétně rozdělená s konečným počtem možností, můžeme to prostě ručně spočítat pro každou možnou hodnotu.

Pro absolutně spojitou náhodnou veličinu můžeme postupovat takto:

FY(y)=P[Yy]=P[h(X)y]=h1((,y)fX

Je-li h ostře rostoucí, můžeme použít jednodušší vztah

FY(y)=P[Yy]=P[h(X)y]=P[Xh1(y)]=FX(h1(y))

Analogicky pro ostře klesající h, má-li X absolutně spojité rozdělení:

FY(y)=P[Yy]=P[h(X)y]=P[Xh1(y)]=P[X>h1(y)]=1FX(h1(y))
Věta. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor, náhodná veličina X má absolutně spojité rozdělení, funkce h: je ryze monotónní a h1 je diferencovatelná. Potom fY(y)=fX(h1(y))|(h1)(y)|

Pro náhodný vektor X a funkci h:n, kde Yh(X):

FY(y)=P[h(X)y]=h1((,y)fX1,,Xn
Příklad. Nechť YX1+X2 a X1,X2 jsou nezávislé. Potom FY(y)=P[X1+X2y]=x1+x2yfX1(x1)fX2(x2)dx2dx1=yx1fX1(x1)fX2(x2)dx2dx1=fX1(x1)yx1fX2(x2)dx2dx1=fX1(x1)Fx2(yx1)dx1 fY(y)=ddyfx1(x1)Fx2(yx1)dx1=*fx1(x1)fx2(yx2)dx1=(fX1*fX2)(y)

Tedy za předpokladu, že můžeme zaměnit integrál a derivaci (což můžeme, pokud je hustota pravděpodobnosti omezená, což v praxi většinou je), hustota součtu nezávislých veličin se rovná konvoluci jejich hustot.

Věta. Nechť náhodný vektor X má sdružené absolutně spojité rozdělení a Y=h(X), kde h:nn je spojité bijektivní zobrazení na otevřené množiné G, jehož integrál přes celé G je 1, inverzní zobrazení h1 je spojité, diferencovatelné a Jh10 na h(G). Potom i náhodný vektor Y má sdružené absolutně spojité rozdělení a platí fY1,,Yn=(fX1,,Xnh1)|Jh1|

Konkrétní absolutně spojitá rozdělení

Definice. Rovnoměrné rozdělení s parametry a,b,a<b, značeno XU(a,b), je fX(x)[x(a,b)]ba
Definice. Gamma rozdělení s parametry α,β, značeno XGamma(α,β), je fX(x)[x>0]xα1exp(xβ)Γ(α)βα
Definice. Normální (Gaussovo) rozdělení s parametry μ,σ2+, značeno XN(μ,σ2), je fX(x)=exp((xμ)22σ2)2πσ2
Definice. Standardní normální rozdělení je normální rozdělení s μ0,σ21. Definujeme φ(x)exp(x22)2π Φ(x)φ(x)dx=12πxexp(t22)dt
Věta. Φ(x)=1Φ(x)
Věta. Jestliže XN(μ,σ2), potom FX(x)=Φ(xμσ).
Poznámka. Integrál φ nejde spočítat analyticky, ale numericky se snadno počítá tím, že φ roztaylorujeme a zintegrujeme po členech.
Věta. Nechť XN(μ,σ2) a a,b,a0. Potom aX+bN(aμ+b,a2σ2).
Důsledek. XμσN(0,1).
Definice. Exponenciální rozdělení s parametry μ,θ, značeno XExp(μ,θ), je fX(x)[x>μ]exp(xμθ)θ
Věta. Pro exponenciální rozdělení platí P[X>a+x|X>a]=P[X>x]
Poznámka. Mějme veličinu XPo(λ). Nechť Xt značí počet jevů, které nastanou za čas t, tedy P[Xt=k]=exp(λt)(λt)kk!. Nechť T je doba do první události. Potom zjevně platí vztah P[T>t]=P[Xt=0]. Z toho snadno odvodíme, že TExp(1λ).

Rozdělení používaná v matematické statistice

xkcd 1347

Charakteristiky náhodných veličin

Definice. Nechť náhodná veličina X má diskrétní rozdělení. Potom její střední hodnota je EXixipi pokud řada absolutně konverguje.
Definice. Nechť náhodná veličina X má absolutně spojité rozdělení. Potom její střední hodnota je EXxfX(x)dx pokud integrál absolutně konverguje.
Věta. Nechť X a Yh(X),h: jsou náhodné veličiny. Potom pro diskrétní rozdělení EY=ih(xi)pi a pro absolutně spojité EY=h(x)fX(x)dx
Věta. Eh(X,Y)=i,jh(xi,yi)pi,j Eh(X,Y)=h(x,y)fX,y(x,y)dxdy
Definice. Je-li X náhodný vektor, potom definujeme EX(EX1,,EXn).
Věta. Nechť náhodné veličiny X,Y mají diskrétní nebo absolutně spojité rozdělení a existují EX,EY. Potom existuje i E(X+Y) a platí E(X+Y)=EX+EY.
Věta. Nechť c, náhodná veličina X má diskrétní nebo absolutně spojité rozdělení a existuje EX. Potom existuje i E(cX) a platí E(cX)=cEX.
Důsledek. Střední hodnota je lineární funkcionál na náhodných veličinách.
Věta. Pro a je Ea=a.
Věta. Nechť nezávislé náhodné veličiny X,Y mají diskrétní nebo absolutně spojité rozdělení a existují EX,EY,E(XY). Potom E(XY)=EXEY.
Definice. Nechť X je náhodná veličina a k0. Potom k-tý obecný moment X je μk(X)EXk a k-tý centrální moment X je μk(X)E(XEX)k
Poznámka. μ0(X)=μ0(X)=1,μ1(X)=0.
Definice. Druhý centrální moment se nazývá rozptyl: VarXμ2(X)=E(XEX)2. Jeho odmocnina je směrodatná odchylka: s.d.XVarX.
Věta. Nechť X je náhodná veličina. Potom VarX=EX2(EX)2.
Věta. Nechť X je náhodná veličina a a,b. Potom Var(ax+b)=a2VarX.
Věta. Nechť X,Y jsou nezávislé náhodné veličiny. Potom Var(X+Y)=VarX+VarY.
Definice. Nechť X je náhodná veličiny. Potom koeficient šikmosti je α3(X)μ3(X)(VarX)32 a koeficient špičatosti je α4(X)μ4(X)(VarX)23
Věta. Nechť XBi(n,p). Potom EX=np a VarX=np(1p).
Věta. Nechť XN(μ,σ2). Potom EX=μ a VarX=σ2.
Věta. Nechť XExp(μ,θ). Potom EX=μ+θ a VarX=θ2.
Definice. Kovariance náhodných veličin X,Y je Cov(X,Y)E((XEX)(YEY)).
Věta. Nechť X,Y jsou náhodné veličiny. Potom Cov(X,Y)=E(XY)(EX)(EY)
Definice. Koeficient korelace náhodných veličin X,Y je ρ(X,Y)Cov(X,Y)s.d.Xs.d.Y.
Lemma (Schwarzova nerovnost). Nechť X,Y jsou náhodné veličiny. Potom (E(XY))2EX2EY2.
Věta. Nechť X,Y jsou náhodné veličiny. Potom 1ρ(X,Y)1, přičemž rovnost ρ(X,Y)=±1 platí, právě pokud (β±)(YEY=β(XEX)).

Koeficient korelace vyjadřuje míru lineární závislosti mezi veličinami. Pokud je nízký, veličiny přesto mohou být korelované, akorát ne lineárně! A to, že veličiny jsou korelované, nemusí znamenat příčinný vztah mezi nimi.

xkcd 552
Definice. Náhodné veličiny X,Y jsou nekorelované, pokud ρ(X,Y)=0.
Věta. Jsou-li náhodné veličiny X,Y nezávislé, potom jsou nekorelované.
Definice. Kovarianční matice náhodného vektoru X je dána jako Σi,jCov(Xi,Xj).
Poznámka. Matice Σ je symetrická, na diagonále má variace a pokud jsou veličiny nezávislé, potom je diagonální.
Definice. Nechť X je náhodná veličina a α(0,1). α-kvantil veličiny X je bod xαinf{x|FX(x)α}.
xkcd 2118
Poznámka. Některé kvantily mají speciální názvy: x0.5 = medián, x0.25 = dolní kvartil, x0.75 = horní kvartil, x0.1 = dolní decil, x0.9 = horní decil, x0.75x0.25 = mezikvartilové rozpětí.
Definice. Charakteristická funkce náhodné veličiny X je φX: definovaná jako φX(t)Eexp(itX).
Poznámka. φX(t) vždy existuje, platí |φX(t)|1 a je-li X absolutně spojitě rozdělená, potom jde o její Fourierovu transformaci: φX(t)=f(x)exp(itx)dx
Definice. Momentová vytvářející funkce náhodné veličiny X je Mx: definovaná jako MX(t)Eexp(tX).
Poznámka. Momentová vytvářející funkce na rozdíl od charakteristické funkce nemusí existovat.
Příklad. Je-li XPo(λ), potom MX(t)=exp(λ(expt1)).
Příklad. Je-li XGamma(α,β), potom MX(t)=(1βt)α.
Věta. Nechť náhodná veličina X má momentovou vytvářecí funkci na intervalu (s,s). Potom pro každé k platí Mx(k)(0)=μk(X)=EXk.
Poznámka. Pokud má náhodná veličina X všechny momenty a momentovou vytvářející funkci, potom MX jednoznačně definuje FX (a navopák).
Věta. Nechť náhodná veličina X má momentovou vytvářející funkci. Potom pro náhodnou veličinu YaX+b platí MY(t)=exp(bt)MX(at).
Věta. Nechť náhodné veličiny X1,,Xn mají na intervalu (s,s) momentové vytvářéjící funkce. Potom pro náhodnou veličinu Yj=1nXj platí MY(t)=j=1nMXj(t).

Limitní věty

Motivace: Chceme odhadnout pravděpodobnost nějakého jevu nebo střední hodnotu nějaké náhodné veličiny tím, že provedeme spoustu nezávislých pokusů.

Definice. Nechť (Xn) je posloupnost náhodných veličin a c. Řekneme, že (Xn) konverguje k c podle pravděpodobnosti P, pokud pro každé ε+ je limnP[|Xnc|ε]=0. Značíme XnPμ.
Věta (Čebyševova nerovnost). Nechť X je náhodná veličina se střední hodnotou a konečným rozptylem. Potom pro každé ε+ platí P[|XEX|ε]VarXε2
Věta (zákon velkých čísel). Nechť (Xn) je posloupnost nezávislých, (stejně rozdělených) náhodných veličin, přičemž pro každé i existují stejná μEXi a σ2E(Xiμ)2. Potom Xni=1nXinPμ.
Důsledek (metoda Monte Carlo). Nechť U1,,UnU(a,b) a f:. Potom i=1nf(Ui)nPEf(U1)=abfba To se dá využít k numerické aproximaci integrálu.
Definice. Posloupnost náhodných veličin (Xn) konverguje k náhodné veličině X v distribuci, pokud pro všechna x, kde je FX spojitá, platí limnFXn(x)=FX(x). Značíme XnLX.
Věta (střední limitní). Nechť (Xn) je posloupnost nezávislých, stejně rozdělených náhodných veličin se stejnou střední hodnotou μ a konečným rozptylem σ2. Potom i=1nXinμnσLN(0,1)
Důsledek (Moivre-Laplace). Nechť (Xn) je posloupnost nezávislých veličin a XiBe(p). Potom i=1nXinpnp(1p)LN(0,1) Označíme-li Yni=1nXi, potom YnBi(n,p) a platí limnP[Ynnpnp(1p)x]=Φ(x) tedy binomické rozdělení lze aproximovat jako normální pro dostatečně velké np(1p) (používá se 9).

Matematická statistika

Vytvoříme model, na základě experimentu odhadneme hodnoty volných parametrů, testujeme o nich hypotézy a ověřujeme shodu modelu se skutečností.

Nejprve musíme odhadnout rozdělení, většinou podle intuitivní představy.

Bodový odhad = předpokládáme, že XFX(x,θ), a snažíme se odhadnout θ(X) podle vektoru pozorování X.

Intervalový odhad = hledáme interval, ve kterém se parametr θ nachází s danou pravděpodobností.

Parametrické testy = odhadneme něco o parametru θ a snažíme se ověřit, jestli to platí.

Testy dobré shody = ověřujeme, jestli se data skutečně řídí odhadnutým rozdělením.

Pořád máme prostor (Ω,𝒜,P), ale tentokrát Ω představuje populaci, ωΩ představují individua a náhodná veličina X:Ω představuje jejich vlastnost. Aby to sedělo s větami, které jsme si předtím odvodili, uděláme takový podvod a zavedeme si náhodné veličiny XiX(ωi).

Definice. Nechť (Ω,𝒜,P) je pravděpodobnostní prostor a n. n-tici nezávislých náhodných veličin X1,,Xn se stejným rozdělením F nazýváme náhodný výběr z rozdělení F.

Potom, co něco naměříme, už nemáme náhodné veličiny, ale nějaká konkrétní čísla, která označíme x1,,xn a nazveme realizace náhodného výběru.

Definice. Nechť X1,,Xn je náhodný výběr z rozdělení F. Statistika je funkce náhodného výběru X1,,Xn, která nezávisí na rozdělení F.

Bodové odhady

Uvažujme náhodný výběr X1,,Xn z rozdělení F{FX(x,θ)|θΘ}, kde Θd.

Často existuje víc různých nestranných odhadů, potom si chceme vybrat ten, který má nejmenší rozptyl.

Metoda momentů

Je výpočetně jednoduchá, ale odhady někdy nemívají dobré vlastnosti.

Uděláme tolik rovnic, kolik chceme odhadnout parametrů, přičemž porovnáváme momenty a výběrové momenty:

EXk=mki=1nXikn

Pro získání odhadu se snažíme věrohodnostní funkci maximalizovat. Protože je to součin, většinou je jednodušší maximalizovat její logaritmus. Budeme tedy řešit věrohodnostní rovnice:

θjlnL(θ1,,θn)=0

Pokud jsou splněny podmínky regularity a rovnice mají jednoznačný kořen θ^n, potom je to konzistentní odhad parametru θ a s pravděpodobností 1 je to maximální věrohodný odhad.

Tyto odhady jsou často výpočetně náročné a musí se řešit numericky.

Intervalové odhady

Místo odhadu parametru θ nás zajímá interval, v němž leží s nějakou velkou pravděpodobností.

U binomického rozdělení můžeme díky centrální limitní větě přibližně použít odhad pro normální rozdělení.

Testování hypotéz

Varování: následující definice není v prezentaci napsaná jako definice, takže studenti často neví, že ji mají umět!

Testy o parametrech normálního rozdělení

Mějme náhodný výběr z rozdělení N(μ,σ2). Úkolem je otestovat hypotézu H0:μ=μ0 proti hypotéze H1:μμ0 nebo H1:μ>μ0 nebo H1:μ<μ0.

Podívejme se na H1:μ>μ0. Tak nějak intuitivně odhadneme, že W bude mít tvar Xnμ0>K pro nějaké K. Znormováním dostáváme P[(X1,,Xn)W]=P[σnXnμ0σ>K1]=za prˇedpokladu μ=μ0P[σnXnμσ>K1]P[Zn>K1]chcemeα,ZnN(0,1) Volíme tedy K1u1α.

Test poměrem věrohodností: Mějme náhodný výběr (X1,,Xn) z rozdělení FX(θ),θΘ. Testujeme hypotézu H0:θΘ0 proti H1:θΘΘ0. Nechť L(θ) je věrohodnostní funkce. Definujeme statistiku

Λ(x1,,xn)supθΘ0L(θ)supθΘL(θ)

Myšlenka je taková, že pokud platí H0, potom Λ(X1,,Xn)1, jinak Λ(X1,,Xn)1.

Test bude vypadat tak, že W zvolíme tak, aby pro nějaké K0,1 platilo

(xW:Λ(x)K)(xW:Λ(x)K)

Odvození pro normální rozdělení je na fotce tabule.

Pokud u něčeho měříme hodnoty dvou různých znaků, například změnu tlaku před a po podání léku, máme výběr dvojic (X1,Y1),,(Xn,Yn), ovšem Xi,Yi jsou na sobě závislé. To snadno vyřešíme tím, že definujeme ZiXiYi a použijeme normální jednovýběrový test u nich. To je takzvaný párový test. Rozdíl dvou závislých normálních rozdělení ovšem nemusí být normální rozdělení, takže to musíme separátně ověřit!

Testy dobré shody

Pearsonův χ2-test

Máme náhodný výběr z neznámého rozdělení F. Chceme otestovat hypotézu, že jde o konkrétní rozdělení F0, tedy H0:F=F0,H1:FF0.

Člen (njnpj0) tedy vyjadřuje rozdíl mezi tím, kolik veličin skutečně nabylo nějakou hodnotu, a tím, kolik jich ji v průměru mělo nabýt.

Test probíhá tak, že spočteme sumu a zamítneme hypotézu, pokud >χ1α2(r1).

U spojitého rozdělení je potřeba provést kvantizaci, tedy vyrobit z ní diskrétní. Mějme náhodné veličiny X1,,Xn s distribuční funkcí F a chceme otestovat hypotézu H0:F=F0. Pozorovací prostor si rozdělíme na nějakých r intervalů Ij a spočteme: nj počet pozorování v intervalu Ij, pj0P0(XIj) naše hypotéza o tom, s jakou pravděpodobností bychom jednotlivé intervaly měli dostávat. Tím vytvoříme „diskrétní“ hypotézu H0, která je slabší než H0, tedy platí implikace H0H0, ale ne vopáčně!

Je důležité správně zvolit počet intervalů. Čím víc, tím líp aproximujeme spojité rozdělení, ale zároveň si tím zhoršíme asymptotickou aproximaci. V praxi se používá pravidlo jr^:npj05, tedy chceme mít v každém intervalu alespoň pět pozorování. Buňky, které mají méně, se pokusíme sloučit se sousedy. Jedna možnost, jak najít intervaly, je zvolit si r tak, aby nr5, a dát dělicí body za každou pětici (nebo víc).

Pearsonův χ2-test pro složenou hypotézu

Chceme zjistit, jestli rozdělení nějakého výběru pochází z nějaké rodiny rozdělení (například jestli je normální).

Pro diskrétní rozdělení opět mějme konečně mnoho možných hodnot B1,,Br s pravděpodobnostmi p1,,pr. Hypotéza je, že XiPθ,θΘ. Budeme postupovat tak, že odhadneme konkrétní hodnotu θ=θ* a poté již můžeme použít normální Pearsonův test. Dá se dokázat, že pokud θ* je maximální věrohodný odhad, potom Tn(θ*)Lχ2(rs1), kde s je počet parametrů, které odhadujeme.

A co když máme spojité rozdělení? Potom opět rozdělíme data do kyblíčků a odvodíme si slabší hypotézu. Problém může být akorát v tom, že vhodné rozkyblíčkování vlastně závisí na θ, které neznáme. Tudíž parametr θ musíme odhadnout přímo z původních dat (například pokud zjišťujeme, jestli data mají normální rozdělení, spočteme si průměr a výběrový rozptyl).

Vzorová písemka

Cvičení. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel, z nichž žádné není větší než jedna, bude nejvýše roven jedné a jejich součin nebude větší než 29?
Cvičení. Mezi šesti puškami jsou dvě zastřílené. Pravděpodobnost zásahu ze zastřílené pušky je 0.9 a z nezastřílené 0.2. Výstřelem z jedné vybrané pušky byl cíl zasažen. Určete pravděpodobnost, že byla vybrána zastřílená, resp. nezastřílená puška.
Cvičení. Určete hustotu pravděpodobnosti, střední hodnoty a kovarianci náhodných veličin X,Y definovaných v oblasti [0,π2]2, jestliže jejich sdružená distribuční funkce je FX,Y(x,y)=sinxsiny
Cvičení. Nechť X1,,Xn je náhodný výběr z rozdělení s hustotou pravděpodobnosti fXi(xi)={exp(xi3θ)θ,xi>30,xi3 Najděte maximálně věrohodný odhad parametru θ. Je tento odhad nestranný?
Cvičení. Něco s laboranty a dusíkem