Definice (Laplace). Mějme náhodný pokus, který může vykázat různých „stejně možných“ výsledků a jev zahrnuje z nich. Potom pravděpodobnost jevu je
Poznámka. Tato definice z dnešního pohledu není matematicky korektní, ale pro základní příklady stačí.
Cvičení. Z balíčku karet náhodně vybereme . Určete pravděbodobnost, že mezi nimi budou právě dva králové.
Řešení.
Věta (základní kombinatorické vzorečky). Mějme vzájemně rozlišitelných prvků. Potom
počet variací s opakováním velikosti (uspořádaných -tic prvků) je ,
počet variací bez opakování velikosti (uspořádaných -tic různých prvků) je ,
počet permutací je ,
počet kombinací bez opakování velikosti (neuspořádaných -tic různých prvků) je ,
počet kombinací s opakováním velikosti (neuspořádaných -tic prvků) je .
Cvičení. Určete pravděpodobnost, že při hodu dvěma kostkami bude součet () 9, () 10.
Řešení. Pro 9 jsou čtyři možné součty z celkem 36, tedy . Pro 10 jsou tři možné součty, tedy . To ale uvažujeme, že kostky jsou rozlišitelné. Pokud bychom ale uvažovali, že jsou nerozlišitelné, už nemůžeme použít klasickou definici pravděpodobnosti, protože výsledky nebudou „stejně možné“.
Cvičení. Spočtěte pravděpodobnost, že při šesti hodech kostkou () nepadne ani jedna šestka, () padne alespoň jedna šestka, () padne právě jedna šestka, () padne nejvýše jedna šestka.
Řešení.
Cvičení. sportovních družstev bylo náhodně rozděleno do dvou stejně početných podskupin. Jaká je pravděpodobnost, že dvě nejsilnější družstva budou v () různých, () stejných podskupinách?
Řešení.
Definice (geometrická definice pravděpodobnosti). Je-li výsledek stejně možný v každém bodě geometrického objektu , potom pravděpodobnost jevu reprezentovaného podobjektem je
Poznámka. Tato definice zobecňuje klasickou definici na jevy s nekonečnou množinou výsledků.
Cvičení. Dva vlaky mají přijet k rampě na vykládku. Mohou přijet kdykoli během dne se stejnou pravděpodobností. Jaká je pravděpodobnost, že jeden bude muset čekat, když vykládka jednoho trvá dvě hodiny a druhého tři hodiny?
Řešení.
Cvičení (Bertrandův paradox). K dané kružnici náhodně zvolíme tětivu. Určete pravděpodobnost, že tětiva bude delší než strana vepsaného rovnostranného trojúhelníka.
Řešení.
Náhodně zvolíme dva body na kružnici. Pokud z prvního uděláme trojúhelník, potřebujeme, aby druhý bod byl na oblouku odpovídajícím protilehlé straně trojúhelníka. Tedy .
Náhodně zvolíme bod a přímku jím procházející, z níž vykousneme tětivu. Potom také .
Náhodně zvolíme poloměr kružnice, na něm bod a vyrobíme v tomto bodě tětivu kolmou na poloměr. Potom chceme, aby bod byl uvnitř trojúhelníka. Tedy .
Náhodně zvolíme bod na kružnici a zvolíme tětivu, která ho má jako střed. Potom chceme, aby bod byl uvnitř kruhu vepsaného do trojúhelníka. Tedy .
„Paradox“ je v tom, že pravděpodobnost závisí na tom, jakým způsobem „náhodně“ zvolíme tětivu.
Definice. Nechť je pravděpodobnostní prostor. Náhodná veličina je -měřitelná funkce . Pro daný výrok značíme .
Vlastnosti náhodných veličin jsou vlastnosti měřitelných funkcí, které již známe z ANA4, takže je tady nebudu vypisovat.
Definice. Nechť je pravděpodobnostní prostor a je náhodná veličina. Distribuční funkce náhodné veličiny je funkce .
Poznámka. Definujeme-li funkci , potom zřejmě je Lebesgue-Stieltjesova pravděpodobnostní míra a je distribuční funkce této míry.
Věta. Nechť je pravděpodobnostní prostor a je náhodná veličina. Potom
je neklesající
je zprava spojitá
Zároveň pokud funkce splňuje tyto vlastnosti, potom je to distribuční funkce nějaké náhodné veličiny.
Důkaz. ANA4.
Věta. Nechť je pravděpodobnostní prostor a je náhodná veličina. Potom funkce má nanejvýš spočetně mnoho bodů nespojitosti.
Důkaz. ANA4?
Věta. Nechť je pravděpodobnostní prostor a . Je-li , potom .
Důkaz. To by zvládl i student APIN.
Definice. Náhodný vektor je měřitelná funkce .
Definice. Nechť je pravděpodobnostní prostor a jsou náhodné veličiny. Potom jejich sdružená distribuční funkce je a jsou marginální distribuční funkce.
Věta. Nechť je pravděpodobnostní prostor a jsou náhodné veličiny. Potom
pro všechna je neklesající
pro všechna je neklesající
pro všechna je
pro všechna je
pro všechna je
pro všechna je
Analogicky pro vyšší dimenze.
Důkaz. Zřejmé.
Definice. Nechť je pravděpodobnostní prostor. Náhodné veličiny jsou nezávislé, pokud pro všechna jsou jevy nezávislé.
Věta. Náhodné veličiny jsou nezávislé právě tehdy, pokud pro všechna je .
Důkaz.
Stačí zvolit .
Z principu inkluze a exkluze:
Diskrétní náhodné veličiny
Definice. Nechť je pravděpodobnostní prostor. Náhodná veličina má diskrétní rozdělení, pokud existuje nejvýše spočetná množina taková, že a .
Poznámka. Pro diskrétní náhodnou veličinu má distribuční funkce „schodovitý“ tvar: na intervalu je konstantní.
Definice. Nechť je pravděpodobnostní prostor a . Bernoulliovo (alternativní) rozdělení je diskrétní rozdělení, kde . Značíme . (Intuitivně vyjadřuje pokus s jedním binárním výsledkem.)
Definice. Nechť je pravděpodobnostní prostor a . Binomické rozdělení je diskrétní rozdělení, kde . Značíme . (Intuitivně vyjadřuje pokus s jedním binárním výsledkem, který provedeme -krát a zaznamenáme počet úspěchů.)
Poznámka. Nechť je pravděpodobnostní prostor, a jsou nezávislé náhodné veličiny takové, že . Potom .
Věta..
Důkaz. Řekl to Hobza.
Definice. Nechť je pravděpodobnostní prostor a . Pascalovo (geometrické) rozdělení je diskrétní rozdělení, kde . Značíme . (Intuitivně vyjadřuje pokus s jedním binárním výsledkem, který zkoušíme, dokud nevyjde, a zaznamenáme počet neúspěšných pokusů.)
Věta. Nechť je pravděpodobnostní prostor a náhodná veličina má Pascalovo rozdělení . Potom .
Definice. Nechť je pravděpodobnostní prostor a . Poissonovo rozdělení je diskrétní rozdělení, kde . Značíme . (Intuitivně vyjadřuje počet událostí, které nastanou během časového intervalu, kde je průměrný počet událostí, nebo počet částic na ploše, kde je průměrný počet částic.)
Poznámka. Pro a lze aproximovat . To lze odůvodnit jako speciální případ následující věty.
Věta. Nechť je pravděpodobnostní prostor a jsou náhodné veličiny s rozdělením . Potom
tedy .
Důkaz. Podle předpokladu je . Můžeme tedy psát
Dále
Celkově
Diskrétní náhodné vektory
Definice. Nechť je pravděpodobnostní prostor. Náhodný vektor má diskrétní rozdělení, pokud existuje spočetná množina vektorů taková, že může být jen z té množiny.
Definice. Nechť je pravděpodobnostní prostor, a . Náhodný vektor má multinomické rozdělení, pokud
Poznámka. Binomické rozdělení je speciální případ multinomického s .
Věta. Nechť je pravděpodobnostní prostor a je diskrétní náhodný vektor. Potom můžeme spočítat jeho marginální distribuční funkci pomocí sdružené distribuční funkce jako
Důkaz.
Zároveň
Jelikož to platí pro každé , sumy se musí rovnat člen po členu.
Věta. Nechť je pravděpodobnostní prostor. Diskrétní náhodné veličiny jsou nezávislé právě tehdy, pokud
Důkaz. Rozepíšeme si to jako sumy a porovnáme člen po členu.
Definice. Nechť je pravděpodobnostní prostor a je diskrétní náhodný vektor. Jestliže pro dané je , potom podmíněná pravděpodobnostní funkce náhodné veličiny za podmínky je
Definice. Nechť je pravděpodobnostní prostor. Náhodná veličina má absolutně spojité rozdělení, pokud existuje funkce taková, že
je poté pravděpodobnostní hustota náhodné veličiny .
Poznámka. Vzhledem k definici je určena až na množinu nulové míry.
Věta. Nechť je pravděpodobnostní prostor a náhodná veličina má absolutně spojité rozdělení. Potom pro skoro všechna platí
.
Důkaz. Použijeme větu o derivaci integrálu, která ale platí jen pro kompaktní interval, takže si ho zkompaktníme.
Věta. Nechť je pravděpodobnostní prostor a náhodná veličina má absolutně spojité rozdělení. Potom pro každou množinu platí
Důkaz. Dokážeme jen pro interval , dál to plyne z vlastností Lebesgueova integrálu.
Věta. Nechť je pravděpodobnostní prostor, náhodná veličina má absolutně spojité rozdělení a . Potom .
Důkaz. Triviální.
Věta. Nechť je pravděpodobnostní prostor a náhodná veličina má absolutně spojité rozdělení. Potom .
Důkaz. Triviální.
Absolutně spojité náhodné vektory
Definice. Nechť je pravděpodobnostní prostor. Náhodné veličiny mají sdružené absolutně spojité rozdělení, pokud existuje funkce taková, že
Funkce je pak jejich sdružená hustota pravděpodobnosti.
Věta. Nechť je pravděpodobnostní prostor a náhodné veličiny mají sdružené absolutně spojité rozdělení. Potom skoro všude platí
Věta. Nechť je pravděpodobnostní prostor. Mají-li náhodné veličiny sdružené absolutně spojité rozdělení, potom také mají sdružené absolutně spojité rozdělení a platí
Důkaz. Pomocí Fubiniho věty:
Věta. Nechť je pravděpodobnostní prostor a náhodné veličiny mají sdružené absolutně spojité rozdělení. Potom jsou nezávislé, právě pokud skoro všude platí
Důkaz. Dokážeme pro , pro větší analogicky.
Nechť platí rovnost. Potom
Definice. Nechť je pravděpodobnostní prostor, jsou náhodné veličiny a . Potom podmíněná distribuční funkce veličiny za podmínky je
Poznámka. V definici musíme použít limitu, abychom se vyhnuli dělení nulou.
Věta. Nechť je pravděpodobnostní prostor a náhodné veličiny mají sdružené absolutně spojité rozdělení. Potom skoro všude platí
Máme pravděpodobnostní prostor, nějakou náhodnou veličinu a odvozenou náhodnou veličinu . Zajímalo by nás, jak určit rozdělení na základě rozdělení .
Je-li diskrétně rozdělená s konečným počtem možností, můžeme to prostě ručně spočítat pro každou možnou hodnotu.
Pro absolutně spojitou náhodnou veličinu můžeme postupovat takto:
Je-li ostře rostoucí, můžeme použít jednodušší vztah
Analogicky pro ostře klesající , má-li absolutně spojité rozdělení:
Věta. Nechť je pravděpodobnostní prostor, náhodná veličina má absolutně spojité rozdělení, funkce je ryze monotónní a je diferencovatelná. Potom
Důkaz. Zderivujeme vztahy pro odvozené nahoře.
Pro náhodný vektor a funkci , kde :
Příklad. Nechť a jsou nezávislé. Potom
Tedy za předpokladu, že můžeme zaměnit integrál a derivaci (což můžeme, pokud je hustota pravděpodobnosti omezená, což v praxi většinou je), hustota součtu nezávislých veličin se rovná konvoluci jejich hustot.
Věta. Nechť náhodný vektor má sdružené absolutně spojité rozdělení a , kde je spojité bijektivní zobrazení na otevřené množiné , jehož integrál přes celé je , inverzní zobrazení je spojité, diferencovatelné a na . Potom i náhodný vektor má sdružené absolutně spojité rozdělení a platí
Důkaz. Bez důkazu, protože by to chemici nepochopili.
Poznámka. Pokud nemá dost složek na to, aby matice byla čtvercová, můžeme si nějaké uměle přidat, třeba tím, že zkopírujeme jednu ze složek .
Konkrétní absolutně spojitá rozdělení
Definice. Rovnoměrné rozdělení s parametry , značeno , je
Definice. Gamma rozdělení s parametry , značeno , je
Poznámka. Prý si nemusíme přesně pamatovat ten vzoreček, důležité je umět ho použít.
Definice. Normální (Gaussovo) rozdělení s parametry , značeno , je
Důkaz (že to je rozdělení).
Poznámka. určuje střed zvonu, určuje, jak moc je rozplizlý.
Definice. Standardní normální rozdělení je normální rozdělení s . Definujeme
Věta.
Důkaz.
Věta. Jestliže , potom .
Důkaz. Plyne přímo z definic a věty o substituci.
Poznámka. Integrál nejde spočítat analyticky, ale numericky se snadno počítá tím, že roztaylorujeme a zintegrujeme po členech.
Věta. Nechť a . Potom .
Důkaz. Nechť . Potom .
Důsledek..
Definice. Exponenciální rozdělení s parametry , značeno , je
Poznámka.
Poznámka. Distribuční funkce je .
Věta. Pro exponenciální rozdělení platí
Důkaz.
Poznámka. Díky tomuto se nazývá „rozdělení bez paměti“. Pokud průměrná doba do nějaké události je dána tímto rozdělením, potom to, jak dlouho ještě budeme čekat, nezávisí na tom, jak dlouho jsme už čekali. Často se s ním modeluje životnost elektronických součástek nebo obsluha zákazníků.
Poznámka. Mějme veličinu . Nechť značí počet jevů, které nastanou za čas , tedy . Nechť je doba do první události. Potom zjevně platí vztah . Z toho snadno odvodíme, že .
Rozdělení používaná v matematické statistice
Definice. Pearsonovo rozdělení s stupni volnosti, značeno , je
(konkrétní vzoreček si nemusíme pamatovat)
Poznámka. Jsou-li nezávislé a , potom
Definice. Nechť jsou nezávislé veličiny s . Studentovo rozdělení s stupni volnosti má veličina
Značíme .
Definice. Nechť jsou nezávislé veličiny s . Fisherovo rozdělení s stupni volnosti má veličina
Značíme .
Definice. Nechť náhodná veličina má diskrétní rozdělení. Potom její střední hodnota je
pokud řada absolutně konverguje.
Definice. Nechť náhodná veličina má absolutně spojité rozdělení. Potom její střední hodnota je
pokud integrál absolutně konverguje.
Věta. Nechť a jsou náhodné veličiny. Potom pro diskrétní rozdělení
a pro absolutně spojité
Důkaz. Pro diskrétní rozdělení jednoduché, jen se musí řešit, když není prostá. Pro absolutně spojité dokážeme jen pro ostře rostoucí :
Poslední rovnost platí proto, že pokud , potom a analogicky pro dolní mez.
Věta.
Definice. Je-li náhodný vektor, potom definujeme .
Věta. Nechť náhodné veličiny mají diskrétní nebo absolutně spojité rozdělení a existují . Potom existuje i a platí .
Důkaz.
Věta. Nechť , náhodná veličina má diskrétní nebo absolutně spojité rozdělení a existuje . Potom existuje i a platí .
Důkaz. Triviální.
Důsledek. Střední hodnota je lineární funkcionál na náhodných veličinách.
Věta. Pro je .
Důkaz. Triviální s použitím Diracova rozdělení .
Věta. Nechť nezávislé náhodné veličiny mají diskrétní nebo absolutně spojité rozdělení a existují . Potom .
Důkaz.
Definice. Nechť je náhodná veličina a . Potom -tý obecný moment je
a -tý centrální moment je
Poznámka..
Definice. Druhý centrální moment se nazývá rozptyl: . Jeho odmocnina je směrodatná odchylka: .
Věta. Nechť je náhodná veličina. Potom .
Důkaz.
Věta. Nechť je náhodná veličina a . Potom .
Důkaz.
Věta. Nechť jsou nezávislé náhodné veličiny. Potom .
Důkaz.
Stačí dokázat, že kovariance je pro nezávislé veličiny nulová. Spočteme
Definice. Nechť je náhodná veličiny. Potom koeficient šikmosti je
a koeficient špičatosti je
Poznámka. Šikmost vyjadřuje, jak moc se graf hustoty nahýbá doprava. Špičatost vyjadřuje… jak moc je špičatý (kde je jako normální rozdělení).
Poznámka. Pro je .
Věta. Nechť . Potom a .
Důkaz.
Poznámka. Speciálně pokud , potom a .
Věta. Nechť . Potom a .
Důkaz.
Věta. Nechť . Potom a .
Definice. Kovariance náhodných veličin je .
Věta. Nechť jsou náhodné veličiny. Potom
Definice. Koeficient korelace náhodných veličin je .
Lemma (Schwarzova nerovnost). Nechť jsou náhodné veličiny. Potom .
Důkaz.
To je kvadratický výraz, který má být nezáporný, takže jeho diskriminant musí být nekladný:
Věta. Nechť jsou náhodné veličiny. Potom , přičemž rovnost platí, právě pokud .
Důkaz. Z definic a Schwarzovy nerovnosti plyne , z čehož triviálně . Co se týče tvrzení s rovností:
Nechť . Potom a
Ne.
Koeficient korelace vyjadřuje míru lineární závislosti mezi veličinami. Pokud je nízký, veličiny přesto mohou být korelované, akorát ne lineárně! A to, že veličiny jsou korelované, nemusí znamenat příčinný vztah mezi nimi.
Definice. Náhodné veličiny jsou nekorelované, pokud .
Věta. Jsou-li náhodné veličiny nezávislé, potom jsou nekorelované.
Důkaz. Triviálně plyne ze skutečnosti, že pro nezávislé veličiny je .
Poznámka. Vopáčná implikace neplatí: Nechť mají rovnoměrné rozdělení na jednotkovém kruhu, tedy . Potom
Veličiny nejsou nezávislé:
Veličiny jsou nekorelované:
Definice. Kovarianční matice náhodného vektoru je dána jako .
Poznámka. Matice je symetrická, na diagonále má variace a pokud jsou veličiny nezávislé, potom je diagonální.
Definice. Nechť je náhodná veličina a . -kvantil veličiny je bod .
Poznámka. Pokud je spojitá a ostře rostoucí, potom .
Poznámka. Pokud má absolutně spojité rozdělení, potom .
Poznámka. Některé kvantily mají speciální názvy: = medián, = dolní kvartil, = horní kvartil, = dolní decil, = horní decil, = mezikvartilové rozpětí.
Definice. Charakteristická funkce náhodné veličiny je definovaná jako .
Poznámka. vždy existuje, platí a je-li absolutně spojitě rozdělená, potom jde o její Fourierovu transformaci:
Definice. Momentová vytvářející funkce náhodné veličiny je definovaná jako .
Poznámka. Momentová vytvářející funkce na rozdíl od charakteristické funkce nemusí existovat.
Příklad. Je-li , potom .
Příklad. Je-li , potom .
Věta. Nechť náhodná veličina má momentovou vytvářecí funkci na intervalu . Potom pro každé platí .
Důkaz. Pro jednoduchost předpokládejme, že platí nějaká podmínka pro přehození integrálu a sumy.
-tou derivací a dosazením dostaneme dokazovaný vztah.
Poznámka. Pokud má náhodná veličina všechny momenty a momentovou vytvářející funkci, potom jednoznačně definuje (a navopák).
Věta. Nechť náhodná veličina má momentovou vytvářející funkci. Potom pro náhodnou veličinu platí
.
Důkaz. Jednoduchý.
Věta. Nechť náhodné veličiny mají na intervalu momentové vytvářéjící funkce. Potom pro náhodnou veličinu platí .
Motivace: Chceme odhadnout pravděpodobnost nějakého jevu nebo střední hodnotu nějaké náhodné veličiny tím, že provedeme spoustu nezávislých pokusů.
Definice. Nechť je posloupnost náhodných veličin a . Řekneme, že konverguje k podle pravděpodobnosti , pokud pro každé je . Značíme .
Poznámka. Intuitivně: graf hustoty pravděpodobnosti se „přicucává“ k bodu .
Věta (Čebyševova nerovnost). Nechť je náhodná veličina se střední hodnotou a konečným rozptylem. Potom pro každé platí
Důkaz. Dokážeme pro absolutně spojité rozdělení. Nechť je náhodná veličina taková, že . Potom
Nyní stačí dosadit , což můžeme, protože .
Věta (zákon velkých čísel). Nechť je posloupnost nezávislých, (stejně rozdělených) náhodných veličin, přičemž pro každé existují stejná a . Potom .
Důkaz.
Čebyševova nerovnost nám říká
Výraz nalevo je přesně to, co chceme dokázat, že konverguje k nule pro každé . To je podle této nerovnosti triviální.
Poznámka. Předpoklad stejného rozdělení ve skutečnosti není potřebný, ale z nějakého důvodu se s ním věta formuluje.
Důsledek (metoda Monte Carlo). Nechť a . Potom
To se dá využít k numerické aproximaci integrálu.
Definice. Posloupnost náhodných veličin konverguje k náhodné veličině v distribuci, pokud pro všechna , kde je spojitá, platí . Značíme .
Poznámka. Je-li , můžeme značit také .
Věta (střední limitní). Nechť je posloupnost nezávislých, stejně rozdělených náhodných veličin se stejnou střední hodnotou a konečným rozptylem . Potom
Poznámka. Pro snadnější zapamatování můžeme formulovat takto, kde :
Důkaz. Dokážeme pouze pro mající momentovou vytvářecí funkci, obecně by se to dokázalo pomocí charakteristické funkce. Nejprve uvažujme veličiny s . Nechť je jejich momentová vytvářecí funkce. Definujme . Potom
Roztaylorováním dostáváme
Tím je věta pro dokázaná. Pro stačí vzít .
Poznámka. V praxi aproximace funguje dobře pro (u diskrétních rozdělení může být potřeba trochu víc).
Důsledek (Moivre-Laplace). Nechť je posloupnost nezávislých veličin a . Potom
Označíme-li , potom a platí
tedy binomické rozdělení lze aproximovat jako normální pro dostatečně velké (používá se ).
Vytvoříme model, na základě experimentu odhadneme hodnoty volných parametrů, testujeme o nich hypotézy a ověřujeme shodu modelu se skutečností.
Nejprve musíme odhadnout rozdělení, většinou podle intuitivní představy.
Bodový odhad = předpokládáme, že , a snažíme se odhadnout podle vektoru pozorování .
Intervalový odhad = hledáme interval, ve kterém se parametr nachází s danou pravděpodobností.
Parametrické testy = odhadneme něco o parametru a snažíme se ověřit, jestli to platí.
Testy dobré shody = ověřujeme, jestli se data skutečně řídí odhadnutým rozdělením.
Pořád máme prostor , ale tentokrát představuje populaci, představují individua a náhodná veličina představuje jejich vlastnost. Aby to sedělo s větami, které jsme si předtím odvodili, uděláme takový podvod a zavedeme si náhodné veličiny .
Definice. Nechť je pravděpodobnostní prostor a . -tici nezávislých náhodných veličin se stejným rozdělením nazýváme náhodný výběr z rozdělení .
Potom, co něco naměříme, už nemáme náhodné veličiny, ale nějaká konkrétní čísla, která označíme a nazveme realizace náhodného výběru.
Definice. Nechť je náhodný výběr z rozdělení . Statistika je funkce náhodného výběru , která nezávisí na rozdělení .
Příklad. Výběrový průměr
Příklad. Výběrový rozptyl:
( se dělí proto, že potom bude platit jistý hezký vzoreček)
Příklad. Výběrová směrodatná odchylka
Příklad. Výběrový -tý moment
Příklad. Značíme-li data seřazená podle velikosti, potom výběrový medián je
Příklad. Výběrový geometrický průměr (vhodnější než aritmetický, když modelujeme například nárůsty cen)
Bodové odhady
Uvažujme náhodný výběr z rozdělení , kde .
Definice. Bodový odhad parametru je jakákoli funkce , jejíž předpis nezávisí na .
Poznámka. Bodový odhad je statistika a jelikož je to funkce náhodných veličin, taky je sám o sobě náhodná veličina, tedy má střední hodnotu, rozptyl a tak podobně. Samozřejmě by se nám líbilo, aby byl co nejblíž skutečné hodnotě.
Definice. Odhad je nestranný, pokud pro všechna je . Odhad, který není nestranný, se nazývá vychýlený.
Definice. Odhad je konzistentní, pokud pro všechna je .
Poznámka. Nestrannost znamená, že odhad není zatížen systematickou chybou, zatímco konzistentnost znamená, že dostatečným počtem měření dokážeme zajistit libovolně malou chybu.
Věta. Nechť je náhodný výběr s distribuční funkcí , kde . Potom je nestranný a konzistentní odhad a je nestranný a konzistentní odhad .
Důkaz.
Konzistence plyne ze zákona velkých čísel. Konzistence plyne z jeho obecnější verze, kterou si (zatím?) dokazovat nebudeme.
Poznámka. Intuitivní vysvětlení, proč odčítáme jedničku, je to, že už jsme využili data ke spočtení paramteru , takže nám ubyl jeden stupeň volnosti. Pokud ale už známe předem, potom ho můžeme přidat k souboru a tím pádem při počítání dělit .
Často existuje víc různých nestranných odhadů, potom si chceme vybrat ten, který má nejmenší rozptyl.
Definice. Odhad je nejlepší nestranný, pokud je nestranný a má nejmenší rozptyl ze všech nestranných odhadů.
Věta (Rao-Cramer). Nechť je náhodný výběr s distribuční funkcí , která splňuje jakési podmínky regularity, a je nestranný odhad . Potom
kde je Fisherova míra informace:
(ta rovnost je jedna z podmínek regularity).
Důkaz. Není čas ani na pořádnou formulaci věty, natož na důkaz.
Věta. Je-li náhodný výběr z binomického, Poissonova, exponenciálního nebo normálního rozdělení, potom je nejlepší nestranný odhad .
Důkaz (pro ).
Věta. Je-li náhodný výběr z exponenciálního rozdělení, potom je nejlepší nestranný odhad .
Důkaz. Použijeme Rao-Cramera:
Metoda momentů
Je výpočetně jednoduchá, ale odhady někdy nemívají dobré vlastnosti.
Uděláme tolik rovnic, kolik chceme odhadnout parametrů, přičemž porovnáváme momenty a výběrové momenty:
Příklad. Máme-li binomické rozdělení a chceme odhadnout , řešíme soustavu
Tím dostaneme
Definice. Věrohodnostní funkce je sdružená hustota pravděpodobnosti náhodného výběru uvažovaná jako funkce parametru při dané realizace . Značíme .
Definice. Nechť je náhodný výběr s distribuční funkcí . Hodnota je maximální věrohodný odhad parametru , pokud .
Poznámka. Jelikož maximum nemusí existovat, přesněji by to mělo být něco jako
Ale céčkaři zřejmě nerozlišují maximum a suprémum.
Pro získání odhadu se snažíme věrohodnostní funkci maximalizovat. Protože je to součin, většinou je jednodušší maximalizovat její logaritmus. Budeme tedy řešit věrohodnostní rovnice:
Pokud jsou splněny podmínky regularity a rovnice mají jednoznačný kořen , potom je to konzistentní odhad parametru a s pravděpodobností je to maximální věrohodný odhad.
Tyto odhady jsou často výpočetně náročné a musí se řešit numericky.
Místo odhadu parametru nás zajímá interval, v němž leží s nějakou velkou pravděpodobností.
Definice. Dvojice statistik je -procentní interval spolehlivosti, pokud
je dolní mez, je horní mez, je koeficient spolehlivosti. Většinou se používá nebo .
Poznámka. Obecně se to dělá blbě, ukážeme si jenom pro normální rozdělení.
Věta. Nechť je náhodný výběr z rozdělení a známe . Potom
kde je -kvantil standardního normálního rozdělení.
Důkaz. Někde jsme si už odvodili, že . Znormujeme si to:
Přímo z definice plyne, že
Potom si to jen odnormujeme zpátky.
U binomického rozdělení můžeme díky centrální limitní větě přibližně použít odhad pro normální rozdělení.
Testování hypotéz
Varování: následující definice není v prezentaci napsaná jako definice, takže studenti často neví, že ji mají umět!
Definice. Nechť je náhodný výběr z rozdělení s neznámým parametrem . Nechť o parametru existují dvě vzájemně se vylučující hypotézy: nulová hypotéza a alternativní hypotéza . Potom test nulové hypotézy proti alternativní hypotéze je rozhodovací proces založený na náhodném výběru, podle nějž zamítneme nebo nezamítneme hypotézu . Můžou nastat čtyři možnosti:
platí a nezamítneme : správně ☺
platí a zamítneme : chyba prvního druhu
neplatí a nezamítneme : chyba druhého druhu
neplatí a zamítneme : správně ☺
Poznámka. Nezamítnutí hypotézy neznamená, že ji přijímáme!
Poznámka. Samozřejmě není možné se úplně vyhnout oběma druhům chyb. V praxi se to většinou dělá tak, že stanovíme toleranci pro chybu prvního druhu a snažíme se minimalizovat pravděpodobnost chyby druhého druhu.
Podle našeho rozhodovacího procesu se výběrový prostor rozpadne na dvě části podle toho, kterou hypotézu zvolíme. Množina bodů, pro které zamítneme hypotézu , se nazývá kritický obor a značí . Jestliže chceme, aby pravděpodobnost chyby prvního druhu byla menší než , volíme tak, aby
Číslo je hladina významnosti testu.
Příklad. Nechť a je % interval spolehlivosti pro . Potom kritický obor pro hypotézy bude
Tedy hypotézu zamítneme, pokud odhadnutá hodnota parametru nepatří do intervalu spolehlivosti. Pokud bychom ale testovali proti hypotéze , potom
Testy o parametrech normálního rozdělení
Mějme náhodný výběr z rozdělení . Úkolem je otestovat hypotézu proti hypotéze nebo nebo .
Podívejme se na . Tak nějak intuitivně odhadneme, že bude mít tvar pro nějaké . Znormováním dostáváme
Volíme tedy .
Test poměrem věrohodností: Mějme náhodný výběr z rozdělení . Testujeme hypotézu proti . Nechť je věrohodnostní funkce. Definujeme statistiku
Myšlenka je taková, že pokud platí , potom , jinak .
Test bude vypadat tak, že zvolíme tak, aby pro nějaké platilo
Odvození pro normální rozdělení je na fotce tabule.
Pokud u něčeho měříme hodnoty dvou různých znaků, například změnu tlaku před a po podání léku, máme výběr dvojic , ovšem jsou na sobě závislé. To snadno vyřešíme tím, že definujeme a použijeme normální jednovýběrový test u nich. To je takzvaný párový test. Rozdíl dvou závislých normálních rozdělení ovšem nemusí být normální rozdělení, takže to musíme separátně ověřit!
Definice.-hodnota testu je nejmenší možné , při kterém bychom nulovou hypotézu ještě zamítli. Nebo ekvivalentně, je to pravděpodobnost, že bychom dostali náhodný výběr ještě více odporující nulové hypotéze než ten, co jsme skutečně napozorovali.
Definice. Síla testu je .
Testy dobré shody
Pearsonův -test
Máme náhodný výběr z neznámého rozdělení . Chceme otestovat hypotézu, že jde o konkrétní rozdělení , tedy .
Věta (Pearson). Mějme nezávislé veličiny , kde pro každá veličina nabývá hodnotu s pravděpodobností , a hypotézu . Nechť je počet veličin nabývajících hodnotu , kde , potom
Člen tedy vyjadřuje rozdíl mezi tím, kolik veličin skutečně nabylo nějakou hodnotu, a tím, kolik jich ji v průměru mělo nabýt.
Test probíhá tak, že spočteme sumu a zamítneme hypotézu, pokud .
U spojitého rozdělení je potřeba provést kvantizaci, tedy vyrobit z ní diskrétní. Mějme náhodné veličiny s distribuční funkcí a chceme otestovat hypotézu . Pozorovací prostor si rozdělíme na nějakých intervalů a spočteme: počet pozorování v intervalu , naše hypotéza o tom, s jakou pravděpodobností bychom jednotlivé intervaly měli dostávat. Tím vytvoříme „diskrétní“ hypotézu , která je slabší než , tedy platí implikace , ale ne vopáčně!
Je důležité správně zvolit počet intervalů. Čím víc, tím líp aproximujeme spojité rozdělení, ale zároveň si tím zhoršíme asymptotickou aproximaci. V praxi se používá pravidlo , tedy chceme mít v každém intervalu alespoň pět pozorování. Buňky, které mají méně, se pokusíme sloučit se sousedy. Jedna možnost, jak najít intervaly, je zvolit si tak, aby , a dát dělicí body za každou pětici (nebo víc).
Pearsonův -test pro složenou hypotézu
Chceme zjistit, jestli rozdělení nějakého výběru pochází z nějaké rodiny rozdělení (například jestli je normální).
Pro diskrétní rozdělení opět mějme konečně mnoho možných hodnot s pravděpodobnostmi . Hypotéza je, že . Budeme postupovat tak, že odhadneme konkrétní hodnotu a poté již můžeme použít normální Pearsonův test. Dá se dokázat, že pokud je maximální věrohodný odhad, potom , kde je počet parametrů, které odhadujeme.
A co když máme spojité rozdělení? Potom opět rozdělíme data do kyblíčků a odvodíme si slabší hypotézu. Problém může být akorát v tom, že vhodné rozkyblíčkování vlastně závisí na , které neznáme. Tudíž parametr musíme odhadnout přímo z původních dat (například pokud zjišťujeme, jestli data mají normální rozdělení, spočteme si průměr a výběrový rozptyl).
Vzorová písemka
Cvičení. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel, z nichž žádné není větší než jedna, bude nejvýše roven jedné a jejich součin nebude větší než ?
Řešení
Nakreslíme si čtverec a do něj grafy funkcí . Hledáme obsah plochy, která leží pod oběma grafy. Najdeme si průsečíky:
Mezi těmito dvěma průsečíky je níž hyperbola, mimo tento interval úsečka. Stačí tedy spočíst integrály:
Cvičení. Mezi šesti puškami jsou dvě zastřílené. Pravděpodobnost zásahu ze zastřílené pušky je a z nezastřílené . Výstřelem z jedné vybrané pušky byl cíl zasažen. Určete pravděpodobnost, že byla vybrána zastřílená, resp. nezastřílená puška.
ŘešeníOznačíme si jevy: – máme zastřílenou pušku, – trefili jsme se. Známe:
Z Bayesovy věty:
A jelikož nejsme naprostí idioti, pro nezastřílenou pušku to nebudeme počítat znovu, ale stačí vzít
Cvičení. Určete hustotu pravděpodobnosti, střední hodnoty a kovarianci náhodných veličin definovaných v oblasti , jestliže jejich sdružená distribuční funkce je
ŘešeníHustotu spočteme derivací distribuční funkce podle obou proměnných (je jedno, v jakém pořadí, protože jsme v hezkém spojitém světě):
Marginální hustoty dostaneme integrací sdružené hustoty přes celý definiční obor:
Střední hodnoty vypočteme z marginálních hustot:
Pro výpočet kovarianční matice potřebujeme rozptyly a pro ty potřebujeme druhý moment:
A ještě potřebujeme kovarianci. Tu bychom obecně mohli spočítat vzorečkem
V našem případě ale vidíme, že veličiny jsou nezávislé, takže kovariance musí být nula. Sestavíme tedy kovarianční matici:
Cvičení. Nechť je náhodný výběr z rozdělení s hustotou pravděpodobnosti
Najděte maximálně věrohodný odhad parametru . Je tento odhad nestranný?
Řešení
Řešením rovnice dostaneme
Chceme zjistit, jestli je odhad nestranný, tedy jestli .
Tedy odhad je nestranný.
Cvičení. Něco s laboranty a dusíkem
ŘešeníNejprve otestujeme, jestli rozptyly jsou stejné. K tomu použijeme poslední vzoreček v tabulce. Závěrem bude, že nezamítáme hypotézu, že rozptyly jsou stejné, tedy můžeme použít vzoreček pro porovnání středních hodnot při stejném rozptylu. Opět nezamítneme hypotézu, že jsou stejné.