Cvičení z matematické statistiky 2 (NSTP192)

Arnošt Komárek

Podstránky

Domácí | Výuka |

Výuka zima

NSTP021 + 183 | NSTP191 | NSTP195 |

Výuka léto

NSTP070 | NSTP192 |

Výuka, software

Rko |

Vedené práce

Diplomové práce | Bakalářské práce |

Cvičení z matematické statistiky 2 (NSTP192)

Letní semestr 2011-12

Cvičení k přednášce Matematická statistika 2 (NSTP202), kterou vyučuje Prof. RNDr. Jiří Anděl, DrSc.

Oficiálně sice nemá (letos již patrně naposledy) Cvičení z matematické statistiky 2 žádné prerekvizity, nicméně důrazně se nedoporučuje ho zapisovat v případě, že student nemá úspěšně složenu zkoušku (nebo dokonce ani zápočet) z předmětu Pravděpodobnost a matematická statistika (NSTP022), případně z předmětu Pravděpodobnost a statistika (NSTP129). Dále se předpokládá znalost látky předmětu Matematická statistika 1 (NSTP201) a dovednosti procvičované v rámci Cvičení z matematické statistiky 1 (NSTP191).

ROZVRH

Cvičení: Úterý 15:40 v K11   
Středa 12:20 v K11   
Přednášky: Pondělí 10:40 v K2 a úterý 14:00 v K3    (Prof. RNDr. Jiří Anděl, DrSc.)

OZNÁMENÍ

Termín dodání zápočtové domácí práce pro studenty Bc. studia, kteří se hlásí k červnovému termínu SZZ: 5. červen 2012 (14:00). U prací dodaných do tohoto termínu garantuji jejich zpracování a (v případě přijatelnosti) zápis zápočtu ve čtvrtek 7.6. navečer (viz dále), tj. v termínu umožnujícím včasné uzavření indexu na studijním oddělení.

Zápis zápočtů do indexu. V průběhu zkouškového období lze získat fyzický zápis uděleného zápočtu do indexu v následujících momentech:

Pondělí  28. května  14:00–15:30  učebna K2
Čtvrtek  7. června  17:30–19:00  moje pracovna (2. patro u schodů)
Pondělí  18. června  8:30–10:30  praktikum KPMS, případně moje pracovna
Čtvrtek  21. června  8:30–10:30  praktikum KPMS, případně moje pracovna
 

Pokud mne v uvedené doby nezastihnete na uvedeném místě, pohybuji se v nejbližším okolí (typicky po karlínské budově) a v řádu několika málo minut budu k zastižení. Pokud zazvoníte na zvonek vedle mé pracovny v jinou dobu a já vám otevřu, zápočet vám zapíši taktéž. Nicméně odmítám si po e-mailu domlouvat individuální termíny návštěvy mající jako jediný účel získání mého podpisu. Index s lístečkem, na kterém bude uveden požadavek na zápis zápočtu + kontaktní e-mail lze též zanechat u sekretářky KPMS paní Jandové. Zápočet bude v nejbližším termínu zapsán, vy budete e-mailem vyrozuměni a index bude opět k dispozici k vyzvednutí na sekretariátě KPMS. Děkuji za pochopení.

Index k podpisu není nutné nosit osobně. Lze využít též kamarádů, resp, kurýrních a jiných služeb.

Opravná (resp. náhradní) zápočtová písemka se bude konat v pondělí 28. května 2012, od 14:00 v K2.

PODMÍNKY ZÍSKÁNÍ ZÁPOČTU

Získání zápočtu je podmíněno splněním následujících požadavků:

  1. Účast na cvičení v dobách dle zápisu v SISu. Zápočet bude udělen pouze tomu, kdo měl nejvýše dvě nenahrazené absence během semestru. Tato podmínka se nevztahuje na studenty zapsané v kombinované formě studia.
    • Za účast na jednom cvičení se považuje přítomnost během alespoň 75 minut daného cvičení.
    • Plánovanou i neplánovanou absenci lze výjimečně nahradit účastí na cvičení druhé skupiny se stejným obsahem (až do května se v důsledku rektorského volna z 29.2. nejedná o cvičení ve stejném týdnu!)
    • Plánovanou celotýdenní absenci (která neumožňuje návštěvu druhé skupiny), resp. absenci způsobenou doloženou pracovní neschopností lze po dohodě se cvičícím nahradit zpracováním zadaných úloh. O zadání úloh je třeba požádat (osobně či e-mailem) nejpozději druhý den po cvičení, kterým se mají úlohy nahrazovat (výjimkou z tohoto pravidla jsou pouze situace, kdy je student prokazatelně ve stavu neumožňujícím žádný z výše uvedených možností komunikace – hospitalizace, stav bezvědomí, ztroskotání na pustém ostrově, zavalení lavinou apod.). Řešení úloh bude nutné zpracovat pomocí vhodného softwarového nástroje (LaTeX, OpenOffice Writer, MS Word, ...) a odevzdat v papírové formě cvičícímu nejpozději do jednoho týdne od jejich zadání (termín zadání nemusí být totožný s termínem žádosti o náhradní úlohy). Vyřešené úlohy budou považovány za náhradu zameškaného cvičení pouze tehdy, budou-li odevzdány včas a nebudou-li v nich žádné závažné chyby.
  2. Uspokojivé zpracování zápočtové práce (písemky).
    • Za uspokojivě zpracovanou zápočtovou práci se považuje práce napsaná na alespoň 60 % bodů.
    • Zápočtová práce se bude konat na cvičení 9., resp. 15. května 2012.
    • Zápočtovou práci bude možné opravit nebo nahradit (v případě absence z libovolného důvodu na řádném termínu) v právě jednom opravném termínu, který se bude konat v období 28.5. – 29.6.2012 (bude včas upřesněno). Zameškanou (z libovolného důvodu) opravnou zápočtovou práci již nahradit nelze.
  3. Včasné dodání (nejpozději 29. června 2012) uspokojivě zpracované domácí zápočtové práce.
    • Domácí zápočtová práce bude zadána přibližně v polovině semestru tak, aby bylo možné ji zpracovávat průběžně po zbytek výukového období letního semestru.
    • Definice požadované kvality zpracování bude sdělena spolu se zadáním.

Případy hodné zvláštního zřetele (tělesné postižení, chronická nemoc, dlouhodobá hospitalizace, výkon trestu odnětí svobody či jiné vážné objektivní překážky ve studiu) budou posuzovány cvičícím individuálně.


ZÁPOČTOVÝ DOMÁCÍ ÚKOL

Pokyny a zadání  pdf soubor (zveřejněno 3.4.2012).
(21.5.2012 opraveno chybné zadání úlohy 2 (g)
v části pro studenty se sudým číslem studentské karty)
Data  titanic.csv (oddělovač středník) 
  smrt.csv (oddělovač středník) 
  matky.csv (oddělovač čárka) 
 

MATERIÁLY PRO CVIČENÍ

Forma jednotlivých cvičení bude během semestru značně variabilní. Někdy budeme odvozovat odhady, testy a jejich vlastností na papír a tabuli. Jindy budeme prakticky s reálnými daty aplikovat statistické metody probírané na přednášce. Jakožto prostředek výpočtů budeme používat statistický balík R. Nicméně i v tomto případě se pokusíme podívat se na principy fungování jednotlivých metod. Z tohoto důvodu ne vždy použijeme přímočaře funkci, která implementuje danou metodu, ale pokusíme se dojít k výsledku přes výpočet jednotlivých mezivýsledků. Cílem je dojít k poznání, že formu mnohých ,,vzorečků`` lze odvodit ,,selským rozumem`` (s tím, že osvětlení, proč ,,selský rozum`` funguje, je podáno formou rigorózních důkazů na přednášce).

Chci na tomto místě zdůraznit, že cílem tohoto cvičení není procvičovat se v ovládání programu R! Daný software zde slouží pouze jako nástroj nahrazující v minulém století používané kalkulačky, statistické tabulky apod. Pro cvičení, během nichž bude R ve významné míře používáno, naleznete níže předpřipravené skripty (s češtinou kódovanou buď v UTF8 nebo v CP1250). Tyto skripty obsahují pouze v omezené míře zadání práce pro cvičení a slouží zejména k urychlení práce na cvičeních. Prosím, nezabývejte se nadměrně technickými aspekty R. Problémy typu jak změnit barvu v grafu apod. vyřešte v případě zájmu až doma (na základě studia dostupných R příruček či metodou pokus-omyl). Na cvičení se soustřeďte spíše na pochopení principů statistického myšlení, pochopení principů fungování jednotlivých metod, interpretaci výsledků apod.

Některé materiály (zejména data) jsou na stránce s omezeným přístupem. Přístupové údaje budou/byly sděleny na cvičení.

Cvičení č. 1 a 2 (21./22. února 2012, 28. února/7. března 2012)    R skript (UTF8) R skript (CP1250) Data Hosi0 (RData)
Cvičení č. 3 (6./14. března 2012)    R skript (UTF8) R skript (CP1250) Data Hosi0 (RData)
Cvičení č. 7 (3./11. dubna 2012)    R skript (UTF8) R skript (CP1250)
Cvičení č. 8 (10./18. dubna 2012)    R skript (UTF8) R skript (CP1250)
    Data Kojeni (CSV) Popis dat (UTF8) Popis dat (CP1250)
    Data IQ (DAT) Popis dat (UTF8) Popis dat (CP1250)
Cvičení č. 9 (17./25. dubna 2012)    R skript (UTF8) R skript (CP1250)
    Data Kojeni (RData) Popis dat (UTF8) Popis dat (CP1250)
Cvičení č. 10 (24. dubna/2. května 2012)    R skript (UTF8) R skript (CP1250)
    Data Kojeni (RData) Popis dat (UTF8) Popis dat (CP1250)
    Funkce figNorm (R skript) Funkce figKS (R skript)
Cvičení č. 12 (22./23. května 2012)    R skript (UTF8) R skript (CP1250)
    Data Film (CSV) Data Alko (CSV) Data PremarsxXmarsex (CSV)
    Funkce stuart.test.R (R skript) Funkce bhapkar.test.R (R skript)

DALŠÍ DOKUMENTY

Cvičná zápočtová písemka (včetně řešení):  pdf soubor (zveřejněno 24.4.2012).


SKUTEČNÝ PROGRAM JEDNOTLIVÝCH CVIČENÍ

Cvičení č. 1 (21./22. února 2012)   
• Poznámky k domácí zápočtové práci ze zimního semestru.
• Testy o střední hodnotě, zejména v normálně rozděleném náhodném výběru.
Cvičení č. 2 (28. února/7. března 2012)   
• Síla testů o střední hodnotě, resp. o rozdílu středních hodnot, zejména v normálně rozděleném náhodném výběru, resp. dvou nezávislých normálně rozdělených náhodných výběrech.
Cvičení č. 3 (6./14. března 2012)   
• Lineární regrese (základy).
• Testy o korelačních koeficientech (též vícenásobných a parciálních).
Cvičení č. 4 (13./21. března 2012)   
• Odvození nevhodného nestranného odhadu (v useknutém Poissonově rozdělení).
• Regulární systém hustot – opakování.
• Eficience výběrového průměru ve výběru z N(θ, 1).
• Fisherova informační matice ve výběru z dvourozměrného normálního rozdělení se střední hodnotou θ a rozptylem jedna pro obě složky a známou korelací ρ. Diskuze případů ρ jdoucího k ±1.
Cvičení č. 5 (20./28. března 2012)   
• Fisherova informační matice pro náhodný výběr z N(θ, σ2).
• Vybraný prvek Fisherovy informační matice ve výběru z dvourozměrného normálního rozdělení s nulovými středními hodnotami, rozptylem σ2 a korelací ρ.
• (Minimální) suficientní statistika, úplná statistika – opakování.
• Minimální suficientní statistika v rozdělení B(a, b).
• Exponenciální třída rozdělení.
Cvičení č. 6 (27. března/4. dubna 2012)   
• Úplná suficientní (a tedy i minimální) statistika pro výběr z rozdělení z exponenciální třídy.
• Úplná suficientní (a tedy i minimální) statistika pro výběr z rozdělení N(θ, σ2).
• Teorie maximální věrohodnosti – opakování.
• Maximálně věrohodný odhad parametru θ = log(p/(1-p)) v alternativním rozdělení s parametrem p a související asymptotické testy o θ, resp. o p.
Cvičení č. 7 (3./11. dubna 2012)   
• Maximálně věrohodný odhad parametru θ = log(p/(1-p)) v alternativním rozdělení s parametrem p a související asymptotické intervaly spolehlivosti a testy o θ, resp. o p.
• Maximálně věrohodný odhad parametru θ = log(λ) v exponenciálním rozdělení s parametrem λ při nezávislém cenzorování zprava a související asymptotické intervaly spolehlivosti a testy o θ, resp. o λ (dobrovolná domácí úloha).
Cvičení č. 8 (10./18. dubna 2012)   
• Lineární model.
Cvičení č. 9 (17./25. dubna 2012)   
• Analýza rozptylu.
Cvičení č. 10 (24. dubna/2. května 2012)   
• Neparametrické metody.
Cvičení č. 11 (15./9. května 2012)   
• Zápočtová písemka.
Cvičení č. 12 (22./23. května 2012)   
• Zhodnocení zápočtové písemky.
• Kontingenční tabulky.

 

View My Stats