Výuka 2008-09

Arnošt Komárek

Během zkouškového období konzultace pouze na základě předběžné domluvy (e-mailem, ...).

Dosažitelnost během letních měsíců: Během léta 2009 jsem v následující dny buď na pracovní cestě nebo na dovolené a pracovní e-maily budu číst (a odpovídat na ně) pouze v omezeném rozsahu:

  • 3.7. - 12.7.
  • 17.7. - 16.8.
  • 22.8. - 27.8.
  • 31.8. - 6.9.


Na této stránce k počtení:



  Letní semestr 2008-09

NSTP179 (přednáška a cvičení): Navrhování experimentů a sekvenční analýza

spolu s Prof. RNDr. Marií Huškovou, DrSc. a RNDr. Zdeňkem Hlávkou, Ph.D.

ROZVRH

Přednáška: Úterý 14:00 v K2   
Cvičení: Úterý 12:20 v K11   

DOKUMENTY, INFORMACE atd.

Úlohy pro zkoušku (včetně instrukcí): pdf soubor
Data kuřata (pro jednu ze zkouškových úloh): ASCII soubor (zveřejněno 19.5.2009).
 
R ukázka: ASCII soubor
Data pro R ukázku: ASCII soubor (zveřejněno 19.5.2009).
 
Fólie (Inference v LMM): pdf soubor (zveřejněno 19.5.2009).
 
Fólie (ML/REML odhad v LMM): pdf soubor (zveřejněno 19.5.2009).
 
Odkaz na diskuzní příspěvek D. Batese:
,,Proč nepoužívat t- a F-testy pro pevné efekty v lineárním smíšeném modelu.`` (zveřejněno 4.5.2009).
 
V prvním týdnu semestru (24.2.2009) se v časech pro cvičení i přednášku     
uskuteční přednáška věnující se sekvenčním metodám. (zveřejněno 20.2.2009).

NSTP022 (cvičení): Pravděpodobnost a matematická statistika

ROZVRH

Cvičení a: Úterý 8:10 v K4   
Cvičení b: Úterý 8:10 v K3    (Mgr. Šárka Došlá, MSc.)
Cvičení c: Úterý 8:10 v K12    (Doc. RNDr. Daniel Hlubinka, Ph.D.)
Cvičení d: Úterý 9:50 v K9    (Mgr. Matúš Maciak, MSc.)
Cvičení e: Pondělí 15:40 v K9    (Mgr. Šárka Došlá, MSc.)
Cvičení f: Středa 9:00 v K4    (Ing. Marek Omelka, Ph.D.)
Přednášky: Pondělí 14:00 v K1 a středa 10:40 v K1    (Prof. RNDr. Marie Hušková, DrSc.)

DOKUMENTY, INFORMACE atd.

Opravná zápočtová písemka se bude konat
ve středu 27. května 2009 od 13:00 v K1. (zveřejněno 8.5.2009).
 
Info k zápočtové písemce a ukázka příkladů: pdf soubor (zveřejněno 28.4.2009).
 
Zápočtová písemka se bude konat 5. května 2009. (zveřejněno 31.3.2009).
 
Podmínky získání zápočtu:  pdf soubor (zveřejněno 20.2.2009).
 
Zápočet uděluji pouze studentům, kteří jsou zapsáni v mé skupině v SISu!    (zveřejněno 20.2.2009).
 
Jakékoliv dotazy prosím pokládejte buď ústně během cvičení
nebo během konzultační hodiny. Konzultace v jinou dobu je též možná,
avšak pouze po předchozí ústní domluvě provedené buď na cvičení
nebo během běžné konzultační hodiny. Prosím, nepokládejte dotazy e-mailem,   
není v mých silách na (často opakující se) dotazy odpovídat písemně. (zveřejněno 20.2.2009).
 

DOMÁCÍ ÚKOLY

Domácí úkol č. 1 (do 10. března 2009): pdf soubor
Domácí úkol č. 2 (do 24. března 2009): pdf soubor
Domácí úkol č. 3 (do 14. dubna 2009): pdf soubor
Domácí úkol č. 4 (do 28. dubna 2009): pdf soubor
Domácí úkol č. 5 (do 19. května 2009): pdf soubor
Dodání 5. domácího úkolu je dobrovolné.
V případě dodání bude opraven a připraven k vyzvednutí během opravné zápočtové písemky.

NSTP070 (MS710P09 cvičení): Základy biostatistiky

ROZVRH

Cvičení a: Středa 8:10 v B5 (Viničná 7)   
Cvičení b: Středa 9:50 v B5 (Viničná 7)   
Přednáška: Úterý 9:00 v B7 (Viničná 7)    (Doc. RNDr. Karel Zvára, CSc.)



  Zimní semestr 2008-09

NSTP129 (přednáška): Pravděpodobnost a statistika

ROZVRH

Přednášky: Úterý 8:10 v K3 a středa 15:40 v K1   
Cvičení a: Úterý 9:50 v K8/K10A    (Mgr. Andrea Kvitkovičová, MSc.)
Cvičení b: Středa 17:20 v K8/K10A    (Mgr. Šárka Došlá, MSc.)

DOKUMENTY, INFORMACE atd.

Program přednášky: pdf soubor (poslední změna 4.1.2009).
OZNÁMENÍ: Na poslední přednášce ve středu 14.1.2009 bude podrobně ukázána moje představa ideálního řešení statistické části zkouškové písemky a budou zodpovězeny libovolné dotazy (mající vztah k probrané látce nebo k formě zkoušky).
(zveřejněno 4.1.2009).

ZKOUŠKY

  • Zkouškové termíny jsou vypsány v SISu.
  • Pro přihlášení na první tři termíny není vyžadováno získání zápočtu. Známka však bude zapsána až po získání zápočtu, o jehož (ne)udělení rozhoduje cvičící nezávisle na výsledku zkoušky.
  • Kapacita termínu v posledním týdnu zkouškového období bude upravena, případně přibude v tomto týdnu termín v závislosti na počtu studentů potřebujících opravný termín. Možnost opravy v posledním týdnu zkouškového období zaručuji všem zájemcům.
  • Právě jeden opravný termín bude vypsán též v průběhu letního semestru, respektive v letním zkouškovém období. Účast na něm bude umožněna pouze studentům, kteří se fyzicky zúčastní alespoň jednoho termínu během zimního zkouškového období, nebo budou schopni doložit alespoň dvoutýdenní pracovní neschopnost během zimního zkouškového období.
  • Jak jste si jistě povšimli, ti z vás, kteří se na mě přijdou podívat alespoň jednou během první čtyř týdnů zkouškového období, mají zaručenu možnost dvou oprav - proto neváhejte a rezervujte si místo na první pokus již v průběhu prvních čtyř týdnů zkouškového.
Obecná informace o formě zkoušky:    pdf (zveřejněno 2.1.2009).
Ukázka zkouškové písemky:    pdf (zveřejněno 2.1.2009).
Statistické tabulky pro ukázkovou písemku:    pdf (zveřejněno 2.1.2009).

PŘEDNÁŠKOVÉ FÓLIE

  • Fólie promítané na přednášce jsou k dispozici ve dvou variantách: (a) tak jak jsou promítány (přednáška), (b) méně barevné s dvěma fóliemi na straně A4 (tisk).
  • Fólie zdaleka neobsahují vše, co bude řečeno na přednášce (důkazy, řešení ilustračních příkladů a další ,,omáčku`` zde z větší části nenajdete).
  • Fólie doporučuji vytisknout a během přednášky vlastní rukou doplňovat.
  • Obsah fólií se může ještě měnit. Netiskněte tedy příliš mnoho stránek dopředu.
Úvodní informace:  přednáška (pdf) tisk (pdf) (poslední změna 17.9.2008).
Náhodné jevy a jejich pravděpodobnost:  přednáška (pdf) tisk (pdf) (poslední změna 8.10.2008).
Náhodné veličiny:  přednáška (pdf) tisk (pdf) (poslední změna 5.11.2008).
Základy matematické statistiky, bodové odhady:  přednáška (pdf) tisk (pdf) (poslední změna 19.11.2008)
Intervalové odhady a testování hypotéz:  přednáška (pdf) tisk (pdf) (poslední změna 4.1.2009)
Při poslední změně této části fólií zejména přibyly strany 149-152, na kterých naleznete dodělávku z poslední předvánoční přednášky.

UKÁZKA PROGRAMU R

Stručný manuál:  pdf (poslední změna 17.11.2008).
Ukázkový R skript:  R skript (ASCII) (poslední změna 17.11.2008).
Data použitá v manuálu:  auta04.dat (ASCII) auta04.csv (ASCII) auta04.xls (Excel) (poslední změna 17.12.2008).

NSTP191 (cvičení k NSTP201, resp. NSTP001): Matematická statistika

ROZVRH

Paralelka a: Úterý 14:00 v K7   
Paralelka b: Středa 10:40 v K8    (Doc. RNDr. Daniel Hlubinka, Ph.D.)
Přednášky: Pondělí 15:40 v K2 a Čtvrtek 10:40 v K2    (Prof. RNDr. Jiří Andĕl, DrSc.)

DOKUMENTY, INFORMACE atd.

Tady (pdf) jsou nějaké příklady, kterými si můžete vše procvičit. (zveřejněno 14.1.2009).
 
Opravná zápočtová písemka se bude konat
ve čtvrtek 22. ledna 2009 v 8:00 v K3    (zveřejněno 17.12.2008).
 
Příklady pro cvičení 21. a 28. října 2008:  pdf soubor (zveřejněno 21.10.2008).
 
Podmínky získání zápočtu:  pdf soubor (zveřejněno 29.9.2008).
 
Zápočet uděluji pouze studentům, kteří jsou zapsáni v mé skupině v SISu!    (zveřejněno 29.9.2008).

UKÁZKA PROGRAMU R

Stručný manuál:  pdf (poslední změna 17.12.2008).
R skript
ze stručného manuálu:  R skript (ASCII) (poslední změna 17.12.2008).
Ukázkový R skript 
(ze cvičení 16.12.2008): R skript (ASCII) (poslední změna 16.12.2008).
Data použitá v manuálu:  auta04.dat (ASCII) auta04.csv (ASCII) auta04.xls (Excel) (poslední změna 17.12.2008).

DOMÁCÍ ÚKOLY

Domácí úkol č. 1 (do 21. října 2008): pdf soubor
Domácí úkol č. 2 (do 4. listopadu 2008): pdf soubor
Domácí úkol č. 3 (do 18. listopadu 2008): pdf soubor
Domácí úkol č. 4 (do 16. prosince 2008): pdf soubor
Domácí úkol č. 5 (do 6. ledna 2009): pdf soubor

NSTP195 (cvičení k NSTP194, resp. NSTP094): Regrese

ROZVRH

Paralelka b: Úterý 15:40 v K11   
Paralelka a: Pondělí 9:00 v K11    (Doc. RNDr. Karel Zvára, CSc.)
Přednášky: Úterý 12:20 v K2 a čtvrtek 12:20 v K3    (Doc. RNDr. Karel Zvára, CSc.)

DOKUMENTY, INFORMACE atd.

Program cvičení: pdf soubor (poslední změna 3.12.2008).
Podmínky získání zápočtu:  pdf soubor (zveřejněno 30.9.2008).
Zápočet uděluji pouze studentům, kteří jsou zapsáni v mé skupině v SISu!    (zveřejněno 29.9.2008).

ZADÁNÍ ZÁPOČTOVÉ ÚLOHY

  • Zadání a pokyny naleznete v pdf souboru (zveřejněn 29.10.2008). Připomínám, že vypracovanou úlohu je třeba odevzdat vytištěnou na papíře nejpozději na Tři krále roku 2009.
  • Potřebná data chicago máte k dispozici jako ASCII soubor s názvy proměnných na prvním řádku, oddělovačem mezerou a desetinným oddělovačem tečkou.

ZADÁNÍ CVIČENÍ

  • Na cvičeních se budeme postupně zabývat řešením problémů popsaných v níže uvedených pdf souborech.
  • Ke každému pdf souboru je k dispozici ASCII soubor s příkazy pro R uvedenými v příslušném pdf.
  • Před cvičením doporučuji vytisknout zadání z pdf na papír a stáhnout si na lokální disk R skript, který je poté možno doplňovat.
  • Na lokální disk dále doporučuji před cvičením stáhnout příslušný datový soubor (budete ho případně moci modifikovat).
  • Data naleznete zde (k přístupu použijte uživatelské jméno a heslo, které jsem vám sdělil na prvním cvičení).
  • Všechny níže uvedené soubory (včetně dat) najdete co nevidět též na disku I v adresáři I:/kpms/komarek/nstp195 v počítačové učebně.
Ukázky regresních závislostí (data Hosi0) zadání (pdf) R skript (ASCII) (poslední změna 20.10.2008).
Ukázky závislostí (data Kojeni) zadání (pdf) R skript (ASCII) (poslední změna 20.10.2008).
Síla testu (data Vysky) zadání (pdf) R skript (ASCII) (poslední změna 20.10.2008).
Pozadí lineární regrese a maticové rozklady zadání (pdf) R skript (ASCII) (poslední změna 5.11.2008).
Pásy spolehlivosti, predikční pásy, (data Dris) zadání (pdf) R skript (ASCII) (poslední změna 5.11.2008).
testy podmodelu
Analýza rozptylu a lineární model (data Koreny) zadání (pdf) R skript (ASCII) (poslední změna 30.10.2008).
Vyšetření možné rovnoběžnosti přímek, (data Listy) zadání (pdf) R skript (ASCII) (poslední změna 5.11.2008).
kalibrace
Porovnání modelů, prověření kvality modelu (data Policie) zadání (pdf) R skript (ASCII) (poslední změna 9.11.2008).
Tvar závislosti, stabilita rozptylu (data Draha) zadání (pdf) R skript (ASCII) (poslední změna 12.11.2008).
Vážená lineární regrese, testování podmodelu (data Hlavy) zadání (pdf) R skript (ASCII) (poslední změna 12.11.2008).
Transformace, kroková regrese, (data Fazekas) zadání (pdf) R skript (ASCII) (poslední změna 19.11.2008).
korelační a parciální korelační koeficient
Analýza rozptylu dvojného třídění (data Howells) zadání (pdf) R skript (ASCII) (poslední změna 27.11.2008).
Celková analýza (data Melanom) zadání (pdf) R skript (ASCII) (poslední změna 29.11.2008).
Multikolinearita (data IQ) zadání (pdf) R skript (ASCII) (poslední změna 27.11.2008).
Autokorelace (data Voda) zadání (pdf) R skript (ASCII) (poslední změna 9.12.2008).
Nelineární regrese (data Hepaga) zadání (pdf) R skript (ASCII) (poslední změna 15.12.2008).
Nelineární regrese (data Puromycin) zadání (pdf) R skript (ASCII) (poslední změna 17.12.2008).



  Materiály k Rku

   Veškeré níže umístěné materiály slouží pouze pro potřeby studentů MFF UK
   a nesmějí být dále šířeny bez písemného souhlasu autora.

R lze zdarma stáhnout z http://www.R-project.org a poté používat při dodržení podmínek GNU GPL licence (nevylučuje komerční využití).

STRUČNÉ MANUÁLY A UČEBNICE

Stručný manuál číslo 1:   pdf soubor
Ukázková data (ASCII soubory):   kamaradi.dat, kamaradi2.dat, kamaradi3.dat, kamaradi4.dat, kamaradi5.dat, kamaradi6.dat
 
Stručný manuál číslo 2:   pdf soubor
Ukázková data (ASCII soubor): car.dat
Tento manuál byl napsán primárně pro studenty FM VŠE.
Ostatní musejí při četbě ignorovat (zejména v oddíle věnovanému instalaci) odkazy na tamní síťové disky K:/PED/KMIH/...
 
Učebnice statistiky s příklady v R:   Stránka s omezeným přístupem
(přihlašovací údaje sdělím na požádání)
 
Další stručné manuály a jiné odkazy:   Stránka Michala Kulicha
 
Úvod do R psaný pro biology:   pdf soubor
(od Karla Zváry)



  Diplomová práce vypsaná ve školním roce 2008-09

Téma: Metody výpočtu maximálně věrohodných odhadů v zobecněném lineárním smíšeném modelu

Zadáno 30.9.2008: Martin Otava

Anotace: Zobecněný lineární smíšený model (GLMM) je v současnosti patrně nejpoužívanějším prostředkem pro regresní analýzu korelovaných kategoriálních dat. Vzhledem k tomu, že věrohodnost GLMM není obvykle možné maximalizovat analyticky, bylo v literatuře v posledních 15 letech navrženo několik aproximativních způsobů pro výpočet maximálnč včrohodných odhadů (MLE). Cílem práce bude seznámit se s problematikou GLMM s důrazem na výpočetní aspekty při hledání MLE a kriticky srovnat (teoreticky, simulací, analýzou reálných dat) některé z metod navržených v literatuře.

Zásady pro vypracování: Jedná se částečně o kompilační práci, v jejímž rámci student nastuduje problematiku zobecněných lineárních smíšených modelů s důrazem na výpočetní aspekty hledání maximálně věrohodných odhadů (MLE). Posluchač při jednotném značení popíše některé aproximativní metody výpočtu MLE, uvede explicitně matematická odůvodnění použití jednotlivých aproximací a kriticky srovná jednotlivé metody (teoreticky, simulační studií, analýzou reálných dat).

Během 1. ročníku navazujícího magisterského studia nutno absolvovat předměty NSTP094, resp. NSTP194/195 (Regrese včetně cvičení) a NSTP126, resp. NSTP196/197 (Zobecněné lineární modely včetně cvičení).

Alespoň pasivní znalost angličtiny a znalost, či ochota se naučit pracovat se statistickými balíky R a SAS nutné.

Literatura:
Breslow, N. E. and Clayton, D. G. (1993). Approximate inference in generalized linear mixed models. Journal of the American Statistical Association, 88, 9-25.
Clarkson, D. B. and Zhan, Y. (2002). Using spherical-radial quadrature to fit generalized linear mixed effects-models. Journal of Computational and Graphical Statistics, 11, 639-659.
Goldstein, H. and Rasbash, J. (1996). Improved approximations for multilevel models with binary responses. Journal of the Royal Statistical Society, Series A, 159, 505-513.
Liu, L. and Yu, Z. (2008). A likelihood reformulation method in non-normal random effects models. Statistics in Medicine, 27, 3105-3124.
McCullagh, P. and Nelder, J. A. (1989). Generalized Linear Models, Second Edition. Boca Raton: Chapman & Hall/CRC. ISBN 0-412-31760-5.
Molenberghs, G. and Verbeke, G. (2005). Models for Discrete Longitudinal Data. New York: Springer. ISBN 978-0387-25144-8.
Nelson, K. P., Lipsitz, S. R., Fitzmaurice, G. M., Ibrahim, J., Parzen, M., and Strawderman, R. (2006). Use of the probability integral transformation to fit nonlinear mixed-effects models with nonnormal random effects. Journal of Computational and Graphical Statistics, 15, 39-57.
Pinheiro, J. C. and Bates, D. M. (1995). Approximations to the log-likelihood function in the nonlinear mixed effects model. Journal of Computational and Graphical Statistics, 4, 12-35.
Pinheiro, J. C. and Chao, E. C. (2006). Efficient Laplacian and adaptive Gaussian quadrature algorithms for multilevel generalized linear mixed models. Journal of Computational and Graphical Statistics, 15, 58-81.



  Bakalářské práce vypsané pro školní rok 2008-09

Téma 1: Statistické metody pro proporce

Zadáno 13.9.2008: Petr Kubík

Anotace: Součástí bakalářské práce budou zejména následující problémy: statistický úsudek o neznámé proporci (pravděpodobnosti úspěchu) v náhodném výběru z alternativního rozdělení, kvantifikace rozdílnosti proporcí dvou nezávislých náhodných výběrů z alternativního rozdělení (rozdíl proporcí, relativní riziko, poměr šancí) a související metody statistického úsudku, porovnání proporcí v několika nezávislých náhodných výběrech z alternativního rozdělení. Dle zájmu uchazeče lze práci případně rozšířit o základy a aplikaci logistické regrese, zejména s důrazem na interpretaci získaných výsledků.

Zásady pro vypracování: Jedná se o kompilační práci, v jejímž rámci student nastuduje statistické metody pro analýzu proporcí (podrobněji viz anotace). Vlastní příspěvek studenta bude spočívat zejména: v přehledném a uceleném popisu nastudovaných metod a jejich statistických vlastností, vše při jednotném značení, v explicitním vyjádření některých souvislostí mezi studovanými metodami, ve vypracování vybraných cvičení z Fleiss et al. (2003), resp. Agresti (2002), v aplikaci nastudovaných metod na reálná data spolu s interpretací získaných výsledků. Studijní literatura bude k dispozici vesměs v angličtině, práce bude psána v češtině nebo slovenštině.

Alespoň pasivní znalost angličtiny a znalost, či ochota se naučit pracovat se statistickým balíkem R nutné.

Literatura:
Agresti, A. (2002). Categorical Data Analysis, Second Edition. Hoboken: John Wiley and Sons. ISBN 0-471-36093-7.
Fleiss, J. L., Levin, B. and Paik, M. C. (2003). Statistical Methods for Rates and Proportions, Third Edition. Hoboken: John Wiley and Sons. ISBN 0-471-52629-0.

Téma 2: Úvod do bootstrapu s aplikacemi

Zadáno 30.9.2008: Josef Orel

Anotace: Bootstrap je počítačová metoda sloužcí k odhadu přesnosti (směrodatné chyby apod.) statistických odhadů v situacích, kdy teoretické odvození přesnosti odhadu je buď vůbec nebo obtížně proveditelné. Součástí bakalářské práce bude: popis principů bootstrapu a odvození základních statistických vlastností, porovnání boostrapových odhadů přesnosti s těmi teoretickými v situacích, kdy lze teoretickou přesnost snadno odvodit (výběrový průměr, lineární regrese s metodou nejmenších čtverců, ...), aplikace nastudovaných metod na reálná data.

Zásady pro vypracování: Jedná se o kompilační práci, v jejímž rámci student nastuduje základy bootstrapu. Vlastní příspěvek studenta bude spočívat zejména: v přehledném a uceleném popisu nastudovaných metod a jejich statistických vlastností, vše při jednotném značení, v explicitním vyjádření některých souvislostí mezi studovanými metodami, ve vypracování vybraných cvičení z Efron a Tibshirani (1993), resp. Davison a Hinkley (1997), v aplikaci nastudovaných metod na reálná data spolu s interpretací získaných výsledků. Studijní literatura bude k dispozici vesměs v angličtině, práce bude psána v češtině nebo slovenštině.

Alespoň pasivní znalost angličtiny a znalost, či ochota se naučit pracovat se statistickým balíkem R nutné.

Literatura:
Efron, B. and Tibshirani, R. J. (1993). An Introduction to the Bootstrap. Boca Raton: Chapman & Hall/CRC. ISBN 0-412-04231-2.
Davison, A. C. and Hinkley, D. V. (1997). Bootstrap Methods and their Application. New York: Cambridge University Press. ISBN 978-0-521-57471-4.

 

View My Stats