Cvičení MAI010 -- Zadání samostatné zápočtové úlohy

1. Obecné pokyny

Vyřešení a odevzdání této úlohy je podmínkou pro udělení zápočtu, zápočet je podmínkou k připuštění ke zkoušce. Práci odevzdávejte v tištěné podobě, zdrojový kód použitý pro analýzu pošlete e-mailem na . Úlohu je možno odevzdat na cvičení nebo na Karlíně ve 4. patře v místnosti 434. Práci přineste v dostatečném časovém předstihu, tj. minimálně 3 pracovní dny před termínem, kdy budete chtít zápočet.

Při posuzování vaší práce bude brán zřetel zejména na pochopení statistického pozadí problematiky. To by mělo být ilustrováno dostatečně srozumitelným komentářem číselných výsledků (představte si například, že se práci snažíte "prodat" člověku, který statistice nerozumí) a vysvětlením použití daného postupu. Nebojte se rozvést vypočtená čísla do slov, pouhý soupis výstupu z Rka rozhodně nebude impulzem k udělení zápočtu. Naopak, s kopírováním softwarového výstupu raději spíše šetřete a uvádějte skutečně jen to nejpodstatnější (pokud vůbec něco). Při samotném řešení se snažte přeformulovat položené otázky do statistického jazyka. Úlohy se vám pak budou řešit lépe (nehledě na to, že v případě, kdy nevím, co počítám, se počítá velmi špatně). Použití programu R není podmínkou, ale je doporučeno. V případě použití jiného software nezapomeňte uvést jeho název a popsat použité funkce. Celé by to mohlo vypadat například nějak takhle.

Dalším hlediskem při posuzování kvality práce bude její grafické zpracování. Práce by měla být zpracována na počítači, její obsah přehledně a esteticky organizován. Doporučuji zvykat si na (La)TeX, stejně v něm pravděpodobně budete jednou psát diplomku.

2. Popis dat

K analýze použijte soubor Porody.txt. Vzhledem k tomu, že chceme, aby každý dospěl k vlastním závěrům, použijte prosím následující postup, který zaručí, že v proměnné MyPorody budete mít k dispozici vlastní data o přibližném počtu 800 řádek:

set.seed(c(3112, 1977)) # sem patri Vase datum narozeni ve formatu c(ddmm,yyyy)
Porody<-read.table("Porody.txt",sep=";",header=TRUE)
MyPorody<-Porody[runif(nrow(Porody))<0.5,]

Data v tomto souboru popisují údaje o náhodně vybraných dětech. Proměnná PorPor označuje pořadí dítěte v rodině, PorTeh pořadí těhotenství matky, HmotPor a DelPor jsou údaje o porodní hmotnosti a délce, podobně Hmot1, Hmot2, Hmot3, Hmot4 a Vysk1, Vysk2, Vysk3, Vysk4 jsou tyto údaje vztažené k první lékařské prohlídce a k 4., 8. a 12. měsíci života dítěte. Proměnné VekMat a VekOtce uvádějí věk matky a otce v okamžiku narození dítěte. Význam veličiny Sex je 1 = chlapec, 0 = divka, Otitidy2 - Otitidy4 postupně udávají počet otitid (zánětů středního ucha) v třetinách prvního roku života dítěte. Veličiny ObHl1 - ObHl4 udávají obvod hlavy při první lékařské prohlídce a po 4, 8 a 12 měsících.

Při práci pamatujte na to, že jména objektů v programu R jsou case-sensitive!

3. Zadání úlohy

Otázky:
1. Zjistěte, zda je rozdíl mezi porodními délkami u prvorozených a druhorozených dětí. Podobně posuďte rozdílnost porodních hmotností podle toho, zda se jedná nebo nejedná o první porod matky.
2. Testujte hypotézu, že za první rok od porodu děti přiberou 6 700 gramů a zopakujte test zvlášť pro chlapce a děvčata. Komentujte případný rozdíl či shodu.
3. Jsou chlapci ve 4 měsících věku vyšší než děvčata?
4. Zjistěte závislost výšky v jednom roce zvlášť na porodní výšce a hmotnosti v osmi měsících. Která z těchto dvou proměnných lépe vysvětluje výšku v jednom roce?
5. Vyšetřete závislost obvodu hlavy v jednom roce na následujícím modelu: hmotnost v jednom roce, výška v jednom roce, obvod hlavy v osmi měsících, věk matky, pohlaví. Lze tento model zjednodušit?
6. Dostane během prvního roku života otitidu více než čtvrtina dětí?