Základy biostatistiky & Aplikovaná statistika, LS 2001/2002
6. cvičení: základní pojmy statistického rozhodování, testy o jednom výběru, párové testy
data: Cvic.S0, popis v souboru CVIC.TXT
popisné statistiky pro výšku desetiletých hochů
Descriptive Statistics | Descriptive Stats
Summary, Means, Variation, Quartile, Stem-Leaf, Probability , Histogram
interpretace, zejména směr. odchylka vers. střední chyba, intervaly spolehlivosti pro mi, sigma, sigma na druhou, nevhodnost histogramu pro málo pozorování
jednovýběrový t-test H0: mi = 136.1, obous
tranná alternativa
- Analysis | T-Tests | One-Sample T-Test
- Variables | Response Var. : CHLAPCI | Ho Value: 136.1
- Reports | Variable Names: Labels | pouze Probability Plot
- interpretovat zejména výsledek t-testu: VOLÍME POUZE JEDEN ŘÁDEK podle předem zvolené alternativy, diskutovat možné další alternativy, jak by to dopadlo
- POZOR, na přednášce původně tato úloha se známým rozptylem, proto jiný výsledek
- interpretace intervalu spolehlivosti jako množiny těch mi0, pro které bychom H0 nezam
ítli
- zkusit nastavit H0 na 135 nebo 143
- test předpokladů (zde normální rozdělení) jako ověření našeho předpokladu, zamítnutí spíš varování než zákaz, srovnej s pravděpodobnostním diagramem
podobně pro výšky dívek, stejná H0, oboustranná alternativa
studenti samostatněji
podobně pro TEPLOTA (vysvětlení v CVIC.TXT) H0: mi = 28
interpretovat zejména při oboustranné alternativě
zde nemáme zkušenost (jako u výšky), že data mají normální rozdělení, proto (i když test normality bez problémů) zkusíme postupy, které normalitu nevyžadují
Reports | nastav také Nonparametric Report
při interpretaci výsledků připomenout jak se tvoří kritický obor: obsahuje výsledky, které svědčí spíš pro alternativu než pro hypotézu, velikost stanovíme tak, aby chyba 1. druhu nejvýš s pravděpodobností alfa
znaménkový test (sign) porovnává počet naměřených hodnot menších než mi0 s počtem hodnot větších
Wilcoxonův test navíc bere v úvahu, že některá měření jsou k mi0 blíže, jiné dál, neměří ale jak daleko
zvláště při menších počtech pozorování je lépe vzít opatrnější výstup s opravou na spojitost
zkusmo spočítat neparametrické testy také pro výšky dívek
párové testy jako testy pro rozdíly hodnot uvnitř párové závislých měření
porovnat sílu stisku u leváků (STISKL, STISKP)
- Variables | Response: STISKL, Paired: STISKP , Ho Value 0 (NEZAPOMENOUT)
- interpretovat výsledky: popisné statistiky jednotlivých veličin (marginální), u rozdílů má interval spolehlivosti zajímavou interpretaci
- ověření předpokladu normality (v neznámé situaci jako rada, jak dál, ve známé jen jako možné varování)
- porovnejte p-hodnoty při trojích alternativách; máte vysvětlení?
- co vyjde, když zaměníme pořadí veličin STISKL, STISKP? (vyzkoušet)
test o pravděpodobnosti alternativního (binomického) rozdělení
lze hrací kostku, u které nám ve 30 hodech padla šestka 8 krát, považovat za symetrickou?
Analysis | Other | One Proportion
Sample Size (n): 30, Number of Successes (X): 8, Hypothesized Proportion (P0): 0.166667
nebereme v úvahu výsledek Normal Approximation using (P)
interpretovat, kdy má smysl jednostranná alternativa?
opakovat pro dvojnásobky (60 a 16) a trojnásobky (90 a 24), porovnat výsledky
příklad Kalous (skripta str. 90)
n=50, X=33, P0=0.5, jednostranná alternativa
ve skriptech není použita oprava na spojitost
pokud by zbyl čas, tak lze se vrátit k sčítání rovnoměrných (výsledkem přibližně normální)