Základy biostatistiky & Aplikovaná statistika, LS 2001/2002
10. cvičení: regrese, písemka
data: IQ3.S0, policie.S0
zopakovat jednu úlohu na regresní přímku: závislost
vysvětlit IQ pomocí průměrné známky ZN8
- Analysis | Regression/Correlation | Multiple Regression - 2001 Edition
- Variables
- Y: Dependent Variable(s): IQ
- X's: Numeric independent Variables: ZN8
- Reports:
- Display only those items that are CHECKED BELOW:
- Means - Std Dev's
- Correlations
- Equation
- ANOVA Summary
- Normality Tests
- Y-X's Plots
- Probabilty Plot
- Histogram
- interpretovat
rovnoběžné regresní přímky - závislost IQ na ZN7
- Analysis | Regression/Correlation | Multiple Regression - 2001 Edition
- Variables
- Y: Dependent Variable(s): IQ
- X's: Numeric independent Variables: (prázdné)
- X's: Categorical Independent Variables: POHLAVI
- Reports:
- Display only those items that are CHECKED BELOW:
- Means - Std Dev's
- Correlations
- Equation
- ANOVA Summary
- Normality Tests
- Y-X's Plots
- Probabilty Plot
- Histogram
- Format: Alpha of Assumptions: 0.050
- interpretovat (máme tnovu t-test)
- nastavit ve Variables obojí:
- číselnou nezávisle proměnnou ZN7
- kategorickou nezávisle proměnnou POHLAVI
- interpretovat výsledek, zejména zda přidání informace o pohlaví vylepšilo vysvětlení závislosti, podobně pro ZN7
- doplnit představu grafem Scatter Plots: Horizontal : ZN7, Vertical: IQ, Grouping: POHLAVI; vypadají přímky rovnoběžně?
- opět Multiple Regression - 2001, upravit model:
- Model
- Which Model Terms: Custom Model
- Custom Model: POHLAVI + ZN7 + POHLAVI*ZN7 (interakce)
- intrerpretovat výsledek (neprokázali jsme nerovnoběžnost, vystačíme s rovnoběžkami), lze odtud zrekonstruovat obě individální přímky (pro chlapce a pro dívky)
- podle časových možností zkusit vysvětlení reakční doby pomocí diastolického tlaku a pulsu
regresní přímka - data: policie.s0
snažíme se vysvětlit hmotnost muže z jeho výšky, případně také procenta tuku
- Analysis | Regression/Correlation | Multiple Regression - 2001 Edition
- Variables
- Y: Dependent Variable(s): WEIGHT
- X's: Numeric independent Variables: HEIGHT
- interpretovat odhady, uložit
- přidat k nezávisle proměnným FAT, porovnat s předchozí úlohou
písemka:
- přidělit studentům na cvičení pořadová čísla z rozmezí 1 až 20 (označme jako j)
- vyčistit soubor Log, zapsat do něho pro kontrolu jméno a příjmení studenta, jeho pořadové číslo
- uložit jako soubor se jménem PrijmeniJmeno.S0 do adresáře vedoucího cvičení (kde právě jste)
- podat datový soubor deti_tst.S0, vyhledat proměnnou selx, kde x je pořadové číslo cvičení, kde právě jste (Zvára 1-2, Betinec 3, Hlubinka 4-5, Kalina 6-7)
- nastavit filtr s podmínkou selx=j, spustit jej (místo x opět číslici podle počadí cvičení)
- Porovnejte výšky chlapců a dívek v jednom roce (VYSKA4). Na další konkrétní otázky odpovězte tak, že ve výstupu ponecháte potřebnou část výstupu a nepotřebný výstup smažete. Doplňte vlastní slovní komentář. Nakonec připojte svůj upravený text na konec zápisníku Log.
- úloha1: Na 5% hladině rozhodněte, zda se výškou v jednom roce liší chlapci a děvčata. Rozhodnutí o použité statistické metodě podrobně vysvětlete. Nezapomeňte na grafické znázornění.
- úloha 2: Uveďte, zda v datech je větší variabilita výšek u chlapců nebo u děvčat.
- úloha 3: Uveďte interval spolehlivosti pro populační průměr výšek chlapců a slovy vyjádřete jeho interpretaci.
- úloha 4: Porovnejte porodní délku dívek podle příslušnosti ke třem krajům. Lze na 5% hladině prokázat rozdíl? (Nezapomeňte na přidání podmínky do filtru)
- Po ukončení práce soubor Log uložte znovu pod svým jménem. Musíte přitom souhlasit s tím, že přepíšete starou verzi souboru.