Základy biostatistiky & Aplikovaná statistika, LS 2001/2002
9. cvičení: analýza rozptylu, regresní přímka
data: kojeni.S0, popis v souboru kojeni.TXT
zopakovat jednu úlohu na analýzu rozptylu jednoduchého třídění, např. porovnat výšky otců podle vzdělání matky
nepřehlédnout významnost, lze interpretovat pomocí chyby prvního druhu
ukázka dvojného třídění
data cteni.S0
rychlost čtení (RYCHLOST) podle stylu písma (STYLY) a jeho velikosti (VELIKOST); STYL je jemnější dělení stylu písma (fontů)
Analysis | ANOVA | GLM ANOVA (obecnější procedura než Analysis of Variance, umožňuje volit použité interakce, umožňuje analýzu kovariance, u nevyváženého modelu součty čtverců III. typu)
Factors 1-4
- Response Variable(s): RYCHLOST
- Factor 1 Variable (A): VELIKOST Fixed
- Factor 2 Variable (B): STYLY, Fixed
interpretovat výsledek, zejména interakce
jako Factor 2 uvést STYL, znovu interpretovat
pokud bychom předem věděli, že interakce není třeba použít, můžeme je zakázat:
Model | Which Model Term: Up to 1-Way (pouze jednotlivé faktory, bez interakcí), NEBO
Model | Which Model Term: Custom a jako Custom Model nastavit vhodný model, zde A+B (model s interakcemi by byl A+B+AB)
regresní přímka
data: IQ3.S0
vysvětlit IQ pomocí průměrné známky ZN7
Analysis | Regression/Correlation | Linear Regression
- Variables
- Y: Dependent Valiable(s): IQ
- X: Independent Variable: ZN7
- Reports
- Desc. Stats
- Reg. Estimation
- R2 and r
- ANOVA
- Assumptions
- Y vs X Plot
- Resid vs X Plot
- Histogram Plot
- Prob Plot
- zrušit
Show Notes (může být nutné nejdříb roztáhnout okno šablony)
Format
interpretovat výsledky (zejména význam regresních koeficientů a jejich významnost, konfrontovat s grafickým znázorněním, Levenův test mi tak moc nevadí, při aspoň čtyřech skupinách už nevýznamný i na 20 %, přímka prochází těžištěm)
zopakovat pro pouze pro chlapce
- (Data) | Data | Filter
- Filter Statements: POHLAVI=0, Filter Systém Active, RUN
ověřit si, že filtr nastaven pomocí Help | About
Linear Regression: na listu Variables zaškrtnout Filter Active, RUN
výsledky poznamenat nebo uložit
totéž pro dívky, porovnat, diskutovat možné otázky
souvislost s dvouvýběrovým t-testem pro závislost IQ na POHLAVI (zrušit filtr!)
lze opakovat pro závislost na ZN8
rovnoběžné regresní přímky - závislost IQ na ZN7
Analysis | Regression/Correlation | Multiple Regression - 2001 Edition
- Variables
- Y: Dependent Variable(s): IQ
- X's: Numeric independent Variables: ZN7
- Reports:
- Display only those items that are CHECKED BELOW:
- Means - Std Dev's
- Correlations
- Equation
- ANOVA Summary
- Normality Tests
- Y-X's Plots
- Probabilty Plot
- Histogram
- interpretovat
případně přepočítat zvlášť pro chlapce a dívky (filrovat) , stačí připomenout
zrušit filtr, zrušit nastavení X (ZN7), nastavit kategorické X: POHLAVI, opět souvislost s dvouvýběrovým T-testem
nastavit obojí:
číselnou nezávisle proměnnou ZN7
kategorickou nezávisle proměnnou POHLAVI
interpretovat výsledek, zejména zda přidání informace o pohlaví vylepšilo vysvětlení závislosti, podobně pro ZN7
doplnit představu grafem Scatter Plots: Horizontal : ZN7, Vertical: IQ, Grouping: POHLAVI; vypadají přímky rovnoběžně?
opět Multiple Regression - 2001, upravit model:
Model
- Which Model Terms: Custom Model
- Custom Model: POHLAVI + ZN7 + POHLAVI*ZN7 (interakce)
intrerpretovat výsledek (neprokázali jsme nerovnoběžnost, vystačíme s rovnoběžkami), lze odtud zrekonstruovat obě individální přímky (pro chlapce a pro dívky)
regresní přímka - data: howell.s0
snažíme se vysvětlit velikost mozkovny velikostí
týlního úhlu
víme, že máme směs šesti výběrů (3 místa vers 2 pohlaví)
(Data) | Data | Filter
POPUL="AUSTR" (uvozovky jsou nutné, jinak předpokládá, že AUSTR je proměnná)
sex="M"
Keep Row If: Only if all statements are true (AND)
Filter Systém Active zaškrtnout
RUN
Analysis | Regression/Correlation | Linear Regression
- Variables: Y: Dependent Variable(s): GOL X: Independent Variable: OCA Filter Active zaškrtnout
- Reports: Desc. Stats, Reg. Estimation, ANOVA, Assumptions, Y vs X Plot, Resid vs X Plot, Histogram Plot, Prob Plot, zruš Show Notes
- Format: Variable Names: Both
- interpretovat výsledek, zejména nebrat za tak tragické NO u testu normality
samostatně opakovat pro různé kombinace faktorů POPUL a sex