Základy biostatistiky & Aplikovaná statistika, LS 2001/2002
9. cvičení: analýza rozptylu, regresní přímka
data: kojeni.S0, popis v souboru kojeni.TXT
zopakovat jednu úlohu na analýzu rozptylu jednoduchého třídění, např. porovnat výšky otců podle vzdělání matky
- nepřehlédnout významnost, lze interpretovat pomocí chyby prvního druhu
ukázka dvojného třídění
data cteni.S0
rychlost čtení (RYCHLOST) podle stylu písma (STYLY) a jeho velikosti (VELIKOST); STYL je jemnější dělení stylu písma (fontů)
- Analysis | ANOVA | GLM ANOVA (obecnější procedura než Analysis of Variance, umožňuje volit použité interakce, umožňuje analýzu kovariance, u nevyváženého modelu součty čtverců III. typu)
- Factors 1-4
- Response Variable(s): RYCHLOST
- Factor 1 Variable (A): VELIKOST Fixed
- Factor 2 Variable (B): STYLY, Fixed
- interpretovat výsledek, zejména interakce
- jako Factor 2 uvést STYL, znovu interpretovat
- pokud bychom předem věděli, že interakce není třeba použít, můžeme je zakázat:
- Model | Which Model Term: Up to 1-Way (pouze jednotlivé faktory, bez interakcí), NEBO
- Model | Which Model Term: Custom a jako Custom Model nastavit vhodný model, zde A+B (model s interakcemi by byl A+B+AB)
regresní přímka
data: IQ3.S0
vysvětlit IQ pomocí průměrné známky ZN7
- Analysis | Regression/Correlation | Linear Regression
- Variables
- Y: Dependent Valiable(s): IQ
- X: Independent Variable: ZN7
- Reports
- Desc. Stats
- Reg. Estimation
- R2 and r
- ANOVA
- Assumptions
- Y vs X Plot
- Resid vs X Plot
- Histogram Plot
- Prob Plot
- zrušit Show Notes (může být nutné nejdříb roztáhnout okno šablony)
- Format
- interpretovat výsledky (zejména význam regresních koeficientů a jejich významnost, konfrontovat s grafickým znázorněním, Levenův test mi tak moc nevadí, při aspoň čtyřech skupinách už nevýznamný i na 20 %, přímka prochází těžištěm)
- zopakovat pro pouze pro chlapce
- (Data) | Data | Filter
- Filter Statements: POHLAVI=0, Filter Systém Active, RUN
- ověřit si, že filtr nastaven pomocí Help | About
- Linear Regression: na listu Variables zaškrtnout Filter Active, RUN
- výsledky poznamenat nebo uložit
- totéž pro dívky, porovnat, diskutovat možné otázky
- souvislost s dvouvýběrovým t-testem pro závislost IQ na POHLAVI (zrušit filtr!)
- lze opakovat pro závislost na ZN8
rovnoběžné regresní přímky - závislost IQ na ZN7
- Analysis | Regression/Correlation | Multiple Regression - 2001 Edition
- Variables
- Y: Dependent Variable(s): IQ
- X's: Numeric independent Variables: ZN7
- Reports:
- Display only those items that are CHECKED BELOW:
- Means - Std Dev's
- Correlations
- Equation
- ANOVA Summary
- Normality Tests
- Y-X's Plots
- Probabilty Plot
- Histogram
- interpretovat
- případně přepočítat zvlášť pro chlapce a dívky (filrovat) , stačí připomenout
- zrušit filtr, zrušit nastavení X (ZN7), nastavit kategorické X: POHLAVI, opět souvislost s dvouvýběrovým T-testem
- nastavit obojí:
- číselnou nezávisle proměnnou ZN7
- kategorickou nezávisle proměnnou POHLAVI
- interpretovat výsledek, zejména zda přidání informace o pohlaví vylepšilo vysvětlení závislosti, podobně pro ZN7
- doplnit představu grafem Scatter Plots: Horizontal : ZN7, Vertical: IQ, Grouping: POHLAVI; vypadají přímky rovnoběžně?
- opět Multiple Regression - 2001, upravit model:
- Model
- Which Model Terms: Custom Model
- Custom Model: POHLAVI + ZN7 + POHLAVI*ZN7 (interakce)
- intrerpretovat výsledek (neprokázali jsme nerovnoběžnost, vystačíme s rovnoběžkami), lze odtud zrekonstruovat obě individální přímky (pro chlapce a pro dívky)
regresní přímka - data: howell.s0
snažíme se vysvětlit velikost mozkovny velikostí týlního úhlu
víme, že máme směs šesti výběrů (3 místa vers 2 pohlaví)
- (Data) | Data | Filter
- Filter Statements:
- POPUL="AUSTR" (uvozovky jsou nutné, jinak předpokládá, že AUSTR je proměnná)
- sex="M"
- Keep Row If: Only if all statements are true (AND)
- Filter Systém Active zaškrtnout
- RUN
- Analysis | Regression/Correlation | Linear Regression
- Variables: Y: Dependent Variable(s): GOL X: Independent Variable: OCA Filter Active zaškrtnout
- Reports: Desc. Stats, Reg. Estimation, ANOVA, Assumptions, Y vs X Plot, Resid vs X Plot, Histogram Plot, Prob Plot, zruš Show Notes
- Format: Variable Names: Both
- interpretovat výsledek, zejména nebrat za tak tragické NO u testu normality
- samostatně opakovat pro různé kombinace faktorů POPUL a sex