# 10. cvičení - KORELACE, REGRESE # # nakopírovat cvic10.R do pracovního adresáře # nastavit pracovní adresář # # spustit R v režimu SDI # otevřít cvic10.R jako script file library(RcmdrPlugin.TeachingDemos) # # ukázky bodového diagramu: simulovaná data v rávislosti na rho # Demos | Simple correlation # měnit hodnotu (populačního) korelačního koeficientu # sledovat změny mraku bodů # # podat Kojeni # # Graphs | Scatterplot # (možno použít jitter pro obě osy - uměle odstraní vliv zaokrouhlování) # vyska.m, vyska.o # Statistics | Summaries | Correlation matrix # vyska.m, vyska.o # Statistics | Summaries | Correlation test # vyska.m, vyska.o # upozornit na souvislost p-hodnoty a intervalu spolehlivosti # (POZOR, interval je jen přibližný, v mezní situaci si nemusí # test a interval odpovídat) # zdůraznit rozdíl mezi testem nezávislosti a párovým testem # # Spearmanův například pro závislost věku rodičů # Graphs | Scatterplot # asi vhodné dovolit Jitter, dojem silnější závislosti # možno pro zajímavost nechat spočítat i Pearsonův # Statistics | Summaries | Correlation test Spearman!! # nemožnost spočítat p-hodnotu přesně nemusí vadit, # byla by (nejspíš) ještě menší # pozn. S ve výstupu je aproximace pro sum((R_i-Q_i)^2), # v případě shod ne přímo tato hodnota, pocitana # z hodnoty rR; proto divná desetinná místa # # některé korelace raději zvlášť pro jednotlivá pohlaví # připravit data pouze s dívkami: KojeniD # pouze divky: # Data | Active .. | Subset .. hoch==0, KojeniF # doporučuji data uložit # # Graphs | Scatterplot matrix # veličin delka, hmotnost, vyska.o, vyska.m # zruš smooth, nastav LS line, histogram # Statistics | Summaries | Correlation matrix # jako protějšek k matici grafů, porovnat # # Statistics | Summaries | Correlation test # veličin delka, hmotnost # veličin por.delka, por.hmotnost # veličin delka, vyska.m # # REGRESE # # nejprve sami generovat data a nechat si počíta přímku # Demos | Simple linear regression # zůstat raději u jednoho pohlaví, totiž u děvčat # # Graphs | Scatterplot | por.delka (x) delka (y), bez smooth line # zkus přidat jitter pro obě souřadnice # Statistics | Fit models | Linear regression .. delka ~ por.delka # interpretace, zejména významnost směrnice # ZVOL označení modelu, ukaž, kde se objevilo # Models | Confidence intervals # jak by dopadl test H0: beta1 = 1 ? # jakou má tato hypotéza interpretaci? # Models | Hypothesis tests | ANOVA table | Type I # souvislost s R2, souvislost s testem nulovosti směrnice # jaký je celkový součet čtverců? (sečti Sum Sq) # (možná kontrola: Residuals v anova(lm(delka~1,data=KojeniF)) # v Commandelu lze jako lin. model, kde na pravé straně je jen 1, # pak Models | Hypothesis tests | ANOVA) # ověření předpokladů: musí být nastaven hodnocený model! # Models | Graphs | Basic diagnostic ... # # nebo (jen když zbude dost času) # Models | Numerical diag.. | Breusch-Pagan .. | Studentized .. # nechat fitted values, ostatní možnosti jsou # proti specifickým alternativám # (homoskedasticita) # k ověření normality je třeba neprve připravit rezidua: # Models | Add observation statisticstics .. | Residuals | # Statistics | Summaries | Shapiro-Wilk .. | residuals.MODEL ... # doporučuji pak rezidua smazat: # Data | Manage variables ...| Delete variables ... # # # alternativní data IQ3 # # zn7, zn8 známky v pololetí 7. resp. 8. trídy # iq hodnota IQ měřená jednoduchým testem # Gender pohlaví # # závislost IQ na průměru v 7. třídě bez ohledu na pohlaví # Graphs | Scatterplot matrix | iq, zn7, zn8 # bez Smooth, normal QQ plots nebo histograms # (diskutovat např. znaménka korelačních koeficientů) # Statstics | Summaries € Correlation matrix # # Statistics | Fit models | Linear regression modelIqZn7, iq, zn7 # Models | Hypthesis tests | ANOVA (kvůli diskusi o R^2) # Models | Graphs | Basic dignostics ... # případně také (není nutno) # Models | Numerical diagnostics | Breusch-Pagan ... # Models | Add ... zvol jen Residuals # Statististics | Summary | Shapiro-Wilk ... residuals.iq_zn7 # nebo přímo shapiro.test(residuals(iq_zn7)) # # závislost zvlášť pro chalpce a pro dívky: # # Statistics | Fit models | modelIqZn7Hosi, iq, zn7, Gender=="M" # Models | Graphs | Basic dignostics ... # Models | Numerical diagnostics | Breusch-Pagan ... # následující příkaz nelze takto snadno použít # # závislost IQ na průměru v 7. třídě u dívek # Graphs | Scatterplot | iq~zn7 | iq~zn7 bez Smooth Gender=="F" # Statistics | Fit models | iq_zn7M, iq, zn7, Gender=="F" # Models | Graphs | Basic dignostics ... # # porovnání přímek u hochů a dívek bude možné pomocí # mnohonásobné lineární regrese #