# 9. přednáška 9. prosince 2013 # rm(list=ls()) # data(GaltonSyn) summary(GaltonSyn) attach(GaltonSyn) (průměrOtec = mean(otec)) (průměrSyn = mean(syn)) plot(syn~otec,pch=3,col=ifelse((otec-průměrOtec)*(syn-průměrSyn)>0,"black","red")) abline(v=průměrOtec,h=průměrSyn,lty=3) sum((otec-průměrOtec)*(syn-průměrSyn)>0) sum((otec-průměrOtec)*(syn-průměrSyn)<0) cor(otec,syn) cor.test(otec,syn) # data(EU2010) summary(EU2010) attach(EU2010) plot(emiseCO2~HDP,pch=3) qqnorm(emiseCO2) qqline(emiseCO2) shapiro.test(emiseCO2) qqnorm(HDP) qqline(HDP) shapiro.test(HDP) cor.test(emiseCO2,HDP,method="spearman") cor.test(emiseCO2,HDP) cor.test(emiseCO2,HDP,method="pearson") cor(rank(emiseCO2),rank(HDP)) # cor.test(~emiseCO2+HDP) cor.test(~emiseCO2+HDP,subset=země!="LU") # plot(syn~otec,pch=3) # plot(syn~otec,pch=3) abline(m<-lm(syn~otec)) a = 65; b = 75 aHat = predict(m,newdata=list(otec=a)) bHat = predict(m,newdata=list(otec=b)) points(a,aHat,pch=16,col="red") points(b,bHat,pch=16,col="red") (bHat-aHat)/(b-a) summary(lm(syn~otec)) # abline(v=průměrOtec,h=průměrSyn,lty=3) # points(průměrOtec,průměrSyn,pch=3,cex=3,col="red") anova(lm(syn~otec)) # celková variabilita k vysvětlení (ST = sum((syn-průměrSyn)^2)) # reziduální součet čtverců (různé možnosti výpočtu) # model získaný pomocí lm(syn~otec) si uložíme do m # bude tak míň psaní m = lm(syn~otec) (SE = deviance(m)) sum((syn-fitted(m))^2) sum(resid(m)^2) (R2 = 1 - SE/ST) # některé možnosti ověření předpokladů shapiro.test(rstandard(m)) library(lmtest) # další knihovna bptest(m) plot(m) # par(mfrow=c(1,2)) plot(emiseCO2~HDP,pch=3) plot(log(emiseCO2)~log(HDP),pch=3) detach(EU2010) # data(Duchody) summary(Duchody) plot(starobníDůchod~rok,data=Duchody) summary(a<-lm(starobníDůchod~rok,data=Duchody)) abline(a) lines(with(Duchody,loess.smooth(rok,starobníDůchod, degree = 2, span = 1/3)),col="red") with(Duchody,plot(rok,residuals(a),type="b")) library(lmtest) dwtest(a)