1# 11. přednáška 6. ledna 2014 # rm(list=ls()) ## ## volební preference ## (nnn = matrix(c(11,6,4,9),2,2)) rownames(nnn) = c("VŠ","ne VŠ") colnames(nnn) = c("strana A","strana B") addmargins(nnn) (phi = (11*9-4*6)/sqrt(15*15*17*13)) # (n = sum(nnn)) (chi2 = n*(11*9-4*6)^2/(15*15*17*13)) n*phi^2 chisq.test(nnn,cor=FALSE) (chi2Yates = sum(nnn)*(abs(11*9-4*6)-n/2)^2/(15*15*17*13)) chisq.test(nnn) # fisher.test(nnn) # ######################################################################## # # Lorenzova křivka # vinice = c(0,100,1000,900) rozloha = c(10000,20000,10000,15000) names(rozloha)=names(vinice)=c("A","B","C","D") data.frame(rozloha,vinice) hustota = vinice/rozloha data.frame(rozloha,vinice,hustota) # ord = order(hustota) # hustota URČÍ POŘADÍ!!!! data.frame(rozloha,vinice,hustota)[ord,] # data.frame(rozloha[ord]/sum(rozloha),vinice[ord]/sum(vinice)) rozlohaRel<-cumsum(rozloha[ord]/sum(rozloha)) viniceRel<-cumsum(vinice[ord]/sum(vinice)) data.frame(rozlohaRel,viniceRel) plot(x=c(0,rozlohaRel),y=c(0,viniceRel),pch=3,asp=1) lines(x=c(0,1,1,0,0),y=c(0,0,1,1,0),col="grey") lines(x=c(0,rozlohaRel),y=c(0,viniceRel),lwd=2) lines(x=c(0,1),y=c(0,1)) # library(ineq) plot(Lc(hustota,rozloha)) # giniW <- function(yPrum,x=rep(1,length(yPrum))){ permutace <- order(yPrum); k <- length(yPrum) yPrum <- yPrum[permutace]; x <- x[permutace] Xrel <- cumsum(x)/sum(x); Yrel <- cumsum(x*yPrum)/sum(x*yPrum) gini <- sum(Xrel[-k]*Yrel[-1]-Xrel[-1]*Yrel[-k]) return(gini=gini) } # giniW(hustota,rozloha) # ####################################################################### # # jednovýběrový t-test # data(Kojeni); attach(Kojeni) # Co lze říci o tvrzení, že průměrná výška VŠECH matek # je rovna 165 cm? t.test(vyskaM,mu=165) # # Co sděluje interval spolehlivosti? # ####################################################################### # # dvouvýběrový a párový t-test # # Mají chlapci a dívky ve 24. týdni věku stejnou délku? # (Čeho se týká dotaz? CELÝCH POPULACÍ CHLAPCŮ A DÍVEK) (hosi = delka[HochL]) (divky = delka[!HochL]) shapiro.test(hosi) shapiro.test(divky) var.test(hosi,divky) t.test(hosi,divky,var.equal=FALSE) # # Jsou otcové (v populačním průměru) o více než o 12 cm # vyšší než matky? t.test(vyskaO,vyskaM,paired=TRUE,mu=12,alternative="greater") # ####################################################################### # # korelační koeficient # # Závisí spolu výška otce a výška matky? cor.test(vyskaO,vyskaM) # ####################################################################### # # Pokuste se prokázat, že hmotnost ve 24. týdnu věku závisí # na porovní hmotnosti plot(hmotnost~porHmotnost) summary(lm(hmotnost~porHmotnost)) abline(lm(hmotnost~porHmotnost)) plot(lm(hmotnost~porHmotnost)) # ####################################################################### # # Chí-kvadrát test dobré shody # # V souboru Kojeni jsou údaje o vzdělání matek. # Předpokládejme, že v příslušném věkovém rozmezí žen # je 25 % žen se základním vzděláním, 55 % s maturitou # a 20 % žen s vysokoškolským vzděláním. # Lze za platnosti tohoto předpokladu matky ze souboru Kojení # považovat za reprezentativní vzorek potenciálních matek? (nn = table(Vzdelani)) chisq.test(nn,p=c(0.25,0.55,0.20)) chisq.test(nn,p=c(0.25,0.55,0.20))$expected # ####################################################################### # # kontingenční tabulka # # Pokuste se prokázat souvislost mezi vzděláním matky # a odpovědí na otázku, zdy těhotenství bylo plánované. (nn = table(Vzdelani,Plan)) addmargins(nn) chisq.test(nn) chisq.test(nn)$expected # ########################################################################