# přednáška o multinomickém rozdělení rm(list=ls()) data(Kojeni) summary(Kojeni) attach(Kojeni) chisq.test(Plan,Vzdelani) chisq.test(Plan,Vzdelani)$expected # jiný postup: (tab <- table(Plan,Vzdelani)) # nebo (nepotřebuje attach()) (tab <- xtabs(~Plan+Vzdelani,data=Kojeni)) addmargins(tab) chisq.test(tab) # # souvislost zda plánované a délky kojení podle místa porodu addmargins(tab <- xtabs(~(trvani==24)+Plan,data=Kojeni)) chisq.test(tab) chisq.test(tab,correct=FALSE) chisq.test(tab)$expected fisher.test(tab) addmargins(tab <- xtabs(~(trvani==24)+Plan,subset=Porodnice=="venkov",data=Kojeni)) chisq.test(tab) fisher.test(tab) # # Simpsonův paradox # addmargins(tabVenkov <- matrix(c(34,28,5,2),2,2)) addmargins(tabMěsto <- matrix(c(4,6,29,35),2,2)) # výpočet čtyřpolního korelačního koeficientu: phi = function(t){ a = t[1,1]; b = t[1,2]; c = t[2,1]; d =t[2,2] numerator = a*d - c*b denominator = sqrt((a+b)*(c+d)*(a+c)*(b+d)) phi = numerator/denominator return(phi) } phi(tabVenkov) phi(tabMěsto) phi(tabVenkov+tabMěsto) # # bodově biseriální korelační koeficient # data(Vysky) summary(Vysky) t.test(vyska~Pohlavi,data=Vysky) cor.test(~vyska+pohlavi,data=Vysky) cbind(Vysky$vyska,Vysky$pohlavi) # # ukázka dat ke zkoušce # Data = read.csv2("data/data999.csv") summary(Data) attach(Data) mean(x) # PROBLÉM ??????????? x # 1. možnost: mean(x,na.rm=TRUE) # 2. možnost: x = x[1:9] # vybere jen prvních 9 hodnot mean(x)