# přednáška o multinomickém rozdělení rm(list=ls()) data(Kojeni) summary(Kojeni) attach(Kojeni) chisq.test(Plan,Vzdelani) chisq.test(Plan,Vzdelani)$expected # jiný postup: (tab <- table(Plan,Vzdelani)) # nebo (nepotřebuje attach()) (tab <- xtabs(~Plan+Vzdelani,data=Kojeni)) addmargins(tab) chisq.test(tab) # # předvolební průzkum (tab = matrix(c(11,6,4,9),2,2)) chisq.test(tab,cor=FALSE) (t = addmargins(tab)) (phi = (t[1,1]*t[2,2]-t[1,2]*t[2,1])/sqrt(t[1,3]*t[2,3]*t[3,1]*t[3,2])) # vzdělání snoubenců (tab = matrix(c(24,7,3,12,24,9,3,3,15),3,3)) chisq.test(tab) # # souvislost zda plánované a délky kojení podle místa porodu addmargins(tab <- xtabs(~(trvani==24)+Plan,data=Kojeni)) chisq.test(tab) chisq.test(tab,correct=FALSE) chisq.test(tab)$expected fisher.test(tab) addmargins(tab <- xtabs(~(trvani==24)+Plan,subset=Porodnice=="venkov",data=Kojeni)) chisq.test(tab) fisher.test(tab) # # Simpsonův paradox # addmargins(tabVenkov <- matrix(c(34,28,5,2),2,2)) addmargins(tabMěsto <- matrix(c(4,6,29,35),2,2)) # výpočet čtyřpolního korelačního koeficientu: phi = function(t){ a = t[1,1]; b = t[1,2]; c = t[2,1]; d =t[2,2] numerator = a*d - c*b denominator = sqrt((a+b)*(c+d)*(a+c)*(b+d)) phi = numerator/denominator return(phi) } phi(tabVenkov) phi(tabMěsto) phi(tabVenkov+tabMěsto) # # bodově biseriální korelační koeficient # data(Vysky) summary(Vysky) t.test(vyska~Pohlavi,data=Vysky,var.eq=TRUE) cor.test(~vyska+pohlavi,data=Vysky) cbind(Vysky$vyska,Vysky$pohlavi) # # ukázka dat ke zkoušce # Data = read.csv2("data/data999.csv") summary(Data) attach(Data) mean(x) # PROBLÉM ??????????? x # 1. možnost: mean(x,na.rm=TRUE) # 2. možnost: x = x[1:9] # vybere jen prvních 9 hodnot mean(x)