#	přednáška o multinomickém rozdělení
rm(list=ls())
data(Kojeni)
summary(Kojeni)
attach(Kojeni)
chisq.test(Plan,Vzdelani)
chisq.test(Plan,Vzdelani)$expected
#	jiný postup:
(tab <- table(Plan,Vzdelani))
#	nebo (nepotřebuje attach())
(tab <- xtabs(~Plan+Vzdelani,data=Kojeni))
addmargins(tab)
chisq.test(tab)
#
#	souvislost zda plánované a délky kojení podle místa porodu
addmargins(tab <- xtabs(~(trvani==24)+Plan,data=Kojeni))
chisq.test(tab)
chisq.test(tab,correct=FALSE)
chisq.test(tab)$expected
fisher.test(tab)
addmargins(tab <- xtabs(~(trvani==24)+Plan,subset=Porodnice=="venkov",data=Kojeni))
chisq.test(tab)
fisher.test(tab)
#
#	Simpsonův paradox
#
addmargins(tabVenkov <- matrix(c(34,28,5,2),2,2))
addmargins(tabMěsto <- matrix(c(4,6,29,35),2,2))
#	výpočet čtyřpolního korelačního koeficientu:
phi = function(t){
	a = t[1,1]; b = t[1,2]; c = t[2,1]; d =t[2,2]
	numerator = a*d - c*b
	denominator = sqrt((a+b)*(c+d)*(a+c)*(b+d))
	phi = numerator/denominator
return(phi)
}
phi(tabVenkov)
phi(tabMěsto)
phi(tabVenkov+tabMěsto)
#
#	bodově biseriální korelační koeficient
#
data(Vysky)
summary(Vysky)
t.test(vyska~Pohlavi,data=Vysky)
cor.test(~vyska+pohlavi,data=Vysky)
cbind(Vysky$vyska,Vysky$pohlavi)
#
#	ukázka dat ke zkoušce	
#
Data = read.csv2("data/data999.csv")
summary(Data)
attach(Data)
mean(x)		#	PROBLÉM ???????????
x
#	1. možnost:
mean(x,na.rm=TRUE)
#	2. možnost:
x = x[1:9]		#	vybere jen prvních 9 hodnot
mean(x)