Statistický projektový seminář (NMST551)

Arnošt Komárek

Podstránky

Domácí | Výuka | NMST552 |

Výuka zima

NMSA331 | NMST551 |

Výuka léto

NMAT362 | NMST412 | NMST431 |

Výuka, software

Rko |

Vedené práce

Diplomové práce | Bakalářské práce |

Statistický projektový seminář (NMST551)

Zimní semestr 2022–23

SIS stránky předmětu:    CZE    ENG

ROZVRH

Společná beseda: Pondělí 14:00 v Praktiku KPMS   

Společná výuka s RNDr. Matúšem Maciakem, Ph.D.

ANOTACE

Cílem projektového semináře je získání praxe v analýze reálných dat a zpracování výzkumné zprávy, tj., příprava odborného textu s výsledky statistické analýzy ve formě vědeckého článku. V průběhu semestru budeme postupně analyzovat jeden konkrétní datový soubor. Budeme diskutovat různé metody statistického zpracování, implementaci potřebných metod v programu R a postupně se budeme věnovat různým otázkám a problémům, které v souvislosti se zpracováním datového souboru nastanou.

Kromě samotné analýzy budeme diskutovat též způsob tvorby výzkumné zprávy, formulaci odborného textu a prezentaci statistických výsledků. V každém týdnu bude vyžadováno vypracování sady úloh (obvykle několik kroků potřebných ke zpracování konečné výzkumné zprávy).

Na konci semestru odevzdá každý student vlastní práci – vědecký odborný článek/výzkumnou zprávu vypracovanou na základě jednotlivých úloh zadávaných v průběhu semestru. Student zároveň vypracuje oponentský posudek na článek/zprávu jednoho z kolegů.

Formát výuky

  • Jednou týdně společná beseda
  • Každý týden samostatná domácí práce dle zadání
  • Postupné vypracování písemné zprávy
  • Na závěr vzájemná oponentura výzkumných zpráv

Zápočet
Každý týden vypracovat zadané úkoly, pokud je požadováno jejich odevzdání, v termínu je odevzdat. Koncem semestru odevzdat uspokojivou výzkumnou zprávu a zpracovat oponenturu na projekt kolegy(ně). Charakter zápočtu neumožňuje opravné termíny.

ZADÁNÍ PROJEKTU

Zotavení pacientů po mozkové mrtvici: porovnání čtyřech evropských rehabilitačních center. Podrobný popis studie, dat a cílů analýzy je zde (PDF, anglicky). Datové soubory jsou k dispozici v SISu (pro zapsané studenty po přihlášení). Další podrobnosti budou/byly sděleny během prvního semináře (pondělí 3.10. od 14:00 v Praktiku KPMS).

ÚKOLY PRO SAMOSTATNOU PRÁCI

Týden 1 (vypracovat do 10.10.2022)

Seznámit se s datovými soubory, porozumět a pochopit strukturu dat. Připravit R skript, který načte primární datové soubory (případně přeuložené ve formátu csv či jiném vhodném), provede základní kontroly konzistence, základní transformace (odvozené veličiny potřebné pro další práci, faktory, ...) a vše uloží v "longitudinálním" formátu ve formě jednoho data.frame. Zamyslet se nad postupy a kroky, které bude užitečné provést v rámci deskriptivní části analýzy v kontextu cílů analýzy.

Týden 2 (vypracovat do 17.10.2022)

Provést deskriptivní analýzu datového souboru (maje na paměti cíle hlavní analýzy). Vytvořit po jedné tabulce shrnující nejdůležitější výsledky deskriptivní analýzy pro vysvětlující proměnné, respektive pro možné vektory odezvy. Vytvořit jeden obrázek (ten nejdůležitější dle názoru analytika), na jehož základě bude možné dále diskutovat nad dalším postupem analýzy. Tabulky (dvě) a obrázek (jeden) umístit do dokumentu a zaslat ve formátu PDF mailem oběma vyučujícím (nejpozději v pondělí 17.10. v 6:00). Pro vlastní potřebu a zvažování dalšího postupu je možné (a je to i doporučeno) vytvořit více jak dvě tabulky a více jak jeden obrázek.

Týden 3 (vypracovat do 24.10.2022)

Vylepšit dříve vytvořené tabulky a obrázky a doplnit je o odstavec shrnující deskriptivní analýzu souboru. Rozšířený dokument zaslat ve formátu PDF mailem oběma vyučujícím (nejpozději v pondělí 24.10. v 6:00).

Týden 4 (vypracovat do 31.10.2022)

Vylepšit odstavec shrnující deskriptivní analýzu souboru, navrhnout statistický model/metodu, se kterou započne hlavní analýza. Návrh modelu/metody přidat do sekce "Methods". Rozšířený dokument zaslat ve formátu PDF mailem oběma vyučujícím (nejpozději v pondělí 31.10. v 6:00).

Týden 5 (vypracovat do 7.11.2022)

Pro navržený model napsat jasně, jaká veličina charakterizuje jednotlivá centra a bude použita k jejich porovnání. Příslušnou veličinu popsat matematicky i slovně (a pokud možno srozumitelně i pro nestatistika). Napsat, jakým způsobem bude tato veličina použita k porovnání center. Vše spolu s modelem vložit do dokumentu a ten zaslat ve formátu PDF mailem oběma vyučujícím (nejpozději v pondělí 7.11. v 6:00). Dále rozmyslet, zda jsme schopni navržený model odhadnout, případně budeme schopni ho odhadnout v blízké době. Potenciálně pro sebe zkusit odhadnout model, který neuvažuje žádné doplňkové vysvětlující proměnné a pomocí takového modelu provést "finální" porovnání jednotlivých center.

Týden 6 (vypracovat do 14.11.2022)

Upravit/vylepšit navržený model tak, aby zamýšlené porovnání jednotlivých center dávalo smysl. Současně by měl být vzat v potaz fakt, že na začátku studie mají jednotlivá centra různé složení pacientů co se závažnosti stavu týká. Zatím i nadále neuvažovat odlišnosti vzhledem k doplňkovým vysvětlujícím proměnným. Odhadnout navržený model (stačí sdělit, že model byl odhadnut, podrobné výsledky netřeba uvádět ve zprávě). Uvést, jak budou na základě vylepšeného modelu jednotlivá centra porovnána a porovnat je. Uvést p-hodnotu pro celkové srovnání ("ANOVA") a na jedné dvojici center ukázat, jak bude odlišnost mezi centry kvantifikována (srozumitelně i pro nestatistika).

Pokud navržený model uvažuje v nějakém smyslu linearitu, nakreslit alespoň jeden obrázek, ze kterého bude možné posoudit platnost tohoto předpokladu, provést formální statistický test (ve zprávě uvést, jak bylo otestováno a jaká vyšla p-hodnota).

Napsat první iteraci části "Methods" hlavní zprávy, ve které bude použitý postup (model, srovnání mezi centry) popsán "časopiseckým" stylem, tj. úsporně, s uvedením alespoň jedné reference.

Týden 7 (vypracovat do 21.11.2022)

Definitivně dopracovat model bez dalších vysvětlujících proměnných (model na týden 6). Následně zahrnout do tohoto modelu i další vysvětlující proměnné a pokusit se dobrat ke zcela finálnímu modelu. V "neoficiální" části zprávy napsat 2–3 věty o tom, jak se vybral finální model a napsat jeho tvar. Použít finální model k porovnání center a výsledky (pouze porovnání center!) uvést ve formě tabulky, která se později (po případných úpravách) objeví v hlavní zprávě.

Vylepšit část "Methods" hlavní zprávy. Vše zaslat e-mailem nejpozději v pondělí 21.11. v 6:00.

Týden 8 (vypracovat do 28.11.2022)

Podrobněji porovnat jednotlivá centra v čase (viz diskuze během semináře). Výsledky porovnání vhodnou formou vizualizovat a obrázek (dočasně?) umístit do části "Results" hlavní zprávy. Na základě zjištěného se rozhodnout o tom, jakým způsobem bude provedeno hlavní srovnání jednotlivých center. Toto srovnání provést, výsledky shrnout v tabulce. Rozdíly kvantifikovat pomocí (odhadů) parametru, který je interpretovatelný pro zdravotníka (odds ratio, ...).

Do části "Results" přidat větu/y, které shrnou, které proměnné byly sice uvažovány jako kontrolní, ale nakonec v modelu nejsou a to včetně vhodné kvantifikace jejich (ne)významnosti (viz diskuze během semináře).

Dopsat část "Methods" hlavní zprávy tak, že ji pisatel bude považovat za hotovou. Podrobnější popis modelu vložit jako apendix hlavní zprávy. Napsat tak, aby se i zde jednalo o text pro odbroné publikum, tj. vynechat vlastní poznámky apod. Vše zaslat e-mailem nejpozději v pondělí 28.11. v 6:00.

Týden 9 (vypracovat do 5.12.2022)

Dopsat části "Results" a "Conclusions/Discussion" hlavní zprávy tak, že je pisatel bude považovat za hotové. Celou zprávu zaslat e-mailem nejpozději v pondělí 5.12. v 6:00.

Týden 10 (vypracovat do 12.12.2022)

Dopsat části "Introduction" a "Abstract" hlavní zprávy tak, že je pisatel bude považovat za hotové. Celou zprávu zaslat e-mailem nejpozději v pondělí 12.12. v 6:00.

Týden 11 (vypracovat do 19.12.2022)

Dopsat celou hlavní zprávu tak, že ji pisatel bude považovat za hotovou. Celou zprávu zaslat e-mailem nejpozději v pondělí 19.12. v 6:00.

Týden 12 (vypracovat do 31.12.2022, 20:22)

Napsat recenzní posudek na přidělenou práci kolegy(ně). Recenzní posudek zaslat e-mailem ještě letos, nejpozději ve 20:22.

Vzorové posudky:     PDF1     PDF2     PDF3

MOTTO NA ZÁVĚR

The fundamental purpose of scientific discourse is not the mere presentation of information and thought, but rather its actual communication. It does not matter how pleased an author might be to have converted all the right data into sentences and paragraphs; it matters only whether a large majority of the reading audience accurately perceives what the author had in mind.

George Gopen and Judith Swan

 

View My Stats