(NMST 551) Statistický projektový seminář
St: 12:20 - 13:50 | @Praktikum KPMS
Všeobecné informácie
Hlavným cieľom Statistického projektového semináru -- NMST551 je získanie praxe v štatistickej analýze reálných dat a následne vypracovanie výzkumnej zprávy -- t.j. príprava odborného textu s výsledkami analýzy vo forme komplexnho vedeckého článku. Počas semestra budú študenti pracovať na jednom konkrétnom probléme (datovy súbor), ktorý ma za cieľ zodpovedať na explicitne formulované vedecké/odborné hypotézy. V priebehu semestra bude preto postupne nutne jednak spracovať a pripraviť data na analýzu, štatistický data analyzovať (t.j., popisné charakteristiky, diskusia nad rôznymi metódami štatistikej analýzy a voľba vhodného pravdepodobnostného/stochastického modelu), implementovať jednotlivé metódy v programe R a vypracovať záverečnú správu s výsledkami analýzy (so všetkými potrebnými formálnymi náležitosťami, ktoré sú neoddeliteľnou súčasťou dobrého vedeckého článku) a interpretáciou.
Na tejto stránke bude postupne zverejňovaný a priebežne aktualizovaný zoznam špecifických úloh, ktoré bude nutné v danom týždni vypracovať.
Na konci semestru každý študent odovzdá finálny článok -- odborný vedecký text (resp. výskumná správa), vypracovaný podľa jednotlivých úloh, zadávaných v priebehu semetra. Súčastou získania zápočtu je aj vypracovanie stručného oponentského posudku na članok jedného z kolegov/spolužiakov.
Formát výuky
- Jednou týdně společná beseda
- Každý týden samostatná práce dle zadání
- Postupné vypracování písemné zprávy
- Na závěr vzájemná oponentura výzkumných zpráv
Zadanie projektu pre Zimný semester 2023/2024
Inclussion and exclussion of albino individuals by a group of pigmented catfish
- Podrobný popis experimentu a expertných hypotéz: Zadanie projektu
- Podkladové hlavné datové súbory: zip súbor prípadne tar.xz súbor
- Podkladové kontrolné datové súbory: zip súbor prípadne tar.xz súbor
- Ďalšie podrobnosti: Počas prvého semináru
(t.j., v stredu, 11.10.2023, od 12:20, v Praktiku KPMS)
Sylabus (úlohy pre samostatnú prácu)
- Úkol č.1 | Due to 11/10/23
Samostatne si preštudovať povinnú a doporučenú literatúru uvedenú nižšie (hlavne prvé štyri zdroje). Zo zoznamu odborných článkov uvedenných v sekcii ``Názorné ukážky'' si vybrať jeden konkrétny článok, ktorý kriticky prečítate a zhodnotite (tzn., že explicitne uvediete aspoň jednú pozitívnu vec z članku, ktorá vám príde urobená veľmi dobre a aspoň jednú negatívnu vec, ktorú považujete v článku za nezvládnutu). Nejde ale o obecne formulácie typu ``článok je hezky napsaný'', alebo ``vo formulácii anglického textu sa objavuje príliš veľa chýb''. Vaše hodnotenie musí byť špecifické a konkrétne -- napr. ``z uvedených intervalov spoľahlivosti nie je zrejmé, na akej hladine sú spočítané''.
- Úkol č.2 | Due to 18/10/23
Načitať jednotlivé datové súbory do programu R, vhodne ich očistiť (t.j. zredukovať zbytočne záznamy a nadbytočné premenné), následne skombinovať do jedného výsledného datového súboru. Premyslieť spôsob, ako vhodne kvantifikovať vzdialenosť pridaného jedinca od skupiny a kohéznosť skupiny samotnej.
- Úkol č.3 | Due to 25/10/23
Opraviť načítanie datových súborov v programe R tak, aby nevznikali pri načítani zaokrúhľlovacie chyby. Premyslieť metriku pre meranie vzdialenosti pridaného albína od skupiny a kohezity/súdržnosti skupiny. Pripraviť obrázky, na ktorých bude zrejmá závislosť jednak vzdialenosti, ale aj súdržnosti na čase a na type pridaného jedinca (t.j., albín, alebo štandardne zafarbený sumec).
- Úkol č.4 | Due to 01/11/23
Doladiť metriky pre kvantifikáciu vzdialenosti jedinca od skupiny a súdržnosť skupiny samotnej. Pripraviť PDF dokument (začiatok písania výskumnej správy), v ktorom v sekcii Výsledky budú obrázky a tabuľka vyplývajúce z exploratívnej analýzy. Výsledný PDF report zaslať emailom najneskôr v utorok do 23:59.
- Úkol č.5 | Due to 08/11/23
Dopracovať tabuľky s popisnými charakteristikami, dopniť vhodné obrázky a exploratívnu časť analýzy vhodne interpretovať -- tzv. napísať prvú časť sekcie Metódy. Výsledný PDF report zaslať emailom najneskôr v utorok do 23:59.
- Úkol č.6 | Due to 15/11/23
Dopracovať tabuľky s popisnými charakteristikami, dopracovať sekciu Metódy a premysliet návrh konkrétneho modelu pre vzdialenosť pridaného jedinca od skupiny a kohéznosť skupiny. Výsledný PDF report zaslať emailom najneskôr v utorok do 23:59.
- Úkol č.7 | Due to 22/11/23
Navrhnúť konkrétny regresný model pre modelovanie vzdialenosti pridaného sumca od skupiny a model pre súdržnosť pôvodnej skupiny. Niektoré z odhadnutých parametrov explicitne interpretovať v sekcii konfirmačných výsledkov. Opodstatnenie použitých modelov založiť na vhodnej exploratívnej analýze variačnej-kovariančnej štruktúry.
- Úkol č.8 | Due to 29/11/23
Dopracovať model(y), doplniť tabuľku s vhodnými odhadnutými parametrami, parametre v sekcii Výsledky náležite interpretovať a vysvetliť (tak, aby bol text pochopiteľný a zmysluplný pre nematematika/neštatistika). Napísať úvod a využiť v ňom aspoň dve konkrétne citácie (priamu aj nepriamu).
- Úkol č.9 | Due to 06/12/23
Dotiahnuť sekciu výsledky. Doplníť p-hodnoty a príslušné intervaly spoľahlivosti. Celková finalizace reportu (okrem abstraktu).
- Úkol č.10 | Due to 13/12/23
Napísať abstrakt v zmysle spoločnej diskusie na seminári. Abstrakt by mal obsahovať stručné zhrnutie (môže, ale nemusí byť štrukturovaný), najpodstatnejšíe výsledky (napr. aspoň jednú významnú, prípadne nevýznamnú $p$-hodnotu, a konkrétnu kvantifikáciu niektorého odhadnutého efektu) a akési základné zhrnutie (prínosy experimentu, článku). Finálne dopracovanie všetkých ostatných sekcií v správe.
- Úkol č.1! | Due to 20/12/23
Odovzdanie finánej výzkumnej zprávy. Abstrakt opravený a doplnený v zmysle diskusie na seminári a zostávajúce sekcie opravené podľa záverečných poznámok a pripomienok. Finálny report zaslat emialom pred začiatkom semináru.
Povinná a doporučená literatúra
- Zásady psaní výzkumných zpráv (M.Kulich)
- Ako písať vedecký článok (J.S.Dodd)
- Ako pracovať v LaTeXu s tabuľkami (L.F.Mori)
- Ako pracovať v LaTeXu s obrázkami (D.P.Carlisle)
- The Problem of Numeracy (A.S.C.Ehrenberg)
- Writing Technical Papers or Reports (A.S.C.Ehrenberg)
- The Science of Scientific Writing (G.D.Gopen & J.A.Swan)
- A Case for Simple Tables (M.A.Koschat)
- What Makes a Good Graph? (S.P.Duke)
- Online katalóg LaTeXových balíčkov a dokumentace (LaTeX)
Názorné ukážky niekoľkých (dobrých aj špatných) vedeckých článkov
- Wounding of Whale Calves by Kelp Gulls
- Prediction of Post-Operative Liver Dysfunction
- Physical Activity and Motor Competence in 4-7-Year-Old Children
- Predictors of Career Success
- Native American Ancestry, Body Mass Index and Diabetes Risk
Na záver
The fundamental purpose of scientific discourse is not the mere presentation of information and thought, but rather its actual communication. It does not matter how pleased an author might be to have converted all the right data into sentences and paragraphs; it matters only whether a large majority of the reading audience accurately perceives what the author had in mind.
George Gopen & Judith Swan
Disclaimer
Vrámci platných Pravidiel pro organizaci studia na Matematicko-fyzikální fakultě Univerzity Karlovy (ze dne 23.června, 2023), sa vzhľadom k Čl. 8, dds.2 týchto pravidiel týmto vyhlasuje, že povaha předmětu vylučuje právo studenta na jeden řádny a dva opravné termíny pro získaní zápočtu. Získaní zápočtu sa riadi výhradne pravidlami uvedenými vyššiena tejto web stránke (a tiež na stránke predmetu v SIS).