[MAP] 1. laboratorijska vježba - 2021/2022
Rene
garica nisi me skuzio/la, kad izdvojim ove s roka dobijem svoju sliku, kad pustim ggpairs da ih zanemari dobijem tvoju
Nije mi bas jasno u cemu je razlika ali nema veze
ppooww
Rene Probaj izdvojit studente koji su izasli na rok (~ 100 redaka) u poseban dataframe (samo stupci IR_1, …, IR_5). I onda samo napravi ggpairs(df). Vidi kako ce ti ispast onda.
garica
sto se u zadnjem zadatku misli pod provjeriti adekvatnost modela?
Rene
garica Provjera reziduala i kriterij kvalitete modela možda?
Rene
Jel bio netko na labosu da podijeli iskustva?
Ryder
Rene prvih par ljudi su asistenti pitali po 20-30min i onda kad su skuzili da su ispitali 4 ljudi u prvih sat vremena a ostalo je jos 15 za drugih sat vremena su malo ubrzali🤦♂️
Inace ovako prolazis kroz kod i kazes sto si radio i onda te on zaustavi i pita neko pitanje, obicno to bude neko teorijsko, interpretacija grafova (npr. pitali su kod cega smo primjetili negativnu a kod cega pozitivnu korelaciju, koja od te dvije nas je vise iznenadila i kako bi to mogli objasniti, pa recimo negativnu korelaciju imamo sa zadatcima iz mi i sa zi, gdje su se ocigledno studenti koji su losije napisali mi vise potrudili oko zi i obrnuto, i pozitivne korelacije recimo sa onim zadatcima iz mi i zi i lab1 i lab2.)
Ovak od teorijskih pitanja je jos pitao sto je kovarijanca, varijanca, korelacija i kako se racunaju, kako se racuna z score.
Ja sam koristio anovu u jednom dijelu pa me nesto o tome pitao, koja je razlika izmedu toga i t testa, zasto smo izbacili koje retke, sa kojim vrijednostima smo zamijenili nedostajuce vrijednosti i zasto.
Onaj zadnji dio sa regresijom mene nije stigao bas pitat kako je zurio ali sam cuo da je neke isto pitao vezano za adekvatnost modela.
matt
Pitanja:
- osnovne stvari vezane za filtriranje podataka
- normalna distribucija, kad je ona bitna a kad ne -> bitna je kod testova koji pretpostavljaju normalnost, pogotovo koji su osjetljivi na nju, a nije bitno kod lin. reg. (tj. i dalje možemo provesti lin. reg. iako podaci nisu normalni)
- korelacijska matrica, u kojem slučaju ne bi bila invertibilna? -> koje varijable bi morali maknuti ? -> one koje su međusobno zavisne (npr. ir_5 i ir_sum, mičemo ir_sum)
- kad je matrica ne/stabilna?
- kako nestabilnost matrice utječe na promjene? -> male promjene na ulazu velike promjene na izlazu. Recimo kod
summary(lm ... )
onajStd.
bi postao ogroman - stat. udaljenost koju ste koristili se ravna po nekoj distribuciji, navesti ime distribucije i test kojim se provjerava je li stat. signif… Konkretno, mahalanobisa se ravna po Chi squared distrib. pa radimo
pchisq
test - za anovu me nije pitao ali može pitati koje su pretpostavke anove
- što je generalizirana varijanca? -> determinanta kovarijacijske matrice. Probajte skužiti interpretabilnost i kako bi to grafički izgledalo (volumen koji razapinju vektori…)
- znati objasniti svaku oznaku koju daje
summary(lm ... )
, Multiple R-squared, Estimate, Std, Error, t value, Pr(>|t|) … - kako bi provjerili je li varijable zi_1 zi_2 statistički značajno opisuju lin. reg. model? napraviš lin. reg. sa svim varijablama (1), napraviš lin. reg. sa svim varijablama osim zi_1 zi_2 (1). Sad svaka lin. reg (1, 2) ima svoju
F-statistic
-> napraviš f-test za te dvije (1, 2)F-statistic
i provjeriš je li stat. signif.
Lyras
Ah yes, pitati 4/15 studenata u sat vremena od 2h dodijeljenog termina. Predivno.
bodilyfluids
Lyras sad ce nad nama provest 0% speedrun