Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

[MAP] 1. laboratorijska vježba - 2021/2022

Rene

garica nisi me skuzio/la, kad izdvojim ove s roka dobijem svoju sliku, kad pustim ggpairs da ih zanemari dobijem tvoju
Nije mi bas jasno u cemu je razlika ali nema veze


ppooww

Rene Probaj izdvojit studente koji su izasli na rok (~ 100 redaka) u poseban dataframe (samo stupci IR_1, …, IR_5). I onda samo napravi ggpairs(df). Vidi kako ce ti ispast onda.


garica

sto se u zadnjem zadatku misli pod provjeriti adekvatnost modela?


Rene

garica Provjera reziduala i kriterij kvalitete modela možda?


Rene

Jel bio netko na labosu da podijeli iskustva?


Ryder

Rene prvih par ljudi su asistenti pitali po 20-30min i onda kad su skuzili da su ispitali 4 ljudi u prvih sat vremena a ostalo je jos 15 za drugih sat vremena su malo ubrzali🤦‍♂️
Inace ovako prolazis kroz kod i kazes sto si radio i onda te on zaustavi i pita neko pitanje, obicno to bude neko teorijsko, interpretacija grafova (npr. pitali su kod cega smo primjetili negativnu a kod cega pozitivnu korelaciju, koja od te dvije nas je vise iznenadila i kako bi to mogli objasniti, pa recimo negativnu korelaciju imamo sa zadatcima iz mi i sa zi, gdje su se ocigledno studenti koji su losije napisali mi vise potrudili oko zi i obrnuto, i pozitivne korelacije recimo sa onim zadatcima iz mi i zi i lab1 i lab2.)
Ovak od teorijskih pitanja je jos pitao sto je kovarijanca, varijanca, korelacija i kako se racunaju, kako se racuna z score.
Ja sam koristio anovu u jednom dijelu pa me nesto o tome pitao, koja je razlika izmedu toga i t testa, zasto smo izbacili koje retke, sa kojim vrijednostima smo zamijenili nedostajuce vrijednosti i zasto.
Onaj zadnji dio sa regresijom mene nije stigao bas pitat kako je zurio ali sam cuo da je neke isto pitao vezano za adekvatnost modela.


matt

Pitanja:

  1. osnovne stvari vezane za filtriranje podataka
  2. normalna distribucija, kad je ona bitna a kad ne -> bitna je kod testova koji pretpostavljaju normalnost, pogotovo koji su osjetljivi na nju, a nije bitno kod lin. reg. (tj. i dalje možemo provesti lin. reg. iako podaci nisu normalni)
  3. korelacijska matrica, u kojem slučaju ne bi bila invertibilna? -> koje varijable bi morali maknuti ? -> one koje su međusobno zavisne (npr. ir_5 i ir_sum, mičemo ir_sum)
  4. kad je matrica ne/stabilna?
  5. kako nestabilnost matrice utječe na promjene? -> male promjene na ulazu velike promjene na izlazu. Recimo kod summary(lm ... ) onaj Std. bi postao ogroman
  6. stat. udaljenost koju ste koristili se ravna po nekoj distribuciji, navesti ime distribucije i test kojim se provjerava je li stat. signif… Konkretno, mahalanobisa se ravna po Chi squared distrib. pa radimo pchisq test
  7. za anovu me nije pitao ali može pitati koje su pretpostavke anove
  8. što je generalizirana varijanca? -> determinanta kovarijacijske matrice. Probajte skužiti interpretabilnost i kako bi to grafički izgledalo (volumen koji razapinju vektori…)
  9. znati objasniti svaku oznaku koju daje summary(lm ... ), Multiple R-squared, Estimate, Std, Error, t value, Pr(>|t|) …
  10. kako bi provjerili je li varijable zi_1 zi_2 statistički značajno opisuju lin. reg. model? napraviš lin. reg. sa svim varijablama (1), napraviš lin. reg. sa svim varijablama osim zi_1 zi_2 (1). Sad svaka lin. reg (1, 2) ima svoju F-statistic -> napraviš f-test za te dvije (1, 2) F-statistic i provjeriš je li stat. signif.

Lyras

Ah yes, pitati 4/15 studenata u sat vremena od 2h dodijeljenog termina. Predivno.


bodilyfluids

Lyras sad ce nad nama provest 0% speedrun


« Prethodna stranica