[DUBUCE1] 1. laboratorijska vježba - 2021/2022
Ryder
nicrosc samo od asistenta, i može se doć bez svih zadataka koliko znam
yabk
Pepper
Ne moze. Mora se predati nesto na ferko.
Source: imao labos prije 20min
indythedog
Dobiva itko ovaj error prilikom učitavanja MNIST dataseta u 7. zadatku? Ili ima netko ideju kako riješiti? Google baš ne pomaže. Sve što sam napravio je kopirao onaj njihov kod i pokrenuo
micho
indythedog Treba ti noviji torchvision vjv
indythedog
M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽ vec na najnovijoj, al sam na kraju sam preso na colab
ghost
Što bi u 7. zadatku, drugi podzadatak značilo ovo: “ Za najuspješniji model iscrtajte podatke koji najviše doprinose funkciji gubitka”
micho
ksi Uzmeš najbolji model, nađeš podatke koji ti daju najveći loss, i prikažeš ih
matt
Zna li netko prevesti ovaj einsum
izraz np.einsum("ab,abc->ab", grad_h1, diag)
u izraz koji koristi tensordot
ili slično? Matrice su oblika grad_s1 (60, 5)
a diag (60, 5, 5)
. Dakle, koji bi numpy multiplication to sveo na matricu result (60, 5)
?
Lyras
Matt kolega, samos1_grad = (s1 > 0) * h1_grad
cemu komplikacije?
Rene
Labos u 9:
Blic jako slican onima na oblikovnim obrascima po izgledu i tipu zadataka, 10 zadataka ABCD, ima pytorcha, deriviranja funkcija i teorije
Ispitivanje iznenadujuce chill, niti sam rjesio sve one podzadatke niti me pitao to, pokrenuo ispitne programe da se vidi da radi i ispitivao me teoriju dok smo prolazili po kodu
indythedog
Rene deriviranja funkcija
Daju ti neku random funkciju da deriviraš il treba znat derivacije onih stvari iz 2. zadatka?
Rene
indythedog meni je bilo opcenito kao kako glasi izraz za derivaciju kompozicije vektorskih funkcija vektorskih varijabli, znaci \frac{d\vec{f}(\vec{g}(\vec{x}))}{d\vec{x}}
Baksuz
Jel kome u višeslojnoj regresiji u 1. zadatku loss ode u nan? Koristio sam stabilni softmax.
ErnestHemingway
Baksuz dogadalo se. razlog je bio gradijent relu u mom slucaju
Tompa007
Jel se sjeca neko nekih ostalih pitanja sa blica?
yurnero
Jel triba printat kod ka i prošle godine?
indythedog
yurnero Ne treba printat al treba pokretat kod, pa ak možeš ponesi svoj laptop
indythedog
Pitanja s blica od danas:
1) kakva mreža može biti za mnist (ponuđene 4 arhitekture, moraš izabrati onu koja imat 784 na ulazu, 10 na izlazu)
2)a = torch.tensor(nesto)
c = a + 4 -> kojeg je tipa c
3) kako možemo prikazati afinu funkciju? (ima par ponuđenih formula, treba izabrati onu wx + b)
4) dimenzije matrice Wk zadane, treba odrediti dimenziju ulaznih podataka ako znamo da ih ima N, te dimenziju
matrice gradijenata od Wk, te izlaz od sloja u kojem je Wk
5) imamo funkciju koja rotira 2D točke za 35 stupnjeva. Koje su dimenzije njezine matrice parcijalnih derivacija?
6) a = f(x), b = f(x - gradijent od a (zapisan kao formula))
pitanje - što će vrijediti (a > b, b < a, a = b itd)
7) ako sve piksele u MNIST train i test setu nasumično i konzistentno izmiješamo i pokrenemo treniranje/test, hoćemo li dobiti
iste rezultate kao da nismo to napravili (pod isti rezultati mislim na preciznost/točnost na train i test/skup), ako
je odgovor ne ima ponuđeno par razloga zašto ne
8) imaš ponuđeno kao stopa učenja, bias, lambda i još neki hiperparametar, od toga svega treba odrediti što NIJE hiperparametar
Preostala 2 zadatka se ne sjećam, al mislim da je jedan isto bio nešto sa dimenzijama matrice, bio je malo zeznut
Što se tiče ispitivanja, potvrđujem što je kolega gore napisao, full chill i ugodno ispitivanje, treba znati sve što si napisao i zašto, te malo teorije iza toga (npr. zaš koristimo ReLU, koji su nedostaci, što je early stopping itd itd), ali mene osobno nije pitao nikakve izvode il one derivacije divlje il išta takvog
Emma63194
indythedog 5) imamo funkciju koja rotira 2D točke za 35 stupnjeva. Koje su dimenzije njezine matrice parcijalnih derivacija?
6) a = f(x), b = f(x - gradijent od a (zapisan kao formula))
pitanje - što će vrijediti (a > b, b < a, a = b itd)7) ako sve piksele u MNIST train i test setu nasumično i konzistentno izmiješamo i pokrenemo treniranje/test, hoćemo li dobiti
iste rezultate kao da nismo to napravili (pod isti rezultati mislim na preciznost/točnost na train i test/skup), ako
je odgovor ne ima ponuđeno par razloga zašto ne
5) 2 × 2?
Koji je odgovor na 6) i 7)?
neksi
što znače ove strelice iz h0 u h1 i iz h1 u h2?
angello2
filip to su biasevi, cudna je ilustracija
neksi
jel u svakoj iteraciji računamo s1 samo za jedan redak matrice X ili za cilu matricu
tomekbeli420
filip za sve