[STRUCE1] Gradivo
TentationeM
Što mislite odgovaraju li ovi moodle kvizovi težini pitanja na MI?
InCogNiTo124
Emma63194 ovo je u biti dobro pitanje, nadao sam se da cete ili uzet to as is, ili ce nekom neka matematicka intucija pomoc, al zaista nije u redu od mene da to ne objasnim.
Kratak odgovor: nelinearnost je u ortogonalnoj dimenziji pa se “ne broji”. Dugi odgovor slijedi u nekoliko skrinova ispod:
Ovo je sigmoida od linearne kombinacije:
ovdje su mi a i b neke “tezine”, a f je sigmoida, nebitno. Bitno je da bi sad klasifikacijska granica bila f(x)=0.5, odnosno presjekli bi ovu plohu sa ravninom z=0.5. Tebi prepustam da si zamislis sto bi dobila: odgovor je lijepi ravni pravac. Razlog tome je sto je funkcija nelinearna kad se gleda po z dimenziji, dok je linearna kad se gleda u x-y dimenzijama.
Novi primjer:
Ovdje ako obratis pozornost na ulaz u sigmoidu, vidit ces da sam promjenio tako da sam dodao “interakcijsku znacajku” - fensi rijec za nelinearnost. Radimo opet istu stvar, presjeces povrsinu sa ravninom z=0.5 i kj dobis ovaj put? ERMAGERD pa crta koju dobis vise nije linearna!! Upravo zbog podataka haha
Zadnji primjer:
Sad sam dodao kvadrate i vidi sta se dobi, slatki mali bulge ^^ naravno kad bi ovo cudo sad presjekla sa z=0.5 dobila bi neku kruznicu. Y iz that? opet nelinearno, samo zato jer su znacajke nelinearne.
TLDR linearna kombinacija znacajki daje linearnu granicu (nakon sto plohu presjecemo ravninom) cak i uz nelinearnu aktivaciju. Ako je kombinacija znacajki nelinearna, granica ce bit nelinearna.
Yasuke
Ako može neko pls objasnit koji je točan odgovor ovdje?
I ovaj također
koBASA
Ja sam sebi nacrtao, u prvom slucaju je udaljenost od tocke 3,3 do 3,4 jednaka 1 pa je sirina margine 0.5, a u drugom slucaju vidis da je udaljenost tocke 3,4 od ovog pravca koji prolazi kroz dvije tocke jednak 3 korijena iz 2, sirina je pola toga, dakle sirina margine je 3 korijena iz 2 puta veca od ove prve, ne znam jel postoji bolji način, al eto.
narval13068
koBASA
Možda ovaj netko?
Yasuke
hackerman Ja sam tu tražio koji su primjeri potporni vektori tako da sam pomnožio w sa svakim primjerom iz X i onda ako kao izlaz dođe -1 ili 1 ili nešto jako blizu, ja sam za prvi i treći primjer dobio 0.99 i -0.99, onda su to potporni vektori što znači da je za ostale primjere alfa=0 i kako je ponuđeno samo jedno rješenje koje na 2. i 4. mjestu ima 0 onda je to to.
sunceko
Amon
narval13068
Jel zna netko zasto se w0 prije izracuna rezultata mora ovdje dobiti preko prvog zadanog primjera, a ne preko drugog (preko prvog sam dobia da je on -1283.56 pa onaj dio s alfama za novi primjer mi je -265.35 pa daje rjesenje ponudjeno, ali ako idem preko drugog dobit w0 ispadne -57.73, zasto nije isti ka preko prvog :/ )
narval13068
Dima Uspio sam pronaci da postoji neka nestabilnost pa da se nece moc dobiti iz svakog nego iz jednog od njih pa izgleda da treba izracunat iz oba i vidit koje je ponudjeno rjesenje u zdk jer to je ono sta se trazi
MJ3
Dima jel možeš stavit postupak? meni ispadne jako mala vrijednost w0 pa onda ni jedan od ponuđenih odgovora
narval13068
Tamo desno pise jos +w0 u prvoj slici u ove dvije donje jednajdbe kad se izracunava samo je ispalo iz slike
MJ3
Dima hvala 😃
Stark
Dima Za ovaj primjer gdje je vrijednost -1 (na prvoj slici na kraju) mi ispada w0 = -59.73. Što radim krivo? Ne bi se smjelo dogoditi da w0 ima dvije različite vrijednosti, zar ne?
johndoe12
iz cega ucite za ovaj ispit? samo moodle blicevi, bez starih ispita (uz skriptu i video predavanja naravno)?
Stark
Da li bi netko znao objasniti zašto je u ovom zadatku d) točan?
Yeltneb
Stark
Nije nitko odgovorio pa ponavljam, jel zna netko ovo objasniti?
cotfuse
Yeltneb Stark
ako skup podataka nije linearno odvojiv to znaci da kakav god pravac (pravac odluke modela perceptrona) provuces kroz te podatke, barem jedan primjer ce biti s krive strane pravca. Ti primjeri s krive strane pravca ce uzrokovati da je gradijent gubtka veci od 0 i zbog toga ce se pravac stalno micati kako bi pokusao uhvatiti te preostale primjere, odnosno model nece konvergirati.
Vrba
jel moze netko ovaj objasnit?
am22
Vrba Trebas sve modele kojima je C >= 1 (veci C daje slozeniji model) i \gamma <= 1 (manja preciznost isto daje slozeniji model). Takvih je 36, i onda oduzmes 1 jer C = 1 i \gamma = 1 su oni vec napisali, tako da je odgovor 35.
khm19
Vrba Veci gama daje slozeniji model jer je gama=1/2sigma2, a sto je varijanca manja to je Gaussovo zvono uze pa bi primjeri trebali biti sto blize kako bi bili slicni, a to daje slozeniji model. C takoder s povecanjem daje vecu slozenost jer je c=1/lambda, a sto je lambda manji to je regularizacija manja pa imamo slozeniji model. U zadatku ima 6 C i 6 gama ukljucujuci i C=1 i gama=1, kombinacija je 62=36 i oduzmemo ponuđenu za C=1 i gama=1 i to su preostali prenaučeni modeli.
Lujonlu
am22 veca preciznost daje slozeniji model. iz skriptice:
Npr., ako odaberemo visoku vrijednost za γ, dobit ćemo složeniji model, pa će trebati pojačati regularizaciju odabirom manje vrijednosti za C.
Stark
Ovdje mi ispada 0.70, pa očito krivo radim. Može objašnjenje?
RogerRoger
Stark
Formula za gubitak binarne logističke regresije je -y * ln(h(x)) - (1-y) * ln((1-h(x)).
Ako računaš da je npr. y = 1 i izjednačiš s 1.20, onda ti se drugi član poništava jer je pomnožen s (1 - y), što je 0. Uglavnom, imaš -ln(h(x)) = 1.20, tj. h(x) = exp(-1.20) i ponoviš izračun samo uz pretpostavku da je y = 0 (jer je oznaka promijenjena).
Dalje samo izračunaš - ln(1 - h(x)) = -ln(1 - exp(-1.20)) = 0.36.
Noggenfogger
molim nekog za objasnjenje, na koji nacin razmisljati redom
johndoe12
dammitimmad Je li netko zna ovaj? Meni se cini da je a, al nisam garant..
Amali
Ziher
Moze li netko objasniti ovaj? Prvo sam dobio 33.935, ovo sam pogodio
Lujonlu
Ziher ne regulariziras w0, tako da racunas |w| bez w0