Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

[STRUCE] O predmetu

prshoot

andiamo 1) nisam bas skuzio zadatak, radi se o nekom modelu sa parametrima iz R3 i dano je nekoliko primjera (koordinate 0,1 … 1,0 itd) koji jesu linerano odvojivi, i treba nesta zakljucit kakav ce biti |H| i |VS| ako je a) X = {0,1}2, b) ako je X element R i c) ako je X = {0,1}2 i dodan jos jedan primjer koji narusi linearnu odvojivost ovih 4 prethodnih primjera

Zna li netko riješiti ovaj? Što predstavlja |H| i kako se određuje?


olimp26

prshoot
Zadatak je išao “Zadani je D={((0,0), 1), ((0,1), 1), ((1,1), 0)}, linearan klasifikacijski model H s parametrima iz R3. Odredi |H| i |VS| za (a) X ~ {0,1}2, (b) X ~ Z(skup cijelih brojeva)2 i © X ~ Z2 uz proširenje za D primjerom ((-1, 1), 0).”
Nisam siguran točno kako se rješava, al cisto primjetio da je zadatak malo drukcije prepisan


Vamonos

prshoot Mislim da je |H| prostor inacica


TheShtok

prshoot H je model, odnosno sve hipoteze kojima se moze klasificirati, VS je prostor inacica (version space), koji je podskup od H, a u njega spadaju sve hipoteze koje tocno klasificiraju sve primjere


TheShtok

Idemo bio sam na uvidima i 13/21 odista jest rjesenje


TheShtok

olimp26 a) |H| = 14 |VS| = 4 b) |H| = beskonacno |VS| = beskonacno c) |H| = beskonacno |VS| = 0


olimp26

nickname123
Jel mozes samo objasniti zasto je |VS| = 4 za a) dio?


TheShtok

nickname123 a | | predstavlja kardinalitet skupa, odnosno njihov broj


olimp26

Dodatno, još par zadataka okvirno
5.b) “Definiraj KL divergenciju i uzajamnu informaciju, te objasni kak bi koristio za kriterij za odabir modela kod polunaivnog Bayesovog klasifikatora”
4.b) "Skiciraj pogrešku na skupu za učenje/testnom skupu za k-NN u ovisnosti od k

  1. Logisticka regrecija - a) izvod pogreske unakrsne entropije
    b) Multinomijalna log regresija, broj klasa je K=4. Zadan je W, je li vjerojatnije da je primjer x=(2,5) član prve ili treće klase..
    (0.3, 0.4, 0.5)
    W~ (0.1, 0.9, 0.9)
    (2.5, 1.0, 0.5)
    (1.0, 1.2, 0.4)
    2) Model regresije treniramo na podacima koji su generirani uz f(x)=3(x-2)2 + 1. Koristimo preslikavanje fi(x) = (1, x, x2). Skiciraj izokonture neregularizirane f-je pogreške u ravnini R2 koju definiraju parametri w1 i w2 i izokonture L2-reg izraza. Ako se lambda bira tako da se jednak značaj daje složenosti modela i minimizaciji pogreške, skiciraj otprilike vektor optimalnih težina (w1, w2)
    b) Kako se algoritam Linearne regresije može upotrijebiti za binarnu klasifikaciju, glavni nedostatak uz primjer i kroz funkciju gubitka tog algoritma (L ovisno o y*h(x))
    6b) Ima skup D s N=1000 i dvije klase. 60 primjera pripada prvoj klasi, 40 drugoj. Provodimo klasifikaciju korisštenjem modela većinskog glasanja. Ako koristimo stratificiranu 10-struku unakrsnu provjeru za procjenu pogreske, hoce li se procjena pogreske promjeniti ako ponovimo isti postupak koristeći po 50% primjera iz obje klase? Ako da, je le veća ili manja.
    6c) Opisi metodu “izdvoji” jednog i navedi njene nedostatke

TheShtok

olimp26 rado, ali se samo sjecam rjesenja s uvida, upravo pokusavam dokuciti taj pod a)


olimp26

nickname123
Za |H| =14 mislim da ima kao u prvoj dz, 2c) zadatak bas su i nacrtane sve 14 hipoteze, a za |VS| ne kuzim bas, jer tocka (1,0) nije zadana ali tipa ako je postupak da se prvo gleda jel u (1,0) y=1 onda ima jedna hipoteza koja razdvaja, jos jedna ako je y=0 i to bi bilo |VS| = 2, al ocito nije tocno tako..


TheShtok

olimp26 hmmm, ne znam jesam li mozda krivo zapamtio, i da je stvarno 2


olimp26

Ma vjerojatno si dobro zapamtio, |VS| = 4 bi se moglo dobit mozda recimo ako je ovo tih 14 hipoteza koje H sadrzi, |VS| bi bile sve hipoteze medju njima, koje su konzistentne sa skupom D..

To bi onda trebale biti 11 i 15 hipoteza, a mozda se broje i 2 i 6-a…


olimp26

b) dio zadatka je ak sam dobro skuzio |H| su sve moguce hipoteze kojih je beskonacno |VS| beskonacno jer su primjeri linearno odvojivi a u c) H su i dalje sve hipoteze tj beskonacno, jer ne moraju biti konzistentne s primjerima iz D dok je |VS| prazan skup jer su primjeri iz D linearno neodvojivi..


olimp26

“Od N = 1000 primjera, klasifikator je za prvu, drugu i treću klasu ispravno pozitivno klasificirao njih 590, 146, odnosno 134. Od preostalih 130 neispravno je klasificiranih primjera, 30 ih je klasificirao u drugu umjesto u prvu, 60 u drugu umjesto u treću, a 40 u treću umjesto u prvu klasu. Izračunajte makro-F1.”
Jel ima netko postupak (ili bar rjesenje) za ovaj zadatak kad se trazi makro/mikro F1/F2


TheShtok

olimp26 za svaku grupu odredis TP, TN, FP, FN. ako treba mikro, pozbrajaj sve (tako da imas TPukupno, TNukupno,…) i onda racunaj P i R te F1 ili F2. ako treba makro, izracunaj za svaku grupu P, R i F1/F2 te na kraju izracunaj prosjek.


Masli

Kako se rješavaju zadaci poput ovog u 5. gdje dobijemo tablicu s primjerima i faktorizacijom varijabli i treba izračunati MAP za recimo P(x|y,z)?


olimp26

Ovo bi ti trebalo biti od pomoći https://fer.studosi.net/d/1348-struce-pitanja-i-odgovori/10


« Prethodna stranica Sljedeća stranica »