[UUUI] 3. laboratorijska vježba - 2020/2021
Sicsile
Koje prezentacije ulaze u 3. Lab vjezbu?
snowman
Sicsile 10. Strojno učenje
Lyras
Kada nam je information gain za sve potencijalne feature 0, onda samo odaberemo onaj dependent variable value koji je prvi po abecedi?
Nocna_smjena
Jel neko krenuo s ovim labosom? Jel hrv verzija ID3-a korigirana ili se i dalje moramo oslanjati na eng verziju?
ana
Nocna_smjena cini mi se da su hrv i eng verzija iste na slajdovima. napravila sam labos po tome, jedino sto sam izmjenila je da se kod prvog if(D = prazno), ne vrati ovo sto pise u algoritmu nego null i onda se ta grana ne sprema u stablo. zapravo nije velika razlike hoce li se to spremit ili ne (predikcija ce dati isti rezultat, samo je pitanje hoce li se racunati najcesca oznaka tijekom testiranja ili predikcije), ali u autograderu se ne spremaju te grane pa eto
Marko
Nocna_smjena Koliko ja znam u hrvatskim prezentacijama je uvijek bila ispravna verzija, samo kod hrvatskih snimaka je krivo
vjeva
U autograderu je ovo naveden kao correct output:
1:sex=male 2:cabin_letter=B 3:fare=75_to_100 4:age=old yes
1:sex=male 2:cabin_letter=B 3:fare=75_to_100 4:age=young_adult 5:passenger_class=upper_class no
a pada mi test: titanic_train_categorical.csv titanic_heldout_categorical.csv
za primjer: upper_class,male,adult,75_to_100,B,no
Po logici koju su objasnili u uputama, ako ne prepoznaje feature value, a ovdje je to age=adult, treba pogledati koje sve labele postoje za druge vrijednosti featurea i vratiti onu koja se najčešće pojavljuje što je ovdje {‘yes’: 1, ‘no’: 1} pa se uzima abecedno manja tj ‘no’. Autograder očekuje izlaz ‘yes’. Jesam li ja nešto krivo shvatila ili da pričekam par dana da se autograder update-a?
Diego
vjeva Ista stvar i meni pada
zvonkoBogdan
sta u slucaju da imamo razlicite ciljne varijable za iste varijable?
npr
lower_class,male,adult,under_10,U,no
lower_class,male,adult,under_10,U,yes
Ducky
Oce se ljutit ak stavim dva argumenta u fit i predict umjesto jednog?
BillIK
kako čitati csv datoteke? kad koristim csv.DictReader ne budu stupci uvijek dobrim redoslijedom učitani
Joskica
BillIK obican reader iz csv lib
https://docs.python.org/3/library/csv.html
Edrudo
Jeli potrebno znati modeliranje neizvjesnosti da bi se rijesio lab?
ana
Edrudo trebas znat samo iz strojnog ucenja zadnju temu vezanu za stabla odluke
BillIK
može netko objasniti kako se dode do predviđanja? imam izgrađeno stablo i što dalje? ne shvaćam upute nimalo
ana
BillIK Za svaki od testnih primjera trebas raditi:
pogledaj koji ti je feature u rootu stabla, pogledaj koja je vrijednost za taj feature u tom testnom primjeru i onda se spusti tom granom u sljedeci node, i to ponavljaj dok ne dodes do listova ili pronades vrijednost znacajke koja ne postoji u stablu (u tom slucaju umjesto vrijednosti iz lista, uzmi najzastupljeniji label iz primjera za treniranje iz prethodnog nodea stabla), i dok prolazis kroz stablo samo ispisuj gdje prolazis (ili pamti u nekom stringbuilderu). Samo pazi da ispitujes predikcije primjera redom kojim su zapisani u datoteci
HARAmara
je li potrebno znanje iz bilo koje osim 10. prezentacije za ovaj labos?
Kaladonter
lovro
Kak je najpametnije spremit podatke za train set i test set?
micho
l123 isto kao što ih i dobiješ, u CSV formatu
a ako misliš kako to ostvarit, s csv
modulom
MOD EDIT: Eksterna inteligencija mi je dojavila da možda pitaš kako učitat podatke u memoriju, pa ništa posebno, čitaš ih s csv.reader
i onda ih staviš u npr. listu. Samo vjerojatno želiš izbaciti prvi red iz te liste kad su prvi red labele, a ne podatci