[UUUI] 3. laboratorijska vježba - 2020/2021

Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

[UUUI] 3. laboratorijska vježba - 2020/2021

Sicsile

Koje prezentacije ulaze u 3. Lab vjezbu?

snowman

Sicsile 10. Strojno učenje

Lyras

Kada nam je information gain za sve potencijalne feature 0, onda samo odaberemo onaj dependent variable value koji je prvi po abecedi?

Nocna_smjena

Jel neko krenuo s ovim labosom? Jel hrv verzija ID3-a korigirana ili se i dalje moramo oslanjati na eng verziju?

ana

Nocna_smjena cini mi se da su hrv i eng verzija iste na slajdovima. napravila sam labos po tome, jedino sto sam izmjenila je da se kod prvog if(D = prazno), ne vrati ovo sto pise u algoritmu nego null i onda se ta grana ne sprema u stablo. zapravo nije velika razlike hoce li se to spremit ili ne (predikcija ce dati isti rezultat, samo je pitanje hoce li se racunati najcesca oznaka tijekom testiranja ili predikcije), ali u autograderu se ne spremaju te grane pa eto

Marko

Nocna_smjena Koliko ja znam u hrvatskim prezentacijama je uvijek bila ispravna verzija, samo kod hrvatskih snimaka je krivo

vjeva

U autograderu je ovo naveden kao correct output:

1:sex=male 2:cabin_letter=B 3:fare=75_to_100 4:age=old yes
1:sex=male 2:cabin_letter=B 3:fare=75_to_100 4:age=young_adult 5:passenger_class=upper_class no

a pada mi test: titanic_train_categorical.csv titanic_heldout_categorical.csv
za primjer: upper_class,male,adult,75_to_100,B,no

Po logici koju su objasnili u uputama, ako ne prepoznaje feature value, a ovdje je to age=adult, treba pogledati koje sve labele postoje za druge vrijednosti featurea i vratiti onu koja se najčešće pojavljuje što je ovdje {‘yes’: 1, ‘no’: 1} pa se uzima abecedno manja tj ‘no’. Autograder očekuje izlaz ‘yes’. Jesam li ja nešto krivo shvatila ili da pričekam par dana da se autograder update-a?

Diego

vjeva Ista stvar i meni pada

zvonkoBogdan

sta u slucaju da imamo razlicite ciljne varijable za iste varijable?
npr
lower_class,male,adult,under_10,U,no
lower_class,male,adult,under_10,U,yes

Ducky

Oce se ljutit ak stavim dva argumenta u fit i predict umjesto jednog?

BillIK

kako čitati csv datoteke? kad koristim csv.DictReader ne budu stupci uvijek dobrim redoslijedom učitani

Joskica

BillIK obican reader iz csv lib
https://docs.python.org/3/library/csv.html

Edrudo

Jeli potrebno znati modeliranje neizvjesnosti da bi se rijesio lab?

ana

Edrudo trebas znat samo iz strojnog ucenja zadnju temu vezanu za stabla odluke

BillIK

može netko objasniti kako se dode do predviđanja? imam izgrađeno stablo i što dalje? ne shvaćam upute nimalo

ana

BillIK Za svaki od testnih primjera trebas raditi:
pogledaj koji ti je feature u rootu stabla, pogledaj koja je vrijednost za taj feature u tom testnom primjeru i onda se spusti tom granom u sljedeci node, i to ponavljaj dok ne dodes do listova ili pronades vrijednost znacajke koja ne postoji u stablu (u tom slucaju umjesto vrijednosti iz lista, uzmi najzastupljeniji label iz primjera za treniranje iz prethodnog nodea stabla), i dok prolazis kroz stablo samo ispisuj gdje prolazis (ili pamti u nekom stringbuilderu). Samo pazi da ispitujes predikcije primjera redom kojim su zapisani u datoteci

HARAmara

je li potrebno znanje iz bilo koje osim 10. prezentacije za ovaj labos?

Kaladonter

decko_sa_balkana Ne

lovro

Kak je najpametnije spremit podatke za train set i test set?

micho

l123 isto kao što ih i dobiješ, u CSV formatu

a ako misliš kako to ostvarit, s csv modulom

MOD EDIT: Eksterna inteligencija mi je dojavila da možda pitaš kako učitat podatke u memoriju, pa ništa posebno, čitaš ih s csv.reader i onda ih staviš u npr. listu. Samo vjerojatno želiš izbaciti prvi red iz te liste kad su prvi red labele, a ne podatci

Sljedeća stranica »