[UUUI] 3. laboratorijska vježba - 2020/2021
Marko
Nocna_smjena Koliko ja znam u hrvatskim prezentacijama je uvijek bila ispravna verzija, samo kod hrvatskih snimaka je krivo
micho
l123 isto kao što ih i dobiješ, u CSV formatu
a ako misliš kako to ostvarit, s csv
modulom
MOD EDIT: Eksterna inteligencija mi je dojavila da možda pitaš kako učitat podatke u memoriju, pa ništa posebno, čitaš ih s csv.reader
i onda ih staviš u npr. listu. Samo vjerojatno želiš izbaciti prvi red iz te liste kad su prvi red labele, a ne podatci
ErnestHemingway
M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽ je li pametnije napraviti klasicni reader ili dict_reader?
micho
Alfetta kako god ti je lakše
Fikalo
kad pokrenem autograder javlja mi ovo, jel zna neko mozda zasto
micho
Fikalo Mislim da su sjebali kod argparsea, pa pokušaj upisati python3 autograder.py lab3
Fikalo
ako dodam lab kao argument kaze ovo
struktura projekta mi je po predlosku, i sve sam radio kao za prosli labos sto se tice pakiranja projekta i stavljaljanja u direktorij u autograderu, te pokretanje autogradera
Fikalo
jel ima u javi neki bezbolni nacin da ispisuje double sa tockom umjesto zarezom
ili moram razdjelit u dva dijela, pa isprintat prvi dio+ tocka + drugi dio
Extended_mix
System.out.format(Locale.UK, "formt npr. %.1f", brojKojiZelisIspist);
Fikalo
Extended_mix fala, tho vec sam napravio tako da sam splito u dva djela pa ispisivo svaki s tockom izmedu
HARAmara
jel se tko uspio prebaciti u drugu grupu, poslao sam zahtjev za grupu u kojoj ima mjesta prije dosta vremena, ali me još nisu prebacili (nema konflikata niti ista)
Fikalo
OK nije mi jasno. Program mi radi za sve primjere osim za titanic. Kod ispisa entropija je sve dobro, ali branchevi mi nisu isti kao njima, i onda mi na kraju prediction bude razlicit za tri slucaja. Recimo kod prvog brancha di je fare 10_to_20, kad algoritam dode do cabin_letter, meni za cabin_letter ostane samo U
dok bi po njima trebala bit sva slova
i iso sam korak po korak kolko sam mogo, jer ipak je to 700 linija dataseta, i nisam bas naso neke nepravilnosti. Onda sam iso gledat u train dataset, u u tom datasetu nema ni jedna linija koja bi se podudarala sa lower_class,female,adult,10_to_20,A
nego sve linije koje se podudaraju sa
lower_class,female,adult,10_to_20, za cabin_letter imaju samo U, sto moj programi i kaze
To znaci da algoritam nikako nebi za lower_class,female,adult,10_to_20 kao cabin_letter trebo imat A. Sad il sam ja nesto krivo shvatio sa algoritmom, sto mi opet nema smisla jer mi nije jasno kako mi je za sve ostale primjere dobro, il nesto kod njih ne drzi vodu il sam zbilja napokon prosviko, tak da ako neko zna do cega je bio bi zahvalan.
Kaladonter
Fikalo Znači imao sam isti problem, pa sam pitao na course assisstance, pa ni tamo čovjek nije bio skroz siguran zašto je to tako, ali uglavnom bez obzira što u datasetu ne postoji lower_class,female,adult,10_to_20 kao cabin_letter, A, B ili C itd, moraš isprobat sve te moguće opcije i dobiti izlaz po algoritmu s predavanja (to bi ti ti trebao rješiti onaj prvi if koji gleda parent dataset)
EDIT: da bolje objasnim, ako ti napravis branch lower_class,female,adult,10_to_20, A to će algoritmu predat prazan dataset, i onda to zbog toga treba napravit da uhvati onaj prvi if u algoritmu s predavanja
Fikalo
Kaladonter ali to eksuli nema nikakvog smisla, jer algoritam to nije radio u ostalim primjerima, ispisi brancheva su bili ok i nije bilo ispisa za svaki feature cak i ako nepostoji, takoder ni nema smisla jer po algoritmu s prezentacija (ne kod nego bas primjer kako to funkcionira) ne gleda nista osim one opcije kaje sadrze tu opciju za taj feature. Na taj nacin i ako vidi da su svi završni znakovi za taj feature isti npr yes, odma moze odlucit da je yes. Ako moram provjeravat i za one koje nepostoje, sta moram stavit da je njihov zavrsni znak onda. Kao najcesci, al najcesci od cega? i sta ja onda moram pamtit sve feature za svaki naziv tog featura kroz cjeli program? to bi se onda moralo pogledat i pamtit na samom pocetku programa i propagirat kroz svaki korak, da kad bi taj feature bio zadnji mogo ispisat za svaku njegovou opciju
Fikalo
Fikalo Ok sad sam pogledo taj razgovor u teamsu, i kuzim sta hoce rec trebali bi onda sam uzet najcesci zavrsni od cvora roditelja, al opet to nema smisla jer tako nije po algoritmu u prezentacijama, i nije mi jasno kako je moguce da mi je u ispisu brancheva za sve ostale primjere isto ko i njima, ako mi fali citav taj dio
Kaladonter
Fikalo da ni ja bas ne kuzim kako mi sve drugo radi, al čini mi se da su takve situacije provjeravali samo u tom titanic primjeru pa je zato tako ispalo. Al da, kad smo pitali na course assisstance on je rekao da prošle godine nisu morali ovako ispis raditi.
Fikalo
Kaladonter Jesi ti implementira da ti radi to u svakom primjeru onda, ili si napravio da ti to radi samo za titanic
Kaladonter
Fikalo napravio sam za svaki da tako radi, samo sam stavio da mi pregledava uvijek sve moguće vrijednosti za svako svojstvo (znači za cabin_letter da pregledava svako slovo) i tako grana algoritam, pa makar to ako npr za cabin_letter i slovo A rezultira praznim skupom
Fikalo
Kaladonter mislim nije meni problem to implementirat, mislim dodo sam i sad radi sve kak su htjeli, sam ono nema mi bas smisla
Fikalo
Kaladonter al svejedno fala na pomoci, pomogo si mi da skuzim u cem je problem i sta zele