[DAP] 2. laboratorijska vježba - 2021/2022
MT09
Zna li netko kako da prebacim konačni dataset iz prve bilježnice u drugu (za 2. labos)?
Haki
mt09 Jesi uspio ovo rijesit
MT09
Haki kaže asistent da sam mogao ili u prvom labosu dodati liniju koja sprema novi df u neki csv file, pa ga samo importaš u drugom, ili kopirati te linije koda kojima čistiš podatke u prvom i dodati ih na početak drugog. Ja sam napravio ovo drugo.
krokodil
Haki Ja sam skinuo konačan dataset iz prve bilježnice pa ga dodao u Kaggle preko gumba “Add data”:
- Spremiš podatke: train.to_csv(‘train.csv’,index=False)
- Skineš ih
- Add data(ovo napravi u 2. bilježnici)
- Učitaš podatke: pd.read_csv(‘../input/ime_baze/train.csv’)
wesley
pod “entire dataset” misle na cijeli skup za učenje ili trebamo spojiti train_data i test_data?
sheriffHorsey
Treba li u 2. zadatku koristiti time series split?
mini
sheriffHorsey Meni time series split daje jako lose rezultate u odnosu na onaj defaultni fold pa ne znam dal da ga pustim ili ne. Je li tako i vama?
feudalac
bilo bi krasno ovo odgodit 😶
oneTwo
feudalac međuispiti do petka + ogromni labos do ponedjeljka + max 2 submita dnevno😐
mini
Earthling nvm, ipak su dobri rezultati. Imala sam neki bug
mini
Koji bi bio nedostatak RIPPER-a? To nas pita u 10.zadatku
ppooww
Earthling Iz 7. prezentacije:
Nedostatak: Ako je problem složen (uvjeti pokrivaju mali broj primjeraka), nema garancije da će pronaći korisna pravila
Sinusan
Iz preze:
"Nedostatak: Ako je problem složen (uvjeti pokrivaju mali broj primjeraka), nema garancije
da će pronaći korisna pravila"
Dodatno moš navesti sve probleme koje ti je RIPPER zadao pri rješavanju i srati po njemu.
fooFighter
U zadatku sa filterom filtriramo medu znacajkama trenutne utakmice i one 3 sto smo sami dodali?
sheriffHorsey
Jel nekome ripper baca ‘TypeError: cannot unpack non-iterable NoneType’ i kako to riješiti?
wesley
može neke ideje za konstrukciju novih značajki?
sheriffHorsey
wesley Ne znam kakve znacajke imas, ali mozes gledati npr. za koju kombinaciju vrijednosti ce nova znacajka imat velike vrijednosti, a za koje male vrijednosti ili kad ce biti pozitivno, a kad negativno. Zgodno je ubaciti i neku nelinearnost s npr. kvadriranjem, ali pazi na to jesu li ti bitne negativne vrijednosti.
Npr. (prosjecni poeni home teama * vjerojatnost da home pobijedi - prosjecni poeni poeni away teama * vjerojatnost da away pobijedi)**1.5.
Ima smisla da ce prvi dio izraza biti veci ako je prvi tim bolji, a drugi dio manji ako je drugi tim losiji pa ces dobivat pozitivnu vrijednost za taj slucaj, a x1.5 bih dodao za nelinearnost (x2 nebi bilo pametno jer neces razlikovat slucaj kad ti je prvi tim bolji i kada je drugi tim bolji vec samo “koliko” je neki od timova bolji).
Jaster111
Ulazni blic jutros u 8:
što predstavlja metoda mutual_info_classif
objasniti koje ste 3 značajke kreirali
Sulejman
ljudi koji danas imaju u 12, u kojoj učionici ste?
2more
Sulejman
A304