[AVSP] 1. laboratorijska vježba - 2021/2022
iNavy
Kasperinac blast
rekao bih da je i prethodnim generacijama bilo tako na ovom predmetu pa ćete se morat zadovoljit s onime što smo dobili
feel_d_boot
Kako ste riješili problem preduge izvedbe? Za svaki mi query treba 1.5 sekunda otprilike i problem je što ja za svaki upit gradim Q’ tablicu (radim po 1. pristupu s 26. slajda prezentacija). Provjerio sam na lokalnoj izvedbi jedno 100ak querya i točno mi ispadaju, ograničenje od 20 sekundi mi je s ovom implementacijom nedostižno. Ima tko kakav tip kako da ubrzam?
SuperSaiyano
iNut Mislim da ne trebaš raditi na taj pristup, s obrzirom da je N < 1000, puno je brže raditi slijedno pretraživanje (kao što su naveli) po svim ostalim tekstovima.
SuperSaiyano
Lyras Jesi riješio problem, meni također od 50000 je 49998 točno, dok ta dva koji nisu su za jedan manji od predviđenog.
SuperSaiyano
SuperSaiyano EDIT: njihov integracijski 4998 od 5000, ne 49998 od 5000
Na onim što su oni dali u sličnom tako omjeru griješi, od 50000, nekih 49995 myb
Lyras
SuperSaiyano Kod mene je problem bio s izrezivanjem ispravnih pojaseva iz simhasha. Kada sam to ispravio, sve je ostalo proradilo
feel_d_boot
Ljudi koji su pratili njihov LSH pseudokod u B zadatku, koliko vam treba vremena da program učita sve tekstove te ih hashira?
Meni treba 120 sekundi samo za to učitavanje, a to mi se čini malo previše za samo pohranu.
Radim u Pythonu.
feel_d_boot
Da se nadodam na ovo, treba mi uvijek 120 sekundi za pohranu sažetaka svih tekstova, da bi ih mogao kasnije uspoređivati po upitima, prolazi mi integracijske testove, te ima točnost 100 posto na danim primjerima (zip datoteka lab1B).
Problem mi je bio što sam spremao 2 liste. Za tekstove i sažetke. Kasnije sam uklonio listu za tekstove te sam odmah spremao sažetke i kasnije ih po potrebi izvlačio da bih uspoređivao udaljenosti. Sada mi za oba testa treba cca 130 sekundi.
Krpa1
iNut
ja sam isto spremao 2 liste i sad kad sam popravio mi je vrijeme ucitavanja palo sa 175s na 125s. Koliko je tebi vrijeme ucitavanja nakon micanja jedne liste?
iNavy
Prilikom generiranja broja program treba koristiti mapu kandidati, tj. slične tekstove za I-ti tekst program treba tražiti isključivo u mapi kandidati izgrađenoj pomoću LSH algoritma.
ovo znači da iz mape kandidati uzimamo samo redne brojeve i tražimo taj redni broj u listi simHash ili nešto drugo?
feel_d_boot
mornar Ica
Candidates se sastoji od ključeva koji su indeksi tekstova, odnosno njihovih sažetaka ako si ih pri učitavanju hashira. Vrijednosti svakog tog ključa je set indeksa svih tekstova koji su slični ovome tekstu indeksa I (taj indeks je ključ u tom rječniku candidates)
Naravno, pretpostavka je da koristiš rječnik.
Onda samo slijedno provjeriš jel udaljenost manje il jednka K I-tog sažetka sa gore spomenutim sažetcima.
Nadam se da je jasno, brate u Kristu
mrkva
Kasperinac ako ti je i dalje krivo, probaj maknuti oznaku novog retka tekstova
boki8
Treba li ulazne podatke citati iz neke datoteke ili se upisuju npr. iz konzole?
ErnestHemingway
kerovac sa stdin
Suki7
Zna neko kako ubacit u Eclipseu ubacit u java projekt DigestUtils, a da to posli moze radit i na sprutu?
Exelero
SuperSaiyano
Suki7 Ja sam napravio maven projekt i dodao dependecy za DigestUtils da mi radi lokalno, kasnije sam predao samo .java od zadatka i radi sa jednostavnim importom kod njih. Vjerovatno imaju razred negdje u datoteci kada kompajliraju kod na sprutu
gladiator
za test primjere koji su nam dali: ulaz je uredu (R.in), mogu ga pročitati, dok je izlaz (R.out) nekakav vilenjački tipa ਹਹਰਰਰਹਹਹਸਰਹਰਰਰਹਹਹਹਹ. Što se tu zbiva?
HARAmara
gladiator probaj ga otvoriti s notepad++
MantisToboggan
na oba zadatka imam prosjecno 5 krivih za svakih 1000 querya, svi su manji nego ocekivano. Zna li netko sta sam mozda propustio ili mislite da je do njihove provjere?
lucylu
Zna li netko kako da Pythonu najbezbolnije provjerim jednakost outputa?
lucylu
lucylu
nvm rijeseno, ubacila sam ih u liste