[AVSP] 1. laboratorijska vježba - 2021/2022

Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

[AVSP] 1. laboratorijska vježba - 2021/2022

iNavy

Kasperinac blast
rekao bih da je i prethodnim generacijama bilo tako na ovom predmetu pa ćete se morat zadovoljit s onime što smo dobili

feel_d_boot

Kako ste riješili problem preduge izvedbe? Za svaki mi query treba 1.5 sekunda otprilike i problem je što ja za svaki upit gradim Q’ tablicu (radim po 1. pristupu s 26. slajda prezentacija). Provjerio sam na lokalnoj izvedbi jedno 100ak querya i točno mi ispadaju, ograničenje od 20 sekundi mi je s ovom implementacijom nedostižno. Ima tko kakav tip kako da ubrzam?

SuperSaiyano

iNut Mislim da ne trebaš raditi na taj pristup, s obrzirom da je N < 1000, puno je brže raditi slijedno pretraživanje (kao što su naveli) po svim ostalim tekstovima.

SuperSaiyano

Lyras Jesi riješio problem, meni također od 50000 je 49998 točno, dok ta dva koji nisu su za jedan manji od predviđenog.

SuperSaiyano

SuperSaiyano EDIT: njihov integracijski 4998 od 5000, ne 49998 od 5000
Na onim što su oni dali u sličnom tako omjeru griješi, od 50000, nekih 49995 myb

Lyras

SuperSaiyano Kod mene je problem bio s izrezivanjem ispravnih pojaseva iz simhasha. Kada sam to ispravio, sve je ostalo proradilo

feel_d_boot

Ljudi koji su pratili njihov LSH pseudokod u B zadatku, koliko vam treba vremena da program učita sve tekstove te ih hashira?
Meni treba 120 sekundi samo za to učitavanje, a to mi se čini malo previše za samo pohranu.
Radim u Pythonu.

feel_d_boot

iNut

Da se nadodam na ovo, treba mi uvijek 120 sekundi za pohranu sažetaka svih tekstova, da bi ih mogao kasnije uspoređivati po upitima, prolazi mi integracijske testove, te ima točnost 100 posto na danim primjerima (zip datoteka lab1B).

Problem mi je bio što sam spremao 2 liste. Za tekstove i sažetke. Kasnije sam uklonio listu za tekstove te sam odmah spremao sažetke i kasnije ih po potrebi izvlačio da bih uspoređivao udaljenosti. Sada mi za oba testa treba cca 130 sekundi.

Krpa1

iNut
ja sam isto spremao 2 liste i sad kad sam popravio mi je vrijeme ucitavanja palo sa 175s na 125s. Koliko je tebi vrijeme ucitavanja nakon micanja jedne liste?

iNavy

Prilikom generiranja broja program treba koristiti mapu kandidati, tj. slične tekstove za I-ti tekst program treba tražiti isključivo u mapi kandidati izgrađenoj pomoću LSH algoritma.

ovo znači da iz mape kandidati uzimamo samo redne brojeve i tražimo taj redni broj u listi simHash ili nešto drugo?

feel_d_boot

mornar Ica
Candidates se sastoji od ključeva koji su indeksi tekstova, odnosno njihovih sažetaka ako si ih pri učitavanju hashira. Vrijednosti svakog tog ključa je set indeksa svih tekstova koji su slični ovome tekstu indeksa I (taj indeks je ključ u tom rječniku candidates)

Naravno, pretpostavka je da koristiš rječnik.
Onda samo slijedno provjeriš jel udaljenost manje il jednka K I-tog sažetka sa gore spomenutim sažetcima.

Nadam se da je jasno, brate u Kristu

mrkva

Kasperinac ako ti je i dalje krivo, probaj maknuti oznaku novog retka tekstova

boki8

Treba li ulazne podatke citati iz neke datoteke ili se upisuju npr. iz konzole?

ErnestHemingway

kerovac sa stdin

Suki7

Zna neko kako ubacit u Eclipseu ubacit u java projekt DigestUtils, a da to posli moze radit i na sprutu?

Exelero

Suki7

SuperSaiyano

Suki7 Ja sam napravio maven projekt i dodao dependecy za DigestUtils da mi radi lokalno, kasnije sam predao samo .java od zadatka i radi sa jednostavnim importom kod njih. Vjerovatno imaju razred negdje u datoteci kada kompajliraju kod na sprutu

gladiator

za test primjere koji su nam dali: ulaz je uredu (R.in), mogu ga pročitati, dok je izlaz (R.out) nekakav vilenjački tipa ਹਹਰਰਰਹਹਹ਷ਸ਷਱ਰਹਰਰਰਹਹਹਹਹ. Što se tu zbiva?

HARAmara

gladiator probaj ga otvoriti s notepad++

MantisToboggan

na oba zadatka imam prosjecno 5 krivih za svakih 1000 querya, svi su manji nego ocekivano. Zna li netko sta sam mozda propustio ili mislite da je do njihove provjere?

lucylu

Zna li netko kako da Pythonu najbezbolnije provjerim jednakost outputa?

lucylu

lucylu
nvm rijeseno, ubacila sam ih u liste

« Prethodna stranica Sljedeća stranica »