[PARPRO] 3. laboratorijska vježba - 2021/2022
Rene
Koliko brzo van CFD radi paralelno? Jeste minjali G i L ili? Meni s G = (m+2, n+2) i L defaultnim radi skoro istom brzinom kao slijedni? Isprobavao sam i da ista dretva obradi više elemenata ali nema značajnog ubrzanja
Daeyarn
Rene ja sam radio s pyopencl, paralelno mi traje 25 min, a slijedno mi je bilo oko 90 minuta ako se dobro sjecam
edit: prosjecno trajanje iteracije petlje za paralelno mi je 1.55 sekundi, a za slijedno 5.48 sekundi
Jokke
Rene Slijedno 15 sek po iteraciji, paralelno 0.04 sek. Ili sam ja bog paralelizacije ili sam nes sjebo
dora
burza grupa je ponovno otvorena
Rene
Reznox
Jokke MOLIM
Reznox
Jokke Meni traje 0.5 sa svim paraleliziranim al mi se errori zeznu (krivac je ova petlja kad ju paraleliziram)
Pokusavam skuzit kako da nju tocno postavim, najjednostavnija je a jedina me zeza hahahahaha
Daeyarn
Rene da, samo sam pretipkao njihov kod u python
Bisolvon
Reznox Meni ta copy_back petlja uzme 80% trajanja ako nije paralelizirano. Kad probam paralelizirat dolaze mi krivi errori isto.
ZalutaliStudent
nnn
dinoo ZalutaliStudent Reznox Bisolvon znaci 4 sata gledam, ako netko naleti na isti problem:
dev_psi = cl.Buffer(ctx, cl.mem_flags.WRITE_ONLY , psi.nbytes)
stvar je da ovdje se psi stavlja kao write_only
i onda se boundary vrijednosti ne inicijaliziraju prilikom izvršavanja petlje odnosno:
A A A A A A je undefined
A B B B A B zapisemo u loop-u
A B B B A
A B B B A
A A A A A
i onda kada citamo taj buffer nazad u psi sa cl.enqueue_copy(queue, psi, dev_psi).wait()
imamo undefined vrijednosti, ugl ovo treba biti:
dev_psi = cl.Buffer(ctx, cl.mem_flags.READ_WRITE | cl.mem_flags.COPY_HOST_PTR, hostbuf=psi)
Reznox
Bisolvon Da e potpuno mi nejasno, trebala bi biti “prakticki” ista kao ove ostale al nije mi jasno
Bisolvon
Reznox Kad promijenim u kernelu iz double u float baca drugaciji krivi error. Neka zajebancija s tipovima podataka i pointerima. Unlucky.
Reznox
Kako predati ovo? Vidim da su Lab4 i Lab5 burze samo otvorene
niknik
Reznox Komponente kolegija -> Domaće zadaće -> 3. dz
Reznox
niknik Sry krivo sam reka, kako biramo grupu, esu lab4 i lab5 za nadoknade ili? Vidim da na burzi ima samo njih
AnamarijaM
Reznox lab4 ako predajes 1 vjezbu, lab4 i lab5 ako predajes 2
Reznox
MA Ako predajem 3.? haha :')
---
Reznox jednu i dvije, ne prvu i drugu 😃
Reznox
🤡 Smooth brain moment
---
bb99 jesi usporedio mozda?
[obrisani korisnik]
Je li normalno da se greška promijeni za jednu iteraciju nakon pararelizacije? Konkretno, nakon paralelizacije bnorma mi je greška porasla s cca 0.25 na cca 0.34, ali ne vidim gdje bi mogla biti moja greška.
Prije toga sam paralelizirala još neke stvari i greška je ostala 0.25.
Reznox
[obrisani korisnik] Mozda imas gresku u dimenzijama koje saljes/koristis unutar kernela