Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

[PARPRO] 3. laboratorijska vježba - 2021/2022

Rene

Koliko brzo van CFD radi paralelno? Jeste minjali G i L ili? Meni s G = (m+2, n+2) i L defaultnim radi skoro istom brzinom kao slijedni? Isprobavao sam i da ista dretva obradi više elemenata ali nema značajnog ubrzanja


Daeyarn

Rene ja sam radio s pyopencl, paralelno mi traje 25 min, a slijedno mi je bilo oko 90 minuta ako se dobro sjecam

edit: prosjecno trajanje iteracije petlje za paralelno mi je 1.55 sekundi, a za slijedno 5.48 sekundi


Jokke

Rene Slijedno 15 sek po iteraciji, paralelno 0.04 sek. Ili sam ja bog paralelizacije ili sam nes sjebo


dora

burza grupa je ponovno otvorena


Rene

Jokke

Daeyarn
Jel koristite njihov kod za slijedno? Jer meni i slijedni i paralelni traju cca. 2min za 1000 iteracija


Reznox

Jokke MOLIM


Reznox

Jokke Meni traje 0.5 sa svim paraleliziranim al mi se errori zeznu (krivac je ova petlja kad ju paraleliziram)

Pokusavam skuzit kako da nju tocno postavim, najjednostavnija je a jedina me zeza hahahahaha


Daeyarn

Rene da, samo sam pretipkao njihov kod u python


Bisolvon

Reznox Meni ta copy_back petlja uzme 80% trajanja ako nije paralelizirano. Kad probam paralelizirat dolaze mi krivi errori isto.


ZalutaliStudent

Reznox

Bisolvon

Reznox Jeste li slucajno skuzii di je greska? Ja vec 2 sata gledam samo to, imam identican problem, kad koristim paralelizirano krivu gresku izbacuje, a ovaj obicni slijedni kod je spor, ali s tocnom greskom.


nnn

dinoo ZalutaliStudent Reznox Bisolvon znaci 4 sata gledam, ako netko naleti na isti problem:

dev_psi = cl.Buffer(ctx, cl.mem_flags.WRITE_ONLY , psi.nbytes)

stvar je da ovdje se psi stavlja kao write_only i onda se boundary vrijednosti ne inicijaliziraju prilikom izvršavanja petlje odnosno:

A A A A A              A je undefined
A B B B A              B zapisemo u loop-u
A B B B A
A B B B A
A A A A A

i onda kada citamo taj buffer nazad u psi sa cl.enqueue_copy(queue, psi, dev_psi).wait() imamo undefined vrijednosti, ugl ovo treba biti:

dev_psi = cl.Buffer(ctx, cl.mem_flags.READ_WRITE | cl.mem_flags.COPY_HOST_PTR, hostbuf=psi)

Reznox

Bisolvon Da e potpuno mi nejasno, trebala bi biti “prakticki” ista kao ove ostale al nije mi jasno


Bisolvon

Reznox Kad promijenim u kernelu iz double u float baca drugaciji krivi error. Neka zajebancija s tipovima podataka i pointerima. Unlucky.


Reznox

Kako predati ovo? Vidim da su Lab4 i Lab5 burze samo otvorene


niknik

Reznox Komponente kolegija -> Domaće zadaće -> 3. dz


Reznox

niknik Sry krivo sam reka, kako biramo grupu, esu lab4 i lab5 za nadoknade ili? Vidim da na burzi ima samo njih


AnamarijaM

Reznox lab4 ako predajes 1 vjezbu, lab4 i lab5 ako predajes 2


Reznox

MA Ako predajem 3.? haha :')


---

Reznox jednu i dvije, ne prvu i drugu 😃


Reznox

🤡 Smooth brain moment


---

bb99 jesi usporedio mozda?


[obrisani korisnik]

Je li normalno da se greška promijeni za jednu iteraciju nakon pararelizacije? Konkretno, nakon paralelizacije bnorma mi je greška porasla s cca 0.25 na cca 0.34, ali ne vidim gdje bi mogla biti moja greška.

Prije toga sam paralelizirala još neke stvari i greška je ostala 0.25.


Reznox

[obrisani korisnik] Mozda imas gresku u dimenzijama koje saljes/koristis unutar kernela


« Prethodna stranica Sljedeća stranica »