Ovu stranicu je najbolje pregledavati u modernom internet pregledniku s omogućenim JavaScriptom.

Pitanja i odgovori

[obrisani korisnik]

Filemon
Nijedan rad nije dostupan…


[obrisani korisnik]

[obrisani korisnik] Pogledaj npr. osobnu stranicu Segvica, tamo imas objavljenje zavrsne i diplomske radove studenata koji su bili kod njega.


Filemon

[obrisani korisnik] rekao sam ti i ovo drugo, Šegvić i Kalafatić provjereno imaju online dostupne cijele radove na svojim webovima


micho

[obrisani korisnik] ove što su u vlasništvu faksa ne - to je taj njihov retard model open sourcea koji zapravo nije dostupan izvan uživo

postoje ljudi koji objavljuju te radove drugdje - arxiv ponekad, moj je recimo na gitu, al moj rad konkretno je toliko loš da ti neću ni preporučiti da ga gledaš


[obrisani korisnik]

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽
ok, ja trebam napraviti chatbot, samo se brinem jer nemam uopce pojma o NLP-u niti library-ima iz NLP-a ili ML-a koje trebam koristiti, a imam i druge obaveze pa zelim znati koliko ce mi trebati vremena da napravim nesto sto će biti prolazno na završnom. Mentor mi se ne čini kao neki zahtjevan lik niti strog, ali ne znam kakvo je povjerenstvo. Zanima me kakvu funkcionalnost bi neki chatbot trebao imati da ne padnem na obrani, tj. ako je netko radio chatbot ili nesto slicno a da je prosao, sto je implementirao tocno?


njofra

[obrisani korisnik] Na obrani prezentiraš kako želiš, dosta ti je napraviti prezentaciju u kojoj objašnjavaš što imaš. Povjerenstvo više postavlja pitanja iz formalnosti, neće imati neki trik koji će ti crashati bota da bi te srušili.


micho

[obrisani korisnik] Možeš svašta napraviti

Ako je chatbot na engleskom, skineš manji GPT-2 (vjv je dosta i najmanji), finetuneaš ga na nekakvom datasetu za razgovore na colabu, i malo urediš interface. Skoro state of the art performanse za minimalno rada.

Ako je na hrvatskom onda jebiga, morat ćeš nešto custom iskemijat ali mislim da nema hrvatskih datasetova za tak nešto, barem ne za neku mrežu koja bi izgenerirala nešto suvislo. Dakle onda bi valjda išao nekim stohastičim modelima.

U svakom slučaju i ljudi na diplomskom su prebalavi napraviti necringe chatbot iz nule tako da tu nema previše razmišljanja, finetuneat ćeš neki predtrenirani model na datasetu za chatove i nadat se najboljem lmao


[obrisani korisnik]

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽
htio bih neki na hrvatskom, samo jos nemam ideje cemu bi sluzio (na pamet mi pada recimo neke informacije o dionicama ili slicno), ili mozda najjeftiniji proizvod u nekoj kategoriji, samo ne znam odakle bi za to mogao vuci podatke, vjj ne postoji neki API u RH za to.


micho

[obrisani korisnik] ma kakav bi ti API ahhahahahahahahah

možeš probat ekstrahirat s whatsappa svoje poruke ako ih imaš ili žicat druge ljude da ti ih daju, ali good luck with that lol

to nikako neće biti dovoljno za ove nove modele, a za custom rješenja pitanje hoće li to ličiti na išta


[obrisani korisnik]

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽
mislio sam u smislu da ako user pita “koji je rast dionice tesle zadnja 3 tjedna?” chatbot zakljuci o kakvom se upitu radi te zakljuci da korisnik zeli dionicu tesle, a vremenski period je zadnja 3 tjedna, te onda postoji vjj neki api pomocu kojeg mogu dohvatiti podatke o vrijednosti dionice i slicno te vratiti odgovor.


micho

[obrisani korisnik] pa to je još teže

znači trebao bi mrežu koja ne samo da uzima queryje (npr. T5), nego koja to radi na hrvatskom, a onda još i da ode tražiti rast dionice i da još i za to ima samo tako neki API XD

Mislim da bi se trebao malo baciti u istraživanje što se može u NLP-u i pod kojom cijenom jer čini mi se da uopće ne razumiješ o koliko posla pričamo XD


[obrisani korisnik]

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽
Mozes mi dati primjer necega sto je izvedivo onda, kakav chatbot? Ne mora biti originalan, ali da znam usporediti neke svoje ideje.


micho

[obrisani korisnik] chatbot gdje ti na engleskom nešto kažeš, a on ti nešto odgovori.

Uzmeš model koji je prednaučen nastavljati unos (dakle, GPT-2 je najbolji u tom pogledu), uzmeš dataset u kojem se chatta, i finetuneaš tu mrežu da razgovara nalik na taj dataset. Taj model će razumjeti strukturu engleskog jezika, ti ćeš ga samo usmjeriti da drži razgovor na engleskom.


[obrisani korisnik]

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽
Bi li to bio plagijat onda, pošto ništa nije moje? Ne postoji li već milijardu takvih chatbotova?


micho

[obrisani korisnik] nije plagijat ak si sam dotrenirao mrežu


[obrisani korisnik]

[obrisani korisnik] Nije plagijat ako kažeš da si koristi GPT-2, i dotrenirao ga. Kad bi to bio plagijat, onda bi svaki rad koji koristi bilo kakav library ili nešto sl, bio plagijat.


jadzia-dax

M̵̧̩͑̀͝î̶͍̉ć̴̝̾́̀o̶̺̟̣͂̽ a i realno na faksu prolaze svakakve umotvorine pod zavrsne i diplomske radove koje u stvarnom svijetu granice s ilegalnim, odnosno definitivno ne uporabom koja nije bas u skladu sa svim propisima

terms of service, licence i slicne stvari


[obrisani korisnik]

[obrisani korisnik]
A ok, hvala na odgovorima, samo se brinem da to bude dovoljno “moje”, tj. da se ne desi kad budem pred povjerenstvom da samo kazem “samo sam malo tu promijenio stvari”, tj. da mogu pricati sto sam ja radio tocno. Cak i ako ispadne chatbot dobar, ne znam hoce li me srusiti ako sam samo nesto finetunao, a osim toga budem imao neki minimalan frontend i backend.


jadzia-dax

[obrisani korisnik] mislim da se malo previse brines, sto god radio, mentor ti to prvo treba potvrditi, tako da je po njegovoj procjeni opseg dovoljan

drugo, da nekog sruse na obrani, je limes koji tezi u 0^+

no, uzmi u obzir da ako nisi sam napravio previse toga da ce ti pomalo tesko biti nakucati tekst


micho

[obrisani korisnik] Mogu ti odmah reći da ako planiraš da to bude “skroz tvoje”, spremi se na pad kod mentora kad to ne bude radilo nikako. Ne znam kako da ti kvantiziram to ali nemaš ni 1% potrebnog znanja da bi napravio funkcionalan chatbot iz nule. Naravno, ako imaš veće standarde od Andrija AI. A i da imaš, nemaš milijune dolara za razvoj takvog rješenja. A i pazi, da sve to imaš, sama razrada u teoriji toga ima 500-1000 stranica, dakle na nivou doktorskog rada.


iLabaviUmeDaZabavi

[obrisani korisnik] Previse brines, nisi na ETH Zurichu


[obrisani korisnik]

Jadzia Dax no, uzmi u obzir da ako nisi sam napravio previse toga da ce ti pomalo tesko biti nakucati tekst

Pa neće, količina samostalnog rada u praktičnom dijelu nema baš previše veze s tim koliko toga možeš nakucati.

Može nakucati 100 stranica općenito o NLP-u, GPL2-model, onda kako ga je pokretao, pa pa kako ga je finetuneao i s kojim podacima.


« Prethodna stranica Sljedeća stranica »