studentski lider klub 9. generacija semeval-2017 slk_v2.pdf · i smijeh u kasnim satima malo toga...

1
44 Lider /// 15. rujna 2017. STUDENTSKI LIDER KLUB 9. GENERACIJA SemEval-2017 ZAGREBAČKI FEROVCI OSVOJILI VISOKO DRUGO MJESTO U HUMORU U TVITOVIMA Studenti TakLaba, članovi istraživačkog Laboratorija za analizu teksta i inženjerstvo znanja, natjecali su se u četiri izazovna zadatka iz primjene strojnog učenja u semantičkoj analizi prirodnog jezika Sustavi ferovaca mogu raspoznati sentiment tvita prema danoj temi, predvidjeti koji će od dva tvita ljudima biti smješniji te pronaći tematski najsličnija pitanja i najbolje odgovore na stranicama poput StackOverflowa a zagrebačkom FER-u već deset godina uspješno radi istraživačka skupina La- boratorij za analizu teksta i inženjer- stvo znanja (TakeLab) u kojoj se bave obradom informacija iz tekstnih izvora. Njihova istra- živanja obuhvaćaju obradu prirodnoga jezika, pre- traživanje informacija i strojno učenje. Ove godine studenti TakeLaba ostvarili su još jedan izvrstan rezultat: na poznatome međunarodnom na- tjecanju SemEval-2017, natječući se u četiri izazovna zadatka iz primjene strojnog učenja u semantičkoj analizi prirodnog jezika, među deset prijavljenih na- tjecatelja osvojili su visoko drugo mjesto u zadatku predviđanja humora u tvitovima, a među šesnaest natjecatelja treće mjesto u zadatku prepoznavanja sentimenta u tvitovima. – Kad smo krenuli, nismo znali mnogo o strojnom učenju i obradi prirodnoga jezika, zato je bio izazov osmisliti rješenje dok istodobno čitamo, povezu- jemo i učimo. Iznenadilo me koliko smo među- sobno naučili jedni od drugih. Uz razmjene ideja i smijeh u kasnim satima malo toga nam je bilo teško napraviti – prisjetila se studentica Doria Šarić početaka rada u timu. Sustav za smijeh i tugu Uz potporu čla- nova TakeLaba studenti Marin Kukovačec, Toni Kukurin, David Lozić, Juraj Malenica, Ivan Mršić, Lukrecija Puljić, Filip Šaina, Antonio Šajatović, Doria Šarić i Ivan Tokić razvili su sustave koji mogu raspoznati sentiment tvita prema danoj temi, pred- vidjeti koji će od dva tvita ljudima biti smješniji te pronaći tematski najsličnija pitanja i najbolje odgo- vore na stranicama poput StackOverflowa. – Sudjelovanje na SemEvalu bio je izazov koji je za- htijevao kreativnost i razvijanje osjećaja za način na koji ljudi komuniciraju i interpretiraju šale. Ame- rički kontekst šala bio je dodatna zapreka koja je zahtijevala promjenu stanja uma i detaljnu razradu. Sve u svemu, dobili smo priliku odmaknuti se od apstraktnoga gradiva faksa i približiti se nekim stvarnijim problemima – ispričao je Juraj Malenica, jedan od članova tima. – Hvala mentorima iz TakeLaba što su nam omo- gućili da projekt na fakultetu odradimo na zabavniji način i pomogli nam da primijenimo vlastita rje- šenja. Uistinu sam sretna što sam imala priliku biti dio ovog tima – zaključila je Šarić. Semantičke analize Valja spomenuti i da TakeLab provodi projekt 'CATACX' u kojemu se analizira mišljenje korisnika telekomunikacijskih usluga u komentarima na Facebooku, razvija plat- formu s pomoću koje istražuje što izvorni govornici hrvatskoga jezika misle o značenju pojedinih riječi i kako ih upotrebljavaju, a provodi i semantičku ana- lizu događaja ekstrahiranih iz novinskih tekstova. Izradio je i tražilicu CADIAL, javno dostupnu svim građanima naše zemlje, s pomoću koje korisnici mogu semantički pretraživati hrvatske zakone. L N Hrvatski tim koji je uspješno riješio četiri izazovna zadatka iz primjene strojnog učenja pripremio LUKA FIŠIĆ [email protected] 044-045 slk.indd 44 12.9.2017. 17:02:57

Upload: others

Post on 13-Sep-2019

11 views

Category:

Documents


0 download

TRANSCRIPT

44 Lider /// 15. rujna 2017.

S T U D E N T S K I L I D E R K L U B

9. G E N E R A C I J A

SemEval-2017ZAGREBAČKI FEROVCI OSVOJILI VISOKO DRUGO MJESTO U HUMORU U TVITOVIMAStudenti TakLaba, članovi istraživačkog Laboratorija za analizu teksta i inženjerstvo znanja, natjecali su se u četiri izazovna zadatka iz primjene strojnog učenja u semantičkoj analizi prirodnog jezika

STUDENTSKILIDER KLUB

Sustavi ferovaca mogu raspoznati sentiment tvita prema danoj temi, predvidjeti koji će od dva tvita ljudima biti smješniji te pronaći tematski najsličnija pitanja i najbolje odgovore na stranicama poput StackOverflowa

a zagrebačkom FER-u već deset godina uspješno radi istraživačka skupina La-boratorij za analizu teksta i inženjer-stvo znanja (TakeLab) u kojoj se bave

obradom informacija iz tekstnih izvora. Njihova istra-živanja obuhvaćaju obradu prirodnoga jezika, pre-traživanje informacija i strojno učenje. Ove godine studenti TakeLaba ostvarili su još jedan izvrstan rezultat: na poznatome međunarodnom na-tjecanju SemEval-2017, natječući se u četiri izazovna zadatka iz primjene strojnog učenja u semantičkoj analizi prirodnog jezika, među deset prijavljenih na-tjecatelja osvojili su visoko drugo mjesto u zadatku predviđanja humora u tvitovima, a među šesnaest natjecatelja treće mjesto u zadatku prepoznavanja sentimenta u tvitovima. – Kad smo krenuli, nismo znali mnogo o strojnom učenju i obradi prirodnoga jezika, zato je bio izazov osmisliti rješenje dok istodobno čitamo, povezu-jemo i učimo. Iznenadilo me koliko smo među-sobno naučili jedni od drugih. Uz razmjene ideja i smijeh u kasnim satima malo toga nam je bilo teško napraviti – prisjetila se studentica Doria Šarić početaka rada u timu.

Sustav za smijeh i tugu Uz potporu čla-nova TakeLaba studenti Marin Kukovačec, Toni Kukurin, David Lozić, Juraj Malenica, Ivan Mršić, Lukrecija Puljić, Filip Šaina, Antonio Šajatović, Doria Šarić i Ivan Tokić razvili su sustave koji mogu raspoznati sentiment tvita prema danoj temi, pred-vidjeti koji će od dva tvita ljudima biti smješniji te pronaći tematski najsličnija pitanja i najbolje odgo-vore na stranicama poput StackOverfl owa.– Sudjelovanje na SemEvalu bio je izazov koji je za-htijevao kreativnost i razvijanje osjećaja za način na koji ljudi komuniciraju i interpretiraju šale. Ame-

rički kontekst šala bio je dodatna zapreka koja je zahtijevala promjenu stanja uma i detaljnu razradu. Sve u svemu, dobili smo priliku odmaknuti se od apstraktnoga gradiva faksa i približiti se nekim stvarnijim problemima – ispričao je Juraj Malenica, jedan od članova tima.– Hvala mentorima iz TakeLaba što su nam omo-gućili da projekt na fakultetu odradimo na zabavniji način i pomogli nam da primijenimo vlastita rje-šenja. Uistinu sam sretna što sam imala priliku biti dio ovog tima – zaključila je Šarić.

Semantičke analize Valja spomenuti i da TakeLab provodi projekt 'CATACX' u kojemu se analizira mišljenje korisnika telekomunikacijskih usluga u komentarima na Facebooku, razvija plat-formu s pomoću koje istražuje što izvorni govornici hrvatskoga jezika misle o značenju pojedinih riječi i kako ih upotrebljavaju, a provodi i semantičku ana-lizu događaja ekstrahiranih iz novinskih tekstova. Izradio je i tražilicu CADIAL, javno dostupnu svim građanima naše zemlje, s pomoću koje korisnici mogu semantički pretraživati hrvatske zakone. L

N

Hrvatski tim koji je uspješno riješio četiri izazovna zadatka iz primjene strojnog učenja

pripremio LUKA FIŠIĆ[email protected]

044-045 slk.indd 44 12.9.2017. 17:02:57