Didelį kategorijų kiekį turinčių draudimo bendrovės klientų užklausų, gautų elektroniniais laiškais, lietuviško teksto klasifikavimas
Technologijos mokslai
Karolis Kiaunė
Vilniaus Gedimino technikos universitetas
Simona Ramanauskaitė
doc. dr., Vilniaus Gedimino technikos universitetas
http://orcid.org/0000-0003-3195-4280
Publikuota 2019-12-18
https://doi.org/10.21277/jmd.v49i2.235
PDF

Reikšminiai žodžiai

NLP
teksto klasifikavimas
elektroniniai laiškai
teksto apdorojimas

Kaip cituoti

Kiaunė, K. and Ramanauskaitė, S. (2019) “Didelį kategorijų kiekį turinčių draudimo bendrovės klientų užklausų, gautų elektroniniais laiškais, lietuviško teksto klasifikavimas”, Jaunųjų mokslininkų darbai, 49(2), pp. 52–59. doi:10.21277/jmd.v49i2.235.

Santrauka

Natūralios kalbos apdorojimas ir klasifikavimas jau plačiai naudojamas anglakalbėse šalyse. Tačiau lietuviško teksto analizė ir klasifikacija yra sudėtinga ir dar nevisiškai įgyvendinta. Taip yra dėl lietuvių kalbos sudėtingumo ir savitumo, todėl kitoms kalboms tinkami metodai ne visada tinka lietuvių kalbai.
Šiame straipsnyje naudojamos trys pasirinktos tekstų apdorojimo parinktys bei įvairios jų kombinacijos ir įvertinama, kaip skirtingi nuoseklūs teksto klasifikavimo būdai gali klasifikuoti draudimo bendrovės klientų užklausas, gautas el. paštu. Šis tyrimas yra išskirtinis naudojamų metodų gausa ir papildomai įvertina lietuviško teksto klasifikavimo tikslumą daugelyje (33) kategorijų.
Straipsnyje aptariamos natūralios kalbos apdorojimo problemos, analogiški tyrimai su lietuvių kalba parašytų tekstų klasifikacija, pristatoma siūloma tyrimo metodika ir aptariami tyrimo rezultatai.

PDF

Atsisiuntimai

Nėra atsisiuntimų.