Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius
Straipsniai
Paulius Zaranka
Vilniaus universitetas
Gražina Korvel
Vilniaus universitetas
Publikuota 2024-05-13
https://doi.org/10.15388/LMITT.2024.22
PDF

Reikšminiai žodžiai

propagandos atpažinimas
daugiakalbiai modeliai
transformeriai
iš anksto apmokyti modeliai
modelių adaptavimas

Kaip cituoti

Zaranka, P. and Korvel, G. (2024) “Propagandos atpažinimas lietuviškame tekste naudojant transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius”, Vilnius University Open Series, pp. 154–159. doi:10.15388/LMITT.2024.22.

Santrauka

Didėjant informacijos kiekiui ir jos svarbai visuomenėje atsiranda vis didesnis poreikis automatinių įrankių, gebančių atpažinti propagandą. Dėl geopolitinės situacijos Lietuvos valstybė gali būti ypatingai pažeidžiama propagandinių mechanizmų, o automatinis jos atpažinimas lietuviškuose tekstuose yra nepakankamai ištyrinėta sritis. Šio darbo tikslas – išbandyti 3 pagrindinius transformeriais pagrįstus, iš anksto apmokytus daugiakalbius modelius propagandos atpažinimui. Sprendžiamas binarinis klasifikavimo uždavinys, priskiriant tekstui propagandinio arba nepropagandinio teksto klasę. LitLat, XLM-R ir mBERT modeliai adaptuoti apmokant ekspertų suanotuotu duomenų rinkiniu. Nors geriausią, 88,5 % F1 statistikos įvertį pavyko pasiekti adaptavus LitLat iš anksto apmokytą modelį, kiti šiame darbe adaptuoti modeliai pasiekia panašius rezultatus.

PDF
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.