Skiemenų statistikos taikymas atskiriant poeziją nuo prozos
Straipsniai
Gediminas Murauskas
Vilniaus universitetas
https://orcid.org/0009-0008-9602-8345
Marijus Radavičius
Vilniaus universitetas
Publikuota 2022-12-20
https://doi.org/10.15388/LJS.2022.31988
PDF

Reikšminiai žodžiai

logistinė regresija
automatinis skiemenavimas
kryžminė patikra
apmokymas
klasifikavimo klaida

Kaip cituoti

Murauskas, G. and Radavičius, M. (2022) “Skiemenų statistikos taikymas atskiriant poeziją nuo prozos”, Lietuvos statistikos darbai, 61, pp. 32–45. doi:10.15388/LJS.2022.31988.

Santrauka

Straipsnio tikslas – sukonstruoti klasifikatorių, kuris pagal trumpas teksto ištraukas galėtų atskirti poeziją nuo prozos ir kurį kuo mažiau įtakotų atskirų autorių stilius ir kūrinių turinys. Todėl apmokant klasifikatorių naudojama tik informacija apie tekstų skiemenis, nes pastarieji atspindi kalbos fonetines savybes ir mažiau negu žodžiai yra susiję su tekstų turiniu. Tyrimas remiasi suskaitmenintų grožinės literatūros kūrinių bibliotekos  http://ebiblioteka.mkp.emokykla.lt tekstais. Jų pagrindu sudarytas ir apmokytas klasifikatorius atskirdamas testinius 100 žodžių ilgio poezijos ir prozos tekstų fragmentus darė mažiau negu 5\% klaidų.

PDF

Atsisiuntimai

Nėra atsisiuntimų.