Daugiaklasių duomenų klasifikavimo metodų tyrimas
Technologijos mokslai
Emilija Valujavičiūtė
Vilnius Tech
Publikuota 2024-04-09
https://doi.org/10.15388/JMD.2022.2.5
PDF
HTML

Reikšminiai žodžiai

daugiaklasis klasifikavimas
lietuvių kalba
daugiaklasiai tekstiniai duomenys
teksto klasifikacija
kategorijų nustatymo metodas
priklausymo kiekvienai kategorijai metodas
kategorijų kombinacijos nustatymo metodas

Kaip cituoti

Valujavičiūtė, E. (2024) “Daugiaklasių duomenų klasifikavimo metodų tyrimas”, Jaunųjų mokslininkų darbai, 52(2), pp. 50–59. doi:10.15388/JMD.2022.2.5.

Santrauka

Straipsnyje analizuojama, kokią įtaką lietuvių kalba rašytų tekstų, turinčių kelias klases, klasifikavimui turi pasirinktas modelio taikymo būdas. Pristatomas daugiaklasių lietuvių kalba rašytų duomenų klasifikavimo metodų tyrimas, kurio metu atlikta duomenų klasifikavimo metodų taikymo tikslumo lietuvių kalba rašytų daugiaklasių tekstų automatiniam klasifikavimui analizė. Apžvelgiami klasifikavimo metodai, vertinimo kriterijai, jų panaudojimo galimybės ir duomenų paruošimo klasifikavimui principai. Parengus tekstinius duomenis klasifikavimo uždaviniams spręsti, tyrimui buvo suformuoti 44 klasifikatorių deriniai ir atliktas klasifikavimas, naudojant tris skirtingus daugiaklasių duomenų klasifikacijos metodus: kategorijų nustatymo, priklausymo kiekvienai kategorijai ir kategorijų kombinacijos nustatymo. Rezultatai lyginami laiko ir klasifikavimo tikslumo aspektais, nustatant geriausių rezultatų pasiekusius klasifikatorius ir įvardijant naudotų klasifikavimo būdų skirtumus bei privalumus.

PDF
HTML
Kūrybinių bendrijų licencija

Šis kūrinys yra platinamas pagal Kūrybinių bendrijų Priskyrimas 4.0 tarptautinę licenciją.

Atsisiuntimai

Nėra atsisiuntimų.