HTML kodo blokų panašumo vertinimas
Technologijos mokslai
Simona Ramanauskaitė
Vilniaus Gedimino technikos universitetas
Kiril Griazev
Vilniaus Gedimino technikos universitetas
Publikuota 2018-06-25
https://doi.org/10.21277/jmd.v48i1.219

Reikšminiai žodžiai

HTML
duomenų panašumas
panašumo vertinimas

Kaip cituoti

Ramanauskaitė, S. and Griazev, K. (2018) “HTML kodo blokų panašumo vertinimas”, Jaunųjų mokslininkų darbai, 48(1), pp. 30–35. doi:10.21277/jmd.v48i1.219.

Santrauka

Duomenų gavyba iš interneto tinklalapių vis dažniau naudojama organizacijų darbinėje veikloje. Tačiau analizuojant šiuo metu esamą situaciją pastebima, kad egzistuoja metodų ir įrankių pasiūla, kurie gali duomenis atrinkti iš struktūrizuotų puslapių, tuo tarpu nestruktūrizuotiems net nėra mokslinio duomenų rinkinio, kuriuo vadovaujantis būtų galima kurti ir testuoti naujus duomenų atrankos metodus. Šiame darbe siekiama pakeisti šią situaciją, kaip pirmą žingsnį link restruktūrizuotų duomenų rinkinio sukūrimo, pateikiant metodą, skirtą HTML kodo blokų panašumui įvertinti. Šis metodas apima duomenų ir struktūros panašumo vertinimą ir leis kiekybiškai įvertinti dviejų HTML kodo blokų panašumo lygį.

Atsisiuntimai

Nėra atsisiuntimų.