Vol. 1 No. 1 (2023): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

OʻZBEK TILI MATNLARINI QAYTA ISHLASHDA BOW ALGORITMIDAN FOYDALANISH

Zilola Xusainova
Tashkent State University of Uzbek Language and Literature named after Alisher Navoi
Bio
Xusanboyeva Jamila
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Bio
Bekqulova Sevinch
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Bio
Bekchanova Munira
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Bio

Published 2023-04-30

Keywords

  • BoW, Bag of words, soʻzlar jamlanmasi, soʻz vektori, token, BoW algoritmi, TF-IDF usuli

Abstract

Bag Of Words (BoW) modellashtirish algoritmidan foydalanib, matnni raqamli matritsalarga aylantirish va qayta ishlash mumkin. Soʻzlar sumkasi (BoW) – soʻzning hujjatdagi statistikasini hisoblash algoritm hisoblanadi. BoW algoritmidan foydalanib hujjatlarni oʻzaro solishtirish, qidiruv tizimlarida ma’lumotlarni izlash, hujjatlarni tasniflash va tematik modellashtirish mumkin. Ushbu maqolada oʻzbek tilidagi matnlarni BoW algoritmidan foydalanib raqamli shaklga oʻtkazish usullari keltiriladi.