Том 1 № 1 (2023): КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: ПРОБЛЕМЫ, РЕШЕНИЯ, ПЕРСПЕКТИВЫ
Статьи

OʻZBEK TILI MATNLARINI QAYTA ISHLASHDA BOW ALGORITMIDAN FOYDALANISH

Zilola Xusainova
Alisher Navoiy nomidagi Toshkent davlat o`zbek tili va adabiyoti universiteti
Биография
Xusanboyeva Jamila
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Биография
Bekqulova Sevinch
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Биография
Bekchanova Munira
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Биография

Опубликован 2023-04-30

Ключевые слова

  • BoW, Bag of words, soʻzlar jamlanmasi, soʻz vektori, token, BoW algoritmi, TF-IDF usuli

Аннотация

Bag Of Words (BoW) modellashtirish algoritmidan foydalanib, matnni raqamli matritsalarga aylantirish va qayta ishlash mumkin. Soʻzlar sumkasi (BoW) – soʻzning hujjatdagi statistikasini hisoblash algoritm hisoblanadi. BoW algoritmidan foydalanib hujjatlarni oʻzaro solishtirish, qidiruv tizimlarida ma’lumotlarni izlash, hujjatlarni tasniflash va tematik modellashtirish mumkin. Ushbu maqolada oʻzbek tilidagi matnlarni BoW algoritmidan foydalanib raqamli shaklga oʻtkazish usullari keltiriladi.