Vol. 1 No. 1 (2024): COMPUTER LINGUISTICS: PROBLEMS, SOLUTIONS, PROSPECTS
Articles

O‘ZBEK MATNLARI UCHUN COUNT VECTORIZER IMKONIYATLARI VA KAMCHILIKLARI

Gulshahnoz Mahmudjonova
Alisher Navoiy nomidagi Toshkent davlat o‘zbek tili va adabiyoti universiteti
Bio

Published 2024-05-22

Keywords

  • Matn, hujjat, normallashtirish, scikit-learn, indeks, vektorlar, NLP.

Abstract

Ushbu maqola matn ma’lumotlarini raqamli tasvirlarga aylantirish uchun tabiiy tilni qayta ishlash (NLP)ning asosiy vositasi bo‘lgan CountVectorizer haqida umumiy ma’lumot beradi. U mashinani o‘rganish vazifalarida qo‘llanilishi, soddaligi va samaradorligi kabi afzalliklari, shuningdek, semantik tushunish kabi kamchiliklarni muhokama qiladi.