O‘ZBEK TILIDAGI MATNLARDA OT VA OLMOSH SO‘Z TURKUMLARIGA TEGISHLI SO‘ZLARNI ANIQLOVCHI ALGORITM YARATISH
Published 2023-04-30
Keywords
- Tabiiy til jarayonlari (TTJ), teglash, so‘z turkumlari, ot, olmosh, asos, qo‘shimchalar, lemma, lemmatizatsiya, Chekli holatlar mashinasi (ChHM).
Abstract
Ushbu maqolada o‘zbek tili matnlarida ot va olmosh so‘z turkumlarini aniqlashning qoidaga asoslangan algoritmini yaratish ko‘rib chiqilgan. Ot va olmoshlarni matnlarda aniqlash va morfologik tahlil qilish o‘zbek tili uchun tabiiy til jarayonlarining (TTJ) bir qator masalalarini (POS tagging, mashinali tarjimon va h.k.) yechishda foydali bo‘ladi. Barcha turkiy tillar kabi o‘zbek tili ham agglyutinativ til bo‘lib soʻz oʻzak yoki negiziga qoʻshimchalar qoʻshilishi orqali yasaladi. Bu masalani yechish uchun tub bo‘lgan ot va olmosh so‘zlar bazasi yaratildi, bundan tashqari ot va olmoshning so‘z yasovchi va shakl yasovchi qo‘shimchalar bazasi shakllantirildi.