Published 2025-05-02
Keywords
- POS teglash, O‘zbek tili, tabiiy tilni qayta ishlash, NLP, yashirin Markov modeli, HMM, chuqur o‘rganish, BiLSTM, Universal Dependencies, BERT.
Abstract
Ushbu maqola O‘zbek tilidagi so‘zlarni grammatik turkumlar (Part-of-Speech, POS) bo‘yicha teglashning zamonaviy usullarini tizimli tahlil qilishga bag‘ishlangan. O‘zbek tilining agglyutinativ tuzilishi, boy shakl yasovchi qo‘shimchalar tizimi va raqamli resurslarning cheklanganligi POS teglash jarayonini murakkablashtiradi. Tadqiqotda qoidaviy yondashuv, statistik modellar (Hidden Markov Model, Conditional Random Fields) va chuqur o‘rganish (Deep Learning) asosidagi usullar o‘zaro taqqoslanadi. Xususan, HMM asosidagi teglash, BiLSTM arxitekturasiga asoslangan neyron modellar va so‘nggi yillarda ishlab chiqilgan BERT asosidagi tillararo va monolingval modellar tahlil qilinadi. Shuningdek, O‘zbek tili uchun yaratilgan Universal Dependencies treebank va boshqa teglangan korpuslar imkoniyatlari baholanadi. Tadqiqot natijalari shuni ko‘rsatadiki, neyron tarmoq asosidagi modellar (91% gacha aniqlik) an’anaviy statistik va qoidaviy usullardan (86% atrofida) ustunlik qiladi, biroq resurs cheklangan sharoitda HMM modellari ham samarali alternativ bo‘la oladi.