Abstract
O‘zbek tili korpusida NER obyektlarini teglash jarayonidagi asosiy muammolar va ularning mumkin bo‘lgan yechimlari tahlil qilish muhimdir. Maqolada, o‘zbek tilidagi NER tizimini rivojlantirishda duch kelinadigan asosiy muammolar – tegishli korpus yetishmovchiligi, so‘z shakllarining ko‘p variantliligi, ommaviy ochiq NER ma’lumotlar bazasining kamligi va semantik noaniqlik kabi jihatlar yoritiladi.
Shuningdek, maqolada ushbu muammolarni hal qilish uchun zamonaviy texnologiyalar, xususan, mashinani o‘rganish (Machine Learning), chuqur o‘rganish (Deep Learning) va tabiiy tilni qayta ishlashga oid ilg‘or metodlar tahlil qilinadi. Bundan tashqari, o‘zbek tiliga moslashtirilgan, maxsus annotatsiyalangan katta hajmdagi korpus va uni xalqaro standartlarga moslashtirish muhim ekani qayd etiladi.