O‘ZBEK TILIDAGI MATNLAR KOREFERENSIYASINI AVTOMATIK ANIQLASH TIZIMINING LINGVISTIK TA’MINOTINI SHAKLLANTIRISH XUSUSIDA
Опубликован 2025-05-03
Ключевые слова
- koreferensiya, NLP, ma’lumotlar bazasi, annotatsiyalash, SQL Server, korpus, tizim, o‘zbek tili
Аннотация
Tabiiy tilga ishlov berish uchun ishlab chiqilgan tizimlar, birinchi navbatda, ma’lumotlar bazasi bilan ta’minlanishi kerak. Ma’lumotlar bazasidagi ma’lumotlarni tez fursatda qayta ishlash, ulardan qulay tarzda foydalanish maqsadida lingvistik bazalar ma’lumotlar bazasini boshqarish tizimlari (MBBT)da saqlanadi. Ushbu maqolada ma’lumotlar bazasini yaratishda e’tibor qaratish zarur bo‘lgan jihatlar, o‘zbek tilidagi matnlar koreferensiyasini avtomatik aniqlash tizimining lingvistik ta’minotini tuzishda, ularni annotatsiyalashda tayanilgan tamoyillar, ma’lumotlar bazasini SQL Serverga kiritish jarayoni haqida
so‘z yuritiladi. Ma’lumotlarni MBBTda saqlash nafaqat tahlilni soddalashtiradi, balki NLP modellari bilan ishlashda aniq va izchil ma’lumot almashinuvini ta’minlaydi. Tadqiqot o‘zbek tilida koreferensiyani modellashtirishga doir dastlabki amaliy yondashuvlardan biri bo‘lib, koreferensiyani avtomatik aniqlash tizimi, o‘zbek tilidagi matnlarni tahlil qiluvchi algoritmlar va ma’lumotlar bazasi asosida ishlovchi lingvistik vositalarni yaratishda muhim poydevor bo‘lib xizmat qiladi.