XORAZM SHEVASIDAGI MATNLARNI O‘ZBEK ADABIY TILIGA O‘GIRISH MASHINALI TARJIMA MODELINI QURISH UCHUN PARALLEL KORPUS YARATISH
Published 2025-05-02
Keywords
- Xorazm shevasi, o‘zbek adabiy tili, parallel korpus, mashinali tarjima, dialektologiya, NLP.
Abstract
Ushbu maqolada Xorazm shevasidagi matnlarni o‘zbek adabiy tiliga mashinali tarjima qilish imkonini beruvchi tizimni qurish uchun zarur bo‘lgan parallel korpus yaratish masalasi yoritilgan. Dialektal tilni standart tilga moslashtirishda dastlabki va muhim bosqich sifatida sheva-adabiy til juftliklaridan iborat parallel korpus tuzildi. Korpusni shakllantirishda Xorazm shevasida yozilgan ijtimoiy tarmoq matnlari, og‘zaki xalq ijodi namunalarining matnga ko‘chirilgan variantlari, hamda hududiy OAV materiallari asos sifatida tanlandi. Har bir shevada berilgan gapga mos holda o‘zbek adabiy tilida qo‘lda tarjima tayyorlandi. Korpus XML formatida belgilandi va u mashinali tarjima modellarini kelgusida o‘rgatish uchun tayyorlangan ma’lumotlar bazasini tashkil etadi. Tadqiqot natijasi sifatida mashinaviy tarjima va dialektologik izlanishlar uchun ochiq parallel resurs yaratildi.