Опубликован 2026-05-31
Ключевые слова
- diaxron korpus, NLP, korpus lingvistikasi, lemmatizatsiya, morfologik tahlil, POS-teglash, TTR, o‘zbek tili.
Аннотация
Mazkur maqolada o‘zbek tilidagi diaxron korpus asosida til o‘zgarishlarini tabiiy tilni qayta ishlash (NLP) usullari yordamida tahlil qilish masalasi yoritiladi. Tadqiqotda 1920–2025-yillar oralig‘idagi matnlar asosida shakllantirilgan diaxron korpusdan foydalanildi. Korpus tarkibidagi matnlar avtomatik ravishda normalizatsiya qilinib, morfologik tahlil, lemmatizatsiya, POS-teglash va statistik modellashtirish bosqichlaridan o‘tkazildi. Tadqiqot natijalari leksik, morfologik va sintaktik qatlamlarda sezilarli diaxron o‘zgarishlar mavjudligini ko‘rsatdi. Xususan, ayrim tarixiy birliklarning iste’moldan chiqishi, yangi terminlarning paydo bo‘lishi, Type-Token Ratio (TTR) ko‘rsatkichining pasayishi hamda gap uzunligining qisqarishi kuzatildi. Tadqiqot natijalari o‘zbek tilining tarixiy taraqqiyotini kompyuter lingvistikasi metodlari asosida tahlil qilish imkoniyatlarini kengaytiradi.