Abstract
Ma’lumotlar ilmi (Data science) va korpus lingvistikasi so‘nggi yillarda tobora o‘zaro bog‘langan ikkita sohadir. Ushbu maqola til ma’lumotlarining tahlil qilish uchun ma’lumotlar ilmi va tabiiy tillarni qayta ishlash (NLP) texnnologiyasidan foydalangan so‘nggi tadqiqotlarni ko‘rib chiqish orqali ushbu sohalarning kesishishini o‘rganadi. Biz ushbu usullardan Korpus lingvistikasida an’anaviy ravishda qo‘lda bajariladigan ko‘plab vazifalarni avtomatlashtirish uchun qanday foydalanish mumkinligini va ulardan ma’lumotlardagi qolip va tendensiyalarni aniqlash uchun qanday foydalanish mumkinligini muhokama qilamiz. Shuningdek, his-tuyg‘ularni vaqt o‘tishi bilan til o‘zgarishini tahlil qilish va til ma’lumotlariga asoslangan bashoratli modellarni yaratish uchun ma’lumotlar ilmi va NLP texnikasining imkoniyatlarini o‘rganamiz. Va nihoyat, biz ushbu sohalarning kelajagi va NLP va Data Science texnikasidan foydalanish bilan bog‘liq axloqiy va maxfiylik muammolarini hal qilish zarurligini muhokama qilamiz.