Articles
Abstract
Ushbu maqolada til korpuslari haqida ma’lumot berilgan. Sodda va qo‘shma gap turlari va ularning strukturalari orasidagi farqlar va ularni ajratish uchun qoidalar ishlab chiqilgan. Til korpusidan sodda gaplarni avtomatik aniqlash uchun farqlar asosida qoidalar ishlab chiqish mumkinligini izohlab misollar keltirilgan, kompyuter lingvistikasidagi model va model tushunchasiga izoh, til korpuslaridan sodda gaplarni aniqlashda tokenizatsiyaning maqsadlari haqida aytib o‘tilgan.