Том 1 № 1 (2023): КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: ПРОБЛЕМЫ, РЕШЕНИЯ, ПЕРСПЕКТИВЫ
Статьи

ЎЗБЕК ТИЛИ МАТНЛАРИНИНГ РАЗМЕТКАЛАНГАН КОРПУСИНИ МОДЕЛЛАШТИРИШ

Abduvali Qarshiyev
Muhammad al-Xorazmiy nomidagi Toshkent axborot texnologiyalari universiteti
Биография

Опубликован 2023-04-29

Ключевые слова

  • корпус, модел, маълумотлар базаси, матн, разметка, тег, JSON, сўз.

Аннотация

Ушбу ишда, Ўзбек тили миллий корпусини қурилишида пайдо бўлган назарий ва амалий масалалар келтирилган. Корпусни қуриш вақтни ва меҳнатни талаб қилувчи жараёндир. Мавжуд корпусларни таҳлил қилиш натижасида кўриш мумкинки, корпусларни қуришда барча тиллар учун ягона бўлган методология мавжуд эмас. Ушбу мақолада корпусга қўйиладиган талаблар, корпус қуриш модели ва босқичлари таҳлил қилинган.