КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА

ВЫЧИСЛИТЕЛЬНАЯ ЯЗЫКОВКА: ШАГ К РАЗВИТИЮ

Существование узбекского компьютерного языка, адаптированного для искусственного интеллекта, является залогом его национального развития и выживания.

Сегодня повышение культуры грамотности в нашей стране, укрепление статуса нашего государственного языка, развитие престижа узбекского языка в мировом сообществе стало одним из приоритетов государственной политики.

В этой связи обнародование Указа Президента Республики Узбекистан от 21 октября 2019 года ПФ-5850 «О мерах по кардинальному повышению престижа и статуса узбекского языка как государственного» ускорило движение. Как отмечается в указе, узбекский язык активно используется в политической, правовой, социально-экономической, духовной и образовательной сферах, широко слышен на международных форумах. Интерес к нашему языку и его изучению в зарубежных странах растет.

Поэтому поставленные в Указе вопросы, в том числе кардинальное повышение престижа узбекского языка в общественной жизни нашего народа, на международном уровне и повышение роли и престижа государственного языка, обеспечение достойного места узбекского языка в информационной и коммуникационные технологии, в частности Интернет. Такие задачи, как создание, особенно примечательны своей чрезвычайной срочностью. Сегодня активное потребление естественного языка определяется его отражением в цифровых технологиях и созданием его формального облика.

Компьютерная лингвистика в Ташкентском государственном университете узбекского языка и литературы имени Алишера Навои

В процессе стратегического образования, направленного на выполнение этих задач, в Ташкентском государственном университете узбекского языка и литературы имени Алишера Навои в 2020 году открыта магистратура 5А120106 - «Компьютерная лингвистика», на которую принято 13 магистров.

Компьютерная лингвистика - это область образования, направленная на решение языковых задач с помощью компьютерных программ, основной упор делается на создание формальной грамматики узбекского языка, создание лингвистической базы всех связанных с языком явлений. В этом случае языковые правила приобретают формальный вид. Поэтому роль компьютерного лингвиста в переводе естественного языка на машинный неоценима.

Узбекская компьютерная лингвистика сформировалась в конце двадцатого века, первоначально в результате научных исследований и создания ряда частотных словарей с помощью программного обеспечения, которое определяет частоту слов, наиболее часто используемых в периодических изданиях и ряде художественной литературы. К 20-м годам XXI века проведение исследований с практическими результатами, создание различных лингвистических программ (автоматическое редактирование и анализ, транслитерация, мобильные приложения) и получение степени магистра компьютерной лингвистики в вузах республики (Ташкентский государственный университет ) с открытием сцены начался собственный путь развития.10-е годы XXI века

20-е годы XXI века

В нашем университете такие дисциплины, как «Компьютерная лингвистика», «Машинный перевод», «Обработка естественного языка / NLP», «Язык программирования Python», «База данных» преподаются на основе двух модулей: лингвистические знания и программная инженерия. Эта интеграция информационных технологий и лингвистики приносит свои плоды: студенты приобретают навыки и компетенции для формирования лингвистической базы данных, адаптированной к целям этих дисциплин.

Известно, что в сервисах переводчиков Google, Yandex (Online) есть узбекский язык, но поскольку узбекский язык не полностью отражен в памяти этих систем перевода, во многих случаях перевод не имеет ясности и языкового выражения оригинала. Чтобы устранить причину приговора, нужно приложить немало усилий. Поэтому следующие вопросы в области компьютерной лингвистики являются приоритетными в нашем университете:

формирование цифровой лингвистики;

- создание корпуса национального языка;

- создание системы обучения языкам;

- электронные словари нового поколения;

- литература для электронного обучения;

- Отличные программы-переводчики;

- Программа текстового редактора Word предназначена для создания возможности редактирования и анализа узбекских текстов.

По реализации этих задач ведутся как научные, так и практические исследования, и усилия приносят свои плоды. В частности, была создана программа для редактирования и анализа текста на операционной системе Ubuntu Linux. В настоящее время ведутся исследования по включению его лингвистической базы данных в Microsoft Office.

Приоритеты определены в соответствии с Постановлением Президента Республики Узбекистан от 17 февраля 2021 года «О мерах по созданию условий для ускоренного внедрения технологий искусственного интеллекта» и Стратегией «Цифровой Узбекистан - 2030» по ускорению создания искусственного интеллекта. интеллект в социальной сфере Ряд практических проектов

в стадии реализации.

Наши достижения

В результате практического проекта «Разработка узбекского речевого программного обеспечения и синтезатора голоса для слабовидящих с использованием компьютерных технологий, чтения и написания текстов» был создан узбекский синтезатор речи (Text to Speech / TTS). .

Этот синтезатор речи позволяет автоматически озвучивать написанные тексты. Следует отметить, что создание этого синтезатора речи - первый эксперимент в узбекской компьютерной лингвистике. Теперь будут решены проблемы, связанные с процессом самостоятельной работы слепых с электронными текстами на узбекском языке, и их трудоустройство будет обеспечено.

Как известно, сегодня эффективное использование богатого выразительного потенциала узбекского языка стало одним из приоритетов государственной политики. Один из главных признаков речевой культуры - правильное произношение. Проблемы в этой области отражаются в произношении слов, изученных на языках со свободным акцентом. Слова, ассимилированные в определенном языке, имеют тенденцию восстанавливаться в соответствии с природой и законами этого языка, что заставляет усвоенные слова оседать из лексического слоя языка.

Например: моносемия (по-русски) - моносемия (по-узбекски), мускул (по-русски) - мускул (по-узбекски). Сохранение акцента в языке или исходном языке, к которому принадлежит приобретенное слово, может помешать усвоению международного слова. Учитывая схожие аспекты, университет подготовил к изданию в 2-х томах «Акцентный словарь узбекских слов», который включает 11 000 слов, широко используемых компьютерными лингвистами в различных сферах и социальных сетях.

Этот словарь играет особую роль в устранении речевых ошибок, вызванных ударением слов в узбекском языке, служит ценным лексикографическим источником при разработке речевых корпусов и лингвистических моделей для узбекского синтезатора речи и программного обеспечения распознавания речи, автоматического анализа и программы автоматического перевода. Теле- и радиоканалы будут играть важную роль в курсах переподготовки, организованных с целью повышения речевой культуры спикеров.

Еще один такой проект реализуется на основе задач, поставленных научным сообществом университета по грантовому проекту «Создание образовательного корпуса узбекского языка» на 2020-2022 годы. В результате этого проекта будет создан учебный корпус, который будет служить общеобразовательным инструментом III эпохи Возрождения. Основное внимание уделяется созданию современного электронного учебника, 10 видов филологических словарей и непереведенных лексических единиц узбекского языка - толковых словарей национальных и культурных слов, лексикографических мобильных приложений и мультимедийных продуктов, направленных на развитие навыков правильного произношения на узбекском языке.

Известно, что обучение языку требует большой работы. В настоящее время актуальной проблемой стало создание инновационных образовательных технологий, основанных на потребностях и запросах современного студента. В качестве решения этих проблем ведется активная работа над практическим проектом «Создание лингводидактической электронной платформы тюркских языков», направленным на обучение турок, казахов, киргизов, азербайджанцев и татар узбекскому языку на их родных языках.

Основная цель - продемонстрировать природу узбекского языка на этих тюркских языках с помощью компьютерных технологий и выразить текстовые и звуковые разговоры узбекского языка в творческих графических проектах, обеспечить мультимедийную интерпретацию фольклора на других тюркских языках. на единой платформе. Он учитывает преподавание языков и популяризацию нашего духовного наследия через электронную платформу.

Благодаря целевой онлайн-пропаганде профессоров и преподавателей вузов, сегодня наши студенты создают и запускают мобильные приложения по «Навоийской газели», «Творчеству Бобура» и ряду учебных предметов и художественной литературы.

Мобильное приложение «Навои Газели»

Мобильное приложение Bobur Ijodi

Также прилежными мастерами компьютерной лингвистики был создан специальный сайт (http://alisher.navoiy-uni.uz/), отражающий личность и творчество Алишера Навои.

Специалисты в области компьютерной лингвистики как специалисты-новаторы, которые создают и работают над филологическими программами:

Преподаватели и исследователи высших учебных заведений республики;

Специалисты по информационным технологиям в туристических информационных центрах;
Специалисты, преподающие информатику и родной язык в образовательных учреждениях на основе интеграции;
Специалисты по созданию электронных словарей в государственных и негосударственных издательствах республики;
Специалист по международным отношениям / редактор-переводчик;
Они смогут работать над созданием информационно-поисковых систем в электронном правительстве.

Перед университетом стоит высокая цель - объединить узбекский язык и современные информационные технологии, укрепить позиции

наш национальный язык в мировом сообществе и дальнейшее повышение престижа нашего духовного наследия в развитии компьютерной лингвистики и цифровых публикаций.

Елов Ботир Болтаевич - заведующий кафедрой информационных технологий Ташкентского государственного университета узбекского языка и литературы имени Алишера Навои, доктор философии (PhD) технических наук

Абджалова Манзура Абдурашетовна - доктор философских наук, и.о. доцента кафедры «Информационные технологии» Ташкентского государственного университета узбекского языка и литературы имени Алишера Навои.