{{$root.pageTitleShort}}

Трудности электронного перевода

Цифровизация языков Кавказа: насколько точен электронный перевод для кабардино-черкесского, карачаево-балкарского и осетинского?

«Яндекс Переводчик» добавил кабардино-черкесский и карачаево-балкарский языки, расширив возможности для пользователей. Мы разбираемся, насколько совершенны эти новые словари и с какими трудностями может столкнуться пользователь при переводе.

Расширение языкового охвата — часть проекта, направленного на поддержку языков народов России. Яндекс запустил его в 2023 году совместно с Домом народов России и Федеральным агентством по делам национальностей. Первым из кавказских языков в переводчик добавили осетинский. В рамках проекта по поддержке языков народов России в сервисе доступны татарский, башкирский, два марийских (марийский и горномарийский) языка, удмуртский, чувашский, якутский, тувинский, осетинский, коми, эрзянский и мокшанский, которые являются официальными или государственными в 12 субъектах страны.

Наивный переводчик

Конечно, полноценным переводчиком эта модель пока не стала. Если простые бытовые фразы («здравствуйте!», «как дела?», «чем я могу помочь?» и др.) переводятся вполне адекватно, то в другом он несколько «наивен»: переводит буквально то, что чаще всего используется носителями языка в переносном значении. Например, перевод кабардинского слова «къыздэкIуэ» на русский и английский языки: «идущий со мной» и «coming with me». Это верный буквальный перевод, но также это значит «выходи за меня замуж». И во втором значении фраза используется чаще. Такие нюансы переводчику еще предстоит усвоить.

«Это Кавказ» обратился за комментарием к разработчикам, лингвистам и обычным пользователям.

Одним из разработчиков переводчика на карачаево-балкарский стал аналитик, кандидат технических наук Али Берберов:

В марте 2023 года ФАДН России разослало письмо высшим должностным лицам субъектов РФ с предложением начать работу по созданию корпусов языков для добавления их в сервис «Переводчик». Мы с Богданом Теунаевым, дата-сайентистом и моим другом, еще раньше собрали 289 тыс. пар предложений и обучили на нем первую карачаево-балкарскую нейросетевую модель перевода.


Мы передали в Яндекс наш карачаево-балкарский параллельный корпус из 289 тыс. пар предложений, а кабардинский языковой активист Анзор Кунаш передал кабардино-русский — 220 тыс. пар предложений. Стандартный датасет Яндекса из 100 тыс. предложений переводился в КБР силами общественной организации «Черкесский Ренессанс», нанявшей для этой цели школьных учителей кабардинского и балкарского языков. Аналогичная работа проводилась и в КЧР — силами Карачаево-Черкесского института гуманитарных исследований имени Х. Х. Хапсирокова.


В целом опыт можно считать успешным. Впереди нас ждут новые интересные проекты по развитию и сохранению родных языков.

Лариса Дзасежева, кандидат филологических наук, заведующая кафедрой английского языка КБГУ и автор блога Easy_adygebze смотрит на событие как профессионал, ежедневно сталкивающийся с проблемами перевода и в преподавательской, и в просветительской деятельности:

Для меня как для лингвиста и преподавателя интеграция кабардино-черкесского языка в «Переводчик» — это настоящий прорыв. Главное преимущество этого ресурса в том, что он действительно открывает новые горизонты для преподавания. По сути, мы получили мощный инструмент, который позволяет легко создавать самые разные задания буквально под любой уровень ученика. Теперь можно уйти от скучного заучивания и строить уроки вокруг развития языкового чутья и умения анализировать.


Это огромное подспорье для таких любителей родного языка, как я. Раньше создание упражнений часто требовало консультаций со специалистами, а теперь процесс станет значительно доступнее и быстрее. В конечном счете такая технологическая поддержка поможет нам всем вместе сделать изучение кабардино-черкесского языка более современным, увлекательным и эффективным.

По мнению Люсаны Абидоковой, главного редактора газеты «Черкес хэку» (КЧР), для журналистов и популяризаторов родных языков такой инструмент, как онлайн-переводчик, — неоценимый помощник в ежедневной работе:

Это мощный импульс, прорыв в цифровых технологиях, обеспечивающий сохранение национальных языков. Теперь у каждого появилась дополнительная возможность доступа к родному языку и культурному наследию своего народа. Онлайн-переводчик помогает не только сохранить язык — он является средством его возрождения.

Анна Токаренко, учитель русского языка, литературный критик и член жюри номинации «Молодость» премии «Ясная Поляна» часто приезжает на Кавказ. Она выделила те ключевые направления, по которым переводчик на языки народов Кавказа должен развиваться:

Я считаю хорошей новостью, что в «Яндекс Переводчике» теперь есть кабардино-черкесский, карачаево-балкарский и осетинский — языки моих любимых республик Северного Кавказа. Хотя в недолгих поездках я вряд ли буду им пользоваться: везде можно общаться на русском. Сейчас посмотрела несколько стандартных для туриста фраз на кабардино-черкесском: не зная произношения каких-то слов, можно попасть в неловкую ситуацию. Поэтому очень нужна озвучка! Да даже чтобы правильно прочитать в меню ресторанов название вкуснейшего кабардинского блюда «лыгъурлыбжьэ». Вообще, важно, чтобы добавлялись и другие национальные языки нашей страны.

Векторы дальнейшего развития видны уже сейчас, и нужно, чтобы эта работа продолжалась, считает Богдан Теунаев:

В проекте — разработка системы распознавания речи в текст и обратно, а также обучение языковой модели на основе собранного нами материала. В перспективе — полноценный голосовой помощник на карачаево-балкарском языке. Но и про свой переводчик мы не забываем: будем дополнять его разными диалектами и говорами карачаево-балкарского языка.

Марина Битокова

Рубрики

О ПРОЕКТЕ

«Первые лица Кавказа» — специальный проект портала «Это Кавказ» и информационного агентства ТАСС. В интервью с видными представителями региона — руководителями органов власти, главами крупнейших корпораций и компаний, лидерами общественного мнения, со всеми, кто действительно первый в своем деле, — мы говорим о главном: о жизни, о ценностях, о мыслях, о чувствах — обо всем, что не попадает в официальные отчеты, о самом личном и сокровенном.

СМОТРИТЕ ТАКЖЕ

Экскурсии без ограничений. Особенные гиды — о работе на Северном Кавказе

Как «показать» древнейший экспонат музея словами, объяснить шум горной реки на пальцах и почему в Чечне самый популярный жест в общении с туристами — «КРА»? Ответы знают герои нашего материала