«Яндекс Переводчик» начал использовать в работе нейронную сеть

Поисковые системы >> 15.09.2017, 18:19

Специалисты компании «Яндекс» сообщили, что сервис «Яндекс Переводчик» начал применять в своей работе технологии нейронных сетей, что позволяет значительно улучшить качество перевода текстов. Сервис, как отметил представитель компании «Яндекс» функционирует по гибридной системе: к статистической модели, действующей в сервисе с момента его создания, была добавлена технологий перевода с использованием возможностей нейронных сетей.

Основным отличием нейронной технологии является тот факт, что она не производит разбивку текста на отдельные слова и фразы, как это делает статистический переводчик. Технология охватывает предложение целиком, м выдаёт максимально точный его перевод. Использование подобного способа перевода, как отметил представитель компании «Яндекс», позволяет учитывать контекст переводимого, и лучше передать его смысловую нагрузку. Статистическая модель, как отмечают эксперты, гораздо лучше переводит редкие слова и фразы. При непонятном смысле переводимого предложения статистическая модель не включает фантазию, как это делает нейросеть, отметил представитель компании «Яндекс».

При переводе текста сервис использует обе модели, после чего специальный алгоритм машинного обучения под названием «CatBoost», производит сравнение двух вариантов, и выдаёт тот, что является лучшим по его мнению. Гибридная система берёт лучшее от каждой модели перевода, что позволяет, в значительной степени, повысить качество перевода, отметили в «Яндекс». Кроме того, представители компании пообещали интегрировать в сервис переводчик, который позволит провести сравнительный анализ переводов, сделанный статистической и нейронной моделью.

Как отметил представитель компании «Яндекс», на начальном этапе гибридная модель будет работать только для переводов текста с английского на русский, так как это самое востребованное направление для переводов. Добавить другие языки планируют в течение нескольких месяцев, однако точные сроки не называют.