Вернуться в блог
Выковано в Мастерской:

Машинный перевод в локализации: мнения и всяческие за и против

Битва людей и роботов — жаркая тема для дискуссии.

Битва людей и роботов — жаркая тема для дискуссии. Возможно, что и наши клиенты, и наши коллеги размышляют на темы: «ИИ переводит тексты не хуже людей — скоро и половина переводчиков вымрет, да и переводчик в гугле не такой уж и ужасный по сравнению с 2005 годом», «Зачем платить целой толпе людей, если один робот справится лучше?», «А не отберут ли бездушные железяки мою работу?», «Стоит ли вообще напрягаться с учебой? Библиотекари вон почти вымерли, а следующие мы».

Буквально лет пять-десять назад про адекватный машинный перевод в индустрии говорили только научные гики. Но сейчас практически на каждой конференции поднимается этот вопрос. Обсуждаются изменения в индустрии, развитие целого направления. Появилась новая востребованная профессия — постредактор машинного перевода.

Профессий, связанных с работой ИИ и роботизацией, с каждым годом становится всё больше, а ручной труд в промышленных масштабах требуется всё меньше.

Посмотрите, как ИИ становится всё востребованнее

Источник: Исследование о востребованности навыков работы с ИИ в вакансиях. Весь отчет посвящен росту значения ИИ во многих отраслях: от технических до творческих профессий

Машинный перевод сейчас активно внедряется в арсенал инструментов переводчиков и локализаторов.

Но точно ли он нужен локализаторам? Не прячется ли под шкурой ягненка бездушный и беспощадный Т-1000? Это панацея и дорога в светлое будущее или нет?

Есть и вопросы со стороны клиента — если МТ так уж хорош, быстр и ловок, то зачем платить больше за кучу человеческого ресурса?

На животрепещущие вопросы живо трепетали и старались ответить честно:

Как у вас в компании организован процесс перевода игр? Используете ли вы машинный перевод в работе?

Даниил Соколов

Мы имеем с ним дело, но не применяем сами. То есть нам присылают, мы редактируем — но производить МТ не производим. Не знаю, укладывается ли это в «используем».

Один раз пробовали это настроить с китайского на русский, чтобы попробовать предложить клиенту вариант дешевле. На тот момент, а это было года полтора назад, результат нас не удовлетворил.

Основные проблемы были с техническими особенностями игровых текстов: мы локализуем текст, который предназначен не для человека, а для машины. Там есть специальные элементы оформления, заранее неизвестные параметры и тому подобное, которые машина, она же игра должна сначала обработать, чтобы получить текст для игрока. Вот с этим МТ тогда как-то совсем не справлялся. Но и просто качество русского было скорее нередактируемое.

Михаил Горбунов

Всё по классике RU>EN>LOC, всего 12 языков: русский, английский, немецкий, французский, испанский, португальский, итальянский, турецкий, японский, корейский, китайский упрощенный и традиционный.

Используем Memsource и Gridly. В штате есть EN-редактор, который не знает русского, поэтому его английский точно объективен :)

Команда своя, 36 фрилансеров. Устоявшаяся, некоторые переводчики с нами уже 8 лет.

МТ используем широко, но не скажу, что прямо любим. Относимся к нему как к инструменту, который экономит деньги и время.

Самым сложным было показать переводчикам, что МТ им не враг и вообще способен экономить их время.

Машинный перевод — это как? Речь про цену, качество и скорость

Фёдор Куликов

Машинный перевод — скорее бессмысленно в большинстве случаев. Перевод фильмов, реплик, описаний каких-нибудь земель, заклинаний, фразы футбольных комментаторов и так далее требуют понимания контекста. В случае диалогов это не просто перевод тех буковок, которые в английском, но и понимание того, что произойдет до этой фразы, как она свяжется со следующей, на что ссылается персонаж из игрового Лора. В случае описаний, названий предметов всё это сильно зависит от того, как мы на берегу договорились это называть, какой у нас сеттинг игры, какие синонимы при переводе можно использовать в этом сеттинге, а какие нет, ну и так далее.

Еще проблема в том, что МТ не может адекватно и правильно разобрать идиомы в разговорной речи, даже хороший редактор, вооружившись UrbanDictionary, гуглом и такой-то матерью — все равно может промахиваться. При этом если ты начал править такой перевод, — либо тебе нужно просто переписать весь текста заново, удалив МП, чтобы текст был «живым», либо последствия МП останутся.

Даниил Соколов

Как по мне — сравнительно дешево и определенно быстро, а вот от сложности и зависит, МТ это хорошо или без толку в итоге. Во-первых, надо думать, применять ли для вот этих конкретно взятых текстов, во-вторых, надо тренировать движок на конкретную задачу. Без этого легко только получить ситуацию, когда лингвист чертыхается, выбрасывает текст и переводит заново — иногда хуже, чем с пустого места.

Михаил Горбунов

МТ — это дешево, быстро и просто. Я сейчас и шучу, и не шучу. Всё зависит от того, где вы его применяете и что вы хотите получить на выходе. В некоторых сценариях он просто великолепно работает из коробки, когда тексты несложные и общей тематики. Тот же DeepL справляется без проблем с нашим ситибилдером «Мегаполис» и фермой Wild West.

В других сценариях МТ нужно тренировать, скармливать ему корпуса и глоссарии для правильного перевода терминологии и профессионализмов. Так работают в юридическом, техническом и медицинском переводе.

Но есть сценарии, где МТ не работает. Например, у нас в разработке игра, где есть 100500 аллюзий на поп-культуру и очень разговорный US English, с которым не то что МТ, а даже переводчики с профильным образованием не всегда справляются, и никакое обучение тут движку не поможет — таких корпусов просто не существует.

Если движок настраивать как надо, то это сложно. Если движок обучать на чужих корпусах, то это дорого, потому что корпуса для обучения на дороге не валяются. Если движок обучать на своих корпусах, то это долго, потому что они нарабатываются долгие годы. Плюс NDA, копирайт и всякое такое.

Что выгоднее с точки зрения бизнеса: штат лингвистов или один хороший движок?

Фёдор Куликов

Это инструменты для разных целей — для чего-то (к примеру, для юридических документов, технических справок, как ни странно, для описания правил TCG в случае настроенной на большом корпусе текстов нейронке) действительно имеет смысл использовать МП, для чего-то это не работает — нет релевантного корпуса в принципе, необходима внимательность к деталям и так далее. Это просто разные инструменты.

Михаил Горбунов

Всё зависит от того, какие тексты вы переводите. Если однотипные, например, игры одного жанра или узкоспециальные тексты, где конкретный движок хорошо справляется, то штат лингвистов вам не понадобится, когда натренируете движок.

Если же у вас разножанровые игры, локализация софта, художественный и маркетинговый перевод, то там МТ совершенно точно не справится без людей.Я бы советовал его рассматривать как инструмент для решения ограниченного круга конкретных задач, а не вообще всех ваших рабочих задач.

Кроме того, МТ на выходе всё равно даёт далеко не идеальный перевод, поэтому вам вместо штата переводчиков понадобится штат редакторов.

Как студии локализации понять, нужен ей машинный перевод или нет?

Фёдор Куликов

Нужно понять свою область работы. В игровой области есть только немного направлений, в которых он на данном этапе развития может пригодиться. Конечно, его можно продать заказчику как самые-пресамые новейшие технологии, и это даже сработает. Но нет никакой гарантии, что это не приведет к потере репутации и отсутствию гордости за результат. Ну и потоку несвежих помидоров от игроков.

Михаил Горбунов

Я бы сказал, что требуется наличие этих факторов:

  • Студия не может «переварить» весь объем поступающих заказов тем штатом лингвистов, который у них есть, а набор новых затруднен или невозможен.
  • Упала маржинальность, поскольку год от года ставки переводчиков растут, а МТ становится всё лучше и дешевле.
  • Вы поэкспериментировали с движками забавы ради и поняли, что МТ справляется хотя бы с некоторыми вашими задачами и при этом экономит вам время и/или деньги.

Когда машинный перевод точно не нужен при локализации?

Фёдор Куликов

Почти всегда в случае игр — ты видишь в любом случае когда переводчик пытается его использовать даже в процессе перевода, читая тексты за ним. Исключение — специфичные тексты в духе правил TCG, которые фактически являются языком программирования условий, нежели «живым» текстом.

Даниил Соколов

«В каких случаях пока что МТ наверняка не пригодится в локализации?» :-)

Ключевые тревожные звоночки в смысле текста:

  • разговорный/уличный язык;
  • культурные отсылки/игра слов/шутки/сарказм;
  • скрытые непереводимые элементы, например, переменные;
  • иногда — короткие обрывочные строки, не составляющие предложения, например эффекты бонусов или заклинаний.

В смысле общего подхода — не стоит пытаться, если корпус текстов в этой языковой паре маловат.

Михаил Горбунов

МТ не справляется с художественными и маркетинговыми текстами, с метафорами, аллюзиями, шутками и игрой слов. Ещё МТ не нужен там, где нет редакторов, готовых исправлять то, что он вам там напереводил.

В моей компании МТ не используется на новых проектах, где ещё нет наработанных памяти переводов и глоссария.

Можно ли совмещать в одной студии МП и работу переводчиков?

Фёдор Куликов

Я думаю, что это не совсем верный вопрос. Свиной хрящик и арбуз — могут ли они быть в одном холодильнике? Да, могут. Предполагаю, что вопрос — могут ли МТ и переводчик существовать на одном проекте? На одном проекте — да, если у вас есть способ разделить памяти и выделить куски текста отдельной от всего остального тематики, которые можно отдать МП.

Даниил Соколов

Тут, скорее, пока «нельзя не совмещать», МТ сам по себе пока не даёт текста лучше, чем «для примерного понимания при внутреннем пользовании», то есть продукта. Если вообще использовать МТ, то вместе с ним пока необходимы и живые лингвисты.

Голым МТ можно перевести, условно, инструкции по пользованию внутренним инструментом для внутреннего же пользования — тогда «своим» можно объяснить, мол, качество фигня, но основная идея понятна и лучше так, чем на китайском. Да и переспросить можно. А продать и использовать такой перевод в продаваемом продукте — нельзя.

Михаил Горбунов

Можно и нужно. Во всяком случае, мы совмещаем без каких-либо проблем. Чаще всего постредактурой МТ и переводом занимаются разные специалисты, но конкретно у нас это одни и те же лингвисты.

Опять же, разграничьте круг задач, где работают люди и где работает МТ. У команд не должно возникать ощущения, что машина их всех в скором времени заменит.

Как часто машинный перевод ошибается? Когда ему нужна помощь человека?

Фёдор Куликов

Скорее, вопрос — когда не нужна

Михаил Горбунов

Невозможно оценить без входных данных. Всё зависит от текста и от движка. Где-то у вас будет 99% ошибочно переведённых сегментов, а где-то только 40%. Меньше 40% я не встречал лично, сужу только по своим проектам и отзывам коллег. Помощь человека нужна всегда, ибо МТ необходимо обязательно контролировать на выходе, иначе это чревато потерей заказчика.

Различается ли качество машинного перевода между языковыми парами?

Фёдор Куликов

Конечно, различается, и различается значительно — это зависит от корпуса используемых текстов и от особенностей языка. В случае английского корпус побольше, в случае корейского на русский он совсем маленький, и особенности корейского разговорного опускать очевидные из контекста вещи в предложении дают прикурить неимоверно.

Михаил Горбунов

Различается от движка к движку, от текста к тексту и от языка к языку.

Качество перевода на конкретной языковой паре зависит от алгоритмов движка и от качества и объема корпусов, на которых он обучался. Чем распространённее оба языка, тем выше качество перевода, потому что на самые популярные языки проще найти нужных специалистов, проще разработать алгоритмы и проще найти корпусы для обучения.

Качество машинного перевода KO>RU низкое потому, что этот перевод идет через английский, и там по факту KO>EN>RU. Соответственно, увеличивается вероятность возникновения ошибок.

Чувствуется ли прогресс в машинном переводе за последние 10–15 лет? Что стало лучше, что хуже?

Фёдор Куликов

Появилась надежда на настраиваемые под конкретные проект модели, но на деле это всё ещё в зачаточном состоянии и просто не хватает корпусов именно под этот проект.

Михаил Горбунов

Стало определённо лучше, особенно последние 5 лет, когда начали массово использоваться нейросети для обучения. Раньше движки переводили по внутренним базам и шаблонам, алгоритмы были намного примитивнее. Сейчас это полноценный ИИ, который можно научить не всем, но очень многим вещам и существенно упростить себе жизнь.

Как, по вашему мнению, будет развиваться МП в дальнейшем? Станет ли он более удобным/точным/быстрым?

Фёдор Куликов

Ну как — всё развивается. В случае живого языка, где ты должен адаптировать шутки, перенести юмор, — это невозможно пока что, переводчик и редактор вкладывают небольшие кусочки себя в проект и проекты сделанные разными редакторами и разными переводчиками будут значительно отличаться. То, чем мы занимаемся, — между переводом и транскреейшном, и от проекта к проекту процент этого транскриэйшна и процент перевода меняется. Ну то есть вот у нас Хэллоуин скоро — есть заголовок статьи.

  • English:

    Where wolf? There wolf!

  • Вариант переводчика:

    Среди тёмных подворотен, где гуляет оборотень

  • Вариант редактора:

    Оборотней бояться — в лес не ходить

Я боюсь предположить, что сделает с этим МП.

Михаил Горбунов

Быстрее уже некуда, да и не требуется, наверное. Сейчас МТ легко переводит тысячи слов в минуту. Улучшения надо ждать в точности и удобстве внедрения, потому что на текущий момент обучение движков это технически сложный и долгий процесс, а их подключение к «кошкам» — то ещё приключение.

МП когда-нибудь полностью заменит работу человека-переводчика?

Фёдор Куликов

Нет. Увы. Ну или ура!

Даниил Соколов

Нет смысла говорить про это без временных рамок. Заменить в обозримом будущем — не заменит, но граница применения ползёт, область увеличивается.

В какой-то момент МТ будет достаточен, как говорится, for all practical purposes. NN водят лучше человека, диагностируют лучше человека, и мы, переводчики, ничем особым не отличаемся. Останется доля процента случаев, когда без людей не обойтись, и обусловлено это будет тем, что нет практического толка улучшать дальше, затраты будут больше отдачи.

Михаил Горбунов

Я бы переформулировал вопрос как «Во всех ли сферах МТ сможет заменить человека, и если да, то как скоро?».

В некоторых видах перевода МТ уже это сделал. Там, где не требуется высокое качество перевода, люди без проблем пользуются результатами работы МТ.

Что касается художественного перевода и транскреации, то там безраздельно властвуют люди, и я сомневаюсь, что в ближайшие 5 лет что-то радикально изменится.

Определённого прогресса стоит ждать в сфере, которая между этими двумя полюсами. Год от года движки переводят всё лучше, и там, где редактор совсем недавно тратил час, теперь он тратит полчаса или даже меньше, потому что всё меньше сегментов приходится переписывать с нуля.

Что посоветуете начинающему переводчику?

Фёдор Куликов

Не использовать МП в своей работе и не пытаться исправлять фразу за МП — это до добра не доведёт, особенно на начальном этапе.

Даниил Соколов

Принять, что машинный перевод никуда не денется и будет делать только больше черновой работы. Учитывать, что кроме «перевода», «редактуры» и «корректуры», теперь есть ещё «постредактура МТ», да и не в одном варианте. Научиться понимать, когда машина ошибается и когда от неё можно ожидать ошибки, когда формально права, но вряд ли сделала хорошо, а в чём наверняка не ошибается. И научиться подозревать проблему, просто глядя на перевод. Если сможете, разобраться в принципах работы машинного перевода нейросетью и осознать, что значит обучить её, что она может и не может.

Михаил Горбунов

Повышать профессиональный уровень, расширять кругозор и желаю найти хороших заказчиков :)

Стоит подружиться с МТ и освоить постредактуру, поскольку количество соответствующих вакансий на рынке растёт очень стремительно.

Связаться с нами:

Чтобы информация максимально быстро попала к тем, кто сможет вам помочь, мы подготовили две формы связи.

Напиши нам!