
Битва людей и роботов — жаркая тема для дискуссии. Возможно, что и наши клиенты, и наши коллеги размышляют на темы: «ИИ переводит тексты не хуже людей — скоро и половина переводчиков вымрет, да и переводчик в гугле не такой уж и ужасный по сравнению с 2005 годом», «Зачем платить целой толпе людей, если один робот справится лучше?», «А не отберут ли бездушные железяки мою работу?», «Стоит ли вообще напрягаться с учебой? Библиотекари вон почти вымерли, а следующие мы».
Буквально лет пять-десять назад про адекватный машинный перевод в индустрии говорили только научные гики. Но сейчас практически на каждой конференции поднимается этот вопрос. Обсуждаются изменения в индустрии, развитие целого направления. Появилась новая востребованная профессия — постредактор машинного перевода.
Профессий, связанных с работой ИИ и роботизацией, с каждым годом становится всё больше, а ручной труд в промышленных масштабах требуется всё меньше.
Посмотрите, как ИИ становится всё востребованнее

Машинный перевод сейчас активно внедряется в арсенал инструментов переводчиков и локализаторов.
Но точно ли он нужен локализаторам? Не прячется ли под шкурой ягненка бездушный и беспощадный Т-1000? Это панацея и дорога в светлое будущее или нет?
Есть и вопросы со стороны клиента — если МТ так уж хорош, быстр и ловок, то зачем платить больше за кучу человеческого ресурса?
На животрепещущие вопросы живо трепетали и старались ответить честно:
-
управляющий партнёр в Levsha,
-
начальник отдела локализации в Levsha
-
начальник отдела локализации в Social Quantum
Как у вас в компании организован процесс перевода игр? Используете ли вы машинный перевод в работе?
Даниил СоколовМы имеем с ним дело, но не применяем сами. То есть нам присылают, мы редактируем — но производить МТ не производим. Не знаю, укладывается ли это в «используем».
Один раз пробовали это настроить с китайского на русский, чтобы попробовать предложить клиенту вариант дешевле. На тот момент, а это было года полтора назад, результат нас не удовлетворил.
Основные проблемы были с техническими особенностями игровых текстов: мы локализуем текст, который предназначен не для человека, а для машины. Там есть специальные элементы оформления, заранее неизвестные параметры и тому подобное, которые машина, она же игра должна сначала обработать, чтобы получить текст для игрока. Вот с этим МТ тогда как-то совсем не справлялся. Но и просто качество русского было скорее нередактируемое.
Михаил ГорбуновВсё по классике RU>EN>LOC, всего 12 языков: русский, английский, немецкий, французский, испанский, португальский, итальянский, турецкий, японский, корейский, китайский упрощенный и традиционный.
Используем Memsource и Gridly. В штате есть EN-редактор, который не знает русского, поэтому его английский точно объективен :)
Команда своя, 36 фрилансеров. Устоявшаяся, некоторые переводчики с нами уже 8 лет.
МТ используем широко, но не скажу, что прямо любим. Относимся к нему как к инструменту, который экономит деньги и время.
Самым сложным было показать переводчикам, что МТ им не враг и вообще способен экономить их время.
Машинный перевод — это как? Речь про цену, качество и скорость
Фёдор КуликовМашинный перевод — скорее бессмысленно в большинстве случаев. Перевод фильмов, реплик, описаний каких-нибудь земель, заклинаний, фразы футбольных комментаторов и так далее требуют понимания контекста. В случае диалогов это не просто перевод тех буковок, которые в английском, но и понимание того, что произойдет до этой фразы, как она свяжется со следующей, на что ссылается персонаж из игрового Лора. В случае описаний, названий предметов всё это сильно зависит от того, как мы на берегу договорились это называть, какой у нас сеттинг игры, какие синонимы при переводе можно использовать в этом сеттинге, а какие нет, ну и так далее.
Еще проблема в том, что МТ не может адекватно и правильно разобрать идиомы в разговорной речи, даже хороший редактор, вооружившись UrbanDictionary, гуглом и такой-то матерью — все равно может промахиваться. При этом если ты начал править такой перевод, — либо тебе нужно просто переписать весь текста заново, удалив МП, чтобы текст был «живым», либо последствия МП останутся.
Даниил СоколовКак по мне — сравнительно дешево и определенно быстро, а вот от сложности и зависит, МТ это хорошо или без толку в итоге. Во-первых, надо думать, применять ли для вот этих конкретно взятых текстов, во-вторых, надо тренировать движок на конкретную задачу. Без этого легко только получить ситуацию, когда лингвист чертыхается, выбрасывает текст и переводит заново — иногда хуже, чем с пустого места.
Михаил ГорбуновМТ — это дешево, быстро и просто. Я сейчас и шучу, и не шучу. Всё зависит от того, где вы его применяете и что вы хотите получить на выходе. В некоторых сценариях он просто великолепно работает из коробки, когда тексты несложные и общей тематики. Тот же DeepL справляется без проблем с нашим ситибилдером «Мегаполис» и фермой Wild West.
В других сценариях МТ нужно тренировать, скармливать ему корпуса и глоссарии для правильного перевода терминологии и профессионализмов. Так работают в юридическом, техническом и медицинском переводе.
Но есть сценарии, где МТ не работает. Например, у нас в разработке игра, где есть 100500 аллюзий на поп-культуру и очень разговорный US English, с которым не то что МТ, а даже переводчики с профильным образованием не всегда справляются, и никакое обучение тут движку не поможет — таких корпусов просто не существует.
Если движок настраивать как надо, то это сложно. Если движок обучать на чужих корпусах, то это дорого, потому что корпуса для обучения на дороге не валяются. Если движок обучать на своих корпусах, то это долго, потому что они нарабатываются долгие годы. Плюс NDA, копирайт и всякое такое.

Что выгоднее с точки зрения бизнеса: штат лингвистов или один хороший движок?
Фёдор КуликовЭто инструменты для разных целей — для чего-то (к примеру, для юридических документов, технических справок, как ни странно, для описания правил TCG в случае настроенной на большом корпусе текстов нейронке) действительно имеет смысл использовать МП, для чего-то это не работает — нет релевантного корпуса в принципе, необходима внимательность к деталям и так далее. Это просто разные инструменты.
Михаил ГорбуновВсё зависит от того, какие тексты вы переводите. Если однотипные, например, игры одного жанра или узкоспециальные тексты, где конкретный движок хорошо справляется, то штат лингвистов вам не понадобится, когда натренируете движок.
Если же у вас разножанровые игры, локализация софта, художественный и маркетинговый перевод, то там МТ совершенно точно не справится без людей.Я бы советовал его рассматривать как инструмент для решения ограниченного круга конкретных задач, а не вообще всех ваших рабочих задач.
Кроме того, МТ на выходе всё равно даёт далеко не идеальный перевод, поэтому вам вместо штата переводчиков понадобится штат редакторов.
Как студии локализации понять, нужен ей машинный перевод или нет?
Фёдор КуликовНужно понять свою область работы. В игровой области есть только немного направлений, в которых он на данном этапе развития может пригодиться. Конечно, его можно продать заказчику как самые-пресамые новейшие технологии, и это даже сработает. Но нет никакой гарантии, что это не приведет к потере репутации и отсутствию гордости за результат. Ну и потоку несвежих помидоров от игроков.
Михаил ГорбуновЯ бы сказал, что требуется наличие этих факторов:
- Студия не может «переварить» весь объем поступающих заказов тем штатом лингвистов, который у них есть, а набор новых затруднен или невозможен.
- Упала маржинальность, поскольку год от года ставки переводчиков растут, а МТ становится всё лучше и дешевле.
- Вы поэкспериментировали с движками забавы ради и поняли, что МТ справляется хотя бы с некоторыми вашими задачами и при этом экономит вам время и/или деньги.
Когда машинный перевод точно не нужен при локализации?
Фёдор КуликовПочти всегда в случае игр — ты видишь в любом случае когда переводчик пытается его использовать даже в процессе перевода, читая тексты за ним. Исключение — специфичные тексты в духе правил TCG, которые фактически являются языком программирования условий, нежели «живым» текстом.
Даниил Соколов«В каких случаях пока что МТ наверняка не пригодится в локализации?» :-)
Ключевые тревожные звоночки в смысле текста:
- разговорный/уличный язык;
- культурные отсылки/игра слов/шутки/сарказм;
- скрытые непереводимые элементы, например, переменные;
- иногда — короткие обрывочные строки, не составляющие предложения, например эффекты бонусов или заклинаний.
В смысле общего подхода — не стоит пытаться, если корпус текстов в этой языковой паре маловат.
Михаил ГорбуновМТ не справляется с художественными и маркетинговыми текстами, с метафорами, аллюзиями, шутками и игрой слов. Ещё МТ не нужен там, где нет редакторов, готовых исправлять то, что он вам там напереводил.
В моей компании МТ не используется на новых проектах, где ещё нет наработанных памяти переводов и глоссария.

Можно ли совмещать в одной студии МП и работу переводчиков?
Фёдор КуликовЯ думаю, что это не совсем верный вопрос. Свиной хрящик и арбуз — могут ли они быть в одном холодильнике? Да, могут. Предполагаю, что вопрос — могут ли МТ и переводчик существовать на одном проекте? На одном проекте — да, если у вас есть способ разделить памяти и выделить куски текста отдельной от всего остального тематики, которые можно отдать МП.
Даниил СоколовТут, скорее, пока «нельзя не совмещать», МТ сам по себе пока не даёт текста лучше, чем «для примерного понимания при внутреннем пользовании», то есть продукта. Если вообще использовать МТ, то вместе с ним пока необходимы и живые лингвисты.
Голым МТ можно перевести, условно, инструкции по пользованию внутренним инструментом для внутреннего же пользования — тогда «своим» можно объяснить, мол, качество фигня, но основная идея понятна и лучше так, чем на китайском. Да и переспросить можно. А продать и использовать такой перевод в продаваемом продукте — нельзя.
Михаил ГорбуновМожно и нужно. Во всяком случае, мы совмещаем без каких-либо проблем. Чаще всего постредактурой МТ и переводом занимаются разные специалисты, но конкретно у нас это одни и те же лингвисты.
Опять же, разграничьте круг задач, где работают люди и где работает МТ. У команд не должно возникать ощущения, что машина их всех в скором времени заменит.
Как часто машинный перевод ошибается? Когда ему нужна помощь человека?
Фёдор КуликовСкорее, вопрос — когда не нужна
Михаил ГорбуновНевозможно оценить без входных данных. Всё зависит от текста и от движка. Где-то у вас будет 99% ошибочно переведённых сегментов, а где-то только 40%. Меньше 40% я не встречал лично, сужу только по своим проектам и отзывам коллег. Помощь человека нужна всегда, ибо МТ необходимо обязательно контролировать на выходе, иначе это чревато потерей заказчика.
Различается ли качество машинного перевода между языковыми парами?
Фёдор КуликовКонечно, различается, и различается значительно — это зависит от корпуса используемых текстов и от особенностей языка. В случае английского корпус побольше, в случае корейского на русский он совсем маленький, и особенности корейского разговорного опускать очевидные из контекста вещи в предложении дают прикурить неимоверно.
Михаил ГорбуновРазличается от движка к движку, от текста к тексту и от языка к языку.
Качество перевода на конкретной языковой паре зависит от алгоритмов движка и от качества и объема корпусов, на которых он обучался. Чем распространённее оба языка, тем выше качество перевода, потому что на самые популярные языки проще найти нужных специалистов, проще разработать алгоритмы и проще найти корпусы для обучения.
Качество машинного перевода KO>RU низкое потому, что этот перевод идет через английский, и там по факту KO>EN>RU. Соответственно, увеличивается вероятность возникновения ошибок.
Чувствуется ли прогресс в машинном переводе за последние 10–15 лет? Что стало лучше, что хуже?
Фёдор КуликовПоявилась надежда на настраиваемые под конкретные проект модели, но на деле это всё ещё в зачаточном состоянии и просто не хватает корпусов именно под этот проект.
Михаил ГорбуновСтало определённо лучше, особенно последние 5 лет, когда начали массово использоваться нейросети для обучения. Раньше движки переводили по внутренним базам и шаблонам, алгоритмы были намного примитивнее. Сейчас это полноценный ИИ, который можно научить не всем, но очень многим вещам и существенно упростить себе жизнь.

Как, по вашему мнению, будет развиваться МП в дальнейшем? Станет ли он более удобным/точным/быстрым?
Фёдор КуликовНу как — всё развивается. В случае живого языка, где ты должен адаптировать шутки, перенести юмор, — это невозможно пока что, переводчик и редактор вкладывают небольшие кусочки себя в проект и проекты сделанные разными редакторами и разными переводчиками будут значительно отличаться. То, чем мы занимаемся, — между переводом и транскреейшном, и от проекта к проекту процент этого транскриэйшна и процент перевода меняется. Ну то есть вот у нас Хэллоуин скоро — есть заголовок статьи.
-
English:
Where wolf? There wolf!
-
Вариант переводчика:
Среди тёмных подворотен, где гуляет оборотень
-
Вариант редактора:
Оборотней бояться — в лес не ходить
Я боюсь предположить, что сделает с этим МП.
Михаил ГорбуновБыстрее уже некуда, да и не требуется, наверное. Сейчас МТ легко переводит тысячи слов в минуту. Улучшения надо ждать в точности и удобстве внедрения, потому что на текущий момент обучение движков это технически сложный и долгий процесс, а их подключение к «кошкам» — то ещё приключение.
МП когда-нибудь полностью заменит работу человека-переводчика?
Фёдор КуликовНет. Увы. Ну или ура!
Даниил СоколовНет смысла говорить про это без временных рамок. Заменить в обозримом будущем — не заменит, но граница применения ползёт, область увеличивается.
В какой-то момент МТ будет достаточен, как говорится, for all practical purposes. NN водят лучше человека, диагностируют лучше человека, и мы, переводчики, ничем особым не отличаемся. Останется доля процента случаев, когда без людей не обойтись, и обусловлено это будет тем, что нет практического толка улучшать дальше, затраты будут больше отдачи.
Михаил ГорбуновЯ бы переформулировал вопрос как «Во всех ли сферах МТ сможет заменить человека, и если да, то как скоро?».
В некоторых видах перевода МТ уже это сделал. Там, где не требуется высокое качество перевода, люди без проблем пользуются результатами работы МТ.
Что касается художественного перевода и транскреации, то там безраздельно властвуют люди, и я сомневаюсь, что в ближайшие 5 лет что-то радикально изменится.
Определённого прогресса стоит ждать в сфере, которая между этими двумя полюсами. Год от года движки переводят всё лучше, и там, где редактор совсем недавно тратил час, теперь он тратит полчаса или даже меньше, потому что всё меньше сегментов приходится переписывать с нуля.
Что посоветуете начинающему переводчику?
Фёдор КуликовНе использовать МП в своей работе и не пытаться исправлять фразу за МП — это до добра не доведёт, особенно на начальном этапе.
Даниил СоколовПринять, что машинный перевод никуда не денется и будет делать только больше черновой работы. Учитывать, что кроме «перевода», «редактуры» и «корректуры», теперь есть ещё «постредактура МТ», да и не в одном варианте. Научиться понимать, когда машина ошибается и когда от неё можно ожидать ошибки, когда формально права, но вряд ли сделала хорошо, а в чём наверняка не ошибается. И научиться подозревать проблему, просто глядя на перевод. Если сможете, разобраться в принципах работы машинного перевода нейросетью и осознать, что значит обучить её, что она может и не может.
Михаил ГорбуновПовышать профессиональный уровень, расширять кругозор и желаю найти хороших заказчиков :)
Стоит подружиться с МТ и освоить постредактуру, поскольку количество соответствующих вакансий на рынке растёт очень стремительно.
