Быстрый перевод текста по имеющимся субтитрам


Задача озвучивания очень интересна, но что делать, если текст для озвучивания не подготовлен? По идее, можно нанять профессиональных переводчиков, которые гордятся тем, что не используют автоматизированные системы, но один тайтл будет стоить от 2000руб до 700 евро (по оценкам разных онлайн-калькуляторов). Можно конечно взять ансаб и засунуть в гугль, но... А почему бы и нет?

Ниже я опишу процесс подготовки к переводу малыми силами и с сохранением максимума смысловой нагрузки.

1. Ищем оригиналы субтитров, включая японский или китайский. Профильные ресурсы вам в помощь.

2. Ищем все похожее на английские субтитры, в том числе выковыриваем их из видео. Из десятка разных видео можно наковырять штук 5 уникальных сабов. Команда ffmpeg -i video.mkv -map 0:5 subs1.srt вполне поможет из 100 гигов сделать 5 маленьких файлов.

3. Засовываем все что нашли (по крайней мере то, что заслуживает доверия) в онлайн-переводчики. В зависимости от языка это могут быть разные сервисы, такие как Бабел, Гугл, Мелк*софт, Пр*мт, Ян**кс. Напрямую они этого сделать не дадут, потому генерируем простую страничку (srt2html) и хостим ее, а через онлайн-сервис переводим результат. Выделяем содержимое странички и сохраняем в текстовый файлик локально, который кормим утильке txt2srt. Повторять с разными сабами и сервисами пока не надоест. Иногда кривой перевод с китайского гораздо понятнее, чем перевод с уже кривого английского. В принципе, уже можно смотреть.

4. Когда у нас будет 10-15 разных сабов, включая штук 5 от разных сервисов машинного перевода, их можно склеить в такую вот табличку. Обратите внимание, что многие клетки пустуют - там были дубликаты, которые в разных сабах были полностью идентичны. Такая табличка позволит понять примерное положение вещей и оценить затраты, выбрать наиболее хорошие варианты перевода, чтобы работать только с ними.



5. Вместе с табличкой генерируем еще 2 инструмента: html-страничку и ASS-файлик, которые выглядят так





Здесь мы видим все редакции наших субтитров, все ошибки и возможные варианты переводов. В данном примере, роли были предварительно проставлены в ASS-файле. В обоих файлах можно вводить свой перевод, что удобнее - зависит от конкретного человека. Работу можно разделять на несколько участников, договариваясь заранее о переводимых частях. В случае перевода в AegiSub, можно дополнительно поправить тайминг или заполнить колонку с именами персонажей. Перевод с использованием веб-страницы не требует ничего кроме браузера, при этом позволяет сразу генерировать субтитры или склеивать работы разных участников, чего не умеет AegiSub. В любом случае, оба инструмента позволяют быстро и ненапряжно переводить текст.

Такой перевод ничуть не хуже домашних надмозгов с ограниченным словарным запасом, а так как основной перевод уже сделан, задача фактически сводится к вычитке и корректировке текста, что позвляет переводить тексты даже без глубокого знания языка.

Если вы знаете другие способы быстрого перевода или программы, поддерживающие перевод из нескольких источников - напишите нам!

Что-то непонятно? Есть предложения? Пишите на почту anondub@openmailbox.org или в кукарекалку, лучше несколько раз. Мы открыты и ничего не таим. Скачать текстовую версию: fast_translation.txt (Быстрый перевод текста по имеющимся субтитрам) мокрые статьи без смс.