Кошка — лучший друг переводчика: разбираемся в CAT-tools

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | ИИ, сервисы и приложения

Эта небольшая статья поможет вам разобраться в основах инструментов для автоматизации перевода. Я расскажу об общих отличиях одних программ от других, а какие же программы являются лидерами по популярности среди переводчиков.

Кроме того набросаю пару заметок по утилитам Across Translator Edition и Pairaphrase.

Иллюстрация сгенерирована при помощи нейросети

Во-первых, что такое CAT-tool. Ещё раз, если кто-то не читал мои предыдущие статьи. CAT-tool или просто кошка - это программа, помогающая в переводе. Как же она помогает? В программе установлены модули, облегчающие работу переводчика как то: ТМ - память перевода, ТБ - база терминов (см. предыдущее видео), возможность объединить сразу несколько документов в один проект, чтобы было удобнее работать, а также ряд других полезных функций, которые могут быть уникальными для той или иной программы. Кошки могут быть офлайн и устанавливаться на компьютер или онлайн, и не требовать установки, а могут быть просто дополнительным модулем для офиса.

Подробнее я рассказывал про память перевода и терминосистемы в статье "Память перевода: вы всё ещё кипятите? Тогда мы идём к вам!"

Всего существует более 20 разных кошек, но перепробовать их все подвластно только безумцам или тем, у кого очень много свободного времени.

Некоторые из распространённых утилит автоматизации перевода
Источник: en.wikipedia.org

Выше я привёл скриншот страницы Википедии со списком программ.

Одни кошки работают только на Windows, другие только онлайн, есть и те, что устанавливаются на платформы Linux или Java, можно выбрать платформу по душе или взять кросс-платформенную и не париться. 

Сложнее становится, если совместить платформу с типом лицензии - темный прямоугольник значит, что программа платная, а светлый - бесплатная. Порой за качество приходится платить. Значительно платить, Trados Studio сейчас стоит 925 евро. Бесплатные утилиты не всегда могут предоставить желаемый набор функций, удобство использования, поддерживаемые форматы и прочее.

Над таблицей есть пометка о том, что самыми популярными среди переводчиков на 2006 год были Trados (35%), Wordfast (17%), Déjà Vu (16%), SDL Trados 2006 (15%), SDLX (4%), STAR Transit (3%), OmegaT(3%), другие (7%) 2006 год был давно, с тех пор прошло целых 17 лет. А в мире технологий - это вечность. Более свежая статистика, которую удалось найти в интернете, впрочем, говорит, что тренды не сильно изменились. Первая тройка всё та же:

Самые популярные CAT-tools
Источник: saudisoft.com

Однако, некоторые из указанных кошек я всё равно оценю. Особенно меня интересует Across Language Server своим невероятным перечнем поддерживаемых форматов. 

Поддерживаемые форматы Across Language Server
Источник: en.wikipedia.org

Мини-обзор Across Translator Edition v7

С него и начну. Across Language Server - это ПО для управления переводами, которое можно получить только по запросу. Зато можно бесплатно попробовать Across Translator Edition v7 - платную программу. К счастью, есть бесплатная версия с ограничениями. Чтобы скачать, нужно зарегистрироваться на их сайте. Честно говоря, это не очень удобно и мне не нравится. Ну ладно.

Системные требования Across Translator Edition v7

После регистрации скачивается целый архив, который содержит несколько небольших документов: документация, изменения в версии и системные требования. Все файлы на двух языках. Файл "документация" содержит всего несколько строк со ссылками на онлайн-документацию. Онлайн-документация - это удобно и ссылка в приложении к инсталлятору тоже хорошая идея была, как мне кажется. Так пользователь сразу поймёт, где искать информацию в случае необходимости. Я также открыл системные требования и удивился. Предлагают 25 гигабайт свободного места на диске. По-моему, высоковато, но, наверное, они считают с базой данных, в которой будет храниться перевод. Я не очень разбирался в настройках БД.

Платная подписка на год со скидкой будет стоить почти 1200 в месяц. 20 долларов в месяц - это не так и дорого. Ну, если есть деньги и есть возможность оплатить.

Разобраться в программе немного сложно, если никогда не имели дело с CAT-тулзами. Но путём нехитрых манипуляций всё же можно создать проект, а потом начать переводить. Единственное, я не понял, где все языки. Почему только английский, немецкий и французский? Наверное, потерялись в премиум-версии. Ради теста решил вбить тот же документ про масла, что использовал в статье про OCR-сервисы. В качестве целевого языка выбрал немецкий.

Предупреждение о шрифтах

Когда я подготовил проект, вылезло такое предупреждение. Мне очень понравилось предупреждение, потому что так я точно знаю, какие шрифты нужно найти, чтобы документ не получился уродливым. Достойно уважения. Но другой вопрос - получится ли их найти и будут ли они бесплатными?

Первые впечатления: не сразу понятно, куда добавлять перевод, много маленьких кнопочек. Но через пару минут привыкаешь. Кнопочки хоть и мелкие, но подписываются при наведении, а расположение окна перевода не напрягает.

К сожалению, импортировать свои память переводов или термины у меня не получилось. Я с трудом понял, куда нужно для этого зайти, однако ни формат традоса, ни формат мемокью не получилось скормить. Мне не понравилось подтверждение сегментов не через CTRL+ENTER, а через ALT+PAGE UP (очень нетривиальное сочетание). Наверное, можно настроить в параметрах, но всё же хотелось бы иметь удобную работу по умолчанию, а не после настройки.

В общем судите сами, но я бы не рекомендовал. Многих эта программа может отпугнуть, создать впечатление, что "кошки" - это сложно и неудобно.

Кстати, с отсканированным PDFAcross не справился. И места на диске он занял всего 1.4 ГБ, а не 20 гигабайт, как сказано в системных требованиях. Возможно, по мере наполнения базы данных, занимаемое место вырастет.

Нано-обзор Pairaphrase

Испытал быстренько ещё одну утилиту - Pairaphrase. Не помню, откуда узнал о ней, но как-то была она у меня на слуху. Это небольшой онлайн инструмент, нужно зарегистрироваться. Должно быть несложно, но при регистрации встретился с проблемой - нет бесплатного плана.

Ладно, возможно есть какой-то пробный период, я просто о нём не знаю. Раньше точно был. Выбрал Токио, просто посмотреть. Но вот при регистрации они просят ещё и название компании, номер телефона и много других персональных данных.

Да и почему-то письмо с подтверждением не пришло мне от них. Ну и ладно, не очень-то и хотелось. Вообще, насколько я помню свой опыт взаимодействия с этим сервисом, он выдавал машинный перевод по умолчанию, который можно редактировать. Видимо, их спонсирует Microsoft, который по умолчанию вставляет свой перевод. Он достойный, но хотелось бы иметь возможность отключать машинный перевод при необходимости. Ладно, всё равно не попробовать уже.

На этом на сегодня хочу закончить вводную статью. Скоро составлю честный обзор на другие кошки, а не эту вводную ерунду. Начать с чего-то было нужно. Пока можете прочитать что-нибудь интересное у меня в профиле.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Пишу под ником Grolribasi, люблю лонгриды на нишевые темы, чтобы лучше в них разобраться.
Веду канал в телеграме: @grolchannel

5 комментариев

101943865351264515359@google
Спасибо, наконец-то хоть какой-то занятный материал по CAT-инструментам. Как раз сейчас пишу работу в университете и пытаюсь разобраться в этом всём.
Grolribasi
Спасибо! Дальше будут ещё обзоры на популярные инструменты.
101943865351264515359@google
Отлично, буду ждать.
Такой вопрос — есть ли где-нибудь в интернете бесплатные пособия по работе с CAT- инструментами? А то ничего толкового найти не смог, ни учебников, ни видео-уроков. SmartCAT, кончено, классный, но хотелось бы что-то более профессиональное и функциональное попробовать
B
85% времени это работа с памятью перевода и, в целом, разницы между приложениями не увидишь, только если есть специфика в процессе перевода либо же в работе с файлами. Больше что-то бытовое вроде горячих клавиш, чтоб руки не отрывать от клавы, если у тебя много сегментов на перевод. Сюда можно также добавить работу с тегам и — в wordfast, например, довольно адекватно с ними на клаве работать. А в trados приходится до мышки тянуться, что неудобно.
Еще способность приложения бить импортируемый файл на адекватные куски. Ну и экспорт также.
Можно еще добавить возможность программы вычитывать текст на предмет опечаток, пропущенных/лишних запятых или же это внешний инструмент вроде xterm
Grolribasi
Как сказали ниже, особенной разницы между программами нет. Когда понимаешь одну, понимаешь и остальные, а там уже вопрос удобства/неудобство для самого себя.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ученые составляют карту черных дыр на основе гравитационных волн

Гравитационные волны, рябь пространства-времени, предсказанная Альбертом Эйнштейном более века назад и впервые непосредственно зафиксированная в 2015 году, продолжает переворачивать наши...

Русское искусство по цене Макбука? Удивительные открытия на выставке живописи одного из аукционов

Уже скоро в аукционном доме «Александр» пройдут ежегодные торги, где будут предложены предметы искусства из частных коллекций. Предшествует этому, уже по традиции, предпоказ, где ценители и...

Голубая планета, чёрный прогноз: когда Арктика встретит свой первый безледный день?

Арктика, царство вечной мерзлоты, меняется на глазах. Уменьшение площади ледового покрова — один из самых наглядных симптомов глобального потепления. И хотя ученые уже давно говорят о...

Как на острове Ява, меньшем по размеру, чем Омская область, живёт больше людей, чем в России и какова его особенность

Представьте себе крошечный остров, где живёт больше людей, чем во всей огромной России. Всего лишь небольшой клочок суши, размером меньше Омской области, но на нём умудряется разместиться более 150...

Как повысить качество фотографий с низким разрешением с помощью нейросетей

В этой статье покажу бесплатные сайты с нейросетями, которые помогут улучшить качество скриншотов и снимков. Рассмотрим два варианты и сделаем небольшое сравнение между ними в конце материала....