481.81K

Средства автоматизации переводов. Лекция 12

1.

ЛЕКЦИЯ 12.
СРЕДСТВА АВТОМАТИЗАЦИИ
ПЕРЕВОДОВ

2.

Традиционный перевод текстов, т.е. без применения средств
автоматизации, перестает устраивать, поскольку требует больших затрат
времени.
• Какие средства автоматизации перевода текстов появились благодаря
возможностям компьютера?
Прежде всего, это текстовый редактор, сокративший время на
последующее редактирование перевода, а также многочисленные
электронные словари, позволяющие быстро и без труда находить
требуемое значение любого слова и вставлять его в переведенный текст.
Применение только этих средств обеспечило рост производительности
перевода на 20-30% по сравнению с ручной работой.

3.

• Следующим шагом автоматизации перевода стало применение систем
Translation Memory (TM) и технологий машинного перевода (МП).
Принцип работы систем ТМ построен на сравнении текста,
подлежащего переводу, с внутренней базой, хранящей разбитый на
предложения параллельный текст на исходном языке и его перевод,
полученный традиционным способом. При загрузке нового
документа в ТМ-систему происходит его разделение на сегменты и
сопоставление с текстами из базы. Часть этих сегментов оказывается
уже переведенной ранее, и система визуализирует их как уже
известные, другие — как частично совпадающие с БД, а некоторые —
как требующие перевода.

4.

• Наиболее известными системами ТМ в настоящее время
являются Trados TWB и Transit. Они используются в
большинстве переводческих бюро мира.
• Технологии
МП тоже нашли определенное место при
автоматизации процесса переводов. Но наибольшую
эффективность
обеспечивает
комплексное
решение,
опирающееся на все имеющиеся в настоящий момент
лингвистические технологии машинного перевода.

5.

ИСТОРИЯ ЭЛЕКТРОННОГО ПЕРЕВОДА
• Работы по машинному переводу начались с середины 1950-хгодов.
• Машины 70 лет назад были «слабыми», поэтому пользоваться можно
было только ограниченным набором лингвистических средств. Именно
поэтому тогда использовались пословный перевод и словосочетания,
но преимущественно в идиоматических выражениях.
• По мере развития вычислительной техники подходы к машинному
переводу менялись. Активные исследования в области машинного
перевода велись и за рубежом силами таких известных компьютерных
лингвистов, как А.Эттингер (США), И.Бар-Хиллер (США), Н.Хомски
(Израиль).

6.

ИСТОРИЯ ЭЛЕКТРОННОГО ПЕРЕВОДА
• Наибольшую известность приобрели труды японского ученого М.Нагао,
который предложил использовать при машинном переводе уже
готовые, введенные в память ЭВМ варианты прочтения исходных
текстов, ранее сделанные опытными лингвистами. Эти труды и легли в
основу методики Translation Memory («Память переводчика»), широко
используемой до сих пор при переводе документации в крупнейших
корпорациях мира.
• В России пионерами теории машинного перевода были Д.Ю.Панов,
А.А.Ляпунов и И.С.Мухин. В их трудах заложен фундамент, на основе
которого в наши дни развиваются такие известные системы
компьютерного перевода, как PROMT, Сократ и недавно появившаяся
Retrans Vista.

7.

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
Российскими разработчиками созданы четыре поколения программпереводчиков.
• Первое поколение. 1991 г. ознаменован появлением пакета PROMT
(Programmers Machine Translation) версии 3.0, работающего под DOS,
который был ориентирован на переводы документации по
программному обеспечению и не имел возможностей пополнения и
коррекции словаря. В 1992 г. появился пакет Stylus, в состав которого
была включена утилита для коррекции словаря в соответствии со
своей предметной областью. В 1993 г. был создан пакет Stylus for
Windows 2.0, ставший первой в мире программой перевода в среде
Windows 3.1.

8.

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
• Второе поколение. В 1994 г. пользователям была представлена полноценная
версия Stylus for Windows со встроенным редактором, возможностью
сохранения элементов форматирования среды Word, синхронной прокруткой
исходного текста и перевода, механизмом сохранения промежуточных
результатов. Такая программная архитектура позволила организовывать
передачу данных из редактора MS Word и обеспечила перевод
текстов различной тематики. Словарный запас программы значительно
расширился с появлением большого общелексического словаря, к которому
можно было подключать специализированные словари и словари
пользователя. В 1995 г. совместно с компанией «Бит» был разработан пакет
Stylus Lingvo Office, объединивший программу распознавания текста (OCR),
переводчик и программу проверки орфографии (Lingvo Corrector).

9.

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
• Третье поколение. В 1996 г. появляется 32-разрядная версия Stylus под
Windows-95 и –NT. Ее архитектура базируется на ядре перевода под
названием «технология Гигант». Эта технология обеспечивает единую
оболочку
для
перевода,
редактирования
результатов
и
корректировки словарей любых языковых пар, причем пользователь
может обращаться к ядру перевода из самых разных приложений. В
качестве базового инструментального средства в компании был
выбран макроязык программирования MS Visual C++.
• Переводчики для Internet — WebTranSite и «упрощенная» версия Stylus
Lite появляются в 1997 г.

10.

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА
• Четвертое поколение. Программа-переводчик четвертого поколения РгоМТ-98 (1998
г.) состоит из трех компонентов, объединенных оболочкой: PROMT — среда
переводчика; File Translator —приложение для пакетной обработки большого
количества документов; Web View — браузер с синхронным переводом HTMLстраниц. В основе программ-переводчиков четвертого поколения лежит технология
HTML-to-HTML, позволяющая переводить Web-страницы с полным сохранением
форматирования и впоследствии двигаться по переведенным ссылкам. В 1998 г.
появляется также новая версия переводчика для Интернета — WebTranSite-98 и
версия 1.0 переводчика для карманных компьютеров — Pocket PROMT.
• WebTranSite-98 отличается от предыдущей версии возможностью подключения
дополнительных словарей, улучшающих качество перевода, и новой системой поиска,
которая служит для формирования запросов разной сложности на родном языке, их
перевода и отправки на один из популярных поисковых серверов. Pocket PROMT
открывает новую линию программных продуктов компании, ориентированную на
платформу Windows-CE для карманных компьютеров. Текст для перевода можно
набирать на клавиатуре либо открыть готовый небольшой файл размером до 32
Кбайт в текстовом формате или в формате Pocket Word.

11.

Без знания хотя бы одного иностранного языка сегодня
живется туго. Тем ценно, что в Интернете появилось
бесчисленное множество программ-помощников, которые
всегда готовы помочь во время чтения газеты или книги в
оригинале.
• Но тут возникает вопрос, а какой программе довериться?

12.

TRANSLATE.RU (PROMT)
Этот сервис от компании PROMT поддерживает порядка 19 языков и по праву занимает
лидирующие позиции на рынке. Программа может переводить как отдельные слова,
так и крылатые и устойчивые выражения, а также текст целиком. Получить более
качественный перевод пользователь сможет после того, как укажет тематику.
• Есть
также интегрированный словарь, который показывает подробную
грамматическую справку и примеры использования того или иного слова в контексте.
• Программу можно интегрировать на сайт в качестве виджета или кнопки для
перевода сайта целиком.
Плюсы:
• можно усовершенствовать перевод, уточнив тематику;
• умеет переводить веб-страницы;
• содержит встроенные учебники и справочники по грамматике.
Минусы:
• ограничение в 3000 символов.

13.

GOOGLE TRANSLATE
Сервис от специалистов компании Google способен переводить части или вебстраницы целиком на 103 языка. По количеству словарей и доступных функций, Google
Переводчик - самый функциональный и универсальный сервис на сегодняшний день.
Если переводить отдельные слова, сервис автоматически переходит в режим онлайнсловаря, предлагая альтернативы с краткой характеристикой к каждому слову,
показывает транскрипцию и транслитерацию, а также предоставляет озвучку.
Плюсы:
• большая языковая база;
• наличие транскрипции и транслитерации;
• поддержка функции озвучивания.
Минусы:
• ограничивает размер текста до 5000 символов;
• хромает перевод веб-страниц, чаще всего некорректный.

14.

ЯНДЕКС ПЕРЕВОДЧИК
Является одновременно словарем и сервисом для перевода больших текстов и вебстраниц. К каждому слову предлагается несколько вариантов значений слова на другом
языке и подбор синонимов.
Полезная функция - программа умеет переводить текст с изображения, поддерживает
как голосовой, так и текстовый ввод. Стоит отметить и опцию предугадывания слов по
смыслу, что существенно экономит время при вводе текста.
Также есть мобильное приложение, доступное на большинстве платформ, и поддержка
более чем 40 языков. Мобильная версия может работать в офлайн-режиме, если
дополнительно установить приложение программы.
Плюсы:
• интуитивные подсказки для текстового набора;
• предлагает синонимы и альтернативные варианты;
• офлайн-режим.
Минусы:
• есть языки, которым нужна доработка.

15.

MICROSOFT TRANSLATOR
Сервис от компании Microsoft поддерживает 60 с лишним языков. Помимо браузерной
версии есть мобильное приложение для Android, iOS, а также Apple Watch. В мобильной
версии есть офлайн-режим, только необходима загрузка словарей.
Сервис переводит не только тексты, но и голосовые сообщения, фотографии и скриншоты.
Для каждого слова программа предлагает альтернативы.
Программа также предлагает пользователю специальные разговорники и различные
руководства.
Плюсы:
• большая база поддерживаемых языков;
• функция синхронизаци;
• есть функция голосового перевода;
• распознает текст на фотографиях;
• есть синхронизация на разных приложениях.
Минусы:
• функция перевода с картинки или скриншота недоработана.

16.

SYSTRAN
Systran — одна из старейших компаний машинного перевода, основанная в 1968 году. Она работала на
Министерство обороны США и Европейскую комиссию, до 2007 года обеспечивала технологией Google, а до 2012
— Yahoo!, пока они не перешли на свои системы. Сейчас Systran специализируется на платном программном
обеспечении для перевода. Для ознакомления с сервисом компания предлагает воспользоваться их бесплатным
онлайн-переводчиком.
Общее:
• 41 язык;
• поддержка аудио-ввода;
• автоматическое определение языка;
• озвучивание текста перевода;
• режим словаря подобный Google. Тут, однако, отсутствуют примеры использования слов в предложениях, но
даются примеры словосочетаний.
Плюсы:
• предлагаются 2 варианта перевода: Generic (простой, посредственный) и IT (обработанный технологией Systran).
Минусы:
• поле ввода ограничено 2 000 символами;
• работает только с текстами;
• нет возможности редактирования перевода.
English     Русский Правила