Применение принципов когнитивной лингвистики в машинном переводе

1.

ПРИМЕНЕНИЕ ПРИНЦИПОВ КОГНИТИВНОЙ
ЛИНГВИСТИКИ В МАШИННОМ ПЕРЕВОДЕ
Подготовил: аспирант
Орловского государственного университета им. И. С. Тургенева
Новиков Артем Владимирович
Научный руководитель: к.ф.н. доцент
Иванишин Дмитрий Александрович

2.

По А. Д. Швейцеру перевод – это однонаправленный и двухфазный
процесс межъязыковой и межкультурной коммуникации, при котором на
основе подвергнутого целенаправленному (переводческому) анализу
первичного текста создается вторичный текст (метатекст), заменяющий
первичный в другой языковой и культурной среде.
В когнитивной парадигме перевод – это не статичный перенос с одного
языка
на
другой,
а
скорее
динамическое
осмысление
смыслопорождающего акта, в котором исходный текст служит лишь
устройством,
подсказывающим
знания,
необходимые
для
смыслопорождения.
Между текстами на ИЯ и ПЯ нет ни сходств, ни различий; они лишь
концептуально
связаны
между
собой
как
потенциалы
смыслопорождения.

3.

Фрейм определяется как когнитивная структура, знание, которое
(предполагается) ассоциировано с концептом, представленным
тем или иным словом [Филлмор 1988: 87].
Фреймовое соответствие возникает, когда в культурах ИЯ и ПЯ
могут быть задействованы соответствующие или сходные фреймы.
Когда прямое соответствие труднодостижимо из-за различий
между культурами ИЯ и ПЯ, переводчик может модифицировать
такие фреймы, обнаруженные при чтении текста на ИЯ, например,
сократить или добавить элементы фрейма, или осуществить
перенос фреймов ИЯ [Xiao 2017].

4.

Нейронный машинный перевод (Neural Machine Translation – NMT) относится к
области искусственного интеллекта и представляет собой использование нейронных
сетей для достижения высокого качества автоматического перевода.
Применение методов глубокого обучения позволяет системам нейронного машинного
перевода обучаться и совершенствоваться на основе огромных объемов двуязычных
текстовых данных, что приводит к более беглому и контекстуально точному
переводу.
Используются архитектуры кодировщика-декодировщика, где кодировщик
анализирует входной текст и преобразует его в формат, пригодный для обработки
(word-embedding – векторное представление слова – набор чисел, характеризующий
слово с точки зрения семантики), а декодировщик генерирует переведенный текст на
основе закодированной информации.

5.

Google Neural Machine Translator (GNMT)

6.

Оригинал: Don't bring beer to the pub; it is like carrying
coals to Newcastle.
Google: Не приносите пиво в паб; это все равно, что везти
уголь в Ньюкасл.
This isn't the first time Kate has been in a hot water.
Это не первый раз, когда Кейт попадает в горячую воду.

7.

Оригинал: My son always misplaces things, so looking
for his car keys that day was like looking for a needle in a
haystack.
Google: Мой сын всегда теряет вещи, поэтому искать
ключи от машины в тот день было все равно, что
искать иголку в стоге сена.

8.

Оригинал: It’s autumn and I feel blue.
Google: Сейчас осень, и мне грустно.
Оригинал: Now finding any information on the Internet
is a piece of cake.
Google: Сейчас найти любую
Интернете – проще простого.
информацию
в

9.

Таким образом, с точки зрения когнитивистики перевод рассматривается как динамическое
осмысление смыслопорождающего акта, концептуализация «предшествующего текста», то
есть текста на ИЯ в тексте на ПЯ. Исходный текст служит лишь устройством,
подсказывающим знания, необходимые для смыслопорождения. В нейронном машинном
переводе система осуществляет трансформацию текста с ИЯ на ПЯ через формализацию
слов в векторном их представлении – наборе чисел, а также механизмов внимания.
Корректность текста на ПЯ также зависит от культурных сходств или различий ИЯ и ПЯ,
которые машинный переводчик не в силах распознать, но которым, благодаря глубинному
обучению, он может быть обучен для последующего механического распознавания и
воспроизводства.

10.

Спасибо за внимание!

English Русский Правила