Машинный перевод
Перед тем как…
И…цитата:
А теперь МП
Проблема искусственного интеллекта
Классификация МП
Классификация МП
Еще классификации МП
История машинного перевода. Часть 1
Лейбниц, Готфрид Вильгельм
Рене Декарт
Чарльз Бэббидж
Петр Петрович Смирнов-Троянский
Концепция Interlingva
Джорджтаунский эксперимент
Джорджтаунский эксперимент
«John was looking for his toy box. Finally he found it. The box was in the pen John was very happy»
Рекомендую:
История машинного перевода. Часть 2
«серебряный век» советской структурной лингвистики
«Смысл-Текст» ЭТАП
Судьба ученого
В ТО ЖЕ ВРЕМЯ НА ЗАПАДЕ…
НОВЫЙ ЭТАП В ИСТОРИИ
КОММЕРЧЕСКИЙ УСПЕХ
КОММЕРЧЕСКИЙ УСПЕХ
УСПЕШНЫЕ КОММЕРЧЕСКИЕ ПРОЕКТЫ 90х
ПЕРВЫЕ СИСТЕМЫ ОН-ЛАЙН ПЕРЕВОДА
ПРОМТ
835.50K
Категория: ИнформатикаИнформатика

Машинный перевод

1. Машинный перевод

виды
стратегии
классификации
поколения

2. Перед тем как…

Инженер компании Google Пол Хаахр (Paul
Haahr) сделал интересное заявление на
конференции SMX West, которая прошла в
калифорнийском Сан-Хосе в начале марта.
В ходе мероприятия Хаахр отвечал на вопросы
аудитории, в том числе касающиеся
поисковых продуктов Google, так как он сам
является одним из топовых разработчиков
поискового подразделения компании. Хаахра
попросили рассказать о работе системы
искусственного интеллекта RankBrain,
созданной на базе алгоритмов машинного
обучения.

3. И…цитата:

«В Google понимают, по каким принципам
работает RankBrain, но нам не всегда
удается понять, что он делает».
Paul Haahr
https://xakep.ru/2016/03/09/rankbrain/

4. А теперь МП

• Предпосылки к развитию МП
• История МП
• Самый первый и самый известный эксперимент
в истории МП
• С чем был связан «Ренессанс» исследований в
области МП…

5.

6. Проблема искусственного интеллекта

В идеале искусственный интеллект — это способность
машины создавать самостоятельные суждения. Если мы
имеем тот или иной текст, то машина должна уметь, вопервых, извлечь из него информацию, а во-вторых,
знания. Информация — это факты. А знания — это
способность выводить из имеющихся фактов
неизвестные до сих пор закономерности.
Делир Лахути

7. Классификация МП

По степени автоматизации (доле участия
человека):
• Полностью автоматический
• …при участии человека
• Перевод, осуществляемый человеком с
использованием компьютера

8. Классификация МП


По типу лингвистической стратегии:
до середины 60х (СМП первого
поколения): Прямые системы ПМ
до середины 70х (СМП второго поколения)
до середины 80х (СМП третьего
поколения?)
С середины 80х…
Иные СМП…

9. Еще классификации МП


По количеству привлекаемых языковых пар:
двуязычные
многоязычные
универсальные
По тематической ориентации:
монотематические
политематические
По степени реализованности:
промышленные
развивающиеся
экспериментальные

10.

11. История машинного перевода. Часть 1

12.

«I have a text in front of me which is
written in Russian but I am going to
pretend that it is really written in English
and that it has been coded in some
strange symbols. All I need to do is strip
off the code in order to retrieve the
information contained in the text.»
Warren Weaver

13.

«У меня перед глазами текст,
написанный по-русски, но я собираюсь
сделать вид, что на самом деле он
написан по-английски и закодирован
при помощи довольно странных
знаков. Все, что мне нужно, — это
взломать код, чтобы извлечь
информацию»
Уоррен Уивер

14. Лейбниц, Готфрид Вильгельм

- изобрёл первый интегрирующий механизм и
уникальную для того времени счётную машину, вёл
термин «модель»
- в диссертации Dissertatio de arte
combinatoria опубликовал идею о "пазиграфии или
искусстве делаться понятным при помощи общих
письменных знаков для всех народов на земле, на
каких бы разных языках они ни говорили, если только
они знакомы с этими общими знаками". Слова должны
были не только выражать идеи, но также делать их
взаимосвязи, т. е. позволять образовывать их с
помощью алгебраических операций и заменять
рассуждения формулами.

15. Рене Декарт

- предложил универсальный язык, в
котором один символ выражает
эквивалентные идеи различных языков.

16. Чарльз Бэббидж

проект цифровой аналитической машины
Идея Ч. Бэббиджа состояла в том, что память объемом
1000 50-разрядных десятичных чисел (по 50 зубчатых
колес в каждом регистре) можно использовать для
хранения словарей.
В 1985 году сотрудники Музея науки в Лондоне начали
работы по созданию машины Бэббиджа. В ноябре 1991
года машина заработала, вычисляя логарифмы и
другие математические функции.

17. Петр Петрович Смирнов-Троянский

Петр Петрович СмирновТроянский
машина для автоматического производства
нуждающихся только в литературной обработке
готовых печатных переводов с одного языка
одновременно на ряд других языков

18.

Три стадии механического перевода:
1. человек-редактор, знающий исходный язык,
преобразовывал слова предложения в "основную"
форму и расставлял синтаксические функции слов c
целью избавить входной текст от неясностей
морфологического, синтаксического и семантического
характера
2. машина переводила эти формы и функции на
заданный язык
3. полученное редактировал человек, доводя
переведенный текст до правильно сказанного и
благозвучного

19.

«У меня перед глазами текст,
написанный по-русски, но я собираюсь
сделать вид, что на самом деле он
написан по-английски и закодирован
при помощи довольно странных
знаков. Все, что мне нужно, — это
взломать код, чтобы извлечь
информацию»
Уоррен Уивер

20.

«Что касается проблемы механического
перевода,то, откровенно говоря, я боюсь,
что границы слов в разных языках
слишком расплывчаты, а эмоциональные
и интернациональные слова занимают
слишком большое место в языке, чтобы
какой-нибудь полумеханический способ
перевода был многообещающим... В
настоящее время механизация языка...
представляется весьма преждевременной»

21. Концепция Interlingva

Два этапа передачи информации:
1. исходное предложение переводится на
язык-посредник (созданный на базе
упрощенного английского языка)
2. Результат этого перевода
представляется средствами выходного
языка

22. Джорджтаунский эксперимент

Основные даты:
1952 год
7 января 1954 года
3-5 лет
1959 год
1964 год
1966 год

23. Джорджтаунский эксперимент

«Девушка, которая не понимает ни слова на языке
Советов, набрала русские сообщения на перфокартах.
Машинный мозг сделал их английский перевод и выдал
его на автоматический принтер с бешеной скоростью —
две с половиной строки в секунду»
IBM Press release, January 8, 1954

24.

25. «John was looking for his toy box. Finally he found it. The box was in the pen John was very happy»

Яндекс и ABBYY Lingvo
Джон искал его игрушечную коробку. Наконец он нашел его.
Коробка была в загоне. Джон был очень счастлив.
PROMT Online
Джон искал свою игрушечную коробку. Наконец он нашел его.
Коробка была в ручке. Джон был очень счастлив
Google Translator
Джон искал его игрушечную коробку. Наконец, он нашел его.
Коробка была в ручке. Джон был очень счастлив
ETAP-3 MT System
Джон искал свою коробку игрушки. Наконец он нашёл это. Коробка
находилась в ручке. Джон был очень счастлив.

26. Рекомендую:

- 701 Translator. IBM Press release, January
8, 1954
- Weaver memorandum (March 1949)
- Компьютерра, 2002, № 21. "Ты меня
понимаешь?" Проблемы машинного
перевода.

27. История машинного перевода. Часть 2

28. «серебряный век» советской структурной лингвистики

1960 - постановление Президиума АН СССР «О
развитии структурных и математических методов
исследования языка»
Отделы, занимающиеся структурной лингвистикой,
появляются в Москве, Ленинграде, Новосибирске
Советские лингвисты Игорь Мельчук, Юрий
Апресян и Александр Жолковский создают
модель «Смысл — Текст»

29. «Смысл-Текст» ЭТАП

ЛАБОРАТОРИЯ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ
ИППИ ИМ. А.А.ХАРКЕВИЧА РАН
http://proling.iitp.ru/
ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР ЭТАП-3

30. Судьба ученого

Марчук
Игорь Александрович
Советский лингвист,
создатель системы ЭТАП
С 1977 г. профессор
Монреальского университета
Обсерватория лингвистики
«Смысл ⇔ Текст»
http://olst.ling.umontreal.ca/

31. В ТО ЖЕ ВРЕМЯ НА ЗАПАДЕ…

1968 – Питер Тома основывает LATSEC, одну из
первых фирм разработчиков систем МП
1969 – в Миддлтауне (штат Нью-Йорк) Чарльз Бирн
и Бернард Скотт, фирма Logos
Brigham Young University (штат Юта, США) –
WEIDNER и ALPS
Группа TAUM в Монреале, система METEO
Группа GENA в Гренобле и группа SUSY в
Саарбрюкен, проект EUROTRA

32. НОВЫЙ ЭТАП В ИСТОРИИ

1970–80
«Ренессанс» машинного перевода, связанный с
развитием компьютерной техники. Ученые
ставят более реалистичные задачи и делают
акцент на участии человека в процессе
автоматической обработки текста. Затраты на
разработку систем машинного перевода в США,
Европе и Японии исчисляются десятками
миллионов долларов.

33. КОММЕРЧЕСКИЙ УСПЕХ

Комиссия Европейских общин (CEC) покупает:
- англо-французскую версию Systran
- систему перевода с русского на английский
- заказывает разработку франко-английской и
итальяно-английской версий.
В Японии разрабатываются системы, основанные
на Interlingva.
Панамериканская организация здравоохранения
(PAHO) заказывает разработку испано-английского
направления – система SPANAM

34. КОММЕРЧЕСКИЙ УСПЕХ

ВВС США финансируют разработки в
Лингвистическом исследовательстком центре при
Техасском университете в Остине.
Группа TAUM в Канаде достигает заметных успехов
в разработке своей системы METEO.
В период с 1978 по 1993 г.
США – 20 000 000
Европа – 70 000 000
Япония – 200 000 000

35. УСПЕШНЫЕ КОММЕРЧЕСКИЕ ПРОЕКТЫ 90х

Systran
IBM
L&H (Lernout & Hauspie)
Language Engineering Corporation
Transparent Language
Nova Incorporated
Trident Software
Atril
LingoWare
Ata Software
Lingvistica b.v.

36. ПЕРВЫЕ СИСТЕМЫ ОН-ЛАЙН ПЕРЕВОДА

www.alphaworks.ibm.com/aw.nsf/html/mt
http://www.freetranslation.com/
http://www.transtlate.ru/
www.logomedia.net/text.asp
www.foreignword.com/Tools/transnow.htm
babelfish.altavista.com/translate.dyn
http://www.t-mail.com/

37. ПРОМТ

Июль 1990 - на выставке PC Forum в
Москве проедставлена система PROMT
(PROgrammer’s Machine Translation)
1991 - создано ЗАО "ПРОект МТ"
1992 - компания "ПРОМТ" выиграла
конкурс NASA на поставку систем МП
1992 - "ПРОМТ" выпускает целое
семейство систем STYLUS
English     Русский Правила