Похожие презентации:
Машинный перевод
1. Машинный перевод
видыстратегии
классификации
поколения
2. Перед тем как…
Инженер компании Google Пол Хаахр (PaulHaahr) сделал интересное заявление на
конференции SMX West, которая прошла в
калифорнийском Сан-Хосе в начале марта.
В ходе мероприятия Хаахр отвечал на вопросы
аудитории, в том числе касающиеся
поисковых продуктов Google, так как он сам
является одним из топовых разработчиков
поискового подразделения компании. Хаахра
попросили рассказать о работе системы
искусственного интеллекта RankBrain,
созданной на базе алгоритмов машинного
обучения.
3. И…цитата:
«В Google понимают, по каким принципамработает RankBrain, но нам не всегда
удается понять, что он делает».
Paul Haahr
https://xakep.ru/2016/03/09/rankbrain/
4. А теперь МП
• Предпосылки к развитию МП• История МП
• Самый первый и самый известный эксперимент
в истории МП
• С чем был связан «Ренессанс» исследований в
области МП…
5.
6. Проблема искусственного интеллекта
В идеале искусственный интеллект — это способностьмашины создавать самостоятельные суждения. Если мы
имеем тот или иной текст, то машина должна уметь, вопервых, извлечь из него информацию, а во-вторых,
знания. Информация — это факты. А знания — это
способность выводить из имеющихся фактов
неизвестные до сих пор закономерности.
Делир Лахути
7. Классификация МП
По степени автоматизации (доле участиячеловека):
• Полностью автоматический
• …при участии человека
• Перевод, осуществляемый человеком с
использованием компьютера
8. Классификация МП
По типу лингвистической стратегии:
до середины 60х (СМП первого
поколения): Прямые системы ПМ
до середины 70х (СМП второго поколения)
до середины 80х (СМП третьего
поколения?)
С середины 80х…
Иные СМП…
9. Еще классификации МП
По количеству привлекаемых языковых пар:
двуязычные
многоязычные
универсальные
По тематической ориентации:
монотематические
политематические
По степени реализованности:
промышленные
развивающиеся
экспериментальные
10.
11. История машинного перевода. Часть 1
12.
«I have a text in front of me which iswritten in Russian but I am going to
pretend that it is really written in English
and that it has been coded in some
strange symbols. All I need to do is strip
off the code in order to retrieve the
information contained in the text.»
Warren Weaver
13.
«У меня перед глазами текст,написанный по-русски, но я собираюсь
сделать вид, что на самом деле он
написан по-английски и закодирован
при помощи довольно странных
знаков. Все, что мне нужно, — это
взломать код, чтобы извлечь
информацию»
Уоррен Уивер
14. Лейбниц, Готфрид Вильгельм
- изобрёл первый интегрирующий механизм иуникальную для того времени счётную машину, вёл
термин «модель»
- в диссертации Dissertatio de arte
combinatoria опубликовал идею о "пазиграфии или
искусстве делаться понятным при помощи общих
письменных знаков для всех народов на земле, на
каких бы разных языках они ни говорили, если только
они знакомы с этими общими знаками". Слова должны
были не только выражать идеи, но также делать их
взаимосвязи, т. е. позволять образовывать их с
помощью алгебраических операций и заменять
рассуждения формулами.
15. Рене Декарт
- предложил универсальный язык, вкотором один символ выражает
эквивалентные идеи различных языков.
16. Чарльз Бэббидж
проект цифровой аналитической машиныИдея Ч. Бэббиджа состояла в том, что память объемом
1000 50-разрядных десятичных чисел (по 50 зубчатых
колес в каждом регистре) можно использовать для
хранения словарей.
В 1985 году сотрудники Музея науки в Лондоне начали
работы по созданию машины Бэббиджа. В ноябре 1991
года машина заработала, вычисляя логарифмы и
другие математические функции.
17. Петр Петрович Смирнов-Троянский
Петр Петрович СмирновТроянскиймашина для автоматического производства
нуждающихся только в литературной обработке
готовых печатных переводов с одного языка
одновременно на ряд других языков
18.
Три стадии механического перевода:1. человек-редактор, знающий исходный язык,
преобразовывал слова предложения в "основную"
форму и расставлял синтаксические функции слов c
целью избавить входной текст от неясностей
морфологического, синтаксического и семантического
характера
2. машина переводила эти формы и функции на
заданный язык
3. полученное редактировал человек, доводя
переведенный текст до правильно сказанного и
благозвучного
19.
«У меня перед глазами текст,написанный по-русски, но я собираюсь
сделать вид, что на самом деле он
написан по-английски и закодирован
при помощи довольно странных
знаков. Все, что мне нужно, — это
взломать код, чтобы извлечь
информацию»
Уоррен Уивер
20.
«Что касается проблемы механическогоперевода,то, откровенно говоря, я боюсь,
что границы слов в разных языках
слишком расплывчаты, а эмоциональные
и интернациональные слова занимают
слишком большое место в языке, чтобы
какой-нибудь полумеханический способ
перевода был многообещающим... В
настоящее время механизация языка...
представляется весьма преждевременной»
21. Концепция Interlingva
Два этапа передачи информации:1. исходное предложение переводится на
язык-посредник (созданный на базе
упрощенного английского языка)
2. Результат этого перевода
представляется средствами выходного
языка
22. Джорджтаунский эксперимент
Основные даты:1952 год
7 января 1954 года
3-5 лет
1959 год
1964 год
1966 год
23. Джорджтаунский эксперимент
«Девушка, которая не понимает ни слова на языкеСоветов, набрала русские сообщения на перфокартах.
Машинный мозг сделал их английский перевод и выдал
его на автоматический принтер с бешеной скоростью —
две с половиной строки в секунду»
IBM Press release, January 8, 1954
24.
25. «John was looking for his toy box. Finally he found it. The box was in the pen John was very happy»
Яндекс и ABBYY LingvoДжон искал его игрушечную коробку. Наконец он нашел его.
Коробка была в загоне. Джон был очень счастлив.
PROMT Online
Джон искал свою игрушечную коробку. Наконец он нашел его.
Коробка была в ручке. Джон был очень счастлив
Google Translator
Джон искал его игрушечную коробку. Наконец, он нашел его.
Коробка была в ручке. Джон был очень счастлив
ETAP-3 MT System
Джон искал свою коробку игрушки. Наконец он нашёл это. Коробка
находилась в ручке. Джон был очень счастлив.
26. Рекомендую:
- 701 Translator. IBM Press release, January8, 1954
- Weaver memorandum (March 1949)
- Компьютерра, 2002, № 21. "Ты меня
понимаешь?" Проблемы машинного
перевода.
27. История машинного перевода. Часть 2
28. «серебряный век» советской структурной лингвистики
1960 - постановление Президиума АН СССР «Оразвитии структурных и математических методов
исследования языка»
Отделы, занимающиеся структурной лингвистикой,
появляются в Москве, Ленинграде, Новосибирске
Советские лингвисты Игорь Мельчук, Юрий
Апресян и Александр Жолковский создают
модель «Смысл — Текст»
29. «Смысл-Текст» ЭТАП
ЛАБОРАТОРИЯ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИИППИ ИМ. А.А.ХАРКЕВИЧА РАН
http://proling.iitp.ru/
ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР ЭТАП-3
30. Судьба ученого
МарчукИгорь Александрович
Советский лингвист,
создатель системы ЭТАП
С 1977 г. профессор
Монреальского университета
Обсерватория лингвистики
«Смысл ⇔ Текст»
http://olst.ling.umontreal.ca/
31. В ТО ЖЕ ВРЕМЯ НА ЗАПАДЕ…
1968 – Питер Тома основывает LATSEC, одну изпервых фирм разработчиков систем МП
1969 – в Миддлтауне (штат Нью-Йорк) Чарльз Бирн
и Бернард Скотт, фирма Logos
Brigham Young University (штат Юта, США) –
WEIDNER и ALPS
Группа TAUM в Монреале, система METEO
Группа GENA в Гренобле и группа SUSY в
Саарбрюкен, проект EUROTRA
32. НОВЫЙ ЭТАП В ИСТОРИИ
1970–80«Ренессанс» машинного перевода, связанный с
развитием компьютерной техники. Ученые
ставят более реалистичные задачи и делают
акцент на участии человека в процессе
автоматической обработки текста. Затраты на
разработку систем машинного перевода в США,
Европе и Японии исчисляются десятками
миллионов долларов.
33. КОММЕРЧЕСКИЙ УСПЕХ
Комиссия Европейских общин (CEC) покупает:- англо-французскую версию Systran
- систему перевода с русского на английский
- заказывает разработку франко-английской и
итальяно-английской версий.
В Японии разрабатываются системы, основанные
на Interlingva.
Панамериканская организация здравоохранения
(PAHO) заказывает разработку испано-английского
направления – система SPANAM
34. КОММЕРЧЕСКИЙ УСПЕХ
ВВС США финансируют разработки вЛингвистическом исследовательстком центре при
Техасском университете в Остине.
Группа TAUM в Канаде достигает заметных успехов
в разработке своей системы METEO.
В период с 1978 по 1993 г.
США – 20 000 000
Европа – 70 000 000
Япония – 200 000 000
35. УСПЕШНЫЕ КОММЕРЧЕСКИЕ ПРОЕКТЫ 90х
SystranIBM
L&H (Lernout & Hauspie)
Language Engineering Corporation
Transparent Language
Nova Incorporated
Trident Software
Atril
LingoWare
Ata Software
Lingvistica b.v.
36. ПЕРВЫЕ СИСТЕМЫ ОН-ЛАЙН ПЕРЕВОДА
www.alphaworks.ibm.com/aw.nsf/html/mthttp://www.freetranslation.com/
http://www.transtlate.ru/
www.logomedia.net/text.asp
www.foreignword.com/Tools/transnow.htm
babelfish.altavista.com/translate.dyn
http://www.t-mail.com/
37. ПРОМТ
Июль 1990 - на выставке PC Forum вМоскве проедставлена система PROMT
(PROgrammer’s Machine Translation)
1991 - создано ЗАО "ПРОект МТ"
1992 - компания "ПРОМТ" выиграла
конкурс NASA на поставку систем МП
1992 - "ПРОМТ" выпускает целое
семейство систем STYLUS