320.08K

Информационные технологии в лингвистике

1.

Информационные
технологии в лингвистике
теоретический материал семестра
Выполнила:
Пелагея Петрова

2.

Лингвистика - наука о естественном человеческом языке вообще и обо
всех языках мира, как об отдельных её представителях.
Прагматика - цель коммуникации и язык в контексте.
Узус - предпочтительность использования тех или иных языковых
средств.
Контекст - ближайшее окружение языковых единиц.
Нарратив - повествование.
Лакуна - смысловая скважина.

3.

Лингвистика
теоретическая
прикладная
(практическая)
Практическая лингвистика (applied linguistics) - реализация
лингвистических знаний с целью решения практических задач.
Задачи, оптимизирующиеся с помощью прикладной лингвистики:
● оптимизация способов фиксации и хранения речевой информации;
● оптимизация способов передачи информации;
● оптимизация интеллектуальных способностей человека, связанных с
использованием языка;
● оптимизация использования языка, как средства массовой
коммуникации;

4.

Прикладная лингвистика:
Компьютерная лингвистика;
Интернет лингвистика;
Корпусная лингвистика;
Лингвопрагматика;
Политическая лингвистика;
Психолингвистика;
Суггестивная лингвистика;
Гендерная лингвистика;
Когнитивная лингвистика;
Математическая лингвистика;

5.

Computational linguistics
Компьютерная лингвистика - изучение автоматизации естественного
языка.
NLP (Natural Language Processing) - обработка естественного языка.
Автоматизация - направление научно-технического прогресса,
использующее саморегулирующие технические средства и математические
методы, с целью освобождения человека от участия в процессах получения,
преобразования, передачи и использования энергии, материалов, изделий
или информации, либо существенное уменьшение степени его участия или
трудоемкости, выполняемых операций.

6.

Информация - определенным образом связанные сведения, данные,
понятия, отраженные в нашем сознании и изменяющем наше представление
о реальном мире.
Свойства информации:
Ценность;
Достоверность;
Полнота;
Актуальность;
Логичность;
Компактность.

7.

Информационные технологии (ИТ)
-
система взаимосвязанных методов и способов сбора, хранения,
накопления, обработки информации на основе применения средств
вычислительной техники.
Informational technology:
● Звуковые платы (речь, звуки, музыка);
● ПК;
● Изобретение видеоплат.

8.

ИТ (в лингвистике)
-
совокупность знаков, методов и средств получения, хранения, передачи,
распространения, преобразования информации о языке и законах её
функционирования, с помощью компьютеров.
Задачи, которые решают ИТ в лингвистике:
создание систем искусственного интеллекта;
создание систем автоматического перевода;
создание систем автоматического аннотирования и реферирования;
создание систем порождения текста;
создание систем обучения языку;
создание систем понимания устной речи;
создание систем генерации речи.

9.

Тест Тьюринга — эмпирический тест,
идея которого была предложена Аланом
Тьюрингом в статье «Вычислительные
машины и разум», опубликованной в 1950
году в философском журнале Mind.
Тьюринг задался целью определить,
может ли машина мыслить.
Джорджтаунский эксперимент —
демонстрация возможностей
машинного перевода, состоявшаяся 7
января 1954 года в Нью-Йорке, в штабквартире корпорации IBM.
Подготовлена Джорджтаунским
университетом совместно с IBM. В
ходе эксперимента был
продемонстрирован полностью
автоматический перевод более 60
предложений с русского языка на
английский.

10.

Исследованием информации
занимаются:
● Информатика (как
автоматизировать обработку
информации);
● Кибернетика (наука об
управлении; как управлять
системами использования
информации).
Поиск системы - алгоритмы и
реализация их совокупности
компьютерных программ,
предоставляющие пользователю
быстрой доступ к необходимой для
него информации при помощи
поиска в обширной коллекции
доступных данных.

11.

Операторы поиска:
“-” / “минус” - исключение из поиска;
“~” - поиск синонимов;
“*” - неопределенный поиск;
“|” - поиск по нескольким сочетаниям фраз, заменяя несколько слов в
различных местах;
“define” - узнать значение слова;
Для нахождения точного совпадения поисковой выдачи с запросом
достаточно заключить ключевики в кавычки;
“Site” - поиск ключевых слов только по одному сайту;
“Filetype” - поиск по заданному расширению файла;
“translate [слово] into [язык]” - перевод.

12.

Важные и
полезные
для
переводчика
сайты
Britannica
Multitran
ISO.org
ГОСТ.ru
English     Русский Правила