Информационный поиск
План
Поиск
Поиск информации
Информационный поиск
Этапы ИП
Цель ИП
Основные задачи ИП
Виды ИП (критерии выделения)
Цель ИП
Объект ИП
Предмет (содержание) ИП
Степень использования технических средств
Методы ИП 
Жанр литературы
Хронологический охват
Географический охват
Полнота поиска
Интенсивность поиска 
Категория потребителя информации 
Интенсивность поиска
Информационно-поисковая система (ИПС)
Виды ИПС
Оценка эффективности ИТ
Релевантность
Точность  (precision)
Полнота  (recall)
Коэффициент информационного шума
Коэффициент потерь
Задание
Семинар 3
Литература
180.61K

Информационный поиск

1. Информационный поиск

Лекция 3

2. План

Информационный поиск (ИП).
Этапы ИП.
Задачи ИП.
Виды ИП.
Информационно-поисковая
система (ИПС).
Запрос, объект запроса.
Оценка эффективности ИП.
2
Информационный поиск

3. Поиск

совокупность операций, связанных
с определением местонахождения
объекта с заданными
характеристиками или признаками
3
Информационный поиск

4. Поиск информации

- процесс выявления в некотором множестве
документов тех, которые
посвящены указанной теме
удовлетворяют условию поиска
содержат необходимые факты, сведения,
данные
4
Информационный поиск

5. Информационный поиск

Кельвин Муэрс, 1948
процесс поиска (нахождения,
отбора и выдачи) информации из
массивов и записей любого вида и
на любых носителях, которая
определяется заранее заданными
признаками и удовлетворяет
информационные потребности
наука об этом
поиске
Причина осуществления ИП информационная потребность в форме
информационного запроса
5
Информационный поиск

6. Этапы ИП

уточнение потребности, формулировка
запроса
определение источников
извлечение информации
6
ознакомление с полученной информацией,
Информационный поиск
оценка результатов

7. Цель ИП

- помочь пользователю
удовлетворить его
информационную потребность.
7
Информационный поиск

8. Основные задачи ИП

1.
Поиск необходимых сведений об источнике и
установление его наличия в системе других
источников (библиографический поиск).
2.
Поиск информационных источников (документов и
изданий), в которых содержится нужная
информация (документальный поиск).
3.
Поиск фактических сведений, содержащихся в
литературе, книге (фактографический поиск).
8
Информационный поиск

9. Виды ИП (критерии выделения)

Цель поиска
Объект поиска
Предмет поиска
Степень использования технических средств
Метод поиска
Жанр литературы
Хронологический охват
Географический охват
Полнота поиска
Интенсивность поиска
Категория потребителя информации
Интенсивность поиска
9
Информационный поиск

10. Цель ИП

Адресный
- процесс поиска
документов по
формальным признакам,
указанным в запросе
Условия:
наличие у документа
точного адреса
строгий порядок
расположения
документов
10
Информационный поиск
Семантический
- процесс поиска документов по
их содержанию.
Условия:
перевод содержания с
естественного языка на
информационно-поисковый
язык,
составление поисковых
образов
составление поискового
описания

11. Объект ИП

Документальный ИП
Библиотечный -
нахождение первичных
документов.
Фактографический ИП
Документально-
фактографический - поиск
в документах фрагментов
текста, содержащих факты.
Библиографический -
нахождение сведений о
документах,
представленных в виде
библиографических
записей.
11
Информационный поиск
Фактологический -
создание новых
фактографических
описаний путем
переработки найденной
фактографической
информации.

12. Предмет (содержание) ИП

Универсальный
Отраслевой
Тематический
12
Информационный поиск

13. Степень использования технических средств

Ручной
Машинный
Автоматизированный
13
Информационный поиск

14. Методы ИП 

Методы ИП
Сплошной поиск
Выборочный поиск
Интуитивный поиск
Индуктивный поиск
Дедуктивный поиск
Рецептурный поиск
Поиск по библиографическим ссылкам
Поиск путем восхождения от абстрактного к
конкретному
14
Информационный поиск

15. Жанр литературы

Общелитературный
Жанровый (видовой)
15
Информационный поиск

16. Хронологический охват

Текущий
Ретроспективный
Проспективный (перспективный)
16
Информационный поиск

17. Географический охват

Общемировой
Страноведческий
Краеведческий
17
Информационный поиск

18. Полнота поиска

Абсолютный (максимальный)
Избирательный
18
Информационный поиск

19. Интенсивность поиска 

Интенсивность поиска
Систематический
Разовый
19
Информационный поиск

20. Категория потребителя информации 

Категория потребителя
информации
Массовый
Специальный
Индивидуальный
20
Информационный поиск

21. Интенсивность поиска

Разовый
Многоразовый
Постоянный
21
Информационный поиск

22. Информационно-поисковая система (ИПС)

автоматизированная поисковая система,
реализованная на средствах
электронной вычислительной техники и
предназначенная для нахождения и
выдачи пользователям необходимой
информации по заданным критериям
ИПС=ИПЯ + программные средства + средства/правила
перевода текстов на ИПЯ (индексирование)
22
Информационный поиск

23. Виды ИПС

документографические
(документальные)
фактографические
документально-фактографические
(интегрированные)
23
Информационный поиск

24. Оценка эффективности ИТ

Критерий соответствия –
признак/совокупность признаков,
определяющих степень
соответствия между запросом и
документом для принятия
решения о выдаче или не выдаче
документа в ответ на запрос
24
Информационный поиск

25.

Критерий
смыслового
соответствия
признак/совокупность
признаков, по которым
определяется степень
смыслового соответствия
между содержанием
запроса и документом для
принятия решения о
выдаче или не выдаче
документа в ответ на запрос
25
Информационный поиск
Критерий
формального
соответствия
признак/совокупность
признаков, по которым
определяется степень
формального соответствия
между запросом и
документом для принятия
решения о выдаче или не
выдаче документа в ответ
на запрос

26.

Релевантность
Коэффициент
потерь
Коэффициент
информационного
шума
26
Точность
Полнота

27. Релевантность

характеристика степени соответствия
смыслового содержания документа, найденного
в результате поиска, содержанию
информационного запроса.
27
Информационный поиск

28. Точность  (precision)

Точность (precision)
определяется путем деления количества
выданных в результате выполнения поиска
релевантных документов на общее число
выданных документов (релевантных и не
релевантных)
28
Информационный поиск

29. Полнота  (recall)

Полнота (recall)
определяется путем деления количества
выданных в результате выполнения поиска
релевантных документов на общее число
релевантных документов, имеющихся в
информационно-поисковой системе (выданных
и не выданных)
29
Информационный поиск

30. Коэффициент информационного шума

определяется путем деления количества
выданных в результате выполнения поиска
нерелевантных документов на общее число
выданных документов (релевантных и не
релевантных)
30
Информационный поиск

31. Коэффициент потерь

определяется путем деления количества не
выданных в результате выполнения поиска
релевантных документов на общее число
релевантных документов, имеющихся в
информационно-поисковой системе (выданных
и не выданных)
31
Информационный поиск

32. Задание

Общее число релевантных документов в базе
данных - 160.
Общее число найденных по запросу документов
– 100.
Из них релевантных 40, нерелевантных 60.
Определите
• точность
• полноту
• КП
• КИШ
32
Информационный поиск

33. Семинар 3

1.
2.
3.
4.
5.
6.
7.
8.
33
Информационный поиск (ИП): понятие ИП, ИП
как наука и процесс
Этапы ИП
Задачи ИП
Виды ИП
Методы ИП
Информационно-поисковая система (ИПС). Виды
Оценка эффективности ИП
Поисковые образы документов
Информационный поиск

34. Литература

Зубов А.В. Информационные технологии в
лингвистике. Москва, 2004.
Захаров В.В. Лингвистические средства
информационного поиска в Интернете. СанктПетербург, 2005.
Соснина Е.П. Введение в прикладную лингвистику.
Ульяновск, 2012.
34
Информационный поиск
English     Русский Правила