2.15M

Информационно-поисковая система. Современные алгоритмы работы с информацией

1.

ИНФОРМАЦИОННОПОИСКОВАЯ СИСТЕМА.
СОВРЕМЕННЫЕ
АЛГОРИТМЫ РАБОТЫ
С ИНФОРМАЦИЕЙ.

2.

Назначение информационно-поисковой
системы (ИПС)
ИПС предназначена для организации полнотекстового (с учетом морфологии языка)
и семантического (по смыслу) поиска документов в архивных фондах.
Функциональные возможности, предоставляемые Системой доступны для населения, органов
государственной власти, органов местного самоуправления и юридических лиц.
1.
Обеспечение
самостоятельного
доступа к документам
Общение с системой
на естественном языке
Поиск и предоставление
информации из различных
источников, с учетом ролевой
модели прав доступа
Расширение
спектра
электронных
услуг
Общение с системой
2.
3.
Сокращение
временных и
трудовых затрат
на естественном языке
Эффективные алгоритмы
индексирования материалов
Открытые интерфейсы
и протоколы взаимодействия с внешними информационными системами
Снижение времени
на анализ запросов
пользователей и поиска
информации
2

3.

Среда взаимодействия поисково-аналитической
системы
ИСТОЧНИ
КИ
ДАННЫХ
ЕАИС РТ
Файловые хранилища
Электронные архивы
СЭД
ИНФОРМАЦИОННО-ПОИСКОВАЯ
СИСТЕМА
ПОИСКОВЫЕ
ВЗАИМОДЕЙСТ
ИНДЕКСЫ/
ВИЕ С
АЛГОРИТМЫ
ПОЛЬЗОВАТЕЛЕ
М
ПОЛЬЗОВАТЕ
ЛИ
ABBYY Intelligent Search
Проведение синтаксического
разбора поискового запроса для
поиска необходимых документов.
Анализ формы слов, их значений,
связей и контекста.
Ранжирование результатов
поиска на основе смысла слов,
предложений и контекста.
Информационно-поисковая
система
АНАЛИТИ
КА
Аналитические
системы/СППР
3

4.

Характеристика объекта
автоматизации
В основу структуры Системы заложен модульный принцип организации,
обеспечивающий возможность встраивания дополнительных подсистем (модулей)
и взаимодействия с другими информационными системами.
ПОИСКОВЫЕ
ИНДЕКСЫ/
АЛГОРИТМЫ
Информационное взаимодействие
с внешними системами –поставщиками данных для Системы
Извлечение текста из документов/
создание поисковых индексов
ВЗАИМОДЕЙСТ
ВИЕ С
ПОЛЬЗОВАТЕЛЕ
М
Формирование поисковых
запросов
Отображение результатов поиска
Анализ запроса
Фильтрация, сортировка
результатов поиска
Поиск информации
Просмотр найденных документов
АНАЛИТИ
КА
Инструменты отображения
анализа данных
Поддержка принятия решения
Построение ретроспективы
4

5.

Интерфейс
пользовате
ля
1
2
3
4
Область формирования
поискового запроса
Управление сортировкой
результатов
Фрагмент найденного
документа
Данные о месте
хранения информации
(источнике)
5
6
Область
дополнительной
фильтрации
результатов
Область
экспресс-аналитики
5

6.

Результаты полнотекстового
поиска
Найдено:
3
6

7.

Результаты семантического
поиска
Найдено:
89
При семантическом поиске количество найденных
документов увеличилось в 30 (!) раз.
7

8.

Сравнение реализованных
алгоритмов поиска
ПОЛНОТЕКСТОВЫЙ
ПОИСК
СЕМАНТИЧЕСКИЙ
ПОИСК
Поиск конкретного
документа по
существенной его части
Поиск документов
близких по смыслу к
тексту запроса
В результатах поиска с учетом морфологии
учитываются перечисленные ниже критерии
в порядке убывания важности:
В результатах семантического
поиска учитываются следующие
критерии:
форма слов в запросе;
порядок следования слов в запросе;
только те слова в документе, которые имеют
такой же смысл, как и слова поискового запроса;
близость слов из запроса в документе;
все критерии ранжирования, которые применяются
при полнотекстовом поиске (с учетом морфологии);
слова, которые встречаются во многих документах,
по которым проводится поиск, учитываются с меньшим
приоритетом по сравнению со специфичными терминами;
связь между словами в запросе и в документе;
частота слов из запроса в найденном документе;
гиперонимы (обобщения) слов в запросе;
частота слов из запроса в документах данного
поискового индекса
приоритет синонимов над гиперонимами
синонимы слов в запросе;
8

9.

Спасибо
за
внимание
English     Русский Правила