Інформаційно-пошукові системи
План
Пошукова система
Найбільш популярні пошукові системи
Статистика пошукових запитів
Інформаційний пошук
Інформаційний пошук як наука
Інформаційний пошук як процес
Етапи пошуку
Види пошуку
Повнотекстовий пошук
Пошук по метаданих
Пошук зображень
Види пошуку
Адресний пошук
Семантичний пошук
Документальний пошук
Фактографічний пошук
Запит
Об'єкт запиту
Оцінки ефективності інформаційно-пошукових систем
Інтелектуальна пошукова система Nigma.РФ
Nigma-Математика
Nigma-Хімія
Пошук по електронних бібліотеках
Англопідказка
Історія розвитку ІПС
Пошукова система GOOGLE
Пошукова система YANDEX
Пошукова система RAMBLER
Пошукові системи
Міжнародні
1.38M
Категория: ИнформатикаИнформатика

Інформаційно-пошукові системи

1. Інформаційно-пошукові системи

2. План

Пошукові системи
Інформаційний пошук
Види і методи пошуку
Оцінки ефективності інформаційно-пошукових систем
Нигма.РФ - інтелектуальна метапошукова система
2

3. Пошукова система

Пошукова система –
програмно-апаратний
комплекс з веб-інтерфейсом,
що надає можливість пошуку
даних в Інтернеті.
.
3

4.

Під пошуковою системою звичайно
мають на увазі сайт, на якому
розміщений інтерфейс системи.
Програмною частиною пошукової
системи є пошукова машина –
комплекс програм, що забезпечує
функціональність пошукової системи й
звичайно є комерційною таємницею
компанії-розробника пошукової
системи.
4

5. Найбільш популярні пошукові системи

Багатомовні:
• Google
• Bing
• Yahoo! і приналежні до цієї компанії пошукові машини:
• Іnktomі
• AltaVista
• Alltheweb
Англомовні й міжнародні:
• Ask Jeeves
Російськомовні:
• Яндекс
• Maіl.ru
• Рамблер
5

6. Статистика пошукових запитів

1.
2.
3.
4.
5.
6.
6
Google — 84,65 %;
Yahoo! — 6,69 %;
Baidu — 3,39 %;
Bing — 3,29 %;
Ask — 0,56 %;
AOL — 0,42 %.

7. Інформаційний пошук

Інформаційний пошук – це
процес віднаходження
неструктурованих
задокументованих даних та
наука про цей процес.
7

8. Інформаційний пошук як наука

Інформаційний пошук (ІП) –
значуща міждисциплінарна галузь
науки, що лежить на перетині
когнітивної психології, інформатики,
інформаційного дизайну, лінгвістики,
семіотики і бібліотечної справи.
Пошук інформації – процес
виявлення в масиві даних записів,
що задовольняють заздалегідь
певній умові пошуку або запиту.
8

9. Інформаційний пошук як процес

Інформаційний пошук являє собою
процес виявлення в деякій множині
документів всіх тих, які присвячені
зазначеній темі, задовольняють
заздалегідь певній умові пошуку,
відповідають інформаційній потребі або
містять необхідні факти, відомості, дані.
Процес пошуку включає послідовність
операцій, спрямованих на збір, обробку й
надання необхідних відомостей
зацікавленим особам.
9

10. Етапи пошуку

1
Визначення (уточнення) інформаційної потреби
й формулювання інформаційного запиту
2
визначення сукупності можливих власників
інформаційних масивів (джерел)
3
вибирання даних з виявлених інформаційних
масивів
4
ознайомлення з отриманими відомостями або
даними й оцінка результатів пошуку
10

11. Види пошуку

Повнотекстовий пошук
Пошук за метаданими
Пошук зображень
11
ПОШУК

12. Повнотекстовий пошук

Повнотекстовий пошук - пошук по всьому
вмісту документа.
Приклад повнотекстового пошуку - будь-яка
пошукова система, наприклад, www.yandex.ru,
www.google.com.
Як правило, повнотекстовий пошук для
прискорення пошуку використовує попередньо
побудовані індекси.
Найбільш поширеною технологією для індексів
повнотекстового пошуку є інвертовані
індекси.
12

13. Пошук по метаданих

Пошук по метаданих - це пошук за певними
атрибутами документа, які підтримує система:
назва документа, дата створення, розмір,
автор та ін.
Приклад пошуку за реквізитами - діалог
пошуку у файловій системі (наприклад, MS
Windows)
13

14. Пошук зображень

Пошук зображень - пошук за змістом
зображення. Пошукова система розпізнає
зміст фотографії (завантажена користувачем
або доданий URL зображення).
В результаті пошуку користувач отримує
схожі зображення.
14

15. Види пошуку

1
Адресний пошук
2
Семантичний пошук
3
Документальний пошук
4
Фактографічний пошук
15

16. Адресний пошук

Процес пошуку документів здійснюється за чисто
формальними ознаками, зазначеними у запиті.
Для здійснення адресного пошуку потрібні наступні
умови:
• Наявність у документа точної адреси.
• Забезпечення суворого порядку розташування
документів у пристрої, що запам’ятовує, або у
сховищі системи.
• Адресами документів можуть бути адреси вебсерверів або веб-сторінок, елементи
бібліографічного запису та адреси зберігання
документів у сховищі.
16

17. Семантичний пошук

Процес пошуку документів здійснюється за їхнім
змістом.
Умови семантичного пошуку:
• Переклад змісту документів і запитів із природної
мови на інформаційно-пошукову мову й складання
пошукових образів документа й запиту.
• Складання пошукового опису, у якому вказується
додаткова умова пошуку.
Принципова різниця між адресним і семантичним
пошуками полягає в тому, що при адресному пошуку
документ розглядається як об'єкт з позиції форми, а
при семантичному пошуку – з позиції змісту.
17

18. Документальний пошук

Процес пошуку здійснюється в сховищі
інформаційно-пошукової системи первинних
документів або в базі даних вторинних документів,
що відповідають запиту користувача.
Два види документального пошуку:
• Бібліотечний, спрямований на знаходження
первинних документів.
• Бібліографічний, спрямований на знаходження
відомостей про документи, які представлені у
вигляді бібліографічних записів.
18

19. Фактографічний пошук

Це процес пошуку фактів, що відповідають
інформаційному запиту.
До фактографічних даних належать відомості, взяті
з документів як первинних, так і вторинних, і
одержані безпосередньо з джерел їхнього
існування.
Розрізняють два види фактографічного пошуку:
• Документально-фактографічний, сутність якого
полягає в пошуку в документах фрагментів
тексту, що містять факти.
• Фактологічний (опис фактів), що припускає
створення нових фактографічних описів у
процесі пошуку шляхом логічної переробки
знайденої фактографічної інформації.
19

20. Запит

Запит – це формалізований спосіб вираження
інформаційних потреб користувачем системи.
Для вираження інформаційної потреби
використовується мова пошукових запитів,
синтаксис якої варіюється від системи до системи.
Крім спеціальної мови запитів сучасні пошукові
системи дозволяють уводити запит природною
мовою.
20

21. Об'єкт запиту

Об'єкт запиту – це інформаційна сутність того,
що зберігається в базі автоматизованої системи
пошуку.
Незважаючи на те, що найпоширенішим об'єктом
запиту є текстовий документ, не існує ніяких
принципових обмежень. Зокрема, можливий пошук
зображень, музики й інших мультимедіа файлів.
21

22. Оцінки ефективності інформаційно-пошукових систем

Точність пошуку (precision)
Повнота (recall)
Випадання ( fall-out)
22

23. Інтелектуальна пошукова система Nigma.РФ

23

24. Nigma-Математика

Математичні завдання
Користувач вводить математичний вираз (рис. 1) або
словосполучення (рис. 2), наприклад:
Рис.1
Рис.2
24

25.

Система розпізнає запит і видасть відповідь:
25

26.

При бажанні користувач може побачити хід розв'язання
рівняння, натиснувши на вибране посилання:
26

27.

Завдання з одиницями вимірювання
Користувач вводить математичне вираз, що містить одиниці
вимірювання або математичні константи, в повному або
скороченому вигляді:
Результатом запиту стане розв’язок рівняння:
27

28. Nigma-Хімія

Певні реакції
Якщо користувач хоче знайти певну реакцію, він вводить
формули речовин, розділяючи їх знаками "+":
Система знайде всі реакції за участю введених речовин:
28

29. Пошук по електронних бібліотеках

Пошук по електронних бібліотеках допомагає знаходити
повну інформацію по будь-якому автору і тексти всіх його
творів як російської, так і зарубіжної літератури. Система
здійснює пошук у більш ніж 100 електронних бібліотеках.
Написавши тільки прізвище автора,
Ви зможете знайти його твори, наприклад:
29

30.

Щоб знайти конкретний текст автора, необхідно доповнити
запит назвою твору, наприклад: Лєсков Лівша:
30

31. Англопідказка

Користувач вводить вираз в рядок пошуку і, якщо система
вважатиме вираз не зовсім коректним, то користувачеві будуть
запропоновані інші, більш зручні варіанти.
Але англопідказка не виправляє граматичні помилки і не перекладає
словосполучення.
31

32. Історія розвитку ІПС

Archie
Програма Archie є своєрідним
засновником сучасних пошукових
систем.
Вона знаходила назви файлів,
структурувала їх і створювала
власну базу даних.
Після чого проводила по ній пошук
відповідно до заданих критеріїв.
32

33.

Gopher
Перша пошукова система.
Вона була вузько направленою і
призначеною для пошуку виключно
текстових файлів.
33

34.

1993 рік – з’явилася перша програма,
що індексує сторінки Інтернету.
1994 рік – з’явилася система Yahoo,
що є на даний момент старожилом
Інтернету.
1995 рік – з’явилася онлайн-програма
Excite, яка вже могла вести
статистику використання слів в тексті,
а також відповідність їх введеному
запиту.
34

35.

1996 рік – створення пошукової
системи Google, яка досить швидко
стала популярною.
Сьогодні – це найпопулярніша
пошукова система в світі
(займає 77 % світового сегменту).
35

36.

Засновники Google – Брін і Пейдж
36

37.

Перше фінансування
Google здійснив у
серпні 1998 р.
співзасновник
Sun Microsystems
Енді Бехтольшайм
37

38. Пошукова система GOOGLE

http://www.google.com
Ця пошукова машина, заснована на принципово
новому алгоритмі пошуку, відрізняється гранично
аскетичним інтерфейсом і високим рівнем
релевантності.
38

39. Пошукова система YANDEX

http://www.yandex.com
Ця система продовжує залишатись найпопулярнішою
і модною пошуковою системою в російській мережі.
Зокрема, Яндекс – ледве не єдина пошукова система,
здатна відшукати інформацію на сторінці, що
проживає в якому-небудь “віртуальному місті” типу
Narod.Ru.
В пошуках інформації Яндекс не обмежує себе
територією Росії: система з легкістю відшуковує
сайти, розміщені в доменних зонах республік
колишнього СРСР, а інколи – і зовсім за межами
пострадянського простору.
39

40. Пошукова система RAMBLER

http://www.Rambler.com
Rambler – типовий сервер типу „все в одному
флаконі”. Тут можна знайти велику кількість
пошукових сервісів: і знаменитий каталог-рейтинг
Rambler Top 100, і окремі каталоги по таких темах,
як мережні магазини, подарунки, здоров’я,
робота, право, комп’ютери і служби пошуку
файлів, і відмінну довідкову систему з різних
питань.
40

41. Пошукові системи

Українськї
індекс-99
Йохохо
Куди піти
Мета
Шерлок Холмс
Alpha Counter
ANET
Packet ISP search
engine
SESNA
41
Російські
Апорт
АУ
Улітка
LiNet
List Ru
Rambler
VKD
Yandex

42. Міжнародні

Google
Yahoo
Alta Vista
Alltheweb.com
Excite
HotBot
Lycos
InfoSeek
The Internet Industry Portal
42
English     Русский Правила