541.30K
Категория: ИнтернетИнтернет

История развития поисковых систем

1.

Презентация на тему:
„История развития поисковых
систем“
Подготовил:
Пашкин Даниил

2.

Содержание:
Введение.
Разделы.
Заключение.
Источники .

3.

Введение.
В наше время мы часто ищем нужную нам информацию во
всех возможных источниках. Самый распространённый из
них – всемирная паутина, иначе именуемая – интернет.
Когда вы включаете браузер, первой страницей у вас
выскакивает поисковая система. Задумывались ли вы как
она работает? Из чего состоит? Нет? Тогда кликните
мышкой и узнайте.

4.

Итак, рассмотрим то, что нам
предстоит узнать.
Краткая история поисковых систем.
Основные характеристики поисковой системы.
Состав поисковой системы.
Как правильно искать информацию?

5.

История появления поисковых
систем.
Когда только появился интернет, содержащееся количество информации в нём
было не велико. В то время основными пользователями Сети являлись
научные сотрудники университетов и исследовательских лабораторий.
Интернет служил как канал для обмена информацией среди научных
учреждений. В первые годы жизни размеры сети были относительно
небольшими и потому проблема поиска информации была в значительной
степени менее актуальна, чем сейчас.
В качестве организованного доступа к информации в Интернет применялись
структурированные каталоги сайтов. Структура каталогов подразумевала
тематическую группировку ссылок. Одним из первых подобных каталогов
стал „Yahoo“, который появился в 1994 году. По прошествии определенного
времени количество сайтов в каталоге выросло настолько, что разработчикам
пришла в голову мысль о создании специального механизма поиска. Однако
это была еще не поисковая система, потому как область поиска
ограничивалась рамками каталога сайтов.

6.

Структурированные каталоги сайтов получили
большое распространение. Однако скорость
развития Интернета влияла и на развитие
технологий и методов поиска информации. И на
сегодняшний день в мире очень мало поисковых
систем, которые были бы основаны на каталогах.
Самый современный каталог сайтов сможет
обеспечить доступ лишь к малой части Всемирной
Сети. Даже самый большой из существующих
сегодня каталогов DMOZ или Open Directory
Project имеет в своей базе 5 миллионов ресурсов.
Для сравнения - поисковая система Google имеет в
своей базе более 8 миллиардов документов.
Структурированные каталоги ресурсов создаются
и сегодня, однако область их применения в ряде
случаев ограничивается лишь использованием в
качестве инструмента, с помощью которого
осуществляется продвижение сайта в поисковых
системах.

7.

Первые поисковые системы.
В 1994 году появилась первая полноценная
поисковая система WebCrawler.
В 1995 году были запущены проекты Lycos
и AltaVista. Последняя являлась лидером
Интернет-поиска на протяжении многих
лет.
В 1997 году студенты Стэндфордского
университета Ларри Пейдж и Сергей Брин
начали работу над претворением в жизнь
своего исследовательского проекта. В
результате свет увидела поисковая система
Google. На сегодняшний день данная
поисковая система является мировым
лидером в области Интернет-поиска.

8.

23 сентября того же 1997 года было
официально анонсировано создание
поисковой системы Яндекс, которая
занимает лидирующие позиции в
русскоязычном сегменте.
В настоящее время существует только
несколько систем международного
уровня, имеющих свои собственные
поисковые алгоритмы, поисковые роботы
и базы документов. К таким системам
можно отнести bing, Yahoo и Google.
Абсолютное большинство остальных
поисковых систем используют при
формировании собственной выдачи
результаты других систем и трех
перечисленных выше. К примеру такие
поисковые машины как Lycos и AltaVista
используют базу поисковой системы
Yahoo. А поисковая система Mail.ru до
2010 года базировалась на системе
Яндекс.

9.

Основные характеристики
поисковой системы.
Полнота.
Точность.
Актуальность.
Скорость поиска.
Наглядность.

10.

Полнота - одна из основных характеристик поисковой системы,
представляющая собой отношениее количества, найденных по запросу
документов к общему числу документов в сети Интернет, удовлетворяющих
данному запросу.К примеру, если в Интернете имеется 200 страниц,
содержащих словосочетание „Где находится Стоунхендж“, а по
соответствующему запросу было найдено всего 100 из них, то полнота поиска
будет 0,5.
Точность – ещё одна основная характеристика поисковой машины, которая
определяется степенью соответствия найденных документов запросу
пользователя. Например, если по запросу“как выбрать автомобиль“ находится
100 документов, в 50 из них содержится словосочетание „как выбрать
автомобиль“, а в остальных просто перебирают эти слова, то точность поиска
считается 50/100=0,5. Чем точнее поиск, тем быстрее пользователь найдёт
нужные ему документы.

11.

Актуальность – не менее важная состовляющая спроса, которая
характеризуется временем, проходящим с момента публикации документов в
сети Интернет, до занесения их в индексную базу поисковой системы.
Например, на следующий день после появления интересной новости, большое
количество пользователей обратились к поисковым системам с
соответствующими запросами. Объективно, с момента публикации новостной
информации на эту тему прошло меньше суток, однако основные документы
были уже проиндексированы и доступны для поиска, благодаря
существованию у крупных поисковых систем так называемой „быстрой базы“,
которая обновляется несколько раз в день.
Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например по
данным „ООО Яндекс Интернет Холдинг“ , на сегодняшний день в рабочие
часы к поисковой машине Яндекс приходит около 170 запросов в секунду.
Такая загруженность требует сокращения времени обработки отдельного
запроса. Здесь интересы пользователя и поисковой системы совпадают:
пользователь желает получить результаты как можно быстрее, а поисковая
машина должна отрабатывать запрос максимально оперативно, чтобы не
тормозить вычисление следующих запросов.

12.

Наглядность представления результатов является важным компонентом
удобного поиска. По большинству запросов поисковая система находит сотни,
а то и тысячи документов. В следствие нечёткости составления запросов или
неточности поиска, даже первые страницы выдачи не всегда содержат
требуемую информацию. Это означает, что пользователю зачастую
приходится производить свой собственный поиск внутри найденного списка.

13.

Состав поисковой системы.
Система выдачи результатов.
Эта система производит извлечение результатов поиска из собственной базы
данных. Поисковые машины не просматривают всю сеть Интернета, как
многие думают, в поисках нужного запроса, а ищут только в пределах своей
базы данных, которая постоянно обновляется и это обновление называется
апдейт (модернизация, обновление информации, обновление данных). В
различных поисковых системах своя база данных и поэтому, вводя одну и ту
же поисковую фразу в ту или иную поисковую систему, мы видим
совершенно разные результаты. Отсюда можно сделать вывод, что к
различным поисковым службам необходим индивидуальный подход.
База данных.
Здесь хранятся все данные, которые поисковая система скачивает и
анализирует в поиске. Базы данных поисковых систем непрерывно
изменяются и требуют очень больших ресурсов для обеспечения работы
поисковой системы, включая техническое оснащение и научные
исследования.

14.

“Паук” (спайдер).
Программа, скачивающая веб-страницы. Эта программа работает также, как
обыкновенный пользовательский браузер, соединяющийся с сайтом и
загружающий ту или иную страницу. Пауки находят не один миллион страниц
в день и заносят их, индексируя, в базу данных.
“Путешествующий паук” (краулер).
Программа, автоматически проходящая по ссылкам, которые находит на вебстранице сайта, и определяющая путь “паука” (спайдера), где он должен будет
пройти. Осуществляет поиск новых страниц, неизвестных поисковой системе.
Индексатор.
Эта программа разбирает каждую страницу на части и анализирует эти части:
заголовок, ссылки, текст и другие составляющие.

15.

Поисковой сервер.
Поисковый сервер – это довольно сложная программа, точнее комплекс
программ, в которых используются специальные алгоритмы анализа
содержимого веб-сайтов в масштабах всего Интернета.
В основе работы большинства современных поисковиков лежит индекс
цитирования, который вычисляется индексатором в результате анализа ссылок
на текущую страницу с других страниц Интернета. Чем их больше, тем выше
индекс цитирования анализируемой страницы и тем выше эта страница будет
отображена в результатах поиска. Кроме того, учитывается индекс
цитирования страниц, которые ссылаются на страницу, изучаемую
индексатором.
Кроме индекса цитирования учитываются также следующие параметры:
• наличие искомых слов в заголовке страницы или названии сайта;
• частота повторений искомых слов на странице;
• размер шрифта, которым на странице написаны слова из поискового запроса,
а также выделение этих слов шрифтами и стилями;
• тематика ссылающихся сайтов и некоторые другие.

16.

Как правильно искать
информацию?
Чтобы найти нужную информацию в Интернете, необходимо придерживаться
следующих правил:
Для того, чтобы найти что-либо, необходимо точно знать, что вы ищете.
Нужно кратко и логично сформулировать поисковую фразу.
При формулировке поисковой фразы, пользуйтесь только логикой.
Машины не понимают таких фраз, как „пожалуйста“.
Если вы ищете информацию в Российском секторе Интернета, то больше
всего вам подойдут „Рамблер“ или „Яндекс“. Если же в англоязычных, то
пользуйтесть „Alta Vista“ „Lycos“.

17.

Заключение.
Мы рассмотрели основные аспекты поисковой системы и узнали
из чего она состоит и как работает. Посмотрите на свой
обыденный день и сравните его с системой поиска. Есть
определённые различия, не правда ли?Данная система сложна, и
для одного запроса проделывает коллосальную работу.
Возможно в будущем она и станет легче, но сейчас нужно
придерживаться определённым нормам, чтобы и вам было легче,
и работа системы стала лучше. С каждым днём она развивается и
её работа занимает чуть меньше усилий.

18.

Источники.
http://www.plam.ru/compinet/rabota_v_internete/p
4.php
http://portfol10.ru
https://ru.wikipedia.org
English     Русский Правила