6. Поиск информации в сети интернет

Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации.

Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете.

Характеристики поисковых систем

Полнота

Полнота – одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

Точность

Точность – еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

Актуальность

Актуальность – не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.

На серверах поисковых служб есть специальные программы (их называют роботами или пауками), которые собирают информацию в Интернете и возвращают на свой сервер все обнаруженные страницы. Из накопленной таким образом информации формируются базы, особым образом проиндексированные.

Основные задачи поисковых серверов:
■     находить новые сайты и вносить их в собственную базу данных (хранилище) адресов;
■     ранжировать сайты в базе данных и делать результаты поиска наиболее соответствующими запросам пользователей.


Поисковые системы стремятся предоставлять пользователям наиболее релевантные результаты поиска.
Примечание.
Релевантность (от англ. relevancy) - степень соответствия документа запросу. Релевантность документа запросу пользователя определяется в соответствии с заложенным в поисковую систему .алгоритмом. Алгоритмы у поисковых систем разные, однако построены они на общих принципах, поэтому ищут поисковые системы примерно одинаково. Основные отличия поисковых серверов заключаются не в алгоритмах определения релевантности, а в способах их реализации и хранилищах адресов.

При вводе запросов (ключевых слов) в поисковые серверы пользователь надеется быстро получить ссылки на нужные ресурсы. А поисковые серверы, в свою очередь, конкурируют между собой за выдачу наиболее точных результатов.

Поисковая система Google.

Среди множества поисковых систем с огромным отрывом лидирует Гугл. В 1998 году студенты Стэнфордского университета, Сергей Брин и Ларри Пейдж, создали эту систему. Сергей сделал ошибку в слове Googol (число 10 в 100 степени), так и возникло название Гугл. Сегодня Гугл является крупной поисковой системой и работает со 191 языками.

В народе бытует пословица «Гугл поможет всё найти». И это действительно так. Поисковик Google внес не только изменения в виртуальный мир, но и значительно расширил англоязычный и русскоязычный словарный запас. Это лидирующая мировая поисковая система в Интернете, принадлежащая корпорации Google Inc.

История начинается в далёком 1998 году, всё начиналось в тесной комнатушке студенческого общежития. Ныне этот поисковый магнат имеет представительства более, чем в сорока странах мира. Сердцем компании является Маутин-Вью, где находится её штаб-квартира.

В самом начале Ларри Пейдж и Сергей Брин начинали работу над поисковиком под названием BackRub. Отличительной особенностью этой системы был тот факт, что сайт является более важным, если на него ссылаются множество других ресурсов и наоборот. Позднее подобную систему ранжирования страниц стал использовать в своих алгоритмах и поисковик Google.

Трудно поверить в то, что менее, чем за 15 лет компания приобрела мировую известность, но это так.

Информацию пользователям поисковик Google предоставляет вследствие работы поискового робота, бота, который всю информацию о страницах заносит в свою базу данных. Компания разработала серию отдельных роботов, сканирующих определённые страницы сайтов. Так Гугл бот — Мобил используется для индексации мобильных устройств, Гугл бот — Image – работает с изображениями и картинками, Adsbot — Google производит оценку качества содержащейся информации на страницах веб-ресурсов. Все пользователи оценили удобство работы с данной поисковой системой и заметили, что она выдаёт самую актуальную и релевантную информацию. Однако веб-мастерам приходится немного «попотеть» продвигая ресурсы под эту поисковую систему.

Поисковик Google выдаёт перечень сайтов, выстраиваемых в зависимости от значения PR, веса страницы, зависящего от количества ссылаемых на страницу ресурсов и других важных показателей. Появилась «теория песочницы», говорящая о том, что домены с частой сменой владельцев и новыми именами помещаются в зону ожидания. Правдивость этой теории не была доказана, как, впрочем, и не было опровергнута.

Ещё одной легендой поисковика Google является «бонус новичков», основанная на том домысле, что при первоначальной индексации сайт занимает более высокие позиции благодаря завышенному показателю PR.

В Америке неоднократно разгорались скандалы вследствие нарушения поисковой системой авторских прав, однако Гугл всегда отстаивал свои позиции и жалобы Церкви саентологии и известной газеты The New York Times были отклонены.

Система имеет сложный язык запросов, однако именно это позволяет ограничивать поиск отдельными доменами, типами файлов или языками. При этом такой мощный механизм может одновременно применяться и хакерами для сканирования страниц на наличие слабых мест.

В 2009 году корпорация реализовала Википоиск, позволяющий всем желающим настроить результаты выдачи поисковых запросов. Пользователь получил возможность самостоятельно удалять или поднимать вверх результаты выдачи. Технология не прижилась и существовала всего полгода.

3 года назад новым функционалом российских пользователей порадовал поисковик Google: возможность поиска по голосу. Для этого возле строки поиска в телефоне следует нажать кнопку, произнести запрос, который впоследствии отправляется на сервер. Через время браузер выдаёт результаты поиска согласно распознанному запросу.

Поисковик Google обладает ещё одной функцией, с которой знакомы все, кто когда-либо пользовался поисковой системой. Логотип поисковика в праздники меняется со стандартного на тематический, но всегда в стиле Гугл. Патент на подобную опцию компании удалось получить после 10 лет ожидания. Компания в настоящее время  поддерживает множество проектов, призванных сделать ещё более совершенным глобальную сеть.

Краткая характеристика Яндекс

Яндекс – самая крупная отечественная поисковая система. Дата основания – 23 сентября 1997г. В последнее время Яндекс активно выходит на международный уровень и уже имеет локализованные версии сервиса в Украине, Казахстане, Беларуси и Турции. Помимо поиска Яндекс предоставляет много дополнительных возможностей, в том числе, бесплатный хостинг Народ.ру, сервис для ведения блога Я.ру, почтовый сервис, рекламная сеть Яндекс Директ, и, кроме того, с недавнего времени Яндекс активно продвигает свой собственный браузер. Помимо основного поиска, Яндекс предоставляет возможность поиска по блогам, картинкам и видео.

В 2011 году был разработан и внедрен новый, метод машинного обучения «Матрикснет», который значительно улучшил качество поиска.

Кроме того, в 2011 году компания Яндекс разместила акции на американской бирже высоких технологий Nasdaq, что является знаковым событием для отечественных интернет-компаний.

В декабре 2012г. Был внедрен новый алгоритм «Калининград», который позволил сделать поиск персонализированным. Это значит, что теперь основным фактором ранжирования является сам пользователь, который формирует запрос для поисковой системы. Другими словами, результаты поиска по одному и тому же вопросу для двух разных пользователей теперь будет различаться в зависимости от нужд и предпочтений самих пользователей. Это новый шаг на пути эволюции поисковых систем.

Кроме того, среди нововведений Яндекса можно отметить:

  • введение геозависимости запросов в зависимости от региональной принадлежности пользователя и сайта;
  • учет поведенческих факторов;
  • разработка механизма подсказок, исправления ошибок и распознавания аббревиатур;
  • активная борьба с продажными ссылками и переоптимизированными текстами;
  • введение персонализированного поиска;
  • учет добавочной смысловой стоимости сайта.

Краткая характеристика Google

Общепризнанный лидер среди поисковых систем. Поисковая система появилась в 1996 году, и изначала предназначалась для поиска в картотеке библиотеки Стэнфорда. Корпорация Google была основана в 1998 году. В настоящий момент имеет более 100 региональных версий в различных странах. Кроме того, Google это не только поиск, но и еще более 50 различных сервисов, в том числе самый популярный браузер Google Chrome.

С этих двух самых популярных поисковых систем на сайт приходит больше всего посетителей, так что не теряй времени даром, и начинай продвигать свои запросы. Для того, чтобы определить на каком месте твой сайт находится сейчас, советую прочитать статью о том, как проверить позиции сайта в поисковых системах.

Несмотря на все возможности популярных поисковых систем, они не могут решить все проблемы. В частности, ими не всегда удобно пользоваться для поиска научной информации. Для этих целей существуют специальные научные поисковые системы.

 

 

Какая поисковая система более популярна в мире?
Google
Yandex
Какая поисковая система более популярна в России?
Google
Yandex
Отечественная поисковая система?
Google
Yandex
Rambler
Основатель GOOGLE
Сергей Брин
Стив Джобс
Билл Гейтс