Файл: «Анализ поисковых систем в сети Интернет» (История становления и развития поисковых систем).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 28.03.2023

Просмотров: 103

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

1.3. Обзор поисковых систем

Google — поисковая система, которая принадлежит корпорации Google Inc.

Именно она сейчас является лидером и самым популярным поисковиком в мире (84,65 %). Обрабатывая 41 млрд 345 млн запросов в один месяц (доля рынка 62,4 %), она индексирует более 8 миллиардов web-страниц, и способна находить информацию на 191 языке (c 15.10.2009).

Google способна осуществлять поиск в документах RTF, PostScript, PDF, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других форматах.

Она начиналась, как учебный проект двух талантливых студентов Стендфорского университета. Их звали Лари Пейдж и Сергей Брин. Они смогли предложить новую поисковую систему, которая в настоящий момент стала одной из наиболее известных и влиятельных компаний во всемирной сети Интернет.

История названия поисковика представляет особенный интерес. В его основе наименование математической величины гугол (от англ. googol) — число, в десятичной системе счисления изображаемое единицей с сотней нулей. Идея создателей заключалась в организации миллиардов байтов информации, которая содержится в сети Интернет, и название Google как нельзя лучше смогло передать суть их детища.

Поисковая система Google представляет собой мощный механизм. Без таких поисковых систем найти информацию в глобальной сети Интернет было бы крайне невозможно. Как и все поисковые системы, Google использует специальный поисковый алгоритм для получения результатов поиска. Часть базовых характеристик своего алгоритма компания не скрывает, но конечно отличительные особенности своего алгоритма являются объектом конфиденциальной, строго закрытой, информации. Такая политика компании позволяет Google сохранять лидирующие позиции в сети Интернет и защищает систему от взлома.

Как и большая часть поисковых систем, Google использует программы-пауки для автоматического выбора всех документов, на которые есть ссылки в первом выбранном документе. В специальною строчку вписываются ключевые слова, и стартует поиск. По какому критерию и как Google классифицирует итоги поиска на своей странице – особенность данной поисковой системы. В ней используется алгоритм PageRank, который занимается сортировкой всех web-страниц по смысловому соответствию.


Факторы, от которых зависит работа PageRank:

  • От частоты повторов и местоположения ключевых слов на web-странице – если заявленное в строке поиска слово или словосочетание встречается на сайте лишь 1 раз, то страница отмечается низким балом.
  • От времени существования сайта – новые появляются в Интернете ежедневно, но лишь часть из них задерживается на длительный срок. Поэтому алгоритм отдает преимущество тем сайтам, которые успели зарекомендовать себя в течение длительного срока.
  • От количества web-страниц, связанных с «главной страницей» - поисковик считывает сколько страниц относится к этому сайту, на основании чего определяет её рейтинг среди всех прочих.

Обмануть систему Google практически невозможно, потому что она воспринимает все ссылки на web-страницы как «голоса». Как следствие, самый оптимальный метод сделать так, чтобы ваш сайт оказался в топе и на первой странице поиска – это наполнить его наиболее разнообразной информацией, которая сможет привлечь много разной аудитории. Не последнюю роль играют и ссылки: чем их больше на вашей страничке, тем выше её оценит Google и в частности поисковый агент PageRank.

До 2011 года для части результатов поиска Google давал дополнительное поле для поиска, которое обладало функцией находить информацию внутри конкретного сайта. Сегодня такой опции не существует для пользователей, чем многие были недовольны, так как она была удобна и пользовалась популярностью.

Весной 2009 года была запущена поисковая технология «Википоиск». Она давала пользователю возможность самостоятельно настраивать результаты поиска под себя – он мог сам удалять результаты из полученного списка выдачи, и даже поднимать их на более высокие строки списка. Как и вышеописанная опция, «Википоиск» продержалась недолго – до осени того же года.

В компании Google развитие не останавливается ни на минуту: существует целый сегмент бесплатных сервисов от Google, которые часто не требуют даже установки дополнительного программного обеспечения на персональный компьютер пользователя. Особую популярность заслужили такие сервисы, как «Gmail» и «Gtalk». Оба проекта отлично работают, как в связке, так и по отдельности. «Gmail» - почтовый сервис, который умеет автоматически фильтровать спам, располагает большим объемом почтового ящика и имеет, удобный для многих, мобильный доступ. «Gtalk» – сервис, который дает возможность обмена сообщениями – как текстовыми, так и голосовыми, причем по вашему желанию и в окне браузера, и с помощью специального программного обеспечения.


Также очень популярны сервисы контекстной рекламы «AdSense» и «AdWords». Ими пользуются владельцы разных популярных сайтов, чтобы монетизировать их – заработок строится на посещаемости страниц. Кроме того, можно привлечь и новых посетителей.

Для простых пользователей есть сервисы, которые дают доступ к новостям и справочной информации самой разной направленности и тематики, обмену картинками и фотографиями и многим иным ресурсам.

Yahoo! — американский поисковик, который находится на второй по популярности позиции в мире (6.35 %). Компания Yahoo! Также предлагает рынку линейку сервисов, объединённых интернет-порталом «Yahoo! Directory». В него входит и один из старейших и наиболее популярных в интернете серис электронной почты под названием «Yahoo! Mail». Существует и версия почтового интерфейса, которая основана на AJAX (русскоязычный обзор нового интерфейса).

История Yahoo! началась в январе 1994 года с создания web-сайта под названием «Путеводитель Джерри по Всемирной Паутине». Это был каталог разных других сайтов. Его авторами были Джерри Янг и Дэвид Файло. Уже через 3 месяца создатели переименовали «Путеводитель» в известный сегодня Yahoo!.

Существуют две различные истории о происхождении названия компании. Первой версии придерживаются создатели – Джерри Янг и Дэвид Файло. Её суть в том, что слово Yahoo! было взято из романа Джонатана Свифта «Путешествия Гулливера». Оно обозначало расу грубых и тупых человекообразных существ (в русскоязычной версии звучит, как Йеху).

Есть вторая версия. Придерживаясь её Yahoo! – это аббревиатура, которая была образована от фразы «Yet Another Hierarchical Officious Oracle». В приблизительном переводе на русский она означает «Еще один иерархический неотесанный (неофициальный) прорицатель».

Но существует и третья версия происхождения названия. В Японии есть слово Yahhoo, которое обозначает неформальный вариант значения слова «Привет». Возможно название поисковой системы Yahoo! было заимствовано именно из этого источника. Можно отметить, что Yahoo уже существовало в качестве зарегистрированной торговой марки, под которой продавался соус для барбекю. Поэтому Джерри Янг и Дэвид Файло добавили к названию один восклицательный знак.

Уже 2 марта 1995 года Yahoo! стал корпорацией.

По данным статистики Alexa Internet, сайт Yahoo! сегодня находится на четвертой строке по посещаемости в сети Интернет в мире. Около 28% посещений – просмотр лишь одной только страницы.

Bing — поисковая система от международной корпорации Microsoft. Но ранее она имела совсем другие названия:


  • MSN Search — с момента появления и до 11 сентября 2006;
  • Windows Live Search — до 21 марта 2007;
  • Live Search — до 1 июня 2009.

Сегодня Bing находится на третьей строчке рейтинга самых популярных поисковых систем. Но в отличии от своих конкурентов с первой и второй строки, Bing имеет ряд уникальных возможностей. Например, вместо того, чтобы пролистывать множество страниц с результатами поиска, с Bing их можно посмотреть на 1-ой странице. Кроме того, здесь существует динамическое корректирование объёма информации, отображаемой для каждого результата поиска – это может быть только название, а также сводка большого или малого размера).

В американской версии Bing есть определенные интересные новшества относительно поиска, среди них:

  • темы оформления стартовой страницы, которые меняются каждый день, плюс есть информационные блоки;
  • вывод уточняющих вариантов поисковых запросов по отдельным категориям;
  • видео с запуском предварительного просмотра, это происходит автоматически;
  • по каждому результату поиска предоставляются дополнительные данные;
  • для поиска маршрутов есть отдельный встроенный сервис;
  • дополнительные функции, которые делают поиск информации, изображений и видео более удобным.

Не смотря на отличные показатели точности поиска при вводе запросов на английском, важно отметить, что для русскоговорящих пользователей Bing практически бесполезен. В России и странах, поддерживающих русский язык, наиболее релевантный результат выдает «Яндекс» и «Google».

Поисковая система «Яндекс» к началу 2013 года сзаняла четвертую строчку в рейтинге популярнейших поисковиков планеты (после Google, китайского Baidu и Yahoo!) с 4,84 млрд поисковых запросов, причём она стала самым быстрорастущим из ТОП-5.

Поисковая система Yandex.ru была заявлена официально 23 сентября 1997 года, и вначале осуществляла развитие в рамках компании CompTek International. Образование отдетьной компании "Яндекс" произошло только в 2000 году.

«Яндекс» постоянно совершенствует свои поисковые алгоритмы. Это дает ему возможность всегда отвечать самым актуальным и продвинутым критериям поиска и быть на одном уровне с компанией «Google» хотя бы на российском рынке. Сегодня это именно так, если оценивать уровень освоения обоих поисковых систем аудиторией русскоговорящих стран. «Яндекс», как и «Google», работает на кластерной системе организации компьютерных вычислительных сетей. Каждый кластер отвечает за определённый сегмент сохранённой информации.

Сканирующие роботы поисковой системы бывают 2 видов:


1) основной сканирующий робот

2) быстрый робот – он регулярно сканирует сайты, где скорость и частота обновления информации крайне велика. Робот добавляет результаты поиска с этих сайтов в поисковую систему, что обеспечивает быстрое обновление её индекса.

Два вида апдейтов (обновления) поисковой системы:

1) Апдейт поисковой базы. В результатах поиска, собранных основным поисковым роботом, начинают появляться обновленные страницы разных сайтов. Это происходит обычно несколько раз за один месяц.

2) Апдейт программной части (движка) поисковой системы. Здесь смысл заключается в изменениях алгоритмов ранжирования документов в поисковой системе. Подобные обновления обычно получают собственные названия, их появление анонсируется.

Очень важный момент «Яндекса» заключается в том, что он учитывает морфологию русского языка. Он обладает системой определения словоформ, причем довольно сильной. Кроме того, «Яндекс» позволяет сузить запрос до предельно точного – это стало возможно благодаря использованию особых поисковых формул и геотаргетинга; имеет свой специальный алгоритм оценки релевантности – точности результата запроса по отношению к самому запросу – который работает на очень высоком уровне. Плюс «Яндекс» отличается крайне высокой скоростью реакции на поисковые запросы при практически полном отсутствии перегрузки своих серверов.

С появлением алгоритма "Снежинск" «Яндекс» научилась определять регион сайтов, благодаря этому стало возможно выводить результат поиска по географии пользователя. В настоящий момент «Яндекс» по праву можно назвать наиболее точным поисковиком Рунета по географическому критерию.

Вместе с тем, интернет-портал «Яндекс» - это далеко не только сильнейшая поисковая система. Под маркой собрано огромное количество самых разнообразных удобных сервисов из разных сфер.

Так, с помощью «Яндекса» вы можете узнать свежие новости («Новости»), связаться и пообщаться с друзьями и коллегами («Блоги», «Почта»), заработать («Мой Круг», «Директ», «Рекламная сеть»), продать или приобрести различные товары («Маркет», «Авто»), а также получить море полезной информации: среди них карты, пробки и схемы метро, афиша мероприятий и программа телепередач, очень популярный сервис такси, сервис прогноза погоды и валютных котировок. Очень известна и востребована у русскоязычных пользователей платежная система «Яндекс Деньги», которая позволяет осуществлять электронные платежи с помощью web-интерфейса или Интернет-кошелька. Совсем недавно появился, стремительно набирающий популярность, сервис Яндекс.Еда.