Файл: Анализ поисковых систем в сети Интернет (Работа поисковой машины).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 27.05.2023

Просмотров: 107

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

Глобальная сеть Интернет объединяет миллионы компьютеров и локальных сетей, к ее услугам прибегают сотни миллионов людей. При этом сеть Интернет — это лишь средство связи компьютеров и локальных сетей между собой. Для хранения и передачи информации по сети созданы специальные информационные службы, иногда называемые сервисами Интернет. Этих служб несколько, наиболее часто используемыми являются электронная почта, электронные библиотеки, телеконференции.

Самой популярной службой является World Wide Web (WWW) - всемирная паутина - специальная технология подготовки и размещения документов в сети Интернет.

Интернет, объединяя локальные, национальные и глобальные сети, открыл доступ ко многим информационным ресурсам, получить которые другим способом в настоящее время невозможно для читателей библиотек.

Быстрый рост и динамическое развитие информационных ресурсов, представленных в сети Интернет, обязывает каждого иметь навыки поиска информации во всемирной сети. Уметь быстро и правильно искать информацию в Интернет – значит, экономить время, владеть достоверной и актуальной информацией, на основании которой принимать верные решения.

Проблема поиска и использования информации является одной из самых актуальных в современной науке. В Интернет храниться огромное количество знаний человечества. Однако для того, чтобы воспользоваться нужной и актуальной информацией, необходимо осуществить эффективный и качественный ее поиск.

Актуальность темы исследования заключается в том, что в нынешних условиях стремительного развития информационных технологий любая организация должна стремиться к их использованию в целях повышения эффективности своей предпринимательской деятельности. Интернет и его сервисы могут оказать значительную помощь в поиске нужной информации и оптимизации бизнес-процессов организации при умелом их использовании.

Целью курсовой работы является исследование технологии эффективного и качественного поиска информации в системе Интернет и применение ее в оптимизации бизнес-процессов организации.

Достижение поставленной цели предполагает решение следующих задач:

- исследование технологии эффективного поиска в системе Интернет;

- анализ эффективности работы браузеров по поиску информации;

- определение алгоритма поиска надежного поставщика для организации;

- оптимизация бизнес-процесса заключения договоров с новыми поставщиками на Полоцкой РОС ДОСААФ при помощи внедрения технологии эффективного поиска в системе Интернет.


Объект исследования в работе – бизнес-процесс заключения договоров с новыми поставщиками на Полоцкой РОС ДОСААФ.

Предмет исследования – технология эффективного поиска поставщика в системе Интернет.

Первая глава работы посвящена рассмотрению принципов организации и средств поиска информации в Интернет.

Вторая глава курсовой работы посвящена внедрению эффективного поиска в системе Интернет в бизнес-процесс заключения договоров с новыми поставщиками на Полоцкой РОС ДОСААФ.

В процессе написания работы применялись такие методы исследования, как изучение монографических публикаций, статей, информации из удаленных источников, анализ и синтез, наблюдение, графический и табличный метод представления данных.

ГЛАВА 1. ПРИНЦИПЫ ОРГАНИЗАЦИИ И СРЕДСТВА ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТ

1.1. Технология, инструменты и средства поиска информации в Интернет

Глобальная сеть Интернет объединяет миллионы компьютеров и локальных сетей, к ее услугам прибегают сотни миллионов людей. При этом сеть Интернет — это лишь средство связи компьютеров и локальных сетей между собой. Для хранения и передачи информации по сети созданы специальные информационные службы, иногда называемые сервисами Интернет. Этих служб несколько, наиболее часто используемыми являются электронная почта, электронные библиотеки, телеконференции.

Самой популярной службой является World Wide Web (WWW) - всемирная паутина - специальная технология подготовки и размещения документов в сети Интернет.

В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи. Вся информация в WWW хранится на WWW-серверах в виде гипертекстовых документов, называемых Web-странцами. Эти документы пишутся на языке HTML (Hyper Text Markup Language ) и могут содержать информацию различного вида: текст, рисунки, аудио и видео, что делает эту информацию чрезвычайно привлекательной для пользователей.[1]

Гиперссылки в HTML-документах могут указывать как на другую часть этого документа, так и на другой документ, расположенный на любом сервере сети Интернет. Это позволяет легко отыскивать требуемую информацию, переходя посредством гиперссылок от документа к документу.


Для того, чтобы сориентироваться в огромном и масштабном информационном пространстве помогают поисковые инструменты.

Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернет.

Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

- анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера;

- поиск информации по запросу пользователя;

- обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.[2]

Условно инструменты поиска подразделяются на:

- поисковые каталоги - средства справочного типа.

Каталоги подобны глобальным электронным справочникам, имеющим тематическую структуру, что позволяет ориентироваться в ресурсах Internet в пределах отдельных отраслей знания;

- поисковые системы (машины) в чистом виде при поиске рассматривают WWW как огромную базу данных, когда при вводе термина программа выдает перечень документов, содержащих искомое определение.

Поисковые каталоги явились одним из первых способов организации доступа к информационным ресурсам сети.

Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Internet.

Каталоги ссылок подразумевают обязательное присутствие человеческого фактора и строятся на следующих принципах:

- пополняются каталоги людьми, которые заносят в них адреса и описания страниц и наборы ключевых слов для поиска;

- ссылки в их базах данных жестко систематизированы и разбиты по разделам и подразделам;

- в каталог допускаются только те страницы, которые действительно содержат что-то полезное.

При загрузке каталога на экран выводится самый общий перечень областей человеческой деятельности: искусство, образование, спорт и т.п. Входя в любой раздел, пользователь последовательно видит все более и более дробную его детализацию, пока не дойдет до конкретных учреждений или лиц. Такая разветвляющаяся (иерархическая) структура дает возможность шаг за шагом обследовать интересующие разделы киберпространства.


Большинство каталогов создаются путем добавления авторами web-страниц своего сайта к существующему списку ссылок.

Старейшим каталогом ресурсов сети является Virtual Library. В отличие от других сайтов такого типа, он содержит обстоятельный каталог, с помощью которого можно выйти на раздел по своей специальности.

Предметный каталог Virtual Library дает представление о том, что опубликовано в Интернете и какой материал в настоящее время доступен. Если в каталоге представлен раздел, соответствующий направлению поиска, тогда можно отыскать такие работы, которые в других поисковых системах практически недоступны.

Способ поиска по каталогу подразумевает «движение вниз по ступенькам», то есть движение от более общих категорий к более конкретным.

Основными преимуществами предметных каталогов являются:

- выделение из огромных ресурсов сети нужной информации, в связи с чем исчезает необходимость задавать в поисковой машине специфические для поиска ключевые слова.

Так пояснения к ссылкам дают создатели каталога и полностью отражают его содержание, то есть имеется возможность точнее определить, насколько соответствует содержание сервера цели поиска;

- организация информации в виде каталога является логически очевидной и удобной.

К недостаткам предметных каталогов относят:

- возможная неактуальность информации и ее неполнота ввиду формирования каталога не автоматически, а авторским коллективом;

- размещение важных ресурсов в неожиданном разделе каталога. [3]

Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время, поскольку поисковой системы содержат в десятки раз больше документов.

Поисковые системы распространены в гораздо большем количестве, нежели электронные справочники. При этом работа с ними требует некоторых навыков, поскольку простой ввод искомого термина в поисковую строку может привести к получению в ответ списка из сотен тысяч документов, содержащих данное понятие.

Поисковые машины - это, грубо говоря, база данных ссылок плюс программа поиска. Поисковая машина работает полностью в автоматическом режиме: сама находит и заносит в базу данных новые Web-страницы, сама формирует их описания и наборы ключевых слов, сама обновляет адреса уже существующих страниц, если они изменились, и их описания. [20, C.45]

Присутствие «человеческого фактора» в работе классических поисковиков минимально.


Поисковые системы по существу представляют собой базы данных слов, полученных при периодическом сканировании виртуального информационного пространства.

Первые системы поиска были созданы в шестидесятые годы: 1965 – 1970 - Dialog, MARK, STAIRS; 1990 – 1995- Z39.50, - GALILEO WAIS; с 1995 - RetrievalWare, - Autonomy, AltaVista, Яндекс, Google.

Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет.

В 1997 году Сергей Брин и Лари Пейдж создали Google самую популярную на сегодняшний момент поисковую систему в мире. 23 сентября 1997 года была официально анонсирована поисковая система Яндекс, самая популярная в русскоязычной части Интернет.

В настоящее время существует 3 основные международные поисковые системы – Google, Yahoo и MSN Search, имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем использует в том или ином виде результаты 3 перечисленных.

Основными характеристиками поисковых систем являются:

- полнота обследования текста, т.е. все ли слова заносятся в индексные файлы или же только термины из названий, заголовков, резюме и т.д.;

- периодичность обновления;

- простота и информативность интерфейса;

- возможность использовать операторы расстояния и дополнительные функции. [4]

К основным критериям качества поисковых машин относят:

- релевантность результатов поиска - означает, что эти результаты содержат страницы, которые относятся к смыслу поискового запроса;

- точность – мера качества выданных результатов, исчисляемая как количество релевантных страниц в общем объеме страниц, выданных в результатах поиска;

- ранжирование – расположение результатов поиска по релевантности.

Невозможно сказать какая поисковая машина лучше. Для пользователя лучше поисковик, выдающий наиболее релевантные и точные результаты. Для владельца сайта хороша, та машина, в которой хорошо виден сайт и которая приводит наибольшее количество целевых посетителей.

В настоящее время классические поисковые машины и каталоги в чистом виде очень редко встречаются. Абсолютное большинство современных поисковых машин используют оба этих подхода, т. е. содержат и классический поисковик, и каталог ссылок. Таким образом, они комбинируют достоинства и обходят недостатки этих двух разновидностей поисковых машин.

Поисковые системы состоят из пяти отдельных программных компонент (Приложение 1):