Файл: Краткие сведения.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.10.2023

Просмотров: 30

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Лабораторная работа 1. Тематический поиск в сети Интернет. Поисковые возможности информационной системы World Wide Web.
Цель: изучение и освоение средств и методов информационного поиска на уровне конечного пользователя в гипертекстовой среде WWW сети Интернет. В результате выполнения работы студенты должны:

  • ознакомиться с принципами и организацией хранения гипертекстовой информации в сети Интернет;

  • ознакомиться с принципами построения и использования современных систем поиска гипертекстовой информации;

  • изучить основные приемы поиска информации в Интернет;

  • научиться анализировать результаты шагов информационного поиска и принимать решения по дальнейшим действиям;

  • приобрести первичные навыки в решении практических задач поиска гипертекстовой информации.


Краткие сведения
Вся совокупность сайтов в Интернете является огромным набором неструктурированной информации. WWW - распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к сети Интернет. Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW. Соответственно, чтобы что-то найти в этой огромной массе информации, не связанной едиными нормами и стандартами, необходима помощь специальных сервисов. Такими сервисами являются каталоги и поисковые системы, которые предназначены для структуризации и систематизации информации и облегчения поиска в Интернете. Каталог Интернет-ресурсов — это иерархически организованная структура, содержащая названия и аннотации сайтов, распределенных по тематике в соответствии с разделами (категориями) каталога, составление и сопровождение которых осуществляется специальным персоналом. Внутри каждой категории существует несколько уровней подкатегорий, уточняющих тематику ресурсов, которые в ней расположены. Внутри самой нижней подкатегории сайты располагаются в определенном порядке в соответствии с их рейтингом. Поисковые системы (машины) (ПМ) располагают найденные сайты в порядке убывания релевантности, — соответствия содержания сайта запросу пользователя. Поисковая машина совершает поиск в огромном массиве информации и обрабатывает такое количество сайтов, которое никогда не сможет собрать ни один каталог, формируемый людьми. Поисковые системы состоят из трех основных частей: поискового робота, базы индексов и программы поиска по базе индексов.
Поисковый робот — это специальная программа, которая посещает сайты и индексирует их содержимое в соответствии с определенными правилами, заложенными в нее разработчиками. Результаты своей работы поисковый робот помещает в базу данных (базу индексов).

Для совершения поиска пользователь вносит набор ключевых слов в специальное поле интерфейса поисковой системы и запускает поиск. В этот момент начинает работать третья составляющая — программа поиска. Поиск она по базе индексов. Результатом поиска является список сайтов и кратких аннотаций к ним. Сайты в списке расположены в порядке убывания релевантности. Поисковые машины отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа сформулированному запросу. Одну из лучших поисковых машин предлагает своим пользователям поисковая система Яндекс (Yandex). Метапоисковые системы обращаются сразу к нескольким поисковым машинам. Каждая метапоисковая система имеет свой язык запросов. Сформулированный на этом языке запрос, она переводит на языки запросов используемых поисковых машин. Способы формулировки запросов:

  • Естественно-языковый (простой) – задается предложение или набор слов;

  • Строгий (с языком запросов) – помимо ключевых слов в запросе содержатся операторы;

  • Расширенный – разновидность простого запроса, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения специальной формы.

Особенностью поиска информации в среде WWW является то, что при любых технологиях поиска данный процесс носит двухэтапный характер.

1 этап. Нахождение некоторого списка (набора) WWW-страниц, в которых может содержаться необходимая пользователю информация. Фактически это означает наличие возможности «прямого» доступа к содержанию WWW-страницы посредством некоторого элементарного действия, например, набором известного адреса в поле адреса программы-обозревателя или нажатием клавиши мыши на некоторой позиции из журнала посещения.

2 этап. Пользователь осуществляет просмотр некоторого количества WWW-страниц из состава ранее найденного на первом этапе списка, для чего он открывает страницу и знакомится с ее содержанием. После этого пользователь может принимать решение относительно дальнейших действий с найденной страницей. Например, исключение из рассмотрения из-за ее несоответствия, частичное соответствие (когда целесообразно осуществить извлечение и сохранение некоторого текстового фрагмента или изображения), сохранение всего текста или всей страницы и пр.



Обработав список (или его полезную часть), пользователь может принять решение о дальнейшем ходе поискового процесса. Основными здесь являются два варианта:

  • расширение области поиска (при малом объеме списка, с тем, чтобы вовлечь в поиск дополнительные WWW-страницы) за счет ослабления поискового требования (отмена некоторых условий поиска)

  • сужение области поиска (при очень большом объеме списка, который может достигать сотен и тысяч страниц) путем наложения дополнительных условий.


Задание
1. Выполните конкретные поисковые задачи в WWW-пространстве с соблюдением технологии поиска:

1) формулировка задачи,

2) определение стратегии поиска,

3) составление поискового запроса,

4) исполнение запроса и анализ результатов.

2. С помощью тематического поиска поисковой системы Rambler найдите информацию о результатах торгов на ММВБ.

3. Составьте сложный запрос для поиска информации на русском языке о студенческих конференциях по менеджменту или маркетингу с помощью поискового языка Rambler и выполните этот запрос.

4. Составьте сложный запрос на поисковом сервере Yandex для поиска информации: в названии документа должны быть слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика» и найдите информацию по этому запросу.

5. Составьте сложный запрос на поисковом сервере Yandex для поиска информации о московских провайдерах Интернет.

Необходимо обратить внимание на следующие особенности сформулированной информационной потребности:

  • указание территориальной принадлежности («Моск», «Москва», «Московские» и пр.)

  • слова «провайдер» и «Интернет» должны располагаться рядом в указанном порядке,

  • название сети может быть как «Интернет», так и «Internet».


Технология работы

1. Запустите любой браузер.

2. Создайте файл с именем Протокол-Фамилия.doc, в котором будет записываться отчетная информация:

  • поисковые запросы;

  • количество найденных документов;

  • адреса изучаемых страниц и пр.


Тематический поиск

3. Чтобы с помощью тематического поиска найти информацию о результатах торгов на ММВБ, необходимо выполнить следующие действия:

  • На стартовой странице поисковой системы Rambler в поисковой строке ввести запрос «результаты торгов на ММВБ»;

  • Найдите в списке найденных страниц такую страницу, которая после перехода на неё отражает актуальные котировки ММВБ;

  • Ознакомьтесь с содержанием страницы.


4. Сохраните в файле Протокол-Фамилия.docнайденную информацию.
Поиск информации при помощи поисковых машин. Сложные запросы.

1. Для составления и выполнения сложного запроса в поисковой системе Rambler:

  • На стартовой странице Rambler перейдите по гиперссылке «Помощь» (https://help.rambler.ru/rsearch/);

  • Ознакомьтесь с вариантами построения сложных запросов;

  • Вернитесь на стартовую страницу;

  • Введите в поисковое поле следующий запрос: $Russian: (студенческие конференции)&(менеджмент | маркетинг) и выполните поиск (кнопка «Поиск»).

2. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.

3. Просмотрите итоговый список и сохраните его в отчетном файле.

4. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Rambler сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.

5. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос, т.е. информацию о студенческих конференциях по менеджменту или маркетингу на ближайшее время.
6. Для составления и выполнения сложного запроса в поисковой системе Yandex:

  • Откройте страницу поисковой системы Yandex;

  • Перейдите к странице с описанием поискового языка системы Yandex по гиперссылке «Расширенный поиск», (https://yandex.ru/support/search/query-language/search-context.html);

  • Ознакомьтесь с синтаксисом языка запросов;

  • Вернитесь на стартовую страницу Yandex и введите в поисковое поле следующий запрос: $Title: (студенческая конференция)&(компьютеры | графика) и выполните поиск (кнопка «Поиск»).


7. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.

8. Просмотрите итоговый список и сохраните его в отчетном файле.

9. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.

10. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос. Это будут документы, в названии которых содержатся слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика».

11. Для составления и выполнения сложного запроса по поиску информации о московских провайдерах Интернет в поле запроса Яндекса введите:

(провайдер/+1 (Интернет | Internet)) & Москва, где: провайдер/+1 - указывает расстояние между словами провайдер и Интернет; Интернет | Internet - поиск любого из слов; (….)& Москва – слова, объединенные знаком & находятся в одном предложении.

12. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.

13. Просмотрите итоговый список и сохраните его в отчетном файле.

14. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.

15. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос.