ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 25.10.2023
Просмотров: 65
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Лабораторная работа 1. Тематический поиск в сети Интернет. Поисковые возможности информационной системы World Wide Web.
Цель: изучение и освоение средств и методов информационного поиска на уровне конечного пользователя в гипертекстовой среде WWW сети Интернет. В результате выполнения работы студенты должны:
-
ознакомиться с принципами и организацией хранения гипертекстовой информации в сети Интернет; -
ознакомиться с принципами построения и использования современных систем поиска гипертекстовой информации; -
изучить основные приемы поиска информации в Интернет; -
научиться анализировать результаты шагов информационного поиска и принимать решения по дальнейшим действиям; -
приобрести первичные навыки в решении практических задач поиска гипертекстовой информации.
Краткие сведения
Вся совокупность сайтов в Интернете является огромным набором неструктурированной информации. WWW - распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к сети Интернет. Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW. Соответственно, чтобы что-то найти в этой огромной массе информации, не связанной едиными нормами и стандартами, необходима помощь специальных сервисов. Такими сервисами являются каталоги и поисковые системы, которые предназначены для структуризации и систематизации информации и облегчения поиска в Интернете. Каталог Интернет-ресурсов — это иерархически организованная структура, содержащая названия и аннотации сайтов, распределенных по тематике в соответствии с разделами (категориями) каталога, составление и сопровождение которых осуществляется специальным персоналом. Внутри каждой категории существует несколько уровней подкатегорий, уточняющих тематику ресурсов, которые в ней расположены. Внутри самой нижней подкатегории сайты располагаются в определенном порядке в соответствии с их рейтингом. Поисковые системы (машины) (ПМ) располагают найденные сайты в порядке убывания релевантности, — соответствия содержания сайта запросу пользователя. Поисковая машина совершает поиск в огромном массиве информации и обрабатывает такое количество сайтов, которое никогда не сможет собрать ни один каталог, формируемый людьми. Поисковые системы состоят из трех основных частей: поискового робота, базы индексов и программы поиска по базе индексов.
Поисковый робот — это специальная программа, которая посещает сайты и индексирует их содержимое в соответствии с определенными правилами, заложенными в нее разработчиками. Результаты своей работы поисковый робот помещает в базу данных (базу индексов).
Для совершения поиска пользователь вносит набор ключевых слов в специальное поле интерфейса поисковой системы и запускает поиск. В этот момент начинает работать третья составляющая — программа поиска. Поиск она по базе индексов. Результатом поиска является список сайтов и кратких аннотаций к ним. Сайты в списке расположены в порядке убывания релевантности. Поисковые машины отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа сформулированному запросу. Одну из лучших поисковых машин предлагает своим пользователям поисковая система Яндекс (Yandex). Метапоисковые системы обращаются сразу к нескольким поисковым машинам. Каждая метапоисковая система имеет свой язык запросов. Сформулированный на этом языке запрос, она переводит на языки запросов используемых поисковых машин. Способы формулировки запросов:
-
Естественно-языковый (простой) – задается предложение или набор слов; -
Строгий (с языком запросов) – помимо ключевых слов в запросе содержатся операторы; -
Расширенный – разновидность простого запроса, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения специальной формы.
Особенностью поиска информации в среде WWW является то, что при любых технологиях поиска данный процесс носит двухэтапный характер.
1 этап. Нахождение некоторого списка (набора) WWW-страниц, в которых может содержаться необходимая пользователю информация. Фактически это означает наличие возможности «прямого» доступа к содержанию WWW-страницы посредством некоторого элементарного действия, например, набором известного адреса в поле адреса программы-обозревателя или нажатием клавиши мыши на некоторой позиции из журнала посещения.
2 этап. Пользователь осуществляет просмотр некоторого количества WWW-страниц из состава ранее найденного на первом этапе списка, для чего он открывает страницу и знакомится с ее содержанием. После этого пользователь может принимать решение относительно дальнейших действий с найденной страницей. Например, исключение из рассмотрения из-за ее несоответствия, частичное соответствие (когда целесообразно осуществить извлечение и сохранение некоторого текстового фрагмента или изображения), сохранение всего текста или всей страницы и пр.
Обработав список (или его полезную часть), пользователь может принять решение о дальнейшем ходе поискового процесса. Основными здесь являются два варианта:
-
расширение области поиска (при малом объеме списка, с тем, чтобы вовлечь в поиск дополнительные WWW-страницы) за счет ослабления поискового требования (отмена некоторых условий поиска) -
сужение области поиска (при очень большом объеме списка, который может достигать сотен и тысяч страниц) путем наложения дополнительных условий.
Задание
1. Выполните конкретные поисковые задачи в WWW-пространстве с соблюдением технологии поиска:
1) формулировка задачи,
2) определение стратегии поиска,
3) составление поискового запроса,
4) исполнение запроса и анализ результатов.
2. С помощью тематического поиска поисковой системы Rambler найдите информацию о результатах торгов на ММВБ.
3. Составьте сложный запрос для поиска информации на русском языке о студенческих конференциях по менеджменту или маркетингу с помощью поискового языка Rambler и выполните этот запрос.
4. Составьте сложный запрос на поисковом сервере Yandex для поиска информации: в названии документа должны быть слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика» и найдите информацию по этому запросу.
5. Составьте сложный запрос на поисковом сервере Yandex для поиска информации о московских провайдерах Интернет.
Необходимо обратить внимание на следующие особенности сформулированной информационной потребности:
-
указание территориальной принадлежности («Моск», «Москва», «Московские» и пр.) -
слова «провайдер» и «Интернет» должны располагаться рядом в указанном порядке, -
название сети может быть как «Интернет», так и «Internet».
Технология работы
1. Запустите любой браузер.
2. Создайте файл с именем Протокол-Фамилия.doc, в котором будет записываться отчетная информация:
-
поисковые запросы; -
количество найденных документов; -
адреса изучаемых страниц и пр.
Тематический поиск
3. Чтобы с помощью тематического поиска найти информацию о результатах торгов на ММВБ, необходимо выполнить следующие действия:
-
На стартовой странице поисковой системы Rambler в поисковой строке ввести запрос «результаты торгов на ММВБ»;
-
Найдите в списке найденных страниц такую страницу, которая после перехода на неё отражает актуальные котировки ММВБ; -
Ознакомьтесь с содержанием страницы.
4. Сохраните в файле Протокол-Фамилия.docнайденную информацию.
Поиск информации при помощи поисковых машин. Сложные запросы.
1. Для составления и выполнения сложного запроса в поисковой системе Rambler:
-
На стартовой странице Rambler перейдите по гиперссылке «Помощь» (https://help.rambler.ru/rsearch/); -
Ознакомьтесь с вариантами построения сложных запросов; -
Вернитесь на стартовую страницу; -
Введите в поисковое поле следующий запрос: $Russian: (студенческие конференции)&(менеджмент | маркетинг) и выполните поиск (кнопка «Поиск»).
2. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.
3. Просмотрите итоговый список и сохраните его в отчетном файле.
4. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Rambler сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.
5. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос, т.е. информацию о студенческих конференциях по менеджменту или маркетингу на ближайшее время.
6. Для составления и выполнения сложного запроса в поисковой системе Yandex:
-
Откройте страницу поисковой системы Yandex; -
Перейдите к странице с описанием поискового языка системы Yandex по гиперссылке «Расширенный поиск», (https://yandex.ru/support/search/query-language/search-context.html); -
Ознакомьтесь с синтаксисом языка запросов; -
Вернитесь на стартовую страницу Yandex и введите в поисковое поле следующий запрос: $Title: (студенческая конференция)&(компьютеры | графика) и выполните поиск (кнопка «Поиск»).
7. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.
8. Просмотрите итоговый список и сохраните его в отчетном файле.
9. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.
10. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос. Это будут документы, в названии которых содержатся слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика».
11. Для составления и выполнения сложного запроса по поиску информации о московских провайдерах Интернет в поле запроса Яндекса введите:
(провайдер/+1 (Интернет | Internet)) & Москва, где: провайдер/+1 - указывает расстояние между словами провайдер и Интернет; Интернет | Internet - поиск любого из слов; (….)& Москва – слова, объединенные знаком & находятся в одном предложении.
12. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса.
13. Просмотрите итоговый список и сохраните его в отчетном файле.
14. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос.
15. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос.