Файл: изучить основные приемы поиска информации в Интернет.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 05.12.2023

Просмотров: 92

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Лабораторная работа 1. Тематический поиск в сети Интернет. Поисковые возможности информационной системы World Wide Web.

 

Цель: изучение и освоение средств и методов информационного поиска на уровне конечного пользователя в гипертекстовой среде WWW сети Интернет. В результате выполнения работы студенты должны:

˗ ознакомиться с принципами и организацией хранения гипертекстовой информации в сети Интернет;

˗ ознакомиться с принципами построения и использования современных систем поиска гипертекстовой информации;

˗ изучить основные приемы поиска информации в Интернет;

˗ научиться анализировать результаты шагов информационного поиска и принимать решения по дальнейшим действиям;

˗ приобрести первичные навыки в решении практических задач поиска гипертекстовой информации.

 

Краткие сведения

 

Вся совокупность сайтов в Интернете является огромным набором неструктурированной информации. WWW - распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключённых к сети Интернет. Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW.Соответственно, чтобы что-то найти в этой огромной массе информации, не связанной едиными нормами и стандартами, необходима помощь специальных сервисов. Такими сервисами являются каталоги и поисковые системы, которые предназначены для структуризации и систематизации информации и облегчения поиска в Интернете. Каталог Интернет-ресурсов — это иерархически организованная структура, содержащая названия и аннотации сайтов, распределенных по тематике в соответствии с разделами (категориями) каталога, составление и сопровождение которых осуществляется специальным персоналом. Внутри каждой категории существует несколько уровней подкатегорий, уточняющих тематику ресурсов, которые в ней расположены. Внутри самой нижней подкатегории сайты располагаются в определенном порядке в соответствии с их рейтингом. Поисковые системы (машины) (ПМ) располагают найденные сайты в порядке убывания релевантности, — соответствия содержания сайта запросу пользователя. Поисковая машина совершает поиск в огромном массиве информации и обрабатывает такое количество сайтов, которое никогда не сможет собрать ни один каталог, формируемый людьми. Поисковые системы состоят из трех основных частей: поискового робота, базы индексов и программы поиска по базе индексов. 
Поисковый робот — это специальная программа, которая посещает сайты и индексирует их содержимое в соответствии с определенными правилами, заложенными в нее разработчиками. Результаты своей работы поисковый робот помещает в базу данных (базу индексов).

Для совершения поиска пользователь вносит набор ключевых слов в специальное поле интерфейса поисковой системы и запускает поиск. В этот момент начинает работать третья составляющая — программа поиска. Поиск она по базе индексов. Результатом поиска является список сайтов и кратких аннотаций к ним. Сайты в списке расположены в порядке убывания релевантности. Поисковые машины отличаются количеством и составом просматриваемых сайтов, языком запросов, алгоритмами определения степени соответствия документа сформулированному запросу. Одну из лучших поисковых машин предлагает своим пользователям поисковая система Яндекс (Yandex). Метапоисковые системы обращаются сразу к нескольким поисковым машинам. Каждая метапоисковая система имеет свой язык запросов. Сформулированный на этом языке запрос, она переводит на языки запросов используемых поисковых машин. Способы формулировки запросов: 

˗ Естественно-языковый (простой) – задается предложение или набор слов; 

˗ Строгий (с языком запросов) – помимо ключевых слов в запросе содержатся операторы; 

˗ Расширенный – разновидность простого запроса, в котором требования, дополняющие список ключевых слов, могут быть указаны путем заполнения специальной формы.

Особенностью поиска информации в среде WWW является то, что при любых технологиях поиска данный процесс носит двухэтапный характер.

1 этап.Нахождение некоторого списка (набора) WWW-страниц, в которых может содержаться необходимая пользователю информация. Фактически это означает наличие возможности «прямого» доступа к содержанию WWW-страницы посредством некоторого элементарного действия, например, набором известного адреса в поле адреса программы-обозревателя или нажатием клавиши мыши на некоторой позиции из журнала посещения. 

2 этап.Пользователь осуществляет просмотр некоторого количества WWW-страниц из состава ранее найденного на первом этапе списка, для чего он открывает страницу и знакомится с ее содержанием. После этого пользователь может принимать решение относительно дальнейших действий с найденной страницей. Например, исключение из рассмотрения из-за ее несоответствия, частичное соответствие (когда целесообразно осуществить извлечение и сохранение некоторого текстового фрагмента или изображения), сохранение всего текста или всей страницы и пр.



Обработав список (или его полезную часть), пользователь может принять решение о дальнейшем ходе поискового процесса. Основными здесь являются два варианта: 

˗ расширение области поиска (при малом объеме списка, с тем, чтобы вовлечь в поиск дополнительные WWW-страницы) за счет ослабления поискового требования (отмена некоторых условий поиска) 

˗ сужение области поиска (при очень большом объеме списка, который может достигать сотен и тысяч страниц) путем наложения дополнительных условий. 

 

Задание

 

1. Выполните конкретные поисковые задачи в WWW-пространстве с соблюдением технологии поиска: 

1) формулировка задачи, 

2) определение стратегии поиска, 

3) составление поискового запроса, 

4) исполнение запроса и анализ результатов. 

2. С помощью тематического поиска поисковой системы Rambler найдите информацию о результатах торгов на ММВБ. 

3. Составьте сложный запрос для поиска информации на русском языке о студенческих конференциях по менеджменту или маркетингу с помощью поискового языка Rambler и выполните этот запрос. 

4. Составьте сложный запрос на поисковом сервере Yandex для поиска информации: в названии документа должны быть слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика» и найдите информацию по этому запросу. 

5. Составьте сложный запрос на поисковом сервере Yandex для поиска информации о московских провайдерах Интернет. 

Необходимо обратить внимание на следующие особенности сформулированной информационной потребности: 

˗ указание территориальной принадлежности («Моск», «Москва», «Московские» и пр.) 

˗ слова «провайдер» и «Интернет» должны располагаться рядом в указанном порядке, 

˗ название сети может быть как «Интернет», так и «Internet»

 

Технология работы

1. Запустите любой браузер.

2. Создайте файл с именем Протокол-Фамилия.doc, в котором будет записываться отчетная информация: 

˗ поисковые запросы; 

˗ количество найденных документов; 

˗ адреса изучаемых страниц и пр. 

 

Тематический поиск

3. Чтобы с помощью тематического поиска найти информацию о результатах торгов на ММВБ, необходимо выполнить следующие действия: 

˗ На стартовой странице поисковой системы Rambler в поисковой строке ввести запрос «результаты торгов на ММВБ»

˗ Найдите в списке найденных страниц такую страницу, которая после перехода на неё отражает актуальные котировки ММВБ; 


˗ Ознакомьтесь с содержанием страницы. 

4. Сохраните в файле Протокол-Фамилия.docнайденную информацию.

 

Поиск информации при помощи поисковых машин. Сложные запросы.

1. Для составления и выполнения сложного запроса в поисковой системе Rambler: 

˗ На стартовой странице Rambler перейдите по гиперссылке «Помощь»(https://help.rambler.ru/rsearch/);

˗ Ознакомьтесь с вариантами построения сложных запросов; 

˗ Вернитесь на стартовую страницу; 

˗ Введите в поисковое поле следующий запрос: $Russian: (студенческие конференции)&(менеджмент | маркетинг) и выполните поиск (кнопка «Поиск»). 

2. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 

3. Просмотрите итоговый список и сохраните его в отчетном файле. 

4. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Rambler сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 

5. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос, т.е. информацию о студенческих конференциях по менеджменту или маркетингу на ближайшее время. 

 

6. Для составления и выполнения сложного запроса в поисковой системе Yandex: 

˗ Откройте страницу поисковой системы Yandex; 

˗ Перейдите к странице с описанием поискового языка системы Yandex по гиперссылке «Расширенный поиск», (https://yandex.ru/support/search/query-language/search-context.html); 

˗ Ознакомьтесь с синтаксисом языка запросов; 

˗ Вернитесь на стартовую страницу Yandex и введите в поисковое поле следующий запрос: $Title: (студенческая конференция)&(компьютеры | графика) 
и выполните поиск (кнопка «Поиск»). 

7. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 

8. Просмотрите итоговый список и сохраните его в отчетном файле. 

9. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 

10. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос. Это будут документы, в названии которых содержатся слова «студенческая конференция», а в самом документе – слова «компьютеры» или «графика». 

11. Для составления и выполнения сложного запроса по поиску информации о московских провайдерах Интернет в поле запроса Яндекса введите: 

(провайдер/+1 (Интернет | Internet)) & Москва, где: провайдер/+1 - указывает расстояние между словами провайдер и ИнтернетИнтернет | Internet - поиск любого из слов; (….)& Москва – слова, объединенные знаком находятся в одном предложении.

12. Запишите в отчетный файл формулировку задачи, формулировку запроса, количество найденных серверов и страниц для этого запроса. 

13. Просмотрите итоговый список и сохраните его в отчетном файле. 

14. Проведите анализ полученной информации по страницам результатов. Для этого достаточно прочитать небольшое реферативное сообщение с этого сервера и провести небольшой анализ приведенного описания (как представлен текст, возникает ли ассоциация с темой при прочтении наименования компьютера, папки или наименования документа и т.д.). Система Yandex сортирует ссылки по степени релевантности, то есть по наибольшему соответствию вашему информационному запросу, поэтому имеет смысл проверить только первые 5-7 страниц или же изменить информационный запрос. 

15. Откройте несколько ссылок из списка найденных в результате поиска и просмотрите их содержание. Сохраните в отчетном файле ответ на заданный запрос.