Файл: Могилев А.В. Информатика.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 31.03.2021

Просмотров: 6863

Скачиваний: 51

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

501 

ного

  типов,  В  связи с широким  распространением персональных  компьютеров,  локальных  и гло-

бальных сетей ЭВМ подавляющее распространение получили диалоговые системы. 

По

  архитектуре

  вычислительной  среды  различают 

централизованные

  и 

распределенные

 

банки информации. 

К  настоящему  времени  сложились  следующие  три  основных  типа  банков  информации: 

банки документов, банки данных и банки знаний. 

Исторически  первым  типом  банков  информации  явились  банки  документов  или  докумен-

тальные информационно-поисковые системы. Документальные информационно-поисковые систе-
мы бурно развивались в 60-е годы, они широко используются в качестве справочного инструмента 
пользователей научно-технической информацией, в информационном обслуживании  управленче-
ских работников, специалистов и др. В настоящее время интерес к этим системам возобновился в 
связи  с  развитием  глобальных  информационных  сетей 

(

Internet

)

  и  появлением  гипертекстовых 

серверов типа WWW, 

Gopher

 и т.д.. которые вместе с соответствующими поисковыми системами 

{

Archie

Whatis

 и т.д.) можно отнести к распределенным банкам документов. 

Объектом хранения в таких системах является документ (научная статья, монография, при-

каз, циркуляр, письмо и т.д.) или факты, извлеченные из документов. Для обеспечения поиска  и 
доступа к таким документам необходима их предварительная семантическая обработка - индекса-
ция. Индексация до настоящего времени остается неавтоматизированной процедурой и выполня-
ется специалистами -людьми, индексирующими документы и запросы. 

 

1.2. БАНКИ ДОКУМЕНТОВ 

 

В документальной информационно-поисковой системе выделяют следующие компоненты: 
• массив документов (текстов) или фактов, выступающих в качестве объектов хранения  и 

поиска; 

•  информационно-поисковый  язык,  предназначенный  для  отображения  содержания  доку-

ментов и операций над ними, в том числе и запросов для поиска документов; 

• правила, алгоритмы, методы индексирования и поиска документов, позволяющие описы-

вать документы и операция над ними на информационно-поисковом языке; 

• комплекс программных и аппаратных средств, с помощью которых реализуются процессы 

накопления, хранения и поиска документов; 

•  обслуживающий  персонал,  включающий  администратора

 

банка  документов,  системных 

аналитиков, программистов и индексаторов. Банки документов работают обычно в двух режимах: 

1)  избирательного  распределения  информации,  обеспечивающего  регулярное  текущее  ин-

формирование пользователей банка о новых поступлениях документов; 

2) ретроспективного поиска информации по разовым запросам во всем массиве документов. 
Важнейший этап обработки нового документа при поступлении его в хранилище докумен-

тальной  информационно-поисковой  системы  -  индексирование  документа  -слагается  из  следую-
щих действий: 

1) выявления основного смыслового содержания документа (с учетом точки зрения автора 

документа и информационных потребностей пользователя системы); 

2) описания смыслового содержания документа на информационно-поисковом языке (ИПЯ) 

и получения соответствующего поискового образа документа (ПОД).  

При выполнении ретроспективного поиска производится 
1) выявление смыслового содержания запроса; 
2) получение поискового обзора запроса (ПОЗ) на информационно-поисковом языке систе-

мы. 

Результатами индексирования документов и запросов являются их поисковые образы (ПОД 

и ПОЗ). Поиск документов по запросу означает сопоставление ПОД и ПОЗ. Качество поиска зави-
сит от критериев смыслового соответствия документа запросу (критериев выдачи). 

Различают 
• теоретико-множественные критерии, основанные на оценке

 

степени совпадения

 

лексиче-

ских единиц ИПЯ (слов), используемых в ПОД и в ПОЗ; 

• критерии, учитывающие с помощью «весовых коэффициентов» относительную информа-

ционную значимость отдельных лексических единиц, входящих в ПОЗ; 


background image

 

502 

•  логические  критерии,  основанные

 

на  использовании  логических  операций  (дизъюнкции, 

конъюнкции, импликации и др.). 

Информационно-поисковые языки (ИПЯ), которые используются в настоящее время, мож-

но разделить на три большие группы: 

• классификационные языки; 
•дескрипторные; 
• комбинированные. 
Языки классификационного типа, в свою очередь, делятся по структуре: 
• ИПЯ иерархической структуры; 
• ИПЯ фасетной структуры; 
• эмпирические (неиерархические) языки. 

Классификационные  системы.

  В 

иерархических

  классификационных  системах  лексиче-

ские единицы (термины) находятся между собой в отношениях включения. При записи они распо-
лагаются в порядке постепенного перехода от общих к более частным. Существуют иерархические 
системы, в которых рубрики включают по 20 и более подклассов, рубрик и подрубрик в нисходя-
щем порядке. Примером такой иерархической классификационной системы является универсаль-
ная десятичная классификация (УДК), широко используемая в библиотечном деле и документаль-
ных поисковых системах. УДК охватывает весь спектр знаний. 

Шифры УДК, которые можно увидеть на обороте титульного листа всех книг, перед заго-

ловками статей в журналах и сборниках, имеют более чем столетнюю историю. В 1905 г. в Брюс-
селе  на  французском  языке  вышло  первое  сводное  издание  таблиц  десятичной  классификации. 
Эти таблицы были созданы на основе таблиц десятичной классификации Мельвиля Дьюи, впервые 
изданных в 1876 г. 

Каждый класс (первая ступень деления) в УДК содержит группу более или менее близких 

наук, например, класс 5 - математику и естественные науки, класс 6 -прикладные науки: технику, в 
том  числе  информатику,  сельское  хозяйство,  медицину.  Каждая  последующая  присоединяемая 
цифра  не  меняет  значения  предыдущих,  а  лишь  уточняет  их,  обозначая  более  частное  понятие. 
УДК настоящего текста: 681.3:62-52. 

В  основе 

фасетной

  классификации  лежит  многоаспектное  распределение  понятий  какой-

либо отрасли науки или техники по однородным взаимно исключающим друг друга фасетам. 

Примером 

эмпирической

  (неиерархической)  классификации  может  быть  алфавитно-

предметная классификация. Словарный запас такой классификации состоит из упорядоченного по 
алфавиту множества слов, словосочетаний и фраз естественного языка, обозначающих предметы 
какой-либо  отрасли  науки  или  практической  деятельности.  Каждому  предмету  или  вопросу  при 
этом отводится только один индекс, собирающий всю информацию относительно данного предме-
та или вопроса независимо от аспекта рассмотрения. В предметных классификациях используются 
следующие термины: 

• предметная рубрика (заголовок) - слово или фраза естественного языка, используемая для 

обозначения основного предмета документа (или запроса); 

• предметный подзаголовок - слово или фраза, обозначающая аспект рассмотрения предме-

та, указанного в предметном заголовке или в подклассе предметов, входящих в класс, обозначен-
ный предметным заголовком; 

•предметный словник - упорядоченное по алфавиту множество предметных заголовков, ис-

пользуемых для построения какого-либо каталога или указателя. 

Система  предметных  заголовков  и  подзаголовков  и  более  мелких  разделов  создает  слож-

ную предметную классификацию по аспектам рассмотрения предмета, т.е. имеет некоторые черты 
фасетных классификаций. 

Дескрипторные  информационно-поисковые  языки.

  Дескрипторные  информационно-

поисковые языки основаны на методе координатного индексирования, сущность которого сводит-
ся к тому, что смысловое содержание документа может быть с достаточной точностью и полнотой 
выражено списком ключевых слов, содержащихся в тексте. 

Ключевое слово - это лексическая единица информационно-поискового языка, являющаяся 

существительным,  прилагательным,  глаголом,  наречием,  числительным  или  местоимением  есте-
ственного языка или словосочетанием. Основной критерий отбора ключевых слов из текста - сте-
пень

 

их полезности для индексирования документа или запроса. 


background image

 

503 

Координатное индексирование выполняется с помощью ключевых слов и логических опе-

рации конъюнкции и дизъюнкции. Близкие по смыслу ключевые слова образуют классы условной 
эквивалентности, имена которых также являются единицами поискового языка и называются де-
скрипторами. Дескрипторы вместе с набором ключевых слов языка и семантических связей между 
ними образуют тезаурус - систематизированный набор данных об области знания, позволяющий в 
ней ориентироваться. 

В  дескрипторной  статье  тезауруса  обычно  устанавливаются  следующие  виды  семантиче-

ских отношений: 

• отношение синонимии; 
• отношение подчинения; 
• отношение ассоциации. 
Такие связи служат для увеличения полноты представления содержания документов и по-

зволяют формировать запрос не обязательно в ключевых словах документа. 

Пример дескрипторной статьи: 
языки алгоритмические синонимы: алгоритмические языки 
машинно-ориентированные  языки  проблемно-ориентированные  языки  вышестоящие:  про-

граммное обеспечение 

языки формальные нижестоящие: автокоды 
алгол паскаль фортран си бейсик ассоциации: алгоритмы 
программирование 
Целесообразность применения того или иного языка во многом зависит от назначения ин-

формационной системы, степени ее автоматизации. Для описания документов в библиотеках, об-
щих  и  технических  архивах  обычно  применяют  классификационные  языки.  В  автоматизирован-
ных информационно-поисковых системах используются, главным образом, дескрипторные языки. 

 

1.3. БАНК ПЕДАГОГИЧЕСКОЙ ИНФОРМАЦИИ 

 

В  качестве  примера  реально  существующего  и  достаточно  широко  используемого  банка 

данных рассмотрим банк педагогической информации (БПИ), созданный в Республиканском  ин-
ституте повышения квалификации работников образования под руководством В.И.Журавлева. На 
основе  этого  банка  в  ряде  регионов  России  созданы  и  успешно  функционируют  региональные 
банки педагогической информации. 

БПИ предназначен для хранения всех видов информации, циркулирующей в системе обра-

зования страны, и удовлетворения информационных потребностей пользователей. 

С банком работают лица следующих категорий: 
• работники образования, получающие с разными целями информацию из банка (к ним от-

носятся учителя, методисты, работники управленческих структур всех уровней, ученые педагоги, 
преподаватели вузов, студенты и учащиеся, родители и др.); 

•  поставщики  информации,  т.е.  авторы  учебной,  учебно-методической  и  научно-

методической литературы, разработчики нормативно-правовой документации, относящейся к сис-
теме образования и т.д.; 

•работники  информационной  системы,  функция  которых  состоит  в  накоплении  информа-

ционного фонда вторичных документов - информационных модулей, разработанных в соответст-
вии с концепцией БПИ (информационные (информационно-педагогические) модули готовятся на 
основе первичных материалов, представленных поставщиками информации; такая работа требует 
специальной подготовки); 

• непосредственные работники информационной службы, ведущие лингвистическую часть 

информационной системы: администратор банка, эксперты. 

В перспективе в нашей стране должна быть создана единая сеть банков педагогической ин-

формации,  объединяющая  как  центральный  республиканский  банк,  так  и  региональные  БПИ.  В 
последних наряду  с информацией общего назначения сосредоточивается информация региональ-
ного  характера,  отражающая  опыт  учителей  и  методистов  региона,  деятельность  региональных 
учреждений повышения квалификации и местных вузов, связанную с региональной системой об-
разования,  региональных  органов  управления  образованием  и  другую  информацию  педагогиче-
ской  направленности.  Принципиально  важной  частью  такой  сети  является  такая  система  обмена 


background image

 

504 

данными между различными банками, при которой пользователь любого из них может получать 
информацию из любого банка и отправлять ее туда. 

Содержание  и  структура  банка.

  Охарактеризуем  содержание  БПИ  приведя  перечень  и 

краткое описание нескольких его разделов.  

Учебная  литература,  авторские  курсы.

  Вариативность  отечественного  образования  -  ха-

рактерное его свойство, возникшее в последнее десятилетие. Почти по всем дисциплинам есть не-
сколько вариантов изложения, подкрепленных учебниками, сборниками упражнений, тестов и т.д. 
Учитель не может иметь все эти материалы, да в этом и нет необходимости, так как он обычно ра-
ботает по одному из вариантов. Однако, время от времени возникает потребность ознакомиться и 
с другими вариантами, что можно сделать с помощью банка. 

Особенно эта проблема актуальна при необходимости ознакомиться с разработками по спе-

циальным (авторским) курсам, к которым зачастую практически нет другого доступа. 

Методы обучения.

 В конце XX века в образовании во всем мире активизировались поиски 

новых  форм  и  методов  обучения.  Это  связано  со  стремительными  переменами  в  общественном 
устройстве  (и,  в  частности,  с  информационной  революцией).  Ежегодно  публикуется  множество 
материалов на эту тему, аккумулируемых в БПИ. 

Аспекты  педагогической  науки.

  Новые  разделы  теории  воспитания  и  описание  практиче-

ских приемов реализации педагогических концепций - важная часть педагогической информации. 

Диагностика  педагогического  профессионализма.

  Проблемы  диагностики  успехов  обуче-

ния были актуальны всегда, но стали еще более актуальными в связи с внедрением государствен-
ных  образовательных  стандартов.  Все  чаще  используются  тестовые  методики  контроля,  сравни-
тельно новые для нашей школы; на эту тему постоянно возникают новые материалы. 

Зарубежная  педагогическая  информация.

  Без  знания  происходящего  в  этой  сфере  в  мире 

невозможно  правильно  ориентироваться  в  проблемах  образования  собственной  страны.  Прямой 
доступ к зарубежным материалам для большей части работников отечественной системы образо-
вания затруднен по финансовым, языковым, терминологическим и прочим причинам. Аккумули-
рование  в  банке  обзорных  (и  оригинальных)  материалов  позволяет  существенно  продвинуться  в 
решении этой проблемы. 

Инновации в образовании.

 Многочисленные находки учителей, методистов, работников ор-

ганов управления часто остаются невостребованными просто из-за невозможности ознакомления с 
ними широкой педагогической общественности. Даже по отношению к широко известным педаго-
гам-новаторам существуют проблемы доступа к конкретным материалам. 

Историко-педагогическое наследие,

 как отечественное, так и зарубежное, весьма велико, и 

соответствующие материалы необходимо иметь в БПИ. 

Повышение  квалификации  работников  образования  -

  необходимое  условие  функциониро-

вания системы образования. Наряду с давно действующими в этой сфере институтами повышения 
квалификации,  указанной деятельностью занимаются вузы, коммерческие организации и др. Ин-
формация на эту тему в БПИ необходима и поможет сделать правильный выбор. 

Опыт управленческой работы

 для системы образования не менее важен чем чисто педаго-

гический опыт. Приемы организации управления учебными заведениями, учебно-воспитательным 
процессом систематизируются в БПИ. 

Правовая  основа  педагогической  деятельности

  важна  для  каждого  участника  педагогиче-

ского процесса - учителя, ученика, родителей, администраторов. В системе образования существу-
ет большое количество нормативно-правовых актов, накапливаемых в БПИ. 

В БПИ содержатся также сведения о рынке образовательных услуг, неформальных объеди-

нениях молодежи и других аспектах деятельности системы образования. 

Как и во всяком «электронном» банке информации, является важным вопрос о структурных 

единицах  хранения  информации.  Основной  такой  единицей  является  информационно-
педагогический  модуль  (ИПМ).  ИПМ  -  формализованное  отражение  информации,  обладающее 
следующими свойствами: 

• логической законченностью (изложенная в одном ИПМ информация соответствует одно-

му и только одному типу); 

• информативностью (объем и качество информации в ИПМ достаточны для ее использова-

ния в науке или практике без обращения к источнику); 

• популярностью изложения (язык изложения доступен педагогу-практику); 


background image

 

505 

• краткостью изложения (объем ИПМ не превышает 5 кбайт). 
ИПМ записываются в специальных форматах. Структура и форма записи в них выбрана та-

ким образом, чтобы информацию мог формализовать не только специально подготовленный чело-
век, но и сам автор, что оправдано экономически и способствует формированию информационной 
культуры работников образования. Поскольку оформление содержательной (т.е. основной) части 
информации  требует  знаний  в  достаточно  узких  предметных  подобластях  образования,  никто 
лучше автора этого сделать не может; администратор же банка (или методист) могут при необхо-
димости  оказать  автору  помощь  в  некоторых  формальных  моментах.  В  то  же  время,  создание 
ИПМ по источникам, авторы которых не доступны для прямого общения (например, когда ИПМ 
создается по статьям в зарубежных журналах), могут осуществлять специалисты банка - референ-
ты. 

Отметим,  что  подобная  практика  существует  и  в  научных  реферативных  журналах,  куда 

может быть помещен либо реферат статьи, написанный референтом, либо автореферат, написан-
ный автором статьи. 

ИПМ представляет собой текстовый файл, состоящий из двух полей: поля поискового об-

раза документа и поля записи данных. Каждое из полей распадается на подполя  - элементы дан-
ных. Рассмотрим структуру и содержание записи отдельно для каждого поля. 

Поле поискового образа документа.

 В этом поле записываются элементы данных, необхо-

димые для поиска информации, ее классификации, анализа наличия или отсутствия, экспертизы по 
различным параметрам, осуществления коммуникаций как внутри системы, так и с другими авто-
матизированными информационными системами. Поскольку параметры информации в таких сис-
темах жестко стандартизированы, а эти стандарты (ГОСТы) недостаточно полно отражают специ-
фику  педагогических  исследований,  то  допускается  описание  элементов  данных,  не  имеющих 
аналога в ГОСТах; они помечаются символом «звездочка» (*). Элементы данных, запись в кото-
рых (или ее часть) может повторяться в других подполях, помечены символом (1). Максимальная 
длина записи в элементах данного поля составляет 80 байт (длина строки экрана). В тех случаях, 
когда элемент данных имеет другое ограничение, оно указано в конце строки в скобках. 

Структура записи элементов данных: 
1) название рубрикатора (*); 
2) указатель десятичной классификации (УДК); 
3) название тезауруса (*); 
4) информационное поле (*); 
5) фасет (*); 
6) дескриптор тезауруса (1); 
7) дата ввода записи; 
8) организация - создатель записи; 
9) автор, авторский коллектив (*)(1); 
10) основное заглавие (250); 
11) место работы автора (страна); 
12) место работы автора (область); 
13) составитель текста записи (1); 
14) редактор текста записи (1); 
15) переводчик (1); 
16) тип информации (*); 
17) ключевые слова (через запятую) (1); 
18) вид исходного документа; 
19) дополнительные данные об исходном документе; 
20) библиографическая ссылка (250)(*)(1). 
 
Для формирования пунктов 1-3 необходимо пользоваться справочниками по УДК, пунктов 

18 и 19 - таблицами кодов «вид документа» и «код дополнительных данных», имеющимися в до-
кументации к банку. 

Поясним использованное выше понятие «фасет». Поскольку информационное поле охваты-

вает  очень  широкий  объем  понятий,  то  используется  фасетный  метод  классификации:  термины 
внутри поля располагаются по фасетам - небольшим параллельным группам. Внутри фасеты - де-