ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 31.03.2021
Просмотров: 6863
Скачиваний: 51
501
ного
типов, В связи с широким распространением персональных компьютеров, локальных и гло-
бальных сетей ЭВМ подавляющее распространение получили диалоговые системы.
По
архитектуре
вычислительной среды различают
централизованные
и
распределенные
банки информации.
К настоящему времени сложились следующие три основных типа банков информации:
банки документов, банки данных и банки знаний.
Исторически первым типом банков информации явились банки документов или докумен-
тальные информационно-поисковые системы. Документальные информационно-поисковые систе-
мы бурно развивались в 60-е годы, они широко используются в качестве справочного инструмента
пользователей научно-технической информацией, в информационном обслуживании управленче-
ских работников, специалистов и др. В настоящее время интерес к этим системам возобновился в
связи с развитием глобальных информационных сетей
(
Internet
)
и появлением гипертекстовых
серверов типа WWW,
Gopher
и т.д.. которые вместе с соответствующими поисковыми системами
{
Archie
,
Whatis
и т.д.) можно отнести к распределенным банкам документов.
Объектом хранения в таких системах является документ (научная статья, монография, при-
каз, циркуляр, письмо и т.д.) или факты, извлеченные из документов. Для обеспечения поиска и
доступа к таким документам необходима их предварительная семантическая обработка - индекса-
ция. Индексация до настоящего времени остается неавтоматизированной процедурой и выполня-
ется специалистами -людьми, индексирующими документы и запросы.
1.2. БАНКИ ДОКУМЕНТОВ
В документальной информационно-поисковой системе выделяют следующие компоненты:
• массив документов (текстов) или фактов, выступающих в качестве объектов хранения и
поиска;
• информационно-поисковый язык, предназначенный для отображения содержания доку-
ментов и операций над ними, в том числе и запросов для поиска документов;
• правила, алгоритмы, методы индексирования и поиска документов, позволяющие описы-
вать документы и операция над ними на информационно-поисковом языке;
• комплекс программных и аппаратных средств, с помощью которых реализуются процессы
накопления, хранения и поиска документов;
• обслуживающий персонал, включающий администратора
банка документов, системных
аналитиков, программистов и индексаторов. Банки документов работают обычно в двух режимах:
1) избирательного распределения информации, обеспечивающего регулярное текущее ин-
формирование пользователей банка о новых поступлениях документов;
2) ретроспективного поиска информации по разовым запросам во всем массиве документов.
Важнейший этап обработки нового документа при поступлении его в хранилище докумен-
тальной информационно-поисковой системы - индексирование документа -слагается из следую-
щих действий:
1) выявления основного смыслового содержания документа (с учетом точки зрения автора
документа и информационных потребностей пользователя системы);
2) описания смыслового содержания документа на информационно-поисковом языке (ИПЯ)
и получения соответствующего поискового образа документа (ПОД).
При выполнении ретроспективного поиска производится
1) выявление смыслового содержания запроса;
2) получение поискового обзора запроса (ПОЗ) на информационно-поисковом языке систе-
мы.
Результатами индексирования документов и запросов являются их поисковые образы (ПОД
и ПОЗ). Поиск документов по запросу означает сопоставление ПОД и ПОЗ. Качество поиска зави-
сит от критериев смыслового соответствия документа запросу (критериев выдачи).
Различают
• теоретико-множественные критерии, основанные на оценке
степени совпадения
лексиче-
ских единиц ИПЯ (слов), используемых в ПОД и в ПОЗ;
• критерии, учитывающие с помощью «весовых коэффициентов» относительную информа-
ционную значимость отдельных лексических единиц, входящих в ПОЗ;
502
• логические критерии, основанные
на использовании логических операций (дизъюнкции,
конъюнкции, импликации и др.).
Информационно-поисковые языки (ИПЯ), которые используются в настоящее время, мож-
но разделить на три большие группы:
• классификационные языки;
•дескрипторные;
• комбинированные.
Языки классификационного типа, в свою очередь, делятся по структуре:
• ИПЯ иерархической структуры;
• ИПЯ фасетной структуры;
• эмпирические (неиерархические) языки.
Классификационные системы.
В
иерархических
классификационных системах лексиче-
ские единицы (термины) находятся между собой в отношениях включения. При записи они распо-
лагаются в порядке постепенного перехода от общих к более частным. Существуют иерархические
системы, в которых рубрики включают по 20 и более подклассов, рубрик и подрубрик в нисходя-
щем порядке. Примером такой иерархической классификационной системы является универсаль-
ная десятичная классификация (УДК), широко используемая в библиотечном деле и документаль-
ных поисковых системах. УДК охватывает весь спектр знаний.
Шифры УДК, которые можно увидеть на обороте титульного листа всех книг, перед заго-
ловками статей в журналах и сборниках, имеют более чем столетнюю историю. В 1905 г. в Брюс-
селе на французском языке вышло первое сводное издание таблиц десятичной классификации.
Эти таблицы были созданы на основе таблиц десятичной классификации Мельвиля Дьюи, впервые
изданных в 1876 г.
Каждый класс (первая ступень деления) в УДК содержит группу более или менее близких
наук, например, класс 5 - математику и естественные науки, класс 6 -прикладные науки: технику, в
том числе информатику, сельское хозяйство, медицину. Каждая последующая присоединяемая
цифра не меняет значения предыдущих, а лишь уточняет их, обозначая более частное понятие.
УДК настоящего текста: 681.3:62-52.
В основе
фасетной
классификации лежит многоаспектное распределение понятий какой-
либо отрасли науки или техники по однородным взаимно исключающим друг друга фасетам.
Примером
эмпирической
(неиерархической) классификации может быть алфавитно-
предметная классификация. Словарный запас такой классификации состоит из упорядоченного по
алфавиту множества слов, словосочетаний и фраз естественного языка, обозначающих предметы
какой-либо отрасли науки или практической деятельности. Каждому предмету или вопросу при
этом отводится только один индекс, собирающий всю информацию относительно данного предме-
та или вопроса независимо от аспекта рассмотрения. В предметных классификациях используются
следующие термины:
• предметная рубрика (заголовок) - слово или фраза естественного языка, используемая для
обозначения основного предмета документа (или запроса);
• предметный подзаголовок - слово или фраза, обозначающая аспект рассмотрения предме-
та, указанного в предметном заголовке или в подклассе предметов, входящих в класс, обозначен-
ный предметным заголовком;
•предметный словник - упорядоченное по алфавиту множество предметных заголовков, ис-
пользуемых для построения какого-либо каталога или указателя.
Система предметных заголовков и подзаголовков и более мелких разделов создает слож-
ную предметную классификацию по аспектам рассмотрения предмета, т.е. имеет некоторые черты
фасетных классификаций.
Дескрипторные информационно-поисковые языки.
Дескрипторные информационно-
поисковые языки основаны на методе координатного индексирования, сущность которого сводит-
ся к тому, что смысловое содержание документа может быть с достаточной точностью и полнотой
выражено списком ключевых слов, содержащихся в тексте.
Ключевое слово - это лексическая единица информационно-поискового языка, являющаяся
существительным, прилагательным, глаголом, наречием, числительным или местоимением есте-
ственного языка или словосочетанием. Основной критерий отбора ключевых слов из текста - сте-
пень
их полезности для индексирования документа или запроса.
503
Координатное индексирование выполняется с помощью ключевых слов и логических опе-
рации конъюнкции и дизъюнкции. Близкие по смыслу ключевые слова образуют классы условной
эквивалентности, имена которых также являются единицами поискового языка и называются де-
скрипторами. Дескрипторы вместе с набором ключевых слов языка и семантических связей между
ними образуют тезаурус - систематизированный набор данных об области знания, позволяющий в
ней ориентироваться.
В дескрипторной статье тезауруса обычно устанавливаются следующие виды семантиче-
ских отношений:
• отношение синонимии;
• отношение подчинения;
• отношение ассоциации.
Такие связи служат для увеличения полноты представления содержания документов и по-
зволяют формировать запрос не обязательно в ключевых словах документа.
Пример дескрипторной статьи:
языки алгоритмические синонимы: алгоритмические языки
машинно-ориентированные языки проблемно-ориентированные языки вышестоящие: про-
граммное обеспечение
языки формальные нижестоящие: автокоды
алгол паскаль фортран си бейсик ассоциации: алгоритмы
программирование
Целесообразность применения того или иного языка во многом зависит от назначения ин-
формационной системы, степени ее автоматизации. Для описания документов в библиотеках, об-
щих и технических архивах обычно применяют классификационные языки. В автоматизирован-
ных информационно-поисковых системах используются, главным образом, дескрипторные языки.
1.3. БАНК ПЕДАГОГИЧЕСКОЙ ИНФОРМАЦИИ
В качестве примера реально существующего и достаточно широко используемого банка
данных рассмотрим банк педагогической информации (БПИ), созданный в Республиканском ин-
ституте повышения квалификации работников образования под руководством В.И.Журавлева. На
основе этого банка в ряде регионов России созданы и успешно функционируют региональные
банки педагогической информации.
БПИ предназначен для хранения всех видов информации, циркулирующей в системе обра-
зования страны, и удовлетворения информационных потребностей пользователей.
С банком работают лица следующих категорий:
• работники образования, получающие с разными целями информацию из банка (к ним от-
носятся учителя, методисты, работники управленческих структур всех уровней, ученые педагоги,
преподаватели вузов, студенты и учащиеся, родители и др.);
• поставщики информации, т.е. авторы учебной, учебно-методической и научно-
методической литературы, разработчики нормативно-правовой документации, относящейся к сис-
теме образования и т.д.;
•работники информационной системы, функция которых состоит в накоплении информа-
ционного фонда вторичных документов - информационных модулей, разработанных в соответст-
вии с концепцией БПИ (информационные (информационно-педагогические) модули готовятся на
основе первичных материалов, представленных поставщиками информации; такая работа требует
специальной подготовки);
• непосредственные работники информационной службы, ведущие лингвистическую часть
информационной системы: администратор банка, эксперты.
В перспективе в нашей стране должна быть создана единая сеть банков педагогической ин-
формации, объединяющая как центральный республиканский банк, так и региональные БПИ. В
последних наряду с информацией общего назначения сосредоточивается информация региональ-
ного характера, отражающая опыт учителей и методистов региона, деятельность региональных
учреждений повышения квалификации и местных вузов, связанную с региональной системой об-
разования, региональных органов управления образованием и другую информацию педагогиче-
ской направленности. Принципиально важной частью такой сети является такая система обмена
504
данными между различными банками, при которой пользователь любого из них может получать
информацию из любого банка и отправлять ее туда.
Содержание и структура банка.
Охарактеризуем содержание БПИ приведя перечень и
краткое описание нескольких его разделов.
Учебная литература, авторские курсы.
Вариативность отечественного образования - ха-
рактерное его свойство, возникшее в последнее десятилетие. Почти по всем дисциплинам есть не-
сколько вариантов изложения, подкрепленных учебниками, сборниками упражнений, тестов и т.д.
Учитель не может иметь все эти материалы, да в этом и нет необходимости, так как он обычно ра-
ботает по одному из вариантов. Однако, время от времени возникает потребность ознакомиться и
с другими вариантами, что можно сделать с помощью банка.
Особенно эта проблема актуальна при необходимости ознакомиться с разработками по спе-
циальным (авторским) курсам, к которым зачастую практически нет другого доступа.
Методы обучения.
В конце XX века в образовании во всем мире активизировались поиски
новых форм и методов обучения. Это связано со стремительными переменами в общественном
устройстве (и, в частности, с информационной революцией). Ежегодно публикуется множество
материалов на эту тему, аккумулируемых в БПИ.
Аспекты педагогической науки.
Новые разделы теории воспитания и описание практиче-
ских приемов реализации педагогических концепций - важная часть педагогической информации.
Диагностика педагогического профессионализма.
Проблемы диагностики успехов обуче-
ния были актуальны всегда, но стали еще более актуальными в связи с внедрением государствен-
ных образовательных стандартов. Все чаще используются тестовые методики контроля, сравни-
тельно новые для нашей школы; на эту тему постоянно возникают новые материалы.
Зарубежная педагогическая информация.
Без знания происходящего в этой сфере в мире
невозможно правильно ориентироваться в проблемах образования собственной страны. Прямой
доступ к зарубежным материалам для большей части работников отечественной системы образо-
вания затруднен по финансовым, языковым, терминологическим и прочим причинам. Аккумули-
рование в банке обзорных (и оригинальных) материалов позволяет существенно продвинуться в
решении этой проблемы.
Инновации в образовании.
Многочисленные находки учителей, методистов, работников ор-
ганов управления часто остаются невостребованными просто из-за невозможности ознакомления с
ними широкой педагогической общественности. Даже по отношению к широко известным педаго-
гам-новаторам существуют проблемы доступа к конкретным материалам.
Историко-педагогическое наследие,
как отечественное, так и зарубежное, весьма велико, и
соответствующие материалы необходимо иметь в БПИ.
Повышение квалификации работников образования -
необходимое условие функциониро-
вания системы образования. Наряду с давно действующими в этой сфере институтами повышения
квалификации, указанной деятельностью занимаются вузы, коммерческие организации и др. Ин-
формация на эту тему в БПИ необходима и поможет сделать правильный выбор.
Опыт управленческой работы
для системы образования не менее важен чем чисто педаго-
гический опыт. Приемы организации управления учебными заведениями, учебно-воспитательным
процессом систематизируются в БПИ.
Правовая основа педагогической деятельности
важна для каждого участника педагогиче-
ского процесса - учителя, ученика, родителей, администраторов. В системе образования существу-
ет большое количество нормативно-правовых актов, накапливаемых в БПИ.
В БПИ содержатся также сведения о рынке образовательных услуг, неформальных объеди-
нениях молодежи и других аспектах деятельности системы образования.
Как и во всяком «электронном» банке информации, является важным вопрос о структурных
единицах хранения информации. Основной такой единицей является информационно-
педагогический модуль (ИПМ). ИПМ - формализованное отражение информации, обладающее
следующими свойствами:
• логической законченностью (изложенная в одном ИПМ информация соответствует одно-
му и только одному типу);
• информативностью (объем и качество информации в ИПМ достаточны для ее использова-
ния в науке или практике без обращения к источнику);
• популярностью изложения (язык изложения доступен педагогу-практику);
505
• краткостью изложения (объем ИПМ не превышает 5 кбайт).
ИПМ записываются в специальных форматах. Структура и форма записи в них выбрана та-
ким образом, чтобы информацию мог формализовать не только специально подготовленный чело-
век, но и сам автор, что оправдано экономически и способствует формированию информационной
культуры работников образования. Поскольку оформление содержательной (т.е. основной) части
информации требует знаний в достаточно узких предметных подобластях образования, никто
лучше автора этого сделать не может; администратор же банка (или методист) могут при необхо-
димости оказать автору помощь в некоторых формальных моментах. В то же время, создание
ИПМ по источникам, авторы которых не доступны для прямого общения (например, когда ИПМ
создается по статьям в зарубежных журналах), могут осуществлять специалисты банка - референ-
ты.
Отметим, что подобная практика существует и в научных реферативных журналах, куда
может быть помещен либо реферат статьи, написанный референтом, либо автореферат, написан-
ный автором статьи.
ИПМ представляет собой текстовый файл, состоящий из двух полей: поля поискового об-
раза документа и поля записи данных. Каждое из полей распадается на подполя - элементы дан-
ных. Рассмотрим структуру и содержание записи отдельно для каждого поля.
Поле поискового образа документа.
В этом поле записываются элементы данных, необхо-
димые для поиска информации, ее классификации, анализа наличия или отсутствия, экспертизы по
различным параметрам, осуществления коммуникаций как внутри системы, так и с другими авто-
матизированными информационными системами. Поскольку параметры информации в таких сис-
темах жестко стандартизированы, а эти стандарты (ГОСТы) недостаточно полно отражают специ-
фику педагогических исследований, то допускается описание элементов данных, не имеющих
аналога в ГОСТах; они помечаются символом «звездочка» (*). Элементы данных, запись в кото-
рых (или ее часть) может повторяться в других подполях, помечены символом (1). Максимальная
длина записи в элементах данного поля составляет 80 байт (длина строки экрана). В тех случаях,
когда элемент данных имеет другое ограничение, оно указано в конце строки в скобках.
Структура записи элементов данных:
1) название рубрикатора (*);
2) указатель десятичной классификации (УДК);
3) название тезауруса (*);
4) информационное поле (*);
5) фасет (*);
6) дескриптор тезауруса (1);
7) дата ввода записи;
8) организация - создатель записи;
9) автор, авторский коллектив (*)(1);
10) основное заглавие (250);
11) место работы автора (страна);
12) место работы автора (область);
13) составитель текста записи (1);
14) редактор текста записи (1);
15) переводчик (1);
16) тип информации (*);
17) ключевые слова (через запятую) (1);
18) вид исходного документа;
19) дополнительные данные об исходном документе;
20) библиографическая ссылка (250)(*)(1).
Для формирования пунктов 1-3 необходимо пользоваться справочниками по УДК, пунктов
18 и 19 - таблицами кодов «вид документа» и «код дополнительных данных», имеющимися в до-
кументации к банку.
Поясним использованное выше понятие «фасет». Поскольку информационное поле охваты-
вает очень широкий объем понятий, то используется фасетный метод классификации: термины
внутри поля располагаются по фасетам - небольшим параллельным группам. Внутри фасеты - де-