ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 01.06.2020

Просмотров: 477

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

2 Разработка системы управления базой данных СРС специальности УИТ

2.1 Описание педагогического эксперимента


В ходе выполнения дипломного проекта производился педагогический эксперимент, в ходе которого определялась фактическая занятость студентов самостоятельной работой.

Эксперимент проводился в течение второго семестра 1999 – 2000 учебного года. В эксперименте участвовали студенты Балаковского института техники, технологии и управления специальности «Управление и информатика в технических системах» 1 – 4 курсов. Студенты пятого курса в течение второго семестра выполняют дипломное проектирование. Они не участвовали в эксперименте в связи с тем, что было бы чрезвычайно трудно вести контроль сдачи хронокарт.

С каждого курса было выбрано по 30 человек по следующему принципу: пять отличников с бюджетной формы обучения, пять отличников с коммерческой формы обучения; пять хорошистов с бюджетной формы обучения, пять хорошистов с коммерческой формы обучения; пять троечников с бюджетной формы обучения, пять троечников с коммерческой формы обучения. Статус студента (отличник, хорошист или троечник) определялся по среднему балу оценок, полученных за зимнюю сессию.

Для каждого курса были разработаны хронокарты. В них по каждому предмету учитывалось:

  1. Подготовка к лекции:

  • Работа с конспектом лекций.

  • Работа с основной и вспомогательной литературой.

  1. Подготовка к практическим занятиям:

  • Работа с конспектом лекций.

  • Работа с основной и вспомогательной литературой.

  1. Подготовка к лабораторным занятиям:

  • Работа с конспектом лекций.

  • Работа с основной и вспомогательной литературой.

  1. Подготовка к коллоквиуму:

  • Работа с конспектом лекций.

  • Работа с основной и вспомогательной литературой.

  1. Курсовое проектирование:

  • Подбор литературы.

  • Выполнение задания.

Каждому студенту, участвующему в педагогическом эксперименте, в начале недели выдавалась хронокарта. В течение недели он вносил в нее количество часов, которые он затратил выполнение различных видов самостоятельной работы. В конце недели преподаватель собирал со студентов хронокарты.

Таким образом, была собрана уникальная база данных самостоятельной работы студентов специальности УИТ.

Полученные две с лишним тысячи хронокарт легли в основу электронной базы данных.


2.2 Обработка результатов эксперимента методами математической статистики. Меры центральной тенденции


2.2.1 О б щ и е п о н я т и я. Полученные в результате педагогического эксперимента значения фактической занятости студентов самостоятельной работой представляют собой совокупность данных. Совокупность данных можно представить в форме графиков или таблиц. Часто график или таблица говорят больше, чем мы хотим или должны знать, а передаваемая информация может оцениваться временем, потребным на сообщение. Поэтому обычно используют для описания совокупности данных только два – три свойства. Эти свойства (например, «значение», наиболее часто встречающееся среди результатов (типичное) или разброс значений) могут быть описаны показателями, известными как «статистики свертки».


Эти описательные индексы можно использовать для ответа на вопрос вроде «каков рост типичного ученика в этом университете?». Если предположить, что множество результатов расположено на числовой прямой, то свойство описываемой совокупности проявляется в ориентации результатов относительно этой прямой. Различные меры центральной тенденции совокупности данных предполагают разные определения «центрального положения». Существует сравнительно небольшое число таких мер, и ниже мы рассмотрим их подробно.

2.2.2 М о д а. Наиболее просто получаемой мерой центральной тенденции является мода. Мода – это такое значение во множестве наблюдений, которое встречается наиболее часто. Однако не всякая совокупность значений имеет единственную моду в строгом понимании этого определения, поэтому рабочее определение моды содержит особенности и соглашения.

В совокупности значений (2, 6, 6, 8, 9, 9, 9, 10) модой является 9, потому что оно встречается чаще любого другого значения. Следует обратить внимание, что мода представляет собой наиболее частое значение (в данном примере 9), а не частоту этого значения (в примере равную 3).

2.2.3 М е д и а н а. Медиана, Md, представляет собой 50-й процентиль в группе данных. Это значение, которое делит упорядоченное множество данных пополам, так что одна половина значений оказывается больше медианы, а другая – меньше.

Медиана вычисляется по следующей формуле:


, (1)

где Md – медиана;

L – фактическая нижняя граница интервала медианы;

l – ширина интервала медианы;

n – количество значений в совокупности;

F – частота, накопленная к интервалу медианы;

f – частота в интервале медианы.

Для определения медианы необходимо все значения распределить в порядке возрастания. Количество повторений одних и тех же чисел определяет частоту значения. Значение, на которое приходится 50 % суммы всех частот и будет являться медианой.

2.2.4 С р е д н е е а р и ф м е т и ч е с к о е. Является наиболее известной из всех мер центральной тенденции и определяется по формуле:

, (2)

где - среднее арифметическое;

n – количество значений в совокупности,

Xi – текущее значение.

2.2.5 О б о с н о в а н и е в ы б о р а м ер ы ц ен т р а л ь н о й т е н д е н ц и и. Каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной в определенных условиях.

Мода наиболее просто вычисляется – ее можно определить на глаз. Кроме того, для очень больших групп данных это достаточно стабильная центра распределений. Во многих распределениях значительного числа измерений, используемых в педагогике и психологии, мода близка к двум другим мерам – медиане и среднему.

Медиана занимает промежуточное положение между модой и средним с точки зрения ее вычисления, если последнее осуществляется вручную. Эта мера получается почти прямым счетом и особенно легко в случае ранжированных данных. В больших массивах данные сначала можно сгруппировать (что значительно проще ранжирования), а затем можно легко найти медиану.


Среднее арифметическое множества данных предполагает в основном арифметические операции. На величину среднего влияют значения всех результатов. Медиана и мода не требуют для определения всех значений. На величину среднего особенно влияют результаты, которые можно назвать «выбросами», то есть данные, находящиеся далеко от центра группы оценок.

Для нашего случая наиболее предпочтительным, так как для проведения эксперимента мы брали не произвольную выборку из тридцати человек, а конкретных людей в зависимости от статуса и формы обучения. Следовательно, нам необходимо учитывать все данные.


2.3 Разработка базы данных


В результате проведения педагогического эксперимента было собрано около двух тысяч хронокарт. Для эффективной обработки полученной информации необходимо на основании этих данных создать электронную базу данных.

База данных – это множество взаимосвязанных единиц данных, которые могут обрабатываться одной или несколькими прикладными системами. Использование электронных баз данных по сравнению с ручным методом имеет следующие преимущества:

  1. Компактность,

  2. скорость обработки данных,

  3. низкие трудозатраты - нет необходимости в утомительной ручной работе над картотекой. Механическую работу машины всегда выполняют лучше.

Достоинства централизованного управления данными, (то есть данными физически сосредоточенными на одном компьютере):

  1. возможность сокращения избыточности. Избыточность данных – некоторые единицы данных повторяются в разных приложениях. Причем в разных приложениях они записаны в разных форматах. Это означает лишние затраты на поддержание и хранение данных, а также риск противоречий между разными версиями общих данных.

  2. Возможность устранения (до некоторой степени) противоречивости данных (например, две записи дублируются, но если между ними потеряется связь, то при изменении одной, вторая останется прежней, следовательно, информация будет противоречивой). Для недопущения этого должно производиться множественное обновление данных.

  3. Возможность общего доступа к данным.

  4. Возможность соблюдения стандартов (корпоративных, отраслевых, государственных) это важно для совместного использования данных.

  5. Возможность введения ограничений для обеспечения безопасности (централизованные данные подвержены большему риску, чем разрозненные, следовательно, централизованная природа системы баз данных требует наличия хорошей системы безопасности).

  6. Возможность обеспечения целостности данных, то есть обеспечение правильности и точности данных в базе данных.

  7. Возможность сбалансировать противоречивые требования (быстрый доступ к файлам для наиболее важных приложений, возможно с потерями производительности для других).

  8. Обеспечение независимости данных.

Зависимость данных нежелательна, так как для разных приложений требуются разные представления одних и тех же данных; администратор базы данных должен иметь возможность при изменившихся требованиях изменять структуру хранения или метод доступа к данным без изменения существующих приложений.

Обеспечение независимости данных является основной целью систем баз данных. Независимость данных можно определить как иммунитет приложения к изменениям в структуре хранения данных или в методах доступа к данным, то есть рассматриваемые приложения не зависят от любой конкретной структуры хранения и конкретных методов доступа.


Недостатки баз данных:

  1. без надлежащего контроля безопасность может быть подвержена риску,

  2. целостность может быть подвергнута риску (без надлежащего контроля),

  3. может потребоваться дополнительное аппаратное обеспечение,

  4. накладные расходы для повышения производительности могут быть значительными,

  5. успешное выполнение операции является критическим (предприятие может быть весьма уязвимым по отношению к сбоям),

  6. система, вероятно, будет сложной (хотя такие сложности должны быть скрыты от пользователя).

Хронокарты представляют собой таблицы, следовательно, база данных будет реляционной. Реляционная база данных поддерживает все логические отношения между данными, логический доступ к данным, не зависящий от физической реализации. Таблица – некоторая регулярная структура, состоящая из конечного набора однотипных записей.

Разрабатываемая база данных должна быть нормализованной. Нормализация – это процесс приведения реляционных таблиц к стандартному виду. Существует три правила нормализации – три нормальные формы:

Первая нормальная форма – данные в виде двумерной таблицы, все значения атрибутов не должны являться множеством значений или повторяющейся группой. Атрибут –функциональное отношение объектного множества к другому объектному множеству, или информационное отражение свойств объекта. Каждый объект характеризуется рядом основных атрибутов.

Вторая нормальная форма – база данных удовлетворяет первой нормальной форме, а также никакие ключевые атрибуты не являются функционально зависимыми. Функциональная зависимость – значение атрибута в кортеже однозначно определяет значение другого атрибута в кортеже. Кортеж – строка двумерной таблицы.

Третья нормальная форма – база данных удовлетворяет первой и второй нормальным формам, а также любой детерминант является ключом. Детерминант – это атрибут в левой части функциональной зависимости, определяет значения других атрибутов кортежа. Ключ – значение, которое однозначно определяет элемент объектного множества.

Разрабатываемая база данных будет состоять из следующих таблиц: «Данные», «Курсы», «Недели», «План», «Предметы», «Статусы», «Студенты», «Формы».

В таблице «Данные» расположена информация о коде курса, на котором учится студент, код номер недели, универсальный код студента, код предмета и количество часов затраченных этим студентом специальности УИТ на выполнение самостоятельной работы. Таблица «Курсы» содержит информацию о количестве курсов и их коды. Таблица «Недели» содержит информацию о количестве учебных недель и их коды. В таблице «План» находится информация о коде курса, коде недели, предмете, его коде и количестве часов, которые отводятся на выполнение самостоятельной работы студентов по рабочим программам преподавателей. «Предмет» содержит данные о предметах, их кодах, о кодах курсов на которых они изучаются. «Статус» - информация о статусе студента и код статуса: троечник хорошист или отличник. Статус определялся по итогам зимней сессии 1999-2000 годов. В Таблице «Студенты» расположена информация о персональном коде студента, его фамилия, номер курса, на котором учится студент, форма обучения студента, а также статус этого студента. «Форма» содержит данные о формах обучения, а также коды форм обучения.