Файл: Исаев Г Н Теоретико-методологические основы качества информационных систем.doc

ВУЗ: Не указан

Категория: Учебное пособие

Дисциплина: Не указана

Добавлен: 21.10.2018

Просмотров: 11397

Скачиваний: 72

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

Глава 1. Теоретико-методологические условия совершенствования качества информационных систем

1.1. Определение структуры парадигмы совершенствования качества информационных систем

1.2. Методологические положения совершенствования качества информационных систем

Глава 2. Разработка концептуальной модели совершенствования качества информационных систем

2.1. Понятийное представление совершенствования качества информационных систем

2.2. Дескриптивное моделирование совершенствования качества информационных систем

2.3. Концепция креативного управления качеством информационных систем

Глава 3. Разработка математических моделей совершенствования качества информационных систем

3.1. Обобщённая модель совершенствования качества информационных систем

3.2. Модель определения состава показателей качества информационных систем

3.3. Модель расчета значений показателей оценки качества информационных систем

3.4. Модель определения обобщенных показателей и коэффициентов их весомости

3.5. Модель автоматического обнаружения и исправления ошибок в документах табличного вида

Выводы

Глава 4. Экспериментальное исследование моделей совершенствования качества информационных систем

4.1. Постановка задачи экспериментального исследования моделей совершенствования качества ИС

4.2. Обработка экспериментальных данных по исследованию моделей

4.3. Оценка и анализ адекватности моделей и результатов экспериментов

Глава 5. Синтез комплексной системы управления качеством информационных систем

5.1. Цель, задачи и функции комплексной системы управления качеством информационных систем

5.2. Структура комплексной системы управления качеством информационных систем

5.3. Технология обработки данных Комплексной системы управления качеством информационных систем

5.4. Разработка алгоритма и программы автоматического восстановления достоверности данных

5.5. Создание комплексной системы управления качеством информационных систем

Выводы

Заключение

Библиографический список использованной литературы

Приложение 1. Методика выявления и регистрации дефектов информационных систем

Приложение 2. Ведомость выявленных дефектов ИС

Приложение 3. Кодификаторы информации для заполнения «Ведомости выявленных дефектов»

Приложение 4. Расчет значений показателей оценки качества информационных систем

Приложение 5. Перечень основных сокращений


координат до пересечения с линией регрессии. Подобным образом можно определить экспресс-оценки по графику регрессии себестоимости обработки документов (рис. 4.6).

Для получения значений обобщенных показателей качества в результате реализации программы регрессионного анализа были получены коэффициенты регрессии и оценочные величины соответственно по производительности и себестоимости (таблицы 4.9 и 4.10). По этим данным составлены уравнения множественной линейной регрессии по производительности и по себестоимости:

= 348,9 – 1,452 x1 - 0,1119 x2 + 0,07146 x3.

= 3,66 + 0,3924 x1 + 0,0002067 x2 - 0,02332 x3.

В правой части уравнений расположены слева направо соответствующие свободные члены регрессии (нулевые коэффициенты), затем коэффициенты регрессии. Они обозначают соответственно значения базовых показателей производительности и себестоимости и коэффициентов весомости по достоверности, полноте и своевременности. Подставляя значения показателей по достоверности, полноте и своевременности можно определить фактические или прогнозируемые значения показателей по производительности и себестоимости.




Рис. 4.5. График зависимости производительности ИС от снижения

трудоемкости устранения дефектов обработки





Рис. 4.6. График зависимости себестоимости обработки документов от снижения трудоемкости устранения дефектов обработки


Таблица 4.9


Коэффициенты регрессии по производительности и данные их оценки

Вид (коэффици-ента)

Значение коэффициента регресссии

Стандартная ошибка коэффициента

Уровень значимости

нулевой гипотезы (Р-значение)

Нулевой

348,9

27

5,95Е-7

Достоверность

-1,452

271,7

0,9915

Полнота

-0,1119

81,56

0,9941

Своевременность

0,07146

23,47

0,993

Коэффициент множественной корреляции – 0,9993;

Коэффициент детерминации – 0,99859;

Приведенная (несмещенная) оценка коэффициента детерминации - 0,99834;

Стандартная ошибка вычислений – 0,37546;

F – значение статистики Фишера для проверки нулевой гипотезы - 4020;

Уровень значимости (Р - значение) нулевой гипотезы -0,0000;

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>.


Таблица 4.10

Коэффициенты регрессии по себестоимости и данные их оценки

Вид (коэф-фициента)

Значение коэффициента регресссии

Стандартная ошибка коэффициента

Уровень значимости

нулевой гипотезы (Р-значение)

Нулевой

3,663

0.06802

1.037E-8

Достоверность

0.3924

0.5402

0.5162

Полнота

0.0002067

0.0005942

0.7315

Своевре-менность

-0.02332

0.03202

0.5174



Коэффициент множественной корреляции – 0,99917;

Коэффициент детерминации – 0,99833;

Приведенная (несмещенная) оценка коэффициента детерминации – 0,99804;

Стандартная ошибка вычислений – 0,020831;

F – значение статистики Фишера для проверки нулевой гипотезы - 3392;

Уровень значимости (Р - значение) нулевой гипотезы - 0,0000;

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>.


Экспериментальная проверка алгоритма. В целях экспериментального исследования, проверки работоспособности и оценки эффективности алгоритма анализу подвергается программа автоматического восстановления данных, реализующая указанный алгоритм. В качестве экспериментального материала привлечено 20 документов (таблица 4.11). Каждый документ состоит из 7 таблиц. Для проверки программы в документы были внесены ситуационные ошибки (таблица 4.11). Объем и модификации ошибок определялись с учетом необходимости проверки максимального набора вероятных типов ошибок и полного объема функциональных свойств программы.

Таблица 4.11

Ведомость ошибок в документах

№№

пп

Наименование организации

(сокращенное)

Код предприятия

Адрес и модификация ошибки

адрес

(строка-графа)

значение показателя

заменяемое

заменяющее

1

2

3

4

5

6

1

Казанский

144000

170200-1

50

51

2

Калининградский

144003

173700-14

51

58

3

Кременчугский

144008

173400-11

406

552

4

Красноярский

179009

01-1

700

704

5

Липецкий

179010

180100-10

451

2051

6

Магнитогорский

179011

173400-кс

180100-10

815

800

825

890

7

Московский

334000

051100-13

0

50

8

Орловский

334010

020200-12

20

25

9

Одинцовский

334011

01-14

59

50

10

Павловский

391010

180100-15

6599

6590

11

Пензенский

391011

180100-13

0

20

12

Саратовский

391023

01-9

0

25

13

Саранский

490001

120200-8

0

10

14

Северный

490005

120200-11

136

150

15

Таганрогский

490009

120700-11

21

73

16

Тульский

491003

121100-4

92

95

17

Тюменский

491009

120800-10

112

122

18

Тагильский

491012

120800-12

0

10

19

Угличский

493019

050100-12

060800-12

76

88

88

76

20

Самарский

494023

-

Без ошибок


С целью получения данных для проведения сравнительного анализа и оценки эффективности рассматриваемой программы экспериментальная обработка осуществляется по двум вариантам. По первому варианту входной контроль отчетов выполняется средствами системы подготовки данных (СПД) с подключением программы автоматического восстановления достоверности значений показателей. Затем указанные отчеты контролируются по второму варианту – только средствами СПД, то есть с отключением рассматриваемой программы. Как по первому, так и по второму вариантам должны быть получены соответствующие протоколы ввода и диагностики ошибок во входных документах (распечатка принтера).


Последующий анализ протоколов ввода показал следующее. Одиночные ошибки автоматически обнаруживаются, вычисляются достоверные значения, затем последние заменяют ошибочные значения и оператору для контроля правильности работы программы выдаются сообщения типа «В документе ХХХХХ УУ обнаружена ошибка, строка ХХХХХХ-графа ХХ, значение ХХ скорректировано на значение УУУУ (таблица 4.11, позиции 1-5,7-12,14-15,17). По двойным и более ошибкам программа обнаруживала ошибки, однозначно идентифицируя их адреса, и выдавала сообщения типа «В документе ХХХХХ УУ обнаружено более одной ошибки, строка ХХХХХХ, содержит ошибку, строка ХХХХХХ, графа ХХ содержит ошибку» (таблица 4.11, позиция 18). Ошибочное значение определяется путем взятия пересечения номеров соответствующих строк и (или) граф. При условии случайной механической перестановки значений показателей по строкам и отсутствия нарушения контрольной суммы по графе (в строке 01) было выдано сообщение типа «В документе ХХХХХ УУ обнаружено более одной ошибки, строка ХХХХХ содержит ошибку, строка ХХХХХХ содержит ошибку, графа ХХ содержит ошибку» (таблица 4.11, позиция 19). Точно также идентифицируется «перестановка» значений показателей по графам. В процессе экспериментального исследования оператором подготовки данных была внесена непреднамеренная ошибка в отчет предприятия «Магнитогорский». В строке 180100, графа 10, в значении показателя 890 цифра 9 была ошибочно заменена на цифру 0, то есть, получено ошибочное значение 800. Поскольку в этот отчет ранее была внесена ситуационная ошибка, то программа выдала сообщение о двух ошибках и их адресах (таблица 4.11, позиция 6). В отчет предприятия «Самарский» ситуационные ошибки не вносили, при подготовке данных ошибок также не было, поэтому программа идентифицировала указанный отчет как безошибочный.

4.3. Оценка и анализ адекватности моделей и результатов экспериментов


По результатам обработки ЭВМ были получены данные, содержащие статистические оценки, в частности, среднее выборочное, среднее квадратичное отклонение, мода, медиана, коэффициенты вариации, ассиметрии, эксцесса, гистограммы классов дефектов по параметрам времени и стоимости, согласия эмпирических распределений дефектов с теоретическими и др. По каждой КДРД (таблицы 4.1-4.6) приведены выборочные оценки. На основе этих, а также в последующем полученных данных, были проведены необходимые расчеты (приложение 4) с целью заполнения «Карты оценки и анализа качества» (таблица 4.14) и выполнения анализа по соответствующей методике [122].

Оценка параметров ИС обычно проводится при уровне значимости 0,05, так как с учетом содержания данной задачи этого достаточно. Таблицы показывают, что полученные средние значения по указанному уровню достаточно хорошо укладываются в границы доверительных интервалов. В результате обработки распечатываются также гистограммы распределения частот дефектов, как по времени, так и по стоимости. Проверка эмпирических распределений показала, что случайные величины подчиняются нормальному закону распределения.


Для определения функциональной зависимости между временем и стоимостью обнаруженных и исправленных дефектов использована программа канонического анализа. В результате обработки, в частности, установлено, что между указанными переменными существует сравнительно тесная зависимость. Так, коэффициент канонической корреляции равен 0,99999, коэффициент множественной корреляции равен 0,99998. Вариации значений указанных коэффициентов относительно массивов находится в границах 5-го знака после запятой. Данное условие, в частности, свидетельствует о том, что в последующих измерениях и оценки качества обработки УБ можно не регистрировать стоимость дефектов, так как полученное по соответствующей программе соотношение «время (мин.)»: «стоимость (коп.)» равно 1:13. Однако это положение правомерно до изменения условий эксплуатации ИС, например, обновления комплекса технических средств, изменения оплаты труда работников и др.

Для проверки адекватности регрессионной модели обратимся к содержанию полученных в результате экспериментальной обработки оценок (таблицы 4.9, 4.10). Проверка регрессионных моделей показала в целом по гипотезе № 1 их адекватность экспериментальным данным. Относительно коэффициентов множественной корреляции, коэффициентов детерминации, критериев Фишера, уровней значимости нулевой гипотезы и других оценок, можно принять, что качество линейного прогноза хорошее.

Более четкое заключение можно дать на основе анализа остатков. В результате обработки получена информация по анализу остатков. Она приведена в таблицах 4.12 и 4.13. Графики зависимости величины нормированного остатка от величины процента приведены на рис. 4.7 и 4.8.

Значения производительности и себестоимости и анализ параметров показывает, что значения остатков незначительны как в абсолютном, так и относительном измерениях. Визуальную проверку адекватности модели удобнее всего выполнить по графикам зависимости величин нормированных остатков от величин процентов снижения дефектов соответственно по производительности и себестоимости (рис. 4.7, 4.8). К обработке и построению графиков целесообразно привлечь нормированные остатки, указанные в графе «Остаток в единицах стандартного отклонения» соответственно таблиц 4.12 и 4.13.

По полученным графикам можно установить следующее. График зависимости величины нормированного остатка от величины процента снижения дефектов по стоимости (рис. 4.8) показывает отсутствие четко выраженного криволинейного тренда. Наблюдается случайный разброс, свидетельствующий о том, что модель


Таблица 4.12

Данные анализа остатков регрессии по производительности


Зна-че-ние %

Номинальное значение производительности (Yэксп.)

Значение прогноза производительности (Yрегр.)

Остаток (Yэксп - Yрегр.)

Остаток в единицах

стандартного отклонения

Стандартная ошибка среднего значения

(d/Yрегр)

95% до-верительный интервал

(iYрегр.)

0

200.8

200.1

0.661

1.91

0.3756

0.7832

1

202.1

201.6

0.4351

1.257

0.3717

0.775

2

203.4

203.1

0.2691

0.7774

0.3681

0.7675

3

204.7

204.6

0.1332

0.3847

0.3649

0.7609

4

206.1

206.1

-.002805

-0.008104

0.3621

0.7551

5

207.4

207.6

-0.1088

-0.3142

0.3598

0.7501

6

208.8

209

-0.2047

-0.5914

0.3578

0.7461

7

210.3

210.5

-0.2707

-0.782

0.3563

0.7429

8

211.7

212

-0.3266

-0.9436

0.3552

0.7406

9

213.1

213.5

-0.3626

-1.048

0.3545

0.7392

10

214.6

215

-0.3786

-1.094

0.3543

0.7388

11

216.1

216.5

-0.3745

-1.082

0.3545

0.7392

12

217.6

218

-0.3505

-1.013

0.3552

0.7406

13

219.2

219.4

-0.2865

-0.8275

0.3563

0.7429

14

220.7

220.9

-0.2224

-0.6425

0.3578

0.7461

15

222.3

222.4

-0.1284

-0.3709

0.3598

0.7501

16

223.9

223.9

-0.01434

-0.04142

0.3621

0.7551

17

225.5

225.4

0.1197

0.3458

0.3649

0.7609

18

227.2

226.9

0.2837

0.8197

0.3681

0.7675

19

228.8

228.4

0.4478

1.294

0.3717

0.775

20

230.5

229.8

0.6818

1.97

0.3756

0.7832












Таблица 4.13

Данные анализа остатков регрессии по себестоимости


Зна-че-ние %

Номина-льное значение про-изводительности (Yэксп.)

Значение прогноза производительности (Yрегр.)

Остаток (Yэксп - Yрегр.)

Остаток в единицах

стандартного отклонения

Стандартная ошибка среднего значения

(d/Yрегр)

95% до-верительный интервал

(iYрегр.)

1

2

3

4

5

6

7

0

11.24

11.25

-0.005596

-1.762

0.003446

0.007186

1

11.17

11.17

0.0007875

0.2479

0.00341

0.00711

2

11.09

11.09

-0.002168

-0.6827

0.003377

0.007042

3

11.02

11.02

0.00435

1.37

0.003348

0.006981

4

10.94

10.94

0.001064

0.3349

0.003322

0.006928

5

10.86

10.86

-0.002223

-0.6998

0.003301

0.006882

6

10.79

10.79

0.004295

1.352

0.003283

0.006845

7

10.71

10.71

0.0002629

0.08279

0.003269

0.006816

8

10.63

10.63

-0.002277

-0.717

0.003259

0.006795

9

10.56

10.56

0.004478

1.41

0.003253

0.006782

10

10.48

10.48

0.0009548

0.3006

0.003251

0.006778

11

10.4

10.4

-0.002331

-0.734

0.003253

0.006782

12

10.33

10.33

0.004383

1.38

0.003259

0.006795

13

10.25

10.25

0.0009007

0.2836

0.003269

0.006816

14

10.17

10.17

-0.002385

-0.7511

0.003283

0.006845

15

10.09

10.1

-0.005671

-1.786

0.003301

0.006882

16

10.02

10.02

0.0008466

0.2666

0.003322

0.006928

17

9.94

9.942

-0.002439

-0.7681

0.003348

0.006981

18

9.87

9.866

0.004274

1.346

0.003377

0.007042

19

9.79

9.789

0.0009882

0.3112

0.00341

0.00711

20

9.71

9.712

-0.002494

-0.7851

0.003446

0.007186







Рис. 4.7. График зависимости величины нормированного остатка от величины процента снижения дефектов по времени




Рис. 4.8. График зависимости величины нормированного остатка от величины процента снижения дефектов по стоимости




едва ли можно или целесообразно улучшить. Сравнительная смещённость, например, распределения настолько мала (близость к оси), что не имеет принципиального значения относительно номинальных величин прогнозируемой переменной по себестоимости (таблица 4.13). Вместе с тем график зависимости величины нормированного остатка от величины процента снижения дефектов по времени (рис. 4.7) показывает незначительный криволинейный тренд. В общем случае это может означать, что в модели вероятно не учтен какой-либо фактор, либо допущены некоторые ошибки в расчетах. Первое условие маловероятно (пропуск фактора), так как кластер-анализ показал только три фактора, с одной стороны, и это условие не подтверждается распределением нормированных остатков по стоимости (рис. 4.8.). Более всего вероятным в данном случае является второе условие. Кроме того, следует учитывать вероятность действия в принципе обоих вышеуказанных и других условий, как это принято в модели регрессии (формула 3.35). Вместе с тем, график показывает, что смещённость распределения остатков относительно оси настолько мала, что в практическом отношении эта смещённость не имеет принципиального значения относительно номинальных величин прогнозируемой переменной по производительности (таблица 4.12, графа «Остаток»). С учетом вышеизложенного можно констатировать, что полученные модели адекватны экспериментальным данным.