ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2023
Просмотров: 9
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Розрахункова робота
Короткі теоретичні відомості
Особливості хімічного аналізу як метрологічної процедури. Основні
поняття
Сучасна аналітична хімія використовує широкий арсенал методів аналізу, які потребують не тільки теоретичних знань, а й практичних експериментальних та
інструментальних навиків. Особливістю хімічного аналізу як метрологічної процедури є те, що виміру підлягає одночасно декілька величин, тому процес вимірювання складається, як правило, з декількох стадій, а саме вимірювання має непрямий характер. Реальні досліджувані зразки являють собою складні багатокомпонентні та/або багатофазні системи, для яких практично неможливо врахувати всі можливі види взаємодій під час проведення операцій з вимірювання.
У зв’язку з цим похибки є невід’ємною частиною будь-яких вимірювань, а їх визначення та врахування є важливим завданням аналітика-дослідника. Похибки виміру виникають внаслідок багатьох причин: недосконалість засобів вимірювання, методів вимірювання, зовнішні збурення (постійні або змінні), індивідуальні якості дослідника, недостатня ретельність проведення й обробки результатів виміру тощо.
Під похибкою виміру розуміють відхилення виміру
B
x
від істинного значення
I
x
вимірюваної величини:
I
B
x
x
x
−
=
Оскільки істинне значення величини є невідомим, а при уточненні виміру дослідник лише асимптотично наближається до точного, то числове значення похибки також залишається невідомим. Тому на практиці використовують умовно
істинне, або дійсне
Д
x , значення:
Д
B
x
x
x
−
=
Існує декілька підходів до класифікації похибок; розглянемо найбільш поширені:
І. За способом вираження розрізняють абсолютні та відносні похибки.
Абсолютною похибкою ∆ називається абсолютна величина різниці між виміряним та дійсним значенням:
B
Д
x
x
=
−
(1)
Відносною похибкою числа х називається відношення абсолютної похибки цього числа до модуля дійсного значення; якщо дійсне значення невідоме, використовують виміряне значення:
Д
x
=
або
B
x
=
(2)
Також прикладом абсолютної похибки є стандартне відхилення, а прикладом відносної – коефіцієнт варіації.
ІІ. За характером зміни результатів при повторних вимірах, розрізняють систематичні, випадкові та грубі похибки (промахи).
Систематична похибка виміру (систематична похибка) – складова частина похибки результату виміру, що залишається постійною або закономірно змінюється при повторних вимірах однієї й тієї самої величини. Систематичні похибки не залежать від кількості вимірів; їх можна враховувати та виключати з результату виміру.
В залежності від характеру прояву розрізняють постійні, прогресивні, періодичні похибки та похибки, які змінюються за складним законом.
Постійні похибки – похибки, які тривалий час зберігають своє значення і знак; вони зустрічаються найчастіше.
Прогресивні похибки – неперервно зростаючі або спадаючі похибки. До них відносяться, наприклад, похибки внаслідок розрядження акумулятору та батареї.
Періодичні похибки – похибки, значення яких є періодичною функцією часу або переміщення покажчика вимірювального засобу. Така похибка виникає, коли вісь обертання стрілки приладу не співпадає з центром кола шкали.
Похибки, які змінюються за складним законом виникають внаслідок сумісної дії декількох систематичних похибок.
Випадкова похибка виміру (випадкова похибка) – складова частина похибки результату виміру, що змінюється випадковим чином (за знаком та за значенням) при повторних вимірах, проведених з однаковою ретельністю, тієї ж самої величини.
Випадкова похибка не може бути виключена з результату виміру, однак при проведенні деякої кількості повторних вимірів методи теорії ймовірності та математичної статистики дозволяють дещо покращити результат, тобто знайти значення вимірювальної величини, більш близьке до істинного, ніж результат однократного вимірювання: при n → ,
0
i
x
→
,
B
I
x
x
→
Промах – похибка результату окремого виміру, що входить до ряду вимірів, яка для даних умов різко відрізняється від інших результатів даного ряду. Інколи замість терміну «промах» використовують термін груба похибка виміру. Результати вимірів, що містять грубі похибки, не приймають до уваги та виключають з ряду вимірювань.
Найбільш розповсюдженими причинами промахів є: помилка спостерігача, несправність вимірювальної апаратури, різка зміна умов вимірювання та інші випадкові впливи. Розглянемо декілька прикладів.
Неправильне врахування малих позначок на шкалі: 5 поділок приймають за 10, або відлік ведуть не в тому напряму, в якому відградуйована шкала (якщо нуль розташований з права), або не враховують, що на логарифмічній шкалі ціна найменшого ділення в середині шкали змінюється.
Неправильний запис результату спостереження: перестановка цифр – 369 замість 396, або неправильний запис маси гирь. Описка може виникнути, коли один учасник досліду диктує іншому відлік показань приладу.
Помилки при маніпуляціях з приладами або елементами вимірювальної
установки. Промахи у таких випадках виникають внаслідок недостатнього досвіду або кваліфікації дослідника; при цьому весь ряд спостережень слід скасувати.
ІІІ. За причиною виникнення виділяють інструментальні, реактивні, методичні, суб’єктивні похибки, а також похибки, які виникають внаслідок зміни умов вимірювання; похибки, які виникають внаслідок неправильної установки вимірювального засобу; похибки еталонів тощо.
ІV. За способом обробки результатів похибки середньоарифметичні та середньоквадратичні, середньоймовірні похибки.
V. В залежності від того, оцінюється похибка вимірюваної величини чи результат непрямого вимірювання, розрізняють похибки прямих та непрямих вимірів.
VІ. За кількістю проведених вимірів – похибки однократного виміру та похиби порівнюваних рядів вимірів, серій тощо.
Загальні правила представлення результатів
➢ Якщо інструментальна похибка має більшу кількість десяткових знаків, ніж точність відліку, то кількість десяткових знаків має відповідати точності відліку результату виміру.
➢ Якщо інструментальна похибка має меншу кількість десяткових знаків, ніж точність відліку, то результат виміру слід представляти з кількістю знаків, що відповідає інструментальній похибці.
➢ Округлення результатів виміру, отриманих цифровим методом, виконується до кількості знаків, що відповідає похибці засобу вимірювання.
➢ Якщо результат виміру отримано між поділками шкали, то інтерполювати покази можна лише у тому випадку, якщо це вказано у інструкції до засобу вимірювання; інакше встановлюються довірчий інтервал, що відповідає відстані між поділками.
Результат представляють наступним чином:
зазор S у сполученні за результатами багатократних вимірів з 60 значень
складає S=4,053±0,004 мкм при р=0,95.
або
дійсне значення зазору S у сполученні за результатами багатократних вимірів з
60 значень знаходиться у межах від 4,049 до 4,057 мкм із ймовірністю р=0,95.
Планування та обробка багатократних вимірювань
Багатократні вимірювання проводять серіями; з метою підвищення надійності проводять декілька серій. Кількість вимірювань у серії обирають наступним чином:
− виконують попередню серію з незначною кількістю вимірів;
− розраховують стандартне відхилення окремих результатів цієї серії (оцінку середнього квадратичного відхилення) за формулою:
(
)
2 1
1
i
s
x
x
n
=
−
−
;
(3)
− визначають значення коефіцієнта Стьюдента для попередньої серії (значення довірчої ймовірності обирають в залежності від вимог до точності, найчастіше р=0,95);
− розраховують граничну допустиму похибку результату
, яка визначає границі довірчого інтервалу та точність вимірів;
− розраховують оптимальну кількість вимірювань:
2 2
p
t s
n
=
(4)
Після проведення m серій перевіряють, чи містить результат грубі похибки.
Перевіряють гіпотезу: чи підпорядковується результат вимірювання нормальному закону
− при n < 10 гіпотеза не перевіряється;
− при n > 50 використовують критерій Пірсона;
− при 10 < n < 50 використовують складовий критерій;
Обчислюють результат вимірів;
Розраховують стандартне відхилення (стандартне відхилення для m серій визначають за формулою:
m
n
x
S
i j
ij
m
−
=
2
(
m
j
n
i
,
1
;
,
1
=
=
),
(5) та розраховують межі довірчих інтервалів.
Обробка результатів вимірів з використанням складового критерію (перевірка, чи відповідає закон розподілу нормальному)
➢ Обчислюють результат вимірів;
➢ Визначають стандартне відхилення за формулою (3);
➢ Перевіряють наявність грубих похибок;
➢ Розраховують критерій d за формулою:
(
)
2 1
1
1
x
x
n
x
x
n
d
i
n
i
i
−
−
=
=
(6)
➢ Перевіряють, чи виконується умова: max min
d
d
d
(7)
➢ Якщо умова виконується, гіпотезу щодо закону розподілення приймають та довірча похибка обчислюється за формулою:
p
t
s
= ,
(8) де
p
t – табличне значення коефіцієнта Стьюдента
Спосіб симетричних спостережень для виключення систематичної
похибки
Спосіб симетричних спостережень застосовується для виключення прогресивної похибки, яка є лінійною функцією часу (або іншої величини). Така функція може бути зображена у вигляді графіку.
Спосіб симетричних спостережень полягає у тому, що виміри проводять послідовно через однакові інтервали часу.
При обробці застосовують властивість результатів будь-яких двох спостережень, що симетричні відносно середньої точки
інтервалу спостережень. Ця властивість полягає у тому, що середнє значення прогресивної похибки результатів будь-якої пари симетричних спостережень дорівнює похибці, що відповідає середній точці інтервалу.
Наприклад, було проведено п’ять вимірів; вони були початі у момент t
1
(див. графік), коли похибка мала значення
1
. Отже,
3 4
2 5
1 2
2
=
+
=
+
. Кількість вимірів може бути й непарною. Тоді
2 2
2 4
3 5
2 6
1
+
=
+
=
+
. Мінімальна кількість вимірів похиб ка t, час
Графік прогресивної похибки
1
2
3
4
5
a
1
t
2
t
3
t
4
t
5
t
0
при способі симетричних спостережень – три; якщо при цьому початкова похибка дорівнює нулю, обчислення спрощуються.
Оцінка меж систематичних похибок
У деяких випадках виключення систематичних похибок є практично неможливим. В першу чергу це відноситься до тих методів, похибки яких не вивчені. Крім того, є група засобів вимірювання, систематичні похибки яких вивчені, можуть бути виміряні й визначені, проте не можуть бути використані для внесення поправок у результат виміру. До них відносяться інтегруючі засоби вимірювання, найчастіше лічильники, витратоміри тощо.
Якщо похибку неможливо виключити, навіть коли вона відома, обмежуються оцінкою меж можливих систематичних похибок. Довірча межа похибки
результату виміру – це найбільше й найменше значення похибки виміру, які обмежують інтервал, всередині якого із заданою ймовірністю знаходиться шукане
(істинне) значення похибки результату виміру.
Приклад 1. Температура яскравості злитка металу, що виміряна квазімонохроматичним пірометром у п'яти різних точках, виявилася наступній: 976,
1004, 946, 951, 988 °C. Різниця в температурах яскравості обумовлена систематичною похибкою. Оцініть найбільш ймовірне значення температури злитка, а також довірчий інтервал систематичної похибки, що відповідає довірчій ймовірності p = 0,95. Припущення:
• дійсна температура в усіх точках однакова;
• похибка розподілена за а) законом Стьюдента; б) нормальним законом.
Розв’язання
Нижню та верхню межі обчислимо за формулами:
−
= x
x
H
,
+
= x
x
B
а) якщо похибка розподілена за нормальним законом, то
p
t
s
= ; б) якщо похибка розподілена за законом Стьюдента, то
p
t
n
=
Розрахуємо вибіркове стандартне відхилення та виправлене стандартне відхилення:
(
)
2 1
22
i
B
x
x
n
=
−
,
(
)
2 1
25 1
i
B
s
x
x
n
=
−
−
Вибіркове середнє x =973, тоді а)
2,776 25 68
=
; б)
22 2,776 27 5
=
;
H
x
=973-68=905;
H
x
=973-27=946;
B
x
=973+68=1041.
B
x
=973+27=1000.
Знайдемо довірчий інтервал для стандартного відхилення, скориставшись формулою:
0 < ???? < ????(1 + ????), (???? > 1)
де S – виправлене стандартне відхилення, яке знаходять за формулою
???? =
√
∑ ????
????
(????
????
−????
????
)
2
????−1
;
q знаходять за таблицею (додаток 2) за заданими n (кількість дослідів) i заданого p.
Для даного прикладу q=1,37, тоді
H
x
=0;
B
x
=25(1+1,37)≈58.
Розрахунок похибки при непрямих вимірах
Якщо
(
)
1 2
,
,
,
,
k
y
f x x
x
=
, то
(
)
2 1
2 1
,
,
,
k
k
y
i
i
i
f x x
x
x
x
=
=
,
Де
і
х
може бути як середньою квадратичною, так і граничною похибкою.
Приклад 2. При градуюванні витратоміра були отримані наступні значення: i
1 2
3 4
5 6
7 8
9
τ, с 97,5 94,8 94,7 95,2 94,9 95,3 91,1 95,2 95,3
Об'єм баку 500±0,1 л. Похибка вимірювання часу становить 0,32 сек.
Розрахуйте похибку, з якою проводилось вимірювання витрати.
Розв’язання.
t
V
Q =
,
2 2
+
=
t
t
Q
V
V
Q
Q
t
V
Q
1
=
,
2
t
V
t
Q =
2 2
2 1
+
=
t
t
V
V
t
Q
,
+
+
+
=
9 3
,
95 8
,
94 5
,
97
t
95 c.
+
=
2 2
2 32
,
0 95 500 95 1
,
0
Q
0,0178л/с
Оцінка результатів, які містять промахи або грубі похибки
Одним з простих способів аналізу результатів, що містить похибку, є правило трьох сігм. У виробничих умовах додатково аналізують результати вимірювань, які перевищують 3,5
або 4
(
- стандартне відхилення).
При малій кількості спостережень найбільш точні результати дозволяє отримати критерій Романовського, який базується на розподіленні Стьюдента.
Критерій Романовського. Нехай було проведено (n+1) вимір; при цьому n результатів не викликають сумніву, а один здається таким, що порушує цей ряд.
Цей результат позначають як
1
n
x
+
. Для інших значень (від
1
x
до
n
x
) розраховують середнє значення x та стандартне відхилення
Далі знаходять розрахункове значення критерію:
розр
t
=
, та табличне
табл
t
при відомих n та р. Якщо
розр
t
>
табл
t
, то це значення виключають з ряду.
Приклад 3. Під час вимірювань температури отримано такі результати: i
1 2
3 4
5 6
7 8
9
T, °C
96 98 93 95 97 98 96 98 97
Перевірити, чи містить результат грубі похибки:
Значення Т=93°C здається таким, що порушує ряд вимірів. Позначимо його як
9
x
. Для інших значень розрахуємо середнє значення та стандартне відхилення:
x
=96,88;
=1,053.
Розрахункове значення критерію:
розр
t
=3,68.
Табличне значення:
табл
t
=2.17.
Оскільки
розр
t
=3,68>
табл
t
=2.17, то значення Т=93 відкидаємо.
Кореляційний аналіз
Нехай дослідні дані, отримані для вивчення залежності між випадковими величинами Х і Y такі, що кожному значенню Х відповідає декілька значень Y.
Наприклад, при X = x
1
величина Y набула значень y
1
, y
2
, …, y k
, і навпаки, кожному значенню Y відповідає кілька значень Х.
Залежність, за якої кожному значенню однієї з випадкових величин відповідає ряд розподілу іншої, а також зі зміною однієї величини закономірно змінюються статистичні характеристики рядів розподілення іншої величини, називають
статистичною. Кореляційна залежність є окремим випадком статистичної залежності, коли у разі зміни однієї з величин змінюється середнє значення іншої.
Вивчення залежності між двома змінними можливо за допомогою так званих
діаграм розсіювання (точкових діаграм) – це тип графіка або математичної діаграми, що використовує декартові координати для відображення значень зазвичай двох змінних з набору даних. Дані відображаються як сукупність точок
(рис. 1, а). На одній діаграмі можна розмістити одну
1
або декілька додаткових змінних, якщо точки інших змінних закодовані
2
(рис. 1, б). а) б)
Рис. 1 - Діаграми розсіювання
Досліджувані змінні можуть відноситися до:
− характеристики якості і фактору, який впливає на характеристику; наприклад, швидкість фільтрування та степінь очищення води;
− двом різним характеристикам якості; наприклад, прозорість та каламутність води;
− двом факторам, що впливають на одну характеристику якості; наприклад, значення рН та температура.
Приклади діаграм розсіювання представлені на рис. 2.
1
Рекомендується розміщувати не більше однієї додаткової змінної.
2
тобто мають інший колір/форму/розмір
а) б) в) г)
Рис. 2 - Приклади діаграм розсіювання
Метод, який дає можливість приймати рішення щодо існування кореляції між двома змінними шляхом побудови діаграм розсіювання і розрахунку коефіцієнта кореляції, має назву кореляційний аналіз.
Наявність (чи відсутність) зв’язку між випадковими величинами X та Y, а також силу (тісноту) зв’язку характеризують коефіцієнтом кореляції r xy
. Коефіцієнт
кореляції – безрозмірна величина (причому |r xy
|<=1), яку використовують для оцінки тісноти тільки лінійного зв’язку між величинами Х і Y: чим ближче абсолютна величина коефіцієнта кореляції до одиниці, тим зв’язок сильніше; чим ближче значення |r xy
| до нуля, тим зв’язок слабкіше.
x
y
0
x
y
0
x
y
0
Якщо r xy
>0, говорять про додатню кореляцію (у разі зростання однієї з величин інша має тенденцію у середньому до зростання, як показано на Рис. 2, а та б); якщо r xy
<0,
- про від’ємну кореляцію (за зростання однієї з величин інша має тенденцію у середньому до спадання – Рис. 2, в).
Розрахунок коефіцієнту кореляції:
xy
xy
xx
yy
S
r
S
S
=
,
(9) де n – кількість пар даних
(
)
=
=
=
−
=
−
=
n
i
n
i
i
i
n
i
i
xx
n
x
x
x
x
S
1 2
1 2
1 2
,
(
)
=
=
=
−
=
−
=
n
i
n
i
i
i
n
i
i
yy
n
y
y
y
y
S
1 2
1 2
1 2
,
(
) (
)
=
=
=
=
−
=
−
−
=
n
i
n
i
i
n
i
i
i
i
n
i
i
i
xy
n
x
x
y
x
y
y
x
x
S
1 1
1 1
,
Величину S
xy називають коваріацією.
Кореляційну залежність У від Х можна визначити як функціональну залежність умовної середньої
y
від х:
( )
( )
x
f
x
y
=
Таке рівняння називають рівнянням регресії У на Х (чи Х на У); функцію
( )
x
f
–
регресією У на Х (чи Х на У); а її графік – лінією регресії У на Х (чи Х на У).
Процедуру відшукання зв’язку між У та Х у вигляді лінії регресії, називається
регресійним аналізом.
У випадку лінійної кореляції рівняння лінії регресії У на Х має вигляд:
Y
a
b X
= + , де a - вільний член (константа); b - коефіцієнт регресії (кутовий коефіцієнт).
Коефіцієнти цієї функції знаходять за алгоритмом:
Крок 1. Знайти
x
та
y
Крок 2. Розрахувати S
xх
та S
хy
Крок 3. Знайдіть b за формулою
xy
S
b
Sxx
=
, а a - за формулою
a
y
b x
= −
Аналогічно, рівняння лінії регресії Х на У має вигляд:
Y
c
d X
= + , де c і d – коефіцієнти.
Приклад 4. На одному з підприємств хімічної галузі проводили аналіз взаємозв’язку між рентабельністю виробництва (Х, %) та преміями на 1 працівника (У, тис. грн.). Результати досліджень наведені у таблиці:
Розрахуйте коефіцієнт кореляції та оцініть тісноту зв’язку між Х та У. Побудуйте діаграму розсіювання та розрахуйте коефіцієнти лінії регресії Х на У.
Розв’язок.
Розрахуємо середні значення Х та У:
16 15 18 13,71 12
x
+
+
+
=
=
,
2,5 2,4 2,9 2,20 12
y
+
+
+
=
=
Далі розрахуємо S
xх
та S
хy
:
(
)
(
) (
)
(
)
2 2
2 2
1 16 13,71 15 13,71 18 13,71 9,52
n
xx
i
i
S
x
x
=
=
−
=
−
+
−
+
−
=
,
(
)
(
) (
)
(
)
2 2
2 2
1 2,5 2, 2 2, 4 2, 2 2,9 2, 2 0,19
n
yy
i
i
S
y
y
=
=
−
=
−
+
−
+
+
−
=
,
(
) (
) (
) (
) (
) (
)
(
) (
)
1 16 13,71 2,5 2, 2 15 13,71 2, 4 2, 2 18 13,71 2,9 2, 2 1, 29;
n
xy
i
i
i
S
x
x
y
y
=
=
−
−
=
−
−
+
−
−
+
+
−
−
=
тоді коефіцієнт кореляції:
1, 29 0,95 9,52 0,19
xy
xy
xx
yy
S
r
S
S
=
=
=
Значення r xy
> 0, тобто зі зростанням премії рентабельність теж зростає; також отримане значення досить близько до одиниці; отже, зв’язок між рентабельністю виробництва та преміями досить тісний.
Побудуємо діаграму розсіювання та розрахуємо коефіцієнти лінії регресії Х на У:
1, 29 0,1356 9,52
xy
xx
S
b
S
=
=
=
,
2,2 0,1356 13,71 0,3375
a
y
b x
= − =
−
=
Тоді рівняння регресії матиме вигляд:
0,3375 0,1356
y
x
=
+
Рис. 3. Діаграма розсіювання
Контрольні запитання
1. Поняття наближеного числа.
2. Правила округлення чисел.
3. Відносна й абсолютна похибки.
4. Систематичні та випадкові похибки.
5. Алгоритми визначення похибок та способи оцінки результатів, що містять похибки.
6. Яку залежність називають кореляційною?
7. Поняття кореляційної залежності.
8. Поняття лінії регресії.
9. Що характеризує коефіцієнт вибіркової кореляції і які значення може приймати?
10. Кореляційна таблиця. Як вона створюється і як використовувати записані там дані?
11. Від’ємна і додатна лінійна кореляція.
12. Граничні значення коефіцієнта кореляції та їх сенс для оцінювання сили зв’язку між величинами.
13. Поняття умовних середніх.
Задача 1. За наведеним даними перевірте, чи містить результат грубі похибки.
Таблиця 1.
Номер
варіанту
Величина, що
вимірюється
Результати вимірювань
q
1
q
2
1 рН, од. рН
7 10 12 13 11 10 12 0.01 0.05 2 рН, од. рН
12 7
12 13 10 11 13 0.05 0.1 3 рН, од. рН
12 11 7
13 10 10 12 0.01 0.05 4 рН, од. рН
10 12 13 7
10 10 13 0.05 0.1 5 рН, од. рН
11 12 13 12 7
10 11 0.01 0.05 6
Вміст SiO
2
у зразках сілікату, %
64.03 64.58 64.6 65.07 65.16 62.52 65.41 0.05 0.1 8
Вміст Ni у зразках сталі, %
1.54 1.55 1.57 1.61 1.61 1.63 1.73 0.01 0.05 9
Вміст Ni у зразках сталі, %
1.75 1.64 1.64 1.64 1.65 1.65 1.7 0.05 0.1 10
Вміст Ni у зразках сталі, %
1.7 1.76 1.73 1.71 1.71 1.72 1.7 0.01 0.05 11
Вміст Ni у зразках сталі, %
1.73 1.73 1.71 1.74 1.74 1.74 1.73 0.01 0.05 12
Вміст Ni у зразках сталі, %
1.54 1.55 1.56 1.53 1.57 1.58 1.57 0.05 0.1 13
Вміст Ni у зразках сталі, %
1.6 1.6 1.6 1.62 1.57 1.62 1.62 0.01 0.05 14
Вміст діючої речовини у суміші, мкг
50.71 51.53 53.28 54.29 55.38 59.93 55.44 0.05 0.1 15
Вміст діючої речовини у суміші, мкг
58.24 61.14 61.19 61.47 61.57 61.66 55.2 0.01 0.05 16
Вміст діючої речовини у суміші, мкг
57.53 63.1 63.22 64.85 65.91 65.93 62.69 0.05 0.1 17
Вміст вуглецю в пробі органічної речовини, %
40.02 39.64 40.31 40.36 40.37 40.37 40.25 0.01 0.05
Сірим кольором виділено значення, яке здається сумнівним
Задача 2. Розрахуйте, скільки треба провести вимірювань, щоб випадкова похибка
не перевищувала * 0,1
(0.01
**
) з ймовірністю р
1
=1-q
1
p
2
=1-q
2
***
, якщо попередньо було проведено серію з n дослідів. Результати попередньої серії вимірювань наведені у Задачі 1.
Задача 3. Результати вимірювань фізичної величини представлені у табл. 1, причому різниця у виміряних значеннях обумовлена систематичною похибкою.
Знайдіть довірчий інтервал систематичної похибки, що відповідає довірчій ймовірності p. Для парних варіантів прийняти, що похибка розподілена за законом
Стьюдента, p = 0,95. Для непарних варіантів прийняти, що похибка розподілена за нормальним законом, p = 0,99.
Задача 4. За даними таблиці 2 індивідуального завдання побудуйте діаграму розсіювання, розрахуйте коефіцієнт кореляції та коефіцієнти ліній регресії У на Х та Х на У, якщо рівняння мають вигляд:
y
a
b x
= +
x
c
d y
= +
Зробіть висновок щодо наявності та тісноти кореляційного зв’язку за отриманими результатами.
Для варіантів №№ 1-6 та 14-16.
**
Для всіх інших варіантів.
***
Якщо у серії попередніх вимірювань є промах (груба похибка), цей результат слід виключити з ряду.
Додаток 1. Значення критерія Романовського
q n =4 n = 6 n = 8 n
=
10 n
=
12 n
=
15 n
=
20 0,01 1,73 2,16 2,43 2,62 22,75 2,90 3,08 0,02 1,72 2,13 2,37 2,54 2,66 2,80 2,96 0,05 1,71 2,10 2,27 2,41 2,52 2,64 2,78 0,10 1,69 2,00 2,17 2,29 2,39 2,49 2,62
Додаток 2. Таблиця значень
n
p
0,95 0,99 0,999 5
1,37 2,67 5,64 6
1,09 2,01 3,88 7
0,92 1,62 2,98 8
0,80 1,38 2,42 9
0,71 1,20 2,06 10 0,65 1,08 1,80 11 0,59 0,98 1,60 12 0,55 0,90 1,45 13 0,52 0,83 1,33 14 0,48 0,78 1,23 15 0,46 0,73 1,15 16 0,44 0,70 1,07 17 0,42 0,66 1,01 18 0,40 0,63 0,96 19 0,39 0,60 0,92 20 0,37 0,58 0,88 25 0,32 0,49 0,73 30 0,28 0,43 0,63 35 0,26 0,38 0,56 40 0,24 0,35 0,50 45 0,22 0,32 0,46 50 0,21 0,30 0,43 60 0,188 0,269 0,38 70 0,174 0,245 0,34 80 0,161 0,226 0,31 90 0,151 0,211 0,29 100 0,143 0,198 0,27 150 0,115 0,160 0,211 200 0,099 0,136 0,185 250 0,089 0,120 0,162
Розрахункова робота
Короткі теоретичні відомості
Особливості хімічного аналізу як метрологічної процедури. Основні
поняття
Сучасна аналітична хімія використовує широкий арсенал методів аналізу, які потребують не тільки теоретичних знань, а й практичних експериментальних та
інструментальних навиків. Особливістю хімічного аналізу як метрологічної процедури є те, що виміру підлягає одночасно декілька величин, тому процес вимірювання складається, як правило, з декількох стадій, а саме вимірювання має непрямий характер. Реальні досліджувані зразки являють собою складні багатокомпонентні та/або багатофазні системи, для яких практично неможливо врахувати всі можливі види взаємодій під час проведення операцій з вимірювання.
У зв’язку з цим похибки є невід’ємною частиною будь-яких вимірювань, а їх визначення та врахування є важливим завданням аналітика-дослідника. Похибки виміру виникають внаслідок багатьох причин: недосконалість засобів вимірювання, методів вимірювання, зовнішні збурення (постійні або змінні), індивідуальні якості дослідника, недостатня ретельність проведення й обробки результатів виміру тощо.
Під похибкою виміру розуміють відхилення виміру
B
x
від істинного значення
I
x
вимірюваної величини:
I
B
x
x
x
−
=
Оскільки істинне значення величини є невідомим, а при уточненні виміру дослідник лише асимптотично наближається до точного, то числове значення похибки також залишається невідомим. Тому на практиці використовують умовно
істинне, або дійсне
Д
x , значення:
Д
B
x
x
x
−
=
Існує декілька підходів до класифікації похибок; розглянемо найбільш поширені:
І. За способом вираження розрізняють абсолютні та відносні похибки.
Абсолютною похибкою ∆ називається абсолютна величина різниці між виміряним та дійсним значенням:
B
Д
x
x
=
−
(1)
Відносною похибкою числа х називається відношення абсолютної похибки цього числа до модуля дійсного значення; якщо дійсне значення невідоме, використовують виміряне значення:
Д
x
=
або
B
x
=
(2)
Також прикладом абсолютної похибки є стандартне відхилення, а прикладом відносної – коефіцієнт варіації.
ІІ. За характером зміни результатів при повторних вимірах, розрізняють систематичні, випадкові та грубі похибки (промахи).
Систематична похибка виміру (систематична похибка) – складова частина похибки результату виміру, що залишається постійною або закономірно змінюється при повторних вимірах однієї й тієї самої величини. Систематичні похибки не залежать від кількості вимірів; їх можна враховувати та виключати з результату виміру.
В залежності від характеру прояву розрізняють постійні, прогресивні, періодичні похибки та похибки, які змінюються за складним законом.
Постійні похибки – похибки, які тривалий час зберігають своє значення і знак; вони зустрічаються найчастіше.
Прогресивні похибки – неперервно зростаючі або спадаючі похибки. До них відносяться, наприклад, похибки внаслідок розрядження акумулятору та батареї.
Періодичні похибки – похибки, значення яких є періодичною функцією часу або переміщення покажчика вимірювального засобу. Така похибка виникає, коли вісь обертання стрілки приладу не співпадає з центром кола шкали.
Похибки, які змінюються за складним законом виникають внаслідок сумісної дії декількох систематичних похибок.
Випадкова похибка виміру (випадкова похибка) – складова частина похибки результату виміру, що змінюється випадковим чином (за знаком та за значенням) при повторних вимірах, проведених з однаковою ретельністю, тієї ж самої величини.
Випадкова похибка не може бути виключена з результату виміру, однак при проведенні деякої кількості повторних вимірів методи теорії ймовірності та математичної статистики дозволяють дещо покращити результат, тобто знайти значення вимірювальної величини, більш близьке до істинного, ніж результат однократного вимірювання: при n → ,
0
i
x
→
,
B
I
x
x
→
Промах – похибка результату окремого виміру, що входить до ряду вимірів, яка для даних умов різко відрізняється від інших результатів даного ряду. Інколи замість терміну «промах» використовують термін груба похибка виміру. Результати вимірів, що містять грубі похибки, не приймають до уваги та виключають з ряду вимірювань.
Найбільш розповсюдженими причинами промахів є: помилка спостерігача, несправність вимірювальної апаратури, різка зміна умов вимірювання та інші випадкові впливи. Розглянемо декілька прикладів.
Неправильне врахування малих позначок на шкалі: 5 поділок приймають за 10, або відлік ведуть не в тому напряму, в якому відградуйована шкала (якщо нуль розташований з права), або не враховують, що на логарифмічній шкалі ціна найменшого ділення в середині шкали змінюється.
Неправильний запис результату спостереження: перестановка цифр – 369 замість 396, або неправильний запис маси гирь. Описка може виникнути, коли один учасник досліду диктує іншому відлік показань приладу.
Помилки при маніпуляціях з приладами або елементами вимірювальної
установки. Промахи у таких випадках виникають внаслідок недостатнього досвіду або кваліфікації дослідника; при цьому весь ряд спостережень слід скасувати.
ІІІ. За причиною виникнення виділяють інструментальні, реактивні, методичні, суб’єктивні похибки, а також похибки, які виникають внаслідок зміни умов вимірювання; похибки, які виникають внаслідок неправильної установки вимірювального засобу; похибки еталонів тощо.
ІV. За способом обробки результатів похибки середньоарифметичні та середньоквадратичні, середньоймовірні похибки.
V. В залежності від того, оцінюється похибка вимірюваної величини чи результат непрямого вимірювання, розрізняють похибки прямих та непрямих вимірів.
VІ. За кількістю проведених вимірів – похибки однократного виміру та похиби порівнюваних рядів вимірів, серій тощо.
Загальні правила представлення результатів
➢ Якщо інструментальна похибка має більшу кількість десяткових знаків, ніж точність відліку, то кількість десяткових знаків має відповідати точності відліку результату виміру.
➢ Якщо інструментальна похибка має меншу кількість десяткових знаків, ніж точність відліку, то результат виміру слід представляти з кількістю знаків, що відповідає інструментальній похибці.
➢ Округлення результатів виміру, отриманих цифровим методом, виконується до кількості знаків, що відповідає похибці засобу вимірювання.
➢ Якщо результат виміру отримано між поділками шкали, то інтерполювати покази можна лише у тому випадку, якщо це вказано у інструкції до засобу вимірювання; інакше встановлюються довірчий інтервал, що відповідає відстані між поділками.
Результат представляють наступним чином:
зазор S у сполученні за результатами багатократних вимірів з 60 значень
складає S=4,053±0,004 мкм при р=0,95.
або
дійсне значення зазору S у сполученні за результатами багатократних вимірів з
60 значень знаходиться у межах від 4,049 до 4,057 мкм із ймовірністю р=0,95.
Планування та обробка багатократних вимірювань
Багатократні вимірювання проводять серіями; з метою підвищення надійності проводять декілька серій. Кількість вимірювань у серії обирають наступним чином:
− виконують попередню серію з незначною кількістю вимірів;
− розраховують стандартне відхилення окремих результатів цієї серії (оцінку середнього квадратичного відхилення) за формулою:
(
)
2 1
1
i
s
x
x
n
=
−
−
;
(3)
− визначають значення коефіцієнта Стьюдента для попередньої серії (значення довірчої ймовірності обирають в залежності від вимог до точності, найчастіше р=0,95);
− розраховують граничну допустиму похибку результату
, яка визначає границі довірчого інтервалу та точність вимірів;
− розраховують оптимальну кількість вимірювань:
2 2
p
t s
n
=
(4)
Після проведення m серій перевіряють, чи містить результат грубі похибки.
Перевіряють гіпотезу: чи підпорядковується результат вимірювання нормальному закону
− при n < 10 гіпотеза не перевіряється;
− при n > 50 використовують критерій Пірсона;
− при 10 < n < 50 використовують складовий критерій;
Обчислюють результат вимірів;
Розраховують стандартне відхилення (стандартне відхилення для m серій визначають за формулою:
m
n
x
S
i j
ij
m
−
=
2
(
m
j
n
i
,
1
;
,
1
=
=
),
(5) та розраховують межі довірчих інтервалів.
Обробка результатів вимірів з використанням складового критерію (перевірка, чи відповідає закон розподілу нормальному)
➢ Обчислюють результат вимірів;
➢ Визначають стандартне відхилення за формулою (3);
➢ Перевіряють наявність грубих похибок;
➢ Розраховують критерій d за формулою:
(
)
2 1
1
1
x
x
n
x
x
n
d
i
n
i
i
−
−
=
=
(6)
➢ Перевіряють, чи виконується умова: max min
d
d
d
(7)
➢ Якщо умова виконується, гіпотезу щодо закону розподілення приймають та довірча похибка обчислюється за формулою:
p
t
s
= ,
(8) де
p
t – табличне значення коефіцієнта Стьюдента
Спосіб симетричних спостережень для виключення систематичної
похибки
Спосіб симетричних спостережень застосовується для виключення прогресивної похибки, яка є лінійною функцією часу (або іншої величини). Така функція може бути зображена у вигляді графіку.
Спосіб симетричних спостережень полягає у тому, що виміри проводять послідовно через однакові інтервали часу.
При обробці застосовують властивість результатів будь-яких двох спостережень, що симетричні відносно середньої точки
інтервалу спостережень. Ця властивість полягає у тому, що середнє значення прогресивної похибки результатів будь-якої пари симетричних спостережень дорівнює похибці, що відповідає середній точці інтервалу.
Наприклад, було проведено п’ять вимірів; вони були початі у момент t
1
(див. графік), коли похибка мала значення
1
. Отже,
3 4
2 5
1 2
2
=
+
=
+
. Кількість вимірів може бути й непарною. Тоді
2 2
2 4
3 5
2 6
1
+
=
+
=
+
. Мінімальна кількість вимірів похиб ка t, час
Графік прогресивної похибки
1
2
3
4
5
a
1
t
2
t
3
t
4
t
5
t
0
при способі симетричних спостережень – три; якщо при цьому початкова похибка дорівнює нулю, обчислення спрощуються.
Оцінка меж систематичних похибок
У деяких випадках виключення систематичних похибок є практично неможливим. В першу чергу це відноситься до тих методів, похибки яких не вивчені. Крім того, є група засобів вимірювання, систематичні похибки яких вивчені, можуть бути виміряні й визначені, проте не можуть бути використані для внесення поправок у результат виміру. До них відносяться інтегруючі засоби вимірювання, найчастіше лічильники, витратоміри тощо.
Якщо похибку неможливо виключити, навіть коли вона відома, обмежуються оцінкою меж можливих систематичних похибок. Довірча межа похибки
результату виміру – це найбільше й найменше значення похибки виміру, які обмежують інтервал, всередині якого із заданою ймовірністю знаходиться шукане
(істинне) значення похибки результату виміру.
Приклад 1. Температура яскравості злитка металу, що виміряна квазімонохроматичним пірометром у п'яти різних точках, виявилася наступній: 976,
1004, 946, 951, 988 °C. Різниця в температурах яскравості обумовлена систематичною похибкою. Оцініть найбільш ймовірне значення температури злитка, а також довірчий інтервал систематичної похибки, що відповідає довірчій ймовірності p = 0,95. Припущення:
• дійсна температура в усіх точках однакова;
• похибка розподілена за а) законом Стьюдента; б) нормальним законом.
Розв’язання
Нижню та верхню межі обчислимо за формулами:
−
= x
x
H
,
+
= x
x
B
а) якщо похибка розподілена за нормальним законом, то
p
t
s
= ; б) якщо похибка розподілена за законом Стьюдента, то
p
t
n
=
Розрахуємо вибіркове стандартне відхилення та виправлене стандартне відхилення:
(
)
2 1
22
i
B
x
x
n
=
−
,
(
)
2 1
25 1
i
B
s
x
x
n
=
−
−
Вибіркове середнє x =973, тоді а)
2,776 25 68
=
; б)
22 2,776 27 5
=
;
H
x
=973-68=905;
H
x
=973-27=946;
Оцінка меж систематичних похибок
У деяких випадках виключення систематичних похибок є практично неможливим. В першу чергу це відноситься до тих методів, похибки яких не вивчені. Крім того, є група засобів вимірювання, систематичні похибки яких вивчені, можуть бути виміряні й визначені, проте не можуть бути використані для внесення поправок у результат виміру. До них відносяться інтегруючі засоби вимірювання, найчастіше лічильники, витратоміри тощо.
Якщо похибку неможливо виключити, навіть коли вона відома, обмежуються оцінкою меж можливих систематичних похибок. Довірча межа похибки
результату виміру – це найбільше й найменше значення похибки виміру, які обмежують інтервал, всередині якого із заданою ймовірністю знаходиться шукане
(істинне) значення похибки результату виміру.
Приклад 1. Температура яскравості злитка металу, що виміряна квазімонохроматичним пірометром у п'яти різних точках, виявилася наступній: 976,
1004, 946, 951, 988 °C. Різниця в температурах яскравості обумовлена систематичною похибкою. Оцініть найбільш ймовірне значення температури злитка, а також довірчий інтервал систематичної похибки, що відповідає довірчій ймовірності p = 0,95. Припущення:
• дійсна температура в усіх точках однакова;
• похибка розподілена за а) законом Стьюдента; б) нормальним законом.
Розв’язання
Нижню та верхню межі обчислимо за формулами:
−
= x
x
H
,
+
= x
x
B
а) якщо похибка розподілена за нормальним законом, то
p
t
s
= ; б) якщо похибка розподілена за законом Стьюдента, то
p
t
n
=
Розрахуємо вибіркове стандартне відхилення та виправлене стандартне відхилення:
(
)
2 1
22
i
B
x
x
n
=
−
,
(
)
2 1
25 1
i
B
s
x
x
n
=
−
−
Вибіркове середнє x =973, тоді а)
2,776 25 68
=
; б)
22 2,776 27 5
=
;
H
x
=973-68=905;
H
x
=973-27=946;
B
x
=973+68=1041.
B
x
=973+27=1000.
Знайдемо довірчий інтервал для стандартного відхилення, скориставшись формулою:
0 < ???? < ????(1 + ????), (???? > 1)
де S – виправлене стандартне відхилення, яке знаходять за формулою
???? =
√
∑ ????
????
(????
????
−????
????
)
2
????−1
;
q знаходять за таблицею (додаток 2) за заданими n (кількість дослідів) i заданого p.
Для даного прикладу q=1,37, тоді
H
x
=0;
B
x
=25(1+1,37)≈58.
Розрахунок похибки при непрямих вимірах
Якщо
(
)
1 2
,
,
,
,
k
y
f x x
x
=
, то
(
)
2 1
2 1
,
,
,
k
k
y
i
i
i
f x x
x
x
x
=
=
,
Де
і
х
може бути як середньою квадратичною, так і граничною похибкою.
Приклад 2. При градуюванні витратоміра були отримані наступні значення: i
1 2
3 4
5 6
7 8
9
τ, с 97,5 94,8 94,7 95,2 94,9 95,3 91,1 95,2 95,3
Об'єм баку 500±0,1 л. Похибка вимірювання часу становить 0,32 сек.
Розрахуйте похибку, з якою проводилось вимірювання витрати.
Розв’язання.
t
V
Q =
,
2 2
+
=
t
t
Q
V
V
Q
Q
t
V
Q
1
=
,
2
t
V
t
Q =
2 2
2 1
+
=
t
t
V
V
t
Q
,
+
+
+
=
9 3
,
95 8
,
94 5
,
97
t
95 c.
+
=
2 2
2 32
,
0 95 500 95 1
,
0
Q
0,0178л/с
Оцінка результатів, які містять промахи або грубі похибки
Одним з простих способів аналізу результатів, що містить похибку, є правило трьох сігм. У виробничих умовах додатково аналізують результати вимірювань, які перевищують 3,5
або 4
(
- стандартне відхилення).
При малій кількості спостережень найбільш точні результати дозволяє отримати критерій Романовського, який базується на розподіленні Стьюдента.
Критерій Романовського. Нехай було проведено (n+1) вимір; при цьому n результатів не викликають сумніву, а один здається таким, що порушує цей ряд.
Цей результат позначають як
1
n
x
+
. Для інших значень (від
1
x
до
n
x
) розраховують середнє значення x та стандартне відхилення
Далі знаходять розрахункове значення критерію:
розр
t
=
, та табличне
табл
t
при відомих n та р. Якщо
розр
t
>
табл
t
, то це значення виключають з ряду.
Приклад 3. Під час вимірювань температури отримано такі результати: i
1 2
3 4
5 6
7 8
9
T, °C
96 98 93 95 97 98 96 98 97
Перевірити, чи містить результат грубі похибки:
Значення Т=93°C здається таким, що порушує ряд вимірів. Позначимо його як
9
x
. Для інших значень розрахуємо середнє значення та стандартне відхилення:
x
=96,88;
=1,053.
Розрахункове значення критерію:
розр
t
=3,68.
Табличне значення:
табл
t
=2.17.
Оскільки
розр
t
=3,68>
табл
t
=2.17, то значення Т=93 відкидаємо.
Кореляційний аналіз
Нехай дослідні дані, отримані для вивчення залежності між випадковими величинами Х і Y такі, що кожному значенню Х відповідає декілька значень Y.
Наприклад, при X = x
1
величина Y набула значень y
1
, y
2
, …, y k
, і навпаки, кожному значенню Y відповідає кілька значень Х.
Залежність, за якої кожному значенню однієї з випадкових величин відповідає ряд розподілу іншої, а також зі зміною однієї величини закономірно змінюються статистичні характеристики рядів розподілення іншої величини, називають
статистичною. Кореляційна залежність є окремим випадком статистичної залежності, коли у разі зміни однієї з величин змінюється середнє значення іншої.
Вивчення залежності між двома змінними можливо за допомогою так званих
діаграм розсіювання (точкових діаграм) – це тип графіка або математичної діаграми, що використовує декартові координати для відображення значень зазвичай двох змінних з набору даних. Дані відображаються як сукупність точок
(рис. 1, а). На одній діаграмі можна розмістити одну
1
або декілька додаткових змінних, якщо точки інших змінних закодовані
2
(рис. 1, б). а) б)
Рис. 1 - Діаграми розсіювання
Досліджувані змінні можуть відноситися до:
− характеристики якості і фактору, який впливає на характеристику; наприклад, швидкість фільтрування та степінь очищення води;
− двом різним характеристикам якості; наприклад, прозорість та каламутність води;
− двом факторам, що впливають на одну характеристику якості; наприклад, значення рН та температура.
Приклади діаграм розсіювання представлені на рис. 2.
1
Рекомендується розміщувати не більше однієї додаткової змінної.
2
тобто мають інший колір/форму/розмір
а) б) в) г)
Рис. 2 - Приклади діаграм розсіювання
Метод, який дає можливість приймати рішення щодо існування кореляції між двома змінними шляхом побудови діаграм розсіювання і розрахунку коефіцієнта кореляції, має назву кореляційний аналіз.
Наявність (чи відсутність) зв’язку між випадковими величинами X та Y, а також силу (тісноту) зв’язку характеризують коефіцієнтом кореляції r xy
. Коефіцієнт
кореляції – безрозмірна величина (причому |r xy
|<=1), яку використовують для оцінки тісноти тільки лінійного зв’язку між величинами Х і Y: чим ближче абсолютна величина коефіцієнта кореляції до одиниці, тим зв’язок сильніше; чим ближче значення |r xy
| до нуля, тим зв’язок слабкіше.
x
y
0
x
y
0
x
y
0
Рис. 2 - Приклади діаграм розсіювання
Метод, який дає можливість приймати рішення щодо існування кореляції між двома змінними шляхом побудови діаграм розсіювання і розрахунку коефіцієнта кореляції, має назву кореляційний аналіз.
Наявність (чи відсутність) зв’язку між випадковими величинами X та Y, а також силу (тісноту) зв’язку характеризують коефіцієнтом кореляції r xy
. Коефіцієнт
кореляції – безрозмірна величина (причому |r xy
|<=1), яку використовують для оцінки тісноти тільки лінійного зв’язку між величинами Х і Y: чим ближче абсолютна величина коефіцієнта кореляції до одиниці, тим зв’язок сильніше; чим ближче значення |r xy
| до нуля, тим зв’язок слабкіше.
x
y
0
x
y
0
x
y
0
Якщо r xy
>0, говорять про додатню кореляцію (у разі зростання однієї з величин інша має тенденцію у середньому до зростання, як показано на Рис. 2, а та б); якщо r xy
<0,
- про від’ємну кореляцію (за зростання однієї з величин інша має тенденцію у середньому до спадання – Рис. 2, в).
Розрахунок коефіцієнту кореляції:
xy
xy
xx
yy
S
r
S
S
=
,
(9) де n – кількість пар даних
(
)
=
=
=
−
=
−
=
n
i
n
i
i
i
n
i
i
xx
n
x
x
x
x
S
1 2
1 2
1 2
,
(
)
=
=
=
−
=
−
=
n
i
n
i
i
i
n
i
i
yy
n
y
y
y
y
S
1 2
1 2
1 2
,
(
) (
)
=
=
=
=
−
=
−
−
=
n
i
n
i
i
n
i
i
i
i
n
i
i
i
xy
n
x
x
y
x
y
y
x
x
S
1 1
1 1
,
Величину S
xy називають коваріацією.
Кореляційну залежність У від Х можна визначити як функціональну залежність умовної середньої
y
від х:
( )
( )
x
f
x
y
=
Таке рівняння називають рівнянням регресії У на Х (чи Х на У); функцію
( )
x
f
–
регресією У на Х (чи Х на У); а її графік – лінією регресії У на Х (чи Х на У).
Процедуру відшукання зв’язку між У та Х у вигляді лінії регресії, називається
регресійним аналізом.
У випадку лінійної кореляції рівняння лінії регресії У на Х має вигляд:
Y
a
b X
= + , де a - вільний член (константа); b - коефіцієнт регресії (кутовий коефіцієнт).
Коефіцієнти цієї функції знаходять за алгоритмом:
Крок 1. Знайти
x
та
y
Крок 2. Розрахувати S
xх
та S
хy
Крок 3. Знайдіть b за формулою
xy
S
b
Sxx
=
, а a - за формулою
a
y
b x
= −
Аналогічно, рівняння лінії регресії Х на У має вигляд:
Y
c
d X
= + , де c і d – коефіцієнти.
Приклад 4. На одному з підприємств хімічної галузі проводили аналіз взаємозв’язку між рентабельністю виробництва (Х, %) та преміями на 1 працівника (У, тис. грн.). Результати досліджень наведені у таблиці:
Розрахуйте коефіцієнт кореляції та оцініть тісноту зв’язку між Х та У. Побудуйте діаграму розсіювання та розрахуйте коефіцієнти лінії регресії Х на У.
Розв’язок.
Розрахуємо середні значення Х та У:
16 15 18 13,71 12
x
+
+
+
=
=
,
2,5 2,4 2,9 2,20 12
y
+
+
+
=
=
Далі розрахуємо S
xх
та S
хy
:
(
)
(
) (
)
(
)
2 2
2 2
1 16 13,71 15 13,71 18 13,71 9,52
n
xx
i
i
S
x
x
=
=
−
=
−
+
−
+
−
=
,
(
)
(
) (
)
(
)
2 2
2 2
1 2,5 2, 2 2, 4 2, 2 2,9 2, 2 0,19
n
yy
i
i
S
y
y
=
=
−
=
−
+
−
+
+
−
=
,
(
) (
) (
) (
) (
) (
)
(
) (
)
1 16 13,71 2,5 2, 2 15 13,71 2, 4 2, 2 18 13,71 2,9 2, 2 1, 29;
n
xy
i
i
i
S
x
x
y
y
=
=
−
−
=
−
−
+
−
−
+
+
−
−
=
тоді коефіцієнт кореляції:
1, 29 0,95 9,52 0,19
xy
xy
xx
yy
S
r
S
S
=
=
=
Значення r xy
> 0, тобто зі зростанням премії рентабельність теж зростає; також отримане значення досить близько до одиниці; отже, зв’язок між рентабельністю виробництва та преміями досить тісний.
Побудуємо діаграму розсіювання та розрахуємо коефіцієнти лінії регресії Х на У:
1, 29 0,1356 9,52
xy
xx
S
b
S
=
=
=
,
2,2 0,1356 13,71 0,3375
a
y
b x
= − =
−
=
Тоді рівняння регресії матиме вигляд:
0,3375 0,1356
y
x
=
+
Рис. 3. Діаграма розсіювання
Контрольні запитання
1. Поняття наближеного числа.
2. Правила округлення чисел.
3. Відносна й абсолютна похибки.
4. Систематичні та випадкові похибки.
5. Алгоритми визначення похибок та способи оцінки результатів, що містять похибки.
6. Яку залежність називають кореляційною?
7. Поняття кореляційної залежності.
8. Поняття лінії регресії.
9. Що характеризує коефіцієнт вибіркової кореляції і які значення може приймати?
10. Кореляційна таблиця. Як вона створюється і як використовувати записані там дані?
11. Від’ємна і додатна лінійна кореляція.
12. Граничні значення коефіцієнта кореляції та їх сенс для оцінювання сили зв’язку між величинами.
13. Поняття умовних середніх.
Задача 1. За наведеним даними перевірте, чи містить результат грубі похибки.
Таблиця 1.
Номер
варіанту
Величина, що
вимірюється
Результати вимірювань
q
1
q
2
1 рН, од. рН
7 10 12 13 11 10 12 0.01 0.05 2 рН, од. рН
12 7
12 13 10 11 13 0.05 0.1 3 рН, од. рН
12 11 7
13 10 10 12 0.01 0.05 4 рН, од. рН
10 12 13 7
10 10 13 0.05 0.1 5 рН, од. рН
11 12 13 12 7
10 11 0.01 0.05 6
Вміст SiO
2
у зразках сілікату, %
64.03 64.58 64.6 65.07 65.16 62.52 65.41 0.05 0.1 8
Вміст Ni у зразках сталі, %
1.54 1.55 1.57 1.61 1.61 1.63 1.73 0.01 0.05 9
Вміст Ni у зразках сталі, %
1.75 1.64 1.64 1.64 1.65 1.65 1.7 0.05 0.1 10
Вміст Ni у зразках сталі, %
1.7 1.76 1.73 1.71 1.71 1.72 1.7 0.01 0.05 11
Вміст Ni у зразках сталі, %
1.73 1.73 1.71 1.74 1.74 1.74 1.73 0.01 0.05 12
Вміст Ni у зразках сталі, %
1.54 1.55 1.56 1.53 1.57 1.58 1.57 0.05 0.1 13
Вміст Ni у зразках сталі, %
1.6 1.6 1.6 1.62 1.57 1.62 1.62 0.01 0.05 14
Вміст діючої речовини у суміші, мкг
50.71 51.53 53.28 54.29 55.38 59.93 55.44 0.05 0.1 15
Вміст діючої речовини у суміші, мкг
58.24 61.14 61.19 61.47 61.57 61.66 55.2 0.01 0.05 16
Вміст діючої речовини у суміші, мкг
57.53 63.1 63.22 64.85 65.91 65.93 62.69 0.05 0.1 17
Вміст вуглецю в пробі органічної речовини, %
40.02 39.64 40.31 40.36 40.37 40.37 40.25 0.01 0.05
Сірим кольором виділено значення, яке здається сумнівним
Задача 2. Розрахуйте, скільки треба провести вимірювань, щоб випадкова похибка
не перевищувала * 0,1
(0.01
**
) з ймовірністю р
1
=1-q
1
p
2
=1-q
2
***
, якщо попередньо було проведено серію з n дослідів. Результати попередньої серії вимірювань наведені у Задачі 1.
Задача 3. Результати вимірювань фізичної величини представлені у табл. 1, причому різниця у виміряних значеннях обумовлена систематичною похибкою.
Знайдіть довірчий інтервал систематичної похибки, що відповідає довірчій ймовірності p. Для парних варіантів прийняти, що похибка розподілена за законом
Стьюдента, p = 0,95. Для непарних варіантів прийняти, що похибка розподілена за нормальним законом, p = 0,99.
Задача 4. За даними таблиці 2 індивідуального завдання побудуйте діаграму розсіювання, розрахуйте коефіцієнт кореляції та коефіцієнти ліній регресії У на Х та Х на У, якщо рівняння мають вигляд:
y
a
b x
= +
x
c
d y
= +
Зробіть висновок щодо наявності та тісноти кореляційного зв’язку за отриманими результатами.
Для варіантів №№ 1-6 та 14-16.
**
Для всіх інших варіантів.
***
Якщо у серії попередніх вимірювань є промах (груба похибка), цей результат слід виключити з ряду.
Додаток 1. Значення критерія Романовського
q n =4 n = 6 n = 8 n
=
10 n
=
12 n
=
15 n
=
20 0,01 1,73 2,16 2,43 2,62 22,75 2,90 3,08 0,02 1,72 2,13 2,37 2,54 2,66 2,80 2,96 0,05 1,71 2,10 2,27 2,41 2,52 2,64 2,78 0,10 1,69 2,00 2,17 2,29 2,39 2,49 2,62
Додаток 2. Таблиця значень
n
p
0,95 0,99 0,999 5
1,37 2,67 5,64 6
1,09 2,01 3,88 7
0,92 1,62 2,98 8
0,80 1,38 2,42 9
0,71 1,20 2,06 10 0,65 1,08 1,80 11 0,59 0,98 1,60 12 0,55 0,90 1,45 13 0,52 0,83 1,33 14 0,48 0,78 1,23 15 0,46 0,73 1,15 16 0,44 0,70 1,07 17 0,42 0,66 1,01 18 0,40 0,63 0,96 19 0,39 0,60 0,92 20 0,37 0,58 0,88 25 0,32 0,49 0,73 30 0,28 0,43 0,63 35 0,26 0,38 0,56 40 0,24 0,35 0,50 45 0,22 0,32 0,46 50 0,21 0,30 0,43 60 0,188 0,269 0,38 70 0,174 0,245 0,34 80 0,161 0,226 0,31 90 0,151 0,211 0,29 100 0,143 0,198 0,27 150 0,115 0,160 0,211 200 0,099 0,136 0,185 250 0,089 0,120 0,162