< Попер   ЗМІСТ   Наст >

Принцип перевірки нуль-гіпотези

Припустимо, що є випадкова вибірка, яка складається з п 1 шкіл області А і п 2 шкіл області В, де успішність учнів відповідно становить %1 і %2. Треба визначити, чи є спостережувана відмінність між %1 і х2 вказівкою на істотну різницю між середніми вибірковими сукупностей або ж її можна вважати результатом простої вибіркової варіації. Насамперед ми висуваємо нуль-гіпотезу про те, що середні дані є ідентичними, і піддаємо цю гіпотезу статистичній перевірці.

Основний принцип процесу дослідження полягає в тому, що ми ніколи не можемо довести істинність нуль-гіпотези. Навіть тоді, коли вибірки, взяті з області А і з області В, дадуть однакові середні, ми не можемо бути впевненими в істинності нуль-гіпотези.

А чи не можемо ми довести, що вона невірна? У даному разі статистичний висновок виявляється більш переконливим. Найкращим доказом відмінності двох генеральних сукупностей є відмінність між вибірками. Невелика відмінність, напевно, не дуже переконлива, однак, якщо вона стає все більшою і більшою, можливість відокремлення сукупностей все зростає. Якщо відмінність між вибірками настільки велика, що стає малоймовірним одержання їх з однієї генеральної сукупності, ми можемо з практичною достовірністю заперечити нуль-гіпотезу. Рішення: прийняти або заперечити нуль-гіпотезу, очевидно, мають імовірнісний характер. Достовірність рішення пропорціонально імовірності того, що відмінності між вибірками, принаймні які експериментально спостерігаються, можуть бути одержані випадково, якщо допустити істинність нуль-гіпотези.

Належність варіантів до сукупності

Найбільш простим критерієм для визначення належності варіанти до сукупності є правило трьох сигм, згідно якому вважається, що варіанта х належить до сукупності, якщо вона відрізняється від вибіркового середнього х не більше ніж на три середніх квадратичних відхилення а*х, тобто

При невиконанні умови (6.13) розглянута варіанта вважається анормальною і виключається з вибірки.

Приклад. При визначенні часу, який необхідний на виконання конкретного завдання учнями, отримані наступні 12 значень (в хв. ): 4,6; 3,8; 4,2; 5,1; 4,4; 3,9; 7, 8; 5,3; 4,5; 4,7; 5,2; 4,1. Необхідно визначити, чи не є деякі з отриманих значень анормальними внаслідок грубих помилок або особливих умов спостережень.

1. Визначається вибіркове середнє і середнє квадратичне відхилення результатів вимірів:

х =-(4,6 + 3,8 + 4,2 + 5,1 + 4,4 + 3,9 + 7,8 + 5,3 + 4,5 + 4,7 + 5,2 + 4,1)=4, 80;

а'1 = -(4,62 +3,82 +4,22 +5,12 +4,42 +3,92 +7,82 +5,32 +4,52 +4,72 +5,22 ++

4,12)-4,802=24,03-23,04=0,99;

<т*х = 0,995.

2. Перевіряється виконання умови для найбільшого значення хтах = 7,8:

Через те що умова (6.13) в даному випадку не виконується, значення хтах = 7,8 бажано виключити з вибірки.

Умова (6.13) дозволяє визначати належність того або іншого значення змінної до сукупності лише в самому першому наближенні. Більш точне вирішення завдання пов'язане з врахуванням обсягу вибірки і здійснюється за допомогою критерію грубих помилок. Згідно цьому критерію, сумнівний результат хі слід виключити з вибірок, якщо вірогідність того, що максимальне з п значень вибірки буде більше хі (або мінімальне з п значень буде менш хі) достатньо мала. Вказана вірогідність визначається за нормованим відхиленням розглянутого значення

та обсягу вибірки п за допомогою таблиці Додатку А.3, складеної на основі вивчення функцій розподілу величин V та V! за умови нормального розподілу змінної х.

Приклад. За даними попереднього прикладу за допомогою критерію грубих помилок визначити, чи можна вважати значення хтах = 7,8 таким, що належить до тієї ж сукупності, що й інші члени вибірки.

1. За знайденими в попередньому прикладі вибірковими характеристиками х та ах визначається нормоване відхилення значення хтах = 7,8:

2. За допомогою таблиці Додатку А.3 для V = 3,02 при п = 12 знаходимо р < 0,01. Отже, є достатні підстави вважати значення хтах = 7,8 наслідком грубої помилки або особливих умов спостереження.

 
< Попер   ЗМІСТ   Наст >