< Попер   ЗМІСТ   Наст >

Похибки вибіркових обстежень підприємств

У загальному випадку розбіжності між даними будь-якого статистичного спостереження і дійсним значенням показників вважають помилками спостереження. Існують різні підходи до класифікації таких помилок. За причинами виникнення розрізняють помилки реєстрації та похибки вибірки (похибки репрезентативності).

Помилками реєстрації називають ті, що виникли внаслідок неправильного встановлення фактів або неправильного їх запису. Вони можуть бути як випадковими, так і систематичними. Випадкові помилки є наслідком випадкових причин і, своєю чергою, спричиняють спотворення даних у той чи інший бік. їх допускають як респонденти у статистичних формулярах, так і статистики, які оперують даними при їх введенні, передачі, редагуванні чи кодуванні.

Як правило, випадкові похибки спостереження виявляються ретельними перевірками та контролем вірогідності даних. Насамперед здійснюють зовнішній контроль формулярів спостереження, перевіряють правильність їх оформлення, зокрема виразність і повноту записів, охоплення всіх одиниць спостереження.

Систематичні помилки реєстрації призводять до значних спотворень загальних підсумків статистичного спостереження, іноді вони є наслідком недостатньо чітко сформульованої програми спостережень. Вони бувають навмисні і ненавмисні. Систематичні навмисні похибки реєстрації виникають унаслідок свідомого, навмисного викривлення фактів. Це, наприклад, навмисно подані у звітах недостовірні дані. Службові особи, винні у несвоєчасному поданні або спотворенні даних державних статистичних спостережень, притягаються до адміністративної відповідальності.

Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності. Оскільки вибіркова сукупність неточно відтворює структуру генеральної, то вибіркові оцінки також не збігаються з характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності. За причинами виникнення ці похибки також поділяють на систематичні (тенденційні) та випадкові. Систематичні похибки виникають через те, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Для всіх елементів сукупності вони мають односторонній напрям і тому їх ще називають похибками зміщення.

Випадкові похибки - це наслідок випадковості відбору елементів сукупності для обстеження.

При організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Випадкових похибок уникнути неможливо, проте на основі теорії вибіркового методу можна обчислити їх значення, і, по можливості, регулювати.

Більш детальну класифікацію помилок, які можуть виникнути при обстеженні підприємств, визначають Методологічні положення щодо підготовки звітів з якості даних річного вибіркового структурного обстеження малих підприємств в [16]. Згідно з ними, за джерелами походження похибки обстежень підприємств поділяються на невибіркові (не пов'язані з вибіркою) та вибіркові (похибки репрезентативності). Для суцільного обстеження властиві лише невибіркові похибки, а для вибіркового - як невибіркові, так і вибіркові похибки (рис. 3.1).

Невибіркові похибки - це похибки, які виникають з причин, що непов'язані з випадковим відбором одиниць для обстеження.

Похибки моделювання зазвичай не розглядають як окремий тип похибок. Моделі переважно використовуються саме для того, щоб зменшити інші похибки, тобто вони є похідним типом похибок і не розглядаються окремо.

Похибки вибірки (репрезентативності) виникають через те, що у вибіркових обстеженнях здійснюється відбір для обстеження лише частини сукупності. Вибіркова похибка відображає той факт, що оцінка може бути іншою, коли відбирається інша вибірка, за інших незмінних умов.

Типи похибок за джерелами походження в обстеженнях підприємств

Рис. 3.1. Типи похибок за джерелами походження в обстеженнях підприємств

Як уже зазначалося у підрозділі 3.1, у вибіркових обстеженнях розрізняють граничну (А) і стандартну (ц) похибки вибірки, що пов'язані між собою формулою

Стандартна похибка вибірки ц є середнім квадратичним відхиленням вибіркових точкових оцінок: вибіркової середньої х або вибіркової частки м> від значень відповідних параметрів генеральної сукупності.

При відборі за схемою поверненої кулі - повторному відборі стандартну похибку вибірки обчислюють за формулою (3.2), а при відборі за схемою неповерненої кулі - без повторному за формулою (3.3).

У європейській практиці для оцінювання якості вибіркових оцінок як критерій точності використовують відносну похибку вибірки (коефіцієнт варіації).

Коефіцієнт варіації - це відносна стандартна похибка, яка визначається шляхом ділення стандартної похибки в абсолютному значенні на очікуване значення оцінки показника і виражається як коефіцієнт або у відсотках:

Обчислення відносної стандартної похибки рекомендується для додатних кількісних показників і не рекомендується для відносних величин, особливо часток, величин динаміки, тому що в цих випадках дуже легко неправильно зрозуміти її зміст. Наприклад, при вибіркових обстеженнях малих підприємств в Україні для характеристики точності вибіркових оцінок використовують порогові значення коефіцієнтів варіації, наведені у табл. 3.5.

Таблиця 3.5. Категорії точності оцінок у вибіркових обстеженнях малих підприємств

Категорія точності/надійності

Відносна стандартна похибка вибірки (коефіцієнт варіації),%

Рівень точності/надійності

А

не більше 5

високий

Б

від 5,1 до 10

достатній

В

від 10,1 до 15

задовільний

Г

від 15,1 до 25

низький (придатні лише для якісного аналізу)

Д

більше 25

незадовільний (малопридатні до аналізу)

Гранична похибка вибірки (А =щ) - це максимально можлива похибка для прийнятої ймовірності Р. Довірче число - вказує, як співвідносяться гранична та стандартна похибки. Найчастіше вживані значення і наведено в табл. 3.1. Розмір граничної похибки середньої величини і частки обчислюється за такими формулами для відбору:

Як видно з формул 3.19 і 3.20, значення граничної похибки залежить від варіації ознаки в генеральній сукупності (дисперсії), яку приймають рівною вибірковій а2, обсягу вибірки п та її частки у генеральній сукупності пШу а також прийнятого рівня ймовірності, якому відповідає квантиль ї.

Виходячи з того, що гранична похибка вибірки для ймовірності Р є максимальним відхиленням значень вибіркової оцінки від характеристики генеральної сукупності, можливі межі значень останньої визначають так:

де х і х - середні значення ознаки, відповідно, генеральної і вибіркової сукупностей; р і © - частки елементів, відповідно, генеральної і вибіркової сукупностей, які мають певні значення ознаки.

Наведені формули розрахунку похибок спостереження використовуються за простого випадкового відбору. Якщо вибірка формується в інший спосіб, його особливості враховують за допомогою формул, наведених у підрозділі 3.2.

 
< Попер   ЗМІСТ   Наст >