< Попер   ЗМІСТ   Наст >

Репрезентативні та нерепрезентативні вибірки

Є два основні типи вибірок: репрезентативні та нерепрезентативні. Що це означає та чому важливо їх розрізняти?

Репрезентативною вибірковою сукупністю (від англ, represent – представляти) є така, що дає нам можливість поширити як якісні, так і кількісні[1] результати її дослідження на певну більшу сукупність. У контексті опитувань громадської думки репрезентативна вибірка – це та, що дає нам можливість поширити кількісні результати інтерв'ю не лише на учасників дослідження, а й на багатьох інших людей.

Наприклад, на основі опитування ми довідалися, що думку X мають 18% респондентів, які потрапили до нашої вибірки, репрезентативної для дорослого населення України. Отже, можемо сказати, що приблизно[2] 18% дорослого населення України має думку X. Якби вибірка була нерепрезентативною, то ми могли б хіба що висловити припущення: "меншість дорослого населення України має думку X", "менш як третина має думку X", "менш як чверть має думку X". Але ці припущення змогли б перевірити лише завдяки репрезентативному опитуванню. Отже, у контексті дослідження поглядів людей нерепрезентативна вибірка – це та вибірка, кількісні результати дослідження якої не можна поширювати на інших людей, окрім тих, які взяли участь у дослідженні. Або загальніше: нерепрезентативна вибіркова сукупність – це та, що не дає можливості поширити кількісні результати її дослідження на певну більшу сукупність.

Уявімо, що теплого літнього дня ми виходимо на вулицю та опитуємо 10 перехожих біля нашого помешкання або офісу, чи подобається їм така погода, як зараз. Нехай 7 скажуть, що подобається; 1 вагатиметься з відповіддю, 2 зазначать, що не люблять такої погоди й почуваються комфортніше за нижчої температури. На основі цього опитування ми не зможемо стверджувати, що 70% людей подобається така погода, як зараз. І навіть не зможемо бути впевненими, що більшості людей подобається така погода, як зараз. Ми можемо висловити припущення, що більшості вона подобається, але не можемо знати напевно. Це була нерепрезентативна вибірка.

Одне з помилкових уявлень про вибірки: будь-яка велика вибірка є репрезентативною; чим більше опитаємо, тим вона більш репрезентативна. Це не так. Якщо ми продовжимо наше вуличне опитування про погоду, поки не опитаємо 100 чи навіть 1000 осіб, усе одно не зможемо нічого впевнено сказати про тих, кого не спитали. Чому так? Хіба 100, а тим паче 1000 осіб недостатньо, щоб зробити певні висновки про вподобання інших?

Річ у тім, що для забезпечення репрезентативності важлива не лише кількість респондентів, а й те, як саме і'х було відібрано. У наведеному вище прикладі ми не продумували, кого, де та як відбираємо, а просто почали спілкуватися з перехожими. Озирнімося довкола. Можливо, ми перебуваємо поблизу університету в навчальний день? Тоді серед перехожих здебільшого молоді люди, які загалом легше переносять високу температуру, ніж старші, й через це відсоток задоволених погодою може виявитися штучно завищеним. Або, можливо, ми потрапили туди, де серед перехожих більше літніх людей, яким, імовірно, важко переносити задуху спекотних літніх днів? Тоді відсоток задоволених погодою може виявитися заниженим порівняно з усіма мешканцями населеного пункту.

  • [1] Поняття кількісної та якісної інформації докладно пояснено в розділі 3.
  • [2] Говоримо "приблизно", оскільки результати дослідження репрезентативних вибірок є імовірнісними: з певною імовірністю похибка результату не перевищує певне значення, що буде пояснено далі в цьому розділі.
 
< Попер   ЗМІСТ   Наст >