Вибірка - безліч випадків (випробовуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних з генеральної сукупності для участі в дослідженні.
Об "єм вибірки
Обсяг вибірки - число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб число випадків становило не менше 30 - 35.
Залежні і незалежні вибірки
При порівнянні двох (і більше) вибірок важливим параметром є їх залежність. Якщо можна встановити гомоморфну пару (тобто, коли одному випадку з вибірки X сооветствует один і тільки один випадок з вибірки Y і навпаки) для кожного випадку в двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваного на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:
- пари близнюків,
- два вимірювання будь-якої ознаки до і після експериментального впливу,
- чоловіки і дружини
- тощо.
У разі, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад:
- чоловіки і жінки,
- психологи та математики.
- Відповідно, залежні вибірки завжди мають однаковий обсяг, а обсяг незалежних може відрізнятися.
Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:
- t-критерій Стьюдента
- T-критерій Вілкоксона
- U-критерій Манна-Вітні
- Критерій знаків
- та ін.
Репрезентативність
Вибірка може розглядатися як репрезентативна або нерепрезентативна.
Приклад нерепрезентативної вибірки
У США одним з найбільш відомих історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році. Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх передбаченнях, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним за телефонними книгами всієї країни, і людям з реєстраційних списків автомобілів. У 25% бюлетенів (майже 2,5 мільйона) голоси були розподілені наступним чином:
57% віддавали перевагу кандидату-республіканцю Альфу Лендону
40% обрали чинного на той час президента-демократа Франкліна Рузвельта
На дійсних виборах, як відомо, переміг Рузвельт, набравши понад 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, - оскільки їм було відомо, що більшість їхніх передплатників вважають себе республіканцями, - вони розширили вибірку за рахунок людей, обраних з телефонних книг і реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії володіти телефонами і автомобілями могли собі дозволити в основному представники середнього і верхнього класу (тобто більшість республіканців, а не демократів).
Види плану побудови груп з вибірок
Виділяють кілька основних видів плану побудови груп:
- Дослідження з експериментальною і контрольною групами, які ставляться в різні умови.
- Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
- Дослідження з використанням тільки однієї групи - експериментальної.
- Дослідження з використанням змішаного (факторного) плану - всі групи ставляться в різні умови.
Стратегії побудови груп
Відбір груп для їх участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої і зовнішньої валідності
- Рандомізація (випадковий відбір)
- Попарний відбір
- Стратометричний відбір
- Наближене моделювання
- Залучення реальних груп
Рандомізація
Рандомізація, або випадковий відбір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити до вибірки. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вишу, можна скласти папірці з іменами всіх студентів вишу в капелюх, а потім дістати з неї 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).
Попарний відбір
Попарний відбір - стратегія побудови груп вибірки, при якому групи випробовуваних складаються з суб'єктів, еквівалентних за значущими для експерименту побічними параметрами. Ця стратегія ефективна для експериментів з використанням експериментальних і контрольних груп з кращим варіантом - залученням близнюкових пар (моно- і дизиготних), оскільки дозволяє створити...
Стратометричний відбір
Страт (або кластерів) - це рандомізація з виділенням. При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що володіють певними характеристиками (стать, вік, політичні уподобання, освіта, рівень доходів та ін.), і відбираються випробовувані з відповідними характеристиками.
Наближене моделювання
Наближене моделювання - складання обмежених вибірок і узагальнення висновків про цю вибірку на більш широку популяцію. Наприклад, за участю в дослідженні студентів 2-го курсу університету, дані цього дослідження поширюються на «людей у віці від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.