Надійність психологічного тесту

Суспільство 24 грудня 2023

Надійністю називається один з критеріїв якості тесту, його стійкість по відношенню до похибок вимірювання. Розрізняють два види надійності - надійність як стійкість і надійність як внутрішню узгодженість.

Надійність як стійкість
Надійність як внутрішня узгодженість
Метод розщеплення (Split-half reliability)
Метод еквівалентних бланків
Альфа Кронбаха
Надійність і валідність

Надійність як стійкість

Стійкість результатів тесту - можливість отримання однакових результатів у випробовуваних у різних випадках.

Стійкість визначається за допомогою повторного тестування (ретесту):

У даному методі пропонується провести кілька замірів з деяким проміжком часу (від тижня до року) одним і тим же тестом. Якщо кореляція між результатами різних замірів буде високою, отже, тест досить надійний. Однак надійність не всіх тестів можна перевіряти цим методом, оскільки оцінювана якість, явище або ефект можуть бути самі по собі нестабільні (наприклад, наш настрій, який може змінюватися від одного заміру до наступного). Ще один недолік МР - це ефект звикання. Випробовувані вже знайомі з цим тестом, а можливо, навіть пам'ятають більшу частину своїх відповідей після попереднього заповнення.

Надійність як внутрішня узгодженість

Внутрішня узгодженість визначається зв'язком кожного конкретного елемента тесту із загальним результатом, тим, наскільки кожен елемент входить у протиріччя з іншими, наскільки кожне окреме питання вимірює ознаку, на яку спрямований весь тест.

Для перевірки внутрішньої узгодженості застосовуються:

Метод розщеплення або метод автономних частин
Метод еквівалентних бланків
Альфа Кронбаха

Метод розщеплення (Split-half reliability)

Цей метод полягає в розщепленні/поділі тесту на дві рівні частини (наприклад, парні і непарні питання, перша і друга половина), а потім знаходиться кореляція між ними. Якщо кореляція висока, тест можна вважати надійним.

Метод еквівалентних бланків

МЕБ полягає в застосуванні двох порівнянних один з одним форм тесту для великої вибірки (наприклад, форми L і M для вимірювання в шкалі інтелекту Стенфорда-Біні)

Результати, отримані при виконанні двох форм, порівнюють і вираховують кореляцію. Якщо коефіцієнт кореляції високий, отже, тест надійний. Брак цього методу в тому, що він передбачає такий тривалий і трудомісткий процес, як створення двох еквівалентних форм.

Альфа Кронбаха

У цьому методі, запропонованому Лі Кронбахом, порівнюється розкид кожного елемента із загальним розкидом всієї шкали. Якщо розкид результатів тесту менший, ніж розкид результатів для кожного окремого питання, отже, кожне окреме питання спрямоване на дослідження однієї й тієї самої ознаки, властивості або явища. Вони виробляють значення, яке можна вважати справжнім. Якщо таке значення виробити не можна, тобто виходить випадковий розкид при відповіді на питання, тест не надійний і коефіцієнт альфа Кронбаха буде дорівнювати 0. Якщо ж усі питання вимірюють одну й ту саму ознаку, то тест надійний і коефіцієнт альфа Кронбаха в цьому випадку дорівнюватиме 1.

Крім надійності тестів, є також надійність спостереження - міжспостережувальна надійність. МН - це відсоток збігу результатів спостереження експертів один з одним.

Надійність і валідність

Надійність показує, що результати проведеного дослідження близькі до істини, а валідність показує, що результати дійсно відносяться до того явища, яке вивчається дослідником. Валідне дослідження автоматично є надійним, проте зворотне слідство не обов'язково. Надійне дослідження може і не бути валідним.