Ким В.С., Тестирование учебных достижений. - Уссурийск, 2007

1.5. НАДЕЖНОСТЬ И ВАЛИДНОСТЬ ТЕСТА

Под надежностью, или релиабильностью,  измерения понимается степень надежности, или точности, с какой может быть измерен тот или иной конкретный признак19. Надежность теста характеризует воспроизводимость его результатов. Отметим, что определяя надежность теста, следует иметь в виду, что измерение не может быть стабильнее измеряемой латентной переменной. Если переменная очень лабильна, то ее измерение в принципе не может характеризоваться высокой повторяемостью.

Научно обоснованный тест - это метод, соответствующий установленным стандартам надежности и валидности26. Если тест имеет низкие надежность и валидность, то использовать его нельзя.

Надежность характеризуется коэффициентом надежности. Коэффициент надежности, это корреляционный коэффициент, показывающий степень совпадения результатов тестирования осуществленного в одинаковых условиях одним и тем же тестом.

Другая важнейшая характеристика теста – валидность. Валидность характеризует пригодность теста для измерения  определенной величины. Следует отметить, что нельзя говорить о валидности теста, не указав условий его применения6.

Можно привести такой наглядный пример. Два стрелка стреляют по мишени. Первый набрал 60 очков, а второй 90 из 100. Какой стрелок лучше? На первый взгляд кажется, что второй. Но при уточнении условий задачи оказалось, что второй стрелок поразил чужую мишень.  Поэтому, несмотря на высокую надежность стрельбы, второй стрелок является «не валидным», он не может достигнуть цели, которая перед ним ставилась.  Ясно, что первый стрелок предпочтительнее.

Тест может иметь высокую надежность, но низкую валидность. Тест с высокой валидностью обязательно имеет высокую надежность. Если тест имеет низкую валидность, то применять его нельзя, даже если он имеет высокую надежность.

Понятия надежности и валидности педагогического теста чрезвычайно важны, поскольку именно они характеризуют тест как измерительный инструмент. Тест с неизвестными надежностью и валидностью непригоден для измерения. Когда преподаватель, разработав тест, проводит тестирование, то полученные результаты следует интерпретировать (например, для ранжирования испытуемых) очень осторожно, так как неизвестны надежность и валидность вновь составленного теста. Эти, крайне важные понятия более подробно будут рассмотрены в третьей главе.

Ким В.С., Тестирование учебных достижений. - Уссурийск, 2007