Нормативно-ориентированный тест должен хорошо дифференцировать испытуемых. Это означает, что индивидуальные тестовые баллы должны в достаточной степени отличаться друг от друга.
Вариацию тестовых результатов задают отклонения от среднего значения
При полном совпадении всех индивидуальных баллов вариация равна нулю. Если индивидуальные баллы не совпадают, то отклонения могут быть положительными и отрицательными. Сумма всех отклонений будет равна нулю. Поэтому, чтобы охарактеризовать вариацию тестовых баллов используют квадрат отклонений. Сумма квадратов отклонений зависит от количества испытуемых N. Чтобы избавиться от этой зависимости, нам необходима обратно пропорциональная зависимость от N. В результате мы приходим к понятию дисперсии sx2.
Дисперсия пропорциональна не 1/N, а 1/(N-1). Это сделано для того, чтобы для небольших N получить несмещенную оценку генеральной дисперсии11.
Для удобства вычисления, преобразуем выражение для дисперсии.
Учтем, что
Используя полученное выражение, перепишем формулу для дисперсии
Подставим численные значения
Таким образом, дисперсия тестовых баллов в нашем примере равна 4.9. Подобные расчеты удобно проводить с использованием табличного процессора Microsoft Excel, входящего в стандартный офисный пакет. Для этого необходимо использовать статистическую функцию «ДИСП», для которой надо указать диапазон ячеек со значениями индивидуальных баллов испытуемых.
С дисперсией связан еще один важный параметр - стандартное отклонение
Величина дисперсии тестовых баллов позволяет судить о качестве теста, о его дифференцирующей способности. Малая величина дисперсии говорит о том, что тест плохо различает испытуемых по уровню знаний, не позволяет с приемлемой точностью ранжировать их. Слишком большая дисперсия указывает на сильную неоднородность группы испытуемых, на возможные нарушения процедуры тестирования, на недостаточно ясные формулировки заданий и т.п. В случае оптимальной величины дисперсии, распределение тестовых баллов близко к нормальному.
М.Б.Челышкова7 считает, что если среднее арифметическое примерно равно утроенному стандартному отклонению,
то можно считать дисперсию оптимальной, а распределение тестовых баллов близким к нормальному.
Отметим, что это утверждение справедливо не для всех случаев. Возможны ситуации, когда среднее арифметическое гораздо больше утроенного стандартного отклонения, но распределение тестовых баллов, тем не менее, достаточно близко к нормальному.
Рассмотрим следующий модельный пример. Пусть в результате тестирования мы получили следующую таблицу частот.
Таблица 3.6.1
Баллы |
77 |
78 |
79 |
80 |
81 |
82 |
83 |
Частота |
1 |
2 |
7 |
10 |
6 |
2 |
1 |
Из таблицы видно, что средний тестовый балл равен 80.
Нормированная эмпирическая кривая распределения и нормальное распределение с дисперсией равной 1, показаны на рис.3.6.1.
Рис.3.6.1. Эмпирическая кривая.
Легко видеть, что возможны такие эмпирические данные, когда кривая распределения будет почти гауссовой, но среднее арифметическое значение будет существенно превышать утроенное значение стандартного отклонения.
В качестве грубой оценки нормальности распределения можно рекомендовать проверку следующего соотношения:
- если почти все значения тестовых баллов X укладываются в этот интервал, то в первом приближении можно считать эмпирическое распределение нормальным.
Для корректного решения вопроса о степени близости эмпирических данных нормальному распределению необходимо использовать более строгие доказательства, например, проверить гипотезу о нормальном распределении генеральной совокупности по критерию Пирсона12.