Ким В.С., Тестирование учебных достижений. - Уссурийск, 2007

4.2. ПРЕОБРАЗОВАНИЕ ТЕСТОВЫХ БАЛЛОВ В ОЦЕНКИ

Широкое внедрение тестирования в образовательный процесс высших и средних учебных заведений и трудности восприятия тестовых результатов в образовательной практике часто вынуждает исследователей трансформировать тестовые баллы в привычные оценки. И хотя такого рода перевод данных снижает дисперсию тестовых результатов и ухудшает дифференцирующую способность теста, реальная практика часто заставляет представлять тестовые баллы в обычной системе школьной и вузовской пятибальной шкалы. Подобная шкала отметок подвергается заслуженной критике, но, тем  не менее, она обладает и рядом достоинств, что и позволяет ей прочно сохраняет свои позиции.

В.Аванесов отмечает, что оценки нередко путают с отметками. Отметки он считает численными аналогами оценочных суждений. Основная цель измерения в педагогике — это получение численных эквивалентов степени выраженности интересующего признака на интервальной шкале2.

Несмотря на отмеченное принципиальное отличие оценок и отметок, в практике их почти всегда отождествляют. Видимо это обусловлено устоявшейся на практике терминологией. В частности, в рекомендациях Федерального центра тестирования6  под термином «оценка» понимается именно «отметка».

Главным достоинством пяти- и четырехбалльной шкалы является ее простота, обусловленная ограниченной разрешающей способностью человека как измерительного инструмента. Педагогу достаточно легко отследить градации объема знаний  в пределах 4-7 уровней. Если же ввести, например 20-ти балльную шкалу отметок, то отличить 19 баллов от 20 педагог просто не сможет.

При математической обработке результатов тестирования, преобразовании их в отметки по той или иной процедуре, вычислении средней отметки, следует иметь в виду, что отметки определены на порядковой шкале7. В частности, нельзя в качестве средней отметки использовать среднее арифметическое.   Орловым А.И8  показано, что, согласно законам нечисловой статистики, для определения среднего значения величины по порядковой шкале необходимо использовать не просто среднее арифметическое, а среднее арифметическое центральных членов вариационного ряда, то есть медиану. Среднее же арифметическое используется для интервальных шкал.

Важность корректного определения оценки обусловлена тем, что оценка является мощным  педагогическим инструментом, посредством которого педагог весьма эффективно может влиять на учебный процесс.

Процедура перевода тестовых баллов в отметки включает в себя либо  таблицу соответствия некоторого диапазона тестовых баллов отметкам, либо некоторое математическое выражение, позволяющее определить отметку.

Остановимся сначала на таблицах.  Разные авторы  предлагают различные таблицы. Например, в работе В.Дубас9 предлагается  следующая таблица 4.2.1.

Таблица 4.2.1

«2»

«3»

«4»

«5»

0,4> V >=0,l

0,7> V >=0,4

0,9> V >=0,7

1= V >=0,9

В этой таблице V- относительный объем знаний.

Согласно этой таблице В.Дубас предлагает номограмму (рис. 4.2.1), позволяющая быстро осуществить процедуру перевода тестовых баллов в отметки.

Введем обозначения:

N – максимальное количество баллов;
X – индивидуальный балл испытуемого.

Рассмотрим пример использования номограммы. Допустим, что индивидуальный балл испытуемого составляет X=16. На номограмме отмечаем горизонтальную линию на высоте 16 единиц. Назовем эту линию линией индивидуального уровня. Эта линия индивидуального уровня пересекает  графики почти всех отметок, а именно – «2», «3», «4» и «5».

Опуская перпендикуляры из точек пересечения линии индивидуального уровня с графиками отметок, мы найдем количество заданий  M  в тесте, для точного соответствия данной отметке. В таблице 4.2.2 приведены значения M в случае X=16 для различных отметок.

Таблица 4.2.2.

Оценка

«1»

«2»

«3»

«4»

«5»

N

-

40

23

18

16

Рис. 4.2.1. Номограмма для  определения отметки.

На практике нас обычно интересует обратная задача – найти отметку при заданном значении N. В этом случае ответ получается неоднозначный. Вернемся к нашему примеру X=16.  Допустим, что испытуемый прошел тест из 30 заданий. На номограмме проводим вертикальную линию, соответствующую значению N=30 и отмечаем точку пересечения с линией индивидуального уровня. Эта точка удалена от графика «2» на 5 единиц, а от графика «3» на 4 единицы. Таким образом, получаем, что отметка находится между «2» и «3», но ближе к «3».

Несмотря на широкое применение вычислительной техники в учебном процессе, подобные «подручные» методы расчета могут оказаться полезными.

В некоторых случаях предпочтительнее использование тех или иных формул для определения отметок. В этих случаях, в уравнениях используются величины на интервальной шкале, а полученный результат (отметка) рассматривается на порядковой шкале). В частности, А.Молибог10 предлагает приближенное соотношение следующего вида:

Y = 3,3 lg(1/(1-V))

где Y — оценка (отметка) в баллах (Y = 2, 3, 4, 5);
V—объем знаний материала в долях от 1.

 

Кривая, соответствующая указанной выше зависимости, представлена на рис. 4.2.2.

Рис. 4.2.2.

Здесь обращает на себя внимание сильно нелинейная зависимость  величины отметки от относительного объема знаний, а также высокий уровень требований к знаниям испытуемых. В частности, оценке «3» соответствует значение V=0.75, что довольно много.

Например, Федеральный центр тестирования предлагает следующую таблицу (таблица 4.2.3) по переводу тестовых баллов в  отметки. Из этой таблицы видно, что V=0.75 – это заведомо отличная оценка. Разумеется, подобные таблицы преобразования тестовых баллов в отметки изначально субъективны и отражают множество скрытых факторов.

Тем не менее, такие таблицы представляется интересным  классифицировать по типу зависимости «отметка – тестовый балл».

Проследим общие закономерности  разработки процедур преобразования тестовых баллов в оценки.  Известно, что табулированные функции можно с той или иной степенью точности описать достаточно простыми уравнениями. В этой связи удобно анализировать не таблицы перевода, а поведение функций, описывающих эти таблицы.

 

В дальнейшем будем предполагать, что оценка y связана с индивидуальным баллом X испытуемого  нелинейной зависимостью вида:

где a, b, n – коэффициенты, подлежащие определению.

Таблица 4.2.3. Рекомендации по переводу тестового балла централизованного тестирования (вузовского) в пятибалльную шкалу оценок в 2005 году11.

Предмет

«2»

«3»

«4»

«5»

1. Русский язык

0-36

37-50

51-65

66-100

2. Математика

0-34

35-48

49-67

68-100

3. Физика

0-37

38-47

48-65

66-100

4. Химия

0-33

34-48

49-69

70-100

5. Информатика

0-36

37-48

49-67

68-100

6. Биология

0-36

37-49

50-65

66-100

7. История России

0-38

39-49

50-62

63-100

8. География

0-38

39-48

49-61

62-100

9. Английский язык

0-36

37-49

50-66

67-100

10. Немецкий язык

0-36

37-48

49-65

66-100

11. Французский язык

0-35

36-50

51-65

66-100

12. Обществознание

0-36

37-50

51-63

64-100

Рис. 4.2.3.

Из этих коэффициентов нас будет интересовать коэффициент n, определяющий тип зависимости (рис. 4.2.3).

При n=1 мы получаем линейную зависимость, обозначенную на рис. 4.2.3 символом B.

Кривая А соответствует случаю n<1  и характеризует сублинейную зависимость.

Кривая C соответствует случаю n>1  и характеризует надлинейную зависимость.

В случае линейной зависимости (n = 1) наблюдается прямая пропорциональная зависимость между оценками и индивидуальным баллом. Это самая простая зависимость, но на практике она, как правило,  не используется.

В частности, из рис. 4.2.2 видно, что А.Молибог использует надлинейную зависимость.

В.Дубас считает, что диапазон "четверки" должен быть несколько уже диапазона "тройки". Из таблицы 4.2.1 также следует надлинейная зависимость с n = 1.4.

Соответствующая надлинейная зависимость показана на рис. 4.2.4 кружочками.

Примеры сублинейных зависимостей можно взять из таблицы 4.2.3, содержащей рекомендации Федерального центра тестирования. На рис. 4.2.4 выборочно показаны зависимости для географии (треугольники) и химии (квадратики).

Шкала по географии представляет собой яркий пример сублинейной зависимости. Для химии это свойство выражено слабее. Для остальных предметов результаты занимают промежуточное положение между географией и химией.

Значение n < 1 (сублинейные зависимости) означает, что исследователь в первую очередь интересуется повышенной дифференцирующей способностью используемой шкалы в области низких отметок. Надлинейные же зависимости с n > 1 используются, когда стремятся повысить дифференцирующую способность шкалы преобразования в области высоких оценок.

Сублинейные зависимости видимо следует использовать для тестов, содержащих задания повышенной трудности. Это связано с тем, что в случае  трудных заданий основная доля испытуемых будет получать относительно низкие индивидуальные баллы. Тогда, область повышенной дифференцирующей способности выгодно переместить к началу шкалы, т.е. в область низких отметок.  Для тестов же с относительно легкими заданиями желательно использование надлинейных зависимостей.

Рис. 4.2.4.

Таким образом, при разработке процедуры пребразования тестовых баллов в традиционные отметки (оценки) следует применять сублинейные или надлинейные зависимости,  обращая внимание  на характеристики как теста, так и испытуемых.

Ким В.С., Тестирование учебных достижений. - Уссурийск, 2007