Примерный


Надежность и валидность результатов педагогических измерений



бет3/7
Дата26.05.2022
өлшемі136 Kb.
#145083
1   2   3   4   5   6   7
Байланысты:
Основы пед. измерений

Надежность и валидность результатов педагогических измерений.
Рассматривая валидность в педагогических измерениях, необходимо рассматривать валидность во взаимосвязи с характерными свойствами размерностью и надежностью. При этом выявление раз­мерности – необходимый предварительный этап работ по оцени­ванию надежности и валидности результатов измерений.
По сложив­шейся традиции термин «надежность», а именно «характеристику точности тестовых результатов и их устойчивости к действию случайных факторов» часто, хотя и не совсем верно, используют по отношению к тесту (Звонников В.И., Челышкова М.Б. Современные средства оценивания результатов обучения. – Москва, 2007. – 224 с, 156). Однако надежность те­ста является необходимым, но не достаточным условием получе­ния высокой точности измерений. В случае нарушений требова­ний к стандартизации условий проведения тестирования, проверке и оцениванию его результатов даже с помощью очень на­дежного измерителя можно получить результаты со значительным ошибочным компонентом.
Каким же образом определяется надежность результатов измерений? Основ­ная аксиома классической теории тестов приводит к фундамен­тальному соотношению, позволяющему получить концептуальную формулу для коэффициента надежности результатов измерений (количественной характеристики надежности), которая связыва­ет дисперсию (показатель разброса) наблюдаемых баллов  и дисперсию ошибок измерения  с rн – коэффициентом надеж­ности теста. Эта формула имеет вид
(1)
Ее значение исключительно теоретическое, поскольку по эм­пирическим результатам выполнения теста нельзя подсчитать  .
Несложный анализ формулы для оценивая надежности (1) по­зволяет сделать выводы о возможных пределах величины rн. Очевидно, что дробь  всегда неотрицательна, поэтому коэффици­ент надежности не может принимать значение больше единицы. Максимальное значение rн равное 1, получается в том случае, когда   = 0, – случай, который не встречается в практике изме­рений. Так как величина дроби уменьшается с ростом знаменате­ля, то естественно предположить, что надежность увеличивается в тех случаях, когда тест обеспечивает высокий разброс тестовых баллов обучающихся.
Таким образом, анализ надежности результатов измерений основан на предположении классической теории тестов о связи между на­блюдаемым баллом, истинным баллом и ошибкой измерения. В данном случае при применении педагогических тестов (заданий в тестовой форме, тестовых вопросов) основная цель оценка истинных баллов испытуемых, потому что любые результаты тестирования могут содержать в себе ошибоч­ные компоненты.
При этом надежность теста влияют следующие факторы :
1. Тест будет иметь высокую надежность и обеспечит низкую погрешность изме­рения при выборе заданий, имеющих наи­большую корреляцию с другими заданиями теста. Данный фактор очень важен для тестов с заданиями от 25 до 35 вопросов, в тестах с более 100 заданиями малые значения интеркорре­ляции заданий могут сочетаться с высокой надежностью теста.
2. Надежность измерений повышается при учете оптимальной длины теста, потому что рост длины теста повышает утомляемость и снижает мотивацию к выполнению заданий у испытуемых, что в совокупности ведет к росту ошибки измерения. Что доказывается исследованием Н.Гронлунда, в котором указывается на то, что учащиеся старших классов в сред­нем за 1 мин могут выполнить одно задание с выбором ответа (при числе ответов не более четырех) [Гэйбл Э. Цифровая трансформация школьного образования. Международный опыт, тренды, глобальные рекомендации / пер. с англ.; под науч. ред. П. А. Сергоманова. М.: НИУ ВШЭ, 2019. 108 с., 80].
Рассмотрим подробнее валидность результатов педагогических измерений. Традиционно валидность определяют как характеристику адекватности результатов измерения постав­ленной цели создания теста, если говорить точнее это мера характеризующая точность измерения конкретного запланированного конструкта, что непосредственно связывает оценку валидности с с анализом размерности пространства педагогических измерений.
Каким же образом производится оценка валидности? В связи с многочисленными внешними критериями адекватности теста поставленным це­лям измерения, существуют различные виды валидности и мно­гочисленные методы ее исследования.
1. Соотнесение результатов измерения с различ­ными внешними критериями (обычно качественного характера), независимо описывающими все ситуации тестирования, выдает нам количественную оценку валидности. Где высокая корреляция результатов измерений с внешними критериями свидетельствует о высокой валидности теста, и наоборот, слабая корреляция указывает на неполную адек­ватность теста своему предназначению и позволяет сделать вывод о низкой валидности теста
2. Уровень легкости измерения кон­цептуально выбранного латентного конструкта определяет оценку конструктной валидности, которая определяется при анализе корреляции между ре­зультатами по новым и уже существующим тестам, валидность которых подтверждена многолетней практикой их применения. В данном случае проводят независимую экспертизу качества содержания теста, ис­пользуют факторный анализ, позволяющий выстроить факторную структуру теста, анализируют внутреннюю согласованность теста методами корреляционного анализа и т.д.
3. Степень релевантности и репре­зентативности отражения концептуально выделенного конструк­та в содержании заданий теста отражает содержательную валидность, которое подвергается тщательной экспертизе. В основе работы экспертов обычно лежит анализ полноты, значимости, правильности пропорций со­держания теста и его соответствия запланированным для провер­ки видам учебной деятельности, что можно показать схематически (рис. 1).

Схема 1. Модель обеспечения содержательной валидности измерения


Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет