Нормативно-ориентированный тест (norm-referenced test) предназначен для сравнения учебных достижений отдельных испытуемых. Результаты тестирования выражаются в баллах, и, соответственно, учащиеся располагаются в зависимости от количества набранных баллов. Этот тест широко используется при распределении учащихся по учебным группам (в составе учебной группы) с учетом уровня языковой подготовки и способностей.
Критериально-ориентированный тест (criterion-referenced test) используется для оценки степени владения испытуемым пройденным материалом.
Для оценки умения говорить на английском языке предлагается комплект тестов, составные части которого были разработаны Р. Ладо в 50-х годах. В комплект входят три «языковых» теста (проверка восприятия на слух языковых единиц разного (аудирование), лексический и грамматический тесты и один «речевой» (сочинение)). Некоторые тестологи предлагают ставить испытуемого в условия реальной речевой деятельности, при которой он слушает или читает конкретные тексты, звучащие или письменные. Однако такая процедура делает тест очень громоздким, что фактически лишает тестовую форму контроля её преимуществ по сравнению с другими, нетестовыми. Кроме того, крайне сложным, практически почти невозможным становится подбор равных по трудности текстов для нескольких вариантов одного и того же теста.
Указанный вид теста, наряду с «чисто языковыми» тестами, в настоящее время является наиболее популярным. Такую форму контролирующего теста, безусловно, легче реализовать на практике, чем и объясняется его распространенность. Однако его адекватность, даже только в отношении рецептивных видов речевой деятельности, нельзя считать доказанной, что признают и сами его сторонники. Во-первых, есть сомнения относительно достоверности получаемых результатов о степени понимания текста или владения тем или иным умением: неясно, например, когда происходит понимание текста – в процессе слушания/чтения или же в тот момент, когда учащийся работает с заданием теста и сравнивает предлагаемые ему решения вопроса, т.е. выбирает одно из готовых решений. Во-вторых, пока еще отсутствует исчерпывающий список умений, необходимых для осуществления того или иного вида речевой деятельности. В-третьих, открытым остается вопрос, следует ли проверять все умения (хотя бы из числа установленных) или же можно ограничиться несколькими. Если же можно ограничиться несколькими умениями, то какими.
Тестирование продуктивных видов речевой деятельности (говорение и письмо) с форматом типа «комментарий» или «эссе» по объективным причинам является менее надежным, чем тестирование рецептивных видов (слушание и чтение) с форматом типа «множественный выбор».
Тест типа «заполнение пропусков в связном тексте» (cloze procedure) представляет собой более надежную процедуру по сравнению с форматом «исправление ошибок» (editing procedure) (Huges, 1997). Одновременно исследования показывают низкую надежность такого привычного способа измерения учебных достижений, как перевод (Spolsky, 2000). Проблема заключается в том, что тестовые задания различаются между собой по степени надежности (Backman, 1996), хотя вся получаемая с помощью тестов информация (a prior), считается надежной в равной степени.
Надежность языкового тестирования зависит не только от формата самого теста, но и от согласованных действий экзаменаторов, оценивающих результаты выполнение продуктивных тестовых заданий (говорение и письмо). Среди многочисленных типов заданий, которые используются для составления тестов и контрольных работ, чаще всего встречаются следующие:
перекрестный выбор (matching),
альтернативный выбор (true-false, ets.),
множественный выбор (multiple choice),
упорядочение (rearrangement),
завершение/ окончание (completion),
замена / подстановка (substitution),
трансформация,
ответ на вопрос,
внутриязыковое перефразирование,
межъязыковое перефразирование (перевод),
клоуз-процедура (cloze procedure) и т. д.
В процессе языкового тестирования осуществляется измерение как целостных, так и дискретных (выборочных) знаний обучающихся в их эксплицитной (демонстрируемой) форме. Объект языкового тестирования состоит из нескольких «рубрик оценивания» (Moskal, 2000). Оценки по этим рубрикам выставляются в соответствии с разработанными параметрами и критериями. Данные параметры необходимы для того, чтобы согласованно выставлять оценки за выполненное устное задание с учетом, например, «грамматической правильности высказывания», «механической организованности высказывания» (уместного употребления вводных слов и проч.), «логической организованности высказывания», «убедительной аргументации высказывания», «оптимальной презентации высказывания» (темп, четкость и т.п.).
Если используются дискретные рубрики, тестовое задание (например, эссе аргументирующего типа) может быть оценено отдельно за убедительность аргументов и, отдельно, по другим параметрам. При этом каждая из рубрик оценивания может иметь свой «вес», придавая большую пли меньшую значимость каждому из оцениваемых параметров. Рубрики оценивания позволяют не только измерить педагогический результат по нужным параметрам, но также получить ценную информацию о качестве знаний учащихся и наметить пути его повышения (Мильруд, Матиенко, 2006: 12).
Языковое тестирование является процедурой педагогических измерений, которая не лишена характерных противоречий. Желание повысить валидность языковых тестов приводит к тому, что важная информация, получаемая в ходе тестирования, игнорируется, так как теряется определенность того, «что именно измеряет данный тест». Повышение надежности языковых тестов осуществляется через процедуру «модерации», исключая гибкий личностно-ориентированный подход к организации тестирования (Мильруд, Матиенко, 2006: 12).
Стандартизация языкового тестирования, продиктованная стремлением повысить валидность, надежность и объективность применяемых контрольно-измерительных инструментов (тестов), нередко выражается в сопротивлении попыткам внедрить в практику педагогических измерений альтернативное языковое тестирование, обеспечивающее право выбора формы экзамена, более полный учет индивидуальных особенностей учащихся и способное сообщить обучающимся ценную информацию, существенную для повышения учебных результатов. Наконец, существующая количественная парадигма языкового тестирования, то есть ориентация на количественную норму, даже если применяются качественные критерии (все переводится в баллы), создает ложное впечатление, что успех есть количественный показатель. При этом существенно снижается роль языкового теста как гуманистического инструмента педагогических измерений.
Анализ проблем показывает необходимость совершенствования существующих в педагогической практике различных языковых тестов. Одновременно все больше осознается необходимость поиска альтернативных форм языкового тестирования, которые давали бы учащимся право выбора формата тестового экзамена и повышали бы гуманистический потенциал процедуры педагогических измерений.
Достарыңызбен бөлісу: |