Российская академия образования ассоциация «Профессиональное образование»



Pdf көрінісі
бет7/11
Дата21.10.2019
өлшемі0,92 Mb.
#50367
1   2   3   4   5   6   7   8   9   10   11
Байланысты:
Новиков Как работать над диссертацией


ОПЫТНО-ЭКСПЕРИМЕНТАЛЬНАЯ РАБОТА 
 
Тебе дано бесстрастной мерой 
Измерить все, что видишь ты. 
А. Блок. «Возмездие» 
 
Опытно-экспериментальная  работа  составляет  значительную  часть 
большинства 
диссертационных 
педагогических 
исследований.          
Всегда  ли  она  обязательна?  Она  не  предусматривается,  естественно,        
в  исследованиях  по  истории  педагогики.  Но  в  них  проводится  эмпи-
рическое  исследование  «на  поле»  исторических  фактов,  публикаций, 
архивных  материалов  и  т.п.  То  же  относится  к  исследованиям  по  ме-
тодологии  педагогики,  отчасти  по  сравнительной  педагогике.  Иногда 
исследование  может  быть  построено  на  обобщении  педагогического 
опыта.  Но  в  большинстве  случаев  необходимы  опытная  работа  или 
эксперимент, или и то и другое вместе. 
Можно  посоветовать  начинающему  исследователю  включаться  в 
опытно-экспериментальную  работу  как  можно  раньше.  Это  не  при-      
зыв  «сломя  голову»  бросаться  экспериментировать  неизвестно  зачем, 
неизвестно  что  и  неизвестно  как.  Но  прежде,  чем  Вы  организуете  и 
проведете  именно  ту  опытную  работу  и  именно  те  эксперименты,  ко-
торые  подтвердят  или  опровергнут  Вашу  гипотезу,  Вам  необходимо 
приобрести  первоначальные  умения  планирования  и  организации 
опытно-экспериментальной  работы,  анализа  и  обобщения  ее  резуль-
татов.  Кроме  того,  этот  предварительный  этап  позволит  Вам  подо-    
брать  нужные  педагогические,  методические  подходы,  отработать 
инструментарий,  подготовить  педагогов  –  участников  основного  эта-       
па опытно-экспериментальной работы. 
Вопросы  организации  изучения  и  обобщения  педагогического  
опыта,  опытной  работы  и  педагогического  эксперимента  достаточно 
подробно  описаны  в  вышеупомянутых  книгах  В.И.  Загвязинского,          
А.А.  Кыверялга  и  М.Н.  Скаткина  и  других  авторов,  поэтому  на  них         
здесь  мы  останавливаться  не  будем.  Кстати,  объем  и  характер  опыт-            
но-экспериментальной  работы  в  педагогических  кандидатских  дис-
сертациях  обычно  не  вызывает  существенных  возражений.  Сомнения       
и  возражения  чаще  всего  относятся  к  интерпретации  ее  результатов, 
применявшимся  критериям  оценки  и  методикам  статистической  об-
работки данных. 
Интерпретируя  результаты  опытно-экспериментальной  работы  в 
кандидатской  диссертации,  необходимо  иметь  в  виду  одно  существен-
ное  обстоятельство,  связанное  со  спецификой  педагогики.  Личность 
человека,  начиная  с  ребенка,  формируется  десятилетиями.  В  ее  фор-
мировании  участвуют  десятки,  сотни  людей:  родители,  родственни-       
ки,  товарищи,  все  школьные  учителя  и  т.д.  Поэтому  говорить  о  суще-
ственном  влиянии  тех  или  иных  серьезных  педагогических  иннова-            
ций,  например,  какой-либо  дидактической  системы  на  воспитание  и 
развитие  учащихся,  строго  говоря,  можно  было  бы,  если  бы  они  про-

 
57
верялись  с  I  по  XI  класс в  школе  во  всех  предметах.  И  тогда,  казалось  
бы, оценивать их эффективность. 
Но и это не все. Выпускник школы в 17 лет – еще не окончательно 
сложившаяся  личность.  Следовало  бы  еще  получить  отдаленные  ре-
зультаты  организованных  педагогических  воздействий  –  лет  так  че-        
рез десять. Но с тех пор, когда был бы начат такой эксперимент и когда 
он  был  бы  окончен,  изменятся  многие  социально-исторические  усло-   
вия  жизни  общества,  изменится  социальный  заказ  школе,  и  получен-      
ные  результаты  уже  вряд  ли  кому-то  будут  нужны.  Мы  специально 
«сконструировали»  такой  крайний,  предельный  вариант,  чтобы  под-
черкнуть  определенную  условность  результатов  всех  педагогических 
экспериментов  в  силу  особой  специфики  педагогической  науки  как,               
в некотором смысле, науки о будущем. 
Кроме  того,  условность  результатов  опытно-экспериментальной 
работы  в  педагогических  исследованиях  вызывается  еще  и  тем,  что          
как  бы  ни  выравнивались  начальные  условия  в  контрольных  и  экспе-
риментальных  группах  учащихся,  как  бы  ни  подбирался  «одинако-         
вый»  состав  педагогов,  учащихся,  допустим,  в  эксперименте,  педаго-
гический  процесс  все  равно  будет  иметь  личностную  обусловлен-        
ность.  Учитель  или  сам  исследователь,  преподающий  в  контрольном          
и  экспериментальном  классе,  как  бы  ни  стремился  быть  объективным, 
все  равно  будет  иметь  внутренние,  часто  неосознаваемые  симпатии           
или  антипатии  как  к  тому  или  иному  методу  обучения,  так  и  к  тому             
или  иному  ученическому  классу.  Ведь  каждый  школьный  класс  имеет 
свое  неповторимое  индивидуальное  «лицо»  –  все,  кто  работал  в  шко-          
ле,  в  каком-либо  другом  учебном  заведении,  это  хорошо  знают.  По- 
этому  для  получения  действительно  достоверных  результатов  иссле-
дования,  строго  говоря,  необходимо  привлечение  огромных  контин-
гентов учащихся и педагогов.  
У  аспиранта,  соискателя  есть  всего  3–4  года  для  того,  чтобы 
провести  и  закончить  диссертационное  исследование  и,  как  прави-        
ло,  весьма  ограниченные  возможности  привлечения  широкой  пе-
дагогической  общественности  к  опытно-экспериментальной  рабо-            
те  по  теме  своей  диссертации.  Естественно,  все  это  понимают.  Но 
диссертанту  надо  быть  предельно  осторожным  в  интерпретации 
полученных  результатов.  Когда  автор  диссертации,  проведя  экс-
перимент  по  одному  разделу  курса  физики,  допустим,  в  X  классе, 
утверждает,  что  за  счет  этого  повысилась  эффективность  форми-  
рования  у  учащихся  научного  мировоззрения,  или,  в  другом  слу-         
чае,  после  изучения  всего  трех  тем  специального  предмета  у  уча-         
щихся  ПТУ  было  сформировано  умение  самостоятельно  опреде-            
лять  стратегические  цели  своей  трудовой  деятельности  –  такие  ут-
верждения  вызывают,  по  меньшей  мере,  недоумение.  И  уж  совсем 
нелепым  выглядит  утверждение,  которое  встретил  автор  в  одной 
диссертации  о  том,  что  после  проведения  эксперимента  уровень  об-          
щей культуры студентов повысился на 17% (?!).  

 
58
Самый  сложный  и  острый  вопрос  для  любого  педагогического 
опытно-экспериментального  исследования:  по  каким  критериям  про-
изводится  оценка  педагогических  явлений,  процессов?    Критерии  эф-
фективности    важнейшая  проблема  вообще  в  любой  деятельности.            
Из-за  ошибочного  выбора  критериев  неоднократно  происходили  кру-
шения  целых  социальных  институтов  и  экономических  систем.  Часто 
приводится  такой  классический  пример  неправильного  выбора  кри- 
терия  и  вызванных  этим  последствий:  в  двадцатые  годы  нашего  сто-
летия  пожарным,  чтобы  они  вроде  бы  «меньше  спали»,  была  установ-
лена  заработная  плата,  пропорциональная  числу  потушенных  за  ме-      
сяц  пожаров.  В  итоге  дело  кончилось  тем,  что  пожарные  сами  стали 
устраивать поджоги! 
Поэтому,  приступая  к  опытно-экспериментальной  части  своего 
исследования,  диссертант  должен  самым  серьезным  образом  подойти       
к  подбору  критериев  оценки  эффективности  предполагаемых  педа-
гогических  инноваций.  Еще  до  проведения  основного  эксперимента, 
основного  этапа  опытной  работы  необходимо  точно  определить  и  про-
верить  «работоспособность»  критериев  оценки  эмпирических  дан-         
ных,  по  предварительным  результатам  прикинуть,  какой  контингент 
обучаемых,  сколько  классов,  групп  или  школ  необходимо  будет  вклю-
чить  в  опытно-экспериментальную  работу,  чтобы  получить  статисти-
чески достоверные окончательные результаты. 
Критерии  должны  удовлетворять,  в  частности,  следующим  при-
знакам: 
1.  Критерии  должны  быть  объективными  (настолько,  насколько         
это  возможно  в  педагогике),  позволять  оценивать  исследуемый  при-      
знак однозначно, не допускать спорных оценок разными людьми. 
2.  Критерии  должны  быть  адекватными,  валидными,  т.е.  оцени-     
вать  именно  то,  что  экспериментатор  хочет  оценить.  Сегодня,  в  связи             
с  повсеместным  распространением  и  утверждением  педагогики  раз- 
вития  личности  это  требование  тем  более  актуально,  что  мы  весьма 
посредственно  умеем  оценивать  уровень  знаний  и  умений  учащихся,        
но  практически  совершенно  не  умеем  оценивать  уровень  развития  тех 
или  иных  способностей,  их  личностных  качеств,  а  часто  даже  и              
не  знаем,  какие  способности,  качества  надо  оценивать.  Особенно  ос-        
тро  требование  адекватности  критериев  стоит  перед  исследователя-       
ми, занимающимися проблемами воспитания молодежи. 
3.  Критерии  должны  быть  нейтральными  по  отношению  к  иссле-
дуемым  явлением.  Так,  если  в  ходе  эксперимента  в  одних  классах, 
допустим,  изучается  какая-то  новая  тема,  а  в  других  –  нет,  то  в  ка-    
честве  критерия  сравнения  нельзя  брать  знание  учащимися  матери-       
ала этой темы. 
Совокупность  критериев  с  достаточной  полнотой  должна  охваты-
вать  все  существенные  характеристики  исследуемого  явления,  про- 
цесса.  Для  педагогики  это  требование  особенно  актуально,  поскольку 
любая  педагогическая,  любая  учебная  деятельность  –  чрезвычайно 

 
59
сложный  многоплановый  процесс,  который,  как  правило,  нельзя  оце-
нить  каким-то  одним  показателем.  Для  многих  педагогических  ис-
следований  этот  момент  оставляет  желать  лучшего.  Так,  в  связи  с 
введением  аттестации  учителей  некоторые  специалисты  предлагают         
для  учителей  математики,  физики  разработать  систему  тестов,  по-
зволяющих  оценивать  их  умение  решать  математические  и  физиче-    
ские  задачи  –  это  и  будет  якобы  критерием  квалификации  учителя. 
Наверное,  это  должен  быть  лишь  один  из  многих  критериев,  посколь-       
ку,  помимо    профессионально-математической  подготовки,  подготовки 
по  физике  учитель  в  том  числе  должен  еще  владеть  и  педагогическим, 
методическим мастерством, что в данном случае остается без внимания
*
.  
Рассмотрим  теперь  некоторые  типичные  ошибки  в  определении 
критериев  оценки  эффективности  педагогических  инноваций,  пред-
лагаемых  в  кандидатских  диссертациях.  Характерно,  что  грамотно  и 
относительно  строго  построенные  критерии  в  разных  работах  весьма 
разнообразны,  диссертанты  нередко  проявляют  большую  изобрета-
тельность  в  этом  деле.  В  то  же  время  примерно  в  половине  диссерта-
ционных  работ  встречаются  практически  одни  и  те  же  недостатки  в 
выборе критериев оценки. 
В  частности,  вполне  очевидно,  что  оценить  уровень  сформирован-
ности  тех  или  иных  знаний,  умений,  каких-то  качеств  личности  уча-
щихся,  студентов,  слушателей  можно  лишь  в  процессе  каких-либо 
определенных  действий,  совершаемых  этими  учащимися,  студента-          
ми,  слушателями,  когда  они  могут  активно  проявить  эти  знания,  уме- 
ния,  качества  личности.  Поэтому,  например,  такой  «критерий»,  как 
результаты  анкетирования  студентов  по  окончании  эксперимента         
«какая  музыка  вам  нравится  больше  –  эстрадная  или  классическая?» 
(изучалось  воспитание  эстетического  вкуса  у  студентов)  вряд  ли  мо-       
жет  о  чем-то  говорить.  Ведь  студенты,  зная,  какой  ответ  от  них  хотят 
получить,  могут  просто  «подыграть»  преподавателю,  эксперимента- 
тору.  Или  же  «критерий»  –  ответы  школьников  на  вопрос  «Понра- 
вились  ли  занятия  по  основам  информатики  и  вычислительной  тех-
ники?».  Ведь,  во-первых,  школьники  опять  же  могут  «подыграть» 
спрашивающему,  а  во-вторых,  наверное,  не  всегда  учение  может  и 
должно  нравиться  –  так  же,  как  горькое,  но  необходимое  лекарство         
для больного. 
Еще  один  типичный  случай  –  изучалась  подготовка  студентов  пе-
дагогического  вуза  к  ведению  профориентационной  работы  со  школь-
                                                   
*
 
Нередко встречается и несколько иное, но тоже вполне правомерное трактование 
понятия  «критерий»,  когда  в  роли  последнего  принимается  качественная  сторона  по-
лученного  результата,  достижения  цели.  Тогда  понятие  «критерий»  отделяется  от 
понятий  «показатель»,  «параметр».  Например,  критерий  –  уровень  знаний  и  умений 
учащихся,  а  показатель  –  их  успеваемость  в  баллах  (кстати,  весьма  сомнительный 
показатель  –  см.  ниже).  В  этой  трактовке  один  и  тот  же  критерий  может  иметь 
несколько  показателей,  параметров.  Например,  когда  успешность  выполнения  какого-
либо  задания  оценивается  по  времени,  затраченному  учащимися  и  количеству 
допущенных ими ошибок.  
 

 
60
никами  –  уровень  готовности  студентов  к  этой  работе  оценивался 
преподавателями  кафедры  педагогики  по  итогам  теоретических  за- 
нятий.  Это  оценка  чисто  умозрительная.  Диссертант  мог  бы,  навер-       
ное,  попробовать  оценить  уровень  такой  готовности  студентов  хотя           
бы  в  процессе  их  педагогической  практики  в  школе,  которая  предпо-
лагала бы какие-то их практические действия в этом направлении.  
Или же «критерий» –  ответ на вопрос, нередко обращаемый к учи-
телям  –  участникам  опытно-экспериментальной  работы:  «Надо  ли  при-
менять  такие  занятия?».  Положительный  ответ  на  него  позволяет,  воз-
можно,  судить  о  готовности  тех  или  иных  разработок  к  внедрению  в 
практику обучения и воспитания, но вряд ли может выступать основным 
критерием эффективности результатов научного исследования.  
Наиболее  часто  встречаются  случаи,  когда  диссертант  в  качестве 
критерия  выделяет  определенные  уровни  сформированности  каких-       
то  качеств  личности  учащихся  (например,  моральной  ответственно-        
сти,  эстетической  культуры,  гуманистических  отношений  и  т.п.),  или 
уровни  овладения  какой-либо  деятельностью  (профессионального 
мастерства,  управления  педагогическим  коллективом  и  т.д.).  Как 
правило,  выделяется  три  таких  уровня:  низкий,  средний  и  высокий.          
Или  выделяется  большее  число  градаций,  допустим:  нулевой,  низ-       
кий,  средний,  достаточный,  высокий  и  т.д.  Естественно,  в  силу  слож-
ности  педагогических  явлений,  процессов  выделение  каких-то  уров-     
ней  в  качестве  критерия  оценки  вполне  правомерно.  Но  беда  в  том,        
что  выделяя  чисто  умозрительно,  субъективно  подобным  образом 
уровни:  низкий,  средний,  высокий,  экспериментатор  сам  же  произ-
вольно  и  оценивает,  относит  учащихся  к  тому  или  иному  уровню.  Та- 
ким  образом,  ни  о  какой  объективности  критерия  и  достоверности  ре-
зультатов здесь речь идти не может. 
Другое  дело,  если  вводятся  уровни  качественно,  принципиально 
отличные  один  от  другого.  Например,  для  оценки  овладения  учащи-      
мися  знаниями  нередко  используются  4  уровня,  предложенные            
В.П.  Беспалько
*
:  I  уровень  –  знания-знакомства  –  узнавание  объ-      
ектов,  явлений,  процессов,  свойств  при  повторном  восприятии  ранее 
усвоенной  информации;  II  уровень  –  знания-копии  –  предполагает 
репродуктивное  воспроизведение  и  применение  полученной  инфор-
мации;  III  уровень  предполагает  продуктивные  действия  по  приме- 
нению  полученной  информации  в  процессе  самостоятельной  дея-
тельности;  IV  уровень      –  знания-трансформации  –  предполагает 
возможность  творческого  применения  полученной  информации  по-
средством  самостоятельного  конструирования  собственной  деятель-
ности.  
При  грамотном  построении  оценочных  процедур  в  этом  случае 
знания  каждого  учащегося  вполне  однозначно  могут  быть  отнесены         
к  тому  или  иному  определенному  уровню.  Или  же,  скажем,  в  диссер-
                                                   
*
 
См.:  Беспалько В.П. Основы теории педагогических систем.  – Воронеж, 1977. – 304 с. 

 
61
тации  Д.В.  Татьянченко  выделяются  уровни  управления  уроком:  сти-
хийный,  эмпирический,  научный  с  четким  обоснованием  их  качест-
венных  отличий.  Тогда  каждый  урок  того  или  иного  учителя  также 
относительно  объективно  может  быть  однозначно  отнесен  к  опреде-
ленному  уровню.  То  же  в  диссертации  Л.В.  Коняхиной  –  выделены 
уровни  восприятия  и  оценки  художественных  произведений  писате-        
лей  учащимися:  констатации,  комментария,  рассуждения,  обобще-        
ния  (о  качественных  отличиях  этих  уровней  можно  судить  по  их  на-
званиям).    Кроме  того,  как  видим,  во  всех  этих  случаях  оценка  осуще-
ствляется  не  умозрительно,  а  по  выполнению  испытуемыми  каких-то 
конкретных  действий,  а  сами  уровни  логически  выстраиваются  по  ка-
кому-то единому основанию классификации (см. ниже). 
Критерии  оценки  педагогических  явлений  могут  быть  качествен-
ными  и  количественными.  Они,  естественно,  дополняют  друг  друга. 
Исследователь,  как  правило,  не  ограничивается  только  качественны-         
ми  критериями  и  стремится  использовать  в  целях  объективности  по-
лучаемых  результатов  какие-то  количественные  критерии  оценки, 
используя тем самым определенные величины. 
О  величинах  и  шкалах  их  измерения  стоит  поговорить  особо.  По-
нятие  «величина»    определяется  следующим  образом:  величина  есть 
мера  некоторого  множества,  относительно  элементов  которого  имеют 
смысл  утверждения  –  больше,  меньше  или  равно.  Естественно,  не  на 
всяких  множествах  может  быть  задана  величина,  мера.  Например, 
утверждение,  что  ученик  Иванов  равен  ученице  Петровой  (не  путать        
с  равноправием!)  смысла  не  имеет,  так  как  каждый  человек  –  непов-
торимая  личность.  Но,  например,  утверждение,  что  рост,  вес  ученика 
Иванова  больше  (меньше,  равен)  роста,  веса  ученицы  Петровой,  име-         
ет  уже  вполне  определенный  смысл;  рост  и  вес  здесь  выступают  ве-
личинами. 
  Величина  задается  той  или  иной    шкалой    измерений,  оценки. 
Шкала  измерения  –  то  числовая  система,  в  которой  отношения           
между  различными  свойствами  изучаемых  явлений,  процессов  пере-
ведены в свойства того или иного числового ряда.    
Шкалы измерений делятся на 4 основных класса
*
:  
–  шкала  отношений  –    самая  мощная  шкала.  Она  позволяет  оце-
нивать,  во  сколько  раз  один  измеряемый  объект  больше  (меньше) 
другого  объекта,  принимаемого  за  эталон,  единицу.  Одновременно            
здесь  возможно  и  сравнение:  на  сколько  один  объект  больше  (меньше) 
другого.  Шкалами  отношений  измеряются  почти  все  физические  ве-
личины  –  время,  линейные  размеры,  площади,  объемы,  сила  тока, 
мощность  и  т.д.  В  педагогических  измерениях  шкала  отношений  бу-      
дет  иметь  место,  например,  когда  измеряется  время  выполнения  того  
или  иного  задания,  количество  ошибок  или  количество  правильно  ре-
шенных  задач.  В  последнем  случае,  естественно,  можно  говорить  о            
                                                   
*
  Подробнее  о  шкалах  измерения  см.:  Психологические  измерения:  Сб.  /  Под  ред.        
Л.Д. Мешалкина. – М.: Мир, 1967. – 196 с. 

 
62
том,  что ученик Иванов правильно решил, к примеру, в два раза больше 
задач, чем ученик Петров, но утверждение, что знания ученика Иванова  
в два раза больше знаний ученика Петрова, будет неправомерным.  
В  отдельных  случаях,  в  том  числе  в  исследованиях  по  трудовому          
и  профессиональному  обучению,  применяются  оценки  и  в  мерах  фи-
зических  величин  –  величина  допускаемых  ошибок  в  миллиметрах             
при,  допустим,  токарной  обработке  деталей,  величина  силы  нажатия 
учащимся  на  слесарный  инструмент  в  ньютонах  (килограммах),  ве-
личина  электрической  активности  мышц  в  милливольтах  и  т.п.  На  
шкалы  отношений  распространяется  весь  основной  аппарат  матема-
тической  статистики.  Здесь  не  возникает  никаких  проблем  с  обосно-
ванием  достоверности  различий  между  контрольными  и  эксперимен-
тальными группами, классами;  
–  шкала  интервалов    –  довольно  редко  применяющаяся  и  менее 
мощная.  Примером  ее  является  шкала  температур  по  Цельсию,  Рео- 
мюру  или  Фаренгейту.  Шкала  Цельсия,  как  известно,  была  установ-     
лена  следующим  образом:  за  ноль  была  принята  точка  замерзания         
воды,  за  100  градусов  точка  ее  кипения,  и,  соответственно,  интервал 
температур  между  замерзанием  и  кипением  воды  поделен  на  100  рав- 
ных  частей  –  градусов.  Здесь  уже  утверждение,  что  температура  в          
30
о
С  в  три  раза  больше,  чем  10
о
С,  будет  неверным.  Справедливо  го-
ворить  лишь  об  интервалах  температур  –  температура  в  30
о
С  на  20
о
С   
больше,  чем  температура  в  10
о
С.  В  педагогических  исследованиях,  в 
частности,  к  таким  шкалам  интервалов  можно  условно  отнести  дихо-
томическую  шкалу,  которая  содержит  только  два  значения:  да  –  нет, 
лучше  –  хуже,  мальчик  –  девочка  и  т.д.  В  такой  шкале  имеется  толь-      
ко  один  интервал  деления  (0–1  или  1–2,  плюс–минус  и  т.д.),  поэ-         
тому  ее  можно  рассматривать  как  предельный  случай  интервальной 
равномерной шкалы, просто «равномерность» не с чем сравнивать; 
 –  шкала  порядка    или    шкала  рангов  –    самая  слабая  шкала  – 
шкала,  относительно  значений  которой  уже  нельзя  говорить  ни  о  том,          
во  сколько  раз  измеряемая  величина  одного  объекта  больше  (меньше) 
другого,  ни  на  сколько  она  больше  (меньше).  Такая  шкала  только 
упорядочивает  расположение  объектов,  приписывая  им  те  или  иные 
ранги.  Например,  так  построена  шкала  твердости  минералов  Мооса:       
взят  набор  10  эталонных  минералов  для  определения  относительной 
твердости  методом  царапания.  За  1  принят  тальк,  за  2  –  гипс,  за  3  –  
кальцит  и  так  далее  до  10  –  алмаз.  Любому  минералу  соответственно 
однозначно  может  быть  приписана  определенная  твердость.  Если  ис-
следуемый  минерал,  допустим,  царапает  кварц  (7),  но  не  царапает            
топаз  (8)  –  соответственно  его  твердость  будет  равна  7.  Аналогично  
построены  шкалы  силы  ветра  Бофорта  и  землетрясений  Рихтера.          
Шкалы  порядка  широко  используются  в  педагогике,  психологии,  ме-
дицине  и  других  науках,  не  столь  «точных»,  как,  скажем,  физика  и 
химия.  В  частности,  повсеместно  распространенная  шкала  школьных 
отметок  в  баллах  (пятибалльная,  двенадцатибалльная  и  т.д.)  условно 

 
63
может  быть  отнесена  к  шкале  порядка.  Именно  условно,  поскольку 
оценка  знаний,  умений  в  баллах  обладает  определенной  субъектив-
ностью. 
Если  в  шкале  Мооса  тому  или  иному  минералу  может  быть  одно-
значно  приписано  строго  определенное  значение  твердости,  то  оцен-         
ка  знаний  одного  и  того  же  учащегося  у  разных  учителей  (экзамена-
торов)  может  быть  разной.  Разная  «цена»  отметок  будет  и  в  разных 
школах,  в  разных  регионах  –  в  зависимости  от  уровня  предъявляе-       
мых  требований  и,  соответственно,  возможностей  учителей  школы, 
контенгента  учащихся  и  т.п.  В  школах  некоторых  стран  применяется      
и  другая  оценка  успеваемости  учащихся  (как  итоговая):  порядковое 
место,  которое  данный  ученик  занимает  в  данном  классе  (выпуске).       
Это тоже шкала порядка;  
–    шкала  наименований.  Она  фактически  уже  не  связана  с  поня-
тием  «величина»  и  используется  только  с  целью  отличить  один  объект  
от  другого:  номера  автомобилей,  телефонов,  применение  цифр  или       
букв  алфавита  для  перечисления  пунктов  в  аконах,  положениях                 
и т.п. 
Теперь,  когда  мы  совершили  небольшой  экскурс  в  теорию  изме-
рений,  рассмотрим  вопрос  о  применении  шкал  измерений  в  педаго-
гических исследованиях. 
Наиболее  распространенная  мера  педагогических  оценок  шкала 
оценки  знаний  и  умений  учащихся  в  баллах.  Школьные  оценки  (от-
метки)  –  удобный  аппарат  для  практики  обучения,  который  выпол-         
няет  не  только  оценивающие,  но  и  определенные  воспитательные 
функции  стимулирования  одних  учащихся,  определенного  «наказа-      
ния» других и т.д. 
В  педагогических  исследованиях  используются  также  и  другие 
шкалы  балльных  оценок.  Например,  выделив  какие-либо  уровни 
сформированности  у  учащихся  определенных  качеств  личности  или 
овладения  той  или  иной  деятельностью,  диссертант  приписывает       
этим  уровням  соответствующие  значения  баллов:  «1»,  «2»,  «3»      и  т.д., 
или  «0»,  «1»,  «2»...,  что  принципиально  безразлично.  Но  использова-   
ние  балльной  шкалы  оценок  как  критерия  оценки  для  педагогических 
исследований  нежелательно,  хотя  и  не  исключено.  И  дело  здесь  не 
только  в  известной  необъективности  отметок,  о  чем  уже  говорилось,          
но  и  в  свойствах  самой  шкалы  порядка.  В  той  шкале  ничего  нельзя 
сказать  о  равномерности  или  неравномерности  интервалов  между  со-
седними  значениями  оценок.  Мы  не  вправе,  к  примеру,  сказать  о  том,  
что  знания  учащегося,  оцененные  на  «5»,настолько  же  отличаются               
от  знаний,  оцененных  на  «4»,  как  знания,  оцененные  на  «4»,  отлича- 
ются  от  знаний,  оцененных  на  «3».  С  тем  же  успехом  можно  было  бы 
приписывать  баллам  значения  не  «1»,  «2»,  «3»,  «4»,  «5»,      а,  допустим 
«1», «10»,  «100», «1000», «10000». И поэтому совершенно неправильно 
использование  так  широко  применяемой  в  диссертациях  величины 
среднего  балла  (по  классу,  группе  учащихся  и  т.д.),  поскольку  усред-

 
64
нение  предполагает  сложение  значений  величины,  а  операция  суммы         
на  таком  множестве  (шкале)  не  может  быть  корректно  (грамотно) 
определена.  Соответственно  не  могут  быть  определены  и  все  осталь-     
ные арифметические и алгебраические действия. 
Поэтому,  например,  утверждение  о  том,  что  знания  учащихся  в 
экспериментальных  классах  в  среднем  на  0,5  балла  выше,  чем  в  кон-
трольных,  будет  неправомочным,  некорректным.  Тем  более  некор- 
ректно  утверждение,  встреченное  автором  в  одной  из  диссертаций,          
что  эффективность  экспериментальной  методики  в  2,6  раза  выше 
контрольной (была произведена оценка по 10-балльной шкале). 
Чтобы  продемонстрировать,  что  может  получиться  с  использова-
нием  «среднего»  балла,  приведем  такой  гипотетический  пример.      
Пусть  исследовалась  сравнительная  эффективность  двух  каких-либо 
методов  обучения,  А  и  В.  В  обеих  группах  учащихся  –  контрольной          
и  экспериментальной  –  было  по  80  человек.  Оценки  производились          
по  двум  шкалам  –  пятибалльной  и  десятибалльной  (ведь  количество 
баллов  в  шкале  устанавливается  произвольно).  При  этом  будем  пред-
полагать,  что  оценки  по  десятибалльной  шкале  могут  быть  пересчи-     
таны  в оценки по шкале пятибалльной:  оценки «10»     и  «9»    будут  от-
несены к  «5», «8»   и «7»  –  к «4»   и так далее. Пусть оценки по десяти-
балльной  шкале  распределились  следующим  образом  (в  числителе          
будет  указано  количество  учащихся,  получивших  соответствующую 
оценку в группе,  обучавшейся  методом  А,   в  знаменателе   –   методом             
       20          0          30         0          20          0         10  
В):  «10»―;  «9»―;  «8»―;  «7»―;  «6»―;  «5»―;  «4»―; оценки «3», «2», 
               0          30          0         30          0          30         0 
«1»  не  получил  никто.  Соответственно  «средний  балл»  составит  7,50 
(метод  А)  и  7,25  (метод  В).  Казалось  бы,  можно  сделать  вывод,  что  
метод   А  лучше  метода   В.   Соответственно  оценки  по  пятибалльной      
                                                    20        30        20        10          0  
шкале,  в том же порядке:  «5»―; «4»―; «3»―; «2»―;  «1»―.   «Средний 
                                                    30        30        20         0           0 
балл» в этом случае  составит 3,750  в  группе, обучавшейся методом   А,         
и  4,125  в  группе,  обучавшейся  методом  В.  Таким  образом  мы  получи-    
ли как бы противоположный «результат» – метод В лучше метода А. 
Заметим,  что  этот  «парадокс»  никак  не  связан  со  статистической 
достоверностью  различий  –  он  будет  иметь  место  и  при  очень  боль-     
ших  выборках  данных  (числе  учащихся).  Просто  это  свойство  слабой 
шкалы  измерений.  Сказанное  будет  относиться  и  к  любым  другим 
критериям оценки, использующим шкалу порядка. 
В  принципе,  шкалу  балльных  оценок  так  же,  как  и  другие  шкалы 
порядка,  можно  использовать  в  педагогических  исследованиях,  если       
Вы  убеждены  в  объективности  выставляемых  оценок.  Но  в  этом  слу-    
чае  необходимо  использовать  специальные  непараметрические  кри-
терии  различий,  например  критерий  знаков.  (О  статистических  кри-
териях  достоверности  различий  мы  поговорим  немного  ниже.)  Но  эти 
критерии  слабые  и  для  установления  достоверных  различий  необхо- 
димо получение значительно больших массивов данных. 

 
65
По  этим  соображениям  целесообразно  использовать  такие  способы 
оценки,  которые  позволяют  применить  шкалу  отношений  или  шкалу 
интервалов,  а  не  шкалу  порядка.  Например,  использовать  тесты  –        
серии  коротко  и  точно  сформулированных  вопросов,  заданий,  на 
которые  учащийся  должен  дать  краткие  и  однозначные  ответы,  в  пра-
вильности  (или  неправильности)  которых  нельзя  сомневаться.  Точно        
так  же  могут  быть  построены  письменные  контрольные  работы,  ре-
зультаты  обработки  анкет  (процент  учащихся,  давших  положитель-    
ные ответы на тот или иной вопрос) и т.д.  
Необходимо  сделать  еще  одно  предупреждение  об  использовании 
дихотомической шкалы (т.е. шкалы, имеющей всего 2 значения: да–нет, 
1–0  и  т.д.),  а  также  любых  дискретных  шкал  с  ограниченным  числом 
градаций  (трихотомических  и  т.д.).  Их  можно  успешно  использовать     
для  установления  различий  в  результатах  каких-либо  педагогиче-       
ских  воздействий  в  диагностических,  констатирующих,  «срезовых» 
целях.  Но  если  Вы  исследуете  динамику  развития  какого-то  педаго-
гического  процесса,  например,  процесса  становления  у  учащихся  того 
или  иного  навыка,  то  такие  шкалы  в  этом  случае  принципиально  не 
годятся,  так  как  они  существенно  искажают  динамику  процесса.  К 
примеру,  на  так  называемых  кривых  обучения  –  графиках,  показы-
вающих  изменение  того  или  иного  параметра  в  зависимости  от  вре-     
мени  обучения,  появляются  своеобразные  ступени,  «этапы»,  которых  
нет  в  действительности,  при  использовании  шкалы  отношений,  вы-
раженной  в  мерах  физических  величин  (время  и  т.п.)
*
.  По  крайней      
мере,  для  изучения  динамики  развития  каких-то  педагогических  про-
цессов  во  времени  необходимо  использовать  дискретные  шкалы  из-
мерения с достаточно большим числом градаций. 

Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10   11




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет