Тесты школьной успеваемости. Тесты успеваемости и контрольные работы

В мире проведено не менее нескольких десятков тысяч исследований, посвя­щенных установлению отношений между психометрическим интеллектом и школьной успеваемостью, и с каждым годом их число возрастает. Вопрос о воз­можности прогнозирования успеваемости, поставленный Бине, до сих пор не утра­тил своей актуальности.

Пока еще никому не удалось выделить обучаемость как специфическую об­щую способность, отличную от общего интеллекта. Поэтому интеллект рассмат­ривается как способность, лежащая в основе обучаемости, но не являющаяся су­щественным фактором, обусловливающим успешность обучения. Корреляция тес­тов общего интеллекта с критериями обучаемости колеблется от -0,03 до 0,61.

Для теста «Прогрессивные матрицы» Равена корреляция общего интеллекта с уровнем школьной успеваемости равна 0,70 (английские школьники). Данные, полученные в других странах по тесту Равена, менее значимы: корреляции колеб­лются от 0,33 до 0,61 (успеваемость по математике; немецкие школьники) и 0,72 (общая успеваемость; советские школьники).

Тест Векслера дает менее высокие корреляции с успеваемостью: вербальная шкала - до 0,65, невербальная - от 0,35 до 0,45, общий интеллект - 0,50.

Чаще всего для прогноза школьной успеваемости используют тесты структуры интеллекта или их отдельные субтесты. Например, корреляция суммарных показа­телей субтестов «Вербальное мышление» и «Числовые способности» теста ДАТ с успеваемостью по отдельным предметам изменяется в пределах 0,70 - 0,80.

Российские психологи не остались в стороне от общего движения и провели массу аналогичных исследований. Например, в работе Э. А. Голубевой, С. А. Изю-мовой и М. К. Кабардова выявлялись корреляции между успеваемостью по различным учебным предметам и результатами тестирования интеллекта батаре­ей Векслера. Исследовались ученики 7-го класса. Полученные коэффициенты корреляции изменялись в диапазоне от 0,15 до 0,65 (успеваемость по черчению и невербальный интеллект). Корреляция общего интеллекта и суммарных оценок успеваемости равнялась 0,49 (для вербального интеллекта г = 0,50, для невербаль­ного интеллекта г = 0,40).

Положительные, но умеренные по величине корреляции между учебными оценками и результатами тестирования не позволяли исследователям однознач­но утверждать, что интеллект детерминирует успешность обучения. Недостаточ­но высокие корреляции объяснялись нерелевантностью оценок в качестве крите­риев успешности обучения, несоответствием материала тестов содержанию учебных программ и т. д.

Анализ распределения индивидов в пространстве координат «школьные оцен­ки» - «величина IQ» свидетельствует о наличии более сложной зависимости между интеллектом и успеваемостью, чем линейная связь.

Нетрудно заметить, что существует положительная корреляция IQ и школь­ной успеваемости, но для школьников с высоким уровнем интеллекта она мини­мальна.

Л. Ф. Бурлачук и В. М. Блейхер исследовали зависимость школьной успевае­мости от уровня интеллекта (тест Векслера). В ряды слабоуспевающих школьни­ков попали ученики и с высоким, и с низким уровнем интеллекта. Однако лица с интеллектом ниже среднего никогда не входили в число хорошо или отлично успевающих . Главной причиной низкой успеваемости детей с высоким IQ было отсутствие учебной мотивации.


средний величина IQ


Рис. 54. Соотношение между IQ и школьными оценками

Таким образом, существует нижний «порог» IQ для учебной деятельности: успешно учиться может только школьник, чей интеллект выше некоторого уровня, определяемого внешними требованиями деятельности. И вместе с тем успевае­мость не растет бесконечно: ее уровень ограничивают системы оценок и требова­ния педагогов к учащимся (см. рис. 54).

В качестве примера рассмотрим результаты исследования, в ходе которого проверялось влияние структуры групповых факторов интеллекта на успевае­мость. В работе принимали участие С. Д. Бирюков и А. Н. Воронин - старшие научные сотрудники ИП РАН.

С помощью упрощенного и валидизированного нами варианта теста структу­ры интеллекта Амтхауэра тестировались уровни развития пространственного, вербального и числового интеллектов у школьников 5-11-х классов. Результа­ты тестирования сопоставлялись с учебными оценками с помощью корреляцион­ного и регрессионного анализов.

Было обследовано свыше 2000 школьников. Анализировались данные по клас­сам, а также отдельно по группам школьников с оценками выше и ниже средней по выборке.

Зависимости между успеваемостью по учебным предметам и уровнем разви­тия отдельных интеллектуальных способностей удалось выявить только в груп­пах учащихся, успеваемость которых была выше среднегрупповой. Более того, в группах учащихся 5-7-х и 8-9-х классов с успеваемостью ниже средней встре­чались случаи отрицательной корреляционной зависимости между уровнем ин­теллекта (в первую очередь - пространственного) и успеваемостью по отдель­ным учебным предметам. Можно сказать, что в группах неуспевающих школьни­ков встречаются индивиды как с высоким, так и с низким уровнем интеллекта, что полностью соответствует приведенному выше графику (рис. 54).

Если учащихся разделить на группы по уровню развития интеллекта, а не по успеваемости, картина получится более сложная. Результаты конфирматорного факторного анализа свидетельствуют, что выделенные латентные факторы интел­лекта и успеваемости в группах школьников с IQ ниже среднего по выборке могут быть связаны положительно, не связаны или связаны отрицательно (5 класс). У детей с интеллектом выше среднего отмечалась положительная связь двух факторов (интеллекта и общей успеваемости). Но она не велика - меньше, чем на смешанной выборке. Исключение из этого правила составляют результаты, полученные на выборках учащихся 10-11-х классов: они прошли от­бор, а их менее интеллектуальные сверстники отсеялись.

Можно постулировать наличие нижнего «интеллектуального порога» учебной деятельности: ученик, который обладает IQ ниже этого порога, никогда не будет учиться успешно. С другой стороны, существует и предел успешности обучения для индивида с данным уровнем IQ.

Следовательно, учебная успеваемость (Ni) подчиняется следующему неравен­ству:

N(IQJ

Поэтому весьма надуманными и непродуктивными представляются рассужде­ния о малой информативности тестов интеллекта для прогноза школьной успева­емости. Интеллект определяет лишь верхний, а деятельность - нижний предел успешности обучения, а место ученика в этом диапазоне определяется не когнитив­ными факторами, а личностными особенностями, в первую очередь учебной мотива­цией и такими чертами «идеального ученика», как исполнительность, дисциплини­рованность, самоконтроль, отсутствие критичности, доверие к авторитетам .

ОБЩИЙ ИНТЕЛЛЕКТ И ПРОФЕССИОНАЛЬНАЯ ДЕЯТЕЛЬНОСТЬ

Тесты интеллекта, особенно так называемые тесты структуры интеллекта (тест Амтхауэра, GATB, ДАТ и т. д.), широко используют в целях профессиональ­ного отбора и распределения кадров.

Данные тестирования общего интеллекта коррелируют с успешностью дея­тельности: для разных профессий -0,10< г<, 0,85. Для большинства профессий корреляция равна 0,60 (тест GATB).

Накопленные к 60-м годам результаты, характеризующие связь показателей тестирования интеллекта при профессиональном отборе с характеристиками ус­пешности профессионального обучения и профессиональной деятельности, позво­лили сделать весьма нетривиальный вывод. Одним из первых теорию «порога интеллекта» для профессиональной деятельности предложил Д. Н. Перкинс. Со­гласно его концепции, для каждой профессии существует нижний пороговый уро­вень развития интеллекта. Люди с IQ ниже определенного уровня не способны

овладеть данной профессией. Если же IQ превышает этот уровень, то между уров­нем достижений в профессиональной деятельности и уровнем интеллекта нельзя проследить никакой существенной корреляционной связи. Успешность профессио­нальной деятельности начинает определять мотивация, личностные черты инди­вида, система ценностей и т. д. [б].

Таким образом, успешность деятельности как бы «ограничена снизу» - инди­вид не способен трудиться, если его IQ меньше некоторого «интеллектуального порога», специфичного для данной профессии.

Одно из последних исследований связи интеллекта и профессиональных дос­тижений опубликовано в 1993 году У. Шнейдером . Оно касается изучения особенностей интеллекта «экспертов» - лиц, компетентных в какой-то опреде­ленной сфере деятельности. Как правило, «эксперты» обладают интеллектом средним или не ниже среднего. Шнейдер также считает, что для каждой деятель­ности есть свой интеллектуальный «порог». Индивид не в силах овладеть дея­тельностью, если его интеллект ниже этого порога. Если же его интеллект превы­шает пороговое значение, то реальные достижения индивида определяют не ког­нитивные способности, а его настойчивость, увлеченность, темпераментальные особенности, поддержка семьи и т. д.

Если интеллектуальный порог деятельности невысок, индивид может иметь и сверхвысокие, и средние значения интеллекта, но в любом случае это не отразит­ся на его профессиональных достижениях.

Можно привести еще ряд концепций, которые обобщают накопленный на се­годняшний день эмпирический материал и являются модификациями модели «нижнего интеллектуального порога», в соответствии с которой каждая деятель­ность характеризуется определенным уровнем требований, предъявляемых к ин­теллекту индивида.

Существует ли «верхний» интеллектуальный порог? Иными словами: ограни­чены ли возможности индивида в определенной профессиональной деятельности уровнем его интеллекта?

Если делать вывод по аналогии с результатами, показывающими связь интел­лекта и обучаемости, то предел продуктивности профессиональной деятельности может быть выражен неравенством:

Pi < Р (IQi)

С другой стороны, нижний уровень достижений, порог вхождения в деятель­ность, задается уровнем интеллекта, минимально необходимым для овладения про­фессией.

Следует отметить, что прогностичность тестов интеллекта выше для успешно­сти профессионального обучения, нежели для продуктивности профессиональной деятельности. Очевидно, практическая деятельность менее контролируема, чем учебная, а ее результат зачастую менее жестко оценивается, не определен или очень отдален во времени.

ОБЩИЙ ИНТЕЛЛЕКТ И КРЕАТИВНОСТЬ

Проблема отношения креативности и интеллекта поставлена в тот момент, когда креативность была выделена в качестве самостоятельного фактора. Гилфорд полагал, что творческая одаренность включает в себя, по крайней мере, спо­собности к дивергентному мышлению и к преобразованиям (IQ). Напомню, что, по Гилфорду, дивергентное мышление есть мышление, направленное на поиск разно­образных логических возможностей, способность к которому тестируется с помо­щью особых тестов («Необычное использование предметов», «Дополнение рисун­ка», «Нахождение синонимов» и т. д.).

В ряде статей Гилфорд рассматривает отношение интеллекта и креативности. Он полагал, что интеллект определяет успешность понимания и усвоения нового материала, а дивергентное мышление детерминирует творческие достижения. Кроме того, успешность творческой активности предопределена объемом знаний (зависящим, в свою очередь, от интеллекта). Гилфорд высказывает предположе­ние, что IQ будет предопределять «верхний предел» успешности решения задач на дивергентное мышление. Причем тесты креативности Гилфорда были связаны с оперированием семантическим кодом (словесной информацией), и он считал, что ограничивающая роль интеллекта для них будет выше, чем для невербальных тестов. Исследования показали, что корреляции между тестами интеллекта и ди­вергентного мышления выше для семантических тестов, чем для пространствен­ных и символических.

Однако результаты исследований К. Ямамото, а также Д. Хардгривса и И. Бол-тона позволяют ввести гипотезу «нижнего порога»: конвергентный интеллект (IQ) ограничивает проявления креативности при низких значениях IQ, при IQ выше некоторого «порога» творческие достижения от интеллекта не зависят.

В исследованиях Гилфорда и Кристиансена также было выявлено, что при низком IQ практически не бывает проявлений творческой одаренности, в то вре­мя как среди людей с высоким IQ встречаются лица и с высоким, и с низким уровнем развития дивергентного мышления.

Торренс , обобщив собственные исследования, пришел к выводу, что"связь между уровнем интеллекта и креативностью односторонняя. Он предложил мо­дель интеллектуального порога: до уровня IQ < 120 креативность и интеллект образуют единый фактор, выше этого порога факторы креативности и интеллекта проявляются как независимые. Иначе говоря, до какого-то уровня IQ ограничивает проявление креативности, выше «порога» креативность «вырывается на свободу».

Казалось бы, модель «интеллектуального порога» получила явное подтвержде­ние. Но результаты исследований Когана и Воллаха опровергли теорию «нижне­го» порога. Коган и Воллах модифицировали процедуру тестирования: сняли вре­менной лимит, отказались от показателя «правильности» (по Гилфорду), устрани­ли момент соревновательности. В итоге факторы креативности и интеллекта оказались независимыми . Была выявлена и описана особая группа детей с высоким уровнем креативности, но с интеллектом ниже среднего.

структура орщих способностей 251

В 1980 году вышла работа Д. X. Додда и Р. М. Уайта , в которой проанали­зированы результаты исследования связей между IQ и оценками дивергентной продуктивности (рис. 55).

60 120 140 IQ

Рис. 55. Соотношение между дивергентной продуктивностью и интеллектом

Распределение индивидов в пространстве двух координат (IQ и дивергент­ная продуктивность) удивительно напоминает распределения, полученные при исследовании связей интеллекта и обучаемости, а также интеллекта и успешно­сти профессиональной деятельности. Интеллект ограничивает «сверху» уровень творческой продуктивности. Наивысшие показатели по тестам дивергентного мышления показывают индивиды с максимальными значениями IQ. Обратное не верно.

Каким же образом совместить результаты Когана и Воллаха, а также резуль­таты, полученные в нашей лаборатории, с теорией «высокого» интеллектуального порога? Неужели все дело в различии процедур получения данных или же сте­пень регламентированности условий деятельности определяет «нижний» порог IQ для проявления креативности?

Проверялась гипотеза о возможности формирования креативности как общей личностной диспозиции (включающей мотивационную, когнитивную и поведен­ческую составляющие) у детей 3-5 лет . В ходе исследования выявлены две важные закономерности: 1) нелинейный характер изменения креативности в ходе исследования и 2) последовательность формирования компонентов креатив­ности - от мотивационных - к когнитивным и поведенческим.

Если креативная продуктивность испытуемых детей в ходе формирующего эксперимента превышала некоторый (всегда индивидуально определенный) уро­вень, то у них начинали проявляться признаки дезадаптивного, неврозоподобного поведения (росла тревожность, капризность, агрессивность, эмоциональная сензи-тивность и т.д.). Эти признаки напоминают особенности поведения детей с низ­ким уровнем интеллекта и высокой креативностью, как их описывают Воллах и

Коган. Следовательно, можно объяснить этот эффект превышением уровня кре­ативности индивидуального уровня «интеллектуального порога», который опре­деляет успешность адаптации. К концу формирующего эксперимента у большин­ства детей уровень креативности был выше, чем в начале, но меньше, чем в середине исследования, то есть достиг некоторого индивидуального оптимума.

Хотя методика диагностики креативности в нашей работе отличалась от тес­тов креативности Торранса и Гилфорда и состояла в фиксации проявлений твор­ческого поведения детей при спонтанной ситуативной игре, результаты ее можно объяснить с помощью той же модели «интеллектуального порога». Базовым ус­ловием формирования креативности и ее проявления в повседневной жизни яв­ляется формирование у индивида творческой мотивации. По нашим данным, опти­мальным периодом ее формирования является возраст от 3,5 до 4 лет.

Итак, можно заключить, что творческая активность детерминируется творче­ской (внутренней) мотивацией, проявляется в особых (нерегламентированных) условиях жизнедеятельности, но «верхним» ограничителем уровня ее проявления служит уровень общего («флюидного», по Кэттелу) интеллекта. Аналогично суще­ствует и «нижний» ограничитель: минимальный уровень интеллекта, до достиже­ния которого креативность не проявляется.

Условно отношение между творческой продуктивностью и интеллектом мож­но свести к неравенству вида:

IQ «деятельности» < Сг < IQ «индивида»

Если исходить из этого отношения, то речь не может идти об «интеллектуаль­ном пороге». Интеллект индивида выступает в качестве «верхнего ограничите­ля», потолка потенциальных творческих достижений. Использует или нет индивид отведенные ему природой возможности, зависит от его мотивации, компетентнос­ти в той сфере творчества, которую он для себя избрал, и, разумеется, от тех внешних условий, которые предоставляет ему общество. Нижний «интеллектуаль­ный порог» определяется «регламентированностью» сферы, в которой индивид проявляет свою творческую активность.

«ОДНОМЕРНАЯ МОДЕЛЬ»

Попытаемся обобщить приведенные выше результаты. Уточним еще раз основные понятия:

1. Индивидуальная продуктивность является мерой пригодности индивида к той или иной сфере жизнедеятельности (творческой, учебной, профессио­нальной). Индивидуальная продуктивность может оцениваться актуальной успеваемостью, уровнем профессиональных достижений, успешностью решения тестов на креативность (гибкость, уникальность, оригинальность и пр.).

2. Уровень интеллекта определяется успешностью выполнения тестов ин­теллекта (типа «Прогрессивных матриц» Равена), тождествен флюидному интеллекту (Gf), по Кэттеллу, или общему интеллекту, по Спирмену.

Между этими переменными существует определенная зависимость, отобра­женная на графике (рис. 56).

^~" п ^ \ 01

Рис. 56. Модель интеллектуального диапазона

Здесь: Y - продуктивность; Х - интеллект; Xi - индивидуальный интел­лект; Xj - «интеллектуальный порог» деятельности; Yi - предельная индивиду­альная продуктивность; Yj - требуемая минимальная продуктивность в деятель­ности; AYi Xj - диапазон продуктивности, а - определяется строгостью крите­рия оценки продуктивности (чем строже критерий, тем меньше успех а).

Дадим более подробное описание модели.

1. «Верхний порог»

Верхняя граница продуктивности (предельный уровень индивидуальных дос­тижений) задается индивидуальным уровнем интеллекта.

Предельный уровень достижений является линейной функцией от интеллекта:

P^,=k(Gf)+CHPi

где О < k <. 1 определяется спецификой внешних условий; Gf - уровень IQ i-ro индивида; С - начальный уровень компетентности, необходимый для «вхожде­ния» в деятельность; Pi - индивидуальная продуктивность.

2. «Нижний порог»

Нижнюю границу индивидуальных достижений в деятельности определяют требования деятельности, которые проявляются в феномене «интеллектуального порога». Если IQ индивида ниже определенного значения, то индивид не может

проявить минимально необходимую продуктивность и «не проходит по конкур­су». Следовательно, продуктивность индивида не может быть ниже определенного минимального значения, соответствующего уровню нижнего интеллектуального порога деятельности

Gf. Р. < Р,

где Gf. - уровень интеллектуального порога j-й деятельности.

3. Диапазон достижений

Индивидуальная продуктивность определяется, помимо IQ, уровнем мотива­ции и «приобщенностью к задаче» (иначе, уровнем специальных навыков и зна­ний, аналог - «кристаллизованный» интеллект).

Следовательно, можно предположить, что недостаток мотивации и компетент­ности препятствует индивиду достичь верхнего порога индивидуальных достиже­ний. Возможно:

R = k (Gf, -mx Gi),

где М - величина, обратная уровню мотивации («недомотивированность»); Gf - недостаток компетентности.

Модель имеет три любопытных следствия:

1. Успех вхождения индивида в деятельность определяется лишь уровнем индивидуального интеллекта и сложностью деятельности.

2. Уровень конкретных индивидуальных достижений зависит от мотивации и компетентности личности и связан с содержанием деятельности.

3. Предельно высокий уровень индивидуальных достижений зависит только от индивидуального IQ, но не зависит от трудности деятельности и ее со­держания.

Модель (назовем ее «моделью интеллектуального диапазона») имеет еще два интересных следствия.

Во-первых, согласно приведенным выше теоретическим соображениям, у ин­теллектуально одаренных индивидов корреляции между успешностью деятель­ности и уровнем интеллекта должны быть ниже, чем по всей выборке. Причина этого - в расширении диапазона продуктивности: дисперсия продуктивности у одаренных людей больше, чем по выборке в целом.

Корреляции между успешностью выполнения отдельных тестов (или продук­тивностью выполнения деятельностей у одаренных личностей) должны быть ниже, чем у «обычных» людей. Причины этого эффекта: независимость успешно­сти решения тестов друг от друга (они связаны только через G-фактор); большой разброс показателей продуктивности у одаренных; обусловленность положения индивида в плоскости координат «тесты - интеллект» мотивацией и компетент­ностью. Этот феномен обнаружен в многочисленных корреляционных исследова­

ниях: действительно, у интеллектуально одаренных испытуемых корреляции ус­пешности тестов ниже, чем для генеральной совокупности.

Во-вторых, для высокоодаренных испытуемых характерна «пила» достиже­ний в разных сферах деятельности, успешности по разным учебным дисципли­нам и при выполнении тестовых заданий. Действительно, индивидуальный интел­лект определяет лишь верхний порог достижений. У одаренных индивидов диа­пазон возможных достижений шире, чем у всех прочих. Поэтому, при независимости достижений в разных областях, в среднем для группы одарен­ных разница показателей по отдельным тестам, задачам и т. д. будет больше, чем по генеральной совокупности.

И неслучайно множество корреляционных исследований показывает, что ин­теллектуальная одаренность сопровождается большим разбросом индивидуаль­ных достижений в различных сферах деятельности, по предметам обучения и т. д.

Модель может быть расширена для описания структуры интеллекта с учетом его основных групповых факторов.

СТРУКТУРА ОБЩЕГО ИНТЕЛЛЕКТА. ИМПЛИКАТИВНАЯ МОДЕЛЬ

Как уже упоминалось, Ч. Спирмен выявил в структуре общего интеллекта лингвистический (вербальный), механический (пространственно-динамический) и математический факторы.

Критики концепции Спирмена (в частности, Торндайк) отрицали существова­ние общей умственной способности и считали, что следует говорить о множестве независимых способностей (от 3 до 120 «факторов»). Однако, когда Айзенк и Спирмен подвергли статистической обработке данные Торндайка, они обнаружи­ли ошибочность его расчетов и выявили в данных оппонента общий фактор интеллекта.

Практически все исследователи выявляли три основных подфактора общего интеллекта, которые были первоначально выявлены Ч. Спирменом: числовой, про­странственный, вербальный.

Например, в исследованиях Р. Е. Сноу и его коллег выделены следующие структуры: 1) общий фактор, который тестируется такими тестами, как «Прогрес­сивные матрицы» Равена, тестом, свободным от культуры, Кэттелла и пр., занимает вершину иерархии; 2) на втором уровне обобщенности выделяются три (как и у Спирмена) основных фактора, причем один из них более тесно связан с генераль­ным фактором; 3) низший уровень иерархии занимает десять подфакторов.

Н. Хомский в 60-е годы выдвинул гипотезу о том, что ребенок рождается с механизмом овладения языком и изначально обладает восприимчивостью к универсальным свойствам грамматики языка.

Позже ряд исследователей (Дж. Макнамара, М. Дональдсон и др.) показали, что дети усваивают язык только после того, как у них проявляется способность

понимать смысл ситуаций, связанных с социальным поведением людей. Ряд изящ­ных экспериментов продемонстрировали справедливость этого вывода.

Отсюда можно сделать вывод о первичности «эмоционально-поведенческого кода» и операций, связанных с ним, по отношению к естественной речи и способ­ности оперировать «натуральным» языком.

Дональдсон пишет по этому поводу: «На ранних стадиях развития, до того как у ребенка сформируется полное осознание языка, язык включен в поток со­бытий, в связи с которыми он используется. До тех пор пока это происходит, ребенок понимает не отдельные слова, он интерпретирует ситуацию в целом, Его больше заботит смысл того, что делают люди, когда они говорят и действуют, чем значение слов... В то же время ребенок занят структурированием, извлече­нием смысла ситуаций, даже когда никаких слов не произносится; порой ка­жется, что, когда они все-таки звучат, на понимание ребенком прозвучавшего высказывания сильно влияет, как он сам структурирует контекст» . Таким образом, «первичным» является поведенческий интеллект (он же - смысловой). Основные предположения таковы: 1) между групповыми факторами интеллекта (по Спирмену-Гилфорду) существует иерархическая импликативная зависимость, факторы неортогональны; 2) для развития фактора следующего уровня необхо­дим минимальный уровень развития предыдущего фактора; 3) генетическая оче­редность формирования факторов интеллекта: поведенческий, вербальный, про­странственный, формальный.

Итак, «поведенческое мышление» первично, следовательно, прав Гилфорд, вы­делявший поведенческий («социальный») интеллект в качестве самостоятельно­го фактора наряду с вербальным (смысловым), пространственным и арифметиче­ским.

Операции поведенческого интеллекта, с моей точки зрения, обладают следую­щими признаками:

1) контекстуальностью - смысл операции зависит от ситуации;

2) непрерывностью - хотя действие конечно (определяется достижением цели), но движение - непрерывно;

3) нет необратимости операций во времени (в прошлое не вернешься, «чашка разбита»);

4) эмоциональной насыщенностью;

5) неоднозначностью смысла операций - следствие ситуационной зависимости.

Язык позволяет выйти за пределы наличной ситуации: он как бы выносит вовне точку отсчета и позволяет субъекту «децентрироваться» - выйти за преде­лы ситуации (взаимодействия «Я» и другого), «встать над ситуацией».

Первый шаг на пути усвоения языка и формирования речевого мышления - освобождение последнего от связи с конкретными событиями и овладение им как самостоятельной структурой. Наибольшая трудность возникает при освобожде­нии высказывания от ситуационного контекста. Звучащая речь и речевое мышле­ние, строящееся на этой основе, также обладают рядом признаков:

2) мышление (содержание и операции) является непрерывным (главная труд­ность возникает у ребенка при обучении чтению - необходимость выделе­ния в речевом потоке отдельных слов и фонем);

3) речевые операции необратимы («слово не воробей...»);

4) существует эмоциональная насыщенность (конативная составляющая);

5) смысловая неоднозначность (феномены омонимии и синонимии);

Переход к письменной речи требует развития пространственно-динамическо­го мышления. Мышление «изображениями» - пространственно-временными схе­мами - строится на взаимодействии зрительного и тактильного анализаторов с предметами окружающего мира, причем зрение само по себе не дает представле­ния о «физике» окружающего мира: силах, плотности и массе предметов, их «по­датливости» воздействию и др.

Условно из целостного «механического» интеллекта можно выделить простран­ственный интеллект (S-фактор, по Терстоуну). Он измеряется тестами на мыслен­ное вращение предметов и на быстрое восприятие и идентификацию изображений.

Пространственный интеллект является следующей ступенью в генетической иерархии. Он характеризуется следующими особенностями:

1) независимостью содержания и операций от ситуационного контекста;

2) инвариантностью операции относительно пространства;

3) обратимостью операций во времени;

4) независимостью от ситуации;

5) однозначностью отношения изображения к содержанию;

6) почти полным отсутствием эмоциональной составляющей.

Письменная речь - это перевод устной речи в пространственный изобрази­тельный код. И она не может развиваться до определенного уровня сформирован­ное™ пространственного мышления. Устное слово существует во времени, напи­санное - в пространстве, и его содержание существует вне времени.

Письменная речь инвариантна по отношению к ситуации и ко времени, а чте­ние (активное) есть шаг к осознанию языка. Пассивное чтение (слушание) - совсем другое явление. В частности, выявлено, что, читая самостоятельно, дети задают вопросы о языке, а слушая - только о поведении героев и о сюжете.

В 4 года ребенок начинает разбивать слышимый им речевой поток на «кусоч­ки». До этого дети не осознают, что речевой поток не непрерывен, а состоит из слов. Первый шаг, который они делают на пути к к расчленению процесса мышле­ния на элементы, связан с оперированием пространственным изобразительным кодом: буква - это первая пространственная схема.

При этом замечено, что ребенок рисует (и мыслит пространственно) тем луч­ше, чем лучше проговаривает свои действия при рисовании. Многие педагоги отмечают феномен спонтанного проговаривания ребенком своих действий при рисовании.

Наконец, последним по времени формирования является формальный (или знаково-символический) интеллект. Он базируется на «искусственных» языках, которыми ребенок овладевает позже, чем остальными.

Первый искусственный язык, которым овладевает ребенок, - натуральный ряд чисел. Он также базируется на «пространственном коде»: первично порядко­вое число, и лишь позже ребенок овладевает отвлеченным понятием числа. «Пер­вый» и «второй» предшествуют «одному» и «двум».

Приведем основные свойства формально-знакового интеллекта:

1) независимость содержания и операций от контекста;

2) дискретность знаков и операций;

3) обратимость операций во времени;

4) надситуативность операций;

5) однозначность смысла: нет перекрытия смыслов;

6) нет эмоциональной составляющей значения (эмоциональной семантики);

и - новый признак:

7) произвольность знака по отношению к содержанию, которое определяется системой отношений между знаками (структурой искусственного языка в целом).

Только на уровне операций с числом и другими искусственными знаками возможно полностью надситуативное мышление, когда операции полностью неза­висимы от предметного содержания задачи.

При формально-символическом мышлении возможен переход от одной содер­жательной задачи к другой через отождествление их структур с некоторой фор­мальной структурой.

На уровне «пространственно-механического» интеллекта возможен лишь «трансфер» - «горизонтальный перенос» операций с одной задачи на другую по методу аналогий:

Нетрудно заметить, что при последовательном переходе от «поведенческо­го» интеллекта к формальному убывает эмоциональная составляющая «кода» (материала, отношений и операций), возрастает однозначность и произвольность обозначения (выражения) по отношению к содержанию, растет независимость

операций от ситуации, контекста, пространства и времени: проявляются инвари­антность и обратимость операций.

В зависимости от индивидуальной комбинации влияний генетических и сре-довых факторов дети по-разному овладевают перечисленными «универсальными кодами» интеллекта, и эти различия проявляются с момента овладения кодом. Например: при факторизации батареи тестов Векслера, проведенной на детях 6 лет, выявляются три фактора: общий интеллект, вербальный и невербальный (механический и пространственный) интеллекты, между тем как у подростков и взрослых дополнительно выделяется 4-й фактор, включающий субтесты на число­вом материале.

«Поведенческий» интеллект является как бы базой для развития всех прочих форм интеллекта.

ЧЕТЫРЕХМЕРНАЯ МОДЕЛЬ

Рассмотрим формальные отношения групповых факторов интеллекта. Пред­положим, что общий интеллект определяет успешность выполнения любого теста (вербального, пространственного, числового). Зависимость успешности выполне­ния любого теста от уровня общего интеллекта описывается ранее рассмотренной моделью: 1) необходим минимальный уровень интеллекта («порог»), чтобы овла­деть инструкцией и операциями, требуемыми для выполнения теста, 2) чем выше уровень общего интеллекта, тем выше предельная продуктивность, 3) реальная продуктивность индивида может располагаться в диапазоне продуктивности, оп­ределяемой интеллектуальным «порогом» теста и индивидуальным общим интел­лектом. Продуктивность детерминируется мотивацией и развитием специальной компетентности (специальный фактор). Общий интеллект задает верхнюю грани­цу для его проявления.

Предположим также, что для овладения каждым видом «кода»: речевым, про­странственным, формально-знаковым, требуется некоторый начальный минималь­ный уровень интеллекта («порог»). Этот «порог» определяется эмпирически. Овла­дение каждым видом «кода» приводит к возникновению нового интеллектуально­го фактора - интеллектуальной способности: вербальной, пространственной, формально-логической. Причем каждый новый «код» базируется на предыдущих:

вербальный - на поведенческом, пространственный - на поведенческом и вер­бальном и т. д. Для того чтобы новая способность возникла, необходим мини­мальный уровень развития предыдущей, которая задает пределы для развития и проявления новой способности.

Итак, уровень развития базового интеллектуального фактора только ограничи­вает возможность развития других. Причем диапазон возможностей будет коле­баться в диапазоне, определяемом уровнем развития предшествующего фактора и «порогом», необходимым для развития последующего фактора.

Рис. 57. Гипотетические отношения между вербальным (V) и пространственным (S) факторами интеллекта (ср. с рис. 56)

На рис. 57 представлены гипотетические отношения между вербальным (V) и пространственным (S) факторами интеллекта.

Аналогичные отношения должны существовать между пространственным и числовым факторами.

Таким образом, уровень индивидуального общего интеллекта неоднозначно определяет его структуру: овладение каждым следующим кодом предполагает повышение «интеллектуального порога» - уровня развития предшествующего фактора, минимально необходимого для развития последующего, но индивидуаль­ный уровень развития фактора лишь указывает на верхний предел развития фак­торов более высокого уровня (более поздних по происхождению).

И. П. Подласый

Качество обучения напрямую зависит от количества, глубины, своевременности и объективности оценки получаемых знаний. Грамотно составленные тесты позволяют определять уровень усвоения знаний и степень формирования навыков в процессе обучения.

Применение диагностических тестов в зарубежных школах имеет давнюю историю. Признанный авторитет в области педагогического тестирования Э. Торндайк (1874-1949) выделяет три этапа внедрения тестирования в практику американской школы:

1. Период поисков (1900-1915). На этом этапе происходило осознание и первоначальное внедрение тестов памяти, внимания, восприятия и других, предложенных французским психологом А. Бинэ. Разрабатываются и проверяются тесты интеллекта, позволяющие определять коэффициент умственного развития.

2. Последующие 15 лет - годы «шума» в развитии школьного тестирования, приведшие к окончательному осмыслению его роли и места, возможностей и ограничений. Были разработаны и внедрены тесты О. Стоуна по арифметике, Б. Зекингема для проверки правописания, Э. Торндайка по диагностике большинства школьных предметов. Т. Келли разработал способ измерения интересов и наклонностей обучаемых (при изучении алгебры), а Ч. Спирмен предложил общие основы использования корреляционного анализа для стандартизации тестов.

3. С 1931 г. начинается современный этап развития школьного тестирования. Поиски специалистов направляются на повышение объективности тестов, создание непрерывной (сквозной) системы школьной тестовой диагностики, подчиненной единой идее и общим принципах, созданию новых, более совершенных средств предъявления и обработки тестов, накопления и использования диагностической информации.

Напомним в связи с этим, что педагогика, развившаяся в России в начале века, безоговорочно приняла тестовую основу объективного школьного контроля.

После известного постановления ЦК ВКП(б) «О педологических извращениях в системе Наркомпроса» (1936) были ликвидированы не только интеллектуальные, но и безобидные тесты успеваемости. Попытки возродить их в 70-х годах ни к чему не привели. В этой области наша наука и практика значительно отстали от зарубежной.

В школах развитых стран внедрение и совершенствование тестов шло быстрыми темпами. Широкое распространение получили диагностические тесты успеваемости, использующие форму альтернативного выбора правильного ответа из нескольких правдоподобных, написания очень краткого ответа (заполнения пропусков), дописывания букв, цифр, слов, частей формул и т. п. С помощью этих несложных заданий удается накапливать значительный статистический материал, подвергать его математической обработке, получать объективные выводы в пределах тех задач, которые предъявляются к тестовой проверке. Тесты печатаются в виде сборников, прилагаются к учебникам, распространяются на цифровых носителях.

Проблема соотношения устных и письменных форм контроля разрешается в большинстве случаев в пользу последних. Считается, что хотя устный контроль больше способствует выработке быстрой реакции на вопросы, развивает связную речь, он не обеспечивает надлежащей объективности. Письменная проверка, обеспечивая более высокую объективность, кроме того, способствует развитию логического мышления, целенаправленности: обучаемый при письменном контроле более сосредоточен, он глубже вникает в сущность вопроса, обдумывает варианты решения и построения ответа. Письменный контроль приучает к точности, лаконичности, связности изложения мыслей.

В области определения системы оценок (отметок) наблюдается большое разнообразие как в принципах, так и в конкретных подходах, выборе способов оценивания и выставлений оценок. В зарубежных образовательных заведениях практикуются различные системы оценивания знаний, умений, навыков, приняты различные шкалы оценок, включая сто-, двенадцати-, десяти-, двухбалльную и др. Во французском лицее, например, при сдаче выпускных экзаменов результаты определяются по 20-балльной шкале. При этом для каждого предмета устанавливается определенный весовой коэффициент, определяющий значимость данного предмета для избранной обучаемым специальности, профиля или отделения лицея. Благодаря этому оценки по профилирующим предметам приобретают большую весомость.

При значительной децентрализации большинства зарубежных образовательных систем, при условии свободного выбора школой учебных планов и программ, а обучаемыми - учебных предметов редко проводятся централизованные проверки и оценивание знаний, умений. В Великобритании, например, функцию практического контроля за качеством академической подготовки берут на себя университетские комиссии, к которым на период сдачи выпускных экзаменов прикрепляются все грамматические и привилегированные школы, ориентирующиеся в подготовке своих выпускников на дальнейшее университетское образование.

В целом же нужно признать, контроль и учет успеваемости, диагностирование обученности в зарубежных школах носят характер объективной констатации результатов. Он не предполагает заботу о всеобуче. Общепринятый принцип индивидуализации обучения диктует один подход - каждый идет своим путем и темпом, обучается в меру своих возможностей, потребностей, реальных оценок будущего.

До революции в России существовала шестибалльная система оценки знаний с баллами от нуля до пяти. В 1918 г. оценка «0» была упразднена. Но постепенно и оценка «1» стала использоваться все реже, а начиная с 50-х годов все меньше стала использоваться и оценка «2». Пятибалльная система оценок фактически превратилась в трехбалльную, а для большинства обучаемых, которые не могут учиться на «4» и «5», эта шкала стала двухбалльной. Такая оценочная система очень слабо стимулирует учебный труд, «ступенька» между тройкой и четверкой непреодолима для большинства обучаемых.

Однако многие педагоги используют «дополнения» к обычной пятибалльной шкале в виде знаков «плюс», «минус». Реально получается три градации пятерки («пять с плюсом», «пять», «пять с минусом»), три градации четверки (аналогично), три градации тройки и двойки. Получается типичная десятибалльная шкала оценок.

Научно-исследовательские учреждения РАО предложили новые оценочные шкалы, которые проходят экспериментальную проверку в различных регионах страны. Некоторые регионы склонны принять двенадцатибалльную систему оценок, в которой кроме названных десяти баллов существует два экстремальных: балл «1» - «спасайте» - свидетельствует о том, что учащийся требует немедленной индивидуальной помощи или особенного внимания, вплоть до помещения в специальное учебное учреждение; высший балл «12» - экстремальный максимум («ура»), свидетельствующий о появлении способного и чрезвычайно одаренного учащегося, которого следует обучать индивидуально по специальной программе или же в учебном заведении с углубленным изучением предметов.

Тестирование достижений и развития

Слово «тест» английского происхождения и на языке оригинала означает «испытание», «проверка». Тест обученности - это совокупность заданий, сориентированных на определение (измерение) уровня (степени) усвоения определенных аспектов (частей) содержания обучения.

Правильно составленные тесты обученности должны удовлетворять ряду требований. Они должны быть:

  • относительно краткосрочными, т. е. не требовать больших затрат времени;
  • однозначными, т. е. не допускать произвольного толкования тестового задания;
  • правильными, т. е. исключать возможность формулирования многозначных ответов;
  • относительно краткими, требующими сжатых ответов;
  • информационными, т. е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалой измерений;
  • удобными, т. е. пригодными для быстрой математической обработки результатов;
  • стандартными, т. е. пригодными для широкого практического использования - измерения уровня обученности возможно более широких контингентов обучаемых, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.

    Если в основу классификации тестов положить различные аспекты (компоненты) развития и формирования человеческих качеств, то она будет выглядеть следующим образом:

    1. Тесты общих умственных способностей, умственного развития.
    2. Тесты специальных способностей в различных областях деятельности.
    3. Тесты обученности, успеваемости, академических достижений.
    4. Тесты для определения отдельных качеств (черт) личности (памяти, мышления, характера и др.).
    5. Тесты для определения уровня воспитанности (сформированности общечеловеческих, нравственных, социальных и других качеств).

    Применение тех или иных тестов будет наиболее успешным и обеспечит надежные выводы лишь при условии правильного их сочетания со всеми другими группами тестов. Поэтому тестовые испытания всегда имеют комплексный характер. Делать общие выводы, например, об уровне развития обучаемых на основе применения лишь тестов обученности было бы непростительной ошибкой. Когда ставится задача диагностирования обученности в связи с достижениями и развитием личности, нужно применять соответствующие виды тестовых заданий и предписанные им методики измерения, не забывая о локальном характере диагностирования.

    При разработке тестов важно, насколько они соответствуют запроектированным целям обучения, образования, развития обучаемых. Важнейшими критериями диагностических тестов обученности являются действенность (валидность, показательность), надежность (вероятность, правильность), дифференцированность (различимость).

    Действенность теста по своему содержанию близка к требованию полноты, всесторонности проверки, пропорционального представления всех элементов изучаемых знаний, умений. Термин «действенность» имеет, как минимум, два синонима - валидность (от англ. valid - имеющий значение, ценный) и показательность, представительность, трактуемые так же, как репрезентативность. Всегда имеется в виду, что составитель теста обязан тщательно изучить все разделы учебной программы, учебные книги, хорошо знать цель и конкретные задачи обучения. Лишь тогда он сможет составить тесты, которые будут действенными для определенной категории обучаемых.

    Четкая и ясная постановка вопроса в пределах освоенных знаний - неотъемлемое условие действенности теста. Если тест выходит за пределы освоенного содержания или же не достигает этих пределов, превышает запроектированный уровень обучения, то он не будет действенным для тех обучаемых, которым он адресован. Действенность теста определяется статистическими методами. Величина 0,7-0,9 свидетельствует о высокой действенности тестов обученности. Если же коэффициент корреляции достигает 0,45-0,55, то действенность теста считается удовлетворительной, при более низких значениях она считается неудовлетворительной.

    Степень надежности характеризуется стабильностью, устойчивостью показателей при повторных измерениях с помощью того же теста или его равноценного заменителя. Количественно этот показатель характеризуется вероятностью достижения запроектированных результатов (правильностью значений). Грамотно составленные и апробированные тесты обученности позволяют достичь коэффициента надежности 0,9. Установлено, что надежность теста повышается при увеличении количества тестовых заданий.

    Установлено также, что чем выше тематическое, содержательное разнообразие тестовых заданий, тем ниже надежность теста. Это следует понимать так: тест, нацеленный на проверку усвоения конкретной темы, всегда будет более надежным, чем тест, направленный на проверку всего раздела (курса), охватывающий значительное количество материала - закономерностей, концепций, фактов. Происходит это именно потому, что содержательное разнообразие последнего выше.

    Надежность тестов обученности значительно зависит от трудности их выполнения. Трудность определяется по соотношению правильных и неправильных ответов на тестовые вопросы. Включение в состав тестов таких заданий, на которые все обучаемые отвечают правильно или же, наоборот, неправильно, резко снижает надежность теста в целом. Наибольшую практическую ценность имеют задания, на которые правильно отвечают 45-80% обучаемых.

    Характеристика дифференцированности (различимости) связана с использованием таких тестов, где нужно выбирать правильный ответ из нескольких возможных альтернатив. Если, скажем, все учащиеся безошибочно находят правильный ответ на один вопрос и также дружно не могут ответить на другой, то это сигнал для совершенствования теста в целом. Его необходимо дифференцировать, сделать различимым. Иначе подобные задания не помогут отделить тех, кто усвоил материал на необходимом уровне, от тех, кто заданного уровня не достиг. Практически дифференцируют тесты по результатам статистического анализа, сравнивая результаты выполнения теста в целом с результатами выполнения отдельных заданий. Если коэффициент корреляции между ответами на конкретные задания и на тест в целом больше 0,5, то это свидетельствует о достаточной дифференцированности теста.

    При подготовке материалов для тестового контроля необходимо придерживаться таких основных правил:

    1. Нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися.
    2. Неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными.
    3. Правильные ответы среди всех предлагаемых ответов должны размещаться в случайном порядке.
    4. Вопросы не должны повторять формулировок учебника.
    5. Ответы на одни вопросы не должны быть подсказками для ответов на другие.
    6. Вопросы не должны содержать «ловушек».

    Тесты обученности применяются на всех этапах дидактического процесса. С их помощью обеспечивается предварительный, текущий, тематический и итоговый контроль знаний, умений, учет успеваемости, академических достижений.

    Предварительный контроль. Успех изучения любой темы (раздела или курса) зависит от степени усвоения тех понятий, терминов, положений и т.д., которые изучались на предшествующих этапах обучения. Если информации об этом у преподавателя нет, то он лишен возможности проектирования и управления в учебном процессе, выбора оптимального его варианта. Необходимую информацию преподаватель получает, применяя предварительный контроль (учет) знаний. Последний необходим еще и для того, чтобы зафиксировать (сделать срез) исходный уровень обученности. Сравнение исходного начального уровня обученности с конечным (достигнутым) позволяет измерять «прирост» знаний, степень сформированности умений и навыков. Если известны входные и выходные характеристики системы, проблемы ее оптимизации считаются во многом решенными.

    Собрать максимальный объем информации о входных характеристиках обученности и оценить их в количественных показателях удается с помощью тестирования, которое осуществляется с помощью специально разработанных для этой цели заданий.

    Текущий контроль. Он необходим для диагностирования хода дидактического процесса, выявления динамики последнего, сопоставления реально достигнутых на отдельных этапах результатов с запроектированными. Кроме собственно прогностической функции текущий контроль и учет знаний, умений стимулирует учебный труд учащихся, способствует своевременному определению пробелов в усвоении материала, повышению общей продуктивности учебного труда.

    Тематический контроль. Составление тематического тестового задания требует кропотливого и тщательного труда. Ведь речь идет не просто о проверке усвоения отдельных элементов, а о понимании системы, объединяющей эти элементы. Значительную роль при этом играют синтетические, комплексные задания, объединяющие вопросы об отдельных понятиях темы, направленные на выявление информационных связей между ними.

    Итоговый контроль. Осуществляется во время заключительного повторения, а также в процессе экзаменов (зачетов). Именно на этом этапе дидактического процесса систематизируется и обобщается учебный материал. С высокой успешностью могут быть применены соответствующим образом составленные тесты обученности.

    Естественно, не все необходимые характеристики усвоения можно получить средствами тестирования. Такие, например, показатели, как умение конкретизировать свой ответ примерами, знание фактов, умение связно, логически и доказательно выражать свои мысли, некоторые другие характеристики знаний, умений, навыков диагностировать тестированием невозможно. Это значит, что тестирование должно обязательно сочетаться с другими традиционными формами и методами проверки.

  • Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.

    Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).

    Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.

    Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.

    После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.

    Тесты школьной успеваемости являются методами педагогической диагностики, с помощью которого результаты планируемого учебного процесса могут быть максимально объективно, надежно и валидно измерены, обработаны, интерпретированы и подготовлены к использованию в педагогической практике учителями.

    Выделяют следующие виды тестов школьной успеваемости: а) ориентированные на соотносительную группу; б) ориентированные на критерии. Также они могут быть формализованными и неформализованными (неформальными).

    Тесты школьной успеваемости, ориентированные на соотносительную группу, предполагают сопоставление индивидуального результата тестирования каждого ученика с результатами, полученными с помощью релевантной выборки (чаще всего это все классы школьного выпуска). Составление тестов данного типа включает следующие этапы: а) подготовительное планирование, б) анализ учебных программ и учебников, в) конструирование заданий, г) анализ заданий, д) выверка.

    Этап подготовительного планирования предполагает обдумывание следующих вопросов: кто, что и почему подлежит исследованию? Например, если необходимо определить учащихся для дополнительных занятий, то нет необходимости тестировать весь класс, можно взять лишь более слабую его половину. Необходимо продумать, какие формы успеваемости будут исследоваться – устные, письменные или моторные, что будет выноситься на первый план – умение мыслить или запоминать и т.д.

    После определения цели и функции тестирования необходимо провести анализ учебных планов, программ и учебников. Здесь обращается внимание на то, каков уровень требуемых знаний, умений и навыков. Уровень узнавания изученного материала, репродуктивного воспроизведения усвоенного или творческого использования в новой ситуации.

    Тесты школьной успеваемости, ориентированные на критерии,– это тесты, сообщающие индивидуальный результат учащегося по отношению к критериям, заранее установленным исследователем (педагогом) или учебной программой. В этом случае учащиеся заранее предупреждаются, что результаты предстоящего тестирования на владение грамотной письменной речью успешно пройдут лишь те, кто наберет такую-то сумму баллов. То или иное количество тестовых баллов может быть определено для получения той или иной отметки успеваемости.

    Неформальные тесты школьной успеваемости являются методом педагогической диагностики, конструируемыми школьными педагогами с целью объективной фиксации результатов процесса обучения в своем классе. Неформальные тесты характеризуются отсутствием строго научного подхода на всех этапах создания. Если даже формализованные тесты никогда не дают уверенности в абсолютной надежности, то несовершенным тестам, создаваемым учителями для собственного пользования, это присуще еще в большей степени. Несовершенство измерений с точки зрения их надежности находит свое практическое выражение в вычислении стандартной измерительной ошибки, то есть величины стандартного отклонения теста, которая объясняется его надежностью.

    Стандартная измерительная ошибка учитывается создателями теста в процессе его подготовки. Пользователь теста в специальном приложении к тесту предупреждается, что стандартная ошибка в измерении, допустим, составляет ±4 балла. В этом случае он знает, что «истинное» значение успеваемости для ученика, набравшего 24 балла, располагается между 20 и 28 баллами. Если знать измерительные ошибки инструментария, то можно избежать переоценки его надежности и не принимать случайные расхождения результатов при их интерпретации за подлинные различия в успеваемости.

    Надежность инструментария зависит – при прочих равных условиях – от количества заданий. Для неформальных тестов ошибка в измерении может быть вычислена с помощью следующего основного правила: при количестве заданий менее 24 ошибка составляет 2 балла; при количестве заданий между 24 и 47 ошибка составляет 3 балла; при количестве заданий между 48 и 89 ошибка составляет 4 балла.