Возникновение тестирования

Возникновение тестирования
     Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании в практике.
     История психодиагностики — это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического. В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.
     Тестовые методики связаны с теоретическими принципами бихевиоризма. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения, понимая его как совокупность доступных объективному наблюдению реакций на стимулы. Поведение, согласно бихевиористской концепции, является единственным объектом изучения психологии, а все внутренние психические процессы должны быть интерпретированы по объективно наблюдаемым поведенческим реакциям. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном).
     Первым исследователем, использовавшим в психологической экс-периментатике понятие «интеллектуальный тест», был Дж. Кеттелл. Этот термин после статьи Дж. Кеттелла «Интеллектуальные тесты и измерения», опубликованной в 1890 г. в журнале «Mind» («Мысль»), приобрел широкую известность. В своей статье Дж. Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут однообразными. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых.
     Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения:
     –  чувствительности;
     –  времени реакции;
     –  времени, затрачиваемого на называние цветов;
     –  времени, затрачиваемого на называние количества звуков, воспроизводимых после однократного прослушивания, и др.
     Он применял эти тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Дж. Кеттеллом и другие американские лаборатории начали использовать метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895-1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестоло-гов и придать общее направление тестологическим работам.
     Первоначально в качестве тестов использовались обычные экспериментально-психологические испытания. По форме они походили на приемы лабораторного исследования, но смысл их применения был принципиально иным. Ведь задачей психологического эксперимента является выяснение зависимости психического акта от внешних и внутренних факторов, например, характера восприятия от внешних раздражителей, запоминания — от частоты и распределения повторений и т. д.
     При тестировании психолог регистрирует индивидуальные различия психических актов, оценивая полученные результаты при помощи некоторого критерия и ни в коем случае не изменяя условий осуществления этих психических актов.
     Новый шаг в развитии метода тестов был сделан французским врачом и психологом Л. Бине (1857-1911), создателем самой популярной в начале XX в. серии интеллектуальных тестов.
     До А. Бине тестировались, как правило, различия в сенсомоторных качествах — чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно терминами «ум», «интеллект». Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.
     Причиной, по которой А. Бине вместе с Т. Симоном приступил к разработке первого в истории психодиагностики интеллектуального теста, стал практический запрос — необходимость создать методику, с помощью которой можно было отделить детей, способных к учению, от страдающих прирожденными дефектами и не способных учиться в нормальной школе.
     . Первая серия тестов — Шкала Бине-Симона (Binet-Simon Intelligence Development Echelle) появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения..
     Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80-90 %). Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по уровню тех заданий, которые мог решить ребенок. Если, например, ребенок, чей хронологический возраст равен 3 годам, решает все задачи для четырехлетних детей, то умственный возраст этого 3-летнего ребенка признавался равным 4 годам. Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического).
     Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена (1877-1956). Первый вариант адаптации тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван Шкалой интеллекта Стэн-форд-Бине (Stanford-Binet Intelligence Scale). Основных нововведений по сравнению с тестами Бине было два:
     1)  введение в качестве показателя по тесту коэффициента интеллектуальности (Intelligence Quotient — IQ), выводящегося из отношения между умственным и хронологическим возрастами;
     2) применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.
     Шкала Стэнфорд-Бине рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения, был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего (о) равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал х + о, т. е. ограниченные числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более116), ребенок считался одаренным, а если ниже 84, то умственно отсталым.
     Шкала Стэнфорд-Бине получила популярность во всем мире. Она имела несколько редакций (1937, 1960, 1972, 1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд-Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться путем сопоставления с результатами шкалы Стэнфорд-Бине.
     Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные психологи, имеющие достаточно высокую квалификацию.
     Эти особенности первых тестов ограничивали их распространение. Практика же требовала диагностировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период первой мировой войны появилась новая форма тестовых испытаний — групповое тестирование.
     Необходимость как можно быстрее отобрать и распределить полу-торамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить ученику Л. Термена Л. С. Отису{ 1886-1963) разработку новых тестов. Так появились две формы армейских тестов — Альфа (Army Alpha) и Бета (Army Beta). Первая из них предназначалась для работы с людьми, знающими английский язык. Вторая — для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять [10, т. 1].
     Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктирования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имеющие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.
     В то время как индивидуальные тесты, такие, как шкалы Стэнфорд-Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, в промышленности и в армии.
     Двадцатые годы прошлого столетия характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не чисто эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.
     На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее поистине до высокого совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью.
     Валидизация выявила ограниченные возможности тестов интеллекта: прогнозирования на их основе успешности выполнения конкретных, достаточно узких видов деятельности часто не достигалось. Требовалась, помимо знания уровня общего интеллекта, дополнительная информация об особенностях психики человека. Возникло новое направление в тестологии — тестирование специальных способностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.
     Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Разрабатывались комплексные батареи способностей для использования при консультировании и распределении персонала. Наиболее известны среди них Батарея тестов общих способностей (General Aptitude Test Battery — GATB) и Батарея тестов специальных способностей (Special Aptitude Test Battery — SATB), разработанные Службой занятости США для использования консультантами в государственных учреждениях. Тесты и батареи специальных способностей, различаясь составом, методическими качествами, сходны в одном — их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.
     Теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними — факторного анализа. Факторный анализ позволял точнее определить и классифицировать то, что называли специальными способностями.
     Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая была в 20-40-х гг. XX в. Факторный анализ — это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами.
     Но, пожалуй, главное, что вызывает сомнение, — это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в качестве продукта влияний требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований. Но техника факторного анализа принимает эти способности как некую данность; они же в действительности суть психические образования, находящиеся в динамике.
     Сказанное убеждает в том, что к возможностям факторного анализа и к его факторам нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.
     Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях — тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияния специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее.
     Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (Stanford Achievement Test — SAT), впервые опубликованный в 1923 г.  С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях. Значительное число тестов специальных способностей и достижений было создано под воздействием практических запросов со стороны промышленности и экономики. Они применялись для профотбора и профессионального консультирования. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.
Читайте далее:
Обучение психологов