Из истории психологических тестов

Тестами в психологии называют стандартизированные методики психодиагностики, позволяющие получать сопоставимые колличественные и качественные показатели степени развитости изучаемых свойств. Под стандартизированностью таких методик имеется в виду то, что они всегда и везде должны применяться одинаковым образом, начиная от ситуации и инструкции, получаемой испытуемым, кончая способами вычисления и интерпритации получаемых показателей. Сопоставимость означает, что оценки, получаемые при помощи теста, можно сравнивать друг с другом независимо от того, где, когда, как и кем они были получены, если, разумеется, тест применялся правильно.

История психологического теста уходит своими корнями в древние времена, и я в своем реферате попыталась частично осветить некоторые ммоменты его развития.


  1. Представления о тесте странами древнего мира и средневековья

Предыстория теста уходит в глубину веков, она связана с испытанием различных способностей, знаний, умений и навыков. Уже в середине третьего тысячилетия до нашей эры в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготовленный писец был центральной фигурой месопотамской цивилизации, благодаря обширным по тем временам знаниям, он был обязан знать все четыре арифметических действия, уметь измерять поля, распределять роционы, делить имцщество, владеть искусством пения и игры на музикальных инструментах. Кроме того, проверялось умение разбираться в тканях, металах, растениях и др.

В Древнем Египте только тот обучался искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кандиВндат в жрецы проходил собеседование, в процессе которого выяснялись его биографические данные, уровень образованности; кроме того, оцеВннивались внешность, умение вести беседу. Затем следовали проверки умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрачных подземелий в полном одиночестве и др. Все эти жестокие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образоваВнния. Поэтому каждому кандидату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм тАФ с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно преодоВнлел знаменитый ученый древности Пифагор. Вернувшись позже в ГреВнцию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники, Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что Влне из каждого деВнрева можно выточить МеркурияВ», и потому, вероятно, придавал больВншое значение диагностике именно этих способностей. Для этого кажВндому давалась сравнительно трудная математическая задача. В слуВнчае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где учеВнники, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпады, хорошо и достойно держать себя, его принимали в школу.

Особенное значение Пифагор придавал смеху и походке молодых людей, утверждая, что манера смеяться является самым хорошим поВнказателем характера человека. Он внимательно относился к рекоменВндациям родителей и учителей, тщательно вел наблюдение за каждым новичком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников.

Сообщается, что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способностей лиц, желавВнших занять должности правительственных чиновников. Каждые три года чиновники повторно экзаменовались лично у императора по шести ВлискусствамВ»: музыке, стрельбе из лука, верховой езде, умению пиВнсать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно способных, в меру эрудированных, и главное, лояльных по отношению к власти люВндей для последующего их использования на административной службе.

Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда слуВнжили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать мудрость иранцев, прислал им шахматы. Предполагалось, что иранцы вряд ли сумеют разгадать суть этой игры и потому они должны были по условию отослать в Индию подать. Сообщается, однако, что визирь Хосрова Важургмихр понял правила игры и в свою очередь изобрел игру, называемую сейчас нарды. Он послал с новой игрой визиря в Индию, где ее, как выясниВнлось, разгадать не смогли.

Другим свидетельством использования испытаний тестового харакВнтера являются материалы, излагающие основы религиозного учения чань-буддизма. Учителя чань-буддизма использовали загадки, вопросы-парадоксы с одновременным созданием ситуации психологического стресса. Отвечать на них необходимо было сразу, на раздумывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединВнках-диалогах сама парадоксальность постановки вопросов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды?) создавала драматическое напряжение, которое усиливалось всем образом действий наставника. Хватая своего оппонента и крича на него: ВлГовори! Говори! Отвечай немедленно!В», он создавал ситуаВнцию психического напряжения. Чаньские парадоксальные загадки использовались, по мнению этого же автора, в качестве тестов на опреВнделенный ВлчаньскийВ» ход мышления. В зависимости от того, как тестиВнруемый неофит отвечал на эти загадки, опытный наставник определял, на каком уровне ВлпросветленностиВ» он находился и какие меры нужно принять для углубления его Влчаньского опытаВ», а также выявлял симуВнлянтов, скрывающих за внешней грубостью и странностью манер свою некомпетентность.

В созданном чжурчжэнями государстве Цзинь результаты экзамеВннов применялись для распределения выпускников медицинского учиВнлища. Из числа выдержавших экзамены лучшие поступали на государВнственную службу в качестве практикующих врачей, преподавателей или исследователей, худшие получали разрешение заниматься частной практикой. Не выдержавшим экзамен рекомендовалось либо продолВнжить подготовку, либо сменить профессию.

Различные конкурсы и экзамены устраивались и в средневековом Вьетнамском государстве. Всего за два года в период с 1370 по 1372 г. удалось провести переаттестацию всех военных и гражданских чиновВнников, что позволило организовать проверку государственного аппаВнрата по всей стране. В результате этого Вьетнам вновь стал сильным и жизнеспособным феодальным государством; особое внимание было уделено созданию боеспособного офицерского корпуса.

В XV в. конкурсные испытания были упорядочены. Они проводиВнлись по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты получали подарки от короля, их имена вносились в Влзолотой списокВ», который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся высекались на специВнальных каменных стелах, установленных в Храме Литературы.

Интересные данные приводятся В. Н. Басиловым в отношении шаманства. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманству, но эти претензии отвергались в процессе испытаний. Проверка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов, проверка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шамаВнном, то он по требованию народа должен был, как сообщается, ходить по снегу в трескучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачного претендента считали сумасшедшим. У ульчей шаман подВнвергался испытаниям во время поминок. Такой же обычай был у наВннайцев.

Приведенный здесь краткий исторический экскурс позволяет сдеВнлать вывод о необходимости рассматривать испытания индивидуальВнных способностей как важную и неотъемлемую часть общественной жизни многих (если не всех) народов мира со времен древнейших цивилизаций и до наших дней. Однако можно ли, на основании привеВнденных данных говорить о глубокой истории и широкой распространенВнности тестов? Если согласиться с наиболее известными сейчас опредеВнлениями теста даваемыми как перевод с английского слова ВлtestВ» тАФ испытание проверка, проба, то на поставленный вопрос надо отвечать утвердительно. Дело, однако, в том, можно ли в наше время так опреВнделять тест.

Определения подобного рода Маркс удачно называл простым назваВннием идеи, создающим только видимость познания. ВлОбъяснение, - пиВнсал он, - в котором нет указания на differentia specifica (т. е. специфиВнческое различие), не есть объяснениеВ». Для научного анализа приведенная выше трактовка теста уже недостаточна, ибо она не раскрывает тех существенных признаков, которые выделяют тест из других средств психодиагностики, контроля знаний методов оценки способностей. ВлСлишком короткие определения, - отмечал В. И. Ленин, - хотя и удобны.. все же недоВнстаточны, раз из них надо особо выводить весьма существенные черты того явления, которое надо определитьВ»).

В случае с тестами научный анализ дает классический пример видимого совпадения вещей по форме и их действительных различий по существу. Различия начинаются с рассмотрения основного понятия. В марксистско-ленинской философии сложилась традиция рассмотреВнния научных понятий с двух противоположных позиции. Как отмечал Б. М. Кедров, каждое понятие может быть зафиксировано, во-первых, как сложившееся готовое на данный момент времени, а потому как относительно неизменное, постоянное. Во-вторых, научные понятия моВнгут и должны быть рассмотрены, исходя из того, что они выражают и резюмируют собой на каждом этапе научного развития определенную ступень движения науки. В результате складываются две логические системы: формально-логическая, оперирующая относительно неизменВнными. готовыми понятиями, и диалектологическая, оперирующая изменВнчивыми развивающимися или, по терминологии Энгельса, текучими понятиями.

С течением времени обыденное представление о тесте и научное понимание теста все больше удалялись друг от друга. Хотя всякий тест включает в себя элемент испытания, он не сводится только к нему, ибо это сейчас метод исследования, включающий в себя ряд чисто научных требований. На каждом этапе развития науки требоВнвания к тестам и они сами менялись. Игнорирование этого диалектиВнческого момента нередко приводит к упрощенчеству в его оценках.

Настоящая история тестов началась век назад, в канун периода ломки устаревшего общественного строя, революционного изменения общественного сознания, совпавшего по времени с научным кризисом, поразившим естествознание. Диалектика и материализм потрясли идеаВнлистический фундамент психологии и стали основой новой методоВнлогии.


  1. Первый тест XX века и возникновение идеи о средстве измерения в тесте

К началу XX в. практические потребности изучения преобладаюВнщих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта проблема и дала импульс к появлению первых тестов. Ф. Гальтон, известный английский ученый, в течение 1884тАФ1885 гг. провел серию испытаний, в которых посетители лаборатории в возрасте от 5 до 80 лет могли за небольшую плату проВнверить свои физические качества (силу, быстроту реакции и др.), ряд физиологических возможностей организма и психических свойств - всего по семнадцати показателям. В число последних вошли показаВнтели роста, веса, жизненной емкости легких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, разлиВнчения цвета и другие. По полной программе было обследовано 9337 человек. Ф. Гальтон писал, что практика вдумчивого и методичВнного тестирования тАФ не фантазия; она требует рассмотрения к экспеВнримента.

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Ф. Гальтона можно сравнить с тем, что сделал Г. Галилей для физической науки своими остроумными экспеВнриментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива идеаВнлизму, а эксперимент - как настоящий фундамент науки. ВлТолько тогда психология сможет стать действительной и точной наукой, - писал, например, Дж. Кэттелл, - когда она будет иметь своей основой эксперимент и измеренияВ».

Дж. Кэттелл, по-видимому, первым увидел в тестах средство измерения, казалось бы, не измеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список 50 лабораторных тестов, которые мы бы сейчас назвали не тестами, а контрольными заданиями. Эти задания обладали только двумя из известных сейчас требований к тестам - имелась инструкция по их применению и подчеркивался лабораторный (т. е. научный) характер испытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допускаются зрители во время тестирования; все испытуемые одинаково инструктируются, они должны хорошо усвоить, что и как нужно им делать.

Надо ли говорить, сколь непривычной казалась идея измерения для психологии XIX века. Измерение с помощью тестов казалось тогда, а многим кажется и по сей день, делом если не странным, то претенциозным. Обыденное сознание исходило при этом из аналогии физическими измерениями и рассматривало эти попытки математизации как чуждый для гуманитарной психологии уклон. Примерно с такими же трудностями сталкивалась и психофизика.

Тем не менее, к концу 20-х годов нашего столетия все больше стал ощущаться потребность в создании специфического направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии тАФ биометрия, в экономике тАФ эконометрия, в науке в целом тАФ наукометрия. К ним следовало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурович свели к элементарным методам оценки взаимодействий индивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кэттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же проВнтивники. В числе сторонников были: в Германии тАФ Г. Мюнстерберг, С. Крепелин, В. Онри, во Франции тАФ А. Бине, в США тАФ Дж. Гилберт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремление к приВнкладным исследованиям в психологии прошлого расценивалось как отход от науки. Дж. Кэттелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 году, но публиковаться не мог из-за противодействия В. Вундта.

Итак, научный статус тестов не был определен, возможность измеВнрений в психологии подвергалась сомнению. Психология переживала трудный период: она уже не могла развиваться на старой основе, но и не научилась еще смотреть на мир по-новому. "Причина кризиса,тАФ писал Л. С. Выготский,тАФлежит в развитии прикладной психологии, приведшей к перестройке всей методологии науки на основе принципа практики. ВлЭтот принцип давит на психологию и толкает ее к разрыву на две наукиВ». Общественная практика требовательно выдвигала одну проблему за другой и ни одну из них, старая психология решить не могла тАФ у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было слуВнчайностью. Ей было дано название психотехника. Прикладное направВнление появилось и в педагогике. Хотя педология претендовала на зваВнние науки о комплексном развитии ребенка, в тот период она была в основном прикладной педагогикой. Будучи не принятыми, в традиционВнной науке тАФ в психологии и в педагогике, тесты быстро нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в древности: если какой-либо науке не находится место в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий Влчистой наукой, созерцанием истиВнныВ». Для представителей чистой науки прикладность не имела заметВнной ценности. За рубежом, например, в 30-х годах ученые Кембриджа, как вспоминает Ч. Сноу,тАФ больше всего гордились тем, что их научная деятельность ни при каких мыслимых обстоятельствах не может иметь практического смысла. Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традиционной психологии лежали в области теоретичеВнских рассуждений. Различались производительная и познавательная функции этих направлений. То, что имело ценность для психотехники, психология того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать для психологии.

Размежевание стало заметным в конце 20-х тАФ начале 30-х годов. Вместо объединения усилий обе стороны приступили к взаимным обвинениям и затяжным дискуссиям. Психология обвинялась в схоВнластике, узком академизме, в неспособности воспринять новое и в отВнрыве от практики жизни. Психотехника в свою очередь осуждалась за узкий практицизм, противоречащий духу науки, за отрыв от психоВнлогии, она обвинялась в голом эмпиризме, прикладности, подражании западным образцам, в чрезмерном увлечении тестами.. Последние стали узловым пунктом критики.

Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии и, особенно, в педаВнгогике. Даже в исторической науке получили распространение взгляВнды морализирующих историков, противопоставляющих Влчистое и возВнвышенное познаниеВ» различным формам приложения науки, влекущим за собой лишь несчастья и опасности.

Начало 30-х годов характеризуется широким использованием теВнстов во многих странах. Во Франции они стали применяться для дефектологических целей и для профориентации, в США тесты исВнпользовались при приеме на работу, в вузы, для оценки знаний школьВнников и студентов, в социально-психологических исследованиях. В СССР тесты применялись в основном в двух основных сферах: в наВнродном образовании и в сфере профотбора тАФ профориентации. ЗатроВннутые тестами столь важные сферы жизни и прямое влияние резульВнтатов тестового контроля на судьбы миллионов людей породили широВнкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несоверВншенство этого метода или пострадал в результате его использования, породили во многих странах, в том числе и в СССР, письма в правиВнтельственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начало 30-х годов характеризуется интенсивным и неконтролируемым использованием тестов в системе народного образования и в промышленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подВнкреплялись серьезной проверкой качества инструментария, решения о переводе некоторых учащихся в классы для умственно отсталых детей принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В промышленности на основе таких же тестов делались попытки классификации работников по различным профессиям, без внимательного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного хаВнрактера было принято известное постановление ВлО педологических извращениях в системе наркомпросовВ» (1936), наложившее запрет на применение бессмысленных (как там отмечалось) тестов и анкет. Это постановление, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А СмирВннова, получило в последующие годы неправомерно расширительное толкование и привело к отказу от разработки научно обоснованных меВнтодов психологической диагностики личности.

В те годы были, однако, и другие выступления тАФ в пользу тестов, Так, известный советский психолог М. Я. Басов говорил: ВлЯ думаю все же, что эта долгая, подчас острая критика тестовой методики.. в конце концов, приведет не к ниспровержению, не к упразднению этой метоВндики, а напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на применение и существованиеВ».

Тем не менее начиная с указанного периода критика тестов приВнобрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, Влс порогаВ». В США, например, против использования тестов выступали представители основных групп населения США тАФ взрослые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В серии проведенных исследований по социальным последствиям тестирования выяснилось, что 37% опрошенных возражали против использования тестов при поступлении на работу, 50% тАФ при продвижении по службе, 25% тАФ против использования тестов в школе. Случаи нарушения этики в использовании тестов окаВнзались столь злободневными, что ими вынужден, был заняться конВнгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное использование тестов, практику вторжения в частную жизнь, как идущую вразрез с моВнральными нормами. В августе 1966 г. в сенате США обсуждалось предложение о полном запрещении тестов, но это предВнложение не было поддержано большинством.

В зарубежной литературе выделяется несколько источников криВнтики тестов. Первый источник психолог С. Брим усматривает в личВнностном портрете критиков, в числе которых чаще других оказываются те, кто не склонен к самопознанию и интроспекции, авторитарен в межВнличностных отношениях, нетерпим к мнению других и возражает проВнтив всяких социальных перемен. Как правило, в США эти лица примыВнкают к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам. Третий источник является, по мнению Р. Кэттелла, следствием эмоционального и сентиментального отношения люВндей эстетического и нарцистического типа против всякой попытки представить "уникальную, художественную личностьВ» в виде формул и т. п. Четвертый источник критики является научным и касается недоВнстатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возлаВнгавшихся на нее надежд в смысле заметного повышения производительВнности труда. Она и не могла это сделать, потому что на том сравниВнтельно низком уровне промышленного развития прогресс в значительВнной мере зависел от уровня индустриализации и автоматизации произВнводства. При достижении необходимого уровня развития средств проВнизводства человеческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличиваться поток прикладных психологических исследований, нацеленных, в частности, на повышение эффективности человека-оператора в управлении сложВнными техническими системами. Соответственно возросла роль психоВнфизики, психометрии, прикладной и инженерной психологии, психолоВнгии труда и безопасности, экспериментальной психологии, научно обосВннованной профориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в нашей стране не прекращалось. Часть тестов применялась под видом контВнрольных заданий, испытаний и, наоборот, различные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названиях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обосноВнванным методом эмпирического исследования в психологии и в ряде других наук. Важная мысль К. Маркса о том, что одна экономическая эпоха отличается от другой не тем, что она производит, а тем, каким способом она это делает, относится в полной мере и к психологической науке. В период зрелоВнсти в ней, как и везде, все большее внимание направляется на способы познания и на критерии обоснования истинности знания.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследования в такихВ» например, направлениях психологии, как изучение личности, способВнностей. Здесь использование тестов позволило преодолеть методологиВнческий тупик, в котором оказались авторы многочисленных теорий, концепций, интуитивных догадок и иных умозрительных построенийВ» не видевших способа обоснования истинности своих суждений. НепоВнсредственное же обращение к практике как критерию истины дает нередко противоречивые результаты, ибо действительная научная аргуВнментация практикой требует определенного структурирования, опосредования, абстрагирования последней и, кроме того, методической вооруженности исследователя.

Только в последние годы в психологии стала широко осознаваться задача согласования теоретических конструкций с эмпирическими реВнзультатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являВнются сейчас, по-видимому, наиболее развитой в научном отношении частью методического арсенала, позволяющего адекватно скреплять теорию с эмпирией, в соответствии с некоторыми известными стандарВнтами качества информации. Именно такое понимание тестов все в большей мере начинает утверждаться в новейшей отечественной и заВнрубежной литературе.

Обоснование качества результатов психологических исследований требует нередкого обращения к вне психологическим понятиям и критеВнриям: философским, логическим, математико-статистическим. В частВнности, философский элемент в теорию психологических измерений вноВнсит известный тезис о неизбежности погрешности измерений. Критики психологических тестов нередко апеллируют к этому тезису как к осноВнванию принципиальной порочности тестов в смысле точности измереВнний. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления этого философского скепсиса является тезис о возможности приближенного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например, в физике те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представВнляющей предмет отдельного рассмотрения в данной книге, отметим здесь лишь ее связь с понятием ВлтестВ». Действительный отход от упрощенного понимания тестов требует наполнения интересующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из основ переосмысления сущности теста, а также одну из характеристик его качества. Без упоминания о надежности определение теста не имеет смысла, ибо тогда пропадает одна из тех самых differentia specificaВ» о которых говорил К. Маркс.

С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к определению наВндежности теста. Это тАФ повторное тестирование, использование паралВнлельных форм одного и того же теста и, наконец, однократное тестироВнвание с последующим разбиением матрицы исходных результатов Х на две или большее число частей. За показатель надежности приниВнмается значение коэффициента корреляции.

Заметно позже появились попытки теоретического осмысления этой концепции. Исходным пунктом всех построений является уже упомиВннавшийся тезис о неизбежности погрешности измерений и, как следВнствие, признание множественности возможных причин искажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концепции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появление надо рассматривать как реакцию на неприемлемость и искусственность ряда таких условий и ограничений, как например параллельность форм одного и того же теста, равенство дисперсий всех высказываний, одинаковая их коррелируемость друг с другом и др. Д. Армор использоВнвал известный факт корреляции тестовых высказываний между собой и стал рассматривать ее как аргумент, статистической функцией котоВнрого является надежность теста.

Если все высказывания измеряют один и тот же признак (свойство). то для фиксированного их числа чем больше корреляция между ними, тем более надежен тест. С другой стороны, высокая корреляция обесВнпечивает хорошую факторизуемость корреляционной матрицы (R) и, следовательно, является залогом выделения такого одного фактора, который может объяснить связь большей части дисперсии в R. СлеВндовательно, надежность тестов должна быть связана с результатом факторного анализа. Предложенная этим автором формула оказалась сравнительно простой:

где тАФ коэффициент надежности теста; k тАФ число высказываний;

1 тАФ наибольшее значение корня, получаемое при решении характеВнристических уравнений вида /RтАФJ/=0.

Помимо надежности в понятие ВлтестВ» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надежВнностью и валидностью можно образно представить в виде кучной стрельбы, но несколько в стороне от центра мишени, т. е. стрельба из оружия вполне надежного, но прицел стрелок выбрал не совсем точно.


3. Современный тест

Современный тест тАФ это не только надежный, но и валидный тест, однако, не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод "работает", т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социоВнлогами анкета будто бы годилась для решения поставленных задач. Первые же проявления действительно научной критики развенчали эту, по сути, ВлверуВ» в валидность. Они же стимулировали поиск. ПривлеВнчение к созданию тестов известных ученых было для научной общественности в начале века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов.

Поскольку в те годы тесты разрабатывались исключительно для решения практических проблем, эмпиризм и соответствующая ему меВнтодология стали главными для обоснования качества инструментария. Это особенно проявилось в создании тестов для решения кадровых проблем: профотбора, профориентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения.

С точки зрения истории можно выделить два основных, эмпиричеВнских подхода к валидизации тестов. Первый назовем прогностическим. Его логика такова. Если те, кто хорошо работают (по критерию У), показывают высокие результаты по какому-либо тесту (X), значит, здесь есть связь, быть может и причинная. Иначе говоря, У, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результаты по X, предполагается, что они покажут и более выВнсокую производительность труда. Ожидания такого рода часто сбыВнваются, но в различной степени. Другой подход к эмпирической валиВндизации тестов основан на использовании экспертных оценок. Здесь логика еще проще, тАФ если эксперты (множество авторитетов) соглаВнсованно считают одних более способными, других тАФ менее, значит Влэто такВ». В случае, когда результаты теста указывают на сходную тенденцию, т. е. данные по тесту коррелируют с данными экспертизы, то принимается, что тест валидный и его можно далее применять и в других подобных ситуациях. Так проводилась валидизация первого теста для измерения интеллектуальных способностей, а в наше время тАФ некоторых тестов для измерения социальВнных потребностей молодежи.

Развитие тестов в тесных рамках эмпиризма не могло продолВнжаться сколь-нибудь долгое время. Без теоретического мышления, как указывал Ф. Энгельс, невозможно связать между собой хотя бы два факта природы или уразуметь существующую между ними связь. Обращение к внеэмпирическим критериям истинности было неизбежным. Отсюда последовали такие подходы к валидизации, в которых теория сочеталась с эмпиВнрией. В качестве примера можно взять важную для традиционной псиВнхологии область научных конструктов, ключевых психологических поВннятий. Именно понятия и конструкты стали основным предметом мноВнгих исследований с помощью тестов. Последние призваны уточнить эмпирический состав индикаторов (высказываний), соответствующих таким конструктам-понятиям, как личность, темперамент, интеллект, экстраверт и многих других. В современной психологии они стали предВнметом эмпирического исследования, и делается это с целью фундаменВнтального обоснования практической значимости теоретических сужВндений.

Теперь пора ответить на последний вопрос, тАФ что же такое совреВнменный психологический тест? Это теоретически и эмпирически обосВннованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств. Теоретическое обоснование предполагает всесторонний анализ теста и результатов его применения в свете известных достижений современной психологичеВнской науки. Эмпирическое же обоснование связано с обращением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозивистским принципом верификации. Этому способствует наличие в обоих случаях требования эмпирического согласования теоретических конВнцепций (конструктов). Но, как справедливо отмечал Э. М. Чудинов, наука до и независимо от неопозитивизма руководствовалась требоВнванием принципиальной проверяемости своих теорий. Это всегда отлиВнчало науку от религии и натурфилософских построений, обеспечивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань, черточку научного познания, обратив ее против философии и против самой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непомерные ограничения и несовместим с ней.

Отмеченными выше критериями надежности и валидности проблеВнма обоснования научности тестов не закрывается. Из используемых сейчас двух критериев первый назовем общенаучным, а второй тАФ спеВнциально научным. Их широкое применение всего лишь дань сложивВншейся в теории тестов традиции. В ряде наук идеи валидности преломВнляются в виде стремления обосновать истинность, обоснованность, неВнобходимость, системность, рациональность и др. Ключевым критерием-принципом является истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметВнности знания, указывающего на степень его соотнесенности к познаваеВнмому. Но все это тАФ область специа

Вместе с этим смотрят:


Cистема роботи шкiльного психолога з профiлактики та подолання проблем статево-рольовоi поведiнки старшокласникiв


Features of evaluation and self-esteem of children of primary school age


Positive and negative values of conformism


РЖндивiдуально-психологiчнi особливостi здiбностей людини


А. Маслоу. Самоактуализирующиеся личности