Руководство к тесту
составляется для его пользователей —
организаций, специальных психологических
служб, профессиональных психологов,
педагогов, психиатров и некоторых
других специалистов. В руководстве,
как правило, излагаются следующие
сведения о тесте:
-
сведения о процедуре
разработки (теоретическое и операционное
определение, сфера применения, данные
о выборке, на которой проводилась
стандартизация, анализ пунктов теста,
валидности и надежности); -
требования к применению
(область распространения теста,
требования к пользователям, описание
процедуры проведения, стандарт тестового
материала); -
данные по обработке и
интерпретации результатов (образцы
регистрационного бланка и ключей,
процедура обработки таблицы для
перевода «сырых» баллов в стандартные
шкалы (нормы), примеры интерпретации
результатов).
А. Общие требования к информации,
содержащейся в руководстве.
Пользователи тестов
нуждаются в информации, которая
помогла бы применить тест стандартным
образом и оценить его в сравнении с
другими тестами, которые можно выбрать
для данной цели. Автор теста должен
представить хотя бы частичную
информацию, в которой нуждается
пользователь при выборе теста или при
его использовании. Практика авторов и
издателей в представлении информации
разнообразна. По некоторым тестам
пользователю представляются только
нечеткие указания к тестированию и
нормы для оценивания результатов, да
и те неизвестного происхождения.
Наоборот, другие тесты имеют руководства,
в которых представлена обширная и
детальная информация о разработке
теста, его валидности и надежности, а
также нормах, видах интерпретации
результатов и возможных областях
его применения.
А.1.
Когда тест становится доступным для
операционного использования, он должен
сопровождаться руководством, для того
чтобы сделать реальными требования,
которые предъявляются к его применению.
(Существенно.)
Комментарий.
Под термином «операционное пользование»
подразумевается принятие практических
решений относительно оценивания
индивидов, групп, учебных предметов,
терапевтической интерпретации и т.
д.
В зависимости от объема
сообщаемой информации, разнообразия
областей применения и пользователей,
термин руководство» может означать
документы монографического характера
или серию отдельных публикаций.
Данный термин может также
распространяться на процедурное
руководство по использованию тестов
или их батарей, например в ситуации
отбора; словесная формулировка и
значение данных о стандартных требованиях
могут быть иными для процедурных
руководств, однако принципы составления
руководства к тестам аналогичны.
А.1.1.
Если некоторая информация, необходимая
для подтверждения интерпретации
результатов, предложенных в руководстве,
не может быть представлена ко времени
публикации руководства, требование
А.1 может быть удовлетворено подчеркиванием
отсутствия и важности такой информации.
(Существенно.)
А.1.2.
Если информация слишком обширна для
сообщения в руководстве, она должна
быть обобщена и сопровождена ссылками
на другие соответствующие источники,
статьи или книги. (Очень
желательно.)
Комментарий.
Некоторые тесты имеют или объемные
технические руководства, или включают
соответствующую информацию в справочники
для пользователей, которые рекомендуются
для консультации. В других случаях
в руководстве дается только
существенная информация и ссылка
на другие полезные источники.
Публикации других лиц, не
связанных с автором теста, часто
выполняют многие функции руководства
к тесту. Если подобная публикация о
тесте предназначена в качестве
руководства, ее автор и издатели
отвечают за тест в той же степени, как
и авторы теста.
А.1.2.1.
Когда информация представлена
автором или издателем в отдельной
публикации, эта публикация должна
соответствовать тем же требованиям,
что и руководство, и не содержать
моментов, ведущих к ошибкам, так же,
как это требуется от руководства.
(Существенно.)
А.1.2.2.
Дополнительный материал к тесту должен
быть точным и полным и не должен давать
повода для ошибочного понимания.
(Существенно.)
Комментарий.
В случае, когда публикатор приводит
обширную и исчерпывающую библиографию
исследований, касающихся теста,
желательно снабдить ее комментариями
аннотациями.
А.1.2.3.
Информационный материал, предназначенный
для пользователя, не являющегося
специалистом в данной области, должен
быть точным, полностью соответствовать
целям его обращения к данному материалу
и написан языком, не допускающим
ошибочного понимания у читателя.
(Существенно.)
Комментарий.
Такая информация часто дается в виде
краткой памятки. При подготовке такого
краткого сообщения может учитываться
психологическая подготовленность
читателя, но это не позволяет
пропускать или искажать существенную
информацию. Если можно надеяться,
что читатель постоянно имеет дело с
такими сообщениями, необходимо приложить
усилия к повышению его способности
понимать детали.
А.2. Тест
и руководство к нему должны периодически
пересматриваться. Время пересмотра
зависит от изменения условий применения
или от исследовательских данных,
ввиду которых некоторые утверждения
в руководстве к тесту оказываются
неправильными или ведущими к ошибкам.
(Очень желательно.)
Комментарий.
Технические характеристики и
полезность теста изменяются с
изменением социальных условий и
установок, определенных видов труда,
условий и содержания обучения и
состава соответствующей популяции.
А.2.1.
Перепроверки теста, проведенные
после его публикации, вне зависимости
от благоприятности или неблагоприятности
для теста, должны быть учтены в
пересмотренных изданиях руководства
или в дополняющих сообщениях. В
руководство должны также включаться
данные не только авторов и публикаторов,
но и других исследователей. (Очень
желательно.)
А.2.2.
Когда тест пересмотрен или издана
его новая форма, руководство к нему
должно быть соответственно пересмотрено
с учетом изменений теста. Кроме того,
должны быть ясно указаны природа и
степень пересмотра, сравнимость
данных, полученных по старому и по
пересмотренному тестам. (Существенно.)
Комментарий.
Целесообразно, чтобы издатели указывали
на пересмотры руководств к тесту в
каталогах и принимали другие меры
для увеличения вероятности того,
что пользователь теста получит
текущую информацию.
А.2.2.1.
Когда на основе хорошо проверенного
теста разработана укороченная форма,
в руководстве должны быть представлены
данные о том, что задания в укороченной
форме адекватны заданиям в полной форме
или что укороченная форма измеряет
те же самые характеристики, что и полная
форма. (Очень
желательно.)
Комментарий.
Если короткая форма теста не была
разработана, но есть основание полагать,
что обычно тест используется в
укороченной форме, в руководстве
должно быть напоминание для читателя,
что данные, отраженные в руководстве,
не могут быть приложим к результатам
использования укороченной формы.
А.2.2.2.
Если укороченная форма разработана
путем сокращения числа заданий или
преобразованием части теста в отдельную
форму, то укороченный тест должен
пройти психометрическую проверку и ее
данные должны быть приведены в
руководстве. (Существенно.)
Комментарий.
В руководстве к тесту, имеющему две
альтернативные формы, необходимо
представить независимые данные для
каждой формы.
А.2.3.
При переводе теста с другого языка и
их адаптации в руководстве еле дует
указать все внесенные в тест изменения
и данные новой психометрической
проверки. (Существенно.)
А.3.
Наименования для публикуемых тестов
и для отдельных частей тестов должны
выбираться так, чтобы обеспечить
минимальный риск ошибок интерпретации
пользователями. (Существенно.)
Комментарий.
Желательно, чтобы наименования не
содержали многозначных терминов в
качестве измерительных характеристик.
Такие наименования как «свободный от
влияния культуры» «интеллект»,
«креативность», «интроверсия», «первичные
умственные способности», «показатель
продуктивности», сомнительны для
опубликованных тестов, не содержащих
необходимых свидетельств их продуктивной
валидности, так как могут предполагать
интерпретации, не вытекающие из
демонстрируемого смысла тестовых
оценок.
А.3.1.
Средства идентификации интересов
и свойств личности путем самоотчета
следует называть не «тесты», а
«опросники», «вопросники», «оценочные
листы», «оценочные шкалы». (Очень
желательно.)
Комментарий.
Когда о таких инструментах говорится
в руководстве, слово «тест» может
использоваться для упрощения языка
даже в том случае, если оно отсутствует
в наименовании.
А.4. Если
тест предназначен только для
исследовательского пользования и не
может быть распространен для широкого
применения, это должно быть ясно
выражено в сопровождающих материалах.
(Существенно.)
Комментарий.
Если психолог, разрабатывающий новый
диагностический тест, например, для
изучения личности, передает свой
инструмент для исследований другим
научным работникам до того, как сочтет
тест готовым для операционного
пользования, на обложке руководства,
а также в каталоге, где он зарегистрирован,
следует печатать «Распространение
только для исследовательского
пользования». Это служит предупреждением
против поспешного использования
инструмента.
А.5. В
руководстве должна быть указана
квалификация пользователя. (Существенно.)
Комментарий.
Обычно на обложке руководства
ставится обозначение, соответствующее
уровню квалификации пользователя: (А)
— тестом может пользоваться любой
человек; (Б) — пользователь должен
пройти полный курс обучения психодиагностике
и иметь законченное высшее гуманитарное
образование; (В) — пользователь
должен иметь опыт в тестировании,
подтвержденный соответствующими
документами, и иметь как минимум
законченное высшее психологическое
образование или быть членом психологической
ассоциации. При покупке тестов группы
(В) обязательно предоставление
квалификационного документа.
Б. Сведения о процедуре разработки
теста.
Ответственность за заключение
о смысле и ограничениях в использовании
тестовых результатов ложится в первую
очередь на пользователя. Однако в этом
случае он частично зависит от доступной
информации о тесте, приводимой его
составителем.
Руководство к тесту не
может полностью подготовить
пользователя к интерпретации данного
теста. Ему приходится делать выводы,
не подтвержденные опубликованными
свидетельствами. Так, профориентатор
не может надеяться на наличие данных
о валидности теста для каждого вида
труда, относительно которых он на основе
тестовых оценок делает наиболее
надежные предсказания. Специалист по
профконсультации или трудоустройству
может иметь дело с испытуемыми, которые
не могут быть отнесены ни к одной из
групп, для которых имеются нормативные
или валидационные данные. Учитель может
оценивать содержание теста достижений
соответственно принятым целям и
особенностям обучения, клиницист
должен соотнести общие данные теории
с собственной интерпретацией данных
по опроснику личности. Степень, с
которой руководство подготовит
пользователя к точной интерпретации
и эффективному использованию теста,
зависит от типа теста и способов его
применения. На составителя теста
возлагается ответственность за
представление информации, необходимой
для правильных суждений. Он должен
приложить все возможные усилия, чтобы
тест не был неправильно употреблен или
неправильно интерпретирован.
Б.1. В
руководстве к тесту должна быть полностью
описана процедура создания теста:
его концептуальная основа, детали
разработки заданий теста и их отбора,
психометрическая проверка надежности
и валидности и другие исследования.
(Существенно.)
Б.2. В
руководстве к тесту должны быть ясно
отражены теоретические положения,
на которых основан тест, и подробно
раскрыта природа характеристик, для
измерения которых тест предназначен.
(Существенно.)
Комментарий.
Ясное описание диагностируемых
переменных, а также характер измерения
позволяют пользователю судить,
насколько тест соответствует его
собственному пониманию, а также насколько
статистические данные характеризуют
его действенность.
Б.2.1.
Диагностический конструкт (концепт)
должен быть сформулирован в теоретических
понятиях и соотнесен на теоретическом
уровне с системой релевантных
конструктов (теоретическое определение).
(Существенно.)
Б.2.2.
Особое внимание должно быть обращено
на операциональное определение
диагностического конструкта.
Операциональное определение — это
определение конструкта в эмпирических
категориях, отражающих ситуацию, в
которых он актуализируется, а также
реакции (поведение, переживания,
представления), в которых данный
конструкт проявляется. (Существенно.)
Комментарий.
Пользователь теста нуждается в
информации, которая позволила бы
ему сравнивать собственную концепцию
конструкта с концепцией автора
теста.
Б.3.
Руководство теста должно указать
диагностические цели и сферы приложения,
для которых тест рекомендован.
(Существенно.)
Комментарий. Ясное указание
целей теста содействует предупреждению
ошибочного истолкования тестовых
оценок. Надо обратить внимание
пользователя на содержание в
руководстве доказательства
предложений, принятых автором.
Например, если тест достижений
рекомендован как тест обследования
знаний учащихся, важно точное описание
его содержания. Если, с другой стороны,
он рекомендован как диагностический
тест или тест для выбора вида деятельности,
требуются данные об его связи с одним
или несколькими критериями.
Б.3.1.
Должна быть четко выделена область
применения, под которой подразумевается
особая социальная среда или сфера
общественной практики (производство,
медицина, семейная жизнь и т. п.),
контингент испытуемых (пол, возраст,
образование, профессиональный опыт,
на производстве, в обществе). (Существенно.)
Б.3.2. В
руководстве должны быть конкретизированы
цели использования результатов: для
прогноза успешности профессиональной
деятельности, психологического
вмешательства, принятия правовых,
судебно-административных решений,
прогноза стабильности коллектива
и т. п. (Очень желательно.)
Б.4.
Руководство к тесту должно отразить
репрезентативность выборки заданий,
процедуру их отбора и психометрические
характеристики заданий. (Существенно.)
Комментарий.
Для тестов, представляющих собой
гомогенную, дискриминативную шкалу
или набор таких шкал, процедура отбора
заданий проводится следующим образом:
каждое задание проходит проверку
на трудность и дискриминативность, на
соответствие заданий нормальному
распределению и их степень отношения
к одному фактору. Выборка для анализа
должна отражать популяцию и в общем
случае для проверки одной формы теста
состоять как минимум из 100 человек.
Б.4.1.
Данные, собранные в ходе разработки
теста (до получения конечной формы),
должны быть отделены от данных,
относящихся к тесту в его конечной
форме. (Существенно.)
Б.5. В
случае если тест не разрабатывается
вновь, а переводится с другого языка,
он должен пройти полную психометрическую
проверку, так же как вновь разрабатываемый
тест. (Существенно.)
Б.5.1.
При переводе руководства к тесту
проверяется эквивалентность
диагностических конструктов и концептов,
лежащих в основе тестовых задач.
(Существенно.)
Стандартные требования
к надежности и валидности. Составитель
теста должен привести в руководстве
сведения о надежности и валидности
теста. Многие пользователи тестов также
выполняют подобные исследования,
опираясь на собственное применение
тестов. Их научные сообщения часто
отличаются от приведенных в руководстве
к тесту как более детальные и более
специфические, описывающие более
узкие сферы использования теста.
Несмотря на эти различия, в обоих случаях
стандартные требования для исследований
и сообщений по ним должны быть в общем
сходными.
В. Надежность и ошибка измерения.
Надежность — характеристика
методики, отражающая точность
психодиагностических измерений, а
также устойчивость результатов
теста к действию посторонних случайных
факторов.
В основе анализа надежности
теста лежит представление об истинных
оценках и ошибках измерения. Распределение
оценок, полученных на генеральной
совокупности при выполнении теста,
измеряющего одну характеристику,
теоретически должно подчиняться
нормальному закону. Поэтому при
разработке теста исследователю
необходимо отбирать задания таким
образом, чтобы распределение реальных
тестовых оценок было по возможности
близко к нормальному.
Для определения ошибки
измерения используются на практике
корреляционные методы, позволяющие
определить надежность через устойчивость
и согласованность результатов.
Классические методы оценки коэффициентов
надежности требуют корреляции по
меньшей мере двух совокупностей сходных
измерений.
Один из методов получения
двух совокупностей измерений — это
ретестирование (повторное обследование
одной и той же выборки испытуемых).
Несмотря на простоту и возможность
определения устойчивости результатов
теста в течение времени, дефект метода
в том, что субъект помнит свои ответы,
и в случае тестов способностей это
может существенно влиять на повторные
ответы.
Если мы желаем исключить
влияние запоминания на результаты
ответов как систематический источник
ошибки и учесть влияние временного
интервала на ответы, то можем использовать
две совокупности заданий, разработанных
или отобранных по одной системе. Это
— параллельные тесты. Недостатком
в данном случае является то, что
очень трудно построить на практике
параллельные формы одного и того же
теста.
Если желательно изучить
только влияние содержания выборки
без влияния запоминания или вариативности
ответов во времени или если практически
нецелесообразно проводить две
параллельные формы в разное время,
надежность может быть оценена проведением
одного теста без ограничения во времени.
В данном случае тест может быть разделен
на две равные части. Полученные показатели
по двум частям теста коррелируются
обычным методом. Но эта корреляция
отражает лишь надежность половины
теста. Для вычисления надежности всего
теста по методу расщепления используют
формулу Спирмена-Брауна.
Оценка надежности на основе однократного
тестирования может быть получена
путем использования формулы, известной
как коэффициент альфа.
Рекомендуется также оценить
надежность теста относительно
экспериментатора как оценщика и как
экспериментатора.
Из предыдущего видно, что
различные методы оценивания надежности
исходят из различных источников ошибок.
Так, на результаты ретестирования
влияет не только случайная вариативность
ответов или изменение субъектов во
времени, но также различия в поведении
(особенно если ретестирует другое
лицо). Коэффициенты надежности,
основанные на однократном тестировании,
исключают вариативность ответов во
времени, т. е. влияние ответов на баллы
не проявляется как ошибка измерения.
Следовательно, «коэффициент
надежности» — обобщенный термин.
Он может основываться на разных типах
свидетельств — каждый тип предполагает
иной смысл. Очень важно, чтобы метод,
использованный для получения коэффициента
надежности, был четко описан.
Автору теста рекомендуется
в руководстве описать значение
любого коэффициента насколько
возможно точно. Например, высказывание:
«Этот коэффициент показывает стабильность
измерения эквивалентных баллов,
основанных на параллельных формах
тестов, проведенных с промежутком в 7
дней, при этом научение испытуемых
исключается» хотя и длинное, но
свободно от двусмысленности.
Коэффициенты надежности
имеют ограниченную практическую
ценность для пользователей теста.
Стандартная ошибка измерения обычно
более полезна, т. к. обладает относительной
независимостью и может быть использована
для установления пределов определенной
вероятности балла. Пользователи
теста могут употребить коэффициент
надежности для сравнения тестов, но
для интерпретации тестовых баллов
используется стандартная ошибка
измерения.
В.1. В
руководстве к тесту должны быть
достаточно подробно описаны процедуры
и выборки, использованные для определения
коэффициентов надежности, сами
коэффициенты и ошибки измерения, что
позволит пользователю судить о том, в
какой степени эти параметры приложимы
к лицам или группам, с которыми он имеет
дело. Если некоторые из необходимых
данных не были получены, то отсутствие
такой информации должно быть отмечено.
(Существенно.)
Комментарий.
Для пользователя важно получить
несколько типов оценки надежности.
Полезным является сообщение
стандартных ошибок измерения, полученных
в разных группах. Следует привести
среднее значение и дисперсию выборки
и информацию о ее составе. Надежность
теста, предназначенного для отбора
работников, проверяется при тестировании
кандидатов на должность, а не школьников
или уже работающих. Если указывается,
что тест пригоден для различных
возрастных групп, следует привести
данные о надежности для каждого класса
или возраста. Авторы и публикаторы
тестов должны избегать необщепринятых
статистических процедур, если применимы
традиционные. Если представлен
необщепринятый статистический анализ,
он должен быть объяснен так, чтобы
свести к минимуму вероятность
ошибочной интерпретации.
В.1.1. В
руководстве к тесту следует представить,
насколько это возможно, количественный
анализ всех факторов, снижающих
надежность измерения: несогласованность
ответов субъекта; несогласованность
или неоднородность внутри выборки
содержания теста (стимульные задания,
вопросы, ситуации и др.); несогласованность
в проведении теста; несогласованность
между оценщиками, экспертами или
единицами математического аппарата;
механические ошибки при выставлении
баллов. (Желательно.)
Комментарий.
Подобный анализ может быть неосуществим,
если результаты теста выражены не в
количественной форме, а в категориальной
или непараметрической.
Для группы тестов школьных
достижений основными источниками
ошибок, подлежащих оценке, являются:
а) несогласованность в содержании
теста; б) несогласованность в
проведении теста; в) нестабильность
ответов испытуемых. Сбор данных
производится для оценки этих трех
факторов. Колебания или несогласованность
ответов субъекта сами по себе могут
быть важной переменной. Они часто
бывают главными источниками подлежащей
оцениванию случайной ошибки. Также
должна быть оценена несогласованность
между оценщиками.
В.1.2.
Стандартные ошибки измерений и
коэффициенты надежности должны
приводиться как для итогового балла,
так и для его частей, комбинаций баллов
(сумм, разниц, производных показателей),
если они рекомендованы в руководстве
к тесту (явно или неявно) для практического
использования, за исключением опытных
и экспериментальных. (Существенно.)
В.1.3. В
руководстве должно быть указано
минимальное различие между двумя
баллами, обычно требуемое для
статистической значимости на
определенном уровне. (Очень
желательно.)
В.1.4. В
руководстве должны быть описаны все
характеристики выборки, которые
могут оказывать влияние на надежность
оценивания. (Существенно.)
Комментарий.
В руководстве следует отразить такую
демографическую информацию, как
распределение субъектов по возрасту,
полу, экономическому и интеллектуальному
уровню, трудовому статусу или прошлой
трудовой деятельности, месту
жительства. Для стандартизированных
тестов при вычислении коэффициентов
надежности выборку следует формировать
случайным образом из генеральной
совокупности.
В.1.5.
Если тест рекомендован или обычно
используется в однородных подгруппах,
для каждой из них независимо должна
быть исследована надежность и ошибка
измерений, и это должно быть сообщено
в руководстве к тесту. (Существенно.)
В.1.6. В
руководстве к тесту должна быть сообщена
стандартная ошибка измерения для
разных уровней баллов. (Желательно.)
Комментарий.
В руководстве к одному тесту способностей
сообщаются стандартные ошибки для трех
уровней баллов: на уровне среднего
балла, на уровне одного стандартного
отклонения выше среднего и на уровне
одного стандартного отклонения ниже
среднего. Так как наиболее существенные
вариации ошибок измерения связаны
с крайними баллами, лучше опираться,
если позволяет количество доступных
случаев, на более широкий диапазон
уровней баллов.
В.1.7.
Неизвестные статистические характеристики
данных должны быть описаны со ссылками
на литературные источники, отражающие
разработку. (Существенно.)
Внутренняя согласованность.
В.2. В
руководстве должны быть представлены
данные о внутренней согласованности
(гомогенности, консистентности тест).
(Очень желательно.)
Комментарий.
Внутренняя согласованность важна,
если задания рассматриваются как
выборка из относительно однородного
общего множества (например, тест сложения
целых чисел, словарный тест для средней
школы, тест, предположительно измеряющий
интроверсию и т. п.). Меры внутренней
согласованности не заменяют иных
мер.
В.2.1.
Оценки внутренней согласованности
определяются соответствующими методами
расщепления пополам, при помощи
коэффициента альфа или других процедур,
которые должны быть адекватны
анализируемым данным. Любая другая
мера внутренней согласованности,
которую автор дополнительно сообщает,
в руководстве к тесту должна быть
подробно объяснена. (Очень
желательно.)
Комментарий.
Коэффициенты парного расщепления
отражают суждения экспертов и обнаруживают
тенденцию быть выше, чем коэффициенты
случайного расщепления. Дисперсионный
анализ обычно дает более низкие оценки
по сравнению с приемами парного
расщепления. Могут быть полезными
специальные коэффициенты: они должны
быть описаны так, чтобы читатель мог
понять их соотношение с общепризнанными
оценками.
В.2.2.
Оценки внутренней согласованности не
следует вычислять для скоростных
тестов. (Существенно.)
В.2.3. Если
тест состоит из отдельно оцениваемых
частей или разделов, в руководстве к
тесту следует сообщить корреляцию
между частями или разделами вместе с
соответствующими оценками надежности,
а также с соответствующими средними и
стандартными отклонениями. (Очень
желательно.)
В.2.3.1.
Если в руководстве сообщается
корреляция между баллом по отдельному
субтесту и общим тестовым баллом,
необходимо подчеркнуть, что коэффициент
неоправданно высок, так как он основан
на совпадении ошибок измерения субтестом
и общим тестовым баллом. (Существенно.)
В.2.4.
Если несколько вопросов внутри теста
экспериментально связаны так, что ответ
на один вопрос влияет на другой вопрос,
предпочтительно относить целую группу
вопросов к одной из двух половин теста,
когда применяются методы случайного
или парного распределения пополам. Тот
факт, что число заданий в этих половинах
не равно, не вызывает затруднений при
соответствующей процедуре анализа.
(Очень желательно.)
Ретестирование.
В.3. В
руководстве к тесту должны быть
представлены результаты ретестиро-вания,
т. е. пользователь должен знать, насколько
оценки стабильны. (Существенно.)
Комментарий.
Ретестовая надежность показывает,
в какой степени результаты теста
можно распространить на различные
случаи его применения. Приводя в
руководстве ретестовую надежность,
всегда необходимо указывать, в каком
интервале времени она измерялась и
какие влияния на испытуемых имели место
в этот период. На практике ретестовая
надежность в ряде случаев бывает
важнее, чем надежность по однородности.
Если нет ретестовой надежности, тест
не может быть валидным. Исключение
составляют тесты, для которых
ретестирование не применяется (тесты
оценки состояний, эмоций).
Считается обоснованным
требовать оценивания стабильности для
проективных техник и других средств
оценки личности, даже если в некоторых
случаях известно, что низкая стабильность
ретестирования за существенный период
отражает только истинное изменение
свойства. Клиническая практика редко
допускает, что выводы из проективных
тестов приложимы к дню исследования.
Реально считается, что на основе
тестовых данных принимаются прагматические
решения, имеющие смысл в течение как
минимум нескольких дней, а обычно —
недель или месяцев терапии. Если
обнаруживается, что результаты некоторого
теста очень нестабильны при интервале
в несколько дней, это свидетельство
вызывает сомнения в пригодности теста
для большинства целей, даже если эта
изменчивость может быть объяснена
гипотезой об изменчивости свойства.
Исследователь может столкнуться с
психологической характеристикой
или результатом обучения, который за
короткое время изменяется. В этом случае
важно не смешивать неустойчивость
свойства с нестабильностью измерения.
В.3.1.
При определении стабильности баллов
повторным тестированием целесообразно
использовать параллельные формы теста,
чтобы свести к минимуму припоминание
отдельных ответов, особенно при небольшом
интервале между тестированиями. (Очень
желательно.)
В.3.2.
При описании исследования согласованности
баллов во времени в руководстве к тесту
необходимо указать, какой промежуток
времени прошел между тестированиями,
и привести средние стандартные отклонения
баллов для каждого тестирования, а
также коэффициент корреляции.
(Существенно.)
В.3.3. Если
есть основание ожидать, что тестовые
баллы за некоторый период существенно
изменяются в соответствии с образовательными
или развивающими воздействиями, в
руководстве следует предупредить
пользователей об этой возможности.
(Очень желательно.)
В.3.4.
При сообщении о стабильности тестовых
баллов в руководстве к тесту необходимо
описать накопление соответствующего
опыта, обучение или лечение испытуемого
за период между тестированиями.
(Существенно.)
Сравнимость форм.
В.4. Если
опубликованы две формы теста,
предназначенные для возможного
применения к тем же испытуемым, в
руководстве к тесту должны быть
сообщены средние и дисперсии двух форм
вместе с коэффициентами корреляции
двух совокупностей баллов. Если в
руководстве не представлены необходимые
данные, пользователь должен быть об
этом предупрежден. (Существенно.)
Комментарий.
Для каждой формы следует представить
обзор таких характеристик заданий,
как частотные распределения
показателей трудности и дискриминативности
заданий. Следует представить также
содержательный анализ каждой формы.
Следовательно, необходимо отразить
как частотные распределения статистических
характеристик заданий, так и таблицы
заданий по группам их содержания,
характеристик поведения и учебных
целей.
Формы должны включать
различные выборки заданий из каждой
категории содержания. Искусственно
близкое сходство между формами может
быть вызвано совпадением заданий
или разработкой второй формы простой
перефразировкой заданий первой формы.
Коэффициент надежности будет
чрезмерно высоким, т. к. не учитывается
ошибка выборки из общего множества
заданий.
Г. Валидность (обоснованность) теста.
Вопросы валидности — это
вопросы о том, какие и насколько
обоснованные выводы могут быть сделаны
на основе тестовых оценок. Вопросы,
относящиеся к валидности, могут быть
сведены к двум: 1) какие выводы можно
сделать о том, что измерялось тестом;
2) какие выводы могут быть сделаны о
реальном поведении человека,
отличающемся от наблюдаемого при
тестировании.
1-й вопрос выясняет внутреннюю
природу самого измерения. Тест, как
измерительный инструмент, является
операционализацией психического
свойства или специфической области
умения или знания. В этом плане
существенной проблемой является
получение заключений о полноте отражения
тестовыми баллами этой области, и в
этом смысле следует говорить о
внутренней (конструктной) валидности.
2-м вопросом выясняется
полезность тестового измерения в
качестве предсказателя поведения.
В этом плане существенной проблемой
является получение заключения о том,
насколько тестовые баллы связаны с
некоторой другой деятельностью, и
в этом смысле следует говорить о
внешней (критериальной) валидности.
Важно отметить, что валидность
не измеряется, о ней только судят. В
руководстве могут быть приведены
коэффициенты валидности, но о
валидности теста для конкретного его
использования судят по набору
коэффициентов. Следовательно, валидность
есть нечто такое, о чем судят как об
удовлетворительном или неудовлетворительном
для вынесения соответствующего
суждения.
Виды валидности зависят
от видов заключений, которые желательно
извлечь из тестовых оценок. Традиционно
описывают три взаимозависимых типа
интерпретации заключений, обобщающих
подавляющее большинство возможностей
применения тестов: валидность по
критерию, содержательная и конструктная.
Валидность по критерию может быть
предсказательной и конкурентной.
Эти аспекты могут
рассматриваться независимо друг от
друга, однако независимость эта
условна. Они связаны операционально и
логически, в конкретной ситуации
редко бывает, чтобы лишь один из них
был важен. Полное исследование теста
часто включает информацию обо всех
видах валидности.
Валидность по критерию
и ее виды. Данная
форма валидности используется, когда
хотят сделать вывод о связи тестовой
оценки индивида с независимыми от
теста внешними параметрами, называемыми
критерием. Предсказательная валидность
отражает степень, с которой будущий
уровень по критерию может быть предсказан
предшествующей деятельностью по
тесту. Конкурентная валидность отражает
степень, с которой тест может быть
использован для оценки у индивида
актуального уровня по критерию. Это
различие важно. Предсказательная
валидность включает отрезок времени,
в течение которого может нечто
случиться (например, люди обучаются,
приобретают опыт, подвергаются лечению).
Конкурентная валидность отражает
только статус индивида в фиксированное
время. При соответствующих условиях
данные о конкурентной валидности
могут быть использованы для оценки
предсказательной валидности теста.
Однако конкурентная валидность не
может использоваться взамен
предсказательной без соответствующего
логического обоснования. Для многих
применений тестов (решение по отбору,
назначению лечения и др.) предсказательная
валидность дает возможность определить
целесообразность использования теста
или батареи тестов в каждом отдельном
случае. Другие формы валидности не
заменяют валидность по критерию. В
руководствах к тестам, разработанным
в предсказательных целях, а также
предназначенным для диагноза, должны
быть отражены исследования валидности
по критерию. В противоположном случае
такие тесты могут рассматриваться
только как исследовательские версии.
О сомнительности отдельного
вычислительного коэффициента
валидности говорят многие факторы.
Условия исследования валидности
никогда точно не повторяются. Быстрое
изменение условий может ограничить
точность и полезность предсказательного
исследования. Логика предсказательной
валидизации предполагает, что
условия, существующие в начале
испытаний, будут существовать и после
завершения исследования.
Логика валидности по
критерию предполагает валидность
самого критерия. Очень часто тесты
валидизируются относительно
доступного критерия вне соответствующего
исследования самого критерия.
Ценность исследования валидности по
критерию зависит от пригодности и
качества измерения по данному
критерию. В прикладных исследованиях
критерий должен выбираться в
соответствии с изучаемой проблемой,
а тест или другое средство оценивания
должны выбираться относительно
данного критерия. Если исследование
предназначено в первую очередь для
улучшения представлений о том, что
измеряется тестом, критерии должны
избираться на основе заключений о
природе конструкта, отражаемого
тестовыми оценками. В любом случае
адекватность исследования зависит
от адекватности критерия.
Логика валидности по
критерию предполагает, что выборка
полностью репрезентативна для
популяции, для которой позднее будут
делаться заключения. На практике выборки
часто не являются репрезентативными,
например, из-за ограниченного объема,
предвзятого отбора или утомления
испытуемых до завершения валидизационного
исследования.
Во многих практических
ситуациях валидизационные исследования
не могут охватить адекватного числа
случаев, и исследователи вынуждены
публиковать лучшее из того, что они
могут при имеющихся данных. Видимо,
лучше попытаться исследовать
валидность по критерию хотя бы каким-то
образом, чем принять совершенно
непроверенную гипотезу — результаты
неадекватного исследования могут
ввести в заблуждение. Особенно
сомнительны результаты валидизационных
исследований при резко ограниченном
ранге или малом количестве испытуемых.
Содержательная валидность.
Свидетельства о
ней требуются, когда пользователь
теста желает оценить, как индивид будет
действовать в ситуации, которую по
предположению будет представлять тест.
Содержательной валидностью обычно
характеризуются тесты умений и
знаний, опросники личности,
поведенческие опросники или средства
измерений различных способностей.
Данное обсуждение относится к
наиболее типичному случаю — тестам
достижения.
Чтобы выразить содержательную
валидность совокупности тестовых
баллов, необходимо показать, что
поведение испытуемых при тестировании
является репрезентативной выборкой
многих видов поведения в желаемой
области деятельности. Любое исследование
содержательной валидности требует,
чтобы составитель или пользователь
теста определил свои цели и исчерпывающе
определил область деятельности в
свете этих целей. Определение обычно
относится к результатам учения, а
не к процессу, в ходе которого достигается
или обнаруживается научение. Оно должно
быть достаточно детальным и четким,
чтобы отразить степень, с которой
компоненты деятельности образуют
целостную область.
Конструктная валидность.
Психологический
конструкт является теоретической
идеей, разработанной для объяснения
и организации некоторых аспектов
существующего знания. Такие термины,
как «тревожность», «способность к
канцелярскому труду» или
«подготовленность по чтению», отражают
конструкт, но конструкт может
обозначать больше, чем его название.
Иногда необходимо постулировать
несколько различных конструктов, чтобы
объяснить дисперсию данной совокупности
тестовых баллов. Более того, могут
потребоваться различные конструкты
для объяснения дисперсии различных
тестов того же типа, или отдельный тест
может отразить данные о нескольких
конструктах. Конструктная валидность
имеет место при оценивании теста
или другой совокупности операций в
свете рассматриваемого конструкта.
Суждения по конструктной валидности
полезны, когда составитель или
пользователь теста желает знать об
измеренном психологическом свойстве
больше, чем позволяет отдельный
коэффициент валидности по критерию,
и особенно когда необходимо
усовершенствовать измерение для
научного изучения конструкта.
Свидетельства о конструктной
валидности нельзя получить в одном
отдельном исследовании — суждения о
ней основаны на совокупности
исследовательских результатов. Вначале
исследователь формулирует гипотезы
о различии между лицами с высокими
и низкими результатами по тесту. Такие
гипотезы в совокупности образуют
предварительную теорию конструкта.
При полном изучении тест выступает
в качестве зависимой переменной в одних
исследованиях и в качестве независимой
— в других. Некоторые гипотезы могут
быть «контргипотезами» конкурирующих
теорий или интерпретаций.
Гипотезы и теоретические
формулировки ведут к некоторым
предсказаниям о том, как люди с различными
баллами по тесту будут выполнять тест
или проявлять себя в некоторых
определенных ситуациях. Если теория
исследователя верна, большинство
предсказаний должно подтвердиться.
Если этого не случится, исследователь
может пересмотреть определение
конструкта или перестроить тест так,
чтобы он стал лучшей мерой подразумеваемого
конструкта. Путем последовательной
верификации, модификации или отклонения
гипотез исследователь все глубже
проникает в сущность измеряемого
тестом свойства.
Доказательства конструктной
валидности можно получить в ходе
разработки самого теста. Хотя
доказательства конструктной
валидности могут быть получены на
основе серии исследований по внешним
критериям, важно отметить, что они
неадекватны доказательствам
пригодности конструкта для других
гипотез.
Составитель теста или любое
лицо, исследующее валидность, должны
представить по мере возможности
максимум информации о валидности, чтобы
пользователь мог оценить тест по
отношению к собственным целям. В
руководстве к тесту необходимо
отразить данные, позволяющие
пользователю оценить пригодность
содержания заданий, установить, является
ли тест приемлемой мерой рассматриваемого
конструкта, и решить, характеризуется
ли тест предсказательной валидностью
в других подобных ситуациях.
Г.1. В
руководстве должна быть указана
валидность теста для всех видов
заключений, для которых он рекомендуется.
Если его валидность для некоторой
предполагаемой интерпретации не
была изучена, этот факт должен быть
указан. (Существенно.)
Комментарий.
Исследование валидности является
частью разработки теста; пользователь
нуждается в том, чтобы составитель
сообщил об этом подробно в руководстве
к тесту. По меньшей мере, в руководстве
должны быть отражены исследования
самого составителя или других
исследователей, опубликованные в других
изданиях. Предпочтительно, чтобы в
руководстве были отражены отдельные
исследования и представлены обобщенные
данные о валидности для различных видов
интерпретаций или выводов.
Г.1.1.
Данные о валидности должны быть сделаны
на основании всех типов тестовой
валидности. (Существенно.)
Комментарий.
Неправильно использовать выражение
«валидность теста», не указывая вид
валидности. Не существует тестов,
валидных для всех целей или во всех
ситуациях, а также для всех групп
индивидов. Любое исследование валидности
относится к некоторым из возможных
применений или видов теста, получаемых
на основе баллов.
Если тест может быть неправильно
использован в некоторых областях
применения, в руководстве должны
быть специальные предостережения.
Г.1.2.
Если предполагается интерпретация
не только баллов субтеста, но и различных
индексов, в руководстве должны быть
помещены свидетельства, подтверждающие
правомерность такой интерпретации.
(Существенно.)
Г.1.2.1.
Разработчик должен предупредить
пользователя о невозможности
рассматривать ответы на отдельные
задания теста в качестве основы для
составления заключений об испытуемом.
Если подобная оценка заложена в
структуре теста, то в руководстве должно
быть приведено подробное обоснование
такого применения.
Г.1.3.
Чтобы обеспечить правильную интерпретацию
баллов в течение длительного времени,
валидность предполагаемых интерпретаций
должна периодически перепроверяться
и результаты сообщаться в последующем
руководстве. (Очень
желательно.)
Комментарий.
Требования к труду, условиям работы
и людям, работающим по данной
профессии, с течением времени часто
существенно изменяются. Подобным
образом изменяется смысл клинических
категорий, типы медикаментозного
лечения, цели и содержание обучения.
Следовательно, пользователь должен
быть в состоянии судить о том, устарел
тест или нет.
Г.1.3.1.
При изменении факторов, которые
могли повлиять на результаты выполнения
или на валидность предполагаемой
интерпретации теста, в случае если для
изменившихся условий не произведена
ревалидизация, тест должен быть исключен
из общего употребления и распространяться
среди лиц, которые будут производить
изучение его валидности. (Очень
желательно.)
Г.1.4.
Корреляции баллов заданий с общим
тестовым баллом могут рассматриваться
только как показатели дискриминативности
заданий, не могут рассматриваться
или использоваться в качестве
коэффициентов их валидности.
(Существенно.)
Комментарий.
Коэффициенты дискриминативности
заданий полезны при суждении о
конструктной валидности, и эту информацию
следует включать в руководство к
тесту. Однако такие коэффициенты
являются не показателями валидности
теста, а только мерой внутренней
согласованности.
Г.2.
Выборка, использованная в исследовании
валидности, и условия, при которых
проводилось тестирование, должны быть
подробно описаны, чтобы пользователь
мог судить, распространима ли сообщенная
валидность на его ситуацию. (Существенно.)
Г.2.1. В
руководстве к тесту следует указать
все параметры, определяющие состав
валидационной выборки. Выборка должна
быть описана по тем переменным, о которых
известно, что они влияют на валидность:
возраст, пол, социоэкономический статус,
национальное происхождение, также
другие демографические и психологические
характеристики. (Существенно.)
Комментарий.
Если валидационные исследования
используют пациентов в качестве
испытуемых, то важно указать диагнозы.
Если возможно, то необходимо показать
обоснованность диагностики (строгость
условий диагностики). Для тестов,
используемых в индустрии, должен быть
описан трудовой статус, профессиональный
опыт, пол и национальный состав выборки.
Для школьных тестов уместной является
информация о характеристиках популяции
или принципах отбора.
Г.2.2.
Доказательства валидности тестов
должны быть получены для субъектов,
которые по возрасту, образованию или
профессиональной подготовленности
соответствуют лицам, для которых
тест рекомендуется. В руководстве
должны быть отражены отклонения от
этого требования. (Существенно.)
Комментарий.
Информация о валидности тестов,
предназначенных для профориентации,
должна в общем определяться на субъектах,
тестированных незадолго до
образовательного или профессионального
выбора или сразу после него.
Вопросник интересов,
стандартизированный на мужчинах,
работающих по исследуемой профессии,
не обеспечивает использование вопросника
в профориентации учащихся средней
школы, поскольку полученные шкалы
не дифференцируют группы учащихся.
Лучшее доказательство было получено
после проверки вопросника на учащихся
с определением характера из последующей
работы и установлением связи между
данными вопросника и последующей
профессией.
Если вопросник интересов
использует критерий приобретения или
неприобретения некоторой профессии,
в выборке, использованной для его
валидизации, должны быть только лица
со способностями, соответствующими
данной группе профессий.
Г.2.3.
При описании выборки должны быть
приведены основные статистические
данные, включая число наблюдений (и
обоснование наблюдений), меры центральной
тенденции вариативности. Следует
также отразить особенности распределения,
возможно, с мерами асимметрии и эксцесса.
(Очень желательно.)
Комментарий.
Чем меньше объем валидационной выборки,
тем менее надежны статистические
данные. Когда число наблюдений очень
мало, нулевой коэффициент корреляции
может привести к ошибочному отклонению
валидного теста.
Г.2.4. Если
тестовые баллы в валидационной
выборке имеют распределение, существенно
отличающееся от распределения баллов
в группе, для которой он будет обычно
использоваться, то данные, основанные
на этих баллах, включая оценки
параметров популяции, следует
интерпретировать с большой
осторожностью. При сообщении оценок
параметра необходимо привести
исходные статистические данные, а также
характеристики распределения,
использованные при введении новой
оценки, и использованные статистические
процедуры. (Существенно.)
Комментарий.
Пользователю руководства следует
предоставить возможность оценить
любое искажение, возникающее
вследствие нетипичности характера
выборки. Предположения, обусловливающие
причины такого искажения, часто
игнорируются, вследствие этого
невозможно определить степень и
направление ошибок. Несмотря на эти
трудности, часто необходима оценка
подходящей статистики. Например,
коэффициент валидности должен
отразить предсказательную способность
в группе, к которой тест будет применяться.
Г.2.5.
Если тест способностей предназначен
для учебного или профессионального
отбора, его валидность должна
устанавливаться на субъектах,
заинтересованных в хорошем выполнении
заданий. Если же они являются добровольцами
или пришли к выводу, что результаты
выполнения теста не будут использованы
в принятии решений о них, этот факт
должен быть ясно указан (экологическая
валидность). (Очень
желательно.)
Комментарий.
В промышленном отборе для валидности
широко используется метод «наличных
кандидатов на работу». Обычно он
включает тестирование реальных
кандидатов, которым указывается,
что выполнение теста не влияет на их
прием на работу. Мотивационные различия
могут повлиять на характер выборки,
так как вводят в ситуацию тестирования
новую переменную.
Г.2.6.
Если валидационная выборка образована
на случайно полученных или произвольно
присланных пользователями результатах
тестирования, этот факт должен быть
отражен в руководстве к тесту. Пользователь
должен быть предупрежден, что группа
не является систематической или
случайной выборкой из определенной
популяции. Должны быть также указаны
возможные отборочные факторы и их
предполагаемое влияние на переменные
места. (Существенно.)
Комментарий.
Хотя вполне целесообразно включать
в руководство такие фразы, как «автор
и издатель теста будут приветствовать
дополнительные данные, полученные при
его использовании», крайне трудно
адекватно судить о качестве и
представительности большинства
сообщений о результатах валидизации,
основанной на подобных данных.
Г.2.7.
Пользователю теста должна быть известна
возможность смещения оценок в тестах
или тестовых заданиях. По возможности
следует изучить вероятные различия
валидности по критерию для частных
выборок, различающихся по полу,
этническому составу или другим признакам,
которые могут быть выявлены при
тестировании. В руководстве следует
сообщить результаты для каждой частной
выборки в отдельности или о том, что
различия не обнаружены. (Существенно.)
Комментарий.
Во многих случаях опубликованные
правила требуют, когда это возможно,
проводить определение валидности для
выборок, отличающихся по национальности,
полу и другим демографическим
показателям.
Возможны и другие источники
различий оценок теста в разных
валидационных выборках. Например,
расположение теста по изучению ловкости
рук на низком столе может вызвать
смещение результатов у высоких людей.
Необходимы и другие
предосторожности при оценке
возможности смещения. Простые различия
групповых средних сами по себе не
указывают на контаминацию теста.
Доказательство дифференциации
смещённости тестовых оценок основывается
на сравнении коэффициентов корреляции,
уравнений регрессий, средних значений
и дисперсий каждой переменной.
Пригодными статистическими
критериями таких различий являются
для любого параметра проверки гипотез
об отсутствии различий между группами,
например отсутствие различий между
коэффициентами корреляций, показателями
наклона или пересечения. Другими
способами — тем, что один коэффициент
корреляции значимо отличается от
нуля, а другой не отличается, невозможно
доказать предполагаемые различия.
Необходимо учесть, что
существуют различные определения
чистоты и от принятого определения
может зависеть, является ли данная
процедура чистой. Более того, имеются
статистические и психологические
неопределенности относительно некоторых
источников наблюдаемых различий в
валидности или регрессии. До тех пор
пока различия не наблюдаются в достаточно
больших выборках и пока отсутствует
достаточное теоретическое (психологическое
или социологическое) объяснение
наблюдаемых различий, любое различие
принимается осторожно. Смещение
обнаруживается не обязательно для
валидности по критерию.
Г.3.
Пользователь теста ответственен за
изучение данных, подтверждающих его
валидность и надежность. Применение
тестовых баллов при принятии решений
должно опираться на достаточные
доказательства. (Существенно.)
Комментарий.
Пользователь теста ответственен за
понимание и оценивание возможности
применения теста в своем исследовании.
В случае, если условия стандартизации
и проверки на валидность и надежность
теста отличаются от тех условий, в
которых работает пользователь, на
пользователя ложится обязанность
провести дополнительные исследования
валидности теста для собственного
исследования. Свидетельства о
валидности необходимы для любого
обоснованного принятия решений, а
не только тогда, когда их легко получить.
Г.3.1.
Пользователи теста ответственны за
сбор данных о валидности и надежности
используемых методик. (Очень
желательно.)
Г.3.2.
Если пользователь желает применить
тест в ситуации, для которой такое
применение ранее не проверено на
валидность или для которой не
существует подтвержденных доказательств
валидности, он несет полную
ответственность за валидизацию.
(Существенно.)
Комментарий.
Тот, кто публикует данные о валидности,
должен обеспечить ее доказательства.
Зачастую данные о валидности, достаточные
для применения тестов, имеются в
руководстве к тесту. Если пользователь
желает заявить, что валидность является
более общей, чем это отражено в
руководстве, он несет ответственность
за доказательность своего утверждения.
Если пользователь теста
существенно изменяет инструкцию, язык,
на котором тест написан, или содержание,
он должен провести повторную валидизацию
применения теста в измененных
условиях.
Валидность по критерию.
Г.4. Все
меры валидизации по критерию должны
быть описаны полно и точно. Критерии
должны быть оценены с точки зрения
их адекватности, надежности и
загрязненности (контаминированности),
что следует убедительно подтвердить.
Необходимо обратить внимание на значимые
аспекты деятельности, которые
критериальные меры не отражают, и на
посторонние факторы, которые могут
оказывать влияние на эти меры.
(Существенно.)
Комментарий.
Критерии являются формами оценивания
и должны соответствовать тем же
требованиям, что и разработка любой
оценочной техники. При диагностике в
области труда и образования критерием
может быть тест достижений или
перечень трудовых действий, достаточно
валидных по содержанию. Оценочные
суждения руководителей и педагогов
являются критерием более общим, но
и более сомнительным по конструктной
валидности. Выводы о конструктной
валидности оценочных суждений могут
быть основаны на высокой их корреляции
с результатами деятельности и максимально
не зависеть от трудового стажа. При
изучении интересов иногда не выясняется,
что показывает критерий: удовлетворенность,
успешность или длительность изучаемой
деятельности. Когда группы по критерию
включают лиц данной профессии и
когда эти группы сравниваются с людьми
вообще, в руководстве должно быть
подчеркнуто различие между работой по
профессии и успехом или удовлетворенностью
ею.
Г.4.1.
Особое внимание должно быть обращено
на потенциальные источники контаминации
критерия; необходимо сообщить о
результатах исследования контаминации.
(Существенно.)
Комментарий.
Результаты таких исследований могут
быть неоднозначны, и пользователя надо
об этом предупредить. Например, при
изучении влияния половых различий на
оценку по критерию может обнаруживаться
существенная разница между мужчинами
и женщинами. Однако этот факт сам по
себе не является достаточным
свидетельством контаминации критерия:
он может отразить фактические половые
различия деятельности.
Г.4.2.
Когда сообщается валидность теста для
предсказаний в сфере профессиональной
деятельности, в руководстве должны
быть описаны служебные обязанности
работников наряду с наименованием
выполняемых ими действий. (Очень
желательно.)
Комментарий.
Принцип заключается в том, что должна
даваться информация, на основе
которой пользователь мог бы судить о
состоятельности критерия. При
отсутствии такой информации описание
критерия часто является неполным.
Г.4.3.
При валидизации по критерию обычно
следует рассматривать не один, более
общий критерий, а несколько частных,
составляющих общий.
Комментарий.
В большинстве видов деятельности по
выполнению теста деятельность выражается
во многих параметрах, которые могут
быть независимы. При объединении
несвязанных аспектов поведения в единый
сложный критерий возможно игнорирование
важных зависимостей и тем самым
уменьшение способностей пользователей
идентифицировать и понимать валидные
интерпретации теста.
Отдельные решения часто
должны быть приняты на многомерной
основе. Тем не менее предпочтительнее
найти правило принятия решений для
объединенных предсказаний.
Г.4.4.
Если валидность теста оценивается
по его соответствию психиатрическим
суждениям, следует указать квалификацию,
опыт и профессиональный статус экспертов,
также природу и степень их контактов
с пациентами и другие потенциально
влияющие факторы. (Очень
желательно.)
Комментарий.
Например, «параноидная шизофрения,
хроническая» лучше, чем просто
«шизофрения». Так как типы пациентов,
подвергаемых специально диагностической
классификации, в некоторой степени
зависят от выбора психиатра, должно
быть предоставлено развернутое
описание каждой диагностической
категории, использованной в исследовании
валидности.
Г.4.6.
Коэффициенты валидности специфичны
для ситуаций, в которых они получены.
Если в руководстве дано сообщение
о валидности для предсказания данного
вида конструкта (критерия), необходимо
представить материалы, предполагающие
границы этого обобщения относительно
характеристик популяции или выборки,
ситуационных переменных или вариации
изменения по критерию. (Очень
желательно.)
Г.4.7.
Так как критерий является выборочным
из всевозможных критериев того же
конструкта, валидность должна быть по
возможности определена как соответствие
этой выборки другим похожим выборкам.
Если доказательства по этому вопросу
представлены быть не могут, автор
на основе суждения по косвенным
данным должен это указать и обсудить
вероятную степень соответствия выборки
другим выборкам. (Очень
желательно.)
Комментарий. Если валидность
измерена, например, по соответствию
теста суждениям психиатров, то должна
быть описана степень согласованности
между экспертами. Если в качестве
критерия использован опубликованный
тест достижений, то его соответствие
параллельным формам или надежность,
сообщенные автором теста, могут быть
использованы как основа для оценивания
критерия при учете влияния различия
между взятой выборкой лиц и исходной
выборкой.
Г.4.8. В
руководстве должны быть отражены
данные о степени полноты и обобщенности
информации о валидности. (Очень
желательно.)
Г.4.8.1.
В руководстве к тесту должны быть
сообщены данные о валидности теста
относительно каждого критерия, для
которого даются рекомендации. Если для
некоторой интерпретации валидность
не выявлялась, этот факт должен быть
ясно указан. (Существенно.)
Комментарий.
Если с данным наименованием профессии
соотнесен широкий круг обязанностей,
пользователей теста следует предупредить
о несостоятельности предположения,
что только одно сочетание интересов и
способностей соотносимо с данной
профессией.
Г.4.9.
Локальный сбор доказательств валидности
по критерию часто более полезен, чем
опубликованные данные. В таких
случаях в руководстве должен делаться
упор на локальные исследования
валидности, а пользователи теста должны
по возможности проводить такие
исследования. (Желательно.)
Г.5. В
валидизационном исследовании при сборе
данных необходимо использовать
процедуры, соответствующие целям
исследования. (Существенно.)
Г.5.1.
При сборе данных для валидизации
исследователь, интерпретирующий
результаты теста, должен располагать
только той информацией об испытуемых,
которая обычно будет доступна при
практическом использовании тестов.
Если существует некоторая возможная
контаминация, связанная с априорным
представлением об испытуемых, в
руководстве должно быть обсуждено
влияние этого фактора на результаты
исследования. (Существенно.)
Г.6.
Любой статистический анализ валидности
по критерию в руководстве должен
даваться в форме, по которой пользователь
мог бы определить, с какой степенью
доверительности можно принять утверждения
или предсказания относительно
индивида. (Существенно.)
Г.6.1. В
докладе о валидности по критерию
должна быть отражена полная информация
о выполненном статистическом анализе.
Следует включить, кроме основных
описательных статистик (средних и
стандартных отклонений), еще один или
несколько показателей: а) один или более
коэффициент корреляции известного
вида; б) описание эффективности, с
которой тест различает группы по
критерию; в) таблицы ожиданий; г) графики
зависимости между тестом и критерием.
(Существенно.)
Комментарий.
Полная информация включает данные
о надежности, тесноте и характере
зависимости. В корреляционное понятие
включается информация о статистической
значимости и величине коэффициента
корреляции, а также о регрессионном
уравнении.
Сообщение о различии между
средними групп само по себе не дает
адекватной информации о валидности:
если дисперсия большая, классификация
может быть неточной, даже если средние
различаются существенно. Теснота связи
может быть представлена описанием
количества ошибочной классификации
или совмещений групп. Таблицы ожиданий
могут дать информацию о характере
предсказания.
В общем, так как руководство
часто предназначено для пользователей,
имеющих слабую статистическую подготовку,
должны быть приняты все меры для
ясного сообщения валидности.
Г.6.1.1.
Коэффициент валидности должен быть
дополнен сообщением о параметрах
уравнения регрессий и стандартной
ошибкой оценки. (Очень
желательно.)
Комментарий.
Необходимая информация может быть
представлена в таблице ожиданий,
показывающей величину возможных оценок
по критерию для каждого балла (или
группы баллов) по тестам. Очень полезна
стандартная ошибка оценки для
различных точек шкалы предсказаний.
Г.6.2.
Если валидность теста выявляется
сравнением групп, различающихся по
критерию, то в руководстве к тесту
необходимо сообщить, различаются
ли группы, и насколько различаются, по
другим переменным. (Очень
желательно.)
Комментарий.
Так как группы, различающиеся по
критерию, могут также резко различаться
и в других отношениях, то тест может
различать качества, отличающиеся
от подразумеваемых. Например, типы
умственного расстройства связаны с
возрастом, образованием и длительностью
госпитализации. Это всегда должно быть
учтено при оценке полезности теста
для диагностики.
Г.6.2.1.
Если тест предназначен для дифференциального
анализа, то в руководстве должны
быть приведены доказательства
способности теста отнести индивидов
в диагностические группы, а не только
отделять диагностируемые группы от
популяции нормальных. (Существенно.)
Комментарий.
Когда тест рекомендован для отнесения
индивидов в дискретные категории,
то φ-коэффициенты или дискриминативные
функции должны быть дополнены таблицами
оценок ошибочных решений. Например,
для каждой категории должен быть
определен процент лиц, ошибочно
исключаемых из нее. Такие проценты
должны сравниваться с базовыми оценками,
т. е. с процентами правильной классификации,
установленными при максимальном
знании объема диагностируемых категорий.
Г.6.3.
Метод статистического анализа должен
выбираться с учетом характеристик
полученных данных и выдвинутых гипотез.
(Существенно.)
Комментарий.
Полученные данные могут очень
незначительно отличаться от
первоначально предполагаемых
характеристик. Однако даже небольшие
отклонения от выдвинутых гипотез
могут приводить к серьезным ошибкам.
Например, при использовании
предсказаний, основанных на
предположении о двумерном нормальном
распределении, возможна серьезная
переоценка средней деятельности
кандидатов с высокими баллами, если
данные заметно несимметричны.
В подобных случаях валидность более
точно определяется методом, не основанным
на предположении о двумерном
распределении.
Г.6.4.
Если коэффициенты корреляции
скорректированы с учетом ограниченности
в ранге или ослабления, то должна быть
представлена полная информация о таких
поправках. При этом проверка значимости
должна быть проведена для коэффициентов
корреляции без поправок. (Существенно.)
Комментарий.
Поправки должны вноситься только к
вычисленным коэффициентам. Обычно
не следует делать последовательных
поправок, например поправки на
ослабление к коэффициенту, уже
скорректированному с учетом ограничения
в ранге. Цепочки поправок могут быть
полезны при рассмотрении возможностей
дальнейших исследований, но эти
результаты не должны представляться
как оценки корреляций в популяции.
Г.6.5.
Если валидизации подвергается батарея
тестов, в руководстве необходимо
отразить валидность суммарной оценки,
а также следует вычислить «вес» каждого
теста в итоговой оценке. (Существенно.)
Г.6.6.
Если весовое объединение тестов в
батареи основано на регрессионных
коэффициентах, отрицательные веса
следует использовать только после
проверки на перекрестную валидность
в больших выборках и только в том случае,
когда их использование не скажется
отрицательно (и, следовательно, не будет
несправедливым) на одной или нескольких
подгруппах тестируемой популяции.
(Существенно.)
Г.6.7.
Если предположено, что решение должно
быть основано на сложном нелинейном
объединении баллов, необходимо
показать, что такое объединение имеет
большую валидность, чем простое линейное
объединение, что уравнения могут быть
логически объяснены и процедуры
объединения баллов подвергались
перекрестной валидизации. (Существенно.)
Г.6.8. По
мере возможности пользователю теста,
продолжительное время работающему
с ним, следует разработать процедуры
отбора данных для дальнейшего
исследования. (Желательно.)
Комментарий.
Данные о валидности могут устареть,
на зависимость между выполнением теста
и реальной деятельностью могут
повлиять многие факторы: изменение
характеристик популяции, источники
ее пополнения, экономические и
организационные характеристики.
Более того, исследования валидности
часто основаны на относительном малом
количестве случаев. План систематического
сбора данных уже после передачи теста
в пользование может быть полезным как
для разработки более надежной
статистической основы, так и для
информации об изменениях тенденций
зависимости с течением времени.
Продолжение исследования менее
необходимо, если исходные данные
получены в относительно большой выборке,
если хорошо определена основа обобщающей
валидности. В этом случае возможно
планировать время от времени небольшие
повторные исследования вместо
продолжительной исследовательской
программы.
Г.7. В
руководстве должна быть указана
разница во времени между проведением
теста и сбором данных по критерию. Если
данные по критерию собирались в течение
некоторого времени, должны указываться
даты начала и окончания. (Существенно.)
Комментарий.
Валидность может со временем
уменьшаться. В профо-риентационном
тестировании изменения содержания и
средств труда, уровня способностей
популяции ориентируемых могут
изменять показатели, для которых
получена информация о валидности.
Г.7.1.
Пользователя теста следует предупредить
о необоснованности составления
долговременных прогнозов. (Существенно.)
Комментарий.
Кратковременные прогнозы намного более
валидны, так как менее подвержены
влиянию разных факторов.
Г.7.2.
Если тест предназначен для долговременных,
отстоящих во времени прогнозов, но
представлены сравнения только по
конкурентному критерию, в руководстве
должно быть подчеркнуто, что валидность
долговременных предсказаний осталась
неопределенной. (Существенно.)
Г.7.3.
Если сообщается валидность теста
для предсказания оценки по учебному
предмету, то должна быть достаточно
ясная информация о видах деятельности,
необходимой при изучении данных
предметов, характере метода обучения
и способе измерения деятельности. Если
тест был проведен после начала изучения
предмета, этот факт должен быть
отмечен. (Очень
желательно.)
Содержательная валидность.
Г.8. Если
деятельность по выполнению теста
интерпретируется как репрезентативная
выборка из видов деятельности в общем
множестве ситуаций, в руководстве
необходимо дать четкое определение
учитываемого общего множества и описать
критерии отбора выборки из него.
(Существенно.)
Комментарий.
В определение не должны включаться
предположения о детерминирующих
деятельность психических процессах,
т. к. это объект не содержательной,
а конструктной валидности.
Г.8.1.
Если вопрос о соответствии выборки
заданий их общему множеству или о
точности выставления оценок решали
эксперты, в руководстве должен быть
описан соответствующий профессиональный
опыт и квалификация экспертов, а также
инструкции, на основании которых
проводилась экспертная оценка.
(Очень желательно.)
Г.8.1.1.
Если задания отобраны экспертами,
то должна быть обобщена степень
согласованности между их суждениями.
(Желательно.)
Г.8.1.2.
Содержание теста должно быть проверено
относительно возможности смещения.
(Желательно.)
Комментарий.
Смещение может иметь место, если задания
не представляют сравнимых видов
деятельности и поэтому не являются
выборкой из области деятельности, общей
для различных подгрупп. Такое смещение
следует выявлять с помощью достаточно
полных суждений экспертов. Изучение
установок или интерпретаций заданий
в различных подгруппах также дает
полезную информацию. Суждения о
смещении могут быть сами смещены —
следует придерживаться принципа, что
по возможности суждения должны
подтверждаться статистическими
данными.
Г.8.2. В
руководствах к тестам достижений
учебных результатов должна быть сообщена
система классификации, использованная
для отбора заданий. (Желательно.)
Г.8.2.1.
Если тест достижений был разработан в
соответствии с двумерной схемой
«темы—процессы», в руководстве должна
быть представлена эта схема с
перечислением заданий, относимых к
каждой клетке схемы. (Очень
желательно.)
Г.8.3.
Для любого утверждения о связи
заданий с изучаемым предметом (или
другими источниками содержания) в
руководстве должна быть указана
дата, когда изучаемый предмет был
разработан. (Существенно.)
Г.8.4.
Если тест описан как валидный по
содержанию труда или видов трудовой
деятельности, в свидетельствах о
валидности должно быть полное
описание трудовых обязанностей,
относительная частота, важность, а
также уровень умений, требующихся
при их выполнении. (Существенно.)
Конструктная валидность.
Г.9. Если
автор интерпретирует тест как меру
диагностируемого конструкта (способности,
черты установки), то должна быть
полностью изложена предполагаемая
интерпретация. Этот конструкт должен
быть полностью ограничен от интерпретаций,
вытекающих из других теорий.
(Существенно.)
Комментарий.
Например, если тест предназначен для
измерения конструкта «тревожность»,
автор теста должен отразить отличия
самого определения данного конструкта
от некоторого другого возможного
значения термина, которое подразумевается,
и должен соотнести свою концепцию с
мерами тревожности, рассмотренными в
литературе.
Описание конструкта может
быть простым, например определение
«креативности» как «совершения
многих оригинальных действий». Все
подобные характеристики или гипотезы
являются частью авторской концепции.
Г.9.1. В
руководстве должна быть отражена
степень случайности предложенной
интерпретации и обобщены исследования
гипотез, вытекающих из данной теории.
(Существенно.)
Г.9.1.1.
Каждое исследование, содержащее
теоретические выводы о тесте, должно
быть отражено так, чтобы были раскрыты
и операциональные процедуры исследования,
и соотнесение результатов с теорией.
(Очень желательно.)
Г.9.1.2.
В руководстве должны быть сообщены
корреляции между тестом и другими
тестами, для которых интерпретация
относительно ясна. (Очень
желательно.)
Г.9.2. В
руководстве необходимо привести
доказательства степени, с которой
другие конструкты, отличающиеся от
предполагаемого автором, объясняют
дисперсию баллов теста. (Очень
желательно.)
Комментарий.
Хотя неразумно требовать от автора
теста предвосхищения или включения
в руководство каждой противоположной
интерпретации, он все же должен
представить достаточные данные о
противоположных гипотезах, наиболее
вероятно объясняющих дисперсию тестовых
баллов.
Г.9.2.1.
В руководстве к любому специализированному
тесту или вопроснику, используемому в
образовательном отборе, профориентации,
необходимо приводить корреляцию его
баллов с общепринятыми мерами вербальной
и вычислительной способности в
соответствующей популяции. (Очень
желательно.)
Г.9.2.2.
В руководстве должна быть представлена
информация о факторных исследованиях
(если тест подвергался им), показывающих
процент тестовой дисперсии, выявляемой
хорошо известными факторами. (Желательно.)
Г.9.2.3.
Для опросников, являющихся мерами
личности, интересов или установок,
должны быть представлены доказательства
степени, с которой оценки чувствительны
к попыткам испытуемых представить
социально желаемую (конформную)
картину своей личности или с которой
баллы могут отражать другие искажающие
особенности ответов. Такие виды ответов
должны изучаться в первую очередь для
определенных выборок, а не для более
общей генеральной выборки. Могут быть
представлены корреляционные или
экспериментальные исследования.
(Очень желательно.)
Г.9.2.4.
Если тест, проводимый с ограничением
во времени, интерпретируется в качестве
измеряющего гипотетическое психологическое
свойство, не связанное специально с
быстротой выполнения теста, то должны
быть представлены свидетельства о
влиянии скорости на тестовые баллы и
об их корреляции с другими переменными.
(Существенно.)
Комментарий.
Наиболее полным доказательством влияния
скорости выполнения может быть
сравнение баллов по двум формам с
обычным ограничением при неограниченном
времени. Корреляция баллов этих вариантов
имеет ограниченный смысл, т. к. эти
два балла не являются независимыми.
Менее исчерпывающим доказательством
является процент испытуемых,
ответивших на последнее задание или
некоторое задание, близкое к концу
теста, за время, отведенное на выполнение
теста. Если этот процент ниже 90,
необходимо более глубокое исследование,
чтобы показать, что индивидуальные
различия по тесту существенно не
отражают скорости.
Г.9.2.5.
Если различия в стратегии выполнения
теста влияют на интерпретацию баллов,
связанных с определенными характеристиками
подгрупп, об этом должна быть дана
ясная информация или ясно указано на
отсутствие ее. (Очень
желательно.)
Г.9.2.6.
Если свидетельство против противоположной
интерпретации основано на низкой
корреляции при малом различии между
группами, в руководстве необходимо
сообщить доверительность поправки
или обсудить ошибки измерения, которые
могли снизить соответствующую
зависимость. (Желательно.)
Д. Сведения о процедуре применения
теста.
Интерпретация тестов и
средств измерения, так же как и
результатов эксперимента, наиболее
надежна, когда измерения ведутся в
стандартизированных и контролируемых
условиях. Конечно, в тестировании
существуют ситуации, когда важно
систематически менять обстоятельства
для максимального понимания деятельности
индивида. Например, исследователь может
систематически менять процедуры в
последовательных повторениях теста,
чтобы выяснить пределы умения ребенка
в определенной содержательной области.
Тем не менее, составитель теста должен
сам предусмотреть стандартные процедуры,
в которых возможна подобная модификация.
Вне стандартизации качество интерпретации
может ухудшиться в степени, с которой
различия в процедуре влияют на результаты
тестирования.
Для большинства целей
наибольший упор делается на строгую
стандартизацию процедур проведения
тестов и инструкций к нему. Если тест
предназначен для разнообразных
популяций, эти процедуры должны быть
полностью доступны для всех испытуемых
из каждой популяции.
Д.1. В
руководстве к тесту должна быть указана
квалификация и специализация, необходимая
для проведения теста и его интерпретации.
(Существенно.)
Комментарий.
Однако из руководств в определении
квалификации, необходимой для
индивидуального тестирования детей
данным тестом, различают психологов,
которые работают с детьми, и тех, кто
работает только со взрослыми. Другое
руководство указывает на специфичность
тестирования учащихся, родной язык
которых отличается от языка теста.
Квалификация пользователя может быть
описана путем указания на профиль
специального обучения, которое в общем
считается необходимым для достижения
компетентности. В некоторых руководствах
к тестам могут выделяться наиболее
частые источники ошибок применения
теста и указываться виды обучения
пользователей, дающие возможность
устранить эти ошибки.
Д.1.1.
Если тест рекомендован для нескольких
целей и типов заключений, в руководстве
следует указать степень обученности
пользователей, необходимую для каждого
применения. (Существенно.)
Д.1.2.
Если авторы предполагают, что тест
может использоваться неспециалистами,
то руководство должно быть написано
в форме, доступной их пониманию.
(Существенно.)
Комментарий.
С тестом могут иметь дело не только
лица, специально обученные этому.
Испытуемые, члены педагогических и
общественных комиссий, родители имеют
также основание для суждений по
тесту. Это их право не вступит в
противоречие с необходимостью сохранять
тайну, если им доступны описательные
и объясняющие материалы.
Д.1.3.
Руководство не должно допустить,
чтобы тест понимался как
«самоинтерпретирующийся». В нем
должно быть указано, какую информацию
о результатах тестирования возможно
представить лицам, не имеющим необходимой
для интерпретации подготовки.
(Существенно.)
Комментарий.
Обычно желательно получать
интерпретацию оценок подготовленным
лицам. Конечно, существуют тесты,
результаты которых могут быть оценены
испытуемыми; часто полезно сообщать
тестовые баллы учащимся и родителям.
Если это практикуется, смысл данного
требования в том, что должны даваться
необходимые сведения по интерпретации
этих баллов.
В руководстве должно быть
указано, что может выполняться необученным
лицом и что не может выполняться.
Например, в одном руководстве к
широко известному тесту интересов
указывается, что испытуемые могут
усвоить способы оценивания результатов
собственных ответов, но подчеркивается,
что они нуждаются в помощи
квалифицированного учителя или
консультанта при интерпретации
результатов и построении планов на
будущее.
Д.2. В
руководстве к тесту следует указать
степень необходимого для теста
сохранения тайны его содержания в
ходе предварительной тренировки. (Очень
желательно.)
Комментарий.
Тест числового ряда предполагает
тренировочную практику, для того
чтобы испытуемые лучше поняли
инструкцию. Данная тренировочная
практика не дублирует заданий теста
и, следовательно, сохраняет содержание
самого теста в тайне.
Д.2.1. В
руководстве должны быть описаны
примеры неприемлемой практики. (Очень
желательно.)
Д.3. В
руководстве к тесту необходимо
отразить основные этапы процедуры его
проведения. (Существенно.)
Комментарий. Обычно последовательность
проведения теста такова:
1) объяснить испытуемым цель проведения
теста;
-
гарантировать сохранение тайны
индивидуальных ответов; -
в соответствии с требованиями
руководства прочитать инструкцию и
провести тренировку; -
попросить испытуемого или
самому заполнить (если требуется)
паспортные и биографические данные в
регистрационных бланках; -
ответить на имеющиеся вопросы;
-
обработать результаты
теста в соответствии с требованиями
руководства.
Д.4.
Инструкции по проведению должны быть
отражены в руководстве к тесту максимально
подробно, с подчеркиванием, что
пользователь теста может и должен
воспроизвести те условия тестирования,
при которых разработаны нормы и получены
данные о надежности и валидности.
(Существенно.)
Комментарий.
Так как лица, проводящие тесты в
школах и на производстве, иногда
могут не поступать строго по инструкциям
и не понимать необходимости их
соблюдения, важно, чтобы руководство
в этом отношении было очень убедительным.
Для обеспечения стандартности
процедуры некоторые тесты проводятся
полностью механизированным способом.
Д.4.1.
Инструкции, опубликованные в руководстве
к тесту, должны быть достаточно
полными, чтобы тестируемые понимали
необходимость действовать так, как
подразумевал автор теста. (Существенно.)
Комментарий.
Например, при заполнении опросника
личности субъект иногда может давать
первый встретившийся ему ответ.
Следовательно, подобная возможность
должна быть указана в инструкции,
которую субъект читает или которая ему
зачитывается. Инструкция для вопросников
интересов должна определить, следует
ли испытуемому отмечать то, что ему
нравится в идеале, или также следует
предусмотреть возможность того, что
ему необходимо иметь благоприятные
условия и способности этого достигнуть.
Подобным образом в инструкции необходимо
определить, следует ли испытуемому
отмечать то, что ему нравится, но
встречается иногда, или только то, что
ему нравится и встречается постоянно.
Д.4.1.1.
Инструкция должна четко подчеркнуть
такие критические моменты, как указания
об угадывании, лимиты времени и способ
ответов. (Существенно.)
Д.4.1.2.
Инструкция для тестирующего должна
содержать указания по поводу вопросов
со стороны испытуемых. (Очень
желательно.)
Д.4.2.
Если предусматривается возможность
изменения и совершенствования
инструкций, описанных в руководстве к
тесту, то должны быть ясно указаны
условия, при которых позволительно
это делать; эти условия приводятся
или в форме общих правил, или на
основе значительного числа примеров,
или тем и другим способом. (Существенно.)
Д.5.
Инструктаж должен подготовить испытуемого
к обследованию: необходимо предусмотреть
подборки необходимых видов стимульного
материала, листы ответов, карандаши,
ручки и т. п. (Желательно.)
Д.6.
Процедуры выставления баллов по тестовым
заданиям должны быть изложены в
руководстве с максимальной детализацией
и ясностью, чтобы уменьшить вероятность
ошибки при оценивании. (Существенно.)
Д.6.1. В
руководстве к тесту должны быть
представлены инструкции по оцениванию
результатов выполнения задания и
указаны процедуры предотвращения
ошибок подсчета и вычисления. (Очень
желательно.)
Д.6.2.
Если оценивание результатов теста
содержит субъективные процедуры, в
руководстве должны быть представлены
данные степени согласованности
независимых оценщиков в операциональных
условиях. Если таких свидетельств
не имеется, в руководстве должно
быть обращено внимание на вариации
оценивания как возможный значимый
источник ошибок измерения. (Очень
желательно.)
Д.6.3.
Если в тесте используется более чем
один метод выражения ответов испытуемыми,
руководство к тесту должно сообщить
данные о степени, с которой результаты,
полученные при использовании различных
методов, взаимозаменяемы. (Существенно.)
Комментарий.
Разное количество времени, необходимого
для ответа на задания в формах,
приспособленных к разным методам
выставления баллов, может влиять на
надежность или валидность теста, на
применимость тестовых норм.
Д.6.4.
Если использована необычная или сложная
система выставления балов, в руководстве
к тесту необходимо указать приблизительное
количество времени, необходимое для
выставления баллов по заданиям теста.
(Желательно.)
Д.6.5.
«Формулы поправки на угадывание»
должны использоваться при заданиях
с множественным выбором или при ответах
вида «истинно – ложно» теста на скорость
выполнения заданий. (Желательно.)
Е.
Сведения о
процедуре обработки и интерпретации
тестовых результатов.
По традиции интерпретация
тестовых баллов является
нормированно-референ-тной, т. е.
индивидуальная оценка интерпретируется
в сравнении с оценками других
индивидов. Однако возможны и другие
интерпретации. Содержательно-референтная
интерпретация имеет место, если балл
интерпретируется непосредственно,
соответственно деятельности на каждой
точке измеренного континуума достижений.
Критериально-референтная интерпретация
отражает непосредственно интерпретацию
баллов в соответствии с деятельностью
в любой данной точке континуума
внешней переменной. Переменной
внешнего критерия могут быть средние
оценки или уровни трудовой деятельности.
Стандартные требования параграфа
в принципе относятся больше к
нормированно-референтным интерпретациям
тестов и в меньшей степени к
содержательно-референтным.
Е.1.
Нормы должны публиковаться в руководстве
к тесту одновременно с публикацией
теста (для операционального использования).
(Существенно.)
Е.1.1.
Нормы должны быть определены также
к тесту, разработанному только для
локального применения или только для
целей предсказания. (Желательно.)
Комментарий. Иногда
забывают, что таблицы норм дают
информацию, полезную не только для
сравнения индивида с групповыми данными.
Например, пользователь теста из
таблицы норм может извлечь информацию
относительно уровня баллов, на котором
различительная сила измерения хороша
или плоха.
Е.1.2.
Даже если предполагается, что тест в
первую очередь будет использоваться
с локальными нормами, в руководстве к
тесту следует предусмотреть нормировочные
данные, чтобы помочь интерпретатору,
не имеющему локальных норм. (Очень
желательно.)
Е.2.
Нормы, представленные в руководстве
к тесту, должны относиться к определенным
и ясно описанным популяциям. Этими
популяциями должны быть группы, с
которыми пользователи теста обычно
желают сравнивать тестируемых лиц.
(Существенно.)
Комментарий.
Почти во всех случаях, когда тесты
разработаны не только для локальных
целей, пользователь хочет знать,
насколько они применимы для различных
групп. Для тестов, разработанных с
целью широкого использования в школах
или в промышленности, необходима
информация о различиях и сходствах
нормативных данных для таких групп,
как группы по полу, национальности,
образованию или возрасту. В руководстве
должны быть описаны случаи, когда
нормы для одних групп также подходят
и для других групп.
Например, руководство к
вопроснику профессиональных интересов
или к тестам способностей, важных
для некоторых профессий, должно
подчеркивать, что лицо, получающее
высокую оценку интересов или
способностей к учебному предмету
или профессии при сравнении со «средним»
человеком, получает более низкую
оценку интересов при сравнении с
лицами, фактически занимающимися в
этой области. Так, высокий процентильный
балл по шкале музыкальных интересов,
в которой испытуемый сравнивается со
«средним» человеком, может быть
эквивалентен низкому процентильному
баллу при сравнении испытуемого с
профессиональным музыкантом.
Е.2.1.
Необходимо предотвращение ошибочного
впечатления о генерализованности
нормативных данных. (Существенно.)
Комментарий.
Нормативные данные, полученные для
выборки людей или школ со специфическими
чертами, часто используются так, как
будто они получены по репрезентативным
общегосударственным группам. Так,
имеются пользователи тестов, которые
могут сказать, что испытуемый читает
на уровне десятиклассника, вне учета
того, что нормы фактически получены на
основе лучших школ, добровольно принявших
участие в исследовании по разработке
теста. Ошибкой интерпретации является
предположение, что нормы добровольных
групп учащихся приложимы к школам
вообще. Сфера действия таких ошибок
может быть сокращена, если в руководстве
к тесту четко определены характеристики
нормативной популяции.
Е.2.1.1.
В руководстве к тесту необходимо
сообщить метод отбора выборки из
популяции испытуемых и обсудить
вероятное смещение в выборочной
процедуре. (Существенно.)
Е.2.1.2.
Нормы, сообщенные в руководстве к
тесту, должны быть основаны на хорошо
спланированной выборке, а не на данных,
собранных в основном из-за их относительной
доступности. Любое отклонение от
намеченного плана должно быть отражено
одновременно с описанием действий,
предпринятых или не предпринятых в
связи с этим. (Существенно.)
Комментарий.
Нормы профессиональных и педагогических
тестов иногда основаны на разрозненных
выборках тестируемых, так как авторы
иногда просят пользователей тестов
прислать результаты тестирования
для использования их в последующих
сообщениях о тестовых нормах.
Полученные таким образом распределения
подвержены смещениям неизвестного
типа и степени. Следовательно, методы
получения выборок должны быть ясно
описаны.
Е.2.1.3.
Наряду с сообщением числа индивидов,
результаты тестирования которых
были использованы при разработке
нормативных данных, руководство должно
также сообщить число выборочных единиц
(например, классов), из которых были
взяты эти индивиды, а также число
индивидов в каждой единице.
(Существенно.)
Е.2.2. В
руководстве к тесту описание нормативной
группы должно быть достаточно полным,
чтобы пользователь мог судить о
пригодности для собственного применения.
В описании должно быть указано число
случаев, классифицированных по одной
или более таких переменных, как возраст,
пол, социоэкономический статус,
образовательный уровень. Если взята
обобщенная выборка, в описании
нормативной группы должно быть
указано число отдельных тестированных
групп. (Существенно.)
Комментарий.
Для описания нормативных данных в
руководствах часто используются
классификационные системы в целом.
Например, в руководстве к одной методике
даны сведения для многих профессиональных
и образовательных групп. Однако
отсутствие информации о таких признаках,
как пол, возраст, образование и
уровень опыта, внутри этих групп
существенно уменьшает полезность норм.
Е.2.2.1.
В руководстве должны быть ясно и рельефно
описаны популяции, на основе которых
определены психометрические свойства
теста и для которых применимы
нормативные данные. В любом сообщении
о доработке теста должны отразиться
характеристики нормативных групп,
использованных в интерпретации
результатов. (Существенно.)
Комментарий.
Назначение этого стандартного требования
— предупредить пользователей и
испытуемых относительно необоснованных
интерпретаций. Если сообщение о
стандартизации представляет
результаты в интерпретации процен-тильных
рангов или стандартных баллов при
последовательном использовании той
же нормативной популяции, будет
достаточным определение этой
популяции с указанием времени сбора
данных.
Е.2.3.
Если выборка, на основе которой
установлены нормы, мала или, по другим
причинам, ненадежна, в руководстве к
тесту необходимо ясно предупредить
пользователя относительно возможности
величины ошибок при интерпретации
баллов. (Существенно.)
Е.2.4. В
руководстве к тесту нормы по субтестам
или группам заданий сообщаются
только в том случае, если указана
валидность и надежность таких субтестов
или групп заданий. (Существенно.)
Комментарий.
Пользователь теста уверен, что, когда
даны нормы для части теста, автор
считает их пригодными для интерпретации.
Должна сообщаться также надежность и
валидность таких баллов.
Е.2.5. В
руководстве к тесту должны быть описаны
условия, при которых получены
нормативные данные. (Существенно.)
Комментарий.
В случае, когда некоторые аспекты
стандартизированы на группах кандидатов
на работу, другие — на группах,
обратившихся за профконсультацией, а
третьи — на группах, осознающих себя
как испытуемые, то между такими группами
и внутри них индивиды часто различаются
по мотивации выполнения теста,
установке к его выполнению, способностям
и личностным характеристикам, хотя
точное описание этих различий не
всегда возможно.
Е.3. При
сообщении норм в руководстве к тесту
следует пользоваться процен-тилями
для одной или нескольких подходящих
референтных групп или стандартными
баллами, для которых ясно определено
основание. В руководстве к тесту должны
быть даны меры центральной тенденции
и рассеивания. (Существенно.)
Е.3.1.
Если тест используется для предсказания,
должны быть приведены, насколько это
возможно, таблицы ожиданий или
эмпирические таблицы перевода баллов
в уровни вероятности успеха или умения.
(Желательно.)
Е.4.
Для многих применений
теста локальные нормы более важны,
чем опубликованные. В таких случаях
руководство к тесту должно давать
возможность использования локальных
норм. (Очень желательно.)
Е.5. В
руководстве к тесту должны быть полностью
описаны производные шкал, использованные
для стандартизированных баллов,
чтобы увеличить вероятность точной
интерпретации и понимания баллов
интерпретатором теста и испытуемым.
(Существенно.)
Комментарий.
Целесообразно сократить число производных
шкал до нескольких, с которыми
пользователи были бы знакомы. Существующее
разнообразие ведет к необходимости
описания таких шкал в каждом руководстве.
Проблема, в частности, в том, что теперь
используются многие различные
системы, не имеющие логических
преимуществ по сравнению друг с
другом. Для преодоления недостатков
старых методов шкалирования могут быть
предложены новые. Разнообразие шкал
для окончательных тестовых оценок
может привести к недоразумениям и
ошибочным интерпретациям, если шкалы,
рекомендованные для данного теста, не
описаны в руководстве ясно и полно.
Е.5.1.
Построение шкалы на основе нормативных
данных должно быть ясно и недвусмысленно
описано в терминах, предотвращающих
нарушения и интерпретации или
неправильные обобщения. (Существенно.)
Комментарий.
Производные оценки могут быть очень
полезны для выводов. Однако очень
часто они рассматриваются как имеющие
абсолютный смысл независимо от отдельного
теста и нормативной популяции.
Примером является коэффициент интеллекта,
который зачастую понимается как
просто стандартный балл, который часто
видоизменяется и интерпретируется
так, словно он отражает неизменную и
независимую характеристику
испытуемого. Оценки эквивалентности
классу обучения или даже процентильные
ранги также могут интерпретироваться
неправильно, как некие абсолютные
величины, если в руководстве к тесту
не приведены характеристики групп,
на которых эти оценки построены.
Е.5.2. В
руководстве необходимо указать,
являются ли стандартные баллы результатом
линейной или нелинейной трансформации
суммарных баллов. (Существенно.)
Е.5.2.1.
Интерпретационных баллов, которые сами
по себе включают существенную
ошибочность интерпретации (оценки
умственного возраста, эквивалентности
классу обучения и др.) надо избегать.
(Очень желательно.)
Комментарий.
Если, несмотря на эту рекомендацию, в
руководство включены подобные
оценки, необходимо предусматривать
в табличной форме также их связь со
стандартными баллами или процентильными
рангами внутри каждой категории и
внутри соответствующей нормировочной
группы. Например, таблица может отразить
вдобавок к баллу эквивалентности
классу обучения соответствующий
процентильный ранг внутри собственного
возраста или класса испытуемых для
каждого суммарного балла. Для старших
классов больше подходят нормы внутри
предметов, чем внутри классов.
Е.5.3.
Если в руководстве к тесту предполагается,
что процентильные ранги будут
выражаться графически профильной
звездочкой, график должен основываться
на нормальной вероятностной шкале или
на некоторой другой приемлемой
нелинейной трансформации. (Очень
желательно.)
Е.6. Если
шкалы пересмотрены, добавлены новые
формы или сделаны другие изменения, в
пересмотренном руководстве к тесту
должны быть помещены таблицы
эквивалентности старой и новой форм.
(Желательно.)
Комментарий.
Новые формы теста должны быть
приравнены к недавно определенным
шкалам стандартных баллов других
форм, чтобы пользователь мог быть
уверен, что баллы, предложенные по новым
формам, сравнимы с баллами предыдущих
форм.
Е.6.1.
Если новая форма теста приравнена
к старой, в пересмотренном руководстве
должно быть описано содержание и старой
и новой форм, а также характер нормативных
групп для них. (Существенно.)
Комментарий.
Изменения в знаниях, технологии или
учебном материале могут потребовать,
чтобы новое издание тестов существенно
отличалось от прежних, а потребность
преемственности требует приравнивания
окончательных шкал друг к другу.
Пользователь должен иметь возможность
оценить эквивалентность в соответствии
с изменениями содержания, поскольку
у него возникают сомнения, возможно ли
значимое сравнение баллов при
изменении содержания.
Е.6.2. В
руководстве должен быть описан метод
установления эквивалентности или
сравнимости оценок и должна быть дана
оценка точности процедуры приравнивания.
(Очень желательно.)
Е.7. Если
предполагается, что тест будет
использоваться не столько для оценки
индивидов, сколько групп (например, для
школ или программ), должны быть
представлены нормативные данные,
основанные на суммарных групповых
статистиках. (Существенно.)
Комментарий.
Например, нецелесообразно оценивать
школы применением норм, разработанных
для оценки индивидов. Также нельзя
вычислять групповые средние по нелинейным
шкалам, например по процентильным
рангам, выведенным для индивидуальных
норм.
Е.8.
Тест, руководство, формы записи ответов
и другие сопровождающие материалы
должны помогать пользователю правильно
интерпретировать результаты теста и
предупреждать неправильное его
употребление. (Существенно.)
Комментарий.
Многие руководства к тестам
подчеркивают переменные, которые
следует учитывать при интерпретации
тестовых оценок. Это может быть информация
об учебных достижениях, рекомендации
или соответствующие анамнестические
данные.
Е.8.1.
Руководство к средству оценивания
личности может включать данные,
показывающие, что психолог должен
учитывать такие факторы, как пол и
возраст субъекта, женаты или разведены
его родители, возраст и пол его детей,
его профессиональный и супружеский
статус и т. д.
Е.8.2.
Руководство к тесту должно подчеркнуть
те существенные влияния на тестовую
оценку, которые связаны с регионом,
социоэкономическим статусом,
национальностью или полом.
(Существенно.)
Е.9.
Руководство должно обратить внимание
пользователя на публикации, с которыми
он должен ознакомиться до тестирования
для более точной интерпретации
результатов теста. (Очень
желательно.)
Комментарий.
Публикациями могут быть книги или
статьи, относящиеся к смежным
психологическим теориям или к самому
тесту, о котором идет речь.
Е.10.
Изложение описываемых в руководстве
зависимостей по смыслу является
количественным и должно быть приведено
с точностью, которую позволяют данные.
Если данные в поддержку таких утверждений
не были собраны, этот факт должен быть
ясно указан. (Существенно.)
Комментарий.
Авторы, например, иногда пишут: «Для
инженера-архитектора требуется
способность пространственного
мышления» или «Необычные ответы могут
указывать на наличие шизофрении».
Такие утверждения сами по себе
количественно неадекватны. Какая
частота эксцентрических ответов
указывает на уже развившуюся
шизофрению? Насколько успех в архитектуре
зависит от пространственной способности?
Количественные данные, связывающие
тестовые оценки с определенными
критериями, должны помочь получить
ответы.
Е.10.1.
Для сообщения количественной
информации предпочитаются хорошо
известные и легко интерпретируемые
статистические процедуры. Любая
необщепринятая статистическая
техника должна быть объяснена, и должны
быть приведены ссылки на источники.
(Существенно.)
Комментарий.
Издатели не обязательно должны
однообразно придерживаться процедур,
широко используемых для сообщения
данных, но технологии и процедуры должны
быть довольно известными на практике,
чтобы компетентные пользователи могли
адекватно судить о результатах.
Это стандартное требование
является конкретизацией принципа, что
представленные в руководстве данные
не должны вводить в заблуждение.
Например, ошибочно показывать
ценность объединенных в батарею тестов
в уравнении регрессии путем использования
данных с интеркорреляцией более
низкой, чем о ней сообщалось в другом
месте руководства.
Е.10.2.
Когда сообщается статистическая
значимость, сообщение должно быть в
форме, которая делает ясным чувствительность
или мощность критерия значимости.
(Существенно.)
Комментарий.
Статистическая значимость, не имеющая
практической полезности, часто может
быть получена использованием очень
большого числа случаев. Наоборот, тот,
кто использует нечувствительный
статистический критерий, может
сделать ошибочный вывод об отсутствии
важного в практическом смысле
различия. В общем, при сообщении тестовых
данных более приемлемо определить
доверительный интервал или функцию
правдоподобия интересующего параметра,
а не просто сообщить, что нулевая
гипотеза может или не может быть
отклонена.
Е.10.3. В
руководстве должны ясно различаться
интерпретация, которая приложима только
к средней тенденции группы, и
интерпретация, приложимая к любому
индивиду внутри группы. (Существенно.)
Комментарий.
Некоторые тесты достаточно надежны
для обеспечения относительно
стабильного среднего балла группы, но
недостаточно надежны, чтобы обеспечить
использование индивидуальных баллов
или позволить сравнение индивидов.
Е.10.4. В
руководстве должно быть ясно указано,
какая интерпретация относится к
каждому баллу субтеста в той же степени,
как и для всего теста. (Существенно.)
Комментарий.
В руководстве должно быть четко указано,
когда баллы субтестов получены только
для простоты вычисления балла всего
теста и не предлагают самостоятельного
использования, когда они могут иметь
исследовательское применение, и
предусматривается ли при этом их
интерпретация.
Е.11.
Составители тестов или другие лица,
использующие ЭВМ для интерпретации
тестов, должны предусмотреть руководство,
отражающее алгоритм и свидетельства
в поддержку интерпретации баллов
на основе ЭВМ. (Существенно.)
Комментарий.
Вычислительная машина позволяет
накопить и воспроизвести большое
количество данных. Интерпретация
теста может быть очень облегчена
использованием банка данных, накопленных
в ЭВМ на основе совокупности
индивидуальных оценок по батарее
тестов или вопроснику личности.
Пользователь таких массивов
должен знать обоснование и свидетельства
в пользу предполагаемой интерпретации,
так как она подвержена ошибкам в той
же степени, как и другие субъективные
интерпретации.
Данный пункт относится только к хранению
и обработке информации, введенной
в ЭВМ.
Проведение тестов
неавтоматизировано и осуществляется
обычным способом. В том случае, когда
пользователь хочет автоматизировать
и проведение теста, тест должен пройти
полную психометрическую проверку.
Наверняка вы сами хоть раз в жизни составляли тесты и уж точно неоднократно проходили разнообразное тестирование – от серьезного до совсем шуточного из серии «Какой ты овощ во время карантина?».
Очень часто, за неимением нужных знаний и подготовки, разработчики придумывают тесты, опираясь исключительно на свой опыт, интуицию и здравый смысл (за исключением «овоща на карантине»). Многие, приступая к разработке собственных тестов, поначалу думают: что тут может быть сложного? Составить вопросы, придумать к ним ответы — вот и вся недолга! Это очень глубокое заблуждение. Создание хорошего задания в тестовой форме – настоящее искусство.
Существуют разработанные учеными методики составления тестовых заданий. В этой статье я хочу рассказать об одной из таких методик, которую используют в системе общего и профессионального образования. В частности, ее нередко применяем и мы в учебном центре «Сетевая Академия ЛАНИТ» для разработки проверочных тестов и систем аттестации сотрудников.
Источник
Вместо предисловия
Почему я решила, что вам это может пригодиться? Во-первых, потому что многим из вас – людям, совсем далеким от педагогики, приходится проводить разнообразные обучающие мероприятия, разрабатывать учебные курсы и т.п., а все это требует проверки усвоения учебного материала. А какой еще способ, кроме тестирования, способен проверить знания быстро, надежно и объективно?
Во-вторых, потому что использование педагогических тестов актуально не только для образования, но и для областей, весьма далеких от него. Тесты – очень полезный инструмент для решения многих задач: и для аттестации сотрудников, и для первичной проверки соответствия знаний и навыков соискателей вакансии, и для оценки степени информированности аудитории о какой-либо проблеме, и много для чего еще.
Сразу оговорюсь, что эта статья в первую очередь рассчитана на людей, не имеющих большого опыта в составлении тестовых заданий. Ее цель – предоставить новичкам достаточный объем материала, который помог бы им научиться составлять качественные педагогические тесты разных видов.
Да простят меня «продвинутые» в вопросах тестовой теории читатели, речь пойдет о базовых сведениях. Хотя, как показывает практика, вспомнить основы тоже никогда не вредно.
Методику, о которой пойдет речь, разработали ведущие отечественные специалисты в области тестологии: В. С. Аванесов, М. Б. Челышкова, А.Н. Майоров и другие.
В качестве примеров приводятся тестовые задания из открытого банка заданий ЕГЭ, размещенного на официальном сайте ФГБНУ «Федеральный институт педагогических измерений», из книги М. Б. Челышковой «Теория и практика конструирования педагогических тестов», из книги В. С. Аванесова «Композиция тестовых заданий», а также задания, составленные автором статьи и преподавателями разных образовательных организаций.
Сначала немного теории
Говоря о тестах в разных сферах деятельности, подразумевают разное. Например, в вычислительной технике тест – это задача с известным решением, с помощью которой проверяется правильность работы системы, а в медицине тестом будет называться метод исследования, заключающийся в пробном воздействии на организм. В общем понимании, тест – это объективное и стандартизированное измерение, которое легко поддается количественной оценке, статистической обработке и анализу.
В рамках наших целей нас интересует педагогический тест со своей спецификой. Это система тестовых заданий различной трудности, созданная для качественного и эффективного измерения структуры и качества подготовленности испытуемых. Тестовое задание является одним из элементов педагогического теста, включает в себя инструкцию, тестовую задачу и эталон ответа.
Преподаватели используют тесты, чтобы:
- оценить исходные знания учащихся перед началом обучения и скорректировать план и содержание занятия;
- сделать срез знаний во время курса, чтобы вовремя внести изменения в процесс обучения, если слушатели недостаточно хорошо усваивают учебный материал;
- проверить финальный результат обучения.
Наиболее часто используются закрытые тесты, в которых ответы уже есть, как в игре «Кто хочет стать миллионером?». Но встречаются и открытые тестовые задания, требующие самостоятельно сконструировать или дополнить ответ.
Итак, выполняя закрытые тесты, обычно надо:
- выбрать один или несколько ответов среди заданных вариантов;
- установить соответствие между элементами двух множеств;
- установить правильный порядок действий или процессов, перечисленных автором теста.
Открытые тесты требуют:
- дополнить имеющийся ответ;
- полностью сконструировать ответ самостоятельно.
Какой материал следует включить в тест
Содержание теста зависит от того, какие цели вы перед собой ставите и зачем вам вообще нужен этот тест. Прежде всего, нужно самому себе ответить на вопрос, можно ли с помощью составленных вами заданий проверить подготовленность аудитории.
Вот такое тестовое задание предложил своим ученикам преподаватель анатомии по теме «Скелет грудной клетки». Одна из целей занятия – знать количество ребер у человека.
Инструкция
: Выберите один правильный ответ.
Количество ребер
- у мужчин больше, чем у женщин
- у женщин больше, чем у мужчин
- индивидуально у каждого человека
- зависит от жизненных обстоятельств
Как вы понимаете, при помощи этого задания невозможно проверить, знают испытуемые, сколько у человека ребер или нет. Поэтому, строго говоря, нет смысла включать такой тест в материалы контроля. Отдельный разговор о качестве подобранных автором вариантов ответа. Особенно интересно влияние жизненных обстоятельств на количество ребер. Но правила подбора неправильных ответов (дистракторов) к тестовым заданиям мы рассмотрим позже.
Основные правила подбора материала для теста следующие:
- Материал, заложенный в тест, должен соответствовать содержанию темы тестирования и программы учебного курса.
- В тест включается только то содержание темы, которое является признанным, объективно истинным и поддается рациональной аргументации. Спорные точки зрения в тестовые задания включать не рекомендуется. Суть тестовых заданий заключается как раз в том, что они требуют четкого, заранее известного преподавателям ответа, признанного ими в процессе разработки заданий объективно истинным.
- Уровень детализации содержания теста зависит от целей тестирования. Если вы планируете использовать тесты для сравнения уровня подготовки тестируемых в какой-то области (например, для конкурсного отбора соискателей вакансии или кандидатов на обучение), то уровень детализации материала должен быть низким. В заданиях такого теста достаточно отобразить только наиболее значимые элементы содержания.
- Если же тесты предназначены для выяснения, насколько успешно испытуемый освоил учебный материал (курс, раздел, тему) и освоил ли он его вообще, то уровень детализации области содержания должен быть довольно подробным. Это позволит сделать вывод о знаниях каждого испытуемого, при необходимости аттестовать его, а также проанализировать, какой материал лучше или хуже освоили испытуемые.
- Вместе с тем в тест необходимо включать те элементы содержания, которые можно отнести к наиболее важным, без которых знания по заявленной теме становятся несущественными. Нет смысла перегружать тест второстепенными деталями, не имеющими большого значения.
- Если с помощью тестовых заданий планируется оценивать знания по всему учебному курсу, следует равномерно включить в итоговый тест задания по всем изучаемым темам курса, убедившись в том, что они охватывают все самые важные аспекты предметной области и в правильной пропорции.
Например, если вы составляете тесты по курсу «Microsoft Excel» и включаете в него задания, посвященные исключительно созданию сводных таблиц и диаграмм, то при помощи этих тестов вы явно не сможете полноценно оценить уровень знаний по всему курсу в целом.
- Не всякое содержание можно выразить в форме тестового задания, то есть тесты – не универсальная форма для проверки знаний.
Сколько времени нужно выделить для тестирования
Сидеть над тестом невозможно бесконечно долго: начало и завершение тестирования должны быть фиксированными. К сожалению, довольно часто временной интервал для этого процесса выбирается спонтанно. И если ошибиться – дать слишком мало времени или слишком много, эффективность теста снизится.
Тестирование в спешке приведет к тому, что как «слабые», так и «сильные» испытуемые не успеют выполнить все задания, и мы не поймем – тестируемый не выполнил задание, поскольку не знал ответа, или вообще не успел к нему обратиться.
Если времени вагон и маленькая тележка, «сильные» испытуемые, успевшие быстро пройти тестирование, начинают отвлекать других, подсказывать ответы, что нарушает процедуру тестирования (мы не соблюдаем правило равных условий для всех испытуемых).
Если человек проходит тестирование в одиночестве или тестируется онлайн, при избытке времени он будет долго сидеть над заданиями, не решаясь выбрать ответ. Это вызовет утомление, снижение концентрации внимания, расслабление, что также снижает точность тестирования.
Всегда нужно иметь в виду, что испытуемые устают. А значит, тестирование не должно занимать слишком много времени, что напрямую связано с объемом самого теста. Практика показывает, что объем осознанно воспринимаемой информации начинает существенно снижаться примерно через 40-45 минут с начала тестирования (Ким В. С. Тестирование учебных достижений. – Уссурийск, 2007, стр. 29-35).
Общее время тестирования определяется количеством и сложностью заданий. Некоторые преподаватели используют, например, такие методики расчета времени тестирования:
- Время, затраченное преподавателем на выполнение составленного им теста, умножить на 3.
- Суммировать время, необходимое для выполнения каждого задания:
• задание закрытой формы с выбором одного правильного ответа – примерно 10 секунд;
• задание более сложных форм – в среднем от 30 секунд до 1 минуты.
Однако бывает, что теоретически рассчитать время тестирования невозможно, поэтому рекомендуется использовать эмпирические данные по результатам первичной апробации теста.
Составление тестовых заданий закрытой формы
А теперь давайте рассмотрим конкретные примеры и поймем, как составлять свои тесты. В фокусе нашего внимания – тестовые задания закрытой формы.
В таких тестовых заданиях выделяют следующие элементы:
- инструкцию (содержит общие требования к выполнению задания – рис. 1);
- основную часть (задание, постановка проблемы – рис. 2);
- варианты ответа (верный ответ(ы) и ответы-обманки – рис. 3).
Рекомендуется, чтобы задания в тесте представляли собой не вопросы, а утверждения, которые в зависимости от ответов могут превращаться в истинные или ложные высказывания.
Среди готовых ответов правильным чаще всего бывает только один, хотя не исключаются и варианты с выбором нескольких правильных ответов.
Неправильные, но похожие на правильные (и поэтому правдоподобные) ответы называются дистракторами (от англ. distract – отвлекать). Они используются для отвлечения внимания от правильного ответа тех, кто либо совсем не знает правильный ответ, либо пытается угадать его во время тестирования. Сделать неправильные ответы правдоподобными – одна из самых сложных задач разработчика теста.
Отдельно от тестовых заданий в программу тестирования вводится эталон выполнения заданий и разрабатываются критерии оценки.
Если вы проводите тестирование по старинке, в письменном виде, то вам потребуется ответник, трафарет для проверки ответника и эталон выполнения тестового задания.
Как оформить тестовые задания
Тестовое задание должно быть оформлено таким образом, чтобы облегчить тестируемому работу над ним.
Существует несколько вариантов дизайна тестовых заданий закрытой формы, но все сходятся в одном: все элементы тестового задания тем или иным образом должны быть графически выделены.
Подробнее о том, как принято оформлять задания
Рекомендован следующий вариант оформления.
- Инструкция не является частью задания. Она пишется отдельно от текста задания и выделяется графически, например, курсивом (пример выше – рис. 1).
- Инструкция может быть записана однократно, если в тесте используются задания одной формы. Каждая новая форма тестового задания требует своей инструкции.
Рекомендуется менять инструкцию как можно реже – ровно столько раз, сколько это оправдано стратегией тестирования. Слишком частая смена инструкции путает испытуемых.
- Текст задания выделяется полужирным шрифтом (рис. 2). Иногда текст задания пишут прописными буквами, но это
too muchвыглядит слишком громоздко и сильно снижает скорость чтения. - Задания нумеруются арабскими цифрами.
- Во избежание путаницы варианты ответов рекомендуется индексировать буквами кириллического или латинского алфавитов (рис. 3).
- Варианты ответа пишутся с маленькой буквы (если не представляют собой имена собственные), поскольку являются продолжением тестового задания, сформулированного в виде утверждения. Если задание сформулировано в вопросительной форме, варианты ответа пишутся так же.
- Варианты ответа располагают в столбик, причем желательно, чтобы все они были немного сдвинуты вправо относительно текста задания.
- Между вариантами ответа и по завершении задания знаки препинания, как правило, не ставятся. Это нарушает правила русской пунктуации, если рассматривать задание как текст, но тестологи мотивируют отсутствие знаков препинания тем, что и без них все части тестового задания графически выделены. Обилие запятых или точек с запятой между вариантами ответов способны помешать восприятию текста задания.
- Не рекомендуется перегружать задания вспомогательными словами: «Вопрос», «Варианты ответов» и пр.
- В печатном варианте теста каждое задание должно быть расположено целиком на одной странице.
- И, конечно же, стиль оформления заданий должен быть единым по всему тесту.
Как написать инструкцию к тестам
Инструкция – это общие требования к выполнению тестового задания. Она должна устранить все вопросы испытуемых об оформлении своих ответов. Кроме того, в тексте инструкции оговаривают специфику задания, например, указывают количество правильных ответов в тесте (один/несколько).
При написании инструкции используют стандартные формулировки. Формулировка инструкции зависит от формы тестового задания, количества правильных ответов и пр.
Для тестовых заданий с выбором одного правильного ответа в зависимости от способа проведения тестирования можно предложить следующие варианты инструкций.
- Выберите один правильный ответ.
- Внимательно прочитайте текст задания и выберите верный ответ из списка.
- Выпишите номер тестового задания и индекс правильного ответа.
- Обведите кружком букву (номер) правильного ответа.
- Для ответа нажмите клавишу с буквой (номером) правильного ответа.
Иногда, по замыслу автора, при разработке задания закладываются несколько правильных ответов, среди которых есть более и менее предпочтительные. В этом случае задание может сопровождаться следующей инструкцией: «Выберите наиболее правильный ответ».
Для тестовых заданий с выбором нескольких правильных ответов в зависимости от способа проведения тестирования можно предложить следующие варианты инструкций.
- Выберите несколько правильных ответов.
- Выберите все правильные ответы.
- Отвечая на задание теста, нажимайте на клавиши с буквами (номерами) всех правильных ответов.
Для тестовых заданий на выбор неправильного ответа инструкция может быть такой: «Выберите неправильный ответ».
Для группы однотипных заданий допускается делать одну инструкцию, которая помещается в начале теста или данной группы заданий в тесте.
Как правильно сформулировать основную часть задания
Эффективность и технологичность теста во многом зависят от того, насколько грамотно сформулированы задания. Если тестируемый не поймет смысл вопроса, ему придется отвечать наугад. А это уже минус к объективности конечного результата. Потому важно тщательно проработать каждое задание. Вот несколько рекомендаций.
1. Рекомендуется, чтобы задания в тесте были формулированы в форме утверждений, которые после ответов испытуемых естественным образом превратятся в истинные или ложные высказывания (рис. 1).
Если продолжить утверждение из основной части этого задания правильным ответом (в данном случае это вариант Б), получится истинное высказывание: Признаком протекания химической реакции между оксидом меди и водородом является изменение цвета. При «подстановке» неправильного ответа высказывание получится ложным.
По мнению многих отечественных тестологов (В.С. Аванесова, М.Б. Челышковой, В.С. Кима и др.), смысл тестового утверждения улавливается всегда лучше, чем смысл вопроса, потому что в тестовых утверждениях нет ни одного лишнего слова и даже знака, в то время как вопрос требует ряда дополнительных слов и знаков для выражения требуемого смысла, значения и интонации. Вопросы и ответы на них иногда бывают столь неопределенными и многословными, что для выявления их истинности требуются большие затраты времени и сил, в то время как технологичная методика тестирования предполагает четкую и быструю дифференцируемость ответов.
Действительно, если трансформировать задание, составленное в форме вопроса, в логическое утверждение, мы увидим, что задание уж точно не стало хуже, а даже выиграло – стало более кратким, понятным, лаконичным. После выбора ответа такое утверждение превратится в законченное высказывание, истинность или ложность которого легко поддается пониманию и оценке.
Пример 1. Задание в вопросительной форме:
Инструкция
: Выберите один правильный ответ.
С каким из названных событий связано окончание периода разрядки международной напряженности в 1970-е гг.?
- начало Корейской войны
- разрыв отношений с Югославией
- конфликт с Китаем
- ввод советских войск в Афганистан
То же задание в виде логического утверждения:
Окончание периода разрядки международной напряженности в 1970-е гг. связано c
- началом Корейской войны
- разрывом отношений с Югославией
- конфликтом с Китаем
- вводом советских войск в Афганистан
Пример 2. Задание в вопросительной форме:
Инструкция
: Выберите несколько правильных ответов.
Какие из перечисленных примеров относят к ароморфозам?
- возникновение теплокровности у позвоночных
- развитие трехкамерного сердца у земноводных
- формирование торпедообразного тела у акул
- развитие зародыша внутри матки
- появление рогов у копытных
- формирование крыльев у летучих мышей
То же задание в виде логического утверждения:
К ароморфозам относят
- возникновение теплокровности у позвоночных
- развитие трехкамерного сердца у земноводных
- формирование торпедообразного тела у акул
- развитие зародыша внутри матки
- появление рогов у копытных
- формирование крыльев у летучих мышей
Подобной трансформации легко поддается большинство заданий, сформулированных в вопросительной форме. Иногда возникают ситуации, когда, казалось бы, задание формулируется только в виде вопроса. Однако после тщательного анализа цели задания и его содержания все же удается подобрать утвердительную форму задания.
Конечно, утверждение об использовании в заданиях исключительно утвердительной формы не категорично. К тому же иногда встречаются задания, в которых вопросительная форма выглядит удобнее и короче.
Вопросительная форма заданий по-прежнему используется при составлении тестов и в России, и за рубежом, и имеет много сторонников. Выбор остается за вами. Главное – не забывать, что выбранная вами форма задания должна быть максимально понятна для испытуемых.
Лично я являюсь сторонником формулировки заданий в виде утверждений, считаю эту форму наиболее удачной, использую только ее и ничего с собой поделать не могу.
2. Текст задания должен содержать достаточную, недвусмысленную и релевантную информацию для ответа.
3. Формулировка задания должна быть грамотной, согласованной с формой вариантов ответа (простите за капитанство).
4. Формулировка задания должна быть предельно лаконичной, но не в ущерб пониманию сути задания. Необходимо исключить повторы слов и, тем более, целых фраз. Чем лаконичнее задание, тем лучше оно воспринимается.
5. Рекомендуется, чтобы основная часть задания состояла из одного предложения (не более 7-8 слов), а во всем задании было не более одного придаточного предложения. Эта рекомендация подходит, конечно, не ко всем случаям. Например, тестовое задание может представлять собой кейс/ситуационную задачу, тогда одним предложением точно не обойтись.
6. Если задание сформулировано в вопросительной форме, предпочтительнее применять прямые вопросы, представляющие собой полное предложение с вопросительным знаком в конце.
7. В основной части задания не должна присутствовать дополнительная информация, не существенная для поставленной проблемы.
8. Из текста задания нужно исключить все вербальные ассоциации, по которым можно догадаться о правильном ответе.
9. Стоит исключить из формулировки задания частицу «не». А если НЕ получается, ее надо выделить прописными буквами (как в этом предложении).
10. Исключаются задания, содержащие оценочные суждения тестируемого: «на ваш взгляд», «по вашему мнению», «что вы думаете…», «согласны ли вы с …», «как бы вы сформулировали…» и т.п.
11. Рисунки, графики, схемы, используемые в задании, должны соответствовать тексту (рис. 2). И, конечно же, присутствие графических объектов в задании должно быть оправдано. Не стоит «добавлять картинку» просто для красоты.
12. Элементы рисунка, графика, схемы рекомендуется обозначать по часовой стрелке (рис. 3).
13. В большинстве случаев варианты ответов замыкают задания (так было и в примерах выше), образуя завершенное истинное или ложное высказывание. Но иногда ответы приходится ставить в середине или за одно-два слова от конца содержательной основы задания теста. Тогда можно использовать такой вариант:
Инструкция
: Выберите один правильный ответ.
Невская битва произошла в … году.
- 1198
- 1240
- 1242
- 1245
14. Ответ на одно тестовое задание не должен служить ключом к правильным ответам на другие задания теста. Это нарушает условие локальной независимости заданий. В этом случае невозможно сделать корректный вывод о том, знает ли испытуемый ответ на второе и последующие задания, или он не справился с ними потому что неправильно ответил на первый вопрос.
Как подобрать дистракторы
К каждому тестовому заданию нужно подобрать правдоподобные неправильные варианты ответа (дистракторы). Это одна из самых сложных задач, стоящих перед составителем тестов. Перед вами основные рекомендации по подбору дистракторов:
1. Все предложенные в задании дистракторы должны быть правдоподобными, теоретически вероятными.
Наиболее хороши дистракторы, подобранные на основе типичных ошибок, которые допускают тестируемые, или на основе распространенных заблуждений.
2. Все дистракторы к заданию должны быть одинаково привлекательными для тестируемых, не знающих правильного ответа.
Дистрактор, который никто не выбирает в качестве правильного ответа, обычно называют неработающим. Если в задании имеется хотя бы один неработающий дистрактор, удалите его, и вы сразу увидите реальное, а не формальное число ответов к заданию теста.
Если все дистракторы в задании не работают, все испытуемые выполнят даже сложное задание верно, выбрав единственный правдоподобный ответ. Например, такое задание:
Инструкция
: Выберите один правильный ответ.
Во вращении предплечья наружу участвует
- двуглавая мышца плеча
- двуглавая мышца бедра
- икроножная мышца
- прямая мышца живота
- собственно жевательная мышца
Даже не будучи знатоком данной предметной области, нетрудно догадаться, что мышцы, расположенные на нижней конечности, животе или черепе, не могут приводить в движение предплечье. Получается, что в тесте нет ни одного работающего дистрактора. Имеется всего один работающий вариант ответа, его и выберут испытуемые как единственно правильный.
Вы спросите: «А что же здесь плохого»? Как мы писали выше, педагогические тесты создаются для объективной оценки структуры и качества знаний. А о какой объективной оценке можно говорить, если правильный ответ можно просто угадать, не имея совсем никакого представления о предмете? Конечно, если целью тестирования было узнать, отличает ли испытуемый живот или бедро от предплечья, то можно сказать, что все прошло успешно. Но все же перед тестами обычно ставятся более серьезные задачи.
Если в предложенном задании мы заменим неработающие дистракторы на правдоподобные, теоретически вероятные (все перечисленные мышцы тем или иным образом двигают предплечье), справиться с ним так просто будет нельзя:
Во вращении предплечья наружу участвует
- плечевая мышца
- двуглавая мышца плеча
- трехглавая мышца плеча
- локтевая мышца
- круглый пронатор
3. Дистракторы должны быть однородными, подобранными по общему (единому) основанию.
Пример 1: Задание с однородными дистракторами
Инструкция
: Выберите один правильный ответ.
Телиоспоры возникают из
- урединиоспор
- эциоспор
- базидиоспор
- пикниоспор
Здесь все дистракторы подобраны по одному основанию, т.к. все они отвечают на вопрос «из чего?» и характеризуют то, из чего могут возникнуть телиоспоры.
А в следующем задании дистракторы подобраны неудачно.
Пример 2: Задание с неоднородными дистракторами
Инструкция
: Выберите несколько правильных ответов.
Телиоспоры возникают
- из урединиоспор
- из эциоспор
- поздней осенью на том же мицелии, на котором летом формировались урединиоспоры
- весной в результате слияния дикариона и последующего мейоза
В этом задании два первых ответа выбраны по одному основанию т.к. все они отвечают на вопрос «из чего?». Третий ответ подобран по другому основанию, поскольку соответствует вопросам «когда?» и «где?».
Последний ответ не совпадает по основанию выбора ни с одним из предыдущих, он отвечает на вопросы «когда?» и «в результате чего?».
Самая частая причина появления в заданиях неоднородных дистракторов понятна – при невозможности подобрать нужное число дистракторов по одному основанию автор теста увеличивает их число, включая дополнительные, выбранные по другому основанию ответы.
Иногда причиной является желание автора проверить с помощью одного задания как можно больше знаний испытуемых. Возможно, это оправдано спецификой предмета, однако некорректно с точки зрения требований тестовой технологии.
Тестовое задание должно проверять один элемент знания. Если это не так, то становится неясным, с каким именно элементом знания тестируемый не справляется, в чем заключена причина невыполнения задания.
4. Все ответы должны быть параллельными по конструкции и грамматически согласованными с основной частью задания теста.
5. Все повторяющиеся в вариантах ответа слова (как в примере ниже) следует перенести в формулировку заданий.
Инструкция
: Выберите один правильный ответ.
Заштрихованная территория на карте России показывает районы
- газовых месторождений
- нефтяных месторождений
- месторождений каменного угля
- месторождений калийной соли
Вот что получится после небольшой правки этого примера:
Инструкция
: Выберите один правильный ответ.
Заштрихованная территория на карте России показывает районы месторождений
- газовых
- нефтяных
- каменного угля
- калийной соли
6. Рекомендуется использовать длинные задания и короткие ответы. В противоположном случае на прочтение и анализ ответов тратится слишком много времени.
7. Из числа неправильных исключаются ответы, вытекающие один из другого.
8. Ни один из дистракторов не должен быть частично правильным ответом, который при определенных условиях превратится в правильный ответ.
9. Ответы не должны отрицать смысл самого задания. «Почему? – спросите вы, – ведь так часто делают». Давайте разберемся на примере следующего задания:
Инструкция
: Выберите один правильный ответ.
PDF-файл можно преобразовать в документ Word, если на вкладке «Файл» выбрать команду
- Открыть
- Сохранить как
- Экспорт
- PDF-файл нельзя преобразовать в документ Word
В этом примере четвертый ответ прямо противоречит основной части, утверждающей существование возможности преобразовать PDF-файл в документ Word. Налицо явная логическая ошибка. В задании же не спрашивается, можно ли преобразовать, а утверждается, что можно, а варианты ответов представляют собой перечисление способов преобразования.
Если четвертый ответ – дистрактор, то в качестве правдоподобного ответа его вряд ли выберет хотя бы один тестируемый. Тогда этот ответ как неработающий дистрактор необходимо удалить из теста.
Если именно четвертый ответ является верным, все задание будет нерабочим, т.к. большинство тестируемых увидят логическую несообразность формулировок и пропустят задание, посчитав его ошибкой разработчика теста.
Если цель задания – выяснить, знает ли испытуемый, можно ли вообще преобразовать PDF-файл в документ Word или нет, лучше сформулировать вопрос по-другому, без нарушения логики:
Преобразовать PDF-файл в документ Word
- можно
- нельзя
10. Не следует использовать в заданиях ответы типа «все вышеперечисленные», «ни один из вышеперечисленных» или, того хуже, – «все ответы неправильные» и «правильного ответа нет». Эта рекомендация, кстати, так же часто вызывает вопросы и несогласие аудитории, как и предыдущая.
С точки зрения большинства тестологов, применение подобных ответов не оправдано по следующим причинам:
- повышение вероятности угадывания правильного ответа, так как чаще всего это будет неработающий дистрактор, добавленный составителем «для количества» при трудностях с подбором качественных дистракторов;
- нарушение логического закона исключенного третьего – если инструкция предписывает выбрать один верный ответ, то в задании он должен быть. Это придает однозначность замыслу самого задания и не допускает противоречивых толкований у испытуемых.
11. Не рекомендуется использовать слова «всегда», «никогда», «ни одного» и т.п., так как в отдельных случаях они способствуют угадыванию.
12. Частота выбора одного и того же номера места для правильного ответа в различных заданиях теста должна быть примерно одинакова или номер места для правильного ответа выбирается в случайном порядке.
13. Дистракторы из одного задания не используются в качестве ответов к другим заданиям теста.
14. Все ответы к одному заданию должны быть примерно одной длины. Если это трудновыполнимо, возможен вариант, когда в задании половина длинных ответов, половина коротких. Это нужно для того, чтобы исключить вероятность угадывания правильного ответа по признаку его полноты или краткости. Многие разработчики тестов грешат тем, что в их заданиях правильные ответы почти всегда или длиннее, или короче неправильных. Эта тенденция очень быстро «считывается» испытуемыми и делает общий результат теста необъективным. Следующая рекомендация имеет такое же обоснование.
15. Правильный ответ не должен быть длиннее других.
16. Дистракторы располагаются в логической последовательности: числа – по возрастанию, буквы – по алфавиту. Это удобнее при поиске тестируемым правильного ответа.
17. Количество дистракторов к заданию подбирается таким образом, чтобы задание не было слишком громоздким, но и чтобы исключить большую вероятность угадывания правильного ответа. Поэтому чаще всего в заданиях бывает три или четыре дистрактора и один правильный ответ.
В отдельных случаях, например, в заданиях с выбором нескольких правильных ответов, количество дистракторов может достигать шести–семи.
18. Число дистракторов и правильных ответов в разных заданиях может быть разным. Оно не должно быть одинаковым во всех заданиях теста.
Источник
По какому принципу придумывают тестовые задания
Из десяти принципов разработки тестовых заданий закрытой формы, которые выделяет В. С. Аванесов, предлагаю рассмотреть основные. Для наглядности будем это делать на примерах.
1. Принцип противоречия применяется при создании заданий с двумя вариантами ответов. Здесь один ответ отрицает другой. Например:
Инструкция
: Выберите один правильный ответ.
Поощрения в трудовую книжку
- записываются
- не записываются
2. Принцип противоположности ответов близок по смыслу к принципу противоречия, но при противоречии используется отрицание, а при противоположности один ответ заменяется другим, антонимичным по смыслу. Например:
Инструкция
: Выберите один правильный ответ.
С увеличением заряда ядра активность щелочных металлов
- возрастает
- убывает
Возможность промежуточных состояний при использовании принципа противоречия позволяет увеличить число ответов, например, до трех. Например:
Инструкция
: Выберите один правильный ответ.
При движении тягового органа конвейера реле скорости
- включено
- выключено
- заблокировано
3. Тесты, основанные на принципе однородности, содержат ответы, относящиеся к одному роду, виду, или отображают основные стороны, грани явления. Например:
Инструкция
: Выберите один правильный ответ.
Основателем андрагогики как науки является
- Ноулз
- Джарвис
- Холтон
- Ушинский
Инструкция
: выберите несколько правильных ответов.
Буква «о» пишется в словах
- пл_вец
- пок_рить вершину
- распол_гать
- осн_щенный
- ум_лять значение
4. Принцип кумуляции означает, что второй ответ вбирает в себя (аккумулирует) содержание первого, третий – содержание второго и т.д.
Пример:
Инструкция
: Выберите один правильный ответ.
Чтобы задать движение точки естественным способом, надо знать
- траекторию
- траекторию и закон движения
- траекторию, закон движения, начало отсчета
- траекторию, закон движения, начало отсчета, скорость
Тестируемые, привыкшие давать полные и правильные ответы, выбирают обычно последний ответ в таких заданиях, ошибочно полагая, что он всегда самый правильный. Поэтому при разработке заданий по принципу кумуляции полезно иметь большую часть правильных ответов не на последнем месте.
5. Принцип сочетания. Используется сочетание слов (знаков) по два или по три, реже четыре, в каждом ответе.
Пример 1: сочетание более или менее однородных и правдоподобных пар ответов
Инструкция
: Выберите один правильный ответ.
Ф. Шопен писал
- оперы и симфонии
- балеты и оратории
- мазурки и ноктюрны
Пример 2: сочетание одного слова (понятия) с несколькими другими
Инструкция
: Выберите один правильный ответ.
НЕ имеют ядра клетки крови
- эритроциты и лейкоциты
- эритроциты и тромбоциты
- эритроциты и лимфоциты
- эритроциты и базофилы
Пример 3: сочетание ответов по правилу цепочки, когда последнее слово в первом ответе становится первым во втором ответе, последнее во втором – первым в третьем и т.д.)
Инструкция
: Выберите один правильный ответ.
Служебными частями речи являются
- предлоги, союзы, частицы
- частицы, союзы, местоимения
- местоимения, частицы, предлоги
6. При использовании принципа градуирования ответы располагаются по возрастанию (увеличению) или по убыванию (уменьшению). Этот принцип применим для заданий с тремя и большим числом ответов. Например:
Инструкция
: Выберите один правильный ответ.
Растворимость газов при повышении температуры
- увеличивается
- остается без изменений
- уменьшается
Согласно ч. 3 ст. 5.63 КоАП РФ, нарушение должностным лицом порядка или сроков рассмотрения жалобы влечет наложение административного штрафа в размере … рублей.
- от трех тысяч до пяти тысяч
- от пяти тысяч до десяти тысяч
- от десяти тысяч до пятнадцати тысяч
- от двадцати тысяч до тридцати тысяч
7. Принцип формулирования заданий с ответами, правильными в различной мере, требует изменения инструкции, содержания задания и логики подбора ответов.
Инструкция, как мы уже говорили, обычно пишется так: Выберите наиболее правильный ответ.
Задача таких заданий – проверить сопоставительные знания, а ответы формулируются так, чтобы был реальный выбор между ответами, правильными в разной степени. Например:
Инструкция
: Выберите наиболее правильный ответ.
Зигота – это
- одна яйцеклетка
- оплодотворенная яйцеклетка
- диплоидная клетка, образующаяся в результате оплодотворения
- одноклеточная стадия развития многоклеточного организма млекопитающих
В этом задании наиболее правильным считается третий ответ (он наиболее емко и точно описывает все характеристики зиготы), следующий по степени правильности – второй ответ (он содержит совершенно правильное, но менее полное определение зиготы), затем четвертый (потому что зиготы образуются не только у млекопитающих). На последнем месте по степени правильности находится первый ответ – он самый неполный, ведь одной яйцеклетки для образования зиготы явно недостаточно.
Задания на выбор наиболее правильного ответа разрабатывать довольно сложно: наиболее правильный ответ далеко не всегда должен быть самым полным. В противном случае тестируемый при выполнении задания будет выбирать правильный ответ только по признаку полноты.
Составили тест? Не поленитесь и пройдите по этому чек-листу.
Проверка качества тестовых заданий
- Соответствует ли задание целям тестирования?
- Все высказывания логичны?
- Все формулировки однозначны и лаконичны?
- Технологичен ли тест? (Задания становятся технологичными, если их содержание точно и быстро понимается испытуемыми, и если форма заданий способствует процессу компьютеризации тестирования)
- Правильно ли выбрана форма задания?
- Содержание корректно?
- Правила оценки ответов разработаны заранее и соответствуют форме теста?
- Правильно ли расположены элементы задания?
- Инструкции одинаковы для всех тестируемых?
- Инструкция соответствует форме и содержанию задания?
В этой статье мы обсудили основные аспекты составления тестовых заданий закрытой формы с одним или несколькими правильными ответами. Благодарю вас за внимание и терпение и надеюсь, что эта статья будет полезной для вас.
Если вы считаете, что стоит продолжить цикл подобных статей и поговорить о методике составления тестовых заданий других видов, напишите, пожалуйста, об этом в комментариях. А если вам нужны готовые инструменты оценки качества обучения, обращайтесь к нам в «Сетевую Академию ЛАНИТ». Будем рады помочь.
МЕТОДИЧЕСКИЕ
РЕКОМЕНДАЦИИ
по
составлению и оформлению тестовых заданий
ВВЕДЕНИЕ
Один из
элементов системы оценки качества – тестирование учебных достижений обучающихся.
Система тестирования – универсальный инструмент определения уровня обученности обучающихся
на всех этапах образовательного процесса, в том числе для оценки уровня
остаточных знаний.
Тест обладает
способностью сравнивать индивидуальный уровень знания каждого обучающегося с
некими эталонами, уровень знания отражается в тестовом балле испытуемого.
Индивидуальные результаты тестирования можно сравнить с результатами других обучающихся
этой же группы и проранжировать их, можно сравнить результаты тестирования
нескольких групп и т.д.
С помощью теста можно
оценить структуру знаний, то есть установить наличие последовательности
в усвоенных обучающимися знаниях, отсутствие пробелов.
Методические
рекомендации по составлению и оформлению тестовых заданий имеют целью
определить единые требования к составлению тестов по учебным дисциплинам/МДК,
предназначенных для проверки уровня и структуры знаний обучающихся техникума.
Объективность
результатов тестирования, в первую очередь, зависит от качества тестовых материалов,
поэтому при разработке необходимо учитывать комплекс требований, диктуемых
положениями теории и практики тестирования.
Методические
рекомендации помогут унифицировать тестовые материалы. Тестирование —
лишь один из способов оценки качества подготовки обучающихся. Тестирование
не заменяет, а дополняет другие формы диагностики, контроля и оценки уровня
обученности.
Методические
рекомендации призваны способствовать:
— формированию культуры тестирования в
системе оценки качества обученности обучающихся;
— повышению объективности процессов и
результатов оценки учебных достижений обучающихся;
— созданию необходимых предпосылок и
условий для совершенствования содержания и структуры образовательного процесса;
—
повышению уровня квалификации педагогов, непосредственно разрабатывающих и
применяющих тестовые материалы.
- СЛОВАРЬ ТЕРМИНОВ
Тестирование —
один из наиболее эффективных методов выявления и оценки уровня учебных
достижений обучающихся, осуществляемый посредством стандартизированных
материалов — тестовых заданий; технологический процесс, реализуемый в форме
алгоритмически упорядоченного взаимодействия студента с системой тестовых
заданий и завершающийся оцениванием результатов.
Тестовое задание (ТЗ)
— варьирующаяся по элементам содержания и по трудности единица контрольного
материала, сформулированная в утвердительной форме предложения с неизвестным.
Подстановка правильного ответа вместо неизвестного компонента превращает
задание в истинное высказывание, подстановка неправильного ответа приводит к
образованию ложного высказывания, что свидетельствует о незнании студентом
данного учебного материала.
Тест —
система заданий возрастающей трудности специфической формы, позволяющая
качественно и эффективно определить уровень и оценить структуру
подготовленности тестируемого.
Контролирующий тест
— тест, выступающий в качестве метода или способа измерения уровня и структуры
знаний обучающихся.
Банк тестовых заданий
– логически упорядоченный набор тестовых заданий, позволяющих генерировать
множество тестов.
Спецификация теста
— система характеристик теста, отражающая его содержание и структуру.
Надежность теста –
характеристика теста, свидетельствующая о постоянстве эмпирических измерений,
то есть многократном повторении.
Валидность теста —
действительная способность теста измерять ту характеристику, для диагностики
которой он заявлен.
Дистрактор —
близкий искомому по своему смыслу вариант ответа, но не являющийся таковым.
Эталон – это
правильный и полный ответ или метод выполнения заданной деятельности.
II. ФОРМЫ
ТЕСТОВЫХ ЗАДАНИЙ
По
классификации тестов, предложенной Аванесовым В.С., можно выделить тестовые
задания четырех основных форм:
·
задания
закрытой формы, в которых испытуемый выбирает один или несколько
вариантов ответов из списка предложенных;
·
задания
открытой формы, требующие от испытуемого самостоятельного ответа (в
текст задания вписывается слово, вставляется формула и т.д.);
·
задания
на установление соответствия, выполнение которых связано с выявлением
соответствия между элементами двух множеств;
·
задания
на установление правильной последовательности, в которых требуется
указать правильный порядок действий или процессов.
Задания закрытой
формы:
— задания с
выбором одного правильного ответа (предлагается
несколько ответных альтернатив, но только один ответ – правильный);
— задания с
выбором наиболее правильного ответа (предлагается несколько
ответных альтернатив, в числе которых могут быть и неправильные, и правильные,
но в разной степени. От испытуемого требуется выбрать наиболее правильный
ответ);
— задания с
выбором всех правильных ответов (предлагается несколько ответных
альтернатив, в числе которых может быть несколько правильных. Испытуемый должен
выбрать все правильные ответы).
Задания закрытой формы
сопровождаются инструкцией: «Запишите номер/-а (цифру/-ы, букву/-ы)
правильного/-ых ответа/-ов».
Задания
открытой формы
В
заданиях открытой формы готовые ответы не даются, их должен получить или
придумать сам испытуемый. Задания открытой формы бывают двух типов:
— задания на
дополнение;
— задания со
свободно конструируемым ответом.
Для
задания открытой формы рекомендуется использовать инструкцию, состоящую из
слов: «Дополните фразу», «Дайте определение..» и т.п..
Задания
на установление соответствия
Они могут быть
двух типов:
— Соответствия
взаимно-однозначные: любому элементу из левого столбца соответствует только
один элемент из правого столбца и наоборот;
— Соответствия
не взаимно-однозначные: различным элементам из левого столбца может
соответствовать один и тот же элемент из правого столбца.
К
заданиям предлагается стандартная инструкция, состоящая из двух слов:
«Установите соответствие».
Задания
на установление правильной последовательности
Эта
форма заданий проверяет определенные знания: алгоритмические, процессуальные,
процедурные, технологические.
Стандартная инструкция к заданиям этой формы имеет вид
«Установите правильную последовательность».
Сопоставительный
анализ характеристик тестовых заданий
Характеристики |
Задания закрытой формы |
Задания открытой формы |
Задания на установление соответствия |
Задания на установление |
Проверка знания фактов |
Годны |
Годны |
Годны |
Годны |
Применение знаний по образцу |
Годны |
Годны |
Годны |
Годны |
Применение знаний в нестандартных ситуациях |
Негодны |
Годны |
Негодны |
Годны |
Простота конструирования |
Есть |
Есть |
Нет |
Нет |
Исключение угадывания |
Не исключено |
Исключено |
Не исключено |
Не исключено |
Объективность оценки |
Да |
Нет |
Да |
Да |
Исключение описок |
Нет |
Да |
Нет |
Нет |
Возможность оригинального ответа |
Нет |
Да |
Да/Нет |
Нет |
III. Уровни сложности тестовых заданий
ТЗ должны быть различного уровня сложности
(классификация тестов по В.С. Беспалько).
Первый
уровень
– ознакомительный (узнавание ранее изученных объектов, свойств): тесты
на узнавание, т.е. отождествление объекта и его обозначения (задания на
опознание, различение или классификацию объектов, явлений и понятий,
соотнесение). Вопросы задаются в открытой и закрытой формах по основным дидактическим
единицам дисциплины («да» — «нет», «выбрать один или несколько правильных
ответов», «соотнести объекты и их характеристики, свойства»).
Второй
уровень
— репродуктивный (выполнение деятельности по образцу, инструкции):
тесты-подстановки, в которых намеренно пропущено слово, фраза,
формула или другой какой-либо существенный элемент текста, и конструктивные
тесты, в которых обучающимся в отличие от теста-подстановки не
содержится никакой помощи даже в виде намеков и требуется дать определение
какому-либо понятию, указать случай действия какой-либо закономерности и т.д. В
качестве тестов второго уровня могут использоваться и типовые задачи,
условия которых позволяют «с места» применять известную разрешающую их
процедуру (правило, формулу, алгоритм) и получать необходимый ответ на
поставленный в задаче вопрос.
Третий
уровень
– продуктивный (планирование и самостоятельное выполнение
деятельности, решение проблемных задач): нетиповые задачи на
применение знаний в реальной практической деятельности и тест «Черный
ящик».
Условия нетиповой задачи формулируются близкими к тем,
которые имели место в реальной жизненной обстановке. Решение такой задачи
состоит в сведении ее к типовой путем преобразования известных формул или
нахождения алгоритма решения. Проверяется деятельность в нестандартной ситуации
по аналогии, сходству между изученными и не изучавшимися ранее элементами.
Тест «Черный ящик»
представляет собой проблемную ситуацию, решение которой содержится в известных
обучающимся знаниях и умениях. Опираясь на них, обучающиеся
решают предложенное задание. («Определите то, что находится в чёрном ящике:
Через него пропускают переменный ток. Чем меньше его частота, тем меньше
сопротивление того. Что в чёрном ящике?» Эталон: конденсатор).
Рекомендуемое распределение
заданий в одном тесте по уровням:
заданий
I уровня –
не более 30% (20-25% заданий разных форм),
заданий
II уровня –
60-70%;
заданий
III уровня –
5-10%.
IV.
ТРЕБОВАНИЯ К ТЕСТОВЫМ ЗАДАНИЯМ
Общие требования
1. Соответствие
ФГОС и рабочей программе учебной дисциплины.
2. Содержание
ТЗ должно отражать знания, умения, практический опыт, которые необходимо
проверить.
3. Содержание
каждого ТЗ должно охватывать какую-либо одну смысловую единицу, то есть должно
оценивать что-то одно.
4. Наличие
ТЗ различной формы и уровня сложности.
5. Формулировка
задания должна быть не в форме вопроса, а в форме утверждения. Предложение
должно быть сформулировано грамотно, коротко, четко, ясно, без повторов,
малопонятных слов и символов, без использования отрицательных частиц. Не
рекомендуется начинать ТЗ с предлога, союза, частицы.
6. Наличие
правильного ответа к разработанному заданию.
7. Среднее время,
отводимое на выполнение одной задачи (вопроса) теста обучающимся, должно быть
минимум 1 минута, а максимум – 3-5 минут.
8. Соблюдение
единого стиля оформления заданий, входящих в один тест.
В дополнение к
общим требованиям существует еще ряд других, обусловленных спецификой
выбранной тестовой формы.
Требования к заданиям закрытой формы:
— Основная
часть задания формулируется в форме утверждения, которое обращается в истинное
или ложное высказывание после подстановки одного из вариантов ответа.
— Задание
формулируется предельно кратко, как правило, в форме предложения, состоящего из
7-8 слов. В основную часть задания следует включать как можно больше слов,
оставляя для ответа не более 2-3 наиболее важных, ключевых для данной проблемы
понятий.
— Из текста
задания необходимо исключать все ассоциации, способствующие выбору правильного
ответа с помощью догадки.
— ТЗ
закрытой формы должны содержать не более пяти вариантов ответов на каждый
вопрос (оптимально – 4 варианта).
— Среди
предложенных вариантов ответа может быть как один, так и несколько верных.
— В ответах
не рекомендуется использовать слова «все», «ни одного», «никогда», «всегда» и
т.п., так как в отдельных случаях они способствуют угадыванию правильного
ответа.
Примеры (уровень
сложности — 1):
1. Преобразование
электрических колебаний в звуковые происходит в …
а) микрофоне;
б) динамике;
в) детекторе
радиоприёмника;
г) приёмной
антенне.
2.
В данном списке найдите два региона России, в которых нет
городов-миллионеров:
Требования
к тестовым заданиям открытой формы:
—
Текст
задания должен обладать предельно простой синтаксической конструкцией. В тексте
задания не должно быть повторов и двойного отрицания.
—
Место
пропущенного понятия обозначается точками или нижним подчеркиванием. Точки/подчеркивание
ставятся на месте ключевого элемента, знание которого является наиболее
существенным для контролируемого материала. Если это возможно, то после точек/подчеркивания
указываются единицы измерения. Все точки/подчеркивания
в заданиях для одного теста рекомендуется делать равной длины.
—
Обычно
ответом служит одно слово или словосочетание, состоящее не более чем из двух
слов.
—
При
указании составителем теста правильного ответа должны быть перечислены все
возможные варианты написания слова-ответа.
Примеры (уровень
сложности 2):
1. Конституцией
определено, что забастовка – это временный … отказ работников от выполнения
обязанностей в целях разрешения спора.
Ответ:
добровольный.
2.
Низменность – это вид ______, с ____ высотой до __ метров.
Ответ:
равнины, абсолютной, 2000.
Требования
к тестовым заданиям на установление соответствия
—
Группы
объектов, между которыми устанавливается соответствие, могут быть одинакового
размера, но предпочтительнее, чтобы одна была больше другой (допускается одна
лишняя позиция).
—
Соответствие
между объектами групп должно быть однозначным, одному элементу первого
множества должен соответствовать один элемент второго множества.
— К
заданиям предлагается стандартная инструкция, состоящая из слов: «Установите
соответствие».
Пример
(уровень сложности 1):
Установите
соответствие между видами конфликтов и их характеристикой.
Столкновение |
Внутригрупповой |
Внутреннее |
Внутриличностный |
Столкновение |
Межгрупповой |
Столкновение |
Межличностный |
Требования
к тестовым заданиям на установление правильной последовательности
—
Последовательность
устанавливаемых объектов должна быть однозначной, не рекомендуется составлять
последовательность, требующую повторения одного из объектов.
—
В
основном тексте задания должно быть указание на направление последовательности.
— Стандартная
инструкция к заданиям четвертой формы имеет вид «Установите правильную
последовательность».
Пример
(уровень сложности 2):
Установите
последовательность этапов переговорного процесса:
o Подготовительный
этап
o Взаимное
уточнение позиций участников
o Выдвижение
аргументов и обоснование своих взглядов
o Согласование
позиций и выработка договоренностей
o Анализ
результатов переговоров
Примеры заданий 3 уровня сложности:
1.
Составьте алгоритм трудовых действий продавца по продаже сыра в молочном
отделе.
2.
Группа обучающихся выполняла облицовку стен в столовой керамической плиткой.
После окончания работы оказалось, что ширина швов на облицованной поверхности —
неодинаковая. Раствор был качественный, поверхность была подготовлена
правильно. Отчего это произошло?
V. Структура теста
Основными структурными
компонентами теста являются:
·
Спецификация
теста
·
Инструкция
для тестируемых
·
Основной
текст
·
Эталон ответов и критерии оценки
Спецификация
теста
В
спецификации теста описываются основные характеристики теста. К характеристикам
теста относятся: название дисциплины, по которой составлен тест; название темы,
по которой составлен тест; цель теста; содержание теста, критерии оценки.
Возможные цели тестов: для контролирующих тестов
основной целью является проверка (контроль) усвоенных обучающимися знаний и
навыков по конкретной учебной дисциплине.
Целью текущего контроля является проверка знаний и навыков по
одной или нескольким темам учебной дисциплины, по одному разделу.
Целью итогового контроля является проверка знаний и навыков по
всей учебной дисциплине в целом.
Целью может быть проверка уровня остаточных знаний по дисциплине.
Инструкция
для тестируемых
Инструкция должна содержать указания на то, что и как обучающийся
должен сделать, какое количество времени дается на его выполнение, какой
стратегии должен придерживаться испытуемый (например, если не знаете ответ на
задание, приступайте к выполнению следующего), что надо сделать, чтобы записать
правильный ответ.
Перед группой однотипных заданий можно поместить общую инструкцию.
Очень важно указать, каким образом нужно делать отметки при выполнении заданий:
например, для тестовых заданий открытой формы – вписать ответ в отведенное
место.
Если тест включает различные формы заданий, то при смене форм,
перед каждой частью теста можно дать дополнительную инструкцию по выполнению
данной формы задания.
Эталон ответов и
критерии оценки
Данный
компонент является обязательной составной частью теста, который предназначен
преподавателям, которые должны проверить тест.
VI. Этапы составления тестов
Для облегчения процедуры
составления тестов учебный материал должен быть достаточно формализован, т.е.
каждый раздел, тему учебной дисциплины (МДК) необходимо представить в виде
таких задач и (или) вопросов, которые наиболее полно отображают содержание дисциплины
(МДК). При этом важно выделить главные (проблемные) вопросы, не увлекаясь
второстепенными.
На втором этапе, в зависимости
от цели тестирования (текущий контроль знаний, итоговый контроль знаний, оценка
остаточных знаний и др.) и формы теста, разрабатывается план раскладки задач и
вопросов в тестовые задания. Формализация учебного материала и составление
тестовых заданий — наиболее ответственные и сложные этапы составления тестов.
Рекомендуемое время
тестирования и количество вопросов (из расчёта 1-3 минуты — на выполнение
одного тестового задания):
—
тест для текущего контроля на 12-15 мин может содержать 6-7
тестовых заданий,
—
тесты для промежуточной аттестации на 90 мин должны включать не
менее 30 тестовых заданий,
—
тесты для промежуточной аттестации на 45 мин – не менее 15
тестовых заданий.
После составления тестовых
заданий педагог оформляет эталон ответов (Приложение 2), инструкцию для
тестируемых, определяет критерии оценки.
VII. методика оценивания ответов
Методика
оценивания ответов обучающихся должна быть проста, объективна и удобна для
обработки результатов тестирования.
Пример системы оценивания для разноуровневых заданий:
— ТЗ
1 уровня: правильный ответ – 1 балл; неправильный ответ – 0 баллов.
— ТЗ
2 уровня: правильный ответ – 2 балла; частично правильный ответ – 1 балл;
неправильный ответ – 0 баллов.
— ТЗ
3 уровня: правильный ответ – 3 балла; правильный ответ, но сопровождающие
записи с ошибками, или неправильный ответ, но записи свидетельствуют о
правильности хода размышлений – 2 балла; частичное решение или частичный ответ,
который не доведен до логического завершения – 1 балл; в остальных случаях – 0
баллов.
Суммируя
количество баллов за каждое задание, получаем максимальное количество баллов –
100%. Затем рассчитываем количество баллов на «4» и «3».
Рекомендуемая шкала оценки текста:
«3» — от 50% до 70% правильных ответов
«4» — от 71% до 90%
«5» — от 91% до 100%
ЗАКЛЮЧЕНИЕ
Рассмотрим достоинства и недостатки тестовой
проверки знаний.
Достоинства
От традиционных оценок
контроля знаний обучающихся тесты отличаются объективностью измерения
результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателя,
а на объективные эмпирические критерии; быстротой получения результата, установления
связи с обучающимся и обсуждения результатов. Тест позволяет охватить большее
число обучающихся на уроке, экономя время на контроле. Эта форма контроля дисциплинирует
обучающихся, приучая их постоянно готовиться к систематическому тестовому
контролю, а так же улучшает психологическую атмосферу учебного процесса, преподаватель
перестаёт быть источником отрицательных эмоций при оценивании знаний.
Недостатки
Одним из недостатков тестовой формы
является возможность угадывания в заданиях закрытого типа. Если тестовое
задание содержит всего два варианта ответа, то половину ответов на такое
тестовое задание можно угадать. Так же существует возможность списать ответы на
тесты закрытого типа. Преподаватель не видит хода решения (хода мыслительной
деятельности обучающегося), если результаты своей работы обучающийся
представляет только в виде номера ответа, гарантии наличия знаний у обучающегося
нет. В тестах трудно выявить степень овладения умениями проводить наблюдения,
опыты, определять объекты, не развивается речь обучающегося.
На основании сказанного, можно
сделать вывод о преимуществе тестовой проверки знаний по сравнению с
традиционными формами контроля. Тестовые задания удобно использовать при организации
самоконтроля, при повторении учебного материала, при подготовке к уроку. Тесты
с успехом можно использовать наряду с другими формами контроля. Главное
достоинство тестовой проверки – в ее скорости, а традиционной проверки – в её
основательности.
Требования к составлению тестов
При составлении тестовых заданий следует учитывать следующие правила:
1.Содержание заданий должно отвечать программным требованиям и отражать содержание обучения.
2.Формулирование вопроса начинать с подбора правильного ответа, чтобы избежать двух часто встречающихся проблем: наличие более одного правильного ответа, наличие только неправильных ответов. Основное требование – тестовое задание должно иметь однозначный правильный ответ.
3. Вопрос должен содержать одну законченную мысль (тестовое задание должно проверять один элемент знания). Если это не так, то становится неясным, с каким элементом знаний ученик не справляется, в чём заключена причина невыполнения задания.
4.Вопрос должен быть чётко сформулирован. Особенно внимательно использовать слова “иногда”, “часто”, “всегда”, “никогда”. Они, с одной стороны, сами по себе содержат неопределённость, а с другой стороны – дают возможность учащимся догадаться о правильном ответе. Исключать по возможности слова “большой”, “небольшой”, “малый”, “много”, “мало”, “больше”, “меньше” и т. п.
5.Правильные ответы должны быть разумны, умело подобраны, не должно быть явных неточностей и подсказок.
6.Все варианты ответов должны быть грамматически согласованы с основной частью задания; следует использовать короткие, простые предложения.
7.Правильные и неправильные ответы должны быть однозначны по содержанию, структуре и общему количеству слов. Применять правдоподобные ошибочные варианты, взятые из опыта.
8.Место правильного ответа должно быть определено таким образом, чтобы оно не повторялось от вопроса к вопросу, не было закономерностей, а давалось в случайном порядке.
9.Лучше использовать длинный вопрос и короткий ответ. В противоположном случае на прочтение ответов уходит больше времени и тратится больше сил на анализ высказывания.
10.Дополнения лучше ставить в конце предложения.
Правила расположения заданий на листе.
1.Все задания должны быть на одной странице и под номерами.
2.У учеников должно быть достаточно места для записей (в заданиях открытого типа).
3.Размер шрифта должен соответствовать возрасту детей.
4.Варианты ответов располагать в один столбик.
Тестовые задания обязательно содержат систему проверки, обработки и анализа результатов. Проверка может осуществляться самими учениками в ходе урока (самопроверка, проверка в парах) или учителем после уроков. За правильно выполненное задание ученик получает определённое количество баллов. Все баллы суммируются, и по выбранной шкале ставится оценка.
Оценка “5” ставится за 95-100 % правильных ответов.
Оценка “4” ставится за 80-95 % правильных ответов.
Оценка “3” ставится за 65-80 % правильных ответов.
Оценка “2” ставится за 50-65 % правильных ответов.
Очень важно при проведении тестирования указывать время, необходимое для работы учащимся. Время является фактором, который определяет качество получаемых в процессе тестирования результатов. Увеличение времени приводит к утомлению учащихся, что в свою очередь повлияет на результаты тестирования. В начальной школе тестирование не должно занимать более 20-30 минут, в это время внимание поддерживается мотивацией. Я чаще всего использую тестовые задания для текущей проверки и включаю в них небольшое количество вопросов (5-7). Выполнение таких заданий занимает не более 7 минут. Снижает затраченное время и бланковая форма заданий. Учащимся выдаются заранее заготовленные бланки или индивидуальные листы с вопросами и вариантами ответов (для заданий закрытого типа). В 1-2 классах вопросы я читаю сама, что тоже приводит к уменьшению потраченного на эту работу времени. А также помогает всем детям, независимо от скорости чтения и темперамента, закончить работу в одно время.
Таким образом, неоспоримые преимущества для учителя тестовых заданий следующие:
• выявление знаний и умений каждого ученика;
• своевременное обнаружение пробелов в знаниях;
• быстрота проведения;
• простота проверки.
А для ученика следующие:
• этот вид работы не утомляет детей;
• не нужно формулировать ответ и думать, как его грамматически правильно написать;
• обладает самопроверкой.
Оценивает способность к
формированию понятий, классификации,
упорядочиванию, абстрагированию,
сравнению. Испытуемый должен установить
и охарактеризовать общность между
парой понятий. Оценка варьирует от 0 до
2 баллов, в зависимости от достигнутого
уровня обобщения: конкретного,
функционального, концептуального.
Напр., при установлении общего в паре
понятий «платье — пальто» могут быть
даны ответы:
— сделаны из одинакового
материала, имеют пуговицы (0 баллов);
— их носят, они дают тепло
(1 балл);
— верхняя одежда (2 балла).
В субтесте предлагается 13
пар понятий.
5. Субтест
повторения цифровых рядов. Направлен
на исследование оперативной памяти
и внимания, состоит из двух частей:
запоминания и повторения чисел в прямом
и обратном порядке. Задания аналогичны
соответствующему субтесту шкалы памяти
(см. Векслера памяти
шкала).
6. Словарный
субтест. Направлен
на изучение вербального опыта (понимания
и умения определить содержание слов).
Предлагается объяснить значение ряда
слов. Всего в задании 42 слова: первые
10— весьма распространенные, повседневного
употребления; следующие 20 — средней
сложности; третью группу составляют
12 слов высокой степени сложности. Оценка
— от 0 до 2 баллов. Примеры:
I
группа II
группа III
группа
Яблоко .Приговор Война
Стол Микроскоп Балласт
Деталь Храм
Идиосинкразия
Шкала невербальная 7. Субтест
шифровки цифр. Изучает
степень усвоения зрительно-двигательных
навыков. Задача состоит в том, чтобы
написать под каждой цифрой в клеточке
соответствующий ей символ (рис. 11). Время
выполнения лимитировано. Оценка
соответствует количеству правильно
зашифрованных цифр.
НАБОР СИМВОЛОВ
Рис. II.
Субтест «шифровки цифр»
Рис. 12. Образцы заданий
субтеста «недостающие детали*
8. Субтест
нахождения недостающих деталей.
Изучает особенности
зрительного восприятия, наблюдательность,
способность отличить существенные
детали.
Испытуемому предъявляют
21 изображение, в каждом из которых
необходимо отыскать какую-либо недостающую
деталь или какое-то несоответствие
(рис. 12). Правильный ответ оценивается
одним баллом (лимит времени — 20 с).
9. Субтест
кубиков Коса. Направлен
на изучение сенсомоторной координации,
способности синтеза целого из
Рис. 13. Субтест «кубики Коса»
WAIS
(1-10, под № 11 — развертка
куба)
частей. Испытуемому предлагают
последовательно воспроизвести десять
образцов рисунков из разноцветных
деревянных кубиков (рис. 13). Время
ограничивается по каждому заданию.
Оценка зависит как от точности, так и
от времени исполнения. См. также Коса
кубики.
10. Субтест последовательности
картинок. Исследует
способность к организации фрагментов
в логическое целое, к пониманию ситуации
и предвосхищению событий. В задании
предлагается восемь серий картинок.
В каждой серии картинки объединены
сюжетом, в соответствии с которым
испытуемый должен расположить их в
определенной последовательности.
Оценка зависит от правильности и
времени решения.
11. Субтест составления
фигур. Направленность
субтеста аналогична субтесту 9.
Испытуемому предлагают в определенной
последовательности детали четырех
фигур («человек», «профиль», «рука»,
«слон*) без указания на то, что из этих
деталей должно быть составлено. В оценке
учитывается время и правильность
решения.
Рис. 14. Субтест «лабиринты»
WISC—R
В 1949 г. была предложена
Векслера мтеллекта шкала для детей
(Wechsler
In-eiligence
Scale
for
Children,
WISC;
после-,няя редакция,
WISC—R,
опубликована в 974 г.),
предназначенная для обследова-ия детей
в возрасте от 5 лет до 15 лет 1 мес (для
WISC—R
стандартизация существлялась
в возрастном диапазоне т 6,5 до 16,5 года).
В отличие от шкалы WAIS,
в тесте VISC—R
имеется 12-й субтест,
альтерна-ивный субтесту шифровки цифр.
Этот убтест включает девять лабиринтов
эис. 14), время «выхода» из которых
ли-итировано. Задания вербальных и
прак-ических субтестов предъявляются
в дет-ком варианте шкалы в чередующемся
по-ядке. Субтест «лабиринты», проведение
оторого требует больше времени, по ус-
мотрению экспериментатора
может быть заменен на «шифровку». Любая
другая замена, в том числе замена
«лабиринтов» на какой-либо другой
субтест, так же как и замена «запоминанием
цифр» (второй альтернативный субтест,
используемый только в WISC—R)
любого из вербальных
субтестов, производится только в
случае, если один из основных субтестов
приходится пропускать из-за
непредвиденных препятствий. Дополнительные
субтесты батареи WISC—R
(«запоминание цифр»
и «лабиринты*) могут быть проведены
вместе с основной группой заданий,
но, в этих случаях их показатели не
учитываются при определении значений
IQ.
В 1963 г. была опубликована
Векслера интеллекта шкала для
дошкольников и младших школьников
(Wechsler
Preschool
and
Primary
Scale
of
Intelligence,
WPPSI),
предназначенная для
детей в возрасте от 4 до 6,5 года.
Она включает 11 субтестов,
из которых 10 засчитываются при
определении IQ.
Восемь субтестов
представляют собой облегченные и
адаптированные варианты заданий WISC,
остальные три
разработаны специально для данной
шкалы. Субтесты также сгруппированы
в вербальную шкалу и шкалу действия;
предъявление субтестов той и другой
группы чередуется. Состав субтестов
шкалы WPPSI
следующий:
Субтесты
Субтесты
вербальные
практические
1, Осведомленность
2. Дом животного
3. Словарный запас 4.
Завершение
картинок
5. Арифметика 6.
Лабиринты
7. Нахождение 8″.
Геометрические
сходства схемы
9. Понимание
10. Кубики Коса
х
11. Предложения (альтернативный)
«Предложения* — тест на
запоминание, заменивший субтест
повторения цифровых рядов из WISC.
От ребенка требуется
вслед за экспериментатором повторять
произносимое предложение. Этот субтест
можно использовать вместо любого
субтеста из .вербальной шкалы или
предъявить как дополнительный для
получения более точной диагностической
информации. Субтест «Дом животного»
сходен с субтестами шифровки цифр. В
этой группе заданий ребенку предъявляется
карта с изображением собаки, цыпленка,
рыбы и кошки. В верхней части карты
размещаются картинки-ключи со
вставленными в них различного
цвета цилиндриками (дом животного).
От ребенка требуется расставить домики
по соответствующим изображениям
животных. Оценка зависит от времени
выполнения и количества ошибок. В тесте
«геометрические схемы» требуется с
помощью цветного карандаша скопировать
10 простых чертежей.
Для рассмотренных трех
вариантов В, и. и. ш. существуют сокращенные
формы, включающие 4-6 субтестов,
коэффициенты корреляции которых с
основными вариантами составляют 0,8-0,9.
Среди них можно указать на Краткий
Векслера
Рис. 15. Образец «профиля
интеллекта» по WAIS
интеллекта тест (Reduzierter
Wechsler
Intelligenztest,
WIP)
— сокращенный вариант
гамбургской редакции основного теста
[HAWIK),
состоит из четырех
субтестов. Разработаны нормы для
пациентов психиатрических клиник
(в возрасте от 15 до 60 лет) и здоровых лиц
(от 10 до 79 лет). Тест стандартизирован
на материале обследования 947 больных
и 124 здоровых испытуемых. Показатели
корреляции с основной формой теста
(НА WIK)
составляют по отдельным
субтестам от 0,89 до 0,97. Коэффициенты
надежности (по методу Кьюдера—Ричардсона),
определенные на основании данных
обследования 305 больных и 197 здоровых
лиц, варьируют от 0,53 до 0,89. Показатели
внутренней согласованности заданий
теста для психиатрических пациентов
оказываются существенно выше, чем
для здоровых. Имеются сведения о
конвергентной и дискриминантной
валидности (см. Валидность
конструктная). Так,
показатели корреляции WIP
с Амтхауэра
интеллекта структуры тестом достигают
0,83; Векслера памяти
шкалой — 0,38 (от 0,23 до
0,46 по отдельным субтестам), Бентона
визуальной ретенции тестом —
0,35 (0,22—0,60). Имеется англоязычный вариант
WJP(K.
Мак-Нью-мар, 1950).
Эти формы находят использование
лишь в исследованиях, направленных на
приблизительный отбор испытуемых (см.
Отсеивание). Одним
из важных достоинств В. и. и. ш. является
возможность качественного анализа и
интерпретации характера выполнения
испытуемым заданий субтестов. При
использовании сокращенной программы
обследования качественные наблюдения
невозможны.
Традиционно психометрическая
часть обработки результатов обследования
с помощью рассматриваемых шкал
предусматривает подсчет оценок
первичных по каждому
из применявшихся вербальных и
практических субтестов.
Согласно таблицам переходов «сырых»
показателей в оценки
шкальные, могут быть
получены стандартные оценки результатов
выполнения каждого отдельного
субтеста. Эти данные могут быть
представлены в виде профиля (рис. 15).
Оценки отдельных субтестов рассчитаны
по шкале с характеристиками: М
= 10, s
= 3. По суммам «сырых» оценок (отдельно
вербальной и невербальной частей теста)
с помощью специальных таблиц определяются
шкальные оценки /Q-вербального,
/Q-не-вербального
и общего /(^-показателя. Оценки по этим
трем показателям выражены в единицах
IQ-показателя
стандартного (М =
100, s
= 15). Интерпретация /(^-показателей по
Векслеру проводится в соответствии
со схемой, приведенной в табл. 1.
Таблица I
Классификация /^-показателей
по Векслеру
Выявление, о/ |
||
/Q-показа- |
Уровень |
/о |
тель |
ного |
1,7 |
от |
||
до |
||
130 |
Весьма |
2,2 |
120-129 |
Высокий |
6.7 |
110-119 |
«Хорошая» |
16,1 |
90-109 |
Средний |
50,0 |
80-89 |
Сниженная |
16,1 |
70-79 |
Пограничный |
67 |
69 |
Умственный |
2,2 |
Количественная интерпретация
результатов исследований с помощью
В. и. и. ш. включает некоторые специальные
приемы. Так, при анализе показателей
WAIS
может быть определен
индекс возрастного снижения некоторых
интеллектуальных функций. Опираясь
на экспериментальные данные, Д.
Векслер разделяет субтесты на
основные, результа-ты которых мало
изменяются с возрас-
Таблица 2 Функции
интеллекта, определяемые субтестами
шкал Векслера
Субтест |
Изучаемая |
Фактор, |
Осведомленность |
Сохранение |
Культурная |
Понимание |
Абстрактное |
Возможность |
Арифметический |
Сохранение |
Возможность |
Установление |
Анализ |
Возможность |
Словарный |
Языковое |
Возможность |
Цифровые |
Немедленное |
Объем |
Последовательные |
Зрительное |
Возможность |
Недостающие |
Зрительное |
Опыт |
Составление |
Зрительное |
Степень |
Кубики |
Восприятие |
Степень |
Шифровка |
Немедленное |
Степень |
том испытуемых (словарный,
осведомленность, составление фигур,
обнаружение недостающих деталей), и
те, которые чаще обнаруживают с возрастом
ухудшение результатов относительно
стандартов (воспроизведение цифр,
обнаружение сходства, шифровка,
кубики Коса). Сравнением показателей в
этих условно выделяемых группах субтестов
определяется коэффициент детериорации,
или ущерба (DQ):
где ТНР — шкальные показатели
по субтестам с практически неизменными
ре-
зультатами; ТПР — показатели
результатов с переменными результатами.
Наибольший интерес
представляет качественная интерпретация
структуры уровня развития определенных
функций интеллекта, а также оценка
комплексных интеллектуально-личностных
особенностей испытуемого.
При конструировании шкал
Д. Векс-лер исходил из стремления отразить
в заданиях теста не только
интеллектуальные, но и прочие факторы,
от которых зависит эффективность
проявления интеллекта. Характеристика
функциональной направленности
отдельных групп заданий В. и. и. ш. и
факторов, влияющих
Таблица 3
Коэффициенты надежности
показателей IQ
в шкалах Векслера
Варианты |
/Q-показа-тель |
Коэффициент |
Способ |
WA/S |
0,96 0,93-0,94 |
Расщепление |
|
WISC—R |
0,94-0,93 |
Ретестирование |
|
WPPS1 |
Вербальный |
0,87-0,90 |
Ретестирование |
на результаты отдельных
субтестов, приведены в табл. 2.
Разработка В. и. и. ш. опиралась
на тщательную стандартизацию. Нормативная
выборка для WAIS
состояла из 1700
испытуемых с равным количеством мужчин
и женщин. Испытуемые в возрасте 16-64 лет
были распределены по семи возрастным
уровням. Предпринимались разные меры
по обеспечению репрезентативности
выборки. Для пожилых
людей были установлены дополнительные
нормы путем тестирования выборки лиц
пожилого возраста из 470 человек.
Стандартизация шкальных показателей
отдельных субтестов осуществлялась на
группе из 500 испытуемых (возраст от 20 до
34 лет), входивших в выборку стандартизации.
Выборка стандартизации WISC—R
состояла из 100 мальчиков
и 100 девочек
в каждом возрастном годовой интервале
от 6,5 до 16,5 года (общее количество
испытуемых 2200). Аналогично процедуре
стандартизации WAIS
для обеспечения
максимальной репрезентативности
выборка была стратифицирована на
основе данных переписи на-
селения. Шкала WPPSI
была стандартизирована
на аналогичной выборке из 1200 детей (по
100 мальчиков и 100 девочек в каждой
полугодовой возрастной группе в диапазоне
от 4 до 6,5 года).
В ходе широкого и длительного
применения В. и. и. ш. в психодиагностике
накоплено немало сведений о надежности
и валидности этих методик. Показатели
надежности вербальных и практических
шкал, а также теста в целом приведены в
табл. 3.
Коэффициенты валидности
текущей WAIS
(по связи с критериями
академической успеваемости и оценками
профессиональной деятельности)
составили 0,3 для невербальных субтестов
и 0,4-0,5 для вербальных. Для WISC
показатели валидности
критериальной по
связи с результатами тестов достижений
и учебными критериями интеллекта
находятся в пределах 0,5-0,6. При этом
показатели вербальной шкалы более тесно
коррелируют с критерием, чем показатели
невербальной шкалы.
В. и. и. ш. отличаются высокой
корреляцией с результатами других
достаточно известных тестов интеллекта.
Коэффициент корреляции с показателями
Стан-форд— Бане
умственного развития шкалы для
WAIS
составляет около 0,8.
Характерна более тесная связь с
результатами вербальной шкалы, чем
с невербальным /Q-показателем.
Так, для шкалы WISC
коэффициенты корреляции
с данными Станфорд—Бине теста
составляют 0,76 по вербальной шкале и
0,56 — по невербальной. Коэффициенты
корреляции показателей IQ
WPPSI
и теста Стан-форд—Бине
равны 0,82, 0,81, и 0,67 для полной, вербальной
и невербальной шкалы соответственно.
Данные о валидности
конструктной существенно
дополняются факторным
анализом результатов
теста. Согласно его результатам, В. и.
и. ш. насыщены
фактором общего интеллекта
{фактор G),
определяющим около
50% суммарной дисперсии батареи. Кроме
того, выявлены три групповых фактора:
фактор вербального понимания (субтесты
«словарный», «осведомленности»,
«понимание*, «нахождение сходст-ва»);
фактор перцептивной организации
(субтесты «Кубики Коса», «составление
фигур»), выраженный сочетанием факторов
скорости восприятия и пространственных
представлений; фактор памяти («арифметика»,
«повторение цифровых рядов»).
Для правильной интерпретации
количественных показателей, особенно
в случае сравнительных психодиагностических
исследований, имеют значение сведения
об ошибке измерения, отражающей точность
индивидуального результата (табл. 4).
•
Таблица 4
Величины стандартной
ошибки
измерения (от)
/Q-показателей
в шкале Векслера
Вариант |
/Q-показатель |
Значение |
wise WA1S |
Вербальный Практический Вербальный |
3,00-5,19 4,74-5,61 3,36- 4,25 3,0 4,0 2,6 |
В отечественных исследованиях
В. и. и. ш. нашли достаточно широкое
распространение. WAIS,
впервые адаптированная
в Ленинградском психоневрологическом
научно-исследовательском институте
им. В. М. Бехтерева, успешно использовалась
в комплексном лонги-тюдном изучении
развития интеллекта (Б. Г. Ананьев, 1969 и
др.). Тест применялся в дифференциальной
диагностике умственной отсталости и
задержки психического развития детей
(А. Ю. Панасюк, 1976), а также судебно-психологической
экспертизе подростков (Л.
А. Калинина, 1980). С помощью WAIS
были получены данные,
углубляющие представления об особенностях
интеллекта при некоторых психических
заболеваниях (И. Н. Гилья-шева, 1983 и др.).
WISC
была адаптирована
и стандартизирована на отечественной
выборке (А. Ю. Панасюк, 1973).
Сведений об использовании
в СНГ варианта WPPSI
не имеется.
ВЕКСЛЕРА ПАМЯТИ
ШКАЛА
(Wechsler
Memory
Scale,
WMS)
— методика
психометрической оценки памяти. Тестовая
батарея, включающая серии заданий
для исследования отдельных мнес-тических
функций. Разработана Д. Векс-лером в
1946 г.
Задания методики объединяются
в 7 субтестов: *
I
субтест —
ориентировка и
осведомленность. Выполнение
заданий предусматривает ответы
испытуемого на наиболее общие вопросы,
касающиеся личных и общественных данных
(6 вопросов, правильный ответ — 1
балл).
II
субтест —
ориентировка во
времени и пространстве (5
вопросов, правильный ответ — 1 балл).
Первые два субтеста методики
предъявляются в случае подозрения
на наличие умственного недоразвития,
глубоких дефектов памяти, нарушение
ориентировки, а также в случае явной
неудачи испытуемого при выполнении
субтестов.
III
субтест —
психический контроль.
Включает три задания:
отсчитыва-ние от 20 в обратном порядке,
называние букв алфавита, отсчитывание
от 1 до 40 через 3 единицы. Время выполнения
лимитировано. За быстрое выполнение
добавляются дополнительные баллы.
IV
субтест — логическая
память. Задание состоит
в воспроизведении коротких рассказов,
отпечатанных на карточках. Оценка
выполнения производится
по числу воспроизведенных
смысловых единиц рассказа.
V
субтест —
воспроизведение рядов
цифр в прямом и обратном порядке.
Оценка соответствует
наибольшему числу элементов цифрового
ряда, воспроизведенных испытуемым в
двух попытках (отдельно для
воспроизведения в прямом и обратном
порядке).
VI
субтест —
воспроизведение
геометрических фигур (рис.
1 б). Испытуемому демонстрируется
последовательно 4 карточки с простыми
геометрическими изображениями.
Экспозиция — 10 с. Оценка успешности
выполнения дифференцирована — в
зависимости от числа воспроизведенных
элементов фигур.
Рис. 16. Субтест «воспроизведение
геометрических фигур» Векслера
памяти шкалы (фигуры Бине) (а, б, ер
в2
— обозначения порядка
предъявления заданий)
VII
субтест — воспроизведение
парных ассоциаций. Обследуемому
зачитывают 10 пар слов, близких или
отдаленных по степени ассоциативной
связи. Первые 6 пар — «легкие ассоциации»,
следующие 4 пары — «трудные ассоциации».
При первом прочтении они расположены
вперемешку. Затем трижды, каждый раз
в другом порядке, экспериментатор
зачитывает первое слово каждой пары
и проверяет запомнившиеся
ассоциации.
Пауза между сериями — 10 с.
Ответ, данный в течение 5 с, засчитывается
как правильный.
Результат теста получают
при сложении половины суммы удавшихся
«легких ассоциаций» с суммой «трудных
ассоциаций». Первичные результаты
по всем субтестам суммируют и, испЯльзуя
специальную таблицу, к «сырым» баллам
прибавляют возрастную поправку,
рассчитанную для возрастных групп
в диапазоне от 15 до 79 лет. Корригированный
по возрасту первичный результат может
быть переведен в оценки, соответствующие
баллам IQ-показателя
стандартного. Имеется
возможность пересчета «сырых» оценок
по отдельным субтестам в оценки
шкальные. Таким
образом, тест допускает профильную
оценку данных с учетом состояния
отдельных мнестичес-ких функций (Д.
Векслер, 1945).
Достоинством В. п. ш. является
возможность количественного измерения
кратковременной и долговременной
памяти, словесно-логической, визуальной
и ассоциативной репродукции. Наряду с
измерением многих показателей в этой
компактной и удобной для проведения
ме-, тодике предусмотрен охват широкого
возрастного диапазона испытуемых.
В нашей стране В. п. ш. получила
наибольшее распространение в
клинической психодиагностике.
ВНУТРЕННЯЯ СОГЛАСОВАННОСТЬ
(консистенция, консистентность)—
характеристика теста, указывающая
на степень однородности состава
заданий с т. з. измеряемого качества.
Критерий В. с. является
существенным элементом валидности
конструкт-ной теста,
характеризуя, в какой мере задания
направлены на измерения данного
психологического явления, а также меру
вклада каждого пункта (задания) в коли-
чественную оценку всей
методики. Максимальная валидность
теста достигается за
счет отбора таких заданий, которые,
обладая значительной корреляцией с
результатом теста, в то же время
минимально коррелируют между собой
(при неоправданно высокой корреляции
отдельных заданий тест будет перегружен
лишними практически однозначными
заданиями). Отбор заданий по критерию
В. с. обеспечивает наибольшую прагматическую
эффективность теста, допуская объединение
в методике пунктов, максимально
связанных с изучаемым показателем.
На практике В. с. определяется
корреляцией между результатами
каждого отдельного задания и теста в
целом. Для этого используется метод
корреляции би-сериальной
между исходами каждого
задания («справился—не справился»,*ответ
на пункт опросника в виде утверждения
или отрицания и т. д.) с суммарной оцен-*
кой всех пунктов теста. Более сложной
процедурой определения В.с. является
анализ частных корреляций между общим
результатом и отдельными заданиями,
предусматривающий построение уравнения
множественной регрессии (см. Регрессионный
анализ, Факторный анализ). В
таком уравнении каждый пункт получает
весовой коэффициент, количественно
выражающий его вклад в общий результат,
несводимый к вкладу других пунктов.
Достоинство метода в том, что весовой
коэффициент впоследствии может
использоваться как «ключ» для данного
пункта. Это существенно повышает
достоверность результатов, особенно
при использовании опросников
личностных. При такой
дифференцированной оценке каждый ответ
получает не +1 или 0 баллов, а вносит
конкретный вклад в сумму тестовых
оценок.
При анализе В. с. иногда
применяется метод контрастных групп,
сформированных из испытуемых,
показавших самые
высокие и самые низкие
суммарные результаты. Выполнение
каждого пункта группой лиц с высокими
результатами по тесту в целом сравнивается
с его выполнением группой с низкими
результатами, и те задания, с которыми
первая справляется незначительно
лучше, чем вторая, признаются невалидными
и либо отбрасываются, либо
пересматриваются.
Критерий В. с. имеет также
отношение к корреляционной связи
между результатами отдельных субтестов
комплексной тестовой методики и их
интегра-тивным результатом. Многие
тесты интеллекта,
напр., состоят из
раздельно применяемых субтестов (таких,
как словарный, арифметический, общей
осведомленности и др.). При построении
таких методик определяется степень
связи субтестов с общим показателем,
и плохо коррелирующие с тестом
субтесты отбрасываются. Коэффициенты
корреляции оставшихся субтестов
свидетельствуют о В. с. тестовой батареи,
мере вклада отдельных компонентов в
обобщенный показатель.
Анализ В. с. элементов
методики служит не только практическим
целям повышения однородности заданий
теста, но может в значительной мере
способствовать углублению представлений
о содержательно-теоретическом статусе
измеряемого конструкта. На основании
содержательного анализа пунктов,
отобранных по этому критерию (напр.,
отдельных субтестов методики исследования
общих способностей), появляется
возможность уточнить понимание
измеряемого комплексного свойства,
в данном случае — область свойств
интеллекта, измеряемых данным тестом
(см. Валидность
конст-руктная).
Процедура определения
критерия В. с. близка характеристике
дискриминативно-сти заданий теста,
однако эти показатели различаются по
своей направленности. Если критерий
В. с. ориентирован на
оценку теста в целом,
своеобразную «внутреннюю» валидность
заданий с т. з. отражения измеряемого
свойства, то индексы дискриминативности
отражают диагностическую силу
(удельный вес в общем результате
теста) лишь отдельных пунктов. Таким
образом, определение дискриминативности
отдельных заданий является подготовительной
процедурой для анализа В. с. целого
теста.
«ВНУШАЕМОСТЬ» ТЕСТ —
опросник
личностный. Предложен
С. В. Клауче-ком и В. В. Деларю в 1997 г. и
предназначен для скрининга лиц,
обладающих повышенной внушаемостью
и соответственно высокой готовностью
к развитию психо-генно индуцированных
состояний (хемо-фобий, радиофобий и т.
п.).
«В», т. состоит из 20 утверждений,
отобранных из известных личностных
опросников. Напр.:
— В детстве Вас считали
упрямым ребенком.
— Когда при Вас кто-нибудь
зевает, Вам тоже нередко хочется зевнуть.
— Вы умеете настоять на
своем и часто этим пользуетесь.
На первом этапе разработки
опросника для подтверждения
дискриминативности 10 экспертов
провели экспертную оценку каждого
утверждения; затем был рассчитан
показатель согласованности экспертов.
На втором этапе была осуществлена
серия исследований, направленных на
проверку валидности
и надежности
утверждений (результаты
ответов сопоставлялись с данными 5
традиционных проб на внушаемость,
адресованных зрительному,
тактильно-кинестетическому и
обонятельному анализаторам,
ассоциативному мышлению). При этом было
обследовано 110 практически здоровых
лиц.
На основе обследования 2092
взрослых людей трудоспособного
возраста (бо-
лее подробные данные о
выборке не сообщаются) получены
ориентировочные значения популяционной
нормы для мужчин и женщин.
Авторы сообщают о достаточно
высокой валидности и надежности
методики при обследовании людей в
естественных условиях жизнедеятельности,
рекомендуют ее для оценки уровня
внушаемости как отдельных индивидов,
так и групп населения.
ВОПРОСОВ
(УТВЕРЖДЕНИЙ)
ФОРМА —
целостная характеристика задания,
указывающая на особенности формирования
структуры «вопрос—ответ* в опросниках.
Термин, используемый
как при конструировании методик, так и
при их описании. В англо-американской
литературе наиболее близким его
эквивалентом является термин
«построение задания» (item
format).
Наиболее распространенными
являются следующие формы:
1. Вопросы, предусматривающие
ответы «да» или «нет». Такие вопросы
легко формулируются, обычно понятны и
не затрудняют обследуемых. Наиболее
часто используются при конструировании
методик. Напр., «Вы ходите медленно
и нето- * ропливо?»
2. Вопросы, предусматривающие
ответы «да», «нечто среднее», «нет».
Добавляется неопределенный ответ.
Как правило, неопределенные ответы
неинформативны, а опросники,
предусматривающие такую форму, не
защищены от искажений (см. Установка
на ответ). Использование
такой формы вопросов обычно обусловлено
тем, что у некоторых обследуемых
возникает раздражение, бывают отказы
от работы в том случае, когда их принуждают
отвечать только утвердительно или
отрицательно. Напр., «Я всегда в состоянии
строго контролировать проявления
своих чувств».
3. Вопросы, предусматривающие
ответы «правда» или «ложь», или т. н.
альтернативные задания. Мало отличаются
от дихотомических (1). Напр., «Терпеть не
могу втискиваться в переполненный
автобус».
4. Вопросы, предусматривающие
ответы «нравится», «не нравится».
Точнее, в таких случаях речь идет как о
фразах, так и об отдельных словах,
которые, строго говоря, вопросом или
утверждением не являются. Крайне редко
используемая форма. Напр., «1) фонарщики,
2) воротники из бобрового меха, 3)
бас-барабан».
5. Вопросы, предусматривающие
ответы по рейтинговым шкалам. В таких
случаях к вопросам (утверждениям)
прилагаются различным образом
градуированные шкалы с крайними
значениями, напр.: «всегда»—«никогда».
Основные проблемы, возникающие при
использовании такой формы, связаны
с разным пони^ манием обследуемыми
терминов, указывающих на частоту.
Возможно появление установки на «крайние»
ответы. Напр.: «В окружении подчиненных
я стараюсь показать свое превосходство:
а) всегда, б) очень часто, в) от случая к
случаю, г) редко, д) очень редко, е)
никогда».
6. Вопросы, предусматривающие
ответы, являющиеся вариантами
«да», «затрудняюсь ответить», «нет».
Это могут быть такие ответы, как
«обычно»— «иногда»—«никогда»,
«согласен»—«не уверен»—«не согласен»
и т. п. Подбор того или иного варианта
обусловливается смысловыми
особенностями вопроса (утверждения).
Напр.: «Бывают периоды, когда мне
трудно удержаться от жалости к самому
себе: «часто», «иногда», «никогда».
7. Вопросы, предусматривающие
ответы на основе выбора из нескольких
предложенных развернутых высказываний.
Обычно это завершающие предложение
фразы, одну из которых и необходимо
выбрать. Используются два,
три и более варианта выбора. Напр.: «Когда
мне нечего делать, я могу…: а) позвонить
другу (подруге), чтобы поболтать; б)
заняться разгадыванием кроссвордов
или чтением; в) пойти на джазовый концерт.
Особенности формирования
структуры «вопрос—ответ» оказывают
влияние на валидность
и надежность
опросников.
«ВРЕМЕНИ РАСПРЕДЕЛЕНИЯ»
МЕТОДИКА — методика
исследования мотивационной сферы
личности, ее устремлений и интересов.
Опубликована С. Я. Рубинштейн а 1979 г.
Обследуемому предлагают
пронумерованный список различных
дел и просят приблизительно указать,
сколько часов он затрачивает на эти
дела в течение 20 дней (480 ч). Так,*если
испытуемый спит около 8 ч в сутки, то
в графе «сон» отмечает — 160 ч. После
того как это задание выполнено,
обследуемому представляется
возможность «располагать временем по
собственному желанию», т. е. он должен
отметить, сколько времени потратит на
те же самые дела в том случае, если будет
им свободно распоряжаться. Пере-чень
занятий состоит из следующих 17 пунктов:
1. Сон.
2. Длительность рабочего
дня.
3. Транспорт.
4. Еда (кроме ее приготовления).
5. Забота о внешности.
6. Покупки и поиски нужных
предметов
в магазинах.
7. Самообслуживание
(приготовление пищи, уборка и т. п.).
8. Забота о детях и других
родственниках.
9. Общение с близкими и
друзьями.
10. Обучение.
11. Чтение художественной
литературы,
газет и т. д.
12. Посещение театров, кино,
выставок и т.д.
13. Прослушивание радио и
телепередач.
14. Прогулки.
15. Занятие физкультурой
или спортом.
16. Игры.
17. Полный отдых (отсутствие
всякой деятельности).
Обработка полученных
результатов сводится к сопоставлению
фактического и желаемого распределения
времени, что наиболее удобно изобразить
графически. Теоретической основой «В.
р.» м. является положение Л. Сэва
(1972) о том, что отношение человека к
использованию своего времени является
важнейшим показателем его жизненных
установок, стремлений, осознаваемых и
неосознаваемых.
Данные об использовании
«В. р.» м. носят предварительный характер.
Валив-ность и
надежность методики
не изучались, стандартизация
не проводилась. Автор
отмечает, что обследование психически
больных не выявило диагностического
значения методики. Тем не менее следует
признать перспективность дальнейшей
разработки «В. р.» м. как психодиагностического
инструмента.
ВЫБОРКИ ОБЪЕМ —число
элементов, включенных в совокупность
выборочную. В. о.
определяется: а) задачами исследования;
б) степенью однородности совокупности
генеральной, которую
данная выборка репрезентирует; в)
величиной доверительной вероятности
(Р), при которой гарантируется достоверность
результата исследований; д) требуемой
точностью результатов, т. е. величиной
допускаемой ошибки репрезентативности.
При выборке В. о. учитывается совокупность
технических приемов, применяемых
для ее качественного и статистического
анализа. В. о. определяется с помощью
статистических таблиц больших чи-
сел, по номограммам достаточно
больших чисел, а также с помощью
специальных расчетов.
В тех случаях, когда
отсутствует информация о средних
показателях и дисперсии в выборочной
и генеральной совокупностях, прибегают
к таблицам достаточно больших чисел.
В. о. зависит от вероятности (Р)
заключения о
достоверности выводов, от величины
предельной ошибки репрезентативности
(D),
а также от вероятности появлений события
(р). Практически
достаточная величина Р не превышает
95% (0,95). Допускаемая ошибка
репрезентативности, т. е. погрешность
производимых наблюдений, вычисляемая
как доля от выборочной средней X,
задается в пределах
от 0,01 до 0,05. Чем выше величина доверительной
вероятности Р и
чем меньше допускаемая ошибка
репрезентативности, тем большим
должно быть число наблюдений (я). Если
средние показатели и дисперсия для
выборочной и генеральной совокупностей
известны, для определения В. о. можно
воспользоваться специальным расчетом.
При этом вначале определяется желательный
уровень точности измерения, выражаемый
в долях измеряемой величины или
процентах доверительной вё1
роятности, напр.: х
± 0,01х или Р
± 5%. Для непрерывно
изменяющейся нормально распределенной
величины объем выборки (я) будет
определяться по формуле
где N—объем
генеральной совокупности, t
— значение абсциссы
для кривой нормального распределения,
определяемое желаемой точностью
оценки или выбора (для Я = 0,95 / = 1,96,
для
Р = 0,99
/ ~ 2,58), Л — уровень
точности в долях от х
выборки, а
— стандартное
отклонениех.
В качестве примера определим
величину выборки для генеральной
совокупности 5000 человек: х=,
заданная ошибка не
превышает 5% от среднего значения,
вероятность попадания значений переменной
за пределы доверительного интервала х
± t$>
не более 5% (Р = 0,95),
стандартное отклонение s
— 2;
Как видно из расчетной
формулы В. о., при заданной предельной
ошибке с возрастанием дисперсии
признака и надежности заключения,
выражаемой вероятностью Р, число
наблюдений в выборке увеличивается.
ВЫБОРОЧНАЯ СОВОКУПНОСТЬ
ЗАДАНИЙ ТЕСТА —
совокупность тестовых задач, являющаяся
частью гипотетической генеральной
совокупности заданий теста. Каждый
конкретный тест теоретически
представляет собой некую В. с. з. т.,
однако на практике отдельные части
теста могут представлять выборки заданий
из различных генеральных совокупностей,
а также одни и те же задания В. с. з. т.
могут принадлежать нескольким генеральным
совокупностям.
В. с. з. т. должна по возможности
в наибольшей степени представлять
генеральную совокупность заданий,
связанных с тестируемым качеством.
Адекватная репрезентация лежит в
основе надежности
(см. Надежность
по внутренней согласованности,
Надежность факторно-дисперсионная) и
валиднос-ти теста.
Связь В. с. з. т. с определенной
генеральной совокупностью
задании определяет внутреннюю
согласованность теста.
ВЫГОТСКОГО—САХАРОВА ТЕСТ
—
методика, предназначенная
для исследования мышления, способности
формирования понятий. Предложена Л.
С. Выготским и Л. С. Сахаровым в 1927 г.
Материал методики представляет
собой набор объемных фигур (рис. 17),
от-
Рис. 17. Набор фигур
Выготского—Сахарова теста
личающихся друг от друга
формой, цветом и величиной. На нижней
поверхности объектов нанесены
условные обозначения в виде
бессмысленных, искусственных слов
(«биг», «цев», «гур», «лаг»). Испытуемому
демонстрируют одну из фигур, объясняют,
что надпись совершенно условна,
однако имеющимся в наборе фигурам с
такой же надписью присущи определенные
признаки. Задача испытуемого —
обобщить признаки по группам. Перед
началом выполнения заданий экспериментатор
просит составить предполагаемый
план выполнения, в ходе работы указывает
на ошибки, фиксирует количество
попыток решения.
В.—С. т. представляет собой
разновидность методики двойной
стимуляции и является видоизменением
известной методики искусственных
слов, предложен-
Рис. 18. Набор фигур
Выготского—Сахарова
теста (модификация А. Ф.
Говорковой) (задания
1-16)
ной в начале века Н. Ахом
для изучения понятийного мышления. По
данным Л. С. Выготского, с помощью
предложенной им методики можно
констатировать нарушение процессов
обобщения не только при явных
расстройствах мышления, но и в тех
случаях, когда вне условий эксперимента
трудно заметить нарушения формального
мышления.
Несмотря на кажущуюся
простоту заданий и процедуры
обследования, методика сложна и
требует определенных навыков в проведении
и правильной интерпретации результатов.
Это связано с необходимостью оказания
помощи испытуемому в ходе выполнения,
оценки восприимчивости к помощи,
подсказки способа решения. Б ходе
исследования и качественного анализа
его результатов могут быть получены
данные об аффективно-личностных
особенностях испытуемого, прежде
всего связанных с реакцией на успех.
Стандартизация В.—С.
т. не проводилась, сведения о валидности
и надежности
отсутствуют. Методика
ориентирована на качественный анализ
особенностей мышления.
Определенным недостатком
В.—С. т. является то обстоятельство, что
данная методика, в силу своей сложности
для
испытуемого, применяется,
как правило, для исследования процессов
обобщения у взрослых. В целях приспособления
В.—С. т. к детскому возрасту была
разработана упрощенная модификация
методики (А. Ф. Говоркова, 1962).
Обследуемому показывают
16 вырезанных из картона фигур (рис.
18), отли-%
чающихся формой (2 вида), цветом (красные
и зеленые) и величиной (4 варианта). На
обороте фигур написаны их условные
обозначения. Одну из фигур дают
обследуемому и просят отобрать другие
фигуры из этого разряда. Каждую отобранную
фигуру испытуемый переворачивает и
убеждается в правильности или
ошибочности своего выбора. О результатах
исследования судят по количеству
«ходов», понадобившихся для формирования
искусственного понятия.
При обследовании детей с
помощью этой методики определяют
способность к целенаправленным и
последовательным действиям, умение
вести анализ одновременно в нескольких
направлениях, отбрасывать неподкрепленные
признаки, что характеризуют течение
процессов обобщения и отвлечения.
В.—С. т. достаточно широко
используется в отечественных, прежде
всего» клинико-диагностических
исследованиях (И. Н. Гильяшева, 1974 и др.).
Имеются сведения о том, что сопоставление
результатов, полученных с помощью
В.—С. т., с результатами традиционных
тестов интеллекта
расширяет диагностические
возможности последних, позволяя, в
частности, обнаружить особые,
специфичные для некоторых психически
больных формы невербального мышления.
В.—С. т. также послужил основой для
разработки некоторых вариантов
диагностического
обучающего эксперимента.
Г
ГАЛО-ЭФФЕКТ {от
греч. halos
— круг, диск) — явление, под которым в
психодиагностике понимается тенденция
исследователя, производящего оценку
(интерпретацию) и готовящего заключение,
поддаваться чрезмерному
влиянию какого-либо одного свойства
(особенности) личности, вызывающего у
него благоприятное или неблагоприятное
отношение к обследуемому и оказывающего
воздействие на суждения обо всех
других его особенностях. Определение
свойств личности через конкретные
формы поведения способствует
уменьшению воздействия Г. э.
ГАМБУРГСКАЯ ОЦЕНОЧНАЯ
ШКАЛА ПСИХИЧЕСКИХ НАРУШЕНИЙ
(Hamburg
Rating
Scale
for
Psychic
Disturbances,
HRSPD)
— опросник-анкета,
предназначенная для
оценки психического статуса больных,
перенесших хирургические вмешательства.
Разработан П. Гетцем с соавт. в 1985 г.
Анализы диагностических свойств и
стандартизация
опросника проводились
на выборке из 99 больных, перенесших
операцию на открытом сердце. Психическое
состояние
оценивалось в раннем
послеоперационном периоде и спустя
1-4 недели после операции.
Выраженность психопатологической
симптоматики оценивается по четырем
степеням тяжести. Имеются данные о
результатах факторного анализа
показателей Г. о. ш. п. н., позволившего
выделить восемь факторных признаков
или шкал-синдромов:
— дезориентировка;
— -нарушения концентрации
внимания, динамики мышления;
— галлюцинаторно-параноидная
симптоматика;
— тревожная симптоматика;
— депрессивная симптоматика;
— враждебность;
— утрата контроля;
— уход в себя.
С помощью кластерного
анализа обнаружены 6 групп,
дифференцируемых по данным опросника:
больные без существенных отклонений;
незначительная выраженность симптоматики;
легкая психоорганическая симптоматика
с аффективными нарушениями; тяжелая
психоорганическая симптоматика с
потерей
контроля над поведением;
враждебность с параноидно-галлюцинаторной
и психоорганической симптоматикой;
делириозная симптоматика. Разработчики
рекомендуют Г. о. ш. п. н. для сравнительных
клинических исследований и оценки
психических нарушений в общей
хирургии.
Сведений об использовании
в СНГ не имеется.
ГЕЙДЕЛЬБЕРГСКИЙ РЕЧЕВОГО
РАЗВИТИЯ ТЕСТ (Heidelberger
Spra-chentwicklungs
Test)
— тест специальных
способностей. Предложен
X.
Гримм и X.
Шелер в 1978 г. Предназначен для
диагностики речевых способностей
детей в возрасте от 3 до 9 лет.
Г. р. р. т. состоит из 13
заданий-субтестов.
1.
Понимание грамматических
структур. Тестовый
материал — 4 куклы, 10 фигурок животных
ч 1 кубик. Ребенку предлагают фразу,
напр. «Кошка поймана мальчиком», смысл
которой он должен проиллюстрировать с
помощью игрушек (всего 17 фраз). Задания
выявляют, могут ли дети понять
грамматическую структуру фраз или же
ориентируются на последовательность
называния понятий. Результаты оцениваются
как верные (1) и неверные (0).
2. Образование
множественного
числа существительных.
Ребенку предъявляют такие слова, как
«машина:», «часы», «пальто», «вечер» и
др. (всего 18 слов). Оценивают, может ли
ребенок выразить семантическое
различие единственного и множественного
числа в соответствии с морфологическими
правилами. Два балла за полностью
правильный ответ, 1 — при ошибочном
употреблении ударения или частичном
изменении нужного окончания, 0 —
неверный ответ.
3. Имитация
грамматических структур. Ребенок
должен максимально
точно повторить произнесенное
вслух предложение. Напр.: «Прежде чем
играть, тыдолжен убрать со стола» (всего
^предложений). Оценка проводится по
двум параметрам — фонетическая точность,
позволяющая судить о способности к
слуховым дифференцировкам и
правильности артикуляции, а также
грамматическая точность, дающая
представление о синтаксических
возможностях ребенка. Два балла — верный
ответ, 1 — незначительные семантические
и синтаксические отклонения, 0 —
неверный ответ.
4. Коррекция
семантически неверных предложений.
Ребенку вслух
произносят предложения, в которых
отдельные слова не соответствуют
общему смыслу, и просят заменить эти
слова на верные. Напр., «Мать ставит вазу
с цветами в стол» (всего 9 предложений).
Определяют, в какой степени ребенку
удается понять связь значений и
установить ее средствами языка
(допускаются сокращения и дополнения).
Два балла — точное исправление
предложения, 1 —■ выбранное для
замены слово не в полной мере отражает
нужный смысл или допущена чрезмерная
конкретизация, 0— коррекция не
проведена.
5. Словообразование.
Тестовый материал
состоит из 4 серий картинок по 4 в каждой.
Ребенку предлагают исходное слово,
напр, глагол «ткать». После этого дают
картинку с изображением мужчины около
ткацкого станка и просят назвать его
профессию. Затем показывают картинки
с изображением женщины-ткачихи, ткацкой
фабрики, тканей. Задания направлены
на то, чтобы диагностировать способность
устанавливать систему отношений
между действием, деятелем, местом
действия и выражать это в речи. Два балла
— полностью верное образование слов,
1 — верное смысловое словообразование,
0 — простое соединение слов, образование
слов от другого корня.
6. Вариации
названий. Тестовый
материал состоит из 3 картинок,
изображающих женщин и мужчину. Ребенку
демонстрируют картинку, изображающую
женщину, и сообщают, что ее зовут Мария
Панова. После этого задают вопросы: «У
этой женщины есть ребенок. Как он ее
называет?», «Эта женщина замужем. Как
ее называет муж?», «Допустим, ты захочешь
написать ей письмо. Как ты к ней
обратишься?» Аналогичные вопросы
задают по другим картинкам. Диагностируется
способность определять структуру
межличностных отношений и адекватно
отражать ее в языке. Два балла —
полностью верный ответ, 1 — ответ
информативен, но не очень точен,
многозначен, 0 — неверный ответ.
7. Классификация
понятий. Тестовый
материал состоит из 30 картинок,
изображающих животных, пищу, одежду1,
игрушки, транспорт и растения.
Экспериментатор называет понятие,
относящееся к группе картинок, и
просит дать подробное определение
понятия, а затем отобрать соответствующие
картинки. Выявляется способность
классифицировать объекты по общим
признакам. Один балл — верный ответ, 0
баллов ребенок получает за все задание,
если наряду с верными выборами им сделаны
и неверные.
13. Запоминание
рассказа. Ребенку
вслух зачитывают сказку, которую он
должен запомнить и воспроизвести в
конце тестирования. Сказка состоит из
11 предложений. Выявляется способность
понимания смысла текста и его передачи.
8. Образование
степеней сравнения прилагательных.
Тестовый материал
состоит из 12 картинок. Ребенку сообщают
исходное существительное, напр. «полосы».
Затем показывают картинку с изображением
флага с полосами и спрашивают о том,
какой это флаг. На другом
флаге полос больше, на
третьем еще больше (ответ на последнюю
картинку — «самый полосатый»).
Аналогичным образом демонстрируют
остальные картинки. Диагностируется,
в какой степени у ребенка развита
способность продуктивно применять
правила при повышении уровня абстрактности.
Два балла — все степени сравнения
образованы верно, 1 балл — незначительные
отклонения, 0 — неверный ответ.
9. Взаимосвязь
вербальной и невербальной информации.
Предлагаются
последовательно 4 картинки с изображением
мужских лиц. Требуется по картинке
определить эмоциональное состояние
мужчины. После этого ребенку предъявляется
фраза, напр., «Мне очень приятно» (всего
8 фраз), которую якобы произносит один
из изображенных мужчин, обращаясь к
ребенку. Задача состоит в том, чтобы
выбрать из четырех мужчин того,
который мог бы произнести эту фразу.
Выявляется способность к диффе-ренцировке
эмоциональных состояний в процессе
общения. Два балла — связь предложения
и картинки верная, 1 — выбрано родственное
эмоциональное состояние, 0— связь
предложения и изображения ошибочна.
10. Кодирование
и декодирование наличной интенции.
Тестовый материал
состоит из 3 картинок с изображением
мужских лиц. Ребенка еще раз просят
назвать эмоциональное состояние каждого
мужчины, после чего рассказывают
короткую историю и просят придумать
фразу, которую мог сказать один из
изображенных мужчин в заданной
ситуации (истории). Напр., показывают
картинку с изображением рассерженного
мужчины и говорят о том, что на него
наехал ребенок своим велосипедом;
требуется ответить, что этот мужчина
мог бы сказать ребенку. Выявляется
способность к различ-
ному выражению одной и той
же информации с учетом специфичных
ролевых признаков. Два балла — высказывание
соответствует типу эмоционального
состояния, 1 — соответствует смыслу,
но не отражает эмоционального состояния,
О — не соответствует смыслу и не отражает
эмоционального состояния.
П. Конструирование
предложений. Ребенку
предъявляют набор слов, из которых нужно
составить предложение, напр.,
«мать—работать—сад» (10 наборов слов
по 2-3 слова). Выявляется способность
логически объединять разные понятия.
Два балла — все слова употреблены
семантически и синтаксически верно,
1 — есть незначительные отклонения от
правил, 0 — грубые отклонения от правил.
12. Нахождение
слов. Называют три
слова с просьбой добавить недостающее
четвертое, напр., «лев—тигр—слон—…»
(14 наборов слов). Диагностируется
способность узнавать аналогию в
значениях слов, выясняется, в какой
степени ребенок усвоил интенциональные
и экс-тенциональные аспекты значений.
Два балла — названное слово связано с
предыдущими, учтены все существенные
признаки, 1 — заданное семантическое
поле нарушено из-за неучета одного
существенного признака; 0 — ответ не
соответствует семантическому полю.
13. Воспроизведение
рассказа. Воспроизводится
сказка, прослушанная после выполнения
7-го субтеста. Два балла — совершенно
верное воспроизведение, 1 —
незначительные смысловые и грамматические
отклонения, 0 — неверное воспроизведение.
После завершения тестирования
вычисляется общая сумма баллов,
сопоставляемая с нормативными
данными. Авторы сообщают о высокой
валидности и
надежности методики.
В СНГ проведена адаптация
Г. р. р. т. (Н. Б. Михайлова, 1990), полученные
психометрические характеристики не
выявляют принципиальных различий
между оригинальным и русскоязычным
вариантами теста.
Тест рекомендуется применять
для диагностики речевого развития
в дошколь- ных учреждениях и в первых
классах средней школы.
ГЕНДЕРСОНА ДИАГНОСТИЧЕСКОЕ
ИНТЕРВЬЮ (Gunderson’s
Diagnostic
Interview
for
Borderlines,
DIB)
— опросник-анкета, предназначенный
для оценки симптомов и особенностей
поведения у больных с пограничными
психическими расстройствами.
Опросник включает 29 пунктов,
относящихся к пяти областям
функционирования (социальное
поведение, импульсивные поступки,
аффективная сфера, психотические
симптомы, -межличностное взаимодействие).
Применяется для ориентировочной
постановки диагноза. Применение Г. д.
и. предусматривает привлечение материалов
истории болезни, опору на них. По
данным Б. Арме-лиса и соавт. (1985), наиболее
интерес-» ным аспектом в использовании
опросника является возможность постановки
диагноза по записям в истории болезни
(ретроспективная диагностика). Имеются
данные о достаточно высокой валидности
Г. д. и., изучавшейся
путем сопоставления с экспертными
заключениями.
Сведений об использовании
в СНГ не имеется.
ГИЛФОРДА —ЦИММЕРМАНА
«ТЕМПЕРАМЕНТА ОБОЗРЕНИЕ»
(Guilford—Zimmerman
Temperament
Survey)
— опросник личностный.
Предложен Дж.
Гилфордом и В. Циммерманом в 1949 г.
Опросник состоит из 300
утверждений, образующих 10 шкал
факторов (по 30 утверждений в каждой).
Предусмотрены три варианта ответа:
«да», «нет», «не знаю». Полученные
результаты выражаются в процентильной
шкале и представляются в виде «профиля
личности». Предназначен для измерения
следующих факторов:
1. Общая активность.
2. Уравновешенность.
3. Доминирование.
4. Общительность.
5. Эмоциональная устойчивость.
6. Объективность.
7. Дружелюбие.
8. Рефлексивность.
9. Отношение к людям. 10.
Мужественность.
По мнению авторов, каждый
фактор имеет два полюса, напр.:
Общая активность Положительный
полюс: Много энергии,
подвижность, быстрый темп деятельности,
энтузиазм в действиях. Отрицательный
полюс: Вялость, частые
перерывы в деятельности, малая
подвижность.
Необходимо, однако, учитывать
известную асимметричность шкал
опросника. Некоторые шкалы являются,
по сути, однополюсными, что признается
и самими авторами (так, по шкале
«уравновешенность» оценки в пределах
0-2, 9, 10 стэ-нов (см. Оценки
шкальные) считаются
в равной мере нежелательными).
При интерпретации полученных
результатов Дж. Гилфорд и В. Циммерман
рекомендуют исходить из «профиля» в
целом, ибо высокий показатель, напр.,
по эмоциональной устойчивости,
рассматривается как благоприятный
в том случае, когда сочетается с
высоким показателем общей активности.
Особенностью построения Г.—Ц. «т. о.»,
как и других оп-
росников Дж. Гилфорда,
является анализ взаимокорреляций между
утверждениями (вопросами).
Из достаточно обширного
перечня утверждений на основе
содержательного и корреляционного
анализа отбираются те, которые наиболее
точно выражают сущность изучаемых
переменных.
Полученные коэффициенты
интеркорреляции подвергаются
факторному анализу.
Утверждения группируются
в шкалы с учетом их «насыщенности»
тем или иным фактором.
Дж. Гилфорд рассматривает
личность как обобщенную совокупность
черт. Под чертой понимается любая
переменная, обладая которой индивидуум
отличается (или может отличаться) от
других людей. Для Дж. Гилфорда
несущественно, будут этими отличительными
признаками особенности поведения
или строения тела. Чем более широкой
будет совокупность выявленных черт,
тем более полными будут наши знания о
данной личности. Однако Дж. Гилфорду
не удается удовлетворительно ответить
на вопрос о том, какой набор черт
достаточен для исчерпывающего
описания личности. В исследовательской
практике он ограничивается определением
статистических закономерностей, не
интересуясь источниками изучаемых
им черт личности и делая упор на их
описание и измерение.
В зарубежных исследованиях
установлена сравнительно высокая
валидность эмпирическая
Г.—Ц. «т.о.». Коэффициент
надежности шкал,
по данным авторов опросника, колеблется
в пределах 0,75-0,85. Приведенные Дж. Гилфордом
и В. Циммерманом показатели интеркорреляции
шкал опросника в некоторых случаях
достаточно высоки (до 0,69), что не позволяет
признать их в качестве измеряющих
ортогональные (независимые) факторы
личности.
Проведенный Г. Айзенком и
С. Айзенк факторный анализ данных,
полученных с помощью представленного
Дж. Гилфордом списка утверждений
(обследовано 600 мужчин и 600 женщин в
возрасте 18-40 лет), позволил отчетливо
выделить два фактора третьего порядка:
экстраверсия—интроверсия и нейротизм
(см. Аи-зенка личностные
опросники). Эти
результаты позволяют объяснить
значимые интеркорреляции шкал опросника.
Г.—Ц. «т. о.» используется
в СНГ, включен в методику Керна—Йирасека
(Рабочая…, 1991).
ГИССЕНОВСКИЙ ЖАЛОБ
ПЕРЕЧЕНЬ (Giesener
Beschwerdebogen,
GBB)
— опросник-анкета,
предназначен для
выявления субъективной картины физических
страданий больных. Предложен Е.
Брюхлер и Дж. Снер в 1967 г.
Г. ж. п. состоит из перечня,
включающего 57 жалоб, относящихся к
таким сферам, как общее самочувствие,
вегетативные расстройства, нарушение
функций внутренних органов. Степень их
интенсивности оценивается по
5-балльной шкале; 0 — нет, 1 — слегка,
2 — несколько, 3 — значительно, 4 — сильно.
Примеры жалоб: 1. Ощущение слабости
0 12 3 4 9. Боли в суставах и
конечностях
0 12 3 4 55. Ощущение давления
в голове
0 12 3 4
Помимо жалоб, выясняется
их обусловленность психическими или
физическими факторами с г. з. пациента.
Предусмотрена возможность указания
на не содержащиеся в Г. ж. п. жалобы.
На основе факторного
анализа были выделены
4 основные и 5-я дополнительная шкалы:
Шкала .
«Истощение» (И) —
характеризует неспецифический фактор
исто-
щения, указывающий на общую
потерю жизненной энергии, потребность
в помощи.
Шкала 2. «Желудочные жалобы»
(Ж) — отражает синдром нервных
(психосоматических) желудочных
недомоганий.
Шкала 3. «Ревматический
характер» • (Р) — выражает субъективные
страдания пациента, носящие алгический
или спастический характер. Шкала 4.
«Сердечные жалобы» (С) — указывает на
то, что пациент локализует свои
недомогания преимущественно в
сердечно-сосудистой сфере. Шкала 5.
«Давление» или «Интенсивность жалоб»
(Д) — характеризует общую интенсивность
жалоб. Оценки по шкалам получают путем
суммирования баллов по каждому входящему
в эти шкалы пункту. Для оценки субъективной
степени физических недомоганий
авторы предлагают рассматривать ее
в сравнении с данйыми выборок пациентов
и здоровых, а также учитывать возрастные
и половые различия. В каче-, стве такого
интегрального показателя для сопоставления
используется т. н. процентный ранг —
процент тех испытуемых из выборки
стандартизации, которые
получили равный или более низкий
балл, нежели данный обследуемый. Г.
ж. п. предполагает также графическое
отображение результатов. Помимо
интерпретации по пяти шкалам, возможен
анализ, базирующийся на всех пунктах.
Стандартизация Г. ж. п.
проводилась на выборке населения
Германии (1601 чел.) и пациентах
психосоматической клиники Гиссеновского
университета (4076 чел.)
Имеется русскоязычный
вариант (В. А. Абабков, С. М. Бабин, Г. Л.
Исури-на и др., 1993), стандартизованный
на здоровых (286 чел.) и больных с
невротическими и психосоматическими
расстрой-
ствами (467 чел.). Помимо
основного предназначения, Г. ж. п. в
психодиагностике может использоваться
для изучения эффективности психотерапии,
при решении проблемы взаимовлияния
физических жалоб у супругов, ответной
реакции на заболевание партнера.
ГИССЕНСКИЙ ТЕСТ (Giesen-Test,
Qg)
— опросник
личностный. Разработан
Д. Бэкманом и Г. Рихтером в 1968 г. Предназначен
для диагностики психосоциальных
связей личности.
Г. т. содержит три варианта
одних и тех же 40 биполярных утверждений
(«Я», «ОН», «ОНА»). Введение таких
вариантов заданий необходимо для
получения характеристик испытуемого
со стороны окружающих, что делает, напр.,
возможным дополнение самохарактеристики
пациента характеристикой врача,
удобно для обследования семейных пар,
психотерапевтических групп и т. д.
Каждое из утверждений оценивается по
7-балльной шкале. Примеры заданий (в
варианте «Я»):
1. У меня впечатление,
что я
скорее не-
скорее тер-
терпеливый 3 2 10 12 3
пеливый человек.
человек.
14. Я редко 32 1QJ.23
часто
чувствую себя подавленным(ой).
40. Я чувствую
себя
свободно 3 2 10 12 3
очень ско-
ванно в обращении с лицами
другого пола.
Сырые оценки подсчитываются
по 6 основным шкалам. К полученному
результату добавляются корректирующие
константы, содержание которых сходно
с прибавкой показателей шкалы коррекции
Миннесотского
многоаспектного личностного опросника.
Полученные показатели
могут быть преобразованы в стандартные
Т-баллы (см. Оценки
шкальные). Дополнительно
подсчитываются ре-
зультаты по двум установочным
шкалам (см. Шкалы
контрольные. Установки на ответ).
Установочная шкала
М показывает
количество средних выборов (0), шкала Е
— количество крайних
выборов (3). На основании данных этих
шкал можно судить об отношении
испытуемого к ситуации обследования,
действии некоторых защитных механизмов
личности, напр., большое количество
средних выборов может быть истолковано
как проявление эмоционального
безразличия к обследованию, а большое
количество крайних выборов может
указывать на возбужденное состояние
или недостаточный самоконтроль.
Основные шкалы Г. т. выделены
на основе факторного
анализа данных
обследования 235 больных неврозами.
Каждая из них имеет два полюса: I.
Шкала социального одобрения.
Полюс низких значений
свидетельствует о непривлекательности
субъекта, неуважении его окружающими,
неумении добиваться поставленной цели,
непопулярности. Высокие значения у
лиц, уверенных в своей положительной
социальной репутации, привлекательности,
популярности, в способности добиваться
цели, уважаемых и высоко оцениваемых
другими людьми. С помощью этой шкалы
в основном диагностируется способность
успешно взаимодействовать с окружением.
П. Шкала доминантности.
На одном полюсе властолюбие,
нетерпение, желание настоять на
своем. На другом — послушание,
уступчивость, терпение. Эти
взаимодополняющие личностные особенности
отождествляются с психосоциальными
защитными формами поведения, в которых
противопоставляются агрессивность,
импульсивность, притязания на
первенство и терпеливость, покладистость,
неспособность к агрессии, склонность
к подчинению, зависимость.
III.
Шкала контроля.
Низкие показатели связаны
с неаккуратностью, непостоянством,
склонностью к беззаботному поведению,
легкомысленным поступкам, неумению
распоряжаться деньгами (недостаточный
контроль). Для избыточного контроля
характерны педантичность,
усердие,отсутствие склонности к
легкомысленному, беззаботному поведению.
IV.
Шкала преобладающего настроения.
Два полюса: гипоманиакальный
(лица, редко испытывающие подавленность,
не склонные к рефлексии и критическому
отношению к себе, не скрывающие
раздражения, независимые) и депрессивный
(подавленность, склонность к рефлексии,
робость, зависимость, самокритичность).
Предполагается, что преобладающее
настроение связано с основным для
личности направлением развития
агрессии (вовне или против собственного
Я).
V.
Шкала открытости—замкнутости.
Лица, демонстрирующие низкие
показатели по этой шкале, характеризуются
как доверчивые, открытые перед другими
людьми, обладающие большой потребностью
в любви, откровенностью; на другом
полюсе — замкнутые, недоверчивые,
отстраненные от других людей, стремящиеся
скрыть собственную потребность в любви.
С помощью этой шкалы диагностируется
основная характеристика социальных
контактов и социального поведения,
развивающаяся из первичного доверия
или недоверия.
VI.
Шкала социальных способностей.
На одном полюсе активная,
общительная, непринужденная,
конкурентоспособная личность с
богатым воображением и способностью к
сильным чувствам. «Социальная
слабость», по мнению авторов, характеризуется
необщительностью, сла-
бой способностью к самоотдаче,
неспособностью к длительным
привязанностям, бедной фантазией.
Комплекс качеств, отраженных в этой
шкале, позволяет судить о степени
зрелости личности.
В целом содержание 6 основных
шкал, по замыслу авторов Г. т., охватывает
те внутриличностные и психосоциальные
переменные, которые имеют центральное
значение для современной психоаналитической
диагностики.
Г. т. первоначально
использовался в области клинической
психодиагностики, однако позднее сфера
применения была существенно расширена.
Опросник получил распространение в
социально-психологических исследованиях.
В 1975 г. с учетом опыта применения в новых
сферах выполнена повторная стандартизация
(Д. Бэкман и соавт.,
1983).
В начале 90-х годов Г. т. была
адаптирована русскоязычная версия
(Е. А. Го-лынкина и соавт., 1993). Выборка
стандартизации составила 173 человека
в возрасте от 18 до 57 лет. Наряду с
переводом и рестандартизацией Г. т.
определены основные психометрические
характеристики русскоязычной версии.
Коэффициент надежности
ретестовой по различным
шкалам составил г, = 0,58-0,83, ко=» эффициент
внутренней согласованности
г = 0,45-0,70. Валидность
кон-структная определялась
на основе сопоставления с данными
«Шестнадцать личностных
факторов» опросника. О валидности
критериальной можно
судить по данным сравнительных
исследований здоровых людей и больных
психосоматическими заболеваниями.
Г. т. как средство психологической
диагностики личности может получить
широкое распространение. Особенно
перспективно его использование в
клинической психодиагностике при
контроле эффективности психотерапии.
Однако особенностью структуры Г. т.
является
то, что, наряду с относительно
постоянными во времени личностными
свойствами, авторы включили те переменные,
которые связаны с ожидаемыми изменениями
после проведения психотерапии.
Поэтому возможны методические затруднения,
обусловленныетем, что в отличие от,
напр., MMPI
Г. т. не имеет
предпочтительной направленности
отдельных шкал, т. е. изменения влево и
вправо в равной степени могут отражать
усиление и ослабление невротических
тенденций. Усреднение же показателей
в этом случае приведет к нивелированию
как изначально имеющихся различий,
так и возникающих изменений. Поэтому
рекомендуется в случае разных
клинических групп и различной по форме
и длительности психотерапии
разрабатывать релевантные выборке
специальные шкалы на базе всех заданий
опросника.
ГУДИНАФ «НАРИСУЙ ЧЕЛОВЕКА»
ТЕСТ (Goodenough
Draw-A-Man
Test,
DAT)
— тест
интеллекта. Предназначен
для измерения уровня интеллектуального
развития детей и подростков. Предложен
Ф. Гудинаф в 1926 г.
Обследуемому предлагают
изобразить на листе бумаги мужчину,
причем просят сделать это как можно.лучше.
Время рисования не ограничивается.
Оценка уровня интеллектуального
развития осуществляется на основе
того, какие части тела и детали одежды
изображает обследуемый, как учтены
пропорции, перспектива и т. д. Ф.
Гудинаф разработала шкалу, по которой
можно оценить 51 элемент рисунка. Имеются
нормы для детей от 3 до 13 лет, которые
могут быть сопоставлены с умственным
возрастом.
Надежность Г. «н. ч.»
т., неоднократно
проверявшаяся разными методами,
достаточно высока. Коэффициент
надежности ретестовой
составляет 0,68, а
коэффициент надежности методом рас-
щепления (см. Надежность
частей теста) —
0,89. Показатели валидности
конструктной, несмотря
на вариабельность, превышают 0,50. Г.
«н. ч.& т. может быть использован
как в индивидуальном, так и в групповом
исследовании. На основе Г. «н. ч.» т. К.
Маховер была предложена проективная
методика исследования личности (см.
«Нарисуй человека»
тест).
В 1963 г. Д. Харрисом Г. «н. ч.»
т. был пересмотрен, расширен и опубликован
под названием «Гудинаф—Харрис рисования
тест» (Goodenough—Harris
Drawing
Test).
В варианте, предложенном Д. Харрисом,
после завершения рисунка мужчины
обследуемому предлагают изобразить
женщину, а затем нарисовать свой портрет,
Наряду с известным способом оценки
рисунка по его элементам предложена
более простая обработка результатов
тестирования — качественная оценка
рисунка в целом путем сопоставления
полученного изображения с 12 образцами
(по степени сходства с эталоном).
Коэффициент корреляции между данными,
полученными при рисовании мужчины и
женщины, весьма высок (0,91-0,98), что позволяет
считать оба варианта взаимозаменяемыми.
Изображение испытуемым самого себя
разрабатывалось Д. Харрисом как
проективная методика
исследования личности.
Сведений об использовании
в СНГ не имеется.
ГУТМЕНА ШКАЛЫ —
разновидность психодиагностических
методик, задания в которых располагаются
по принципу последовательно нарастающей
трудности заданий
теста.
Если, например, в такой шкале
упорядоченная по трудности совокупность
включает задания с 1 по 20-е и испытуемый
успешно выполнил 8-е задание, то он в
состоянии выполнить и задачи с 1-й по
7-ю. Если же испытуемый не
смог выполнить 9-е задание, то он
также, скорей всего, не сможет выполнить
задания с 10-го по 20-е.
На основе анализа кривых,
описывающих «задание—ответ»
зависимость, предполагается,
что для всех значений, превышающих
некоторую точку на оси измеряемого
свойства, вероятность правильного
ответа равна 0, а для всех меньших
значений она составляет +1 (см. Раша
модель). Это, в свою
очередь, означает, что каждое задание
имеет высокую корреляцию
бисериальную с общим
показателем и является весьма дискри-
минативным (см. Дискриминативностъ
заданий теста) в
некоторой точке континуальной оси
измеряемого свойства.
Подбор заданий в Г. ш. чаще
всего осуществляется с помощью
специальных компьютерных программ в
связи со сложностью и громоздкостью
необходимых вычислений.
Наиболее заметный недостаток
Г. ш. заключается в том, что на пра-ктике
редко удается получить необходимый по
размаху диапазон трудностей заданий.
По этой причине шкалы
измерительные оказываются
короткими по диапазону оценок, а стало
быть, и слабо дискриминативными.
д
«ДВА ДОМА» МЕТОДИКА (The
Two-Houses
Technique,
2ИТ) —
проективная методика
исследования личности.
Предназначена для исследования
восприятия детьми своих семей. Предложена
И. Ванл-вик, П. Экблад в 1994 г. Задача
испытуемого при работе с «Д. д.» м. —
перечисление людей, живущих с ним, и
размещение каждого члена семьи в один
из двух домов, нарисованных
исследователем. Идет изучение надежности
и валидности
методики. Авторы
сообщают, что при сравнении данных,
полученных на основе теста и интервью,
30% обследованных, которые забылл
поместить Себя в один из домов, имели
более низкие показатели психосоциального
функционирования(по интервью).
Сведений об использовании
в СНГ не имеется.
ДВАДЦАТИ УТВЕРЖДЕНИЙ
САМООТНОШЕНИЯ ТЕСТ (Twenty
Statements
Attitude
Test)
— опросник личностный,
вариант
нестандартизирован-ного самоотчета,
сближающийся с проективными методиками
исследования личности. Предназначен
для исследования самоотношения.
Предложен М. Куном и Т. Мак-Партландом
в 1954 г.
Д. у. с. т. основан на
использовании нестандартизированного
самоописания с последующим контент-анализом.
Испытуемый должен
в течение 12 мин дать двадцать различных
ответов на вопрос, обращенный к самому
себе: «Кто я такой?» В инструкции
указывается, что ответы следует
давать в том порядке, в котором они
спонтанно возникают, не заботясь о
последовательности, грамматике и логике.
Используемые в тесте
категории контент-анализа были
выделены на основе ряда исследований.
Таковыми являются: социальные группы
(пол, возраст, национальность,
религия,’профессия), мировоззренческие
позиции (философские, религиозные,
политико-идеологические и моральные
высказывания), интересы и увлечения,
стремление и цели, самооценка.
Теоретической основой создания Д. у. с.
т. является разработанное М. Куном
понимание личности, операциональную
сущность которой можно определить через
ответы на вопрос: «Кто я такой?*, обращенный
к самому себе (или обращенный к
человеку вопрос другого лица: «Кто Вы
такой?»).
Общая тенденция в ответах
состоит в том, что «присоединяющие»
утверж-
денкя, в которых фиксируется
принадлежность испытуемого к той
или иной категории людей, выносятся
раньше, чем «дифференцирующие». Среди
наиболее частых категорий, выявленных
на больших выборках в зарубежных
исследованиях, — профессиональная
идентичность, семейная роль и статус,
религиозная идентичность, пол и
возраст. Пока более ясны социологические
закономерности, проявляющиеся в
ответах испытуемых (напр., возраст
чаще упоминают молодые и пожилые
люди, женщины чаще упоминают семейный
статус, мужчины — половую принадлежность),
чем психологические. Обычно считается,
что порядок называния категорий
соответствует выраженности и значимости
соответствующих признаков, однако
это не является доказанным. Возможно
влияние стереотипов, защитных механизмов
и т. д. Гак, показано, что дети чаще, чем
взрослые, определяют себя через
ситуативные и частные особенности, а
частота упоминания расы и национальности
зависит от этнической однородности
общества, к которому принадлежит
испытуемый. Различаются ответы,
касающиеся самоидентичности в рамках
индивидуального уровня самосознания,
и ответы, относящиеся к личностной
самоидентичности.
Диагностическое использование
Д. у. ст. затрудняется отсутствием
социокультурных нормативных
показателей, данных о валидности
и надежности.
Не решены также
теоретические и методические проблемы
кодирования ответов.
Сведений об использовании
в СНГ не имеется.
ДВОЙНОЙ РИСУНОК —
проективная методика
исследования личности.
Разработана П. Тюриным в 1983 г. Обследуемому
предлагают на отдельных листах бумаги
последовательно выполнить 5-7 рисунков.
Нарисовано может быть все что угодно,
с одним условием: рисунок
должен удовлетворять
обследуемого, что и оговаривается в
инструкции. Листы белой бумаги сложены
в виде блокнота. Под второй лист
подкладывают копировальную бумагу,
но красящей стороной вверх. После
завершения первого рисунка два
верхних листа отрывают от блокнота,
а копировальную бумагу переносят прд
следующую пару листов, но так, чтобы
обследуемый не заметил ее необычного
расположения. После завершения процесса
рисования обследуемому вручают
первый рисунок, обратную копию и блокнот,
под второй сверху страницей которого
снова находится копировальная бумага.
При этом его просят разместить блокнот
с чистой страницей так, чтобы он оказался
между двумя имеющимися рисунками.
Испытуемый должен в изобрази-тельной.форме
дать ответ на вопрос о том, что должно
быть на новой чистой странице с учетом
двух уже имеющихся изображений. Затем
процедура повторяется. Обычно достаточно
3-4 серий удвоений. По мнению автора,
рисунки распадаются на четыре основных
типа.
1. Фрагментарно-ассоциативный.
Обследуемый рисует на промежуточном
листе то, что у него ассоциируется с
первоначальным изображением.
2. Вариативный.
Промежуточный лист
обычно делится вертикальной линией
пополам и заполняется так, что он
частично относится к левому рисунку,
а частично — к правому. События
развиваются во времени.
3. Логико-интерполяционный.
Изображаются различные проекции
нарисованного ранее объекта. При
попытке связать изображения используются
в основном признаки, ранее имевшиеся в
рисунке.
4. Синтетический.
Решительный прорыв
к новым образам. Обследуемый в этом
случае нередко пытается дорисовать
детали на первоначальных изображениях,
переворачивает рисунки на 90
или 180 градусов, как бы
постоянно задавая себе вопрос: «А
что будет, если…».
В интерпретации предлагается
исходить из того, что
фрагментарно-ассоциативные решения
являются наименее творческими, тогда
как синтетические ассоциативно
богаты и в высокой степени логичны.
Синтетические рисунки могут служить
индикатором творческих способностей
индивидуума. Работа над тестом, судя по
имеющимся публикациям, не завершена,
данные о стандартизации, валидности
и надежности
не приводятся.
«ДЕЛОВЫЕ СИТУАЦИИ» —
проективная методика исследования
личности. Является модификацией
Розенцвейга рисуночной
фрустрации методики. Предложена
Н. Г. Хитровой в 1992 г.
Стимульный материал «Д. с.»
состоит из 20 рисунков,
изображающих конфликтные ситуации,
нередко встречающиеся в производственных
условиях. На каждом рисунке один из
персонажей произносит слова, фрустрирующие
собеседника. Содержание рисунков
изменено таким образом, что личность
исследуется главным образом в условиях
трудовой деятельности, в том числе
управленческой. Испытуемый должен
сформулировать ответ, адекватный, с его
точки зрения, в данной конфликтной
ситуации. Время работы с методикой
ограничивается. Оценка полученных
ответов аналогична таковой в Розенцвейга
рисуночной фрустрации методике.
Методика может быть использована как
в индивидуальном, так и в групповом (при
одновременном участии 20-25 человек)
обследовании.
«Д. с.» стандартизирована
на выборке из 120 инженеров. Получены
средние оценки («сырые» с переводом в
шкальные) отдельно для мужчин и
женщин, а также для лиц различного
должностного статуса (рядовых, ведущих
инженеров и руководителей). Выделены
«стандартные
ответы» (наиболее часто
встречающиеся в той или иной ситуации).
На их основе подсчитывается индивидуальный
коэффициент групповой адаптивности
(КГА), который, по мнению автора, служит
показателем коммуникативных свойств
личности, навыков эмоционального
реагирования.
Валидность конструктная
«Д. с.» определялась
путем сопоставления данных, полученных
с ее помощью при обследовании 40
руководителей, с результатами
применения PF
Study.
Корреляционный анализ
выявил положительные
связи с рядом показателей теста рисуночной
фрустрации. Валидность
критериальная измерялась
путем сопоставления результатов «Д.
с.» с данными групповой оценки личности
(исследовалась выборка инженеров,
111 человек). Подтверждается валидность
методики по большинству ее показателей.
«Д. с.» используется для
изучения особенностей управленческой
деятельности, поскольку выявляет
индивидуальную комбинацию приемов
решения конфликтных ситуаций.
Рекомендуется для диагностики
административно-управленческих
способностей рядовых и ведущих инженеров,
оценки уровня управленческой деятельности
руководителя.
ДЕРЕВА ТЕСТ (Baum
Test)
— проективная
методика исследования
личности. Опубликована К. Кохом в
1949 г. Идея теста принадлежит Э. Хушеру,
использовавшему рисунок дерева в
качестве психометрического инструмента.
Обследуемому предлагают выполнить
рисунки любых трех деревьев, за
исключением хвойных. Интерпретация
результатов осуществляется с позиций
психоанализа на основе символического
значения, приписываемого тем или
иным деталям изображения, всему
рисунку. Напр., яблоко, нарисованное
на фруктовом дереве, — свидетельство
неразделенной любви, а крону
следует рассматривать как
зону контакта между «Я» и окружающей
средой. На рис. 19 представлена схема К.
Коха, используемая для анализа данных
Д. т.
Рис. 19. Схема анализа
результатов, полученных по Дерева тесту
Обоснованность привлечения
психоаналитической символики для
интерпретации данных теста не
доказана. Критикуются произвольность
и умозрительность подобных интерпретаций.
Д. т. валиден при использовании для
диагностики психического развития
детей. Выделен ряд особенностей рисунка
(размер и пропорция, размещение на
листе бумаги и т. д.), свидетельствующих
о нарушениях развития (статистически
достоверны различия между здоровыми
людьми и страдающими органическими
поражениями нервной системы).
Сведений об использовании
в СНГ не имеется.
ДЕРЕВНЯ (Village)
— проективная методика
исследования личности.
Произведение Г. Уэллса «Игры на полу»
(1911) дало импульс к созданию Д. и Мира
теста. 80
В 1939 г. была предложена
независимо друг от друга несколькими
авторами. Р, Мукиелли издал в I960 г. первое
полное руководство. Предназначена
для обследования как детей, так и
взрослых.
Стимульный материал Д.
состоит из небольших по величине
предметов, количество которых доходит
до 300 (в зависимости от вариантов
различных авторов). Среди них: школа,
больница, мэрия, церковь, торговые
лавки (мясная, булочная), кафе, деревья
различной формы, автомобили, стены,
фигурки людей и животных и т. п.
Испытуемому предлагают построить
деревню, в которой он будет жить.
Психолог фиксирует поведение
испытуемого и время работы, после
окончания которой просит прокомментировать
результат. Вопросы могут быть заданы
как произвольные (напр., «В каком месте
деревни Вы живете?», «Какой уголок
Вам нравится больше всего?», «Есть ли в
деревне уголок, который напоминает
Вам знакомые места?»), так и по определенной
схеме (существует 8 стандартных вопросов).
После этого на бумаге делают набросок
деревни, в котором тщательно отмечается
расположение каждого предмета.
Теоретическую основу
методики со» ставляют исследования
в области феноменологии, символизма,
экзистенциализма. Анализу подвергается
в первую очередь символическое
жизненное пространство и его структура.
При интерпретации результатов учитываются
символика правого и левого, верха и
низа. Например, доска или стол, на которых
строится Д., могут быть условно поделены
на три горизонтальные зоны. Наиболее
удаленная от испытуемого часть
рассматривается как зона стремлений,
центральная — как сфера настоящего,
ближайшая — как сфера актуальных
переживаний и «Эго». Возможно деление
на вертикальные зоны, а также на небольшие
квадраты (от 8 до
16). По мнению Р. Мукиелли, в
исследованиях с помощью Д. выявляются
4 переменные: психологический возраст,
характер (поведение), культурный
уровень и внутренний мир личности, о
чем свидетельствуют символические
фантазии, которые необходимо
декодировать; интерпретации подлежат
форма переживаемого пространства и
значение, придаваемое элементам
построенной Д. (напр., «аптека» —
символ заботы о здоровье, страха болезни,
небольшого недомогания; «мясная
лавка» — насилия, агрессии, убийства;
«вокзал» — изменения жизни, разрыва
с настоящим, отъезда). Обсуждается
также потребность в топографическом
анализе рельефа Д., ее высоты, наличия
долин, возвышенностей, а также типичных
экспрессивных движений в процессе
создания Д.
В исследованиях с использованием
методики выявились типы макетов Д.,
характерные для различных контингентов
испытуемых.
Р. Мукиелли разработаны
«патологические симптомы»: опустошенная
Д., переполненная Д., хаотичная Д.,
расщепленная Д., безлюдная Д., Д. с
двойным центром, Д., построенная в виде
лабиринта, Д., в которой расположение
всех элементов подчиняется общему
плану, и т. д. Так, лица, страдающие
неврозами, создают, как правило,
опустошенный, безлюдный, излишне
строгий или беспорядочный макеты Д.
Б специальных исследованиях
изучалась проблема дополняемости
или взаимодополняемости Д. и Мира
теста, во многом сходных методик. Было
показано, что обе методики обладают
достаточной валидностью, успешно
дифференцируют различные клинические
группы и могут быть использованы
альтернативно при необходимости
диагностики нервно-психических
расстройств. При углубленной
индивидуальной диагностике
рекомендуется использовать обе
методики, так как их диагностический
материал дополняет друг друга.
За рубежом Д. используется
при профотборе и профориентации, в
процессе психотерапии. Усложненная
интерпретация затрудняет широкое
распространение Д. Необходимы
исследования по ее стандартизации.
Сведений об использовании
в СНГ не имеется.
ДЕТСКАЯ ПРОЯВЛЕНИЙ
ТРЕВОЖНОСТИ ШКАЛА (Children’s
Manifest
Anxiety
Scale,
CMAS)
— опросник
личностный. Разработан
А. Кастанеда, Б. Р. Маккендлес и Д. С.
Палером на основании Проявлений
тревожности шкалы. Изучаются
симптомы тревожности, проявляющиеся
во внешнем поведении индивида.
Допускается групповое и индивидуальное
обследование. Д. п. т. ш. содержит 42
вопроса, направленных на идентификацию
симптомов тревожности, и 11 контрольных
вопросов (см. Шкалы
контрольные). Предназначен
для обследования детей от 9 до 11 лет.
Задания предъявляются на
бланке для ответов, где испытуемый
должен кружком обвести нужный ответ
(«да», «нет»). На бланке также содержатся:
инструкция, анкетные данные испытуемого
и тренировочные вопросы. Обследование
занимает примерно 15 минут. При оценивании
результатов первичные показатели
переводятся а стэны (см. Оценки
шкальные). Показатель
надежности ретестовой
(интервал ретеста 7
дней) колеблется в зависимости от
возраста испытуемых от rt
~ 0,85 до rt
= 0,89 (среднее значение
г, = 0,86). Показатель надежности
частей теста соответственно
— от г, = 0,74 до г, = 0,83 (среднее значение
rt
= 0,78).
Из данных валидизации С
MAS
авторы приводят
корреляции с некоторыми другими
методиками исследования тревожности.
Статистически значимые корреляции
были получены между Д. п, т. ш. и ■двумя
отдельными факторами «Шестнадцати
личностных факторов» опросника в
варианте для подростков: «С»
(эмоциональная
устойчивость) — г- 0,56 и «/» (мягкосердечность)
— г =33. Обнаружена связь с Айзенка
личностным опросником (ЕР!) — г-
0,43 по фактору нейротизма.
Сведений об использовании
в СНГ нет.
«ДЕТСКАЯ РУКА, КОТОРАЯ
БЕСПОКОИТ» ТЕСТ (The
«Childhood
Hand
that
Disturbs»
Test,
CHaD)
— проективная
методика исследования
личности. Опубликована Р. Давидо в 1994
г. Отличительной чертой «Д. р. к. б.»
т. является то, что
эта методика предполагает произвольное
рисование одной из наиболее высокосимволичных
частей тела — руки. Подчеркивается, что
«Д. р. к. б.» т. — клинический инструмент,
который обладает преимуществами
быстрого выполнения и пригоден как
для детей, так и для пожилых.
По сообщению автора,
стандартизация теста проводилась
на нормальных и психически больных
лицах в течение более чем 10 лет.
Подтверждается высокая надежность
и валидность
методики. Разработаны
рекомендации по предъявлению теста,
проведению тестирования и его
интерпретации.
Сведений об использовании
в СНГ не имеется.
ДЕТСКОГО ОПИСАНИЯ РОДИТЕЛЕЙ
ПОВЕДЕНИЯ ОПРОСНИК
(Children’s
Report
of
Parental
Behavior
Inventory,
CRPBI)
— опросник
личностный, направленный
на изучение установок, поведения и
методов воспитатель-
82
ных воздействий родителей
с точки зрения их детей. Разработан
Э. С. Шефе-ром в 1965 г.
Первоначальный вариант
состоял из 20 шкал по 10 вопросов в каждой.
В последующей редакции количество
шкал сокращено до 18 при общем объеме
192 вопроса. Диагностируемые параметра
описываются тремя факторами:
принятие—непринятие родителей,
психологический контроль—психологическая
автономия, строгий воспитательный
подход—либеральный воспитательный
подход.
За рубежом Д. о. р. п. о. часто
используется в модификации С. Шлудерман
и Е. Шлудерман, сокративших количество
вопросов до 108 за счет выделения наиболее
диагностически ценных. Изучаемые факторы
в модифицированном варианте квалифицируются
следующим образом: положительное
отношение—враждебность,
директивность—автономия,
последовательность—непоследовательность
воспитательных воздействий. Известен
также предложенный на этой основе
вариант 3. Матейчека и П. Ржичана
(1983). Благодаря анализу гомогенности
(см. Внутренняя
согласованность) во-
__ просов по отношению к выделенным
факторам, появилась возможность
разработать более компактную версию,
обладающую высокой надежностью
и получившую
название «Опросника родительского
поведения и установок для молодежи»
(МОЛОР — сокращенное «молодежь—
родители»). МОЛОР состоит из 50 высказываний,
касающихся поведения родителей;
ответы имеют три градации («да»,
«частично», «нет»), с количественными
оценками 2, 1,0 соответственно. Методика
включает 4 тестовые тетради, которые
различаются в зависимости от субъекта
и объекта оценивания: оценка отца
дочерью, оценка отца сыном, оценка
матери дочерью, оценка матери сыном.
Оценки первичные переводятся
в производный показатель, который
представляет собой стандартную
оценку (от 1 до 5 баллов). Эти оценки
являются удвоенными стэнами (см.
Оценки шкальные).
Стандартная оценка
1 соответствует стэ-нам 1 -2, оценка 2
соответствует стэнам 3-4 и т. д. Опросник
предназначен для обследования лиц
в возрасте 13—18 лет.
Валидность эмпирическую
устанавливали
путем сравнения оценок отдельных
шкал в группах учеников с хорошей и
плохой успеваемостью, при этом были
получены достоверные различия (более
отчетливо при оценке матери). Валидность
критериальная определялась
сопоставлением результатов у детей,
родившихся от нежелательной беременности,
с детьми, эмоционально принятыми
родителями, а также сопоставлением
данных, полученных у детей, живущих
в полных и неполных семьях. Имеются
сведения о валидности
конструктной, полученные
при сопоставлении результатов опросника
с аналогичными данными, направленными
на анализ отношений между детьми и
родителями.
Внутренняя согласованность
шкал оценки матери и
отца является удовлетворительной,
коэффициент корреляции варьирует в
интервале 0,53-0,86. Отмечается высокая
надежность ретесто-вая.
При интервале ретеста
2 нед были получены коэффициенты rt
= 0,70-0,86 (при оценке
матери и отца).
3. Матейчек и П. Ржичан (1983)
указывают на высокую информативность
МОЛОР при анализе семейных конфликтов,
воспитательных проблем, при нарушениях
поведения и невротических расстройствах
в случае развода в семье, при проблемах
с обучением в школе. Опросник находит
применение и в клинической практике.
Сведений об использовании
в СНГ не имеется.
ДЕТСКОЙ АППЕРЦЕПЦИИ
ТЕСТ
(Children’s
Apperception
Test,
CAT)
— проективная
методика исследования
личности. Опубликована Л. Беллаком и С.
Беллак в 1949 г. Д. а. т. — вариант тематической
апперцепции теста, предназначен
для обследования детей в возрасте
от 3 до Шлет.
Стимульный материал Д. а.
т. состоит из 10 стандартных черно-белых
таблиц-рисунков. В качестве персонажей
изображенных ситуаций выступают
животные, которые в большинстве случаев
выполняют человеческие действия.
Рисунки выполнены в манере, характерной
для детских книг (рис. 20, 21). Выбор
рисунков
Рис. 20. Образец рисунка
Детской апперцепции теста
осуществлялся в соответствии
с гипотезой авторов о том, что процесс
проекции у детей значительно облегчается
в том случае, когда в качестве персонажей
выступают животные, а не люди.
Экспериментальное подтверждение
этой гипотезы отсутствует. Напротив,
проведены исследования, свидетельствующие
о том, что более значимый диагностический
материал может быть получен при
использовании рисунков, изображающих
людей. Это было учтено авторами,
предложившими в 1966 г. новый вариант
Д. а. т. с изоб-
ражениями людей (САТ-Н).
Данные о ва-лидностпи
Д. а. т. противоречивы.
Д. а. т. стимулировал появление
значительного количества валидных
проективных методик исследования
личности, ориентированных на изучение
семейных и других отношений, аттитюдов
детей (см.
Аттитюдов детей тест,
Джексон тест семейных установок, Жиля
тест-фильм, Семейных отношений тест).
Д. а. т. (руководство по работе
и картинки) был впервые в СНГ с
разрешения автора опубликован на русском
языке в Киеве (Л. Беллак, С. С. Беллак,
1995).
ДЖЕКСОН ТЕСТ СЕМЕЙНЫХ
УСТАНОВОК (Jackson
Test
of
Family
Attitudes)
— проективная методика
исследования
личности. Опубликована Л. Джексон в
1952 г. Предназначена для обследования
детей в возрасте от 6 до 12″лет.
Стимульный материал Д. т.
с. у. состоит из шести стандартных
таблиц с изображением различных
критических для ребенка сцен семейной
жизни, напр.: угроза его благополучию
вследствие рождения в семье другого
ребенка (рис. 22), отказ родителей от
ребенка и т. п. Д. т. с. у. может
Рис. 21. Пример рисунка Детской
апперцепции теста •
Рис. 22. Образец рисунка
Джексона теста семейных установок
рассматриваться как вариант
детской апперцепции
теста (см. Аттитюдов
детей тест,Жиля тест-фильм, Семейных
отношений тест).
Автором теста были проведены
исследования в трех группах: нормальные
дети; дети, страдающие неврозами;
несовершеннолетние правонарушители.
Обнаружены значимые межгрупповые
различия, позволяющие сделать вывод о
валиднос-тиД. т.
с. у. в изучении установок детей
к родителям, родственникам,
самим себе. Широкого распространения
в психодиагностических исследованиях
тест не получил.
Сведений об использовании
в СНГ не
имеется.
ДЖЕНКИНСА ПОВЕДЕНИЯ
ОБОЗРЕНИЕ . (Jenkins
Activity
Survey,
IAS)
— опросник
личностный, направленный
на выявление поведения типа А. Разработан
Д. Дженкинсом в 1967 г. Среди опросников,
направленных на диагностику поведения
типа А, используется наиболее часто.
Поведение типа А —
поведенческий синдром, который
характеризуется агрессивностью,
нетерпеливостью, чрезмерной вовлеченностью
в работу, стремлением к достижениям,
соперничеству, преувеличенным
чувством недостатка времени, го-ропливой
речью, напряженностью мышц лица и тела.
Людям противоположного типа (Б) эти
особенности несвойственны. М. Фридман,
Р. Розенман, вводя это понятие в 60-е
годы, обнаружили, что лица, отнесенные
к типу А, от 4 до 7 раз чаще (чем лица типа
Б) заболевают инфарктом миокарда. Поиски
типа «коронарной личности» начались
еще.в прошлом веке. В 1938 г. этот тип был
выделен и описан в рамках концепции
«профиля личности». Впоследствии
изучались отдельные психологические
характеристики вне связи с общей
структурой личности. Преморбид-ные
личностные особенности трудно было
отграничить от приобретенных под
влиянием болезни, и поэтому был сделан
переход от категории «личность» к
категории «поведение*, которая чаще
всего и используется в современных
исследованиях ишемической болезни
сердца и инфаркта миокарда.
Д. п. о. состоит из 61 вопроса.
Испытуемый должен выбрать один из
двух-пяти
предусмотренных вариантов
ответа, каждому из которых после
окончания работы с опросником присуждается
«вес» от 1 до 13 баллов, причем 1 балл
присуждается варианту ответа, наиболее
соответствующему поведению,
характерному для типа А. Если предлагаются
2 варианта ответа, один из них
оценивается 1 баллом (тип А), другой —
13 баллами (тип Б); в случае 3 вариантов —
промежуточный оценивается 7 баллами;
при 4.вариантах ответа баллы распределяются
следующим образом: 1, 5, 9, 13, а при 5 вариантах
— 1,4,7,10,13. Эта система оценки баллов
предложена А. Гринявичюс при адаптации
методики на русском
и литовском языках (А. Гоштаутас, В. Ядов,
Ю. Семенов, 1972-1976) при выполнении
международной Каунасско-Роттердамской
программы (обследовались 1450 мужчин
в возрасте от 40 до 59 лет).
Примеры вопросов и вариантов
ответов:
— Бывает ли, что Вы торопитесь
к месту назначения, хотя времени еще
вполне достаточно? а) часто; б) иногда;
в) редко или почти никогда.
— Бывает ли, что Вам трудно
выбрать «время, чтобы сходить в
парикмахерскую? а) никогда; б) иногда;
в) почти всегда.
— Согласились бы хорошо
знающие Вас люди с утверждением, что Вы
живете мирной и спокойной жизнью? а)
абсолютно да; б) возможно да; в)
возможно нет; г) абсолютно нет.
Диагностическое суждение о выраженности
особенностей типа А принимается на
основании итоговой балльной оценки.
Диагностируются: тип А, средний тип АБ
или тип Б.
Валидность Д.
п. о. устанавливалась путем сопоставления
результатов, полученных с его помощью,
и данных интервью. Диагностическое
решение совпадало
в 65-73% случаев. Валидность
текущая характеризуется
наличием связи между данными, полученными
с помощью опросника, и выраженностью
артериосклероза и повторными случаями
инфаркта миокарда.
ДИАГНОЗ ПСИХОЛОГИЧЕСКИЙ
(греч, Siayvcoct^
— распознание) — конечный результат
деятельности психолога, направленный
на выяснение сущности
индивидуально-психологических
особенностей личности с целью оценки
их актуального состояния, прогноза
дальнейшего развития и разработки
рекомендаций, определяемых задачей
психодиагностического
обследования.
Предмет Д. п. — установление
индивидуально-психологических
различий в норме и в патологии. Важнейшим
элементом Д. п. является выяснение в
каждом отдельном случае того, почему
данные проявления обнаруживаются в
поведении обследуемого, каковы их
причины и следствия. По мере обогащения
психологического знания «этиологический*
элемент в Д. п., вероятно, не будет иметь
столь существенного значения, как в
настоящее время, во всяком случае в
текущей, практической работе. Сегодня,
как правило, установив средствами
психодиагностики те или иные
индивидуально-психологические
особенности, исследователь лишен
возможности указать на их причины, место
в структуре личности.
Такой уровень диагностики
Л. С. Выготский назвал симптоматическим
(или эмпирическим). Этот диагноз
ограничивается констатацией
определенных особенностей или
симптомов, на основании которых
непосредственно строятся практические
выводы. Л. С. Выготский отмечает, что
данный диагноз не является собственно
научным, ибо установление симптомов
никогда автоматически не приводит
к диагнозу. Здесь работу психолога
86
вполне можно заменить
машинной обработкой данных.
Второй ступенью в развитии
Д. п. является этиологический диагноз,
учитывающий не только наличие
определенных особенностей (симптомов),
но и причины их возникновения.
Высший уровень — типологический
диагноз, заключающийся в определении
места и значения полученных данных в
целостной, динамической картине
личности. По словам Л. С. Выготского,
диагноз всегда должен иметь в виду
сложную структуру личности.
Диагноз неразрывно связан
с прогнозом. По Л. С. Выготскому,
содержание прогноза и диагноза совпадает,
но прогноз строится на умении настолько
понять «внутреннюю логику самодвижения
процесса развития, что на основе
прошлого и настоящего намечает путь
развития». Рекомендуется разбивать
прогноз на отдельные периоды и
прибегать к длительным повторным
наблюдениям. Развитие теории Д. п. в
настоящее время является одной из
наиболее важных задач психодиагностики.
ДИАГНОСТИЧЕСКИЙ ОБУЧАЮЩИЙ
ЭКСПЕРИМЕНТ —
экспериментальный прием оценки
интеллектуального развития или
отдельных компонентов умственной
активности с помощью выявления
потенциальных способностей испытуемого
к усвоению новых знаний, выработке
способов решения.
В Д. о. э. принцип обучающего
эксперимента приспособлен для решения
задач качественной и количественной
диагностики основных компонентов
обучаемости: активности в решении
интеллектуальных задач, восприимчивости
к помощи, способности к логическому
переносу и др. В качестве основных
критериев умственного развития в Д.
о. э. выступают не столько показатели
достигнутого уровня
сформированности тех или
иных свойств, способностей, умений (как
это чаще всего имеет место при
традиционной тестовой процедуре),
сколько результаты оценки возможностей
развития субъекта в ходе овладения
новым материалом в условиях специально
^организованного экспериментального
обучения. Другими словами, если
психометрические тесты
интеллекта анализируют
«срез» достигнутого уровня той или
иной интеллектуальной способности,
то диагностика с привлечением принципов
обучающего эксперимента выявляет
динамику решения той или иной новой
задачи в результате направленных
обучающих, тренирующих, развивающих
воздействий. Таким образом, если
традиционный тест имеет преимущества
в констатации имеющихся возможностей,
то метод Д. о. э. более адекватно решает
задачу прогноза развития способностей.
Одной из теоретических
основ применения обучающего
эксперимента для ди-агностики умственного
развития в отечественной психодиагностике
является концепция «зоны ближайшего
развития» Л. С. Выготского. В умственном
развитии ребенка Л. С. Выготский выделяет
два уровня: «актуальный» (или достигнутый
к настоящему моменту), и «потенциальный»,
связанный с «зоной ближайшего развития».
Последний определяется способностью
ребенка в сотрудничестве со взрослыми
усваивать новые способы действий,
поднимаясь тем самым на более высокую
ступень умственного развития. При этом
наличие более широкой «зоны ближайшего
развития» у конкретного ребенка
является более надежным (по сравнению
с актуальным запасом знаний и умений)
признаком успешности дальнейшего
обучения, чем и определяется диагностическая
значимость этого критерия при оценке
умственных возможностей с т. з.
перспективы развития. «Зона
ближайшего развития»
является важным показателем не только
перспектив развития ребенка под
воздействием обучения, но и имеет большое
дифференциально-диагностическое
значение с т. з. различения здорового
и умственно отсталого ребенка.
Оценка широты «зоны» в
экспериментальных условиях
осуществляется путем анализа выполнения
ребенком трудного для его возраста
задания с обязательным оказанием ему
помощи наводящими вопросами,
демонстрацией решения промежуточных
по сложности или аналогичных заданий
и т. д.
Важнейшим показателем
перспектив развития, согласно Л. С.
Выготскому, является исследование
способности ребенка к самостоятельному
решению задач, близких к тем, которые
он решал в сотрудничестве с
экспериментатором.
Проведение Д. о. э. предполагает
обеспечение определенных методических
условий исследования. Основное
экспериментальное задание должно
подбираться таким образом, чтобы оно
не являлось слишком трудным или, напротив,
слишком легким, а находилось в «зоне
трудности» для детей обследуемой
возрастной группы. Другим специфическим
условием является подбор дополнительного
(аналогичного по способу выполнения)
задания; предъявляемого после выполнения
основного. Оценка восприимчивости
к помощи как один из основных показателей
обучаемости в Д. о. э. предусматривает
также «дозирование» помощи при выполнении
задания, регламентацию способов ее
оказания.
Примером практической
реализации рассматриваемого приема
диагностики умственного развития детей
является методика Д. о. э., предложенная
А. Я. Ивановой в 1973 г. Методика
предназначена для оценки умственного
развития детей в возрасте 7-9 лет.
Стимульный материал
87
включает два набора по 24
карточки в каждом с изображениями
геометрических фигур, различающихся
по цвету, форме и величине. К первому
набору (основное задание) прилагается
доска-таблица с изображениями всех
фигур, имеющихся на карточках (рис. 23).
Рис. 23. Задание диагностического
обучающего эксперимента по А. Я. Ивановой
Выполнение основного задания
заключается в последовательном
вычленении ребенком каждого из трех
отличительных признаков и группировке
карточек на основании данного признака.
В ходе выполнения задания ребенку
оказывается дозированная помощь в виде
«уроков-подсказок»: I
«урок» — указание на различие каких-либо
двух конкретных карточек по одному
признаку (в соответствии с задачей
обучения); II
«урок» — демонстрация сходства одной
из карточек I
урока с третьей по этому же признаку;
Ш «урок» — объяснение принципа раскладки
карточек на группы и демонстрация
правильного выполнения задания.
Каждый последующий «урок»
(группировка карточек экспериментатором)
повторяется до тех пор, пока испытуемый
сам не справится с задачей классифика-
ции по требуемому признаку.
Способы
оказания помощи и формулировки
объяснения регламентированы.
Задание считается выполненным
в том случае, когда ребенок правильно
раскладывает карточки и дает словесный
ответ, называя признак, на основании
которого выполнялась очередная
группировка. Обследование занимает
примерно 10-15 мин.
Основными регистрируемыми
показателями являются способность
к логическому переносу (понимание и
способность объяснить принцип действия),
время выполнения заданий. Наиболее
ценными являются сведения,
характеризующие процесс умственной
деятельности ребенка, его работоспособность,
интерес, характер ошибок, эмоциональные
реакции, высказывания в ходе решения
задачи. Эти показатели анализируются
качественно. Наряду с этим методика
дает возможность получить определенные
количественные характеристики
обучаемости по числу «уроков», необходимых
для усвоения принципа решения и его
переноса на аналогичные задания.
Заключение по результатам исследования
базируется как на качественной оценке,
так и на приближенных нормах необходимой
помощи для детей исследуемых возрастных
групп.
Вместе с материалом,
основанным на классификации геометрических
фигур, существует вариант Д. о. э. с
использованием пробы Коса (см. Коса
кубики), классификации
карточек с предметными изображениями,
В целом для проведения Д. о. э. может быть
использован любой тестовый материал,
удовлетворяющий указанным выше
методическим особенностям (А. Я.
Иванова, 1976).
Д. о. э. как психодиагностический
инструмент получил широкое
распространение в дифференциальной
диагностике состояний умственной
отсталости, задержек психического
развития у детей.
Наряду с очевидными
преимуществами Д. о. э. по сравнению
с психометрическими тестовыми
методиками (теоретическая обоснованность
критериев диагностики, разнообразие
качественной диагностической
информации, раскрывающей процесс
интеллектуальной деятельности
испытуемого) необходимо указать и
некоторые недостатки этого диагностического
приема. Наиболее существенный из них —
ограниченная возможность количественной
интерпретации результатов, последующего
ранжирования, стандартизации и
статистической обработки полученных
данных. Это связано со сложностью
определения меры вмешательства
экспериментатора в выполнение заданий,
что, в свою очередь, приводит к сложности
квантификации при оценке получаемой
ребенком помощи и трудностям в
стандартизации процедуры исследования
(ом. Стандартизация).
Возникает также
сложность выбора оптимальной группы
заданий, находящихся в «зоне трудности»
для конкретного ребенка.
Это обстоятельство определяет
узкие возрастные границы применения
данной методики, приводит зачастую к
невозможности дифференцированной
оценки уровня обучаемости детей,
относительно легко справляющихся с
предлагаемыми заданиями. Усовершенствовать
Д. о. э. в этом направлении сможет
разработка своеобразной шкалы с наборами
заданий возрастающей сложности,
соотнесенными с различными возрастными
группами испытуемых. Таким образом,
открываются перспективы сочетания
обучающего эксперимента с традиционным
психометрическим подходом к диагностике
интеллектуального развития.
В этой связи представляет
интерес реализация принципа Д. о. э.
на материале уже известных психометрических
тестов. Этот подход не только повышает
точность измерений в виде «оценок
шкальных», но
и дает возможность применения
более разнообразных заданий с широким
диапазоном возрастной трудности,
валидность и
надежность которых
доказаны.
Важными направлениями
совершен-ствования методик Д. о. э.
являются разработка более точных
способов оказания дозированной помощи,
приближение их к реальным возможностям
обучающих воздействий, создание схем
более дифференцированной оценки
показателей обучаемости.
ДИНАМИЧЕСКИЙ ЛИЧНОСТНЫЙ
ОПРОСНИК (Dynamic
Personality
Inventory,
DPI)
— опросник
личностный. Предложен
Т. Грюгер и П. Грюгер в 1976 г.
В опросник включено 325
заданий, которые представляют собой
утверждения или отдельные слова.
Задача испытуемого — оценить их в
соответствии с критерием «нравится—не
нравится». Продолжительность обследования
— 45 мин.
Д. л. о. разрабатывался на
основе опросника личностных
предпочтений М. Кроута (Krout
Personal
Preference
Questionnaire,
1954), который предназначался для оценки
психосексуальных переменных, но оказался
невалидным. Оценивает личностные
особенности, выделенные на основании
психоаналитической теории.
Н. Лицемерие — удовлетворенность
собственными моральными стандартами,
недостаточная проницательность.
Wp.
Пассивность — стремление к комфорту,
теплоте и умеренным чувственным
ощущениям. Ws.
Изолированность и интроспекция как
защита от социальной тревожности.
О. Оральность — любовь к
пище, сладкому, жирной еде.
Оа. Оральная агрессия —
удовольствие от кусания, грызения,
любовь к горькой и сильной по вкусу еде;
возможно, свободно плавающая тревога.
Od,
Оральная зависимость, особенно от
родителей и лиц их замещающих.
От. Потребность в свободе
движения и эмоциональной независимости,
реактивное образование против
оральной зависимости.
Ov.
Вербальная агрессия.
Oi.
Импульсивность, спонтанность, реактивный
темп, переменчивость, эмоциональная
экспрессивность.
Ои. Нетрадиционность
мировоззрения.
Ah.
Накопительское поведение — тревожный
собственнический инстинкт, упрямая
настойчивость.
Ad.
Внимание к деталям — дисциплинированность,
добросовестность, пер-фекционизм.
Ас. Консерватизм — ригидность
и тенденция придерживаться
установленного порядка.
Аа. Покорность власти и
указаниям.
As.
Анальный садизм — особое внимание
уделяется сильной власти, жестоким
законам и дисциплине.
Ai.
Изолированность — сдержанность и
недоверие, социальные и расовые
предрассудки.
Р. Заинтересованность
объектами, имеющими фаллическое
символическое значение.
Рп. Нарциссизм — озабоченность
одеждой и внешним видом, чувственное
наслаждение предметами роскоши.
Ре. Эксгибиционизм —
сознательное наслаждение, получаемое
от внимания и восхищения.
Ра. Активный комплекс Икара
— стремление кдостижениям.
Ph.
Восхищение высотой, пространством
и расстоянием, стремления на уровне
фантазий.
Pf.
Увлечение огнем, ветром, штормом
и взрывами: живое воображение.
Pi.
«Подвиги Икара» — интерес к активному
исследованию, любовь к приключениям.
S.
Сексуальность — сознательное принятие
сексуальности. Ti.
Удовольствие от тактильных ощущений,
интерес к прикладным видам деятельности
и творческой работе с объектами.
Ci.
Творческие, интеллектуальные и
артистические интересы. М. Мужская
сексуальная идентификация, проявляющаяся
в интересах, отношениях и ролях.
F.
Женская сексуальная идентификация,
проявляющаяся в интересах, отношениях
и ролях.
MF.
Тенденция к поиску ролей, независимо
от их сексуальной принадлежности.
Sa.
Интерес к общественной деятельности.
С. Интерес к детям, потребность
проявлять свою любовь.
ЕР. Эго-защитное упорство
— склонность действовать с новой
силой (перед лицом трудностей). Ei.
Инициативность, уверенность в себе,
склонность к планированию, управлению
и организации, Надежность
частей теста, вычисленная
по методу Кьюдера—Ричардсона, в
среднем составляет 0,85.
Надежность ретестовая
составляет 0,50.
Авторами методики была
предпринята попытка определения
валидности критериальной,
однако что именно
оценивается с помощью данной методики,
однозначно не установлено.
Анализ валидности
конструктной методики
не производился.
Данных об использовании в
СНГ не имеется.
ДИСКРИМИНАТИВНОСТЬ
ЗАДАНИЙ ТЕСТА —
способность отдельных пунктов (заданий)
теста дифференцировать обследуемых
относительно «максимального» или
«минимального» результата теста.
Любой ответ испытуемого на
конкретное задание можно оценить по
двухбалльной шкале — «верно» (1 балл),
«неверно» (0 баллов). Сумма баллов по
всем пунктам представляет собой
первичную («сырую») оценку. Мера
соответствия успешности выполнения
одной задачи всему тесту является
показателем Д. з. т. для данной выборки
испытуемых и называется коэффициентом
дискриминации (индексом дискриминации).
где х —
среднее арифметическое всех индивидуальных
оценок по тесту; ~хп
— среднее арифметическое
оценок по тесту у испытуемых, правильно
выполнивших задание (в случае опросника
личностного —
соответствие с «ключом»);^
—среднеквадратическое отклонение
индивидуальных оценок по тесту для
выборки; Nn
~число испытуемых,
правильно решивших задачу (или тех, чей
ответ на данный пункт опросника
соответствует «ключу*); N — общее число
испытуемых.
Данное уравнение пригодно
для расчета коэффициента дискриминации
лишь в тех случаях, когда все испытуемые
дали ответы на все задания теста. При
наличии пропусков в ответах целесообразно
рассчитывать коэффициент дискриминации
следующим образом:
где xd
— среднее арифметическое
индивидуальных оценок испытуемых,
выполнивших задание; aXd
— среднеквадратическое
отклонение индивидуальных оценок
испытуемых, выполнивших задание; Nd
— общее число
испытуемых, выполнивших задание.
Коэффициент дискриминации
может принимать значения от -1 до +1.
Высокий положительный грЬ
свидетельствует об
эффективности деления испытуемых.
Высокое отрицательное значение грЬ
свидетельствует
о непригодности данной задачи для
теста, о ее несоответствии суммарному
результату.
Коэффициент Д. з. т. является,
по сути, показателем критериальной
валидности отдельного пункта,
поскольку определяется по отношению к
внешнему критерию — суммарному результату
или оценкам продуктивности реальной
деятельности испытуемых.
Индекс Д. з. т. вычисляется
с применением метода контрастных
групп (см. Ва-лидность
критериальная, Валидность текущая).
Необходимым условием
применения метода в этом случае
является наличие близкого к нормальному
распределения оценок по валидизации
критерию. Доля членов
контрастных групп может изменяться
в широких пределах в зависимости от
величины выборки. Чем больше выборка,
тем меньшей долей испытуемых можно
ограничиться при выделении групп с
высоким и низким результатами. Нижняя
граница «отсечения групп» составляет
10% от общего числа испытуемых в выборке,
верхняя — 33%. Десятипроцентные группы
берут редко, поскольку их малочисленность
снижает статистическую надежность
индексов дискриминации. Чаще из
выборки «извлекают» по 27 или 33%
испытуемых.
Индекс дискриминации
вычисляется как разность между долей
лиц, правильно решивших задачу, из
«высокопродуктив-
Наконец, можно воспользоваться
четырехпольным коэффициентом
корреляции:
где fg
— число лиц, правильно
решивших задачу, по отношению к общему
числу обследованных в группе с
максимальным результатом; fd
— число лиц, правильно
решивших задание в группе с минимальным
результатом; р —
общая пропорция правильно выполненных
заданий; q
— число лиц, давших
неверное решение (1 — р).
Критические значения этого
коэффициента, свидетельствующие о
диагностической ценности (на уровне
р < 0,05), в зависимости от числа
обследованных (п)
приведены ниже:
п 25
50 100 200 Гры
0.39 0,28 0,20 0,14
Максимальная точность
определения грм
Достигается в случае,
когда максимальная и минимальная
группы составляют по 27% выборки.
При анализе Д. з. т. особое
внимание следует уделить определению
статистической значимости
коэффициентов
корреляции. В тех случаях,
когда значение коэффициента
дискриминации приближается к нулю
и уровень значимости
невысок, проверяемый
пункт теста должен быть пересмотрен
в связи с некорректностью формулировки
задания или вариантов ответа на него.
ДИСКРИМИНАЦИИ ФОРМ ТЕСТ
—
тест специальных
способностей. Предназначен
для оценки дискриминативной перцепции
геометрических образов, качеств
внимания. Относится к невербальным
тестам. Разработан Й. Шванцарой в 1956 г/В
значительной степени продолжает
линию ранних функциональных проб (см.
Корректурная проба).
Материал теста состоит из
1250 геометрических фигур, размещенных
на листе белой бумаги формата А4 по
50 в строке. Типов фигур пять, однако
размещены они по-разному (развернуты в
стороны, вверх или вниз) в случайном
порядке (рис. 24). Задача испытуемого —
отыскивать и вычеркивать указанную
экспериментатором фигуру. Перед
началом обследования проводится
тренировка. По указанию экспериментатора
испытуемый отмечает место на бланке,
соответствующее количеству проделанной
за истекшее время работы.
Автор рекомендует Д. ф. т.
для обследования лиц в возрасте 9-18
лет. При оценивании фиксируется: время
выполнения всего задания; количество
пропущенных знаков; количество
неправильных зачеркиваний; количество
исправлений. Полученные данные
(раздельно по скорости и точности
решения) переводятся в шкалу стэнов
(см. Оценки шкальные).
Наряду с возрастной
дифференциацией, введены раздельные
нормы для мальчиков и девочек.
Надежность Д. ф. т.
устанавливалась методом ретеста на
трех различных по
Рис. 24. Образцы геометрических
фигур теста дискриминации форм
возрасту и полу выборках.
Благодаря выраженному воздействию
эффекта обучения, при повторном
обследовании коэффициенты надежности
оказались
малоудовлетворительными (0,402-0,693).
Коэффициенты корреляции между
параметрами теста (скоростью и
точностью) и успеваемостью в школе не
достигают уровня статистической
значимости. При сопоставлении Д. ф. т.
со Станфорд— Вине
шкалой умственного развития оказалось,
что параметр скорости не имеет связи
с интеллектуальными показателями;
обнаруживается связь на уровне г~
0,43-0,40 с критерием
точности выполнения теста. Методика
допускает как групповое, так и
индивидуальное обследование.
Д. ф. т. рекомендуется в
исследованиях профессиональной
пригодности, для оценки переносимости
монотонной деятельности, в
психофармакологических исследованиях,
консультативной и
клинической практике, при
нарушениях внимания и др. (В. Черны, Т.
Колларик, 1988).
Данные об использовании в
СНГ отсутствуют.
ДИСПЕРСИОННЫЙ АНАЛИЗ —
ана
литико-статистический метод
изучения влияния отдельных переменных,
а также их сочетаний на изменчивость
изучаемого признака.
Метод основан на разложении
общей дисперсии на составляющие
компоненты, сравнивая которые можно
определить долю общей вариации
изучаемого (результирующего) признака,
обусловленную действием на него как
регулируемых, так и неучтенных в опыте
факторов. По характеру решаемых задач
к Д. а. наиболее близок регрессионный
анализ.
При осуществлении Д. а.
результаты наблюдений группируются с
учетом градаций каждого учитываемого
фактора (возраста, уровня образования,
отдельных психологических особенностей
и т. д.). Если учитываемый фактор оказывает
влияние на признак, средние
результирующего признака изменяются
в соответствии с градациями фактора.
Внутри каждой такой группы обнаруживается
своя дисперсия, связанная с действиями
других факторов. Суммарная дисперсия
может быть выражена уравнением
где Dy
— сумма квадратов
отклонении отдельных вариант (jc(-)
всего комплекса
наблюдений от общей средней (х),
или Z(xi~
х)2,
Dx—
сумма квадратов
отклонений в комплексах (группах)
частного среднего (xt)
от общей средней,
умноженная на число вариант в группах,
или л£( х{
— х)2,
Ог
— сумма из сумм
квадратов отклонений отдельных
вариант от их групповых средних, или
Tl[T.(xi‘~xi)
—
Путем соотнесения сумм
квадратов отклонений к числу степеней
свободы (df)
получают выборочные
дисперсии:
а) общую по комплексу
52
Отношение -j|
служит критерием
оценки влияния на признак
регулируемых в опыте факторов (F-критерий
Фишера). Дальнейший анализ проводится
путем проверки нуль-гипотезы, сводящейся
к предположению о равенстве межгрупповых
средних и дисперсий {т. е. никакого
систематического действия факторов на
результативный признак нет, наблюдаемые
различия в групповых средних случайны).
Нулевая гипотеза отвергается при F
£ FKp,
значение FKp
определяется по статистическим таблицам
с учетом принятого уровня
значимости и числа
степеней свободы (dfx
и dfz).
После доказательства
действия регулируемого фактора на
результирующий признак переходят, если
необходимо, к сравнению групповых
средних друг с другом или другими
показателями. Заключительный этап
Д. а. — оценка силы влияния отдельных
факторов (или их групп) на результирующий
признак.
Таким образом, Д. а. позволяет
учитывать не только влияние каждого
фактора на результирующий признак
по отдельности, но и совместное
действие факторов
во всех возможных сочетаниях.
Действие неучтенных факторов оценивается
не дифференцированно, а суммарно.
Д. а. допускает статистическое
исследование признаков, выраженных
не только в абсолютных количественных
единицах, но и в относительных или
условных баллах и индексах.
ДИСТРАКТОРЫ (от
англ. distract
— отвлечение внимания) — варианты
ответов в заданиях с выбором (см. Задачи
закрытого типа), не
являющиеся правильными решениями,
но внешне близкие к правильному
решению.
В качестве примера Д. можно
привести задания следующего типа: —
Телевизор так относится к микроскопу,
как телефон к… В этом задании необходимо
выбрать правильный вариант окончания
суждения из следующих: а) усилителю; б)
микропроцессору; в) осциллографу; г)
микрофону; д) громкоговорителю. Для
правильного решения испытуемый
должен понять, что содержанием аналогии
является применение устройства для
усиления сигнала. Следовательно,
правильным решением будет «а». Как
видно, Д. подобраны с подвохом, все они
связаны с техническим оборудованием,
и испытуемый, обнаруживший неверную
связь, выберет, вероятно, микрофон.
Если в приведенном задании использовалось
бы другое вменю» ответов (например,
а) усилителю, б) отвертке, в) паяльнику,
г) микросхеме, д) диоду), то такие
ответы не являлись бы Д. в строгом
понимании, т. к. они подсказывают
испытуемому верное решение.
Подбор адекватных Д. является
неотъемлемой частью процедуры
разработки надежного и валидного теста,
составленного на материале заданий
с выбором. Д., как правило, выявляются
эмпирически. Так, может быть проведено
исследование в специально подобранной
выборке испы-
туемых. При этом используются
задания, основанные на формулировках
будущего теста, однако предъявляемые
в виде заданий
открытого типа. Полученные
таким образом варианты неправильных
решений могут быть использованы в
качестве Д.
После подбора Д. необходимо
провести дополнительную проверку
адекватности разработанного «меню».
При этом обращается внимание на
действенность Д. При использовании Д.;
слишком близких к правильным ответам,
надежность и
валидность теста
может быть существенно снижена. Д.
становится практически неотличимым от
правильного решения. Напр.: — Расстояние
от Киева до Житомира
составляет: а) 140 км, б)
137 км,
в) 135 км, г) 830 км, д) 1020 км.
Использование неадекватных
Д/ искусственно ухудшает результаты
тестирования, т. к. испытуемые будут
введены в заблуждение. При этом в
наибольшей степени пострадает
наиболее «сильная» по исследуемым
показателям часть испытуемых.
Анализ адекватности Д.
должен быть дополнен исследованием
дискримина-тивности
заданий теста и
трудности заданий
теста.
ДИФФЕРЕНЦИАЛЬНО-ДИАГНОСТИЧЕСКАЯ
МЕТОДИКА (The
Differential
Diagnostic
Technique,
DDT)
— проективная
методика исследования
личности. Рассматривается как
визуально-моторный проективный тест.
Предложена О. Вейнингером в 1986 г.
Задача испытуемого —
последовательное копирование 14
фигур, которые ему предъявляют на
стимульных картах. Визуальная запись
того, как испытуемый копирует
стимульные фигуры, и оценивание его
рисунков безотносительно к тому, как
он реально вел себя во время тестирова-
ния, репрезентирует, по
мнению автора, тип организации «эго» и
уровни его функционирования.
Интерпретация основывается на
выявлении способа, каким испытуемый
контролирует свои действия по отношению
к стимульным картам.
Автор приводит данные о
достаточно высокой надежности
и валидности
Д.-д. м. Существуют
варианты для взрослых и детей.
Сообщается, что результаты последних
исследований (1989) позволяют сделать
вывод о раскрытии с помощью этой методики
связи между силой «эго» и некоторыми
личностными характеристиками, что
важно для лечения беспокойных
подростков, развития зрелой ответственности
и гармонизации личности ребенка, для
развития у детей эмпатичес-кого поведения.
Сведений об использовании
в СНГ нет.
«ДОМ—ДЕРЕВО—ЧЕЛОВЕК»
ТЕСТ
(House—Tree—Person
Test,
H—T—P)
— проективная методика
исследования личности.
Предложена Дж. Буком в 1948 г. Тест
предназначен для обследования как
взрослых, так и детей, возможно групповое
обследование.
Обследуемому предлагают
нарисовать дом, дерево и человека. Затем
проводят детально разработанный опрос.
Выбор предметов для рисования автор
обосновывает тем, что они знакомы
каждому обследуемому, наиболее удобны
как объекты для рисования и, наконец,
стимулируют более свободные словесные
высказывания, нежели другие объекты.
По мнению Дж. Бука, каждый
рисунок — это своеобразный автопортрет,
детали которого имеют личностное
значение.
По рисунку можно судить об
аффективной сфере личности, ее
потребностях, уровне психосексуального
развития и т. д. Помимо использования
«Д.—д.—ч.» т. в качестве проективной
методики автор де-
монстрирует возможность
теста определять уровень интеллектуального
развития (коэффициент корреляции
ранговой с тестами
интеллекта составляет
0,41 — .0,75). Это согласуется с давними
традициями диагностики уровня
интеллекта с помощью рисунка (см. Гудинаф
«Нарисуй человека» тест). Зарубежные
исследователи заявляют о необходимости
дополнительного изучения валидности
«д.—д.—ч.»т.
как инструмента измерения интеллекта
и личностных особенностей. Широкого
распространения в психодиагностических
исследованиях «д.—д.—ч.» т. не получил.
Тест используется в СНГ,
включен в методику Керна—Йирасека
(Рабочая…, 1991).
ДОМИНО-ТЕСТ (D-48)
— тест интеллекта,
создан А. Энстеем в
1943 г. и предназначен для измерения
невербальных интеллектуальных
способностей у лиц старше 12 лет.
Д.-т. состоит из 44 основных
заданий и 4 примеров. Задания расположены
в порядке возрастающей трудности,
установленной при конструировании
методики (см. Трудность
заданий теста). Основным
элементом всех тестовых заданий является
изображение фишек домино, расположенных
в соответствии с различными
закономерностями (рис. 25, 26). Одна из
фишек (последняя в ряду) «пустая» и
обозначается пунктирным контуром.
Количество фишек в заданиях различно
(от 4 до 14) и возрастает по мере перехода
от задания к заданию. Испытуемый должен
выявить принцип, согласно которому
выстроены фишки, и определить ту
фишку, которую следует поставить на
место, обозначенное пунктиром.
Несмотря на то что во всех заданиях
используется один и тот же стимульный
материал, принципы решения весьма
разнообразны. Выполнение
Д.-т. не требует математических
знаний или арифметических способностей,
хотя испытуемый и работает с числами.
Первые четыре задания используются
как тренировочные. Перед началом работы
испытуемого ставят в известность о
временной регламентации работы.
Общее время выполнения теста — 25 мин.
За десять минут до окончания работы
испытуемого предупреждают об
оставшемся в его распоряжении времени.
Каждый правильный ответ оценивается
в 1 балл. Максимальная оценка — 44
балла. Оценки первичные
переводятся в процентили
или /(р-показатели (см. Оценки
шкальные).
Рис.25. Задания №39, 40 основного
набора Домино-теста А. Энстен
Исследования показывают,
что этот тест практический
высоко насыщен фактором
G
и считается одним из
наиболее «чистых» по отношению к из-
Рис. 26. Образцы заданий
Домино-теста А. Энстея
мерению этого фактора.
Результаты факторного
анализа указывают на
то, что показатели D-48
преимущественно связаны со способностями
текучими. Знания
и опыт, приобретенные индивидом, или
способности
кристаллизованные, влияют
на результаты в меньшей степени (В,
Миглиерини, 1982). Методика обладает
всеми преимуществами невербальных
тестов (см. Равена
прогрессивные матрицы).
Д.-т. отличается высокой
надежностью. Так,
коэффициент надежности
частей теста, полученный
методом расщепления на две части,
составил в различных выборках г
= 0,781-0,818. Коэффициент
надежности, рассчитанный по формуле
Кью дер а—Ричардсона, г = 0,771-0,867.
Коэффициент надежности
ретестовой г(
= 0,758′. Дискримина-тивность
заданий теста при
сопоставлении 27% выборок испытуемых
с низкими и высокими результатами
составила rph.
= 0,74. Индекс внутренней
согласованности г=0,36.
Получены данные о валидности
конструктной на
основании сопоставления D-48
с наиболее распространенными
невербальными тестами общих способностей
(г = 0,68-0,80), высока связь результатов
D-48
и с батареями
тестовыми, ориентированными
на измерение общих факторов интеллекта
(В. Миглиерини, 1982). При анализе валидности
критериальной путем
сопос-
тавления результатов теста
с критериями успеваемости школьников
коэффициенты валидности в разных
выборках распределялись в пределах
г = 0,31-0,80.
Нормы, определенные для
французской и чешской выборок,
оказались очень близкими, что
свидетельствует об относительной
устойчивости D-48
к межэтническим факторам. Также не
было статистически значимых различий
в выполнении теста мужчинами и
женщинами (В. Черны, Т.Колларик, 1988). В
первые годы после разработки тест
использовался только в армии, позднее
стал применяться и для гражданского
населения, были существенно расширены
возрастные границы применения. Сегодня
Д.-т. применяется в области
профессионального консультирования,
школьной психодиагностики. Эффективно
объединение D-48
в батарее с тестами
вербальными. В
отечественной практике D-48
нашел применение в клинической
психодиагностике (В. М. Блейхер, И.В.Крук,
1986).
ДОСТОВЕРНОСТЬ РАЗЛИЧИЯ
(сходства) —
аналитико-статистическая процедура
установления уровня
значимости различий
или сходств между выборками по изучаемым
показателям (переменным). Анализ Д. р.
имеет практическое значение при
оценке статистической значимости
разности выборочных средних величин
в сопоставляемых распределениях.
Этот случай весьма
распространен в эмпирических исследованиях.
Предположим, перед психодиагностическим
исследованием стоит задача проверки
валидно-сти текущей
(диагностической)
разрабатываемого теста методом
контрастных групп. Если проверяемая
методика является, к примеру, тестом
общих способностей, валидизация
может базироваться, в частности, на
оценке степени устойчийо-сти различий
в тестовых оценках у детей со слабой и
хорошей школьной успеваемостью.
После проведения тестирования той и
другой группы необходимо получить
подтверждение истинности (а не
случайности, напр, за счет ошибки
измерений) выявленных
различий в средних оценках по тесту в
сравниваемых выборках.
При проверке нулевой гипотезы
о случайности (неслучайности)сходства(различия),
в сущности, используется оценка
вероятности совместного перекрытия
(или не перекрытия) доверительных
интервалов, в которые с определенной,
наперед заданной вероятностью могут
попадать переменные в сопоставляемых
выборках.
При оценке статистической
значимости разности выборочных
средних арифметических двух
распределений первичных величин
применяется (-критерий Стью-дента,
эмпирическое значение которого
вычисляется в этом случае по формуле:
Разность средних считается
статистически значимой, если t
> tKp
для доверительной
вероятности а = 0,05 (см. Уровень
значимости). Нулевая
гипотеза о сходстве принимается при t
й /кр
(ее = 0,05) и отклоняется при t
> / (а = 0,01). Критическое
значение критерия Стьюдента (*кр)
для каждой выборки определяется по
таблицам (см. Приложение
III,
табл. 2) с учетом ее
объема и числа степеней свободы (п1).
Значения /кр
в таблице представлены для трех порогов
доверительной вероятности (‘а = 0,05;
0,01; 0,001).
Предположим, в сопоставляемых
контрастных группах учащихся получены
следующие данные: Мх
= 108,1; тх
= 10,44; Л12=89,2;
т2-9,07;
число обследованных
в первой выборке 106, во второй — 94 (л’ =
106 + 94 — 2 = 198). Эмпирическое значение
/-критерия
Критическое значение по
таблице — 1,97 (для а = 0,05); при / < tKp,
гипотеза о различии
результатов в сравниваемых группах
отвергается.
Приведенный критерий
используется и для оценки долей выборки
(в тех случаях, когда доли находятся
в пределах 0,2 < Р <
0,8); /-критерий для этого случая
принимает вид:
определяют с учетом числа
объектов (А) с
измеряемым признаком и объема выборки
(п):
Дальнейшая процедура
аналогична приведенному выше случаю
со средними значениями выборок.
ДЮССА (ДЕСПЕРТ) СКАЗКИ
(Duss
(Despert)
Fables)
— проективная методика
исследования личности,
входящая в группу «истории
завершение» методик. Предложена
Л. Дюссом в 1940 г. Также известна как
«Десперт сказки» — по имени
исследователя, которая перевела методику
на англ. язык. Д. (Д.) с. использует-
ся для обследования детей
в возрасте от 6 до 11 лет.
Детям предлагают послушать
10 коротких повествований и ответить
на вопросы. Каждый из сюжетов
затрагивает те или иные области из
эмоциональных конфликтов. Напр.:
«Птицы-родители и маленький птенец
спят в гнезде, находящемся на ветке
дерева. Внезапный порыв ветра сбрасывает
гнездо на землю. Проснувшиеся
птицы-родители взлетают и садятся
на разные деревья. Что будет делать
маленький птенец, который уже научился
немного летать?» (Тема страха перед
возможностью разлуки с родителями.)
Интерпретация полученных данных
осуществляется с психоаналитических
позиций, направлена на поиск комплексов
«отлучения от груди», «страха перед
кастрацией» и т. п. Данные о валидности
и надежности
спорны.
Сведений об использовании
в СНГ нет.
ж
ЖИВОТНОГО ПРЕДПОЧИТАЕМОГО
ТЕСТ (The
Animal
Preference
Test,
APT)
— проективная
методика исследования
личности детей и подростков. Впервые
описан как «тест выражения желания»
испанским психиатром Хосе Пиге-мом в
1945 г., наиболее полное описание издано
в 1949 г. Состоит из двух вопросов: «Кем
бы ты хотел быть, если бы не мог быть
человеком?» и «Кем бы ты больше всего
не хотел быть?» Требовалось дать по 3
ответа на каждый вопрос. Затем ребенка
спрашивали о причине выбора.
Пигем основывался на том,
что люди в нашем восприятии часто могут
отличаться определенным сходством
с какими-нибудь животными. Еще
Аристотель в «Физиогномике» наделял
животных особыми качествами, что
способствовало инверсии — описанию
людей путем сравнения их с животными
по чертам характера, особенностям
внешности или поведения. Многие авторы
указывают на легкость, с которой дети
используют животных в качестве
объекта проекции (см. Детской
апперцепции тест).
Д. Ван Кревелен, опираясь
на предшествующие варианты Ж. п. т.,
модифициро-
вал его и предложил собственную
версию в 1953 г. (окончательную — в 1956 г.).
Используется игровая форма вопросов,
что стимулирует воображение ребенка.
Например; «Представь себе, что в эту
комнату входит фея, которая хочет
превратить тебя в какое-нибудь
животное. Она дает тебе право самому
определить, в какое именно. Скажи,
что бы ты выбрал? Кем бы ты хотел быть?»
При интерпретации важно
различать объективную и субъективную
символи-. зацию, общепринятые и
индивидуальные символы. Современные
исследования с использованием Ж. п. т.
характеризуются стандартизацией
процедуры обследования,
изучением валидности
конст-руктной и
выделением диагностических показателей.
Так, в исследовании Е. Ро-хае и С.Хубера
(1991) каждому ребенку задают два вопроса:
1) «Если бы ты больше не мог быть человеком,
каким животным ты хотел бы быть?» и 2)
«Если бы тебе пришлось быть животным,
каким животным ты никогда не хотел бы
быть?» Необходимо дать по три варианта
ответа на каждый вопрос. После этого
ребенка спрашивают, почему он вы-
брал именно этих животных.
Причины выбора животных относятся к
одной из четырех категорий, выявленных
в специальном исследовании:
1. Агрессивный выбор (если
животное выбрано noTQMy,
что оно нападает, бьет, кусает, дерется,
является свирепым, воинственным,
недружелюбным).
2. Автономный выбор (если
животное выбрано потому, что оно
свободное, независимое, крупное,
физически сильное, мускулистое или,
как кажется ребенку, обладает
решительностью или уверенностью в
себе).
3. «Выбор помощи» (если
животное выбрано потому, что оно
может дать приют, защиту, любовь,
благосостояние, пищу, поддержку).
4. Эстетический выбор (если
животное выбирается из-за его красоты,
изящества, грациозности, доставляемого
им эстетического удовольствия). Показано,
что негативный выбор является лучшим
индикатором психологических
особенностей детей сравнительно с
позитивным, т. к. позволяет выявлять
более индивидуальные, интимные параметры,
в то время как позитивный выбор выявляет
стереотипные, общепринятые паттерны
поведения. Оказалось, что дети, отвергающие
животных по эстетическим причинам,
из-за их внешнего вида или пищевых
привычек, были более агрессивными и
более склонными к депрессии, чем
отвергавшие животных из-за их агрессивности
или автономности (по мнению автора
— вследствие дезадаптивнос-ти защитного
механизма, каковой является отвержение
эмоциональной поддержки, отражающееся
в негативных выборах детей).
Проводилось исследование
валидности
конструктной Ж. п. т.
Данные, полученные с его помощью,
сопоставлялись
с результатами исследования
по шкале детского поведения Т. Ахенбаха
(Child
Behavior
Cheeklist,
CBCL)
40 детей 6-12 лет,
находившихся на лечении в психиатрической
клинике. Результаты свидетельствуют
о достаточно высокой валидности Ж.
п. т.
Сведений об использовании
в СНГ нет.
ЖИЗНЕННОГО СТИЛЯ ИНДЕКС
(Life
Style
Index,
LSI)
— опросник
личностный. Предназначен
для диагностики механизмов защиты «Я»,
Предложен Р. Плучеком, Г. Келлерманом и
Г. Конте в 1979 г.
Ж. с. и. состоит из 97 утверждений,
требующих ответа по типу «верно—неверно».
Измеряются 8 видов защитных механизмов:
вытеснение, отрицание, замещение,
компенсация, реактивное образование,
проекция, интеллектуализация
(рационализация) и регрессия. Каждому
из этих защитных механизмов соответствуют
от 10 до 14 утверждений, описывающих
личностные реакции индивидуума,
возникающие в различных ситуациях,
напр.: «Если я сержусь на своего товарищи,
то, вероятно, сорву злобу на ком-нибудь
другом» (замещение). Сырые оценки
переводятся в процентили (см. Оценки
шкальные), строится
профиль защитной структуры обследуемого.
По мнению авторов, использование
защитных механизмов, хотя они и
относятся к области бессознательного,
не обязательно остается вне сознания
человека, что и дает возможность их
диагностики с помощью опросника. В
основе Ж. с. и. лежит теория, устанавливающая
взаимосвязь защитных механизмов с
различными аффективными состояниями
и клинико-диагностическими критериями.
Создана модель, включающая 4 пары
биполярных эмоций: страх—гнев,
веселость—пе-
чаль, принятие—отвращение,
надежда— удивление, которые, как
предполагается, связаны с отдельными
защитными механизмами, зависящими,
в свою очередь, от некоторых личностных
черт. Последние, при известной степени
их выраженности, признаются авторами
как важнейшие образующие соответствующих
личностных расстройств, описание которых
заимствовано из DSM-И
(Diagnostic
and
Statistical
Manual
of
Mental
Disorders.
Washington,
1968). В табл. 5 показана взаимосвязь
«черта—расстройство—механизм
защиты».
Таблица 5
Предполагаемая взаимосвязь
личностных черт, расстройств личности
и механизмов защиты «Яо
(по Р. Плучеку с соавт., 1979)
Личностные |
Расстройства |
Механизмы |
черты |
личности |
защиты |
Робкий |
Пассивно-аг- |
Вытеснение |
рессивный |
||
пассивный |
||
Агрессивный |
Пассивно-аг- |
Замещение |
рессивный |
||
рессивный |
||
Общительный |
Маниакальный |
Реактивное |
ТИП |
разование |
|
Унылый |
Депрессивный |
Компенсация |
тип |
||
Доверяющий |
Истероидный |
Отрицание |
тип |
||
Подозритель- |
Параноидный |
Проекция |
ный |
тип |
|
Контролиру- |
Обсессивно- |
Интеллектуа- |
ющий |
компульсив- |
лизация |
ный |
||
Бесконтроль- |
Психопатичес- |
Регрессия |
ный |
кий |
Модель предполагает
существование весьма ограниченного
количества защитных механизмов, а
их многочисленные классификации —
разные названия одних и тех же механизмов
или их комбинаций. Напр., изоляция,
рационализация и уничтожение
содеянного — вариации рационализации,
составляющие обсессивный защитный
синдром. Также допускается полярность
некоторых защитных меха-
низмов (напр., регрессия—замещение,
отрицание—проекция).
Авторами представлены
сведения о достаточно высокой валидности
и надежности
опросника, стандартизация
проводилась на
различных клинических группах. Имеется
русскоязычный вариант методики (У. Б.
Клубова, 1991), собраны нормативные данные.
ЖИЛЯ ТЕСТ-ФИЛЬМ (Le
Test-Film)
— проективная методика
исследования личности.
Опубликована Р. Жилем в 1959 г. и предназначена
для обследования детей.
Стим*ульный материал Ж.
т.-ф. состоит из 69 стандартных картинок,
на которых изображены дети, дети и
взрослые, а также тестовые задания,
направленные на выявление особенностей
поведения в разнообразных жизненных
ситуациях, актуальных для ребенка и
затрагивающих его отношения с другими
людьми. Напр., на картинке нарисована
семья, расположившаяся вокруг стола
(рис. 27). Ребенку нужно выбрать себе
место за столом.
Рис. 27. Образец рисунков
Жиля тест-фильма
В тестовых заданиях
предлагаются на выбор типичные формы
поведения в некоторых ситуациях.
Напр.:
— С кем ты любишь играть? С
детьми твоего возраста, младше тебя,
старше тебя?
Завершается обследование
опросом, в процессе которого уточняются
интересующие психолога данные. Ж.
т.-ф. дает возможность описать систему
личностных отношений ребенка,
складывающуюся из двух групп переменных:
1. Показатели, характеризующие
конкретно-личностные отношения
ребенка с другими людьми: 1) матерью; 2)
отцом; 3) обоими родителями; 4) братьями
и сестрами; 5) бабушкой и дедушкой; 6)
другом (подругой); 7) учителем (воспитателем
или другим авторитетным для ребенка
взрослым).
2. Показатели, характеризующие
особенности самого ребенка: I)
любознательность; 2) стремление к
доминированию в
группе; 3) стремление к
общению с другими детьми в больших
группах; 4) отгороженность от других,
стремление к уединению; 5) социальная
адекватность поведения. Помимо
качественной оценки результатов все
показатели получают свое количественное
выражение. Несмотря на то что необходима
дальнейшая работа по изучению валидности
и надежности
Ж. т.-ф., проведенные
исследования свидетельствуют о
значительной диагностической ценности
данных, получаемых с помощью теста.
Предпринимались попытки
русскоязычной адаптации Ж. т.-ф.
Изучение структуры конкретно-личностных
отношений здоровых детей и
детей-эпилептиков подтвердило
валидность текущую
теста (И. Н. Гильяшева,
Н. Д. Игнатьев, 1978).
3
«ЗАВЕРШЕНИЕ ПРЕДЛОЖЕНИЯ»
МЕТОДИКИ (Sentence-Completion
Techniques)
— группа проективных
методик исследования
личности. «3. п.» м. представляют собой
развитие ассоциации
словесной теста. В
качестве инструмента для измерения
лингвистических способностей имеют
давнюю историю в психологических
исследованиях. Впервые для изучения
личности «3. п.» м. были применены А.
Пейном (1928), а затем А. Тендлером (1930).
Обследуемому предлагается серия
незаконченных предложений, состоящих
из одного или нескольких слов, с тем
чтобы он их завершил по своему
усмотрению, напр.:
— Будущее кажется мне…
— Думаю, что настоящий
друг…
— Женщины…
Предложения формулируются
таким образом, чтобы стимулировать
обследуемого на ответы, относящиеся
к изучаемым свойствам личности.
Обработка полученных данных может
быть как качественной, так и
количественной.
Существует значительное
количество методик, основанных на
принципе вербального завершения.
Одни предназначены для выявления
мотивов, потребностей.
другие — чувств обследуемого,
его отношения к семье, половой жизни,
вышестоящим по работе и т. д. Наиболее
известны «3. п.» м.,
разработанные Дж. Ротте-ром (1950), Д. Саксом
(1950), Б. Форером (1950), А. Роде (1957). Принцип
вербального завершения используется
также в «истории
завершение» методиках.
Достоинствами «3. п.» м.
являются их гибкость, возможность
приспособления к разнообразным
исследовательским задачам. По оценке
зарубежных специалистов, валидностъ
и надежность
этих методик
достаточно высоки (Р. Ватсон, 1978).
Допускается групповое обследование.
В нашей стране разные виды
«3. п>м. используются преимущественно
в клинико-диагностических исследованиях
(Г. Г. Румянцев, 1969 и др.).
«ЗАДАНИЕ—ОТВЕТ» ЗАВИСИМОСТЬ
— комплексный критерий,
используемый при психометрическом
анализе и конструировании тестов,
учитывает вероятность правильного
ответа на отдельное задание у
испытуемых с разными суммарными
показателями по изучаемому тестом
качеству. Критерий описывает
Рис. 28. Кривые «задание—ответ»
зависимости
вероятность ответа на
дихотомические задания (см. Задачи
закрытого типа).
На рис. 28 приведены некоторые
гипотетические кривые «3.—о»,
з. для двух заданий
(кривые 1 и 2). Предположим, измеряемым
параметром является интеллект.
Испытуемые распределяются по непрерывной
(континуальной) шкале от самого
низкого до самого высокого показателя.
Пусть «а», «б», «в» —
три точки на шкале показателя интеллекта.
Для испытуемых в точке ta»
вероятность правильного
ответа (Р) на задание 2 составляет Р
= 0,3, для задания 1 — Р
= 0,05. В точке «е» эти
вероятности составляют соответственно
Р =
0,55 и Р = 0,8.
Для каждого задания, составляющего
тест, может быть рассчитана своя кривая.
К основным характеристикам, которые
она отражает, относятся:
1.
Трудность задания.
Выражается
в том, насколько далеко
вправо или влево смещена кривая, и
определяется проекцией точки на оси
измеряемого свойства, которая пересекает
значение вероятности Р=0,5 (как видно,
задания 1 и 2 на рис. 28 имеют примерно
одинаковую трудность). При смещении
проекции вправо трудность уменьшается,
влево — увеличивается.
2. Дискриминативность
задания. Выражается
крутизной кривой. Чем больше крутизна,
тем более точно данное задание
выделяет по исследуемой черте среди
испытуемых тех, кто попадает в интервал,
соответствующий значению вероятности
Р = 0,5.
При помощи «3.—о», з. можно
примерно оценить показатели испытуемых
для заданий в тех частях теста, которые
ими че выполнялись, исходя
из того, что расположение этих заданий
(их кривых) относительно континуума
измеряемой черты известно. Это означает,
что результаты испытуемых в
подмножествах заданий позволяют
делать приблизительные оценки для всего
теста, а также что с помощью сопоставления
кривых в тесте могут быть выделены
эквивалентные подмножества заданий
(см. Параллельные формы
теста). Последнее
свойство особенно важно для
конструирования сопоставимых
вариантов тестов. Индекс трудности,
рассчитываемый на основе модели «3.—о»,
з., является более точным и стабильным,
чем уровень трудности, определяемый
в традиционной модели (относительно
количества или доли испытуемых, давших
правильный ответ), поскольку он не
зависит от выборки испытуемых (см.
Трудность заданий
теста). Рассматриваемая
модель наиболее удобна для определения
даскриминативности
заданий теста. Способ
оценок «3.—о», з. особенно важен для
конструирования тестов
объективных, а также
тестов
индивидуально-ориентированных. Описание
статистических моделей «3.—о»,
з. лежит в основе
разработки особой модели психологического
тестирования (см. Раша
модель).
ЗАДАЧИ ЗАКРЫТОГО ТИПА —
тип
задач тестовых,
предусматривающих
различные варианты ответа на поставленный
вопрос, задание. Из набора предлагаемых
вариантов испытуемый выбирает один или
несколько правильных, по его мнению,
ответов.
В 3. з. т. выделяют следующие
виды задач.
Альтернативные задачи,
предусматривающие
наличие двух вариантов ответа (типа
«да»—«нет», «верно»—«неверно» и т.
д.). Являются одними из наиболее
распространенных в опросниках
личнос-
тных (см.
Миннесотский
многоаспектный личностный опросник,
Айзенка личностные опросники и
др.). Достоинствами этого вида заданий
являются простота процедуры регистрации
и обработки данных, максимальная
формализация оценки, что особенно важно
при массовых обследованиях. Вместе с
тем такая альтернативная форма ответа
нередко приводит к потере промежуточных
значений, «огрублению» получаемой
информации. Необходимость принимать
категорические решения нередко
вызывает затруднения у испытуемых.
К тому же ряд задач (особенно имеющих
сложную формулировку) не допускают
альтернативного построения ответа.
Использование альтернативных
задач связано с повышенным риском
возникновения ошибочных ответов и
воздействия различных факторов, мешающих
проведению обследования. В первую
очередь необходимо отметить высокую
вероятность случайных ответов. Это
снижает надежность
методики и требует,
как правило, увеличения количества
дублирующих и уточняющих пунктов теста.
У испытуемого при обследовании может
возникнуть тенденция отвечать чаще в
положительном или, наоборот,
отрицательном плане. * Эта тенденция
может быть связана с особенностями
мотивации, установки, представления
о характере обследования и его последствиях
у испытуемого. Наличие альтернативных
ответов стимулирует возникновение
субъективного «эффекта контраста» (см.
Опросники личностные).
Применение альтернативных
задач всегда требует дополнительного
контроля надежности, применения шкал
контрольных, позволяющих
выявить различные установки к
обследованию и реагирующих на
тенденцию к невнимательному и
поверхностному выполнению задания. При
этом важно равномерно располагать
в тесте примерно одинаковые
по содержанию задания, требующие
утвердительных и отрицательных ответов
по «ключу».
Особого внимания требует
условие простоты и однозначности
понимания испытуемым содержания
пунктов. Для этого желательны
специальные исследова-‘ ния особенностей
понимания вопросов в конкретной выборке
испытуемых, а также проведение экспертной
оценки ясности и содержательности
формулировок пунктов.
Для предупреждения
невдумчивой, «автоматической» работы
испытуемого можно применять различные
специальные приемы, напр, использование
вопросов с двойным отрицанием, что
требует более внимательного анализа
содержания, сосредоточения для
выполнения логической операции
(вопросы типа «Я никогда не выходил
из себя настолько, чтобы это меня
беспокоило», альтернативные ответы
«верно» — «неверно»).
Погрешности исследования
могут быть снижены введением специальных
поправок на вероятность угадывания
ответов. Эта вероятность обратно
пропорциональна числу вариантов
ответа (при двух альтернативных вариантах
эта вероятность Р
~ 0,5). Для введения
поправки на случайные ответы при
определении общей оценки по тесту
можно воспользоваться следующим
уравнением:
где Sc
— оценка выполнения
теста; Sr
— число правильных
ответов; Se
—- число ошибочных
ответов; w
— число вариантов
ответов (при работе с опросниками вместо
правильных и неправильных ответов
рассматривается совпадение или
несовпадение с ключом методики).
Задачи с множественным
выбором предусматривают
большее количество возможных ответов.
Промежуточными
между этой формой задач и
заданиями альтернативного типа являются
задачи с простым множественным выбором,
напр.:
— Соединение с химической
формулой NaCl
является… а) кислотой, б) солью. В данном
примере количество возможных вариантов
меньше трех, однако для ответа требуется
выбор более сложный, чем по типу
«да»—«нет».
Примером задачи со сложным
множественным выбором может служить
форма задач одного из субтестов Амтхауэра
интеллекта структуры теста:
— У дерева
всегда имеются… а) листья, б) плоды, в)
почки, г) корни, д) тень.
— Когда спор заканчивается
взаимной уступкой, то это называют… а)
конвенцией, б) компромиссом, в)
развязкой, г) сговором, д) столкновением.
Обычно в таком наборе вариантов ответов
правильным является только один. Для
снижения «эффекта подсказки» со стороны
других вариантов ответов, которые
явно могут контрастировать с правильным,
требуется подобрать внешне правдоподобные
и похожие на правильный ложные ответы.
Выбор таких вариантов сложен и обычно
проводится на материале опроса по
данному пункту при открытой форме
ответа. Наиболее часто встречающиеся
варианты неправильных ответов испытуемых
обычно дают материал для составления
репертуара ответов. Для уменьшения
вероятности появления случайных
правильных ответов порядковые номера
(места) вариантов должны сменяться по
случайному закону.
При решении 3. з. т. с
множественным выбором в личностных
методиках среди предлагаемых вариантов
не может быть «правильных» и «неправильных»
ответов. Чаще всего в этом случае ответ
носит характер вербальной шкалы с
указанием степени выраженности признака,
меры согласия с содержанием пункта (см.
Шкала вербальная).
ЛП1
В 3. з. т. с множественным
выбором вероятность угадывания ниже,
чем в альтернативных задачах; вместе
с тем процедура обработки существенно
не усложняется. Это делает данный
вид 3. з. т. предпочтительным в
большинстве случаев.
Задачи, построенные
по принципу восстановления
соответствия частей,
являются модификацией задач с
множественным выбором. Здесь в блок
объединяют ряд задач и ответов на
них, при этом количество задач и решений
может совпадать (что более типично)
или число ответов может быть больше,
чем число задач данного блока.
В качестве примера тестовой
задачи по выбору соответствия можно
привести следующую задачу:
Шар—,.. 1. У=а*.
Куб — … 2. У=
-|ягЗ.
— Против названия
геометрического тела поставьте номер
формулы расчета объема.
Другим типичным примером
такого рода задач являются пункты
субтестов PL
и SP
теста Р. Амтхауэра,
где требуется опознать геометрическую
фигуру по ее частям или идентифицировать
перевернутый в различных вариантах
кубик.
Основным достоинством
заданий рассматриваемого вида
является возможность компактного
размещения большого количества пунктов
на бланке обследования.
Задачи с переструктурированием
данных требуют
восстановления правильной комбинации
элементов какой-либо конструкции.
Примером заданий такого рода может
служить субтест «последовательные
изображения» и «состав-
ление объектов* в Векслера
интеллекта измерения шкалах, субтест
Me
теста Р. Амтхауэра.
Эти задачи чаще всего
применяются в практических тестах, а
также в методиках, носящих предметный
характер (кубики, машинка Готтшальдта
и т. д.). Основным преимуществом данного
вида задач является возможность фиксации
последовательности и хода их решения,
а также качественного анализа.
ЗАДАЧИ ОТКРЫТОГО ТИПА —
тип
задач тестовых,
предусматривающих
свободные ответы испытуемого, по
существу задания без предлагаемых
вариантов ответов. Испытуемый должен
выполнять задание по своему усмотрению.
Регламентируются лишь наиболее общие
аспекты формы ответа (вербальная или
невербальная, ориентировочный объем
ответа, иногда — ориентировочное время).
По сравнению с задачами
закрытого типа 3. о.
т. позволяют подучить разностороннюю
развернутую информацию об испытуемом,
существенно расширяют возможности
качественного анализа данных
обследования. Такая форма ответов чаще
всего применяется при анкетировании,
интервью диагностическом, проективных
методиках. Наряду с
достоинствами 3. о. т. присущи и
определенные недостатки, наиболее
существенными являются: сложность
(иногда невозможность) формализации
ответов и их оценки, неоднозначность,
вызывающая затруднение в интерпретации
(связанная иногда с необходимостью
дополнительного расспроса), громоздкость
процедуры и большие затраты времени
на обследование. Нередко в этой связи
возникает необходимость применения
3. о. т. в комплексе с элементами закрытых
заданий (введение дополнительных лимитов
и условий выполнения, разработка
схемы оценки и интерпретации) (см.
Тематической ап-
перцепции тест). Определенное
значение имеет квантификация данных
в ответах (см. Контент-анализ).
В психологической диагностике
применяются различные виды 3. о. т.
Так, к их числу относятся задачи
дополнения, получившие наиболее широкое
распространение по сравнению с
другими видами 3. о. т. От испытуемого
требуется продолжить утверждение
или изображение по предложенным начальным
элементам. Примером таких задач могут
послужить те, которые используются в
«завершение предложения»
методиках, напр.: Мой
отец…
Если бы я был руководителем
.., Моя жизнь в целом … и т. д. Ключевой
проблемой составления заданий такого
рода является возможность провоцирования
у испытуемого определенного ответа.
Для предупреждения «подсказывающего*
или «диктующего* эффекта вопроса
необходимо проведение пробных исследований
частоты похожих ответов на конкретный
пункт в выборке. В случае частого
повторения стереотипных ответов
данный пункт требует замены или
изменения формулировки.
Другим видом 3. о. т. являются
задания свободного
конструирования, которые
носят характер устного или письменного
рассказа, интерпретации изображения,
ситуации,технического(предметного)
конструирования и т. д. Примерами этого
распространенного вида 3. о. т. являются
задания Роршаха теста,
Розен-цвейеа рисуночной фрустрации
методики, Гудинаф «Нарисуй человека»
теста (см. Проективные
методики).
ЗАДАЧИ ТЕСТОВЫЕ —
отдельные задания (пункты) методики,
служащие в совокупности для
моделирования исследуемой деятельности,
актуализации изучаемых психологических
качеств, анализа установок и отношений
личности и т. д.
Наиболее сложным и
ответственным этапом разработки теста
является подбор
тестового материала, условий его
адаптации и процедуры контроля
эффективности его применения. При
составлении набора 3. т. наиболее
типичным является решение вопросов
выбора трудности
заданий теста, дискриминативно-сти
заданий теста, внутренней согласованности,
надежности частей и
всей совокупности пунктов, факторной
нагрузки отдельных заданий и их
комплексов, анализ широкого спектра
характеристик валидности
выбираемых групп 3.
т.
Подбору 3. т. непосредственно
предшествует определение основных
характеристик и типов задач, исходя
из типа разрабатываемого теста
(вербальный или практический, тест
способностей или тест личности и т. д.),
с учетом некоторых общих правил разработки
3. т. Так, 3. т. должны удовлетворять
следующим общим требованиям: 1)
легкость понимания;
2) относительная новизна
для испытуемых по способу решения и
содержанию;
3) лаконичность; 4) минимальная
вероятность случайного решения; 5)
экономичность с т. з. времени выполнения
(для тестов скорости
время выполнения
одного задания должно быть минимальным).
3. т. стремятся составить
таким образом, чтобы они не вызывали
посторонних вопросов со стороны
испытуемого, не требовали больших
усилий для выполнения вспомогательных
операций (напр., больших промежуточных
расчетов при выполнении арифметических
тестов), были компактны и удобны для
учета результатов н обработки материала
экспериментатором, допускали
возможность формализации окончательных
результатов, четкой стандартизации
процедуры и
интерпретации.
В психологической
диагностике находят
практическое применение различные
типы 3. т., разделяемые на основании
их формальной структуры и
способа ответов. Основными из них
являются:
— задачи с предписанными
ответами (закрытые);
— задачи со свободными
ответами (открытые).
Задачи с предписанными
ответами в свою очередь делятся на:
задачи с альтернативными ответами;
задачи с множественным выбором;
задачи с выражением ответа в виде
восстановления частей предложений,
фигур и т. д.; задачи с переструктурированием
данных, требующие перегруппировки
исходных элементов.
Задачи со свободными ответами
включают: задачи дополнения символа,
рисунка, высказывания и т. п.; задачи
свободного конструирования ответа,
которые в свою очередь делятся на задания
с малоструктурированным стимулом
(см. Проективные
методики) и задачи
конструирования по четко заданной
теме или программе.
Примеры и подробное описание
этих типов 3. т. приведены в соответствующих
разделах (си. Задачи
открытого типа, Задачи закрытого типа).
Выбор типа заданий в
наибольшей степени зависит от
назначения и вида теста. Так, в методиках,
направленных на исследование
способностей (общих, специальных и
профессиональных), уровня осведомленности,
умений и навыков {тесты
достижений), как
правило, применяют 3. т. с предписанными
ответами. В опросниках
личностных часто
используют пункты со свободными,
альтернативными или множественными
ответами. В целом для традиционной
психодиагностики, особенно в области
психометрических тестов, более
типично применение задач
закрытого типа.
При построении отдельного
теста или субтеста используют единый
тип задач (исключение — некоторые шкалы
умственного развития, напр. Бине—Симона
умственного развития
шкала), а при разработке
тестовых батарей
желательна смена
типов заданий в субтестах. Последнее
особенно важно при планировании
методик, предназначенных для обследования
детей. В этом случае типы задач должны
следовать в определенном порядке.
Субъективно менее удобные типы задач
(напр., со свободными ответами или
переструктурированием) обычно ставят
в начало батареи. Внутри тестовой батареи
субтесты с субъективно более удобными
типами задач (напр., с альтернативным
выбором) чередуются с менее удобными.
Имеется ряд правил формулирования
содержания и инструкции
выполнения тестовых
задач, а именно;
1. В основе каждой задачи
(пункта), вопроса, набора суждений и т.
д. должна лежать одна мысль. Если состав
утверждений ложный (два или более
относительно независимых высказывания),
то формулировку следует сократить
или разделить на соответствующее
количество пунктов.
2. Следует избегать
употребления многозначных понятий,
редких значений слов, сленга, диалектизмов,
узкоспециальных терминов и формулировок.
3. Следует помнить, что
слишком короткие, в телеграфном
стиле, формулировки вызывают
дополнительные вопросы и нередко
являются многозначными.
4. Необходимо избегать
непомерно длинных высказываний,
использование которых ведет к затруднению
понимания, удлиняет время обследования,
излишне утомляет, создает условия для
возникновения посторонних помех,
которые могут повлиять на результат
обследования (устойчивость внимания,
навык чтения, индивидуальный уровень
развития понимания сложных
синтаксических конструкций и т. д.).
5. Задачи должны быть
реальными, отражать существующие
отношения, со-
ответствовать времени,
иметь конкретное содержание (см.
Валидность очевидная).
6. Задачи не должны быть
похожими друг на друга по содержанию,
чтобы решение одной задачи не служило
«ключом» для другой.
По мере подготовки набора
3. т. производится проверка объективности
и корректности их формулировок.
Проверка этих характеристик 3. т.
базируется на экспертных оценках и
близка к процедуре установления
валидности содержательной.
Экспертам предлагают
оценить 3. т. с точки зрения однозначности
формулировок и соответствия назначению
теста. Задачи, по признанию экспертов,
сформулированные неудачно или вызывающие
различное толкование (здесь возможно
специальное исследование соответствия
содержания и понимания пунктов в
выборке по характеристикам области
применения теста), а
также пункты, неадекватные или слабо
связанные с направленностью разрабатываемой
методики, отбрасываются или
формулируются по-другому.
Отобранные задания размещаются
либо по степени трудности (см. Трудность
задания теста), либо
в случайном порядке (гомогенное
тесты). 3. т. могут также объединяться
в блоки для измерения определенного
фактора или качества (гетерогенные
тесты).
Иногда для решения определенных
экспериментальных задач составляют
комбинации из 3. т., относящихся к
различным методикам. Подобная практика
не может считаться допустимой, так как
характеристики надежности, валидности,
трудности, однородности целых методик
и их частей далеко не идентичны. Для
правильного применения отдельных
совокупностей заданий методики
необходимо соблюдение ряда специальных
условий (см. Надежность
частей теста).
ЗАКЛЮЧЕНИЕ —
документ о результатах тестирования,
подготовленный психологом. 3. должно
строиться на всех доступных для
исследователя данных. Стандартной формы
и правил написания 3. не существует, оно
видоизменяется в зависимости от цели,
ситуации, в которой проводится
тестирование, адресата, теоретических
установок и специализации психолога.
Основное в подготовке 3. — его соответствие
потребностям, интересам и уровню
квалификации заказчика.
3. должно быть ориентировано
на действия, которые необходимо
предпринять в связи с тем или иным
диагнозом психологическим
(рекомендации по
программам обучения, типа лечения
или коррекции, выбора профессии и т.
п.) В 3. должны быть отражены отличительные
свойства обследуемого, т. е. показатели
заметно «низкие» или «высокие», а не
близкие к средним. Основное содержание
— это интерпретация и выводы, в отдельных
случаях могут прилагаться протоколы
обследования. Утверждения психолога
должны отражать степень надежности
каждого из приводимых фактов или
выводов. Следует избегать специальной
терминологии. 3. эффективно лишь в
том случае, когда применимо только к
данному обследуемому, а не к людям
этого возраста, пола, образования,
страдающим тем же заболеванием и т. д.
(см. Валидность
иллюзорная). При
подготовке 3. обязательно следует
руководствоваться этическими
нормами психодиагностики.
ЗАМАСКИРОВАННЫХ ФИГУР
ТЕСТ
(Embedded
Figures
Test,
EFT)
— предназначен
для определения перцептивного стиля
личности. Разработан Г. Виткиным в 1954
г. на основе широко известных фигур
К. Готтшальдта (1926).
Материал 3. ф. т. состоит из
8 простых черно-белых геометрических
фигур, 23 цветных сложных фигур и одной
слож-
ной черно-белой фигуры. В
каждой из сложных фигур замаскирована
одна из простых фигур. Это достигается
наложением на контур простой фигуры
линий таким образом, чтобы образовать
скрывающую ее сложную фигуру.
Маскирующую роль также выполняет цвет.
Обследуемый должен в течение пяти минут
обнаружить простую фигуру внутри
сложной.
Основой для создания 3. ф.
т.- послужили многочисленные
экспериментальные данные, указывающие
на тесную связь между особенностями
выполнения перцептивных задач и
свойствами личности. В работах Г.
Виткина и сотр. было показано, что
индивидуумы сильно различаются по
своей «зависимости от поля зрения»,
причем этот показатель является
относительно стабильной величиной,
определяющей перцептивный стиль
личности. Значимые корреляции (см.
Корреляционный
анализ) между тестами,
использованными в этих исследованиях,
и 3. ф. т. позволяют рассматривать
последний в качестве инструмента
для измерения «зависимости от поля
зрения». В свою очередь, «зависимость
от поля зрения* понимается как
перцептивный компонент довольно широкого
измерения личности обобщенного
когнитивного стиля (или стиля познания).
Обследуемые, с трудом
отвлекающиеся от доминирующей
структуры перцептивного поля (им
трудно отделить конкретный стимул
от фона), называются «по-лезависимыми».
«Поленезависимыми* были названы те
обследуемые, которые легко и быстро
находили фигуру на сложном фоне.
Экспериментально подтверждены
значимые связи зависимости—независимости
от поля с эффективностью обучения,
особенностями межличностных отношений,
способами разрешения конфликтных
ситуаций и другими личностными
показателями. Коэффициент надежности
ретестовой 3. ф. т., по
данным за-
Ш
рубежных исследований,
достаточно высок (0,61-0,92). Опубликованные
варианты теста применимы при
обследовании взрослых, детей школьного
и дошкольного возраста, а также при
групповом обследовании.
В работах российских
психологов 3. ф. т. использовался для
получения данных об особенностях
когнитивного стиля (П.Н.Иванов, 1985 и
др.).
ЗЕРКАЛЬНОГО РИСУНКА ТЕСТ
—
а) тест
специальных способностей,
б) тест,
личности. Разработан
М. Куче-рой и В. Смекалом в 1976 г.
Прием, предусматривающий
зеркальное восприятие рисунка,
применялся в экспериментально-психологических
исследованиях еще в конце прошлого
века. Разные авторы использовали эту
тестовую модель
для выявления как
уровня развития моторики, так и определения
индивидуальных различий в темпе
обучения, латерализации функций
правой и левой рук, особенностей
зрительно-моторных связей. В последующем
этот прием применялся для диагностики
таких особенностей личности, как
тревожность, импульсивность, чувство
неполноценности, агрессивность,
уровень адаптации к* стрессу, эмоциональная
лабильность, самокритичность,
пессимизм и некоторых других (В. Черны,
Т. Колларик, 1988).
Содержание работы испытуемого
заключается в зеркальном срисовывании
с тестовых образцов. Для этого используется
специальное устройство, представляющее
собой камеру с установленным в ней
зеркалом. Испытуемый из-за ширмы (экрана)
может видеть лишь зеркальное изображение
тестового объекта. Сти-мульный материал
теста состоит из двух серий, содержащих
по 3 образца. Образец состоит из семи
точек, пронумерованных так, что, отражаясь
в зеркале, последовательность точек
располагается против ча-
Рис. 29. Исполнение разным-:,
испытуемыми задания Зеркального рисунка
теста
совой стрелки (рис. 29). Задача
испытуемого — соединить точки линиями
согласно последовательности числового
ряда. Испытуемый не может отрывать ручку
от бумаги до соединения линией последней
пары точек. Во время выполнения заданий
экспериментатор может воздействовать
на поведение и состояние испытуемого
для повышения эмоционального напряжения
(напр., замечаниями, критикой, указанием
на медлительность) либо для оказания
поддержки (напр., в ситуации, чреватой
отказом от продолжения работы). Проведение
теста занимает приблизительно 30
минут.
Идея теста состоит в том,
что для большинства взрослых людей
выполнение предлагаемых заданий связано
со значительной психической нагрузкой,
которая может перейти во фрустрацию.
Тест направлен на оценку интенсивности
напряжения и типа поведения в ситуации
фрустрации. Для этого фиксируются
разнообразные поведенческие реакции
испытуемого, к которым относятся:
1. Психофизические проявления
напряжения (потливость, тремор);
2. Выражение лица и спонтанное
поведение. По комплексу этих показателей
состояние испытуемого может быть
охарактеризовано как: а) нервозность,
б) напряженность, в) сосредоточенность,
г) спокойствие, д) легкое отношение
(как к развлечению).
3. Целенаправленность и
осознанность выполнения.
4. Способ удержания ручки
или карандаша (свободное или
напряженное).
5. Способ рисования и характер
штриха (оцениваются три параметра:
скорость, характер штриховки,
выдерживание направления).
6. Вербальные проявления
(нейтральные, критические,
подбадривающие, самообвиняющие,
проявления депрессии, смущения,
отказ, сопровождение деятельности
счетом точек). Дополнительно фиксируется
время,
затраченное на выполнение
каждого задания, общая продолжительность
работы
Рис. 30. Оценочный бланк
Зеркального рисунка теста (прерывистая
линия — показатель по критерию поведения,
штрихпукктирная линия — показатель по
критерию качества рисунка, непрерывная
линия — обобщенный показатель)
испытуемого, периоды
замедления темпа выполнения.
Характер рисунка дополнительно
оценивается параметрами размаха
(степень отклонения линии от прямой
между точками), нажима (различается
величиной — сильный, средний, слабый
и характером — регулярный, с
колебаниями), шгриховки (быстрая, средняя,
медленная, равномерная, неравномерная,
легкая) и рядом других показателей.
Согласно разработанной авторами 3.
р. т. схеме, по отдельным показателям
начисляются первичные баллы, которые
для некоторых диагностических
критериев переводятся в стэны (см. Оценки
шкальные). Результат
фиксируется в виде оценки
профильной на
специальном бланке (рис. 30).
Интерпретация результатов
3. р. т. зависит от целей обследования
и может осуществляться в следующих
формах:
1. Общая характеристика
основных проявлений поведения и
особенностей выполнения рисунка без
подсчета первичных баллов.
in
2. Количественная интерпретация
с последующим пересчетом первичных
баллов в стэны по шести ориентировочным
характеристикам личности.
3. Качественная интерпретация
полученного профиля и зафиксированных
особенностей поведения и качества
исполнения рисунка.
4. Комплексная интерпретация
результатов с составлением заключения.
Наибольшую значимость имеют шесть
диагностических категорий, имеющих
полюса:
— нейропсихологическая
лабильность — стабильность,
— импульсивность — владение
собой,
— сильная воля — слабая
воля,
— устойчивость —
неустойчивость к стрессу,
— ригидность — подвижность,
— адекватная ~ недостаточная
приспособляемость.
Сложность системы оценок
интерпре-тативной схемы, большое
количество специфических оценочных
показателей тре-
буют от психолога, проводящего
3. р. т., большого опыта. Характер тестовой
модели 3. р. т. существенно ограничивает
возможности определения надежности
методики, тем не
менее данные, полученные разработчиками,
подтверждают стабильность результатев
теста во времени при повторном его
применении спустя 2-6 мес. Коэффициент
надежности ретес-товой
по показателю общего
времени выполнения составил г(
= 0,815, а по показателям
таких параметров рисунка, как сложность,
размах, нажим, — находится в пределах
г, = 0,550-0,770.
В процессе валидизации 3.
р. т. авторы проанализировали факторные
связи между комплексами поведенческих
проявлений (физические симптомы,
словесные симптомы волнения и т. д.) и
основными диагностическими категориями
теста (лабильностью, импульсивностью,
устойчивостью к фрустрации, ригидностью
и адаптацией). Корреляционная матрица
(см. Факторный анализ)
содержит преимущественно
достоверные статистические величины
вплоть до гху
= 0,995.
Положительные данные о
валидности 3.
р. т. были получены при анализе ва-
лидности критериальной
в процессе сопоставления
данных по тесту в выборке инженеров
и экспертной оценки диагностируемых
тестом качеств личности. Процент
совпадений тестовых данных и экспертных
оценок достигает 80%. Данные о валидности
конструктной включают
сведения об уровне связи результатов
3. р. т. с опросниками
личности. Лабильность
поведения и общая лабильность в 3. р.
т. коррелируют с показателями
лабильности Кудличковой
личностного опросника (КУД) на
уровне г = 0,228 и г = 0,197 соответственно.
Показатель силы воли в 3. р. т. коррелирует
с лабильностью по КУД
(г = -0,227); низкая
способность к адаптации в поведении
— с экстраверсией по КУД
(г
= -0,237); низкая
толерантность к фрустрации — с
экстраверсией по КУД
(г =-0,184); импульсивность
в рисунке — с показателем экстраверсии
по EPI
(см. Айзенка
личностные опросники) (г= -0,313);
ригидность и недостаточная
приспосабливаемость — с показателем
L
(см. Шкалы
контрольные) опросника
EPI
(г = -0,306 и 0,353
соответственно). Сведений об использовании
в СНГ нет.
и
«ИЗУЧЕНИЕ МОНОТОНОУСТОЙ-ЧИВОСТИ
ЛИЧНОСТИ* (ИМУЛ) —
опросник личностный. Предложен
Н. П. Фетискиныы в 1991 г. Предназначен
для диагностики личностной
моното-ноустойчивости.
Опросник состоит из 40
утверждений, 7 из них предназначены для
определения искренности ответов (см.
Шкалы контрольные),
а остальные входят в
состав следующих шкал:
Шкала сензитивности к
монотонному фактору. Данная
шкала отражает наличный и ретроспективный
опыт, необходимый для оценки усилий,
затрачиваемых индивидом при
однообразной деятельности, степени
ее переносимости, эмоциональной
реактивности на воздействие
монотонности, быстроты потери интереса
к однотипным заданиям. Напр.: «Обычно я
без особого усилия могу подолгу
выполнять одни и те же операции».
Шкала деятельностного
целепо-лагания. Включает
в себя перечень доминирующих целей,
ориентированных на высокую трудовую
результативность, избегание монотонной
деятельности, компенсацию
неблагоприятного воздействия монотонного
труда творческой включен-
ностью или отсутствие
позитивных целей вообще. Напр.: «Я нередко
ищу повод, чтобы уклониться от длительной
однообразной деятельности».
Шкала деятельностного
предпочтения. Направлена
на изучение предпочтений, склонности
индивида’к таким особенностям трудовой
деятельности, как: привычность—новизна,
мало—многоопе-рационность,
репродуктивность—творчество,
однотипность—разнообразие. Напр.: «При
выборе заданий я больше предпочитаю
малознакомую, а не хорошо известную мне
работу».
Шкала эмоциональных
состояний. Направлена
на выявление эмоциональных состояний
индивида в процессе выполнения монотонной
деятельности, Состояния дифференцируются
на положительные, нейтральные,
пассивно-отрицательные по типу
протекания монотонии или активно-отрицательные
по типу протекания психического
пресыщения. Преобладание одного из
эмоциональных сим-птомокомплексов
служит показателем большей или меньшей
монотоноустойчи-вости. Напр.: «Когда я
занимаюсь однотипной работой, у меня,
как правило, бывает ровное, приятное
настроение».
Шкала потребности в
деятель-ностном разнообразии. Определяются
такие показатели
жизнедеятельности личности, как частота
и степень выраженности потребности
в разнообразии, отношение к смене
рабочих мест и операций, отношение к
перестройке трудовых заданий. Напр.:
«Почти всякий переход к новым условиям
работы или жизни кажется мне очень
трудным».
Шкала личностной мотивации.
Включены следующие
мотивы: новизна, привыкание к монотонной
деятельности, самореализация личности,
деятельност-ная определенность. Напр.:
«Однотипная работа привлекает меня
тем, что позволяет показать многие
мои достоинства».
Шкала деятельностной
эффективности. Предназначена
для определения ряда показателей
производственкой деятельности —
темпа работы, его равномерности,
качества труда, а также активности
и инициативности. Напр.: «В ходе однотипной
работы у меня часто появляется желание
сделать паузу, разрядиться».
Каждый ответ испытуемого,
совпадающий с «ключом», оценивается
в 1 балл. Суммарная оценка баллов является
показателем монотоноустойчивости,
при этом чем он выше, тем более выражена
моно-тоноустойчивость. При интерпретации
результатов автор считает возможным
ограничиться характеристикой трех
уровней монотоноустойчивости: низкий
(повышенная чувствительность к
монотонному фактору), средний
(невысокая чувствительность к
воздействию монотонности) и высокий
(низкая чувствительность к однообразной
работе).
При разработке «И. м. л.»
автор исходил из понимания монотонии
как неспецифического состояния,
обусловленного отрицательными изменениями
в направленности личности,
сопровождающегося тягостным переживанием
однообразия
в форме апатии и скуки с
последующим снижением социальной,
психофизиологической и трудовой
активности индивида. Выполнение
монотонной деятельности предполагает,
по мнению автора, возникновение,
наряду с монотонней, состояния психического
пресыщения. Это состояние характеризуется
как эмоциональное, возникающее на
фоне крайне негативного отношения
к однообразной работе и проявляющееся
в непреодолимом стремлении прервать
ее, в высокой психофизиологической
напряженности, резком снижении
эффективности труда. Т. о., особенности
как монотонии, так и психического
пресыщения были заложены в
конструирование «И. м. л».
Автор сообщает о достаточно
высокой валидности и
надежности опросника.
Нормативные данные основываются на
обследовании 560 человек, данные о половой
принадлежности, возрасте и профессии
которых не сообщаются (апробация
опросника проводилась на 600 рабочих
разных специальностей и 460 учащихся
профтехучилищ).
«ИНДИВИДУАЛЬНЫЙ ДЕЛОВОЙ
СХИЛЬ» — опросник
личностный. Предложен
Г. А. Гребенюком в 1996 г.
Предназначен для диагностики
стиля руководства.
Опросник содержит 110 вопросов,
которые подразделяются на пять шкал,
описывающих стилевые аспекты работы
руководителя:
1)
ориентация на себя.
Основная характеристика:
степень увлеченности работой;
2) ориентация
на «золотую середину». Основная
характеристика— стремление к надежному
среднему уровню;
3) ориентация
на человека. Основная
характеристика — создание дружеской
атмосферы в коллективе;
4) ориентация на результаты
работы. Основная характеристика
— стремление к быстрому достижению
результата любыми средствами;
5) ориентация на участие.
Основная характеристика — создание у
сотрудников установки на высокий
результат, на совместную работу.
Автор исходит из того, что
стиль руководства является устойчивым
образованием, характеризующим манеру
и способ управления и основывающимся
на совокупности личностных,
коммуникативных, познавательных и др.
качеств. Были выделены пять стилей
руководства, не являющихся очевидно
зависимыми друг от друга, но в то же
время отражающих описанное в литературе
многообразие стилей. Предполагается,
что выделенная система шкал характеризуется
не только важным для практической работы
психологическим содержанием, но и
обладает статусом теоретических
конструктов, относительно которых
существует принятое большинством
авторов согласованное мнение.
Валидность конструктная
«И. д. с.» изучалась
путем сопоставления с данными
«Шестнадцати личностных
факторов» опросника и
некоторых других опросников.
Так, первая шкала
коррелирует с фактором С, третья —
с Q2,
четвертая— с Е,
а пятая — с Ли L.
Факторный анализ позволил
выделить четыре фактора, каждый из
которых объясняет примерно четверть
дисперсии. Содержание трех факторов
определяется первой, второй и пятой
шкалами опросника, а содержание четвертого
— третьей и четвертой шкалами,
Результаты совместной факторизации
данных «И. д. с.» и опросника Кэттелла
показали устойчивость и независимость
внутренней структуры шкал разработанной
методики. Показатель надежности
выше 0,60. Разработан
компьютерный вариант опросника (см.
Тесты компьютерные),
позволяющий рассматривать
полу-
ченные данные с позиций
разных подходов к управлению и
предсказать эффективность работы
по отдельным составляющим деятельности
менеджера, а также продуктивность
деятельности в 36 различных ситуациях.
ИНСАЙТ ТЕСТ (Insight
Test,
англ. insight
— постижение, озарение) — проективная
методика исследования
личности. Опубликована Е. Саржент в
1944 г.
Обследуемому предлагают
описания 15 ситуаций. После ознакомления
с каждой ситуацией нужно письменно
(или устно) ответить^ вопросы, поставив
себя на место действующего Лица. Имеются
два набора ситуаций — для женщин и
мужчин. Ситуации И. т. затрагивают
семейные проблемы установки по
отношению к противоположному полу,
окружению, религии, профессии и т.д.
Напр., ситуация № 6:
— Молодой человек неожиданно
для себя узнает о том, что девушка, с
которой он обручен, в прошлом имела
очень плохую репутацию. Как поступил
молодой человек и почему именно так?
Что он чувствовал?
Ситуация № И:
— У молодого человека
создается впечатление, что его
знакомые часто говорят о нем, обсуждают
его поступки. Несколько раз он замечал,
как при его входе в комнату разговор
между находящимися там людьми
прекращался или переходил на другую
тему. Как стал вести себя этот молодой
человек и почему именно так? Что он
чувствовал?
При подборе ситуаций автор
в основном опиралась на проблемы,
типичные для студенческого возраста.
Ответы обследуемого
анализируются по трем направлениям:
эмоциональные реакции, когнитивные
проявления и способ разрешения
конфликта. Эти области
детализированы, по каждой
выделены отдельные категории. Напр.,
в область эмоциональных реакций
входят: фрустрация, тревожность, депрессия
и т. д., причем эти категории получают
количественную оценку. Система оценок
произвольна, субъективна. Согласно К.
Фассет (1948), надежность
ретестовая И. т.
удовлетворительна, однако использовалась
упрошенная система оценок. Данные о
валид-ности спорны.
Широкого распространения в
психодиагностических исследованиях
И. т. не нашел.
Сведений об использовании
в СНГ нет.
ИНСТРУКЦИЯ —
руководство по выполнению заданий
теста, предъявляемое испытуемому
письменно, устно или с помощью
компьютера и направленное на создание
адекватной мотивации, установки субъекта
на обследование.
Общие требования к И. включают
простоту и понятность, краткость,
использование примеров. Неудачно
составленная И. может сказаться на
результативности выполнения тестовых
заданий в силу непонимания некоторыми
испытуемыми предъявляемых к ним
требований. При разработке, а также при
адаптации теста
уместна эмпирическая проверка качества
И. на пробной выборке.
Неадекватная И. может
существенно повлиять на валидность
очевидную методики,
для которой она составлена. Особенностью
И., применяемых в ряде методик, в
частности опросниках,
является создание
установки у испытуемого на фиксацию
первого пришедшего на ум ответа.
Раздумья над ответом могут стимулировать
проявление разного рода установок,
в соответствии с которыми и будет дан
ответ (см. Установки
на ответ).
В ряде случаев перед И. стоит
задача «камуфлирования» истинных целей
обследования и показателей, на
диагностику которых ориентирован
тест. Указания
в И. на то, что целью
обследования является анализ
«интеллекта», «качеств личности» и
т. п., могут вызвать эмоциональное
напряжение, избыточную мотивацию, отказ
от работы. В некоторых случаях И.,
напротив, акцентирует внимание
испытуемого на исследовании социально
значимых или престижных показателей
(напр., при исследовании уровня притязаний).
И. не должны предшествовать анкетные
данные, если подчеркивается анонимность
обследования.
ИНТЕЛЛЕКТА КОЭФФИЦИЕНТ
(Intelligence
Quotient,
IQ)
— количественный
показатель уровня интеллектуального
развития, измеряемого с помощью тестов
интеллекта. Понятие
И. к. введено В. Штерном (1912), который
обратил внимание на определенные
недостатки процедуры вычисления
умственного возраста
в шкалах типа Бине
(см. Вине— Симона
умственного развития шкала). Формула
И. к. имеет следующий вид:
умственный возраст
И. к. = ——————-—■——-100.
хронологический возраст
И. к. был впервые использован
в Станфорд—Бине
умственного развития шкале. По
мере развития тестов интеллекта их
математико-статистический аппарат И.
к. был заменен IQ-показате-лем
стандартным. Д. Векслер
(см. Век-слера интеллекта
измерения шкалы) первым
выражает IQ
в единицах стандартного
отклонения, что показывает, в каком
отношении находится результат данного
обследуемого к средней величине
распределения результатов для его
возраста. О психологической
интерпретации И. к. см. Тесты
интеллекта.
ИНТЕЛЛЕКТУАЛЬНОГО
ПОТЕНЦИАЛА ТЕСТ —
тест интеллекта,
относится к группе
невербальных. Разработан П. Ржичаном
в 1971 г.
Рис. 31. Образцы заданий
Интеллектуального потенциала теста
Состоит из 29 заданий.
Испытуемый должен понять принцип, в
соответствии с которым упорядочены
картинки, и дополнить ряд одной из
предложенных (рис. 31). Задания располагаются
по возрастающей сложности. Предлагаются
четыре примера для обучения. Время
обследования ограничено.
Тест ориентирован на оценку
интеллектуальных функций взрослых
и детей старше 12 лет со средними и
сниженными показателями интеллектуального
развития. Оценки
первичные могут быть
переведены в стэны (см. Оценки
шкальные) и показатели
IQ.
Нормы рассчитаны на
основании обследования 1027 учеников 7-9
классов средней школы.
При разработке И. п. т. автор
исходил из стремления минимизировать
влияние фактора пространственного
мышления и старался разнообразить набор
заданий, не повторять сходные тесты
(см. Культурно-свободный
интеллекта тест).
Показатель валидности
критериальной на
основании сопоставления с успеваемостью
детей в возрасте 12,6-17,7 года составил
г = 0,47-0,39.
Коэффициенты валидности по- связи
результатов теста с оценкой интеллектуальных
возможностей педагогами в разных
возрастных группах распределялись
в пределах от 0,7 до 0,4. Результаты
валидизации конструк-тной
при сопоставлении с
образовательными тестами по математике
положительны. Коэффициент корреляции
составил 0,66. Зафиксирована положительная
связь результатов И. п. т. на уровне г
— 0,64 с общим показателем
Амтхауэ-ра интеллекта
структуры теста.
Надежность частей теста
с применением
формулы Спирмена—Брауна — rt
= 0,919-0,885. Коэффициент
надежности, полученный при ретесте
с интервалом в 12 дней, составил гг
= 0,79, что является невысоким значением,
и поэтому автор не рекомендует повтор-
ное использование И. п. т. в
одной и той же выборке.
Имеется две формы теста —
А и В.
И. п. т. чаще всего применяется
в составе комплексных тестовых
батарей. В отдельных случаях методика
может использоваться как скрининговая
(см. Отсеивание).
Полагается, что
результаты И. п. т. мало связаны с уровнем
образования. В отечественной
психодиагностике И. п. т. применяется
для обследования школьников, в практике
педагогической экспертизы.
ИНТЕРВЬЮ МОНОЛОГИЧЕСКОЕ
—
проективная методика
исследования личности.
Изучает отношение личности к окружающим
и к самому себе. И. м. предложено Н. И.
Сарджвеладзе в 1984 г.
Основной принцип И. м.
заключается в том, что испытуемый
выступает не в качестве респондента
(как, напр., при ответах на вопросы
опросника личностного
или анкеты), а в качестве
субъекта исследовательской активности,
который сам формулирует вопросы с целью
познания или самопознания. Испытуемый
как бы берет интервью у другого
(воображаемого) человека. Методика
И. м. базируется на предъявлении
какого-либо материала (вопросника,
рисунков-, теста и
т. д.). Испытуемому предъявляется
инструкция, побуждающая его
формулировать вопросы лицам, которых
определяет исследователь, а также
ответить самому на эти вопросы, играя
роль того, кому они адресованы.
Особенности подхода могут
быть реализованы в различных конкретных
методиках И. м. Н. И. Сарджвеладзе
использовал И. м. для изучения форм
репрезентации образов отца, матери,
лиц противоположного пола, а также
связи этих образов с отношением личности
к самому себе. Испытуемому предлагают
задать три вопроса «женщине-матери»,
которые дали бы
максимум информации о ее
жизни, мыслях, личностных особенностях
и т. д. Испытуемый свободен в выборе
образа своей матери либо другой
женщины. Для изучения особенностей
репрезентации других образов,
включенных в программы исследования,
процедура повторяется.
Предполагается многосторонний
анализ текстов, полученных в результате
И. м., по трем основным направлениям:
1) микроструктурный анализ
содержания текста, т. е. составление
словника и выделение основных
семантических единиц;
2) макроструктурный анализ
содержания текста, вычленение основных
смысловых узлов с учетом их иерархических
соотношений; 3) психолингвистический
и структурно-лингвистический анализы
текстов. В ходе анализа результатов И.
м. могут быть использованы специальные
методы латентного
анализа (см.
Контент-анализ,
Семантический дифференциал). Методика
И. м. моделирует внутреннюю «аудиторию
личности», при условии модификации его
можно применять для изучения разных
типов межличностных отношений
(напр., руководитель—подчиненный,
учитель—ученик, муж—жена и т. д.). И. м.
допускает как индивидуальное, так и
групповое обследование. По мнению
автора, методика может оказаться
полезной при диагностике ценностных
ориентации, когнитивной сложности и
активности субъекта.
ИПСАТИВНОЕ ОЦЕНИВАНИЕ
(от
лат. ipse
— сам) — подход к оценке и интерпретации
измеряемых тестом показателей,
основывающийся на установлении их
отношения к выраженности других, с ними
связанных. Напр., каждый из диагностируемых
показателей выражается не в абсолютных
значениях, а относительно силы других.
И. о. является альтернативной
формой по отношению к нормативному
оценива-
нию, при
котором индивидуальный показатель
сопоставляется со статистическими
значениями нормативной выборки.
Значения и преимущества И.
о. (личностного) могут быть
проиллюстрированы следующим примером.
Если считать, что добровольная затрата
времени и денег на некоторую деятельность
отражает меру мотивации субъекта к этой
деятельности, то при нормативном
оценивании такое измерение в значительной
степени сводится на нет индивидуальными
различиями испытуемых (разный уровень
способностей, наличие свободного
времени и денег). Так, если богатый
человек тратит 400 фунтов на покупку
флейты, это явно указывает на меньший
интерес к игре на этом инструменте, чем
у студента консерватории, делающего то
же самое (П. Клайн, 1994). Для того чтобы
избавиться от подобного источника
ошибок, показатель ипсатизируется, то
есть мерой мотивации испытуемого к
данной деятельности становится
отклонение от среднего значения затрат
времени и денег у него же, но при
осуществлении других видов деятельности.
И. о. может опираться и на
нормативные оценки, что имеет место
в том случае, когда сопоставляется
несколько оценок шкальных у одного и
того же испытуемого (си. Оценки
профильные). Одним из
наиболее известных опросников
личностных, базирующихся
на И. о., является Эдвардса
личностных предпочтений список (см.
также Q-классификация).
ИСКУШЕННОСТЬ ТЕСТОВАЯ —
индивидуальный опыт обследуемого,
приобретенный в ходе выполнения
различных психологических тестов.
Обследуемый, имеющий значительный опыт
участия в психологических тестированиях,
приобретает тем самым определенные
преимущества перед индивидом, впервые
участвующим в подобном обследовании.
По
мнению А. Анастази (1982), эти
преимущества складываются из: ранее
преодоленного чувства неизвестности,
сформировавшейся уверенности в себе,
сложившегося отношения к тестовой
ситуации, приобретенных навыков работы
с тестовыми заданиями, осознания
сходности принципов решения задач в
определенных группах тестов. Наконец,
в случае И. т. снижается влияние мотива
экспертизы в большинстве диагностических
ситуаций, а тем самым меньше вероятность
проявления разного рода установок,
снижающих достоверность получаемых
диагностических данных (см. Установки
на ответ).
У лиц, отличающихся
тревожностью, мнительностью, эмоциональной
нестабильностью и некоторыми другими
индивидуально-личностными особенностями,
недостаточная И. т. может привести к
значительным искажениям результата
обследования. В случае использования
компьютерных вариантов тестов»
(см. Психодиагностика
компьютерная) отсутствие
навыков взаимодействия с ПЭВМ («боязнь
машины*) может повлечь за собой отказ
от участия в обследовании, т. е. необходима
известная И. т. применительно к условиям
обследования.
«ИСТОРИИ ЗАВЕРШЕНИЕ»
МЕТОДИКИ (Story
Completion
Techniques)
— группа проективных
методик исследования
личности. В отличие от «завершения
предложений» методик, обследуемому
предлагают закончить небольшие по
объему истории-рассказы, см. Дюсса
(Десперт) сказки, Методика рассказов
дополнения. Начиная
с 30-х гг. нашего века широко используются
в целях изучения личности ребенка
для осуществления психотерапевтической
работы с детьми. С помощью «И. з.» м.
исследуются эмоциональные отношения
между родителями и детьми, области
наиболее значи-
мых конфликтов, особенности
адаптации детей к условиям обучения в
школе, установки к родителям и т. д.
Интерпретация результатов теста (обычно
качественная) сходна с принятой в
методиках типа тематической
апперцепции теста.
Сведения о eajiudnocmu
и надежности
этих методик зарубежными
авторами, как правило, не приводятся,
отмечается лишь соответствие получаемых
с их помощью данных тем, которые
обнаруживаются при наблюдении и
использовании других тестов.
Сведений об использовании
в СНГ нет.
«ИСТОРИИ РАССКАЗЫВАНИЯ*
МЕТОДИКИ (Story
Telling
Techniques)
— группа проективных
методик исследования
личности. В течение длительного
времени (начиная с 30-х гг.) используются
в психодиагностических исследованиях,
прежде всего для изучения личности
ребенка. Истории, которые предлагают
сочинить детям, различаются по степени
структурированности от строго
структурированных заданий (например,
история «Большой злой волк», которая
использовалась в исследованиях Л.
Десперт и Г. Поттера) до просьбы придумать
любую историю.
Теоретическое обоснование
«И. р.» м. основано на том положении, что
при заданной, относительно
неструктурированной теме рассказанная
обследуемым история позволяет получить
данные о личности, недоступные при
прямом опросе. В этих историях
отражаются сведения о стремлениях,
потребностях, конфликтах ребенка.
Поэтому «И. р.» м. рассматриваются
как аналогичные методикам типа
тематической апперцепции
теста. Считается,
что «свободный рассказ» наиболее полно
раскрывает проблемы и переживания
ребенка. Придумывание и рассказывание
историй — естественная и очень
распространенная форма вербаль-
ного поведения детей.
Согласно Л. Десперт и Г. Поттеру
(1936), повторяющиеся темы обычно указывают
на основную проблему или конфликт.
Тревожность, чувство вины, реализация
желаний и агрессивность — основные
тенденции, проявляющиеся в рассказах
детей.
В литературе, посвященной
разработке и применению «И. р.» м.,
нет сведений о количественной оценке
результатов, приводится только
качественный анализ. Отсутствуют
сведения о валидности
и надежности
этих методик, хотя
достаточно часто указывают на
удовлетворительное соответствие
полученных данных результатам других
тестов. «И.
р.» м. близки к «истории
завершения» методикам.
Сведений об использовании
в СНГ нет.
/Q-ПОКАЗАТЕЛЬ
СТАНДАРТ-
НЫЙ—
вид оценок шкальных.
IQ—n.
с. выступает в качестве
эталонного при разработке системы
оценок и интерпретации результатов
(см. Стандартизация)
в современных
тестах интеллекта.
Основным способом
количественной оценки результатов в
первых тестах интеллекта являлся
интеллекта коэффициент,
определявшийся как
отношение «умственного возраста* к
паспортному или хронологическому. Такой
способ расчета, несмотря на его
простоту и наглядность, оказался
неудовлетворительным прежде всего по
причине несопоставимости показателей
лиц разного возраста. Относительный IQ
был заменен его
стандартизированным вариантом,
являющимся разновидностью Z-показателя.
В стандартизированном виде /Q-n.
с. представляет собой шкалу оценок со
средним значением 100 и стандартным
отклонением 16.
Выбор значения стандартного
отклонения связан со стремлением
приблизить шкалу ]Q—u.
с. к оценкам относительного
JQ,
используемого в
Станфорд—Бине
умственного развития шкале. Эта
методика является одной из наиболее
распространенных. Значения IQ,
соответствующие
различным градациям интеллектуального
развития, приняты в качестве эталона
для интерпретации и классификации
результатов. Так, значения JQ—n.
с. в пределах 40-70 единиц
соответствуют разным степеням умственной
отсталости, 90-109—«норме», 120-129 — высокому
уровню интеллектуального развития (см.
Векслера интеллекта
измерения шкалы).
Наряду с такими известными
тестами, как Векслера
интеллекта измерения шкалы, Векслера
памяти шкала, Раве-ка прогрессивные
матрицы, JQ—n.
с. в качестве
шкальной оценки применяется и во многих
других методиках психодиагностики.
IQ—u.
с. — первый уровень
анализа данных, получаемых с помощью
тестов интеллекта. Большинство
исследователей признает его
ограниченность, невозможность
использования для диагноза и прогноза
в индивидуальных случаях. Второй
уровень анализа результатов тестов
интеллекта— изучение «интерсубтесто-вого
разброса» (А. Рабин, 1965). Имеется в виду
рассмотрение соотношения количественных
показателей по отдельным субтестам или
их группам. Один из наибо-лее популярных
индексов — расхождение между
успешностью выполнения вербальных
и невербальных субтестов. Так, по данным
Д. Векслера, расхождение в 20 единиц
встречается дважды на 100 случа-
ев, а 15 единиц следует считать
диагностически значимой величиной.
Однако количественная информация
на первом и втором уровнях, как правило,
недостаточна для надежных диагностических
заключений.
Третий уровень обозначается
как анализ «интерсубтестового
разброса», при котором в центре внимания
исследователя находятся соотношения
оценок внутри каждого из субтестов.
Наиболее распространенный показатель
— отношение между количеством ошибочных
ответов в субтесте к общему баллу,
полученному за его выполнение. Учитывается
также зависимость ответа от трудности
задания. Этот уровень, по сути, приближается
к последнему, четвертому — качественному
анализу.
Качественный анализ
результатов, полученных при
использовании тестов интеллекта,
выходит за рамки традиционного его
измерения. На этом уровне количественная
оценка теряет свое «доминирующее
значение, ею пренебрегают или отводят
ей незначительную роль. В качественном
анализе иногда прибегают к интерпретации,
принятой в проективных
методиках. Это дает
возможность глубже проникнуть в сферу
интеллекта, выявить те его особенности,
которые остаются скрытыми за количественными
оценками и соотношениями. Появление и
развитие качественного анализа
показывает неудовлетворенность
исследователей традиционной,
психометрической оценкой интеллекта.
К
КАЛИФОРНИЙСКИЙ
ПСИХОЛОГИЧЕСКИЙ ОПРОСНИК (California
Psychological
Inventory,
CPI)
— опросник
личностный, разработан
в 1956 г. под руководством X.
Гоуха. Предназначен для оценки
личностных характеристик и «предсказания
того, что люди будут говорить и делать
в специфическом контексте».
К. п. о, содержит 480 утверждений,
большая часть которых касается типичных
поведенческих паттернов и привычных
ощущений, мнений по различным социальным,
этическим и семейным вопросам. В банк
вопросов CPI
вошли 178 утверждений
из состава MMPI.
Примеры утверждений:
— При настоящем положении
дел трудно надеяться на что-то в будущем.
Верно — неверно.
— Я прочитываю не менее
десяти книг в год. Верно — неверно.
— Самое важное для меня —
долг перед соотечественниками. Верно
— неверно.
— Гораздо важнее, чтобы
отец был добрым, чем удачливым.
Верно — неверно.
Обработка опирается на
нормы, разработанные для испытуемых
от 13 лет и
старше. Результатом первичной
обработки является построение оценок
профильных по 18
шкалам опросника. Для удобства
интерпретации шкалы опросника объединены
X.
Гоухом в четыре группы: I.
Оценка уравновешенности, властности,
самоуверенности, адекватности в
межличностном общении. В группу
входит 6 шкал:
1) доминирования —
предназначена для выявления сильных,
властных, влиятельных и склонных к
доминирова-
в нию
индивидов, способных проявлять инициативу
и брать на себя лидерские функции;
2) способности к поддержанию
статуса — нацелена на такие свойства,
как честолюбие и самоуверенность,
которые позволяют достичь определенного
статуса в социальной сфере отношений
и его определяют;
3) общительности —
предназначена для дифференциации людей
с коммуникативным характером,
ориентированных на активное
взаимодействие в противоположность
тем, кто избегает контактов;
4) социального присутствия
— во многом сходна с предыдущей, с
тем отличием, что человек, имеющий
высокие
оценки по этой шкале, не
просто любит находиться в обществе
других людей, а использует их для своей
выгоды, манипулирует ими;
5) самопринятия — определяет
личную значимость, способность к
независимым суждениям и поступкам,
уверенность в себе;
6) чувства благополучия —
отрицание каких-либо серьезных
конфликтов или проблем, отсутствие
напряженности, тревоги и страхов,
утверждение независимости и
самодостаточности.
II.
Измерение уровня социализации, зрелости,
ответственности и структурированности
ценностей в межличностном общении.
В группу входят 6 шкал:
1) ответственности —
идентифицирует людей, придерживающихся
определенных социальных норм и
правил, осознающих и принимающих их
важность и ценность;
2) социализации — отражает
уровень социальной зрелости, нравственного
развития, вероятности асоциальных
тенденций, степень интериоризации
социальных ценностей и норм, а также
их влияние на поведение индиви-
. да;
3) самоконтроля — направлена
на определение степени принятия и
поддержки самим индивидом социально
одобряемых норм поведения;
4) толерантности — измеряет
отсутствие предубеждений и социальную
терпимость;
5) хорошего впечатления —
служит для выявления людей, способных
создавать о себе хорошее мнение и
озабоченных тем, как их воспринимают
другие;
6) обычности — основывается
на подсчете частоты наиболее
распространенных: в выборке
стандартизации ответов испытуемых.
III.
Оценка потенциальных достижений и
эффективности в интеллектуальной
сфере. Включает 3 шкалы:
1) достижения через
подчинение — стремление к достижениям
через следование определенному
порядку, требованиям;
2) достижения через
независимость — способность достигнуть
успеха в областях, где необходимы
независимость и самостоятельность
мышления, творчество, нестандартность
решений;
3) интеллектуальной
продуктивности — оценка продуктивности
в интеллектуальной сфере на основе
самооценки.
IV.
Анализ сферы интересов. В группу входят
3 шкалы:
1) психологического склада
ума — знание людей, проницательность,
интерес к окружающим;
2) гибкости — дифференцирует
людей с гибкостью и подвижностью
мышления и поведения в целом;
3) женственности —определяет
«маскулинность» и «феминность*
интересов.
Из общего набора шкал К. п.
о. три используются как шкалы
контрольные: шкала
«чувства благополучия» (Wb)
позволяет обнаруживать
испытуемых, склонных к демонстрации
себя в «худшем свете», шкала хорошего
впечатления (Gi)
диагностирует
склонность к социально положительным
ответам (см. Установки
на ответ), и шкала
обычности (Gm)
служит для
идентификации случайных ответов.
Формулировка, отбор и
группировка вопросов по содержанию
осуществлялась в основном по эмпирическому
критерию: задания опросника группировались
в отдельные шкалы на основе ответов
испытуемых в выборках, контрастных
относительно внешнего критерия
(например, ус-
певаемость в школе, участие
в различных организациях и т. п. (см.
Контрастные группы).
При этом К. п. о.
создавался на основе Миннесотского
многоаспектного личностного опросника.
Ставилась задача
создания методики, основанной не на
клинических наблюдениях (как в случае
с MMPI),
а на выявлении качеств,
проявляющихся в реальном повседневном
межличностном взаимодействии.
Исходно К. п. о. рассматривался
автором как «открытый для дополнения»
исследовательский метод. В результате
многочисленных исследований X.
Гоух (1960) пришел к заключению, что
«основным принципом многофакторных
методик типа CPI
является получение
паттернов и комбинаций в любом контексте».
Следуя этому, автор стал использовать
метод множественной регрессии (см.
Регрессионный
анализ) для получения
взвешенных комбинаций показателей
К. п. о., с помощью которых можно оценить
различные интересующие исследователя
факторы. Так, в результате широкого
обследования профессиональных групп
были получены уравнения регрессии
и соответствующие им производные
профили показателей для предсказания
успешности овладения многими сферами
профессиональной деятельности.
За годы использования
накоплен большой материал,
свидетельствующий о высокой надежности
и валидности
К. п. о. По мнению А.
Анастази (1982), это один из лучших
опросников, используемых в настоящее
время. В то же время К. п. о. не лишен
определенных недостатков. Корреляционный
анализ показателей
шкал указывает, что многие характеристики
шкал опросника частично совмещаются,
что свидетельствует о недостаточной
факторной чистоте анализируемых
показателей. К. п. о. относится к числу
наиболее распространенных в англоязычной
психологической диагностике методик.
Его по-
пулярность не уступает
MMPI.
Опросник используется
для прогнозирования успеваемости
по отдельным учебным дисциплинам,
успешности окончания школы, а также в
области профессионального отбора,
прогнозирования эффективности
управленческой деятельности, изучения
креативных качеств личности. Помимо
основных шкал К. п. о. разработаны
дополнительные, широко используется
компьютерная интерпретация получаемых
данных.
В 1987 г. издан пересмотренный
вариант К. п. о. Добавлены две основные
шкалы (независимости и эмпатии) и три
т. н. векторные. Векторные (или структурные)
шкалы образуют «каркас» кубической
модели интерперсонального функционирования,
измеряемого такими факторами, как
«вовлеченность», «нормопри-нятие» и
«осуществление». Эти шкалы генерируют
28 разных видов интерперсональной
ориентации путем определения 4 типов
личности (альфа, бета, гамма и дельта) и
семи уровней, отражающих самоактуализацию.
В этом варианте опросника используются
462 задания, из которых 194 заимствованы
из MMPI.
Сообщается о
достаточно высоких показателях надежности
и валидности CPI—R.
Работа по адаптации и
рестандарти-зации К. п. о. для русскоязычных
испытуемых начата Н. В. Тарабриной
(1989). На выборке студентов (71 человек,
юноши, возраст 19-24 года) определены
нормы, проведен регрессионный анализ
состава показателей, осуществлен
факторный анализ шкал.
КАРТИНЫ АРАНЖИРОВКИ ТЕСТ
(Picture
Arrangement
Test,
PAT)
— проективная
методика исследования
личности. Опубликована С. Томкинсом
в 1957 г.
Стимульный материал К. а.
т. составляют 25 стандартных планшетов,
на каж-
дом из которых три рисунка,
изображающих некоторые действия
(акты поведения) человека. Обследуемому
предлагают расположить рисунки в той
последовательности, которая
представляется ему наиболее логичной,
а затем — рассказать историю, сюжетно
объединяющую изображения.
С. Тоыкинс стремился в К. а.
т. объединить принципы проективного
подхода к исследованию личности с
традиционно психометрической
(количественной) ориентацией.
Интерпретация вербального материала,
полученного входе обследования,
осуществляется примерно так же, как в
тематической апперцепции
тесте. Учет
особенностей расположения рисунков
сходен с таковым в субтесте «последовательные
картинки» теста Д. Векс-лера (см. Векслера
измерения интеллекта шкалы). Данные
о еалидкости и
надежности К.
а. т. нуждаются в уточнении, однако
позволяют использовать его для
дифференциации клинических групп.
Разработаны количественные показатели,
характеризующие частоту определенных
расположений рисунков при разных
психических заболеваниях. К. а. т.
может применяться для группового
обследования.
Сведений об использовании
в СНГ нет.
«КАЧЕСТВО ЖИЗНИ»
—опросник-анкета
для оценки качества
жизни (физическое, психическое и
социальное благополучие) больных
сердечно-сосудистыми заболеваниями.
Разработан А. Г. Гладковым, В. П.
Зайцевым, Д. Ж. Ароновым,
М. Г. Шарфнадель в 1982 г.
Оценивается отношение
больного к следующим переменам в его
жизни (реальный или возможным):
необходимости лечиться; необходимости
ограничения физических усилий, умственной
работы, поездок в общественном транспорте,
избегания ситуаций, ведущих к
эмоциональ-
ному напряжению; изменению
взаимоотношений больного в связи с
егс заболеванием с близкими, друзьями
и сослуживцами, уменьшению контактов
с ними; необходимости изменений в
трудовой деятельности, понижению в
зарплате и в должности; необходимости
ограничений в сфере досуга, занятиях
физкультурой и спортом, ведении домашнего
хозяйства, питании, половой жизни, к
запрету на курение.
Испытуемому предлагают
выразить свое отношение к каждому из
указанных последствий заболевания,
выбрав один из предлагаемых ответов:
1) «очень переживаю*; 2) «мне это
неприятно»; 3) «отношусь безразлично»;
4) «рад этому».
При анализе ответов каждому
из них присваивается определенный балл:
-2, -1,0 и 1 соответственно. Сумма этих
баллов позволяет судить о показателе
качества жизни. Степень снижения
качества жизни определяется количеством
факторов, вызывающих у. больного
отрицательное эмоциональное отношение,
а также его интенсивностью.
Валидность текущая
определялась по методу
контрастных групп.
Получены достоверные
различия при обследовании с помощью
К. ж. 17 инвалидов III
и-il
групп и 77 больных с восстановленной
трудоспособностью; при обследовании
59 больных инфарктом миокарда, занимающихся
интенсивными физическими тренировками,
и 35 больных, не участвующих в
тренировках; при обследовании больных
инфарктом миокарда и гипертонической
болезнью. В последнем случае было
выявлено, что в этих группах больных
источники неприятных переживаний не
совпадают (например, к таким источникам
относят необходимость ограничения
трудовой деятельности 13,3% больных
гипертонической болезнью и 31,9% больных
инфарктом миокарда; достоверность
различий на уровне р < 0,05). Валид-
ность конструктная
исследовалась на
выборке из 63 больных инфарктом миокарда
с применением К. ж. и MMPI
(см. Миннесотский
многоаспектный личностный опросник).
Показано, что у 26 человек с
более низкими показателями К. ж. (-4 и
меньше) значения ММР7
по 1, 2, 7, 8 шкалам
достоверно выше, чем у больных с
относительно более высоким показателем
качества жизни.
Стандартизация методики
проводилась на 124 больных, которые
перенесли инфаркт миокарда от 6 до 24
месяцев назад, и 30 больных, страдающих
гипертонической болезнью 1Б — НА
стадии (мужчины, средний возраст 48,2
года).
К. ж. рекомендуется использовать
при психологических обследованиях
больных сердечно-сосудистыми заболеваниями.
КЕЛЛИ РЕПЕРТУАРНЫХ РЕШЕТОК
ТЕХНИКА (Repertory
Grid
Technique)
— метод изучения индивидуально-личностных
конструктов, опосредующих восприятие
и самовосприятие при анализе
личностного смысла понятий. Предложен
Г. Келли в 1955 г.
Понятие индивидуальной
системы конструктов относится к системе
отношений и установок человека к
миру. Согласно Г. Келли, «конструкт
можно представить себе как референтную
ось, основной параметр оценки… На
поведенческом уровне его можно
рассматривать как открытый человеком
способ поведения…» (Ф. Франселла, Д.
Баннистер, 1987). Описание конструкта, по
Г. Келли, удобнее всего провести в
биполярных понятиях, при этом конструкт
становится тем, «чем два или несколько
объектов сходны между собой и,
следовательно, отличны от третьего
объекта или нескольких других
объектов» (там же, с. 35). Биполяр-ность
конструктов дает возможность получить
матрицу взаимоотношений между
ними, позволяющую провести
различные процедуры латентного
анализа, который
выявляет структуру смысловых параметров,
лежащих в основе восприятия данным
человеком себя и других людей, объектов
и отношений.
Несмотря на внешнее сходство
некоторых процедур, общую направленность
на выявление «личностных смыслов» и
принадлежность к методам экспериментальной
психосемантики, К. р. р. т. радикально
отличается от метода семантического
дифференциала. В
технике, предложенной Ч. Осгудом,
используются заданные извне конструкты,
в то время как К. р. р. т. направлена на
выявление «собственных», индивидуальных,
создаваемых непосредственно в ходе
обследования конструктов. В отличие
от семантического дифференциала,
выбор конструктов и их значений
ограничивается «диапазоном
применимости». Принцип «диапазона
применимости» является вторым (вместе
с принципом биполярности) фундаментальным
принципом К. р. р. т., подчеркивающим,
что каждый конструкт может быть
применен к ограниченному набору
(репертуару) объектов (элементов).
Техника репертуарно-матричного
тестирования представляет собой
реализацию индивидуально-ориентированного
подхода к субъективному шкалированию.
При этом целью является не столько
сравнение оценок испытуемого с
нормативными данными, сколько
реконструкция индивидуальной системы
смысловых единиц, обобщений,
противопоставлений, лежащих в основе
объективного отношения к себе и
окружающим, выявление уникальных,
непохожих на групповые, конструктов
(принцип индивидуальности).
Репертуарно-матричные
методики являются перспективным
направлением развития современной
психосемантики и психодиагностики. В
советской психоло-
гии репертуарно-матричные
методики являлись объектом широких
теоретических и экспериментальных
исследований (П.Н.Козлова, 1975; В. И.
Похилько, 1987; В. В. Столин, 1983). Сегодня
такие методики широко распространены
в психодиагностических исследованиях,
чему способствовало широкое внедрение
компьютеров в психологические
исследования.
КЛИНИЧЕСКОГО АНАЛИЗА
ОПРОСНИК {Clinical
Analysis
Questionnaire,
CAQ)
— опросник личностный. Относится
к группе опросников факторных. Направлен
на исследование личностных факторов
как в клинических условиях, так и обычной
популяции подростков и взрослых (от 16
лет). Предложен С. Круг в 1980 г.
К. а. о. оценивает два набора
переменных. К первому относятся 16
факторов опросника Р. Кэттелла (см.
«Шестнадцать
личностных факторов» опросник). Ко
второму набору относятся следующие
12 клинических факторов:
D1.
Ипохондрия D2.
Суицидальная
депрессия
D3.
Тревожность D4.
Тревожная депрессия
D5.
Вялаядепрес- D6.
Чувство вины сия и обида
В7.Тоскаизамк- Ра. Паранойя
нутость
Pp.
Психопатиче- Sc.
Шизофрения екая девиация
As.
Астения Ps,
Психологиче-
ская неадекватность
В первой части опросника
содержится 120 заданий, направленных на
измерение известных личностных факторов
Р. Кэт-телла вместе с 8 дополнительными
заданиями по фактору
интеллекта (фактор
«В»), Во второй части
содержится 144 задания. За исключением
шкалы «В», задания представляют собой
утверждения, предполагающие выбор
одного из трех ответов: «верно», «не
уверен», «неверно*. Время обследования
— 2 часа, однако для депрессивных
испытуемых время для ответов на
вопросы может быть продлено. Имеются
нормы для мужчин и женщин.
Наиболее интересной в
практическом и теоретическом смысле
является оригинальная вторая часть
К. а. о., поскольку в ней оцениваются 12
факторов личностных отклонений,
выделенных в свое время Р. Кэттеллом
(1973) и не нашедших реализации в других
тестах. Эти факторы были получены из
трех источников: путем анализа текстов
по психиатрии с выделением описаний
разных вариантов аномального
поведения; клинического подтверждения
выделенных вариантов; факторного анализа
данных 16 PF
и MMPI
{см. Миннесотский
многоаспектный личностный опросник).
Оценка факторов методики
16 PF
в К. а.о. является не
вполне адекватной, поскольку на каждый
фактор приходится только 8 заданий. По
этой причине шкалы К. а. о. являются
недостаточно надежными для
индивидуального обследованияг Это
отчасти признает и разработчик, который
рекомендует в тех случаях, когда имеется
такая возможность, применять опросник
16 PF
вместо первой части
К. а. о. Надежность
второй части К. а. о.,
по мнению П. Клайна, достаточна для
индивидуальных клинических обследований.
Доказательства валидности
второй части опросника
неубедительны. В руководстве к
опроснику представлены данные
обследования небольших по численности
клинических групп. Имеются сведения
об анализе валидности факторной К. а.
о., подтверждающие факторную структуру
теста.
Сведений об использовании
в СНГ нет.
КОДИРОВАНИЕ ОЦЕНОК
ТЕСТОВЫХ — элемент
процедуры обработки данных
психодиагностического
обследования. Применяется
в многопарамет-ровых тестовых
батареях, опросниках личностных, других
методиках, предусматривающих
представление результата в виде оценок
профильных.
К. о. т. дает возможность
более экономного и краткого описания
совокупности оценок
шкальных, профиля
шкал, а также более четкой и быстрой
разбивки материала на клинически (или
характерологически) сходные группы.
К. о. т. способствует выявлению в
изучаемой группе наиболее общих
характеристик и закономерностей.
Формализация комплексных тестовых
оценок является важным элементом
создания банка данных и автоматизированной
обработки данныхобследо-вания (см.
Психодиагностика
компьютерная).
Примером К. о. т. может служить
процедура шифровки данных Миннесотско-го
многоаспектного личностного опросника
(MMPI).
Код MMPI
представляет собой
обозначение профиля с последовательным
перечислением шкал (начиная с самых
«высоких») с использованием их порядкового
обозначения для шкал клинических и
буквенного — для шкал
контрольных. Существует
несколько вариантов К. о. т. профиля
MMPI.
Наиболее детальным
является метод Г. Уэлша. Определение
кода осуществляется в несколько
этапов:
1. Все клинические шкалы
перечисляются с использованием их
цифрового обозначения слева направо
в таком порядке, чтобы на первом месте
находилась шкала, которая является в
данном профиле ведущим пиком, а затем
— остальные по мере снижения (рис. 32).
2. Обозначается высота шкал
профиля в зависимости от выраженности
результата в Т-баллах (см. Оценки
шкаль-
Рис.32. Кодирование «профиля
личности»
Миннесотского многоаспектного
личностного
опросника по Г. Уэлшу
ные). Результат
по отдельным шкалам выражается
следующим образом:
Используя эти обозначения,
можно отделить шкалы, расположенные в
различных сигмах графика {сигмы
разделяют на профиле десятки стандартных
делений Т). Если между шкалами 2 и
более сигм, то следует перечислить
пропущенные сигмы. Напр., если 2-я
шкала находится выше 90 Т, а следующая
3-я — между 80 и 70, то следует записать
2″3′ и т. д.
3. Шкалы, расположенные на
одном уровне, записываются согласно
порядковому номеру и подчеркиваются
одной линией. Если разница показателей
шкал в Т единицах не превышает одного
балла, то они также подчеркиваются,
однако первой из них становится
расположенная
выше, независимо от порядкового
номера (21 — если 2-я имеет результат
68 Т, а 1-я —67 Т).
4. Шкалы достоверности
перечисляются начиная с наиболее
высоко расположенной, между ними
ставятся обозначения сигм.
Кроме описанного метода К.
о. т. существует процедура, предложенная
С. Хату-эем, при которой шкалы, расположенные
между 46 и 54 Т, не записываются совсем,
шкалы выше 70 Т отделяются знаком (‘), а
те, что расположены ниже 46 Т — знаком
(-). Контрольные шкалы (без шкалы «?»)
пишутся в порядке их расположения на
графике в числовом выражении (в сырых
баллах). При этом если результат по шкале
превышает критические значения (см.
Шкалы контрольные),
перед обозначением
шкалы ставится косой крест, чтобы
обратить внимание на недостоверность
профиля. Напр., х 6 : 20 : 8.
Приведенный на рис. 32 профиль,
закодированный по С. Хатуэю, выглядит
следующим образом: 234187′ — 93 : 12 : 13.
Приведенные способы в
соответствующей модификации могут
быть перенесены на шифровку данных
других методик, напр, тестов
интеллекта. Приемы
кодирования применимы в тех случаях,
когда результаты отдельных субтестов
выражаются в единых шкалах
измерительных.
КОЛУМБУС (The
Columbus)
— проективная
методика исследования
личности. Предназначена для работы
с обследуемым в возрасте от 7 до 20
лет. Разработана М. Ланживельд в 1976 г. в
качестве альтернативы детской
апперцепции тесту.
Материал теста представляет
собой 24 картины, из них 3 цветные и 21
черно-белая; только две из них (№ 17,
^предназначены специально для
тестирования лиц женского пола, остальные
можно ис-
пользовать для всех
обследуемых. Нумерация картин не
определяет последовательность их
предъявления. Количество и конкретный
набор варьируются в зависимости от
возраста и целей исследования. Задача
испытуемого традиционна для такого
типа методик — составление рассказа
по картине.
Предлагается феноменологическая
интерпретация полученного при помощи
К. материала. Анализируются следующие
аспекты:
I.
Общие категории: 1)
эффективность-эмоциональность; 2)
особенности материала ‘
(сложный/примитивный);
3) структура, форма изложения (а)
логическая, историческая, анекдотическая,
сентиментальная и др.), (б) недостаточная
упорядоченность материала; 4) качество
изложения (ясное/смутное, изощренное/простое).
II.
Личностные проблемы:
1) отношение к
настоящему; 2) отношение к себе, к другим,
к миру объектов; 3) отношение к будущему.
Подчеркивается прогностическая
направленность методики. С ее помощью
предлагается изучать отношения ребенка
в семье и с ровесниками, особенности
его развития и взросления.
Сведений об использовании
в СНГ не имеется.
КОМРЕЯ ЛИЧНОСТНЫЕ ШКАЛЫ
(Comrey
Personality
Scales,
CPS)
— опросник
личностный, относится
к группе опросников
факторных. Предложен А. Комреем в 1970 г.
Общее количество вопросов—180,
ответы даются по 7-балльной шкале. К. л.
ш. включают 8 личностных шкал и две шкалы
контрольные. К
личностным относятся шкалы:
— Доверия—скрытности;
— Дисциплинированности—недостатка
контроля;
— Социального
конформизма—непокорности;
— Активности—недостатка
энергии;
— Эмоциональной
стабильности—невротизма;
— Женственности—мужественности;
— Эмпатии—эгоцентризма;
— Экстраверсии—интроверсии.
Для контроля используются:
шкала, оценивающая логичность ответов,
и шкала, определяющая выраженность
установки на социально одобряемые
ответы. Имеются нормы, рассчитанные
на выборке 365 мужчин и 362 женщин, с учетом
половых различий. Возрастные границы
— 16-60 лет.
Шкалы А. Комрея представляют
интерес, поскольку при их создании
автор исходил из предположения о том,
что имеющиеся к моменту разработки
факторно-аналитические тесты (см.
Объективные шкалы)
недостаточно эффективны
из-за представленности в них наборов
разнородных факторов.
При факторизации методики
низкая надежность отдельных элементов
неблагоприятно влияет на данные
факторного анализа. Для устранения
этого А. Комрей разместил факторно и
семантически сходные вопросы в группы
— факторизо-ванные гомогенные области
вопросов (factored
homogeneous
item
dimensions,
FHID).
Такие группы выступают
скорей как переменные, а не элементы,
подверженные факторному анализу. В
каждую гомогенную область попало по 4
вопроса; каждой личностной шкале
соответствовало 5 гомогенных областей
вопросов.
Надежность частей теста
личностных шкал
составляет 0,90 (за исключением шкалы
мужественности, где этот показатель
равен 0,87). Е. Хатварт (1978) считает К. л. ш.
одним из наиболее удачно факторизованных
тестов. Использование 7-балльной
шкалы также повышает надежность методики.
При анализе факторной
валидности К. л. ш. была обнаружена
определенная близость между факторами
А. Комрея и факторами второго порядка
опросника 16 PF
(см. «Шестнадцать
личностных факторов» опросник). П.
Ноллер с со-авт. (1987) проанализировал
факторы, выделенные А. Комреем, Р.
Кэттеллом и Г. Айзенком (см. Айзенка
личностные опросники) в
совокупности. Обнаружено 7 общих факторов
и подтверждена валид-ностъ
т. н. «Большой пятерки»
факторов. По мнению П. Клайна, К. л. ш.
достаточно надежны на уровне факторов
второго порядка и хорошо оценивают
базовые измерения личности —
экстраверсию и тревожность.
Данных об использовании в
СНГ не имеется.
КОНТАМИНАЦИЯ КРИТЕРИЯ
—
комплекс явлений, связанных
с влиянием информации о результатах
психодиагностического
обследования испытуемого
на субъективное отношение к нему со
стороны других лиц. Так, если педагогу
становится известно, что данный
учащийся недостаточно успешно справился
с тестом достижений по отдельному
предмету (что чаще всего свидетельствует
о недостаточном овладении лишь
некоторыми разделами программы), это
может соответствующим образом
сказаться на субъективной оценке
дальнейшей учебной деятельности
ученика как в области измеряемых учебных
достижений, так и в более широкой оценке
успеваемости и поведения ученика.
Влияние К. к. будет тем более
выраженным, чем больший авторитет
имеет данная методика среди пользователей
результатами обследования, чем
большей валидностью
очевидной она обладает.
Существенную роль в проявлении К. к.
играет совпадение ожиданий и мнений,
сформировавшихся по тем или иным при-
чинам у других лиц в отношении
общих способностей, успешности учебной
или профессиональной деятельности
тестируемого с результатом тестового
обследования. Явление К. к. может
играть негативную роль в любых сферах
психологической диагностики. Его
наличие подчеркивает необходимость
соблюдения норм этики в психодиагностических
обследованиях.
В более частном виде явление
К. к. рассматривается при определении
валид-ности критериальной
методик с помощью
сравнения результатов теста и экспертных
оценок изучаемой деятельности.
При этом знание результата
испытуемого по тесту сказывается на
оценке его успехов в реальной деятельности.
Поэтому обязательным требованием
процедуры выявления валидности
критериальной является отсутствие
у экспертов информации о результатах
обследования.
КОНТЕНТ-АНАЛИЗ — метод
систематизированной фиксации и
квантификации единиц содержания в
исследуемом материале. Применяется
начиная с 20-х гг. нынешнего столетия
для обработки материалов средств
массовой коммуникации, анализа некоторых
социально-психологических явлений
в больших социальных группах. В настоящее
время метод широко распространен в
социальной психологии и социологии.
В методическом аспекте К.
а. находит применение в трех качествах:
как основной метод, направленный на
получение наиболее важной информации
об изучаемом явлении; как параллельный
метод, применяемый в комплексе с другими;
как вспомогательный метод или процедура
обработки данных, полученных при других
исследованиях. В последнем качестве К.
а. наиболее часто используется в
психологической диагностике.
В психологии метод, близкий
к К. а., применялся К. Юнгом для анализа
результатов ассоциативного теста.
Использование К. а. в психологии и
психодиагностике базируется на его
направленности на анализ речевых
сообщений испытуемого, сопровождающих
практически любое обследование,
особенно при индивидуальной процедуре.
Особым достоинством К. а. является то,
что он нередко позволяет выявить и
объективизировать скрытую тенденцию
в ответах и других видах информации,
характеризующих испытуемого,
относительно точно регистрировать
внешне неразличимые показатели в
объемных массивах эмпирических данных.
Конкретные направления применения
К. а. включают: 1) анализ результатов
проективных методик
исследования личности;
2) изучение диагностических интервью,
содержания бесед, другой речевой и
письменной продукции испытуемого;
3) анализ содержания открытых вопросов
при массовом анкетировании; 4) изучение
психологических особенностей личности
по качественным характеристикам,
развернутым экспертным оценкам; 5)
анализ объективной информации о личности;
6) анализ высказываний при_ диагностике
особенностей групповой коммуникации.
В целях диагностики некоторых
личностных особенностей (тревожность,
не-вротизация и др.) проводится
своеобразный К. а. грамматических и
стилистических конструкций речи
испытуемого (напр., количество
«тематических» высказываний, глаголов,
логических «гнезд» и т. д.), что часто
находит применение в «завершение
предложения» методиках.
Проведение К. а. в любом из
направлений требует выполнения ряда
требований к организации его этапов
и процедур. Наиболее важным является
определение категорий анализа — ключевых
элемен-
тое, регистрируемых в
соответствии с задачами исследования
или обследования. Такие категории
(напр., количество речевых актов
взаимодействий, побуждающих высказываний,
частота отражения отдельных тем:
«болезнь», беспокойство по поводу
«карьеры»; «семьи» и т.д.) должны быть
исчерпывающими, охватывать все части
фиксируемого содержания. В случае
включения К. а. как элемента процедуры
обработки данных теста критерий должен
быть четко формализован и «стандартизирован»
в целях однозначности его характеристики
лицами, проводящими исследование.
После выделения регистрируемых
категорий определяются соответствующие
им единицы анализа — лингвистические
единицы речи или элементы содержания,
экспрессивные элементы речевой продукции
(слова, суждения, темы, интонации,
описываемые или наблюдаемые ситуации).
Наконец, выделяются единицы квантификации
(частота появления анализируемых
единиц в определенном объеме
информации). Эти исходные данные
составляют инструкцию по обработке
— алгоритм кодирования.
Источниками информации для
К. а. могут служить различные виды речевой
продукции, материалы и’документы, прямо
или косвенно характеризующие изучаемые
особенности личности. Наиболее
существенными ограничениями при
выборе источников информации является
частота встречаемости необходимых
данных и возможность их квантификации.
При проведении К. а. первичная
информация обычно оформляется в виде
таблицы частот встречаемости
регистрируемых элементов в источнике
данных (табл. 6).
Процедура статистической
обработки результатов К. а. во многом
близка изучению ассоциации (см.
Корреляции коэффициенты
дихотомические) и
ранжированию данных. Предложена
специальная
Таблица 6 Кодировочная
матрица контент-анализа
Источник информации (данные
по отдельным испытуемым)
Категория |
1 |
2 |
3… |
… |
ь |
А |
4 |
7 |
11 |
||
В |
13 |
15 |
28 |
||
С |
2 |
1 |
3 |
процедура подсчета с помощью
коэффициента Яниса (С). При помощи
этого коэффициента может быть установлено
соотношение положительных и отрицательных
оценок относительно определенных
категорий:
где / — число положительных
оценок; п —
число отрицательных оценок; г — объем
единиц информации, отражающей изучаемую
категорию; t
— общий объем единиц
анализируемого источника информации.
При К. а. содержания информации
представляет интерес метод Ч. Осгуда,
направленный на выявление случайных и
неслучайных элементов содержания. Этот
вид анализа очень прост и включает
подсчет числа элементов каждого типа
и числа совместных их наблюдений. На
основании этих исходных данных
вычисляется математически ожидаемая
вероятность совместного появления
Если обнаруженное число
совместных появлений единиц (fAB
или fABC
… О существенно
больше, чем ожидаемое, то можно
предположить, что возникшие сочетания
не случайны. Установленная та-
ким образом гипотеза может
быть проверена с помощью других
статистических и эмпирических методов.
Статистические методы К.
а. применимы для относительно больших
массивов данных и имеют значение в
основном при проведении серии
психодиагностических исследований.
В индивидуальных обследованиях
применяются бо.лее простые процедуры
регистрации К. а,
КОНТРАСТНЫЕ ГРУППЫ —
эмпирические выборки испытуемых,
различающиеся по определенному
набору критериев (см. Валидизации
критерий). Как правило,
в К. г. подбираются лица с максимальным
и минимальным проявлением критериальных
признаков.
Метод подбора К. г. является
распространенным средством
конструирования опросников
эмпирических (см.,
напр., Миннесотский
многоаспектный лич-костный опросник.
Калифорнийский психологический
опросник). К. г. часто
используются как прием установления
валидности
психодиагностических
методик (см. Валидностъ
критериальная), а
также дискриминативности тестовых
процедур.
Основная сложность
комплектации К. г. состоит в выборе
адекватного критерия. Нередко
идеальный случай подбора полностью
противоположных признаков в группах
практически неосуществим. Так, при
конструировании основных клинических
шкал Миннесотского многоаспектного
личностного опросника ответы на вопросы
сравнивались в группах, отобранных по
клиническому признаку и в выборке
здоровых лиц, в то время как идеальные
К. г. состояли бы из испытуемых с
«зеркально» противоположными
клиническими проявлениями. Методические
затруднения при применении процедуры
К. г. связаны и с тем, что практически
невозможно формирование выборок
испытуе-
мых, строго отличающихся
друг от друга наличием или отсутствием
только определенных, контролируемых
в эксперименте групп факторов.
КОРРЕКТУРНАЯ
ПРОБА
(Durch-streich-Test,
Test de barrage, Bourdoh-Test) — бланковый
тест
скорости.
Методика
исследует степень концентрации и
устойчивость внимания. Предложена Б.
Бурдоном в 1895 г.
Обследование проводится с
помощью специальных бланков с рядами
расположенных в случайном порядке
букв. Испытуемый просматривает ряд
и вычеркивает определенные указанные
в инструкции буквы. Результаты пробы
оценивают по количеству пропущенных
(незачеркну-тых) букв или других знаков,
а также по времени выполнения заданного
количества строк.
Важным показателем является
характеристика качества и темпа
выполнения (выражается числом проработанных
строк и количеством допущенных ошибок
за каждые 30- или 60-секундные интервалы
работы). К. п. используется в качестве
методики оценки темпа психомоторной
деятельности, работоспособности и
устойчивости к монотонной деятельности,
требующей постоянного сосредоточения
внимания.
Наиболее известными
модификациями К. п. являются кольца
Ландольта (корректурный бланк содержит
случайный набор колец с разрывами,
направленными в различные стороны (рис.
33). Такой вариант К. п. более удобен
для обследования детей младшего
возраста); проба Иванова-Смоленского
(набор различных вариантов сочетаний
букв). Направлен на оценку уровня
переключаемости внимания, некоторых
динамических особенностей высшей
нервной деятельности.
Результаты выполнения К.
п. легко выразить количественно. Так,
уровень
где So
— количество ошибочно обработанных
строк; S
— общее количество
строк в проработанной
испытуемым части таблицы. При оценке
переключаемости внимания испытуемый
получает инструкцию вычеркивать
разные наборы знаков в четных и нечетных
строках корректурной таблицы.
К. п. относится к числу
наиболее известных и давно применяемых
в экспериментальной и прикладной
психологии методов оценки внимания
и психомоторных особенностей. Различные
модификации К. п. до настоящего времени
широко применяются в области
клинической, профессиональной,
школьной психодиагностики благодаря
простоте и надежности отражения
особенностей внимания и функционального
состояний,
работоспособности
испытуемого.
КОРРЕЛЯЦИИ КОЭФФИЦИЕНТЫ
ДИХОТОМИЧЕСКИЕ —
показатели связи признаков (переменных),
измеряемых по дихотомической шкале
наименований (см. Шкалы
измерительные). По
этой шкале признаки выражаются
альтернативными определениями
(нормаль-
ное развитие психического
свойства— задержка; соответствие—несоответствие
ответа на вопрос «ключу»;
принадлежность—-непринадлежность
испытуемого какой-либо диагностической
группе и т.д.). Наиболее распространенный
случай в психологической диагностике
— коррелирование альтернативных
вопросов в личностном опроснике с
общим его результатом (см. Дискриминативность
заданий теста).
При корреляционном анализе
дихотомических переменных используются
несколько коэффициентов. Так, при
наличии альтернативных признаков в
двух сравниваемых рядах коэффициент
произведения моментов Пирсона {гху)
(см. Корреляционный
анализ) упрощается,
принимая следующий вид:
Коэффициент ф удобен при
расчете надежности
ретестовой, а также
анализа устойчивости ответов на
пункты (задания) и степени их трудности,
что особен-
но ценно при конструировании
тестов. Применяя коэффициент ф и определив
соответствие данных в сравниваемых
сериях (тест—ретест), можно одновременно
Таблица 7
Вычисление коэффициента
ассоциации
Пирсона при сравнении
параллельных
форм опросника
оценить степень оптимальности
задания по силе (трудности) (см. Трудность
заданий теста). Значение
ф обратно пропорционально отношению
частоты правильных и неправильных
ответов! Пограничные варианты (задачи,
решаемые всеми, и задачи чрезмерно
сложные, решаемые относительно
небольшим числом обследованных)
обычно исключаются из теста как
неинформативные и неустойчивые.
Пороговой величиной неустойчивости
пункта теста
является превышение значения ^1-<р =
0,71 (ф< 0,05).
При анализе опросников
личностных с
дихотомической формой ответов («да»—
«нет*, «верно*—«неверно» и т. д.)
составляемая в ходе расчета коэффициента
ф четырехклеточная матрица позволяет
установить несимметричное распределение
утвердительных и отрицательных ответов.
При анализе четырехклеточных
ассоциаций используется также
коэффициент Юла:
Этот коэффициент, в отличие
от ф, выражает одностороннюю связь,
т. е. влияние одного признака «на
другой (в примере из табл. 7 — влияние
тестового результата на вывод об
уровне развития). Значение Q
варьирует от -1 до +1.
При Q
= 0 признаки независимы,
Q
— 1 свидетельствует
о положительной зависимости (всем Х~1
соответствует К=1);
При Q
= -1 —связь отрицательная.
В силу того что Q
выражает одностороннюю
связь, его значения обычно превышают
значения ф
(в примере ф = 0,36; Q
= 0,67). В настоящем
разделе рассмотрены случаи определения
корреляции двух дихотомических
переменных, Когда одна из переменных
дихотомическая, а другая выражена в
шкале интервалов или
отношений (см. Шкалы
измерительные), используются
коэффициенты корреляции бисериальные
(см. Корреляция
бисериальная).
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
—
комплекс методов статистического
исследования взаимозависимости
между переменными, связанными
корреляционными отношениями.
Корреляционными (лат. correlatio
— соотношение, связь, зависимость)
считаются такие отношения между
переменными, при которых выступает
преимущественно нелинейная их
зависимость, т. е. значению любой
произвольно взятой переменной одного
ряда может соответствовать некоторое
количество значений переменной
другого ряда, отклоняющихся в ту или
иную сторону от среднего.
К. а. выступает в качестве
одного из вспомогательных методов
решения теоретических задач
психодиагностики и включает в себя
комплекс наиболее широко применяемых
статистических процедур при разработке
тестовых и других психодиагностических
методик, определения их надежности,
валидности. К. а.
является одним из основных методов
статистической обработки эмпирического
материала в прикладных психодиагностических
исследованиях.
Существующие процедуры К.
а. позволяют определить степень
значимости связи, установить меру и
направление влияния одного из признаков
(X)
на результирующий
признак (У) при фиксированном значении
отдельных переменных (корреляция
частная), выявить степень и направленность
связи результирующего признака (Y)
с совокупностью переменных jcj,
х2,
-.- , xk
(корреляция
множественная). К. а. подлежат как
количественные, так и качественные
признаки (к первым относятся переменные,
измеряемые в интервальной шкале и
шкале отно-
шений, ко вторым — не имеющие
единиц измерения, оцениваемые шкалами
наименований и порядковыми шкалами)
(см. Шкалы измерительные).
Может быть ■также
установлена корреляция и для признаков,
один из которых является качественным,
а другие количественными (корреляция
бисериальная, корреляция качественных
признаков).
Одним из основных принципов
определения количественных критериев
корреляционной связи — коэффициентов
корреляции — является сравнение
величин отклонений от среднего значения
по каждой группе в сопряженных парах
сравниваемых рядов переменных.
Другими словами, определяется частота
соответствия между шкалами X
и У. Предположим, один
и тот же испытуемый получил высокие
оценки по тесту
вербальных способностей
(Х{)
и показателям
успеваемости
по литературе (У^). Тогда
произведения отклонений x,Jc
и у{у принимают
высокие положительные значения. Если
же большому х1
у другого испытуемого
будет соответствовать малое у^,
то это произведение будет отрицательным.
Абсолютная величина произведения
отклонений зависит от степени
отклонения переменных от среднего
значения в сравниваемых парах. Если А»
и У не имеют систематической связи
(большие х сочетаются
с малыми у и
наоборот), различные произведения будут
принимать положительные или отрицательные
значения. Сумма произведений во в£ех
сравниваемых парах
будет приближаться к нулю.
Сумма произведений в сравниваемых
рядах перемен-
ных будет иметь большую
величину по модулю и положительный
знак, если X
и Y
связаны между собой
выраженной прямой зависимостью, и
большую величину и отрицательный
знак при связи X
и Y
сильной обратной
зависимости.
С целью достижения
независимости меры корреляционной
связи от числа сравниваемых пар и величин
стандартных отклонений в двух группах
произведение отклонений делится на
число сравниваемых пар и стандартные
отклонения в сопоставимых рядах. Такая
мера носит название коэффициента
корреляции — произведения моментов
Пирсона:
где Х[ и
yi
— сравниваемые
количественные признаки, п
— число сравниваемых
наблюдений, ах
и ау
— стандартные
отклонения в сопоставимых рядах.
Расчетная формула гху
имеет следующий вид:
При вычислении коэффициента
Пирсона, особенно при большом
количестве наблюдений, целесообразно
упрощение за счет различных приемов,
сокращающих объем вычислений. В
качестве примера приводим расчет
результатов двух тестов в группе из 10
обследованных (табл. 9).
Определение статистической
зависимости коэффициента гху
проводится с помощью
критерия Стьюдента (t):
где п’ —
число степеней свободы {п’
= п — 2). По таблице
распределения Стьюдента для п’-8
находим £ = 2,896 при а
■ 0,02 и * = 2,306 при а = 0,05. Отсюда статистическая
значимость установленного значения
корреляции признаков на уровне а >
0,02.
При возведении коэффициента
корреляции Пирсона в квадрат получаем
коэффициент детерминации г2ху
, выражающий степень
вариации переменных. В нашем примере
г2ху
— 0,48, что свидетельствует
о том, что 48% измерений признаков
объясняются их совместным распределением
(взаимовлиянием),
КОРРЕЛЯЦИЯ БИСЕРИАЛЬНАЯ
(лат. bis
series
— два ряда, две серии) — метод
корреляционного
анализа отношения
переменных, одна из которых измерена
в дихотомической шкале наименований,
а другая — в интервальной шкале отношений
или порядковой шкале. Название метода
связано с тем, что сравниваются две
альтернативные серии объектов X,
имеющие условные
значения 0 или 1 по Y.
Наиболее характерно
применение коэффициентов К. б. в
психологической
диагностике при
анализе дискримина-тивности
заданий теста, а также
при определении валидности
критериальной путем
коррелирования значений тестовых
оценок с независимыми характеристиками
критерия, выраженными в дихотомической
шкале (см. Шкалы
измерительные).
Для описания связи между
перечисленными видами переменных
используется точечный бисериальный
коэффициент корреляции Пирсона:
объектов со значением нуль
по У; Sx
— стандартное
отклонение всех значений по X;
rtj
— число объектов, с единицей по У: щ
— число объектов с
нулем по У, т. е. п = П[
+ п0.
Уравнение для вычисления
грЬ
представляет собой
алгебраическое упрощение формулы
коэффициента гху
(см. Корреляционный
анализ) для случая,
когда У— дихотомическая переменная.
Можно привести ряд других эквивалентных
выражений, удобных для практического
применения:
Значение грЬ
варьирует от -1 до +1.
В том случае, когда переменные с единицей
по Y имеют
среднее по X,
равное среднему
переменных с нулем по У, грЬ
обращается в нуль.
В качестве примера можно
привести вычисление г
ь
при анализе
дискримина-тивностн отдельных пунктов
опросника личностного,
т. е. корреляции между
типичным ответом на отдельный пункт
(утверждение—отрицание) с общим
результатом по тесту (табл. 10).
Вычисленное таким образом
значение грЬ
показывает, что
проверяемый пункт опросника имеет
среднюю диагностическую значимость
и слабо коррелирует с общим результатом
теста.
Достоверность (а) связи,
рассчитанной с помощью коэффициента
грЬ,
может определяться
с помощью критерия Я2
для числа степеней свободы df
= 2.
Другим распространенным
методом расчета является определение
бисериаль-ного коэффициента корреляции
(гш),
который применяется в тех случаях,
когда
есть основания полагать,
что дихотомическое распределение
близко к нормальному:
Элементы уравнения идентичны
используемым при вычислении грЬ,
за исключением величины
U —
ординаты
Таблица 10
Вычисление точечного
бисериального коэффициента корреляции
Пирсона
КОРРЕЛЯЦИЯ КАЧЕСТВЕННЫХ
ПРИЗНАКОВ — метод
анализа связи переменных, измеряемых
в порядковых шкалах и шкалах наименований
(см. Шкалы измерительные).
Наиболее час-го такой
корреляционный анализ
проводят с помощью
коэффициентов корреляции
ранговой, используемых
в случаях, когда обе переменные измеряются
ег
шкалах порядка
или легко могут быть преобразованы
в ранги. При измерении сравниваемых
переменных в шкалах наименований
широко применяются коэффициенты
сопряженности, в которых в качестве
промежуточной расчетной величины
используется критерий согласия
Пирсона (см. Критерий
X2).
Наиболее часто в
таких расчетах пользуются коэффициентом
сопряженности Пирсона:
Значение Р
всегда положительно
и измеряется от нуля до единицы.
Особенностью коэффициента сопряженности
Пирсона является то, что максимальное
его значение всегда меньше +1 и в
значительной степени зависит от
количества наблюдений (размера
таблицы). В случае квадратной таблицы
(k x
k)
где t
— число столбцов
таблицы, k
— число строк
таблицы.
В психологической
диагностике описанные
коэффициенты используются относительно
редко.
КОРРЕЛЯЦИЯ РАНГОВАЯ —
метод корреляционного
анализа, отражающий
отношения переменных, упорядоченных
по возрастанию их значения. Наиболее
часто К. р. применяется для анализа
связи между признаками, измеряемыми
в порядковых шкалах (см. Шкалы
измерительные), а
также как один из методов определения
корреляции качественных
признаков. Достоинством
коэффициентов К. р. является возможность
их использования независимо от
характера распределения коррелирующих
признаков.
В практике наиболее часто
применяются такие ранговые меры
связи, как коэффициенты К. р. Спирмена
и Кендалла. Первым этапом расчета
коэффициентов К. р. является ранжирование
рядов переменных. Процедура ранжирования
начинается с расположения переменных
по возрастанию их значений. Разным
значениям присваиваются ранги,
обозначаемые натуральными числами.
Если встречаются несколько равных
по значению переменных, им присваивается
усредненный ранг (табл. 12).
В табл. 13 приведены данные
для расчета коэффициентов К. р. Во
второй графе представлены ранжированные
показатели по первому из сравниваемых
распределений (оценка IQ,
в третьей графе
— соответствующие им данные теста
зрительной памяти-).
Коэффициент корреляции
рангов Спирмена (rs)
определяется из
уравнения:
ент х более
информативен, чем rs,
и рассчитывается
проще. Поэтому на практике при расчете
К. р. отдают предпочтение коэффициенту
т.
КОСА КУБИКИ —
невербальный тест
интеллекта. Предложен
К. Косом в 1920 г.
Испытуемому предлагают
составить фигуры из цветных кубиков по
рисункам-образцам. Тестовый материал
состоит из шестнадцати кубиков с ребром
2,5 см, стороны которых окрашены в
красный, белый, желтый и синий цвета.
Оставшиеся две противоположные грани
разделены по диагонали, причем одна
окрашена в белый и красный цвета, а
вторая — в синий и желтый (см. Векслера
интеллекта измерения шкалы, рис.
13). В набор включены восемнадцать
образцов фигур, первый из которых
является тренировочным и выполняется
совместно с испытуемым. Цвета
рисунков-образцов соответствуют цветам
кубиков, но размеры образцов вдвое
меньше. Образцы размещены посередине
картонной карточки, имеющей размер 10 х
7,5 см.
Задания следуют в порядке
возрастающей трудности, что
обеспечивается последовательной
комбинацией следующих условий:
— фигуру можно построить
только из одноцветных сторон кубиков;
— для построения фигуры
следует использовать несколько
двухцветных граней;
— фигуру можно сложить
только из двухцветных сторон или из
сочетания двухцветных и одноцветных,
причем на образце не обозначена граница
между соседними кубиками;
— образец повернут на 45°,
т. е. стоит на ребре;
— для составления фигур
требуется использовать все большее
количество кубиков;
— образцы постепенно
становятся все менее симметричными;
— увеличивается количество
цветов на образце;
— образец не ограничивается
рамкой, так что на краях сливается с
фоном. Образцы-рисунки испытуемому
предъявляются последовательно,тестирование
прекращается после пяти последовавших
друг за другом неудачных решений.
Успешность оценивается с нескольких
позиций. Самым важным показателем
является время решения отдельных
заданий. В протоколе фиксируется и
количество попыток при выполнении.
Первичные оценки по результатам
выполнения заданий переводятся в
показатель умственного
возраста. В более
поздних модификациях оценки переводятся
в IQ-показа-тели
стандартные. Данные
дополняются качественным анализом
поведения испытуемого.
К. к. принадлежат к часто
применяемым тестам и широко используются
как в оригинальной, так и в сокращенных
модификациях (см., напр., Векслера
интеллекта измерения шкалы). Ценность
теста определяется особенностями
деятельности испытуемого, которая
моделирует- -ся его заданиями. Испытуемый
начинает выполнение задания с анализа
образца, путем сопоставления фрагментов
образца с гранями кубиков. Затем
осуществляется генерализация
выделяемого признака. Вслед за этим
осуществляется переход к синтезу—констатация
соответствия между образцом и собранной
из кубиков фигурой. По мнению К. Коса, в
ходе решения заданий задействуются
все мыслительные процессы.
Имеются сведения о валидности
кон-структной К. к.
Получена значимая корреляция с
Вине—Симона умственного
развития шкалой (г =
0,82 у нормальных детей и г
= 0,67 у слабоумных
детей). Изучались связи показателей
К. к. с
основными тестами интеллекта,
в частности Станфорд—Бине
умственного развития шкалой (г
= 0,77), Равена прогрессивными
матрицами (г = 0,81).
Обращается внимание на независимость
друг от друга показателей К. к. и тестов
арифметических способностей.
Наиболее широкое применение
К. к. находят в клинической психодиагностике
(В. М. Блейхер, И. В. Крук, 1986). По данным
Л. Кошча (1976), тест весьма полезен при
работе с такими разнообразными
контингентами испытуемых, как творческие
личности с высоким уровнем способностей
и, с другой стороны, умственно отсталые
лица; дети с минимальной мозговой
дисфункцией, нарушением концентрации
внимания, нарушением пространственной
ориентировки; дети, страдающие
неврозами; дети с задержкой психического
развития, педагогически запущенные;
больные юношеского и зрелого возраста,
страдающие шизофренией. Тест может
использоваться и при анализе
интеллектуального потенциала здоровых
лиц.
В отечественной психодиагностике
К. к. используются чаще всего в том виде,
как они представлены в соответствующем
отдельно взятом субтесте Векслера
интеллекта измерения шкалы.
КОЭФФИЦИЕНТ АЛЬФА (а) —
ста
тистический показатель,
используемый при дисперсионном
анализе. Предложен
Л. Кронбахом (1971). Наиболее часто
применяется при оценке надежности
теста. Уравнение К.
А. имеет следующий вид:
дартных отклонений для
отдельных заданий. В том случае, если
в методике применяются задания
дихотомического типа («да»—«нет»,
«правильно»—«неправильно»), может
быть использована упрощенная формула:
где п —
количество заданий теста, а;2
— квадрат стандартного отклонения для
всего теста, Zct,-2
— сумма квадратов
стан-
где SPQ
= Xcy и Р
— доля испытуемых,
давших «ключевой» или правильный ответ,
а Q =
1 — Р.
Дихотомический вариант
К. А. является уравнением Кьюдера—Ричардсона
(см. Надежность частей
теста). Применение
К. А. основано на модели, предполагающей
наличие большой дисперсии (а стало быть,
и дискримина-тивности заданий теста)
скорее у надежного, чем у ненадежного
теста (см. Надежность
факторно-дисперсионная). Таким
образом, если при факторном
анализе возвести в
квадрат и просуммировать нагрузки
выявленных факторов, можно определить
надежность, поскольку нагрузки факторов
представляют корреляцию теста с
общими или специфическими факторами.
Модель надежности факторно-дисперсионной
близка к анализу надежности
по внутренней согласованности.
Факторно-дисперсионный
метод анализа надежности находится
в сильной зависимости от выбора
переменных, в связи с которыми
факторизуется тест. Так, если сопоставлять
тест математических способностей с
личностными или мотива-ционными
переменными, то оценка надежности
была бы неадекватной (практически
не было бы общих факторов). С другой
стороны, если бы тест факторизиро-вался
совместно с тестами общих способностей
так, чтобы каждый тест мог нагружать
соответствующие ему факторы, метод
надежности факторно-дисперсионной
мог бы быть достаточно
точным. Таким образом, эта модель
подходит для оценки надежности теста,
факторная валидность
которого известна
или задана прн разработке, а также
тестов, связанных с ограниченным
числом общих факторов.
КРИТЕРИАЛЬНО-КЛЮЧЕВОЙ
ПРИНЦИП — принцип
конструирования тестов на основе
обнаружения (эмпирического)
психологических признаков, позволяющих
дифференцировать релевантные
критериальные группы от контрольных.
Широко используется для конструирования
психодиагностических методик наряду
с факторно-аналитическим принципом.
Примером методик, в которых реализован
К.-к. п., являются опросники
эмпирические, такие
как Минне-сотский
многоаспектный личностный опросник,
«Бланк интересов»
Стронга (см. Опросники
интересов) и др.
Так, при разработке MMPI
из первоначального
банка утверждений в основные клинические
шкалы включались только те, которые
хорошо дифференцировали испытуемых с
тем или иным клиническим диагнозом от
контрольной группы здоровых людей
(см. Дискриминативность
заданий теста). В шкалы
«Бланка интересов» Стронга вошли те
утверждения из первоначального набора,
которые реально разделяли группы лиц,
являвшихся носителями определенных
интересов. Иногда задания, объединенные
общей шкалой в силу эмпиричности
конструирования, не имеют не только
теоретического, но даже интуитивного,
гипотетического объяснения.
В тех случаях, когда необходимо
дискриминировать группы, напр., в
профотборе, К.-к. п. является достаточно
эффективным.
В тестах, созданных в
соответствии с К.-к. п., основное значение
придается дис-криминативности. Важен
тот факт, что
тест является дискриминативным,
а не причина, по которой это происходит.
В связи с использованием К.-к. п.
конструирования тестов возникает
ряд проблем, которые должен решать
разработчик. К их числу в первую очередь
следует отнести трудности в отборе
критериальных групп. MMPI,
например,
разрабатывался, как указывалось выше,
путем сопоставления больных и здоровых,
однако- разработка шкалы шизофрении
(Sc)
или паранойи (Р&)
с большим успехом
могла бы опираться на сопоставление
группы больных с выраженными шизоидными
или паранойяльными тенденциями с
группой пациентов, у которых отмечаются
противоположные патологические
особенности, но это практически
нереально. Комплектование критериальной
группы больных опиралось на врачебный
диагноз, который разными специалистами
может восприниматься по-разному.
Сложность в отборе «чистых» групп для
сравнения ведет, в конечном итоге к
снижению надежности
и валид-ности
теста. (См. также
Контрастные группы.)
Другая проблема связана со
значительными трудностями, а иногда
и невозможностью психологической
интерпрета- ■ ции показателей тестов,
созданных в соответствии с К.-к. п.
Наиболее вероятным является то, что
одна критериальная группа отличается
от релевантной ей не одним, а несколькими
(иногда многими) переменными. Полученные
шкалы являются, таким образом, не
однозначными, а мультивариантными.
Следовательно, два идентичных показателя
могут иметь различную интерпретацию,
и не существует определенного способа-по
виду показателя установить, что
измеряет данная шкала. Факт, что тест
может дискриминировать группу X
от группы У, не
говорит ничего о природе переменной,
измеряемой тестом, если только мы не
располагаем доказательством, что
группы отлича-
ются одна от другой лишь по
одной переменной.
Результатам тестов,
разработанных на основе К.-к. п., присуща
известная специфичность, что также
является серьезным ограничением.
Например, если такой тест используется
для.отбора сборщиков электронной
аппаратуры, он будет разрабатываться
на основе конкретного критерия, связанного
с выполнением работы определенного
характера. Если содержание работы
изменится, разработанный на основе
неадекватных критериальных признаков
тест станет бесполезен. В противовес
этому тесты, ориентированные на базовые
способности, по-прежнему могут быть
использованы.
Факторный тест, относительно
«чистый» по исследуемым переменным
и опирающийся на теорию измеряемого
конструкта, как можно ожидать, будет
предпочтительней страдающих эмпиричностью
тестов, созданных в соответствии с К.-к.
п. Однако разработка факторно-аналитического
теста является технически более
сложной, трудоемкой задачей.
Не нужно противопоставлять
К.-к. п. конструирования тестов
факторно-аналитическому принципу;
следует помнить, что при подборе
первичного банка заданий разработчики
исходят, как правило, из описания некоего
свойства, конструкта, являющегося
объектом измерения. С другой стороны,
разработанный по К.-к. п. тест в последующем
может пройти процедуру факторизации.
«Эмпиричность* таких тестов
в значительной степени сглаживается
и последующей процедурой определения
валидное-ти конструктной.
Для методик, созданных в
соответствии с К.-к. п., наибольшее
значение имеют эмпирические модели
определения надежности (см. Надежность
ретестовая, Надежность параллельных
форм, Надежность частей теста).
КРИТЕРИЙ X2
(критерий согласия
Пирсона) — характеристика распределения,
используемая для проверки статистических
гипотез. Под статистическим критерием
подразумевается правило, обеспечивающее
с определенной вероятностью принятие
истинной или отклонение ложной
гипотезы. В качестве критериев в
математической статистике применяют
определенные случайные величины,
являющиеся функциями изучаемых
случайных величин и чисел степеней
свободы. Одним из
наиболее часто применяемых является
К. X2,
представляющий
собой сумму квадратов отклонений
эмпирических частот (р) от теоретических
или ожидаемых (p’)t
отнесенную к
теоретическим частотам:
При полном совпадении
эмпирических и ожидаемых частот S
(р — р’) = 0. При
несовпадении производится сравнение
эмпирической величины X2
с его критическим
значением, определенным по таблицам
(см. Приложение III,
табл. 3). Нулевая
гипотеза, которая предполагает, что
расхождение между эмпирическими
частотами и математическим ожиданием
носит случайный характер и между
вычисленными и эмпирическими частотами
разницы нет, опровергается, если X2
£ Х2Р
для принятого уровня
значимости (а) и числа
степеней свободы (df).
В качестве примера
проанализируем с помощью К. X
распределение частот
выбора ответа на закрытый пункт теста
(см. Задачи закрытого
типа). Предлагаемые
варианты неправильных ответов должны
быть примерно равновероятны. При
обследовании 100 человек, отвечающих на
проверяемый пункт неверно, результаты
распределились следующим образом
(табл. 14).
Степень свободы для данного
случая df =
п — I =4
(где п —
число вариантов ответа). По табл. 3
Приложения III
для а = 0,01 и df
~ 4 находим Х2кр
= 3,28. Полученное значение X2
= 9,5
меньше табличного. Следовательно,
при решении задачи может быть принята
гипотеза о примерно равновероятном
распределении выбора ответов а,
Ь, с, d, e.
При повторных
случайных выборках вероятность ложного
вывода составит 1 %.
В качестве другого примера
рассмотрим проверку нормальности
распределения тестовых оценок (см.
Оценка типа распределения).
Исходные данные
приведены в табл. 15, 16.
Число степеней свободы
определяется в данном случае исходя из
свойств нормального
распределения df=k—§
(ограничения
свободы вариации х,
Sx,
n). В результате
объединения частот в крайних классах
(см. ниже) число классов сократилось
с 9 до 7, тогда df
= 4. По таблице
критических значений X2
для а = 0,05 находим
%2кр
в 9,49, X2
< %2кр,
следовательно,
распределение тестовых оценок идет по
нормальному закону, расхождения между
эмпирическим и нормальным распределением
случайны и несущественны.
Как видно из данного примера,
для проверки гипотезы о законе распределе-
ния необходимо сопоставить
эмпирические и расчетные теоретические
частоты. Последние рассчитываются на
основании эмпирических данных по
формулам, описывающим тот или иной
закон распреде-
ления вероятностей. Так,
для проверки нормальности распределения
теоретические частоты рассчитываются
по формуле:
где пх
и я2
— объемы сравниваемых выборок, р{н
р2
— частоты первого и второго рядов.
Нулевая гипотеза сводится к тому, что
сравниваемые выборки взяты из одной
и той же совокупности
генеральной и,
следовательно, несовпадение между
частотами Р] и р2
носит случайный
характер.
К. X2
обычно используется
для проверки гипотез о соответствии
(согласии) эмпирического распределения
теоретическому (см. приведенные выше
примеры); при проверке гипотез о
статистической независимости признаков
(при Х2>Х^р
предложение об
отсутствии связи между признаками
отвергается). Теснота связи может быть
рассчитана с помощью коэффициента
сопряженности Пирсона (см. Корреляция
качественных признаков), при
подтверждении гипотезы об однородности
распределения признаков в разных
совокупностях (в этом случае нулевая
ги: потеза
формулируется как предположение о
сходстве распределения признака в двух
совокупностях генеральных, из которых
взяты независимые выборки объемами
п_ и nj:
Преимуществами К. X*
являются применимость
его для различных распределений
дискретных и непрерывных признаков,
необязательность предварительных
сведений о законе распределения
изучаемой переменной. При использовании
К. X2
следует учитывать
такие ограничения:
— сравниваемые выборки
должны быть получены из независимых
наблюдений;
— минимальное значение
эмпирической частоты не должно быть
менее 10, теоретической — менее 5. Если
это требование не выполняется,
необходимо увеличить объем выборки или
объединить интервалы группировки,
суммируя их частоты (см, выше пример
сравнения эмпирического и нормального
распределения).
КРОУНА—МАРЛОУ СОЦИАЛЬНОЙ
ЖЕЛАТЕЛЬНОСТИ ШКАЛА (Crow-ne—Marlowe
Social Desirability Scale, CM
SDS) — опросник
личностный. Разрабо-
тан Д. Кроуном и Д. Марлоу в
1960 г. для диагностики мотивации одобрения.
К.—М. с. ж. ш. состоит из 33
утверждений (18 социально одобряемых
и 15 социально неодобряемых образцов
поведения), с каждым из которых
испытуемый должен выразить, согласие
или несогласие. Примеры утверждений
(из русскоязычного варианта): 1. Я
внимательно читаю каждый документ,
прежде чем его подписать; 7. Иногда я
люблю позлословить об отсутствующих;
17. Были случаи, когда я
завидовал удаче других.
Каждый ответ, совпадающий
с ключом, оценивается в 1 балл. Итоговый
показатель мотивации одобрения
получают суммированием всех баллов.
Этот показатель характеризует
мотивационную структуру субъекта и, в
частности, степень его зависимости
от благоприятных оценок со стороны
других людей, его ранимость и
чувствительность к средовым и межличностным
влияниям. Иными словами, шкала
позволяет получить косвенную меру
потребности человека в одобрении со
стороны других людей,
Авторы шкалы руководствовались
стремлением разработать инструмент,
свободный от известной фиксированнос-ти
на патологических симптомах, что в той
или иной степени присуще ранее созданным
шкалам (см. Шкалы
контрольные). Кроме
того, была поставлена задача дифференциации
содержания утверждений от влияния
собственно мотивов.. Имеются данные
о достаточно высокой валидности
и надежности
К.—М. с. ж. ш.
В СНГ известен русскоязычный
сокращенный вариант шкалы (20
утверждений), стандартизированный
на выборке более 800 человек с последующей
проверкой валидности и надежности
(Ю. Л. Ха-нин, 1974, 1976). Шкала применяется:
при исследовании мотивации
одобрения; для контроля за степенью
установочного поведения и склонностью
к соответствующим искажениям ответов
в тестах (см. Установки
на ответ); при изучении
предпочтительных средовых и межличностных
влияний.
КРУГОЗОРА И ИНФОРМИРОВАННОСТИ
ТЕСТ — вербальный
тест интеллекта, предназначенный
для оценки общей осведомленности детей.
Разработан Й. Йирасеком в 1953 г.
Материал теста состоит из
40 вопросов, расположенных в порядке
возрастания трудности, В зависимости
от полноты ответа выставляется оценка
2, 1 или О баллов. Первичные баллы с помощью
таблиц переводятся в показатели IQ
для возрастных
групп от 8 до 13,6 года.
Автор приводит следующие
данные о психометрических свойствах
теста:
— валидность
конструктная, определенная
корреляцией со Станфорд—
Вине шкалой умственного развития,
имеет значение г
= 0,76.
— надежность
частей теста г = 0,96,
— показатель- внутренней
согласованности г = 0,67.
— валидность
содержательная обеспечена
отбором тестовых
заданий из первоначального
состава в 60 вопросов.
Тест может найти применение
в школьной и клинической психодиагностике
как скрининговая
методика (см. Отсеивание).
Данных об использовании в
СНГ не имеется.
КУДЛИЧКОВОЙ ЛИЧНОСТНЫЙ
ОПРОСНИК (КУД) —
опросник личностный.
Разработан Е. Кудличковой
в 1964 г.
Опросник содержит 80 вопросов,
на которые испытуемые могут отвечать:
«согласен», «не знаю», «не
согласен*. Применим для взрослой
популяции без ограничения возраста,
допускает как индивидуальное, так и
групповое обследование. На основании
оценки первичной
испытуемых размещают
на девятибалльной шкале станайнов
(см. Оценки шкальные).
Диагностика опирается на
анализ пяти биполярных факторов личности:
устойчивость—лабильность,
активность—пассивность,
доминантность—подчиненность,
рациональность—чувствительность,
экстра—интроверсия. Перечисленные
факторы, по мнению автора, включают
следующие свойства (в скобках приведены
примеры вопросов, диагностирую-щих
соответствующие факторы):
— Активность:
быстрота реакций,
решительность, динамичность (Бывает,
что я никак не могу принять какое-то
решение и упускаю возможность сделать
что-либо своевременно),
— Пассивность:
медлительность,
нерешительность, отсутствие
напористости (Чаще всего я стараюсь
действовать так, чтобы «не напороться
на какие-либо неприятности»).
— Лабильность:
возбудимость,
неуравновешенность, беспокойство,
импульсивность (Обычно я ничего не
планирую, действую -по настроению
в данный
момент).
— Стабильность:
уравновешенность,
рассудительность, владение собой,
постоянство (Я сохраняю спокойствие
даже тогда, когда другие люди теряют
самообладание).
— Доминантность:
властность,
самоуверенность, авторитарность,
агрессивность (С удовольствием
выступаю в роли организатора).
— Подчиненность:
несамостоятельность,
покорность, терпимость (В коллективе,
компании других людей я легко поддаюсь
уговорам, проявляю покладистость).
— Рациональность:
рефлексивность,
объективность, рассудительность (Я
высказываю свои мысли, тщательно
подумав, стремлюсь выразить их как можно
точнее).
— Чувствительность:
богатое воображение,
интуиция, непосредственность,
субъективизм (Я обычно придаю важное
значение внешнему виду и одежде людей
— обращаю внимание, одеты ли они по
моде, смотрю на качество ткани).
— Экстраверсия:
кооперативность,
общительность, открытость,
социабель-ность, разговорчивость (Я
был бы очень огорчен, если бы длительное
время не мог встречаться со своими
знакомыми, друзьями).
— Интроверсия:
замкнутость,
сдержанность, внешняя холодность
(Чтение книг доставляет мне больше
удоволь-
‘ ствия, чем встречи и беседы
со знакомыми и приятелями). В процессе
психометрической разработки опросника
особое внимание уделялось валидности
содержательной утверждений.
Устанавливалась внутренняя
согласованность, а
также дискрими-нативность отдельных
утверждений. В окончательную версию
К. л. о. были включены только те
утверждения, которые соответствовали
статистическим критериям, однако
точные данные в руководстве не
приведены. Имеются сведения о надежности
ретестовой {rt
= 0,80
— 0,96). Нормы в станайнах разработаны
автором для ограниченного контингента
испытуемых (студентов, аспирантов
вузов, женщин и мужчин, занимающих
руководящие должности, рабочих
отдельных специальностей, работников
здравоохранения). Допускается как
индивидуальное, так и групповое
обследование.
Опросник рекомендуется для
диагностики личности, однако
примитивность стандартизации,
условность норм, от-
сутствие сведений о валидности
конст-руктной и
валидности критериальной
делают его скорее
средством для получения ориентировочной,
предварительной информации.
Сведений об использовании
в СНГ нет.
КУКОЛ ТЕСТ (Puppetry
Test) — проективная
методика исследования
личности, разрабатывалась А. Вольтманом
(1951), М. Гауорт (1957) и другими психологами.
Ранее процедуры, близкие К. т., использовались
психоаналитически ориентированными
исследователями как терапевтическая
техника для детей в возрасте до 10 лет
(М. Рамберт, 1938).
Стимульный материал методики
представлен куклами, число которых
у разных авторов не совпадает. Ребенка
просят разыграть с куклами различные
сцены, напр, соперничество с братом,
сестрой или ситуации с участием отца,
матери, других близких. Иногда детям
предлагают поставить кукольное
представление. Такая организация
исследования под руководством
экспериментатора-режиссера сближает
К. т. с психодрамой.
Процедура обследования
не стандартизована. Отсутствует
система оценки полученных данных,
не разработана схема интерпретации.
Упор делается на интуицию исследователя.
Попытки стандартизации
К. т. предприняты М,
Гауорт, создавшей фильм — кукольное
представление, однако данные о
валидности и
надежности теста
отсутствуют.
Сведений об использовании
в СНГ не имеется.
КУЛЬТУРНО-СВОБОДНЫЙ
ИНТЕЛЛЕКТА ТЕСТ (Culture-Fair
Intelligence Test, CFIT)
— тест интеллекта.
Предназначен для
измерения уровня интеллектуального
развития, независимого от влияния
факторов окружающей среды (культуры,
образования и т.д.),
154
т. н. «чистого» интеллекта.
Опубликован Р. Кэттеллом в 1958 г. Имеется
три варианта теста; а) для детей 4-8
лет и умственно отсталых взрослых;
б) для детей 8-12 лет и взрослых, не имеющих
высшего образования (две параллельные
формы А и
В); в)
для учащихся старших классов, студентов
и взрослых с высшим образованием
(две параллельные формы А
и В).
Первый вариант теста состоит
из восьми субтестов, четыре из которых
рассматриваются автором в качестве
«свободных от влияния культуры»: 1)
«подстановка»; 2) «классификация»; 3)
«выбор называемых предметов»; 4^
«лабиринты»; 5) «картинки с недостающими
деталями»; 6) «выполнение указаний»;
7) «загадки»; «определение сходства».
Время решения всех заданий — 22 мин.
Второй и третий варианты
К.-с. и. т. состоят из четырех субтестов
и отличаются лишь уровнем трудности
(рис. 34): «Серии» — распознание и
продолжение закономерных изменений
в рядах фигур; «Классификация* —
определение общих черт, особенностей
фигур; «Матрицы» — дополнения к комплектам
фигур; «Условия» — перестановка
фигур, первоначально расположенных
в определенном порядке (требуется
отметить точкой один из данных на выбор
рисунков с соблюдением условий,
заданных по образцу). Время, отводимое
на решение всех заданий, — 12,5 мин.
К.-с. и. т. представляет собой тест
скорости, но может
быть использован и без ограничения
времени выполнения. Исходные оценки
по второму и третьему вариантам теста
с помощью таблиц преобразуются в
процентили (см. Оценки
шкальные) и lQ-показатель
стандартный с а = 16.
Первый вариант обрабатывается только
посредством относительного IQ
(см. Интеллекта
коэффициент).
Р. Кэттелл исходит из того,
что издание теста для измерения общих
способно-
Тест 1. «Серии»
Выбрать недостающий
квадрат:
Тест 2. «Классификация»
Выделить не относящийся
к ряду элемент:
Тест 3. «Матрицы»
Найти элемент, завершающий
данную матрицу.
Тест 4.«Условия»
Отметить точкой один из
данных на выбор рисунков так, чтобы
соблюсти условие, заданное в образце:
Рис. 34. Образцы заданий из
субтеста Культурно-свободного
интеллекта теста
стей, очищенных от «наслоений
культуры», возможно прежде всего на
основе перцептивных заданий, в- которых
интеллект проявляется через восприятие.
По мнению Р. Кэттелла, данные,
полученные с помощью К.-с. и. т. в
различных культурных группах, вполне
сопоставимы между собой. (Критику
концепции’«чистого» интеллекта см.
в статье Тесты
интеллекта).
Стандартизация К.-с.
и. т. не завершена. Коэффициент
надежности методом
расщепления теста (см. Надежность
частей теста) составляет
0,70-0,92. Валидность
изучалась путем
корреляции с результатами других тестов
интеллекта. По данным Р. Кэттелла,
показатель корреляции К.-с. и. т. со
Станфорд—Бине ум-
ственного развития шкалой
равен 0,56. Некоторые
из субтестов первого варианта требуют
исключительно индивидуального
предъявления, другие варианты могут
использоваться как при индивидуальном,
так и при групповом тестировании.
Сведений об использовании
в СНГ не имеется.
Q-КЛАССИФИКАЦИЯ
(Q-sort) —
ме
тодика исследования
представления о своем «Я» и об окружающих
людях. Предложена В. Стефенсоном в
1953 г.
Выполнение заданий Q-к.
состоит
в сортировке карточек
с названиями свойств или особенностей
личности на группы в зависимости от
близости данного свойства характеру
и образцам поведения обследуемого.
Карточки делятся на заданное количество
групп от «наиболее характерных» к
«наименее характерным» для испытуемого
свойствам. Обследуемый должен в
каждой группе разместить определенное
их число. Количество карточек в группе
определяется значениями нормального
распределения для выбранного числа
групп и его общего количества. Так,
при количестве карточек, равном 100,
количестве групп — 6, распределение
карточек по группам может выглядеть
следующим образом:
Наименее
Наиболее
характерное
характерное
свойство 3 15 32 31 15 3
свойство
Наиболее удобно разделение
карточек на 9 групп. При этом для
определения числа карточек в каждой из
групп можно воспользоваться шкалой
станайнов (см. Оценки
шкальные).
По характеру выполнения
Q-к.
относится к методикам
вынужденного выбора. Выраженность
личностных свойств здесь измеряется
не в абсолютных показателях (напр.,
отношение к результату норматив-
ной выборки), а относительно
выраженности других свойств
испытуемого.
После выполнения основного
задания Q-к.
испытуемому можно
предложить выполнить аналогичную
сортировку применительно к другим
людям (отцу, матери, жене и т. д.). Существует
вариант выполнения задания по
отношению к себе или другим людям в
различных ситуациях (дома, на работе, в
общении и т. д.). Можно получить сведения
относительно представления о себе
в аспекте «идеального Я», «реального
Я», «социального
Я» (т. е. такого, каким видят испытуемого
окружающие) (см. Семантический
дифференциал).
При изучении валидности
проективных методик Q-к.
может с успехом
применяться как для получения
критерия (см. Валидность
критериальная, Вали-дизации критерий),
так и сопоставимых с
ним оценок теста. По мнению А. Анас-тази
(1982), Q-к.
можно
использовать
последовательно на разных стадиях
психотерапии для констатации изменений
в психическом состоянии. При эффективном
терапевтическом воздействии представление
о себе меняется в сторону более
благоприятных оценок и приближается
к идеальному «Я». Методика Q-к,
может найти
применение в самых различных областях
психологической
диагностики. Принцип
Q-к.
может быть реализован
при работе испытуемого с различными
объектами и использован для широкого
круга тестовых методик.
JI
ЛАЙКЕРТА ШКАЛЫ —
разновидность опросников
установок (аттитюдов).
Названы по имени автора — Р. Лайкерта,
предложившего их в 1932 г. Л. ш. состоят из
набора утверждений с 5- или 7-балльными
рейтинговыми шкалами оценивания (по
степени согласия испытуемого с
предложенным ему утверждением). При
конструировании Л. ш., в отличие от
Терсто-уна шкал,
утверждения отбираются
на основании оценки их корреляции с
общим результатом (см. Внутренняя
согласованность). Валидизация
Л. ш. осуществляется по принципу
сопоставления результатов в
критериальных группах (см. Валидность
критериальная). При
оценивании результатов индивидуальные
показатели сопоставляются с
нормативными (см. Нормативное
оценивание). Как
итерстоуновские шкалы, Л. ш. относятся
к числу наиболее распространенных
методик диагностики аттитюдов.
Преимущество Л. ш., сравнительно с
терстоуновс-кими, — независимость от
экспертных заключений при их
конструировании.
ЛАТЕНТНЫЙ АНАЛИЗ (лат.
latens, latentis —
скрытый, невидимый) — совокупность
аналитико-статистических процедур
выявления скрытых переменных
(признаков), а также внутренней
структуры связей между ними.
В понятие Л. а. в широком
смысле можно включить всю совокупность
методов, позволяющих в той или иной
мере путем преобразований, специальной
обработки информации о внешнем
проявлении признака обнаружить
внутренние, латентные закономерности.
Сюда можно включить аналитические
процедуры контент-анализа,
анализа психосемантики
значений (см. Семантический
дифференциал) и др.
Специальными методами Л. а. являются
факторный анализ,
дисперсионный анализ, регрессионный
анализ и другие виды
многомерного статистического анализа,
осуществление которых содействует
выявлению скрытых переменных,
характеристик внутренней структуры
исследуемых объектов.
ЛЖИ ДЕТЕКТОР (ПОЛИГРАФ)
—
прибор, предназначенный
для регистрации физиологических
реакций человека с целью обнаружения
их изменений, связываемых с
неискренностью, лживостью обследуемого.
Феномен изменения деятельности
потовых желез, частоты дыхания и
уровня артериального давления при
состоянии
157
напряжения, вызванного
необходимостью лгать, известен давно.
Впервые начал измерять давление
крови у подозреваемых во время допроса
Ч. Ломброзо в конце XIX
века. В 20-х гг. нашего
века Д. Килер успешно применяет устройство
для регистрации дыхания, артериального
давления и электрической активности
кожи при полицейских расследованиях в
Беркли (Калифорния) и организовывает
производство первых полиграфов.
Несмотря на последующее
активное совершенствование Л. д., вплоть
до современных компьютеризированных
моделей, следует учитывать, что ни один
комплекс физиологических реакций нельзя
достаточно уверенно связывать с
сознательной ложью. Обычно исследователи
ищут признаки симпатикоподобной
активации, такие как неритмичное
дыхание, подъем артериального
давления, иногда — реакция кожной
проводимости (кожно-гальвани-ческая
реакция, КГР). Опыт и интуиция исследователя
играют значительную, а иногда и основную
роль в постановке окончательного
«диагноза». В известной степени процедура
обследования с помощью Л. д. сходна
с проективной (см. Проективные
методики). Отсутствуют
стандарты профессиональной квалификации
лиц, использующих полиграф с целью
установления искренности обследуемых.
Множество работ, посвященных изучению
эффективности Л. д., противоречивы,
тем не менее обычно указывают на
успешность применения в 75-80% случаев.
В теоретическом плане детектация лжи
физиологическими методами не выдерживает
критики, поскольку речь идет о де-тектации
эмоций или активации. Не решены
этические вопросы, связанные с применением
Л. д., их использование запрещено
законодательством многих стран (см.
также Психодиагностика
честности).
Сведений об использовании
в СНГ нет. 158
ЛИРИ ИНТЕРПЕРСОНАЛЬНЫЙ
ДИАГНОЗ (Leary
Interpersonal Diagnosis) —
опросник личностный.
Разработан Т. Лири
в 1957 г. и направлен на диагностику
межличностных отношений и свойств
личности, существенных при взаимодействии
с другими людьми.
Задача испытуемого при
работе с опросником состоит в
соотнесении каждой из 128 лаконичных
характеристик с оценкой своего «Я».
Каждая из эпитетов-характеристик
имеет порядковый номер. Характеристики
могут размещаться на карточках с
последующей сортировкой либо в тестовой
тетради с фиксацией ответа («да* либо
«нет») на отдельном бланке. Примеры
характеристик:
Итак, какой вы человек?
1. Умеет нравиться.
2. Производит впечатление
на других.
3. Умеет распоряжаться,
приказывать.
127. Заботится о других в
ущерб себе.
128. Портит людей чрезмерней
добротой. Для проведения обследования
обычно
требуется не более 10-15 мин.
Согласно «ключу» определяются
оценки первичные по 16 характеристикам,
формирующим 8 октантов т. н. дискограммы
(рис. 35), отражающих тот или иной вариант
межличностных отношений:
1. Властный-лидирующий
2. Независимый-доминирующий
3. Прямолинейный-агрессивный
4. Недоверчивый-скептический
5. Покорный-застенчивый
6. Зависимый-послушный
7. Сотрудничающий-конвенциальный
8. Ответственный-великодушный.
Количественные показатели (баллы,
по числу совпадений с ключом)
откладываются на соответствующей
номеру октанта координате, каждая
из которых размечена дугами. Расстояние
между дугами кратно четырем (0, 4, 8, 12,
16). На уровнях, соответствующих
полученным бал-
Рис. 35. Профили личности
(дискограммы) по методике Т. Лири
лам, в каждом октанте
проводится дуга. Отделенная внутренняя
часть октанта заштриховывается.
Полученные оценки
профильные наглядно
показывают преобладающий стиль
межличностных отношений. Показатели,
не выходящие за уровень 8 баллов,
соответствуют «гармоническим
личностям». Более высокие показатели
соответствуют акцентуации определенных
поведенческих стереотипов. Оценки,
достигающие уровня 14-16 баллов,
свидетельствуют о трудности социальной
адаптации. Низкие показатели по всем
октантам (0-3 балла) могут быть результатом
скрытности или неоткровенности
испытуемого. Если в дискограмме
отсутствуют октанты, закрашенные
выше уровня 4 баллов, данные обследования
считаются сомнительными. Предполагается,
что испытуемые не проявили должной
откровенности.
Первые четыре типа
межличностного поведения, соответствующие
I—IV октантам,
характеризуются преобладанием
неконформных тенденций и склонностью
к конфликтам (III
и IV),
выраженной
независимостью мнений, упорством,
тенденцией к лидерству (I
и II).
Другие четыре октанта
(V—VIII)
представляют
противо-
положную тенденцию. У лиц
с высокими показателями по ним преобладают
конформистские установки, покладистость
(VII и
VIII), неуверенность,
склонность к компромиссам (V
и VI).
Интерпретация данных должна
опираться главным образом не на
абсолютные величины приведенных
показателей, а на совокупность их
взаимоотношений. Дополнительно к анализу
дискограммы могут быть рассчитаны
«фактор доминантности» (V)
и «фактор
доброжелательности» (G)
по приведенным ниже
формулам:
K=I-V + 0,7(II + HI-VI-IV);
G =
VII —
III + 0,7
(VIII +
VI —
IV —
II).
При разработке методики
автор исходил из концепции Г. Салливена
(1953). Теоретический подход Г. Салливена
к пониманию личности исходит из
определяющего значения оценок и
мнений значимых для данного индивида
окружающих, под влиянием которых и
происходит его персонификация, т. е.
формирование личности. В процессе
взаимодействия с окружением личность
проявляется стилем межличностного
поведения. Реализуя потребность в
общении и в осуществлении своих желаний,
человек сообразует свое
159
поведение с оценками значимых
других на уровне осознанного самоконтроля,
а также неосознанной символической
идентификации.
Основываясь на том, что
личность проявляется в поведении в
процессе взаимодействия с окружающими,
Т. Лири систематизировал эмпирические
наблюдения в виде восьми общих или 16
более конкретизированных вариантов
межличностного взаимодействия.
Соответственно классификации
вариантов межличностного поведения
был разработан опросник, задуманный
как средство клинической диагностики.
Конструирование опросника происходило
на основе сопоставления контрастных,
как бы заостренных, моделей стиля
межличностного поведения,
Т. Лири выделяет пять уровней
исследования интерперсонального
поведения личности. Особенно значимыми
с его точки зрения являются 1,2 и 5.
Уровень 1 содержит наблюдаемое
поведение людей, т. е. поведение,
диагностируемое на основании оценок
других людей. Уровень 2 связан с оценкой
собственного поведения или же с оценкой
близких людей — отца, матери, супруга
и т. д. Уровень 5 отражает моральные
представления индивида, его идеальное
«Я». Соответственно этим уровням можно
видоизменять инструкцию и оценивать
соответственно себя, других, моделировать
собственный идеал.
Л.и.д. проходил проверку на
ва-лидность конструктную
путем сопоставления
с данными обследования по Миннесотскому
многоаспектному личностному опроснику.
Была установлена
достоверная связь между типами
интерперсонального поведения,
выделенными Т. Лири, я некоторыми
клинически определенными состояниями,
проявляющимися аналогичными
поведенческими характеристиками,
отраженными и в профилях MMPI.
Имеются данные о
наличии связи факторов Л. и. д. с некоторыми
показа-
160
телями «Шестнадцати
личностных факторов» опросника.
Исследование факторной
валидности (см. Валидность
конструктная) показало,
что исследуемые Л. и. д. показатели
связаны с двумя биполярными факторами:
«доминантность—подчиненность» и
«дружественность—враждебность».
Это привело к заключению о зависимости
стилей интерперсонального поведения
от указанных факторов. Комбинация этих
факторов в наибольшей степени определяет
вид дис-кограммы, разделенной на квадранты
вертикальным вектором (доминантность—
подчиненность) и горизонтальным вектором
(дружественность—враждебность).
Надежность ретестовая
(интервал ретеста —
10 дней) колеблется по отдельным
показателям от 0,63 до 0,81. Коэффициенты
внутренней согласованности
для факторов, полученных
в ходе исследования при установке
испытуемому дать оценку собственного
«Я*, имеют значения от 0,35 до 0,72, а в случае
моделирования идеала «Я» — от 0,16 до
0,66.
Л. и. д. получил широкое
распространение, переведен на многие
языки.
В 1990 г. вышло руководство к
русскоязычной версии Л. и. д. (Л. Н.
Собчик). В ходе подготовки этой версии
был не -только накоплен значительный
опыт применения методики, но и
существенно переосмыслена теоретическая
концепция. Феноменология метода была
рассмотрена с позиций
индивидуально-типологического
подхода. Опираясь на положение С. Л.
Рубинштейна о врожденных индивидуальных
свойствах, опосредующих усваиваемый
социальный опыт, а также на принцип
единства социальных и биологических
факторов в формировании личности,
Л. Н. Собчик предлагает рассматривать
типологию устойчивых личностных свойств
как интеграцию ведущих тенденций,
связанных с эмоционально-динамическими
паттернами, уходящими корнями
в тип высшей нервной
деятельности, с индивидуально-личностными
свойствами, придающими специфику стилю
переживаний, межличностному поведению,
мотивации.
Первые отчечественные
публикации по применению Л. и. д. и ее
модификации относятся к 1972 г: Были
проведены исследования в спортивных
командах (Л. Н. Собчик, 1972, 1974), в
психотерапевтических группах у
больных с пограничными нервно-психическими
расстройствами (Л. Н. Собчик и соавт.,
1975), супружеских пар (Г. С. Васильченко,
Ю. А. Ре-шетняк, 1972, 1979). Методика получила
широкое применение в сфере изучения
отношения больных к стилю
психотерапевтического воздействия
врача (Л. И. Вас-серман, В. В. Богаров, В.
А. Ташлыков, 1985), при исследовании
взаимоотношений в производственных
и студенческих группах (М. С. Малешкина,
1986).
«ЛИЦА И ЭМОЦИИ» («Faces
and Feelings») —
проективная методика,
предназначенная
для диагностики самоуважения у детей
дошкольного и младшего школьного
возраста. Методика опубликована А.
Джахез и Н. Манши в 1990 г. Ребенку предлагают
4 задания:
1) Нарисовать 6 персонажей,
наиболее важных для ребенка: мать, отца,
учителя, друга, какого-либо другого
знакомого (человека, животного и др.)
и, наконец, также семью в целом.
2) Нарисовать 6 ситуаций,
наиболее важных в жизни ребенка: дом,
школа, каникулы, свободное время, урок
математики, чтение.
3) Заполнить 3 окружности
изображениями 3-х лиц (одно лицо в
одной окружности), выражающих, по
мнению испытуемого, радостные, грустные
и нейтральные эмоции.
4) Указать, какое из 3-х лиц
с разными эмоциями больше всего
соответству-
ет каждому из 12 рисунков
(задания 1-2) как наиболее точно отражающее
эмоции, которые ребенок обычно испытывает
в той или иной ситуации, в присутствии
того или иного человека. С помощью
методики выявляются источники
самоуважения у детей: значимые другие
люди и значимые ситуации. Список
людей и ситуаций, задаваемый исследователем,
был составлен в процессе пилотажного
исследования при определении наиболее
типичных значимых людей и ситуаций
для детей изучаемого возраста.
Авторы подчеркивают, что
методика «Л. и э.» обладает высокой
степенью проективности. Рисунок
ребенка является его собственной
интерпретацией понятия конкретного
значимого другого или конкретной
значимой ситуации, в отличие от других
методик, в которых модель заранее
подготовлена взрослым. Ребенку не нужно
объяснять значение рисунков теста: он
«присваивает» рисунок в процессе
рисования. Для ребенка изображение
матери на листе бумаги представляет
его собственную мать. В отличие от
других рисуночных методик, в которых
предусматривается изображение
человека (см. Гуди-наф
«Нарисуй человека» тест), в
«Л. и э.» человеческие фигуры сами по
себе не являются предметом анализа.
Скорее они повышают валидность
содержательную теста.
Теоретической основой «Л.
и э.» являются работы, указывающие
на сложность процесса формирования
самоуважения и многофакторность его
природы. Это работы К. Кули (1912), Р.
Вили, Р. Шавельсо-на и Р. Болуса (1982), в
которых утверждается, что наряду с
определенной стабильностью,
неизменностью самоуважения существует
и его зависимость как от собственного
поведения, так и от поведения других.
Таким образом, любая попытка измерения
детского самоуважения должна включать
не только измерение само-
161
уважения как такового, но
и выявление людей и ситуаций, которые
более всего оказывают влияние на
самоуважение. Было сделано предположение
о том, что представление о себе как
«хорошем» или «плохом», сформированное
под влиянием наиболее значимых людей
и ситуаций, отражает представление
ребенка о своей ценности и, следовательно,
о самоуважении. Путь формирования
детского самоуважения представлен
на рис. 36.
Рис. 36. Формирование детского
самоуважения по А. Джахез и Н. Манши
Методика применима: в
кросскультур-ных исследованиях, при
изучении особенностей самоуважения
в различных возрастных группах; при
обследовании детей, испытывающих
затруднения в овладении навыками чтения
и речи, — в процессе обучения; а также
в психопрофилактике, психотерапии и
психокоррекции.
Начаты исследования по
изучению ва-лидности
и надежности
«Л. и э.» выявлены
этнические различия в особенностях
самоуважения у американских и австралийских
детей.
Сведений об использовании
в СНГ нет.
142
ЛИЧНОСТНОЙ ОРИЕНТАЦИИ
ОПРОСНИК (Personal
Orientation Inventory, POI)
— опросник
личностный. Предложен
Э. Шостромом в 1963 г. и предназначен
для измерения степени самоактуализации
личности.
Опросник состоит из 150
утверждений. Задача обследуемого —
в каждом случае выбрать из двух утверждений
одно наиболее для него подходящее.
Опросник включает в себя две основные
шкалы личностной ориентации («Времени»
и «Опоры») и 10 подшкал. Оценки по
основным шкалам являются относительными.
Они представляют собой отношение
«Времени» (отношение временной
некомпетентности к временной
компетентности) и отношение «Опоры»
(отношение опоры на других к опоре на
себя). По мнению автора, относительные
оценки шкал «Времени» и «Опоры»
представляют две главные области,
существенные для развития личности
на пути к самоактуализации. Отношение
«Времени» самоактуализирующейся
личности составляет приблизительно 1
: 8, несамоактуализирующейся — 1:1.
Отношение «Опоры» самоактуализирующейся
личности равно 1 : 3, несамоактуализирующейся
— 1 : 1. В случае необходимости быстрой
диагностики степени-самоактуализации
личности можно использовать оценки
только по двум основным шкалам.
Оценки по каждой из 10 подшкал
предназначены для отражения различных
аспектов, важных с точки зрения
процесса самоактуализации. Утверждения
основных шкал «Времени» и «Опоры»
не перекрываются, а подшкалы состоят
из утверждений, одновременно входящих
в другие шкалы.
Ниже описаны 2 основные
шкалы Л. о. о. и 10 подшкал. 1.
Отношение Времени [Т(/):
Т(С)]
состоит из 23 утверждений и определяет,
насколько человек живет в «настоя-
щем» в противоположность
«прошлому» и «будущему». Компетентная
во времени личность — Т(С)
— живет главным
образом в настоящем, некомпетентная
— Т(1) —
живет в прошлом или будущем.
2. Отношение
Опоры (О : /) состоит
из 127 утверждений и определяет, насколько
способ реагирования индивида
характеризуется ориентацией на «других»
(О) или на себя (/). Направленные на себя
или внутренне ориентированные
индивиды руководствуются, главным
образом, собственными принципами и
мотивами, а направленные на других в
большей степени зависят от окружения
или внешних сил. Подшкалы:
1.
Ценность самоактуализации
(SAV) —
измеряет, в какой степени человек
разделяет ценности, характерные для
самоактуализирующейся личности.
2. Шкала
экзистенциальности
(Ех) —
измеряет способность человека ситуационно
реагировать без ригидной приверженности
принципам.
3. Шкала
реактивной чувствительности (Fr)
— измеряет
сензитив-ность или отзывчивость на
чувства и нужды других людей.
4. Шкала
спонтанности (S)
— измеряет,
насколько свободно личность может
спонтанно реагировать или быть собой.
5. Шкала
самоуважения (Sr)
— измеряет
способность человека утверждать себя
благодаря собственной силе и значимости.
6. Шкала
принятия себя (Sa)
— измеряет
способность утверждать или принимать
себя, несмотря на свои слабости и
недостатки.
7. Шкала
природы человека (Ыс)
— измеряет степень
конструктивности взглядов на природу
человека, природу мужественности и
женственности.
8. Шкала
синергии (Sy)
— измеряет
способность человека быть целостным,
превзойти дихотомию.
9. Шкала
принятия агрессии
(А) —
измеряет способность человека принимать
чью-либо природную агрессивность
как противоположность отрицанию и
подавлению агрессии.
10. Шкала
способности к близким контактам (С)
— измеряет способность человека
формировать близкие взаимоотношения
с другими людьми, не обременяя себя
ожиданиями и обязательствами.
Обработка результатов
проводится вручную или с помощью
компьютера. Ответ, совпадающий с
ключом, оценивается в один балл. Полученные
по каждой шкале баллы суммируются и
заносятся в специальный бланк.
Завершается обследование построением
индивидуального профиля, для чего
сырые баллы с помощью таблицы
переводятся в стандартные Т-баллы (см.
Оценки шкальные), со
средним значением 50 и стандартным
отклонением 10. Оценки выше 50, но ниже 60
Т-баллов наиболее характерны для
самоактуализирующейся личности.
Отправным пунктом исследований
Э. Шострома была концепция
самоактуализирующейся личности,
наиболее полно развитая в работах А.
Маслоу (1954, 1962). Необходимость создания
Л. о. о. была продиктована потребностью
многих консультантов и терапевтов во
всестороннем измерении ценностей и
некоторых особенностей поведения
человека, имеющих наибольшее значение
для развития самоактуализации. Тест
является валидным
и надежным
инструментом.
В СНГ существует адаптированный
вариант методики. Стандартизация
проводилась на
студентах вуза (А. А. Рукавишников,
1991). Сообщается о высоких показателях
его валидности и надежности. Опросник
может использоваться в клинике и
консультативных службах.
163
ЛИЧНОСТНЫЙ ОПРОСНИК
БЕХТЕ-РЕВСКОГО ИНСТИТУТА (ЛОБИ)
—
опросник личностный.
Предназначен для
диагностики типов отношения к болезни
и лечению у больных хроническими
соматическими заболеваниями. Разработан
сотрудниками Института им. В. М. Бехтерева
(г. Санкт-Петербург) при участии психологов
и психиатров научных и лечебных
учреждений СССР. Опубликован в 1983 г.
Опросник состоит из 12 наборов
фраз-утверждений, касающихся различных
аспектов системы отношений обследуемого
(«отношение к лечению», «отношение к
врачам и медперсоналу», «отношение к
окружающим», «отношение к будущему» и
т. д.). В каждом наборе содержится 10-16
пронумерованных утверждений. Например,
в набор «отношение к будущему» входят
следующие фразы:
— Болезнь делает мое
будущее печальным и унылым — 1
— Мое здоровье не дает пока
никаких оснований беспокоиться за
свое будущее — 2
— Из-за болезни я сильно
тревожусь за свое будущее — 11
Обследуемого просят в каждом из наборов
утверждений выбрать подходящее для
него и внести соответствующий номер
в регистрационный лист. Во всех наборах
предусмотрен «нулевой» вариант, т. е.
допускается, что ни одно из приведенных
утверждений обследуемому не подходит.
Число выборов по каждому набору —
не более трех, в том числе и нулевых
вариантов.
С помощью Л. о. Б. и.
диагностируются следующие типы
отношений: 1) гармоничный
— трезвая оценка
своего состояния; 2) тревожный
— непрерывное
беспокойство и мнительность в отношении
неблагоприятного течения болезни; 3)
ипохондрический —
сосредоточе-
ние на субъективных
болезненных и иных неприятных ощущениях;
4) меланхолический
— удрученность
болезнью, неверие в выздоровление;
5) апатический —
полное безразличие к своей судьбе,
исходу болезни; 6) неврастенический
— поведение по типу
«раздражительной слабости»; 7)
обсессивно-фо-бический
— тревожная мнительность
прежде всего касается опасности не
реальной, а маловероятной; сенситивный
— чрезмерная озабоченность возможным
неблагоприятным впечатлением, которое
могут произвести на окружающих
сведения о болезни; 9) эгоцентрический
— еуход в болезнь»,
выставление напоказ своих страданий и
переживаний с целью полностью завладеть
вниманием окружающих; 10)
эйфорический —
необоснованно повышенное настроение,
нередко наигранное; 11) анозогнозичес-кий
— активное отбрасывание
мыслей о болезни, ее возможных последствиях;
12) эргопатический
—«удод от болезни в
работу»; 13) паранойяльный
— уверенность, что
болезнь является результатом чьего-то
злого умысла.
Диагностировать можно лишь
те из перечисленных типов, по отношению
к которым набрано т. н. «минимальное
диагноз тическое число», определенное
эмпирически.
Теоретическая основа Л. о.
Б. и. — психология отношений. При этом
особенности самой личности
рассматриваются как существенный, но
не единственный фактор, определяющий
отношение к болезни. Отношение к
болезни обусловлено: а) природой
самого заболевания; б) типом личности,
в котором основную роль играет тип
акцентуации характера (см.
Патохарактерологический
диагностический опросник); в)
отношением к заболеванию в значимом
для больного окружении. Под воздействием
названных трех факторов вырабатывается
отноше-
ние к болезни, лечению,
врачам, своему будущему и т. д. (А. Е.
Личко, 1983).
Работа по изучению валидности
и надежности
Л. о. Б. и. не завершена;
Опубликованы данные, выявляющие
корреляции между некоторыми типами
отношения к болезни и конкретными
психосоматическими заболеваниями.
Напр., при язвенной болезни
диагностируются ипохондрический и
неврастенический типы отношений. На
материале обследования большого
количества больных (1200 человек) выделены
утверждения Л. о. Б. и., наиболее
информативные для психодиагностики
«гармоничного» типа отношения к болезни
(Э. Б. Карпова, 1985). Опросник может быть
использован при проведении группового
обследования.
ЛЮШЕРА ЦВЕТА ВЫБОРА ТЕСТ
(Luscher Farbwahl Test) —
проективная методика
исследования личности.
Основана на субъективном предпочтении
цветовых стимулов {см. Цветных
пирамид тест). Опубликована
М. Люшером в 1948 г.
Стимульный материал Л. ц.
в. т. состоит из стандартных разноцветных,
вырезанных из бумаги квадратов со
стороной 28 мм. Полный набор состоит
из 73 квадратов различных цветов и
оттенков. Обычно используют неполный
набор из 8 цветных квадратов. Основными
цветами считаются (в порядке присвоенного
им номера) синий, зеленый, красный,
желтый, а дополнительными — фиолетовый,
коричневый, черный и серый (нулевой).
Упрощенная процедура обследования (для
восьми цветов) сводится к одновременному
предъявлению обследуемому всех цветных
квадратов на белом фоне с предложением
выбрать один наиболее понравившийся,
приятный. Выбранный квадрат переворачивается
и откладывается в сторону, затем
процедура повторяется. Образуется
ряд квадратов, в котором
цвета располагаются по их
привлекательности для обследуемого.
Первые два цвета считаются явно
предпочитаемыми, третий и четвертый
— предпочитаемыми, пятый и шестой —
нейтральными, а седьмой и восьмой —
вызывающими антипатию, негативное
отнощение.
Психологическая интерпретация
полученного ряда субъективного
предпочтения цвета опирается,
во-первых, на предположение о том,
что каждому цвету присуще определенное
символическое значение, напр.: красный
— стремление к власти, доминированию,
зеленый — упорство, настойчивость.
Во-вторых, считается, что ряд цветового
предпочтения отражает индивидуальные
особенности обследуемого. При этом
функциональную значимость имеет
позиция, занимаемая конкретным
цветом. Напр., полагают, что первые две
позиции ряда определяют цели индивидуума
и способы их достижения, а две последние
— подавляемые потребности,
символизируемые данными цветами. Выбор
в области основных цветов связывается
с тенденциями осознаваемыми, а среди
дополнительных — со сферой бессознательного.
__ В разработанной М. Люшером
теории личности есть два основных
психологических измерения:
активность—пассивность и
гетерономность—автономность. Эти
измерения, определяющие значения цветов,
представлены автором в виде схемы:
Характеристика |
Пассивные, |
Активные, |
Детерминированные Детерминированные |
Синий |
Желтый |
В зарубежных исследованиях,
посвященных Л. ц. в. т., отмечается
умозрительность теории его автора,
необходи-
мость детальной научной
разработки теста. Данные о валидности
и надежности
Л, ц. в. т. неоднозначны.
Наряду с индивидуальным обследованием
допускается групповое. В отечественных
исследованиях изучалась валидность
Л. ц. в. т. (И. М. Дашков и Е. А. Устинович,
1980), исследовались связи между выбором
цвета и эмоциональным состоянием (Н. К.
Плишко, 1980). Предпринята попытка
разработки на основе Л. ц. в. т. методики,
предназначенной для изучения эмоциональных
компонентов отношения человека к
значимым для него людям и самому себе
(А. М. Эткинд, 1980).
Исследования Н. Н. Пуховского
(1995) посвящены психометрической разработке
Л. ц. в. т. (8-цветный вариант). По мне-
нию этого исследователя,
тест «запускает» нейропсихологические
механизмы категориального
цветовосприятия. Предполагается,
что при традиционной процедуре
тестирования взаиморасположение
некоторых пар цветов в 8-позиционном
ряду неслучайно, их сочетание без
повторений подчиняется закону нормального
распределения и отражает закономерности
функционирования психологических
механизмов, формирующих актуальное
психическое состояние и устойчивые
особенности личности. Приводятся
данные, подтверждающие гипотезу, и
делается вывод о том, что тест чувствителен
к малейшим изменениям актуального
состояния, а также может быть полезен
для изучения личностных особенностей.
М
МАЙЕРС—БРИГГС ТИПА
ИНДИКАТОР (Myers—Briggs
Type Indikator, MBTI)
— опросник
личностный, предназначен
для классификации испытуемых по типологии
К. Юнга, Разработан и опубликован И.
Майерс и К. Бриггс в 1962 г.
Состоит из 160 вопросов, 52 —
ассоциативные, а остальные предполагают
оценку испытуемым своих индивидуальных
склонностей (путем выбора из двух-трех
предлагаемых вариантов ответа).
Ассоциативные задания основываются
на выборе из пары слов, имеющих
противоположное значение. Напр.:
«Какое из двух слов для Вас более
привлекательно: систематичный—спонтанный;
анализировать—симпатизировать;
сдержанный— разговорчивый; прощать—терпеть;
кто— что; знак—символ?»
Примеры вопросов с
предлагаемыми вариантами ответов:
— Как Вы считаете, распорядок
дня для Вас: а) удобный способ исполнения
дел; б) тягостен и обременителен, даже
когда и необходим.
— Вас больше заботят: а)
чувства людей; б) их права.
— Когда Вы обнаруживаете,
что, несомненно, допустили ошибку,
Вы: а) склонны признать свою ошибку;
б) не признаете свою ошибку,
хотя все о ней знают; в) вообще никогда
не ошибаетесь.
— Выслушивая новую идею,
Вы больше стремитесь: а)узнать все о
ней; б)рассудить, верна она или нет.
Показатели испытуемого рассчитываются
по четырем шкалам, соответствующим
юнговской типологии: экстраверт-интроверт
(Extravert—Introvert),
сенсорный—интуитивный
(Sensor—Intuitive),
мыслительный—эмоциональный
(Thin-ker^Feeler),
рациональный—иррациональный
(Judgement—Perceptive).
Подсчет результатов
производится путем суммирования
баллов по шкалам; большая сумма баллов
соответствует выраженности определенной
черты.
В многочисленных исследованиях
подтверждается валидность
и надежность
М.—Б. т. и.
Имеются обширные нормативные
данные для американской популяции,
позволяющие говорить о следующем
распределении типов:
— экстраверты — составляют
около 75% популяции;
— интроверты — около 25%;
— сенсорные — около 75%;
— интуитивные — около 50%;
— мыслительные — около
50% , но мужчин больше (около 60%);
— эмоциональные — около
50% , но женщин больше (около 60%);
— рациональные — около
50%;
— иррациональные — около
50%;
— сенсорные иррациональные
— 38%;
— сенсорные рациональные
— 38%;
— интуитивные мыслительные—
12%;
— интуитивные эмоциональные—12%;
— рациональные
эмоционально-интуитивные экстраверты
— около 5%;
— рациональные
эмоционально-интуитивные интроверты
— около 1 %;
— иррациональные
интуитивно-эмоциональные экстраверты
— около 5%;
— иррациональные
интуитивно-эмоциональные интроверты
— около 1 %;
— рациональные
мыслительно-интуитивные экстраверты
— около 5%;
— рациональные
мыслительно-интуитивные интроверты
— около 1 %;
— иррациональные
интуитивно-мыслительные экстраверты
— около 5%;
— иррациональные
интуитивно-мыслительные интроверты
— около 1%;
— рациональные
мыслительно-сенсорные экстраверты
— около 13%;
— рациональные
мыслительно-сенсорные интроверты —
около 6%;
— рациональные
эмоционально-сенсорные экстраверты
— около 13%;
— рациональные
эмоционально-сенсорные интроверты
— около 6%;
— иррациональные
сенсорно-мыслительные экстраверты
— около 13%;
— иррациональные
сенсорно-мыслительные интроверты —
около 13%;
— иррациональные
сенсорно-эмоциональные экстраверты
— около 13%;
— иррациональные
сенсорно-эмоциональные интроверты
— около 5%. Существует сокращенная и
переработанная форма MBTI
— опросник
Д. Кейрси, состоящий из 70 вопросов,
каждый из которых имеет только по два
варианта
ответа: 10 вопросов — по
шкале экстраверсии—интроверсии,
для остальных шкал — по 20 вопросов.
Несмотря на существующие
различия в теоретических позициях И.
Майерс и Д. Кейрси, для американской
популяции по опроснику Кейрси приводятся
те же процентные соотношения распределения
типов.
Как М.—Б. т. и., так и опросник
Д. Кейрси широко применяется в США в
профориентации, психологическом
консультировании, исследовании
межличностных отношений.
Сведений об «использовании
теста Майерс—Бриггс в СНГ не имеется.
Есть сообщение об обследовании более
4000 чел. при помощи переведенного на
русский язык опросника Д. Кейрси,
однако сведения о его валидности
и надежности
в нормативных данных
не приводятся.
МАРИ КАРТОЧНЫЙ ТЕСТ
(MART
Card Test, MARI —
сокр: от Mandala
Assessment Research Instrument) —
проективная методика
исследования личности.
Создана Дж. Кэллог в 1980 г. в результате
систематизации большого количества
т. н. «рисунков-мандал», созданных
как психически нормальными людь’ ми,
так и пациентами психиатрических клиник,
Большую роль в создании М. к. т. сыграл
экспериментальный материал, накопленный
в работе с пациентами, проходившими
ЛСД-терапию под наблюдением С. Грофа. С
1980 по 1993 г. тест пересматривался и
совершенствовался, окончательный
вариант получил свое нынешнее название.
Стимульный материал М. к.
т. (рис. 37) состоит из 39 карточек с
черно-белыми мандалоподобными
изображениями (выполнены на прозрачном
пластике), 38 цветных карточек и двух
карточек с ламинированной переливающейся
фольгой («золотой» и «серебряной»).
Испытуемо-
Рис. 37. Образцы рисунков
МАРИ карточного теста
му предлагают просмотреть
на белом фоне одну за другой и отобрать
шесть наиболее привлекающих его
карточек-ман-дал, ранжировать их по
степени привлекательности, а затем,
разложив на ровной поверхности цветные
карты, подобрать к каждой из отобранных
карточек-мандал наиболее подходящий,
со ощущению испытуемого, цвет.
Некоторые исследователи просят также
при просмотре карточек-мандал отобрать
одну или несколько неприятных,
отталкивающих, считая этот выбор столь
же информативным.
Мандала (от санскр. «круг»)
— это рисунок в круге, обретающий
символическое значение. Вообще, вслед
за К. Г. Юн-гом, выделяют т. н. «идеальные»
мандалы, используемые во многих религиях,
особенно в буддизме, для молитв,
медитаций и обрядов, и «индивидуальные»
— рисунки людей, находящихся в
определенном психическом состоянии и
на определенной стадии психического
развития. Считается, что идеальные
мандалы гармонизированы, уравновешенны;
тогда как индивидуальные могут
отражать личностные особенности,
доминанты и состояния, в т. ч. и
неуравновешенные.
Интерпретация М. к. т. основана
на теоретических концепциях
трансперсональной психологии (которые
в основе своей восходят к идеям К. Г.
Юнга, а экспериментальную проработку
и дальнейшее развитие получили в
работах С. Грофа и его последователей).
М. к. т. исполь-
зуется для исследования
состояния испытуемого в данный период
его жизни. Считается, что карточки-мандалы
соответствуют 13 (архетипическим)
стадиям цикла развития, символически
представляя собой визуальную метафору
«процесса» — универсального или
персонального, любого естественного
процесса роста и трансформации. (Каждой
стадии соответствует по 3 карточки
— это количество предложено в
соответствии с психометрическими
требованиями для обеспечения точности
статистической обработки.) Выбор
карточек позволяет определить, на
какой стадии пребывает испытуемый,
нет ли регрессии и односторонности
в его развитии; повторное предъявление
теста (напр., до и после курса
медикаментозного лечения) позволяет
проследить динамику изменений и пр.
Автор теста отмечает, что выбор
здоровых людей более многообразен и
разносторонен, у больных он более
ограниченный и повторяющийся. Дж.
Кэллог рассматривает выбор карточек
как «рентгеновские лучи для психики».
Преимуществами М. к. т.
являются простота использования,
минимальная опасность фальсификации
результата, возможность применения в
случаях наличия языкового барьера
или трудностей, связанных с болезнью,
возрастными изменениями или задержкой
в развитии. Предлагается использовать
М. к. т. как терапевтический и
исследовательский инструмент наряду
с другими проективными и психометрическими
методиками. По сообщениям автора,
стандартизация теста
еще не завершена. Сведения о валид-ности
и надежности
не приводятся.
В СНГ тест используется в
курсе арт-терапии при реабилитации и
социальной адаптации пациентов
неврологических диспансеров (А. И.
Копытин, 1996); а также в исследовательских
целях, в психологическом консультировании.
МЕЖДУНАРОДНАЯ ТЕСТОВАЯ
КОМИССИЯ (International
Test Commission, ITS)
— ассоциация
национальных психологических обществ,
тестовых комиссий, издательств,
публикующих тесты, а также других
организаций, чья деятельность
направлена на распространение, оценку
качества, повышение эффективности
использования психологических и
учебно-образовательных (educational)
диагностических
методик. Основная цель М. т. к. —
содействие обмену и распространению
информации о тестах между
заинтересованными организациями и
исследователями. Основными видами
деятельности М. т. к. являются: организация
конференций, съездов, симпозиумов;
публикации в «Европейском журнале
психологической оценки» (European
Journal of Psychological Assessment of ITC); координация
международных программ и исследований
в области психологического тестирования.
С 1974 г. М. т. к. выпускает «Бюллетень
Международной тестовой комиссии»
(Bulletin of the
International Test Commission).
Идея создания международной
организации, способствующей
распространению тестовых исследований,
принадлежит Ж. Кардину и была высказана
им в конце 60-х годов. В 1974 г. на Конгрессе
Международной Ассоциации прикладной
психологии (International
Association of Applied Psyhology (IAAP) в
Монреале M.
т. к. была учреждена
официально. Первоначально в состав М.
т. к. вошли 15 стран. Решение технических
вопросов, связанных с организацией М.
т. к., взял на себя Тестовый Комитет
Нидерландов. На Конгрессе был избран
Состав Совета М. т. к. во главе с первым
президентом (и первым главным редактором
Newsletter) Ю.
Портингой, профессором Тилбургско-го
университета (Нидерланды). Устав и
основные организационные документы М.
т. к. были приняты на конференциях
IAAP в
Париже (1976) и Мюнхене (1978). Эти материалы
базировались на «Рекомендациях к
конструированию, распространению и
использованию психологических
тестов» (IAAP,
I971).
В настоящее время под эгидой
М. т. к. осуществляется ряд комплексных
программ, связанных с разработкой
технических стандартов психологического
тестирования, адаптации
психодиагностических
методик. Научные проекты реализуются
совместно с Европейской Ассоциацией
психологической оценки (ЕАРА), Международной
Ассоциацией транскультурной психологии
(International
Association of Cross-Cultural Psychology), Международной
Ассоциацией языкового тестирования
(International
Language Testing Association) и
Ассоциацией оценивания учебных
достижений (International
Association for the Evaluation of Educational Achievement). В
настоящее время среди стран СНГ в М. т.
к. представлена только Украина (кафедра
психодиагностики и медицинской
психологии Киевского университета
им. Тараса Шевченко).
МЕЙЛИ ИНТЕЛЛЕКТА
АНАЛИТИЧЕСКИЙ ТЕСТ (Meili
Analytischer In-_ telligence Test, AIT)
— тест
интеллекта. Предназначен
для измерения уровня интеллектуального
развития. Опубликован Р. Мейли в 1928
г.
Тест можно использовать
для обследования лиц старше 11 лет.
Материал М. и. а. т. включает шесть групп
заданий-субтестов, каждый из которых
базируется на достаточно известных
в экспериментальной психологии
методиках.
1 субтест — установление
последовательности событий по серии
картинок. Испытуемому объясняют, что
в представленных ему картинках отражено
какое-либо событие. Однако лишь первая
картинка соответствует своему месту.
Необходимо с помощью нумерации ука-
зать правильный порядок
расположения картинок. За каждое
правильное решение дается 1 балл. Время
выполнения серии заданий — 5 мин.
2 субтест — продолжение
числовых рядов по установленной
закономерности. Времл выполнения —
5 мин., верное решение каждого ряда
оценивается в 1 балл. Возможна оценка
V2
балла в случае,
если испытуемый обнаруживает верное
понимание сути задания, но в ответах
допускает ошибки, расцениваемые как
проявление недостаточности активного
внимания.
3 субтест — составление
предложения по трем предлагаемым
словам. На каждый набор слов дается 2
мин. Испытуемый должен успеть составить
как можно больше предложений. В качестве
критерия оценки выступает не стилистическое
оформление фразы, а мысль, объединяющая
слова. Соответственно этому предлагаются
три вида оценок: связывающая слова
мысль неудачна или фраза лишена смысла
— 1 балл; простое, банальное содержание
фразы — 2 балла; оригинальная мысль —
3 балла.
4 субтест — дополнение
картинок. Предлагается серия
изображений, в каждом из которых
отсутствует фрагмент. Задача
испытуемого — указать, что пропущено
в этом месте. Время выполнения 5 мин,
оценка за верное решение — 1 балл.
5 субтест — составление
фигур из частей. Демонстрируется образец,
на котором изображены несколько
элементов фигур, а затем показываются
и фигуры, составленные из этих элементов.
После объяснения задания испытуемому
предлагают из нового набора элементов
(рис. 38) сложить как можно больше
оригинальных фигур. На каждое задание
дается 1,5 мин. При оценке учитываются
только первые три фигуры, составленные
из каждого набора элементов. Оценка
варьирует в зави-
симости от количества фигур
и их оригинальности от 1 до 3 баллов.
6 субтест — геометрические
аналогии. Испытуемому предъявляют
пару геометрических фигур, определенным
образом связанных друг с другом, а
также первую фигуру второй пары. Задача
испытуемого — нарисовать четвертую
фигуру с учетом установленных отношений
между ними (рис. 39).
Рис. 38. Субтест «Составление
фигур из частей» Мейли интеллекта
аналитического теста
Рис. 39. Субтест «Геометрические
аналогии» Мейли интеллекта аналитического
теста
В процессе обработки
результатов обследования подсчитывается
количество первичных баллов. Среднее
арифметическое первичных оценок
переводится по
таблицам в процентнли. По
мнению автора, оценки от 35 до 65
соответствуют нормальному, среднему
уровню общих способностей, выше 80 —
высокому уровню. По графическому
изображению результатов в отдельных
субтестах (см. рис. 49 к статье Оценки
профильные) строится
профиль интеллекта. Различают пять
типичных профилей, указывающих на
характер интеллекта; формально-логический,
образно-конкретный, аналитический,
творческий, равномерно-развитый интеллект
{рис. 40). Отмечено, что такая простая
интерпретация может быть использована
лишь в случаях отчетливой асимметрии
профилей. Если же речь идет о тенденции,
обнаруживаемой по одному субтесту,
приведенные выше интерпретации
неприменимы.
Рис.40. Варианты интерпретации
«профилей
интеллекта» Мейли интеллекта
аналитического
теста
Теоретически Р. Мейли, не
претендуя на выделение всех возможных
факторов интеллекта, предполагает
существование следующих факторов: 1)
доступной труд-
ности; 2) пластичности; 3)
целостности; 4) беглости. Он указывает,
что эти факторы представляют собой
аспекты процессов мышления (понятых
с позиции геш-тальтпсихологии) и всегда
выступают совместно. Каждый из этих
факторов обнаруживается у любого
человека, но с определенной степенью
«насыщенности*. Набор факторов
характеризует форму интеллекта. По
данным Р. Мейли, результаты факторного
анализа подтверждают
существование предложенных им четырех
общих факторов.
В трех из шести субтестов
определяется способность установления
конкретных связей и зависимостей (1,3,
4). Субтесты 2 и 6 имеют более абстрактный
характер, существующие зависимости
не всегда можно определить
непосредственно. Можно полагать, что
здесь в большей степени проявляется
абстрактное мышление. Субтест 5
занимает особое место, так как требует
визуальной комбинаторики. Р. Мейли
указывает, что в субтестах 1 и 2 главную
роль играют факторы сложности задания
и пластичности интеллекта. В двух
комбинационных субтестах выступают
факторы целостности и беглости. Субтесты
4 и 6 носят наиболее сложный, комплексный
характер.
Автором приводятся некоторые
данные по корреляции М. и. а. т. с
другими методиками диагностики
интеллекта. Так, коэффициент корреляции
со Станфорд— Вине
умственного развития шкалой в
различных возрастных группах варьирует
от 0,60 до 0,69. Коэффициент корреляции с
Амтхауэра интеллекта
структуры тестом составляет
0,81 (по данным обследования испытуемых
15-18-летнего возраста). Имеются данные о
связи AIT с
Батареей тестов механических способностей
Вальтера (Walter
Batterie der «Bega-bung fur Mechanik»). Коэффициенты
корреляции по отдельным субтестам
— 0,56-0,61. Общие показатели надежно-
сти ретестовой устанавливаются
в пределах 0,61-0,67, по отдельным
субтестам — 0,48-0,52; надежности
параллельных форм —
0,74. Р. Мейли разработал несколько
модификаций теста, направленных на
обследование различных контингентов
испытуемых, в том числе допускающих
групповое обследование.
Сведений об использовании
в СНГ не имеется.
МЕЙЛИ ПАМЯТИ ТЕСТ (Meili
Memo ry Test) — методика
исследования зрительной и слуховой
памяти. Относится к числу проб памяти
по определению количества удержанных
членов ряда.
М. п. т. проводится в два
этапа. Первый направлен на исследование
зрительной памяти. Тестовый материал
включает две серии картинок с изображением
различных предметов. Каждая серия
насчитывает 30 карточек, предъявляемых
с интервалом 2 с. После демонстрации
картинок первой серии делается
перерыв на 10 с, и затем обследуемый
называет по памяти изображенные на
карточках предметы. Последовательность
перечисления предметов значения не
имеет. В протоколе обследования
отмечается количество правильно
названных объектов. В аналогичном
порядке проводится обследование с
помощью второй серии карточек (обычно
на следующий день). Желательно также
не проводить в один день обследование
зрительной и слуховой памяти. Анализ
слуховой памяти производится сходным
образом путем предъявления двух серий
по 30 слов. Полученные результаты могут
быть выражены в процентных показателях
(см. Оценки шкальные).
Для оценки результатов
проб зрительной и слуховой памяти
имеются нормы для испытуемых 7-14 лет и
взрослых (отдельно для лиц мужского и
женского пола).
По мнению Р. Мейли, с помощью
данной методики исследуются лишь
облада-
ющие не очень большой
диагностической ценностью показатели
непосредственной «цепкости» памяти.
Для общей оценки состояния памяти
применение М. п. т. допустимо лишь в
комплексе с другими методами. Получение
достоверных различий по результатам
отдельных серий свидетельствует о
лабильности мнестичес-кой функции,
недостаточной концентрации внимания.
Благодаря компактности и
простоте М. п. т. может применяться в
качестве скрининговой методики (см.
Отсеивание). Основное
распространение М. п. т. в отечественной
психологической
диагностике получил
в области клинических исследований
(Мейли, 1969; В. М. Блей-хер и И. В. Крук,
1986).
МЕРЫ ИЗМЕНЧИВОСТИ —
статистические показатели вариации
(разброса) признака (переменной)
относительно среднего значения, степени
индивидуальных отклонений от
центральной тенденции распределения.
М. и. позволяют судить о достоверности
и однородности полученной эмпирически
совокупности данных, существенности
сходств и различий в распределении
и сравниваемых группах распределений,
точности проведенных измерений.
Одна и та же средняя величина
может характеризовать совокупности
данных, в которых размеры вариации
признака значительно отличаются
друг от друга. Так, например, при
обследовании уровня достижений по
отдельному предмету двух групп учащихся
может оказаться, что xl
= x2,
однако в первой
группе показатели плотно концентрируются
около х,
что отражает одинаковый, стабильный
уровень подготовки, а во второй
наблюдается значительный разброс
(часть учащихся, предположим, в силу
индивидуальных интересов и самостоятельной
углубленной подготовки достигают
очень хороших
результатов, в то время как
большинство других имеют показатели
существенно ниже, чем в первой группе).
Наиболее простым и наглядным
способом представления разброса
данных является размах распределения,
т. е. разность между самым высоким и
самым низким результатами. Однако эта
М. и. неточна и неустойчива, поскольку
характеризует только два показателя в
выборке независимо от объема последней.
Случайный, необычно низкий или высокий
результат может заметно повлиять на
величину размаха. Более точная М. и.
основана на учете разности между
каждым индивидуальным результатом
и средним значением по группе. Таким
показателем является среднее абсолютное
(линейное, арифметическое) отклонение
(d):
где jJCf-xj
означает, что
суммируются значения отклонений от х
без учета знака, п
— объем совокупности^
Недостаток показателя d
заключается в
том, что он не учитывает знак отклонения,
поэтому гораздо более информативными
М. и. являются дисперсия и среднеквадратическое
отклонение.
Дисперсия представляет
собой среднюю квадрата отклонений
индивидуальных значений признака
от их средней величины и обозначается
а2:
деления ошибки выборки,
однородности изучаемой совокупности
по тому или иному признаку. Он лежит
в основе факторного
анализа, дисперсионного анализа и
ряда других статистических методов,
Применение дисперсии как М. и. не всегда
удобно, так как размерность дисперсии
равна квадрату размерности изучаемого
признака- Поэтому для измерения вариации
вычисляется среднее квадра-тическое
отклонение ст, равное
корню квадратному из суммы квадратов
отклонений индивидуальных значений
признака от среднего, т. е. дисперсии:
Величина квадратного корня
из дисперсии носит также название
стандартного
отклонения (ст, Sx).
Стандартное
отклонение является общеупотребимой
мерой вариации, так как для многих
распределений, приближающихся к
нормальному, мы приблизительно знаем,
какой процент данных лежит внутри
одного, двух, трех и более стандартных
отклонений от среднего.
Дисперсия и среднее
квадратическое отклонение как меры
вариации признака имеют некоторые
недостатки. Они недостаточно точно
характеризуют изменчивость признака,
т. к. отражают абсолютный размер
отклонений. Это неудобно при сопоставлении
распределений с различной размерностью
и значением признаков. Для устранения
этого недостатка абсолютные числа
переводятся в относительные. Отношение
квадратического отклонения к средней,
выраженное в про-
Отношение среднего линейного
отклонения к средней арифметической,
выраженное в процентах, называется
линейным коэффициентом вариации:
Отношение размаха вариации
{R) к
средней арифметической, выраженное в
процентах, называется коэффициентом
асцилляции:
МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
— характеристики
совокупности переменных (признаков),
указывающие на наиболее типичный,
репрезентативный для изучаемой выборки
результат. Если предположить, что
множество результатов исследования
расположено на числовой прямой, то
центральная тенденция будет проявляться
в ориентации, группировании результатов
относительно определенного участка
этой прямой. М. ц. т. являются наиболее
широко применяемыми статистическими
показателями, используемыми не только
для характеристики количественных
признаков, выраженных в интервальных
шкалах, но и для анализа качественных
признаков в порядковых шкалах путем
приписывания им количественных
индексов. Наиболее распространенными
М. ц. т. являются средние величины: