Квазиэкспериментальные планы. Шпаргалка: Экспериментальная психология Фактор фона в экспериментальной психологии


Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент.

Идеальный эксперимент – это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность – главный признак хорошо проведенного эксперимента.

Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.

Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия – это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

Реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

Эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

Фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

Фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии – клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента, так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.

Валидность соответствие конкретного исследования принятым стандартам / безупречному эксперименту / (Дружинин В.Н.); достоверность / или степень достоверности / вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. «Валидность» – центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения эксперимента.

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует / представляет / безупречный, и чем лучше эта репрезентативность, тем выше валидность эксперимента. Таким образом, повышение валидности, т.е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера реальных условий и, во-вторых, от адекватности выбора средств . Так, источники нарушения валидности (прежде всего, надежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля позволяют приблизиться к нему, т.е. обеспечить высокую валидность для обобщения экспериментальных результатов. Валидность полученных результатов можно оценить статистически: например, валидность теста (в корреляционном исследовании) определяется степенью корреляции результатов его выполнения с изучаемым видом деятельности испытуемых / Готтсданкер Р. /

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент .

Идеальный эксперимент - это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность . Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность - главный признак хорошо проведенного эксперимента.



Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента : фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной.

Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.).

Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих.

Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта.

Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок.

Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом.

Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.



Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия - это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности . От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

- реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

- эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

- фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

- фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии - клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Так же выделяют следующие виды валидности:

Валидность экологическая – вид внешней валидности, характеризует соответствие процедуры и условий лабораторного исследования «естественной» реальности.

Валидность теоретическая /или прогностическая / - отношение идеального исследования к реальности.

Валидность операциональная – соответствие операций экспериментатора теоретическому описанию переменных, контролируемых в исследовании. Варьируемые экспериментатором условия должны соответствовать независимой переменной. Методики и план эксперимента должны соответствовать проверяемой гипотезе – степень этого соответствия и характеризует операциональную валидность.

Валидность конструктная – выражает адекватность метода интерпретации экспериментальных данных теории, т.е. структура экспериментального исследования выглядит следующим образом: теория – эксперимент – интерпретация – реальность./ Д.Кэмпбелл /. Конструктная валидность, по мнению Кэмпбелла, характеризует правильность интерпретации причины и экспериментального эффекта с помощью абстрактных терминов из обыденного языка или формальной теории. С точки зрения Кэмпбелла, хороший эксперимент должен:

1) выявлять временную последовательность предполагаемых причины и следствия;

2) показывать, что вероятные причины и эффект взаимосвязаны /ковариантны/;

3) исключать влияние побочных переменных, которым можно было бы объяснить экспериментальный эффект;

4) исключать альтернативные гипотезы о теоретических конструктах, объясняющих эту связь.

Валидность критериальная – отражает соответствие диагноза и прогноза, полученного на основе данных тестирования, деятельностным и жизненным показателям; включает в себя текущую и прогностическую валидность.

Валидность содержательная / очевидная / - соответствие целей и процедуры исследования обыденным представлениям испытуемого о природе изучаемого явления. Имеет мотивационное значение для испытуемых.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента , так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.


В.В. Никандров указывает, что достижение главной цели эксперимента – предельно возможной однозначности в понимании связей между явлениями внутренней психической жизни и их внешними проявлениями – достигается благодаря следующим основным характеристикам эксперимента:

1) инициатива экспериментатора в проявлении интересующих его психологических фактов;

2) возможность варьирования условий возникновения и развития психических явлений;

3) строгий контроль и фиксация условий и процесса их протекания;

4) изоляция одних и акцентирование других факторов, обусловливающих изучаемые феномены, которая дает возможность выявления закономерностей их существования;

5) возможность повторения условий эксперимента для многократной проверки получаемых научных данных и их накопления;

6) варьирование условий для количественных оценок выявляемых закономерностей.

Таким образом, психологический эксперимент можно определить как метод, при котором исследователь сам вызывает интересующие его явления и изменяет условия их протекания с целью установить причины возникновения этих явлений и закономерности их развития. Кроме того, получаемые научные факты могут неоднократно воспроизводиться благодаря управляемости и строгому контролю условий, что дает возможность их проверки, а также накопления количественных данных, на основе которых можно судить о типичности или случайности изучаемых явлений.

4.2. Виды психологического эксперимента

Эксперименты бывают нескольких видов. В зависимости от способа организации выделяют лабораторный, естественный и полевой эксперименты. Лабораторный эксперимент проводится в специальных условиях. Исследователь планово и целенаправленно воздействует на объект изучения, чтобы изменить его состояние. Достоинством лабораторного эксперимента можно считать строгий контроль за всеми условиями, а также применение специальной аппаратуры для измерения. Недостатком лабораторного эксперимента является трудность переноса полученных данных на реальные условия. Испытуемый в лабораторном эксперименте всегда осведомлен о своем участии в нем, что может стать причиной мотивационных искажений.

Естественный эксперимент проводится в реальных условиях. Его достоинство состоит в том, что изучение объекта осуществляется в контексте повседневной жизни, поэтому полученные данные легко переносятся в реальность. Испытуемые не всегда проинформированы о своем участии в эксперименте, поэтому не дают мотивационных искажений. Недостатки – невозможность контроля всех условий, непредвиденные помехи и искажения.

Полевой эксперимент проводится по схеме естественного. При этом возможно использование портативной аппаратуры, позволяющей более точно регистрировать получаемые данные. Испытуемые проинформированы об участии в эксперименте, однако привычная обстановка снижает уровень мотивационных искажений.

В зависимости от цели исследования различают поисковый, пилотажный и подтверждающий эксперименты. Поисковый эксперимент направлен на поиск причинно-следственной связи между явлениями. Он проводится на начальном этапе исследования, позволяет сформулировать гипотезу, выделить независимую, зависимую и побочные переменные (см. 4.4) и определить способы их контроля.

Пилотажный эксперимент – это пробный эксперимент, первый в серии. Он проводится на небольшой выборке, без строгого контроля переменных. Пилотажный эксперимент позволяет устранить грубые ошибки в формулировке гипотезы, конкретизировать цель, уточнить методику проведения эксперимента.

Подтверждающий эксперимент направлен на установление вида функциональной связи и уточнение количественных отношений между переменными. Проводится на заключительном этапе исследования.

В зависимости от характера влияния на испытуемого выделяют констатирующий, формирующий и контрольный эксперименты. Констатирующий эксперимент включает в себя измерение состояния объекта (испытуемого или группы испытуемых) до активного воздействия на него, диагностику исходного состояния, установление причинно-следственных связей между явлениями. Целью формирующего эксперимента является применение способов активного развития или формирования каких-либо свойств у испытуемых. Контрольный эксперимент – это повторное измерение состояния объекта (испытуемого или группы испытуемых) и сравнение с состоянием до начала формирующего эксперимента, а также с состоянием, в котором находится контрольная группа, не получавшая экспериментального воздействия.

По возможности влияния экспериментатора на независимую переменную выделяют спровоцированный эксперимент и эксперимент, на который ссылаются. Спровоцированный эксперимент – это опыт, в котором экспериментатор сам изменяет независимую переменную, при этом наблюдаемые экспериментатором результаты (виды реакций испытуемого) считаются спровоцированными. П. Фресс называет данный тип эксперимента «классическим». Эксперимент, на который ссылаются, – это опыт, в котором изменения независимой переменной осуществляются без вмешательства экспериментатора. К этому виду психологического эксперимента прибегают тогда, когда независимые переменные оказывают воздействие на испытуемого, значительно растянутое во времени (например, система воспитания и т. п.). Если воздействие на испытуемого может вызвать серьезное негативное физиологическое или психологическое нарушение, то такой эксперимент проводить нельзя. Однако бывают случаи, когда негативное воздействие (например, травма головного мозга) происходит в реальности. Впоследствии такие случаи могут быть обобщены и изучены.

4.3. Структура психологического эксперимента

Главными компонентами любого эксперимента являются:

1) испытуемый (исследуемый субъект или группа);

2) экспериментатор (исследователь);

3) стимуляция (выбранный экспериментатором способ воздействия на испытуемого);

4) ответ испытуемого на стимуляцию (его психическая реакция);

5) условия опыта (дополнительные к стимуляции воздействия, которые могут влиять на реакции испытуемого).

Ответ испытуемого является внешней реакцией, по которой можно судить о протекающих в его внутреннем, субъективном пространстве процессах. Сами эти процессы есть результат воздействия на него стимуляции и условий опыта.

Если ответ (реакцию) испытуемого обозначить символом R, а воздействия на него экспериментальной ситуации (как совокупности воздействий стимуляции и условий опыта) – символом S, то их соотношение можно выразить формулой R = =f (S). То есть реакция есть функция от ситуации. Но эта формула не учитывает активную роль психики, личности человека (P). В действительности реакция человека на ситуацию всегда опосредована психикой, личностью. Таким образом, соотношение между основными элементами эксперимента может быть зафиксировано следующей формулой: R = f (Р, S).

П. Фресс и Ж. Пиаже в зависимости от задач исследования выделяют три классических типа отношений между этими тремя компонентами эксперимента: 1) функциональные отношения; 2) структурные отношения; 3) дифференциальные отношения.

Функциональные отношения характеризуются вариативностью ответов (R) испытуемого (Р) при систематических качественных или количественных изменениях ситуации (S). Графически эти отношения можно представить следующей схемой (рис. 2).

Примеры функциональных отношений, выявленных в экспериментах: изменение ощущений (R) в зависимости от интенсивности воздействия на органы чувств (S); объем запоминания (R) от числа повторений (S); интенсивность эмоционального отклика (R) на действие различных эмоциогенных факторов (S); развитие адаптационных процессов (R) во времени (S) и т. п.

Структурные отношения раскрываются через систему ответов (R1, R2, Rn) на различные ситуации (Sv S2, Sn). Отношения между отдельными ответами структурируются в систему, отражающую структуру личности (Р). Схематически это выглядит так (рис. 3).


Примеры структурных отношений: система эмоциональных реакций (Rp R2, Rn) на действие стрессоров (Sv S2, Sn); эффективность решения (R1, R2, Rn) различных интеллектуальных задач (S1, S2, Sn) и т. п.

Дифференциальные отношения выявляются через анализ реакций (R1, R2, Rn) разных испытуемых (P1, P2, Pn) на одну и ту же ситуацию (S). Схема этих отношений такова (рис. 4).

Примеры дифференциальных отношений: разница скорости реакции у разных людей, национальные различия в экспрессивном проявлении эмоций и т. п.

4.4. Экспериментальные переменные и способы их контроля

Для уточнения соотношения всех факторов, входящих в эксперимент, введено понятие «переменная». Выделяют три вида переменных: независимые, зависимые и дополнительные.

Независимые переменные. Фактор, изменяемый самим экспериментатором, называется независимой переменной (НП).

В качестве НП в эксперименте могут выступать условия, в которых осуществляется деятельность испытуемого, характеристика заданий, выполнение которых требуется от испытуемого, характеристики самого испытуемого (возрастные, половые, иные различия испытуемых, эмоциональные состояния и другие свойства испытуемого или взаимодействующих с ним людей). Поэтому принято выделять следующие типы НП: ситуационные, инструктивные и персональные.

Ситуационные НП чаще всего не входят в структуру экспериментального задания, выполняемого испытуемым. Тем не менее они оказывают непосредственное воздействие на его деятельность и могут варьироваться экспериментатором. К ситуационным НП относятся различные физические параметры, например освещенность, температура, уровень шума, а также размер помещения, обстановка, размещение аппаратуры и т. п. К социально-психологическим параметрам ситуационных НП может быть отнесено выполнение экспериментального задания в изоляции, в присутствии экспериментатора, внешнего наблюдателя или группы людей. В.Н. Дружинин указывает на особенности общения и взаимодействия испытуемого и экспериментатора как на особую разновидность ситуационных НП. Этому аспекту уделяется большое внимание. В экспериментальной психологии существует отдельное направление, которое называется «психология психологического эксперимента».

Инструктивные НП связаны непосредственно с экспериментальным заданием, его качественными и количественными характеристиками, а также способами его выполнения. Инструктивной НП экспериментатор может манипулировать более или менее свободно. Он может варьировать материал задания (например, числовой, словесный или образный), тип ответа испытуемого (например, вербальный или невербальный), шкалу оценивания и т. п. Большие возможности заключаются в способе инструктирования испытуемых, информирования их о цели экспериментального задания. Экспериментатор может изменять средства, которые предлагаются испытуемому для выполнения задания, ставить перед ним препятствия, использовать систему поощрений и наказаний в ходе выполнения задания и т. д.

Персональные НП представляют собой управляемые особенности испытуемого. Обычно в качестве таких особенностей выступают состояния участника эксперимента, которые исследователь может менять, например различные эмоциональные состояния или состояния работоспособности-утомления.

Каждый испытуемый, участвующий в эксперименте, обладает множеством уникальных физических, биологических, психологических, социально-психологических и социальных признаков, которыми экспериментатор управлять не может. В некоторых случаях следует считать эти неуправляемые признаки дополнительными переменными и применять к ним способы контроля, о которых будет рассказано ниже. Однако в дифференциально-психологических исследованиях при применении факторных планов неуправляемые персональные переменные могут выступать в качестве одной из независимых переменных (подробно о факторных планах см. 4.7).

Исследователи различают также разные виды независимых переменных. В зависимости от шкалы представления можно выделить качественные и количественные НП. Качественным НП соответствуют различные градации шкал наименований. Например, эмоциональные состояния испытуемого могут быть представлены состояниями радости, гнева, страха, удивления и т. п. Способы выполнения заданий могут включать наличие или отсутствие подсказок испытуемому. Количественные НП соответствуют ранговым, пропорциональным или интервальным шкалам. Например, время, отведенное на выполнение задания, количество заданий, размер вознаграждения по результатам решения задач могут быть использованы как количественные НП.

В зависимости от количества уровней проявления независимых переменных различают двухуровневые и многоуровневые НП. Двухуровневые НП имеют два уровня проявления, многоуровневые – три или более уровней. В зависимости от количества уровней проявления НП строятся различные по сложности экспериментальные планы.

Зависимые переменные. Фактор, изменение которого является следствием изменения независимой переменной, называется зависимой переменной (ЗП). Зависимая переменная – это компонент в составе ответа испытуемого, который непосредственно интересует исследователя. В качестве ЗП могут выступать физиологические, эмоциональные, поведенческие реакции и другие психологические характеристики, которые можно зарегистрировать в ходе психологических экспериментов.

В зависимости от способа, с помощью которого можно зарегистрировать изменения, выделяют ЗП:

S наблюдаемые непосредственно;

S требующие физической аппаратуры для измерения;

S требующие психологического измерения.

К ЗП, наблюдаемым непосредственно, относятся вербальные и невербальные поведенческие проявления, которые четко и однозначно могут быть оценены внешним наблюдателем, например отказ от деятельности, плач, определенное высказывание испытуемого и т. п. К ЗП, требующим физической аппаратуры для регистрации, относятся физиологические (пульс, величина артериального давления и т. д.) и психофизиологические реакции (время реакции, латентное время, длительность, скорость выполнения действий и т. п.). К ЗП, требующим психологического измерения, относятся такие характеристики, как уровень притязаний, уровень развития или сформированности тех или иных качеств, форм поведения и т. п. Для психологического измерения показателей могут быть использованы стандартизированные процедуры – тесты, опросники и т. п. Некоторые поведенческие параметры могут быть измерены, т. е. однозначно распознаны и интерпретированы только специально обученными наблюдателями или экспертами.

В зависимости от количества параметров, входящих в зависимую переменную, различают одномерные, многомерные и фундаментальные ЗП. Одномерная ЗП представлена единственным параметром, изменения которого и изучаются в эксперименте. Примером одномерной ЗП может служить скорость сенсомоторной реакции. Многомерная ЗП представлена совокупностью параметров. Например, внимательность может оцениваться объемом просмотренного материала, количеством отвлечений, числом правильных и ошибочных ответов и т. д. Каждый параметр может фиксироваться независимо. Фундаментальная ЗП представляет собой переменную комплексного характера, параметры которой имеют некоторые известные отношения между собой. В этом случае одни параметры выступают как аргументы, а собственно зависимая переменная – как функция. Например, фундаментальное измерение уровня агрессии может рассматриваться как функция ее отдельных проявлений (мимических, вербальных, физических и др.).

Зависимая переменная должна обладать такой базовой характеристикой, как сензитивность. Сензитивность ЗП – это ее чувствительность к изменению уровня независимой переменной. Если при изменении независимой переменной зависимая переменная не изменяется, то последняя несензитивна и проводить эксперимент в таком случае не имеет смысла. Известны два варианта проявления несензитивности ЗП: «эффект потолка» и «эффект пола». «Эффект потолка» наблюдается, например, в том случае, когда предъявляемая задача настолько проста, что ее выполняют все испытуемые независимо от возраста. «Эффект пола», напротив, возникает в том случае, когда задание настолько сложно, что с ним не может справиться ни один из испытуемых.

Существуют два основных способа фиксации изменений ЗП в психологическом эксперименте: непосредственный и отсроченный. Непосредственный способ применяется, например, в экспериментах по кратковременному запоминанию. Экспериментатор непосредственно после повторения ряда стимулов фиксирует их количество, воспроизведенное испытуемым. Отсроченный способ используется в том случае, когда между воздействием и эффектом проходит определенный промежуток времени (например, при определении влияния количества заученных иностранных слов на успешность перевода текста).

Дополнительные переменные (ДП) – это сопутствующая стимуляция испытуемого, оказывающая влияние на его ответ. Совокупность ДП состоит, как правило, из двух групп: внешних условий опыта и внутренних факторов. Соответственно их принято называть внешними и внутренними ДП. К внешним ДП относят физическую обстановку опыта (освещенность, температурный режим, звуковой фон, пространственные характеристики помещения), параметры аппаратуры и оборудования (дизайн измерительных приборов, рабочий шум и т. п.), временные параметры эксперимента (время начала, продолжительность и др.), личность экспериментатора. К внутренним ДП относят настроение и мотивацию испытуемых, их отношение к экспериментатору и опытам, их психологические установки, склонности, знания, умения, навыки и опыт в данном виде деятельности, уровень утомления, самочувствие и т. п.

В идеале исследователь стремится все дополнительные переменные свести на нет или хотя бы к минимуму, чтобы выделить «в чистом виде» связь между независимой и зависимой переменными. Существует несколько основных способов контроля влияния внешних ДП: 1) элиминация внешних воздействий; 2) константность условий; 3) балансировка; 4) контрбалансировка.

Элиминация внешних воздействий представляет собой наиболее радикальный способ контроля. Он состоит в полном исключении из внешней среды каких бы то ни было внешних ДП. В лаборатории создаются условия, изолирующие испытуемого от звуков, света, вибрационных воздействий и т. п. Наиболее ярким примером может служить эксперимент по сенсорной депривации, проводимый на добровольцах в специальной камере, полностью исключающей поступление каких-либо раздражителей из внешней среды. Следует отметить, что элиминировать воздействия ДП практически невозможно, да и не всегда нужно, так как результаты, полученные в условиях элиминации внешних воздействий, вряд ли могут быть перенесены в реальность.

Следующий способ контроля – создание константных условий. Суть этого способа состоит в том, чтобы сделать воздействия ДП постоянными и одинаковыми для всех испытуемых на протяжении всего опыта. В частности, исследователь стремится сделать постоянными пространственно-временные условия эксперимента, технику его проведения, оборудование, предъявление инструкции и т. д. При тщательном применении этого способа контроля удается избежать больших погрешностей, однако проблема переноса результатов эксперимента в условия, сильно отличающиеся от экспериментальных, остается проблематичной.

В тех случаях, когда нет возможности создать и поддерживать постоянные условия на протяжении всего эксперимента, прибегают к способу балансировки. Этот способ применяется, например, в ситуации, когда внешняя ДП не поддается идентификации. В этом случае балансировка будет состоять в использовании контрольной группы. Исследование контрольной и экспериментальной групп проводится в одних и тех же условиях с той лишь разницей, что в контрольной группе отсутствует воздействие независимой переменной. Тем самым изменение зависимой переменной в контрольной группе обусловлено лишь внешними ДП, а в экспериментальной – совместным действием внешних дополнительных и независимой переменной.

Если внешняя ДП известна, то балансировка заключается в воздействии каждого ее значения в сочетании с каждым уровнем независимой переменной. В частности, такая внешняя ДП, как пол экспериментатора, в сочетании с независимой переменной (пол испытуемого) приведет к созданию четырех экспериментальных серий:

1) мужчина-экспериментатор – мужчины испытуемые;

2) мужчина-экспериментатор – женщины испытуемые;

3) женщина-экспериментатор – мужчины испытуемые;

4) женщина-экспериментатор – женщины испытуемые.

В более сложных экспериментах может применяться балансировка нескольких переменных одновременно.

Контрбалансировка как способ контроля внешних ДП практикуется чаще всего тогда, когда эксперимент включает в себя несколько серий. Испытуемый оказывается в разных условиях последовательно, однако предыдущие условия могут изменять эффект воздействия последующих. Для ликвидации возникающего в этом случае «эффекта последовательности» разным группам испытуемых экспериментальные условия предъявляются в различном порядке. Например, в первой серии эксперимента первой группе предъявляется решение интеллектуальных задач от более простых к более сложным, а второй – от более сложных к более простым. Во второй серии, напротив, первой группе предъявляется решение интеллектуальных задач от более сложных к более простым, а второй – от более простых к более сложным. Контрбалансировка применяется в тех случаях, когда есть возможность проведения нескольких серий эксперимента, однако следует учитывать, что большое число попыток вызывает утомление испытуемых.

Внутренние ДП, как указывалось выше, – это факторы, кроющиеся в личности испытуемого. Они оказывают весьма значительное влияние на результаты эксперимента, их воздействие достаточно трудно проконтролировать и учесть. Среди внутренних ДП можно выделить постоянные и непостоянные. Постоянные внутренние ДП в течение эксперимента существенно не изменяются. Если эксперимент проводится с одним испытуемым, то постоянными внутренними ДП будут его пол, возраст, национальность. К этой группе факторов также можно отнести темперамент, характер, способности, склонности испытуемого, его интересы, взгляды, убеждения и другие компоненты общей направленности личности. В случае проведения эксперимента с группой испытуемых эти факторы приобретают характер непостоянных внутренних ДП, и тогда для нивелировки их влияния прибегают к специальным способам формирования экспериментальных групп (см. 4.6).

К непостоянным внутренним ДП относятся психологические и физиологические характеристики испытуемого, которые могут либо значительно изменяться по ходу эксперимента, либо актуализироваться (или исчезать) в зависимости от целей, задач, вида, формы организации эксперимента. Первую группу таких факторов составляют физиологические и психические состояния, утомляемость, привыкание, приобретение опыта и навыков в процессе выполнения экспериментального задания. В другую группу входят установка на данный опыт и данное исследование, уровень мотивации к данной экспериментальной деятельности, отношение испытуемого к экспериментатору и своей роли подопытного и т. п.

Для уравнивания эффекта воздействия этих переменных на ответы в разных пробах существует ряд способов, успешно применяемых в экспериментальной практике.

Для устранения так называемого серийного эффекта, в основе которого лежит привыкание, используется особая очередность предъявления стимулов. Эта процедура получила название «уравновешенного чередного порядка», когда стимулы разных категорий предъявляются симметрично относительно центра стимульного ряда. Схема такой процедуры выглядит так: А В В А, где А и В – стимулы разных категорий.

Чтобы предупредить влияние на ответ испытуемого тревожности или неопытности, проводятся ознакомительные или предварительные эксперименты. Их итоги не учитываются при обработке данных.

Для предупреждения изменчивости ответов из-за накопления опыта и навыков в процессе эксперимента испытуемому предлагается так называемая «исчерпывающая практика». В результате такой практики у испытуемого до начала собственно эксперимента вырабатываются устойчивые навыки, и в дальнейших экспериментах показатели испытуемого от фактора накопления опыта и навыков уже напрямую не зависят.

В тех случаях, когда необходимо свести к минимуму влияние на ответ испытуемого утомления, прибегают к «методу вращения». Суть его состоит в том, что каждой подгруппе испытуемых предъявляется определенная комбинация стимулов. Совокупность таких комбинаций полностью исчерпывает все множество возможных вариантов. Например, при трех типах стимулов (А, Б, В) каждому из них представляется первое, второе и третье место в предъявлении испытуемым. Таким образом, первой подгруппе стимулы предъявляются в порядке АБВ, второй – АВБ, третьей – БАВ, четвертой – БВА, пятой – ВАБ, шестой – ВБА.

Приведенные способы процедурного уравнивания внутренних непостоянных ДП применимы как для индивидуальных, так и для групповых экспериментов.

Установка и мотивация испытуемых как внутренние непостоянные ДП должны поддерживаться на одном и том же уровне во время всего опыта. Установка как готовность воспринимать раздражитель и отвечать на него определенным образом создается через инструкцию, которую экспериментатор дает испытуемому. Чтобы установка была именно такой, какая требуется по задаче исследования, инструкция должна быть доступна испытуемым и адекватна задачам эксперимента. Однозначность и легкость понимания инструкции достигаются ее ясностью и простотой. Во избежание вариативности предъявления инструкцию рекомендуется зачитывать дословно или давать в письменном виде. Поддержание исходной установки контролируется экспериментатором путем постоянного наблюдения за испытуемым и корректируется путем напоминания при необходимости соответствующих указаний инструкции.

Мотивация испытуемого рассматривается главным образом как интерес к данному эксперименту. Если интерес отсутствует или слаб, то трудно рассчитывать на полноценность выполнения испытуемым предусмотренных в эксперименте заданий и на надежность его ответов. Слишком высокий интерес, «перемотивация», также чревата неадекватностью ответов испытуемого. Поэтому для получения исходно приемлемого уровня мотивации экспериментатор должен самым серьезным образом подойти к формированию контингента испытуемых и подбору стимулирующих их мотивацию факторов. В качестве таких факторов могут выступать состязательность, различные виды вознаграждения, интерес к своим показателям, профессиональный интерес и др.

Психофизиологические состояния испытуемых рекомендуется не только поддерживать на одном уровне, но и оптимизировать этот уровень, т. е. испытуемые должны находиться в «нормальном» состоянии. Следует убедиться, что до проведения опыта у испытуемого не было сверхзначимых для него переживаний, у него достаточно времени для участия в эксперименте, он не голоден и т. п. Во время проведения эксперимента не следует излишне возбуждать или подавлять испытуемого. Если же эти условия выполнить не удается, то проведение эксперимента лучше отложить.

Из рассмотренных характеристик переменных и способов их контроля становится понятой необходимость тщательной подготовки эксперимента при его планировании. В реальных условиях экспериментирования добиться 100 %-го контроля всех переменных невозможно, однако различные психологические эксперименты значительно отличаются друг от друга степенью контроля переменных. Рассмотрению вопроса оценки качества эксперимента посвящен следующий раздел.

4.5. Валидность и надежность эксперимента

Для конструирования и оценки экспериментальных процедур используются понятия: идеальный эксперимент, эксперимент полного соответствия и бесконечный эксперимент.

Идеальный эксперимент – это эксперимент, организованный таким образом, что экспериментатор изменяет лишь независимую переменную, зависимая переменная контролируется, а все остальные условия эксперимента остаются неизменными. Идеальный эксперимент предполагает эквивалентность всех испытуемых, неизменность их характеристик во времени, отсутствие самого времени. Он никогда не может быть осуществлен в реальности, так как в жизни изменяются не только интересующие исследователя параметры, но и ряд других условий.

Соответствие реального эксперимента идеальному выражается в такой его характеристике, как внутренняя валидность. Внутренняя валидность показывает достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Чем больше влияют на изменение зависимых переменных не контролируемые исследователем условия, тем ниже внутренняя валидность эксперимента, следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами. Высокая внутренняя валидность – главный признак хорошо проведенного эксперимента.

Д. Кэмпбелл выделяет следующие факторы, угрожающие внутренней валидности эксперимента: фактор фона, фактор естественного развития, фактор тестирования, погрешность измерения, статистическая регрессия, неслучайный отбор, отсеивание. Если они не контролируются, то приводят к появлению соответствующих эффектов.

Фактор фона (истории) включает события, которые происходят между предварительным и окончательным измерением и могут вызвать изменения в зависимой переменной наряду с влиянием независимой переменной. Фактор естественного развития связан с тем, что изменения в уровне зависимой переменной могут возникнуть в связи с естественным развитием участников эксперимента (взросление, нарастание утомления и т. п.). Фактор тестирования заключается во влиянии предварительных измерений на результаты последующих. Фактор погрешности измерения связан с неточностью или изменениями в процедуре или методе измерения экспериментального эффекта. Фактор статистической регрессии проявляется в том случае, если для участия в эксперименте были отобраны испытуемые с крайними показателями каких-либо оценок. Фактор неслучайного отбора соответственно встречается в тех случаях, когда при формировании выборки отбор участников проводился неслучайным образом. Фактор отсеивания проявляется в том случае, если испытуемые неравномерно выбывают из контрольной и экспериментальной групп.

Экспериментатор должен учитывать и по возможности ограничивать влияние факторов, угрожающих внутренней валидности эксперимента.

Эксперимент полного соответствия – это экспериментальное исследование, в котором все условия и их изменения отвечают реальности. Приближение реального эксперимента к эксперименту полного соответствия выражается во внешней валидности. От уровня внешней валидности зависит степень переносимости результатов эксперимента в реальность. Внешняя валидность, по определению Р. Готтсданкера, влияет на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным.

К факторам, угрожающим внешней валидности, относят следующие:

Реактивный эффект (заключается в уменьшении или увеличении восприимчивости испытуемых к экспериментальному влиянию вследствие предыдущих измерений);

Эффект взаимодействия отбора и влияния (состоит в том, что экспериментальное влияние будет существенным только для участников данного эксперимента);

Фактор условий эксперимента (может привести к тому, что экспериментальный эффект может наблюдаться только в данных специально организованных условиях);

Фактор интерференции влияний (проявляется при предъявлении одной группе испытуемых последовательности взаимоисключающих влияний).

Заботу о внешней валидности экспериментов особо проявляют исследователи, работающие в прикладных областях психологии – клинической, педагогической, организационной, поскольку в случае невалидного исследования его результаты ничего не дадут при переносе их в реальные условия.

Бесконечный эксперимент предполагает неограниченное количество опытов, проб для получения все более точных результатов. Увеличение количества проб в эксперименте с одним испытуемым ведет к повышению надежности результатов эксперимента. В экспериментах с группой испытуемых повышение надежности происходит при увеличении числа испытуемых. Однако суть эксперимента состоит именно в том, чтобы на основе ограниченного числа проб или при помощи ограниченной группы испытуемых выявить причинно-следственные связи между явлениями. Поэтому бесконечный эксперимент не только невозможен, но и бессмыслен. Для достижения высокой надежности эксперимента количество проб или число испытуемых должно соответствовать изменчивости изучаемого явления.

Следует отметить, что при увеличении числа испытуемых повышается и внешняя валидность эксперимента, так как его результаты могут быть перенесены на более широкую популяцию. Для проведения экспериментов с группой испытуемых необходимо рассмотреть вопрос об экспериментальных выборках.

4.6. Экспериментальные выборки

Как указывалось выше, эксперимент может проводиться либо с одним испытуемым, либо с группой испытуемых. Эксперимент с одним испытуемым проводится лишь в некоторых специфических ситуациях. Во-первых, это ситуации, когда индивидуальными различиями испытуемых можно пренебречь, т. е. испытуемым может быть любой человек (если в эксперименте изучаются его особенности в отличие, например, от животного). В других ситуациях, напротив, испытуемый представляет собой уникальный объект (гениальный шахматист, музыкант, художник и др.). Возможны также ситуации, когда от испытуемого требуется особая компетентность как результат обучения или неординарного жизненного опыта (единственный выживший в авиационной катастрофе и т. п.). Одним испытуемым ограничиваются и в тех случаях, когда повторение данного эксперимента с участием других испытуемых невозможно. Для экспериментов с одним испытуемым разработаны особые экспериментальные планы (подробно о них см. 4.7).

Чаще эксперименты проводятся с группой испытуемых. В этих случаях выборка испытуемых должна представлять собой модель генеральной совокупности, на которую затем будут распространяться результаты исследования. Первоначально исследователь решает проблему численности экспериментальной выборки. В зависимости от цели исследования и возможности экспериментатора она может составлять от нескольких испытуемых до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) варьируется от 1 до 100 человек. Для применения статистических методов обработки рекомендуется число испытуемых в сравниваемых группах не менее 30–35 человек. Кроме того, целесообразно увеличивать количество испытуемых по крайней мере на 5-10 % от требуемого, так как часть из них или их результатов будет «отбракована» в ходе эксперимента.

Для формирования выборки испытуемых необходимо учитывать несколько критериев.

1. Содержательный. Он заключается в том, что подбор группы испытуемых должен соответствовать предмету и гипотезе исследования. (Например, бессмысленно набирать в группу испытуемых детей двухлетнего возраста для выявления уровня произвольного запоминания.) Желательно создать идеальные представления об объекте экспериментального исследования и при формировании группы испытуемых минимально отклоняться от характеристик идеальной экспериментальной группы.

2. Критерий эквивалентности испытуемых. При формировании группы испытуемых следует учесть все значимые характеристики объекта исследования, различия в выраженности которых могут существенно повлиять на зависимую переменную.

3. Критерий репрезентативности. Группа лиц, участвующих в эксперименте, должна представлять всю часть генеральной совокупности, на которую будут распространяться результаты эксперимента. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы.

Рассмотрим стратегии отбора испытуемых из популяции.

Случайная стратегия заключается в том, что каждому члену генеральной совокупности предоставляется равный шанс попадания в экспериментальную выборку. Для этого каждому индивиду присваивается номер, а затем с помощью таблицы случайных чисел формируется экспериментальная выборка. Данная процедура трудноосуществима, поскольку каждый представитель интересующей исследователя популяции должен быть учтен. Кроме того, случайная стратегия дает хорошие результаты при формировании экспериментальной выборки большого объема.

Стратометрический отбор используется в том случае, если в экспериментальной выборке обязательно должны быть представлены испытуемые с определенным набором характеристик (пол, возраст, уровень образования и т. п.). Выборка составляется таким образом, чтобы в ней были равно представлены испытуемые каждой страты (слоя) с заданными характеристиками.

Стратометрический случайный отбор совмещает две предыдущие стратегии. Представителям каждой страты присваиваются номера и из них случайным образом формируется экспериментальная выборка. Данная стратегия эффективна при отборе экспериментальной выборки небольшого объема.

Репрезентативное моделирование применяется в том случае, когда исследователю удается создать модель идеального объекта экспериментального исследования. Характеристики реальной экспериментальной выборки должны минимально отклоняться от характеристик идеальной экспериментальной выборки. Если исследователю известны не все характеристики идеальной модели экспериментального исследования, то применяется стратегия приближенного моделирования. Чем точнее набор критериев, описывающих популяцию, на которую предполагается распространить выводы эксперимента, тем выше его внешняя валидность.

Иногда в качестве экспериментальной выборки используются реальные группы, при этом в эксперименте либо участвуют добровольцы, либо все испытуемые привлекаются принудительно. И в том и в другом случае нарушается внешняя и внутренняя валидность.

После формирования экспериментальной выборки экспериментатор составляет план исследования. Достаточно часто эксперимент проводится с несколькими группами, экспериментальными и контрольными, которые помещаются в разные условия. Экспериментальные и контрольные группы должны быть эквивалентными на момент начала экспериментального воздействия.

Процедура подбора эквивалентных групп и испытуемых называется рандомизацией. По мнению ряда авторов, эквивалентность групп может быть достигнута при попарном отборе. В этом случае экспериментальная и контрольная группы составляются из индивидов, эквивалентных по значимым для эксперимента побочным параметрам. Идеальный вариант для попарного отбора – привлечение близнецовых пар. Рандомизация с выделением страт заключается в подборе однородных подгрупп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Иногда для выделения значимой дополнительной переменной все испытуемые тестируются и ранжируются по уровню ее выраженности. Экспериментальная и контрольная группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы. Распределение испытуемых на экспериментальную и контрольную группы может проводиться и случайным методом. Как уже указывалось выше, при большой численности экспериментальной выборки этот способ дает вполне удовлетворительные результаты.

4.7. Экспериментальные планы

Экспериментальный план – это тактика экспериментального исследования, воплощенная в конкретной системе операций планирования эксперимента. Основными критериями классификации планов являются:

Состав участников (индивид или группа);

Количество независимых переменных и их уровней;

Виды шкал представления независимых переменных;

Метод сбора экспериментальных данных;

Место и условия проведения эксперимента;

Особенности организации экспериментального воздействия и способа контроля.

Планы для групп испытуемых и для одного испытуемого. Все экспериментальные планы можно разделить по составу участников на планы для групп испытуемых и планы для одного испытуемого.

Эксперименты с группой испытуемых имеют следующие преимущества: возможность обобщения результатов эксперимента на популяцию; возможность использования схем межгрупповых сравнений; экономия времени; применение методов статистического анализа. К недостаткам данного типа экспериментальных планов можно отнести: влияние индивидуальных различий между людьми на результаты эксперимента; проблему репрезентативности экспериментальной выборки; проблему эквивалентности групп испытуемых.

Эксперименты с одним испытуемым – это частный случай «планов с маленьким N». Дж. Гудвин указывает на следующие причины использования таких планов: потребности в индивидуальной валидности, так как в экспериментах с большим N возникает проблема, когда обобщенные данные не характеризуют ни одного испытуемого. Эксперимент с одним испытуемым проводится также в уникальных случаях, когда в силу ряда причин невозможно привлечь много участников. В этих случаях целью эксперимента является анализ уникальных явлений и индивидуальных характеристик.

Эксперимент с маленьким N, по мнению Д. Мартина, имеет следующие преимущества: отсутствие сложных статистических подсчетов, легкость в интерпретации результатов, возможность изучения уникальных случаев, привлечение одного-двух участников, широкие возможности манипуляции независимыми переменными. Ему свойственны и некоторые недостатки, в частности сложность процедур контроля, затруднение при обобщении результатов; относительная неэкономичность по времени.

Рассмотрим планы для одного испытуемого.

Планирование временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого во времени. Простейшая стратегия: схема А – В. Испытуемый первоначально выполняет деятельность в условиях А, а затем в условиях В. Для контроля «эффекта плацебо» применяется схема: А – В – А. («Эффект плацебо» – это реакции испытуемых на «пустые» воздействия, соответствующие реакциям на реальные воздействия.) В данном случае испытуемый не должен заранее знать, какое из условий является «пустым», а какое реальным. Однако эти схемы не учитывают взаимодействия воздействий, поэтому при планировании временных серий, как правило, применяют схемы регулярного чередования (А – В – А – В), позиционного уравнивания (А – В – В – А) или случайного чередования. Применение более «длинных» временных серий увеличивает возможность обнаружения эффекта, но приводит к ряду негативных последствий – утомлению испытуемого, снижению контроля за другими дополнительными переменными и т. п.

План альтернативных воздействий является развитием плана временных серий. Его специфика заключается в том, что воздействия А и В рандомизированно распределяются во времени и предъявляются испытуемому раздельно. Затем сравниваются эффекты от каждого из воздействий.

Реверсивный план применяется для изучения двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Затем предъявляется комплексное воздействие, состоящее из специфического компонента для первой формы поведения и дополнительного для второй. Через определенное время сочетание воздействий видоизменяют. Эффект двух комплексных воздействий оценивается.

План возрастания критериев часто используется в психологии обучения. Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. При этом следующее воздействие предъявляется лишь после выхода испытуемого на заданный уровень критерия.

При проведении экспериментов с одним испытуемым следует учитывать, что основные артефакты практически неустранимы. Кроме того, в этом случае, как ни в каком другом, проявляется влияние установок экспериментатора и отношений, которые складываются между ним и испытуемым.

Р. Готтсданкер предлагает различать качественные и количественные экспериментальные планы . В качественных планах независимая переменная представлена в номинативной шкале, т. е. в эксперименте используются два или более качественно разных условия.

В количественных экспериментальных планах уровни независимой переменной представлены в интервальных, ранговых или пропорциональных шкалах, т. е. в эксперименте используются уровни выраженности того или иного условия.

Возможна ситуация, когда в факторном эксперименте одна переменная будет представлена в количественном, а другая – в качественном виде. В таком случае план будет комбинированным.

Внутригрупповые и межгрупповые экспериментальные планы. Т.В. Корнилова определяет два типа экспериментальных планов по критерию количества групп и условий проведения эксперимента: внутригрупповые и межгрупповые. К внутригрупповым относятся планы, в которых влияние вариантов независимой переменной и измерение экспериментального эффекта происходят в одной группе. В межгрупповых планах влияние вариантов независимой переменной осуществляется в разных экспериментальных группах.

Преимуществами внутригруппового плана являются: меньшее количество участников, устранение факторов индивидуальных отличий, уменьшение общего времени проведения эксперимента, возможность доказательства статистической значимости экспериментального эффекта. К недостаткам относятся неконстантность условий и проявление «эффекта последовательности».

Преимуществами межгруппового плана являются: отсутствие «эффекта последовательности», возможность получения большего количества данных, сокращение времени участия в эксперименте для каждого испытуемого, уменьшение эффекта выбывания участников эксперимента. Главным недостатком межгруппового плана является неэквивалентность групп.

Планы с одной независимой переменной и факторные планы. По критерию количества экспериментальных воздействий Д. Мартин предлагает различать планы с одной независимой переменной, факторные планы и планы с серией экспериментов. В планах с одной независимой переменной экспериментатор манипулирует одной независимой переменной, которая может иметь неограниченное количество вариантов проявления. В факторных планах (подробно о них см. с. 120) экспериментатор манипулирует двумя и более независимыми переменными, исследует все возможные варианты взаимодействия их разных уровней.

Планы с серией экспериментов проводятся для постепенного исключения конкурирующих гипотез. В конце серии экспериментатор приходит к верификации одной гипотезы.

Доэкспериментальные, квазиэкспериментальные планы и планы истинных экспериментов. Д. Кэмпбелл предложил разделить все экспериментальные планы для групп испытуемых на следующие группы: доэкспериментальные, квазиэкспериментальные и планы истинных экспериментов. В основе этого деления лежит близость реального эксперимента к идеальному. Чем меньше артефактов провоцирует тот или иной план и чем строже контроль дополнительных переменных, тем ближе эксперимент к идеальному. Доэкспериментальные планы менее всего учитывают требования, предъявляемые к идеальному эксперименту. В.Н. Дружинин указывает, что они могут служить лишь иллюстрацией, в практике научных исследований их следует по возможности избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований, они специально создаются с отступлением от схем истинных экспериментов. Исследователь должен осознавать источники артефактов – внешних дополнительных переменных, которые он не может контролировать. Квазиэкспериментальный план применяется тогда, когда применение лучшего плана невозможно.

Систематизированные признаки доэкспериментальных, квазиэкспериментальных планов и планов истинных экспериментов приводятся в нижеследующей таблице.


При описании экспериментальных планов будем пользоваться символизацией, предложенной Д. Кэмпбеллом: R – рандомизация; X – экспериментальное воздействие; O – тестирование.

К доэксперименталъным планам относятся: 1) исследование единичного случая; 2) план с предварительным и итоговым тестированием одной группы; 3) сравнение статистических групп.

При исследовании единичного случая однократно тестируется одна группа после экспериментального воздействия. Схематично этот план можно записать в виде:

Контроль внешних переменных и независимой переменной полностью отсутствует. В таком эксперименте нет никакого материала для сравнения. Результаты могут быть сопоставлены лишь с обыденными представлениями о реальности, научной информации они не несут.

План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. Его можно записать в виде:

В этом плане отсутствует контрольная группа, поэтому нельзя утверждать, что изменения зависимой переменной (разница между O1 и O2), регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и итоговым тестированием могут произойти и другие «фоновые» события, воздействующие на испытуемых вместе с независимой переменной. Этот план не позволяет контролировать также эффект естественного развития и эффект тестирования.

Сравнение статистических групп будет точнее назвать планом для двух неэквивалентных групп с тестированием после воздействия. Он может быть записан в таком виде:

Этот план позволяет учитывать эффект тестирования, благодаря введению контрольной группы контролировать ряд внешних переменных. Однако с его помощью невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (предварительное тестирование не проводилось). Для сравнения результатов контрольной и экспериментальной групп используют t-критерий Стьюдента. Однако следует учитывать, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием в составе групп.

Квазиэкспериментальные планы являются своеобразным компромиссом между реальностью и строгими рамками истинных экспериментов. Существуют следующие типы квазиэкспериментальных планов в психологическом исследовании: 1) планы экспериментов для неэквивалентных групп; 2) планы с предварительным и итоговым тестированием различных рандомизированных групп; 3) планы дискретных временных серий.

План эксперимента для неэквивалентных групп направлен на установление причинно-следственной зависимости между переменными, однако в нем отсутствует процедура уравнивания групп (рандомизация). Этот план может быть представлен следующей схемой:

К проведению эксперимента в данном случае привлекаются две реальные группы. Обе группы тестируются. Затем одна группа подвергается экспериментальному воздействию, а другая – нет. Затем обе группы повторно тестируются. Результаты первого и второго тестирования обеих групп сопоставляют, для сравнения используют t-критерий Стьюдента и дисперсионный анализ. Различие O2 и O4 свидетельствует о естественном развитии и фоновом воздействии. Для выявления действия независимой переменной необходимо сравнивать 6(O1 O2) и 6(O3 O4), т. е. величины сдвигов показателей. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую. Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия (см. с. 118). Главным источником артефактов является различие в составе групп.

План с предварительным и итоговым тестированием различных рандомизированных групп отличается от плана истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое – эквивалентная группа, которая подверглась воздействию:

Главный недостаток этого квазиэкспериментального плана – невозможность контролировать эффект «фона» – влияние событий, происходящих наряду с экспериментальным воздействием в период между первым и вторым тестированием.

Планы дискретных временных серий подразделяются на несколько видов в зависимости от количества групп (одной или нескольких), а также в зависимости от количества экспериментальных воздействий (одиночного или серии воздействий).

План дискретных временных серий для одной группы испытуемых состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем применяют экспериментальное воздействие и проводят серию аналогичных замеров. Сравнивают уровни зависимой переменной до и после воздействия. Схема этого плана:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования.

Модификацией этого плана является квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия перед замером. Его схема такова:

ХO1 – O2ХO3 – O4 ХO5

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, полученных в эксперименте, серии разбивают на две последовательности и сравнивают результаты замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы n – 2, где n – число ситуаций одного типа.

Планы временных серий часто реализуются на практике. Однако при их применении нередко наблюдается так называемый «эффект Хотторна». Впервые его обнаружили американские ученые в 1939 г., когда проводили исследование на заводе Хотторна в Чикаго. Предполагалось, что изменение системы организации труда позволит повысить его производительность. Однако в ходе эксперимента любые изменения в организации труда приводили к повышению его производительности. В результате оказалось, что само по себе участие в эксперименте повысило мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы контролировать этот эффект, должна использоваться контрольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

O1O2O3O4O5O6O7O8O9O10

O1O2O3O4O5O6O7O8O9O10

Такой план позволяет контролировать эффект «фона». Обычно он используется исследователями при изучении реальных групп в образовательных учреждениях, клиниках, на производстве.

Еще один специфический план, который нередко используется в психологии, называют экспериментом ex-post-facto. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. Стратегия применения этого плана состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия выступает некоторое реальное событие из их жизни. Экспериментальная группа состоит из «испытуемых», подвергшихся воздействию, а контрольная группа – из людей, не испытавших его. При этом группы по возможности уравниваются на момент своего состояния до воздействия. Затем проводится тестирование зависимой переменной у представителей экспериментальной и контрольной групп. Данные, полученные в результате тестирования, сопоставляются и делается вывод о влиянии воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием и тестированием после воздействия. Его схема такова:

Если удается достичь эквивалентности групп, то этот план становится планом истинного эксперимента. Он реализуется во многих современных исследованиях. Например, при изучении посттравматического стресса, когда люди, перенесшие воздействия природной или техногенной катастрофы, или участники боевых действий тестируются на наличие посттравматического синдрома, их результаты сопоставляются с результатами контрольной группы, что позволяет выявить механизмы возникновения подобных реакций. В нейропсихологии травмы головного мозга, поражения определенных структур, рассматриваемые как «экспериментальное воздействие», предоставляют уникальную возможность для выявления локализации психических функций.

Планы истинных экспериментов для одной независимой переменной отличаются от других следующим:

1) использованием стратегий создания эквивалентных групп (рандомизация);

2) наличием как минимум одной экспериментальной и одной контрольной групп;

3) итоговым тестированием и сравнением результатов групп, получавших и не получавших воздействие.

Рассмотрим подробнее некоторые экспериментальные планы для одной независимой переменной.

План для двух рандомизированных групп с тестированием после воздействия. Его схема выглядит так:

Этот план применяют в том случае, если нет возможности или необходимости проводить предварительное тестирование. При равенстве экспериментальной и контрольной групп данный план является наилучшим, поскольку позволяет контролировать большинство источников артефактов. Отсутствие предварительного тестирования исключает как эффект взаимодействия процедуры тестирования и экспериментального задания, так и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами.

В рассмотренном примере использовался один уровень воздействия независимой переменной. Если же она имеет несколько уровней, то количество экспериментальных групп увеличивается до числа уровней независимой переменной.

План для двух рандомизированных групп с предварительным и итоговым тестированием. Схема плана выглядит следующим образом:

R O1 Х O2

Этот план применяется в том случае, если существуют сомнения в результатах рандомизации. Главный источник артефактов – взаимодействие тестирования и экспериментального воздействия. В реальности также приходится сталкиваться с эффектом неодновременности тестирования. Поэтому наилучшим считается проведение тестирования членов экспериментальной и контрольной групп в случайном порядке. Предъявление-непредъявление экспериментального воздействия также лучше проводить в случайном порядке. Д. Кэмпбелл отмечает необходимость контроля «внутригрупповых событий». Данный экспериментальный план хорошо контролирует эффект фона и эффект естественного развития.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляют три значения t: 1) между O1 и O2; 2) между O3 и O4; 3) между O2 и O4. Гипотезу о значимости влияния независимой переменной на зависимую можно принять в том случае, если выполняются два условия: 1) различия между O1 и O2 значимы, а между O3 и O4 незначимы и 2) различия между O2 и O4 значимы. Иногда удобнее сравнивать не абсолютные значения, а величины прироста показателей б(1 2) и б (3 4). Эти значения также сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую.

План Соломона представляет собой объединение двух предыдущих планов. Для его реализации необходимы две экспериментальные (Э) и две контрольные (К) группы. Его схема выглядит так:

С помощью этого плана можно контролировать эффект взаимодействия предварительного тестирования и эффект экспериментального воздействия. Эффект экспериментального воздействия выявляется при сравнении показателей: O1 и O2; O2 и O4; O5 и O6; O5 и O3. Сравнение O6, O1 и O3 позволяет выявить влияние фактора естественного развития и фоновых воздействий на зависимую переменную.

Теперь рассмотрим план для одной независимой переменной и нескольких групп.

План для трех рандомизированных групп и трех уровней независимой переменной применяется в тех случаях, когда необходимо выявление количественных зависимостей между независимой и зависимой переменными. Его схема выглядит так:

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. При необходимости можно увеличить количество экспериментальных групп в соответствии с количеством уровней независимой переменной. Для обработки данных, полученных с помощью такого экспериментального плана, могут применяться все вышеперечисленные статистические методы.

Факторные экспериментальные планы применяются для проверки сложных гипотез о взаимосвязях между переменными. В факторном эксперименте проверяются, как правило, два типа гипотез: 1) гипотезы о раздельном влиянии каждой из независимых переменных; 2) гипотезы о взаимодействии переменных. Факторный план заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп при этом равно числу сочетаний.

Факторный план для двух независимых переменных и двух уровней (2 х 2). Это наиболее простой из факторных планов. Его схема выглядит так.



Данный план выявляет эффект воздействия двух независимых переменных на одну зависимую. Экспериментатор сочетает возможные переменные и уровни. Иногда используются четыре независимые рандомизированные экспериментальные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Существуют более сложные версии факторного плана: 3 х 2 и 3 х 3 и т. д. Дополнение каждого уровня независимой переменной увеличивает число экспериментальных групп.

«Латинский квадрат». Является упрощением полного плана для трех независимых переменных, имеющих два и более уровней. Принцип латинского квадрата состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым значительно сокращаются количество групп и экспериментальная выборка в целом.

Например, для трех независимых переменных (L, M, N) с тремя уровнями у каждой (1, 2, 3 и N(A, В, С)) план по методу «латинского квадрата» будет выглядеть так.

В этом случае уровень третьей независимой переменной (А, В, С) встречается в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных. Применение латинских букв А, В, С для обозначения уровней третьей переменной традиционно, поэтому метод и получил название «латинский квадрат».

«Греко-латинский квадрат». Этот план применяется в случае, если необходимо исследовать влияние четырех независимых переменных. Он строится на основе латинского квадрата для трех переменных, при этом к каждой латинской группе плана присоединяется греческая буква, обозначающая уровни четвертой переменной. Схема для плана с четырьмя независимыми переменными, каждая из которых имеет три уровня, будет выглядеть так:

Для обработки данных, полученных в плане «греко-латинский квадрат», применяется метод дисперсионного анализа по Фишеру.

Главная проблема, которую позволяют решить факторные планы, – определение взаимодействия двух и более переменных. Эту задачу невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной. В факторном плане вместо попыток «очистить» экспериментальную ситуацию от дополнительных переменных (с угрозой для внешней валидности) экспериментатор приближает ее к реальности, вводя некоторые дополнительные переменные в разряд независимых. При этом анализ связей между изучаемыми признаками позволяет выявить скрытые структурные факторы, от которых зависят параметры измеряемой переменной.

4.8. Корреляционные исследования

Теория корреляционного исследования разработана английским математиком К. Пирсоном. Стратегия проведения такого исследования заключается в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследователь выдвигает гипотезу о наличии статистической связи между несколькими психическими свойствами индивида. При этом предположение о причинной зависимости не обсуждается.

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя или более) переменными. В психологии в качестве переменных могут выступать психические свойства, процессы, состояния и т. п.

Корреляционные связи. «Корреляция» в прямом переводе означает соотношение. Если изменение одной переменной сопровождается изменением другой, то говорят о корреляции этих переменных. Наличие корреляции двух переменных не является свидетельством наличия причинно-следственных зависимостей между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие корреляции позволяет опровергнуть гипотезу о причинно-следственной связи переменных.

Различают несколько типов корреляционных связей:

Прямая корреляционная связь (уровень одной переменной непосредственно соответствует уровню другой переменной);

Корреляция, обусловленная третьей переменной (уровень одной переменной соответствует уровню другой переменной в силу того, что обе эти переменные обусловлены третьей, общей переменной);

Случайная корреляция (не обусловлена никакой переменной);

Корреляция, обусловленная неоднородностью выборки (если выборка состоит двух неоднородных групп, то может быть получена корреляционная связь, не существующая в генеральной совокупности).

Корреляционные связи бывают следующих видов:

– положительная корреляция (повышение уровня одной переменной сопровождается повышением уровня другой переменной);

– отрицательная корреляция (рост уровня одной переменной сопровождается снижением уровня другой);

– нулевая корреляция (свидетельствует об отсутствии связи переменных);

– нелинейная связь (в определенных пределах повышение уровня одной переменной сопровождается повышением уровня другой, а при других параметрах – наоборот. Большинство психологических переменных имеют именно нелинейную связь).

Планирование корреляционного исследования. План корреляционного исследования является разновидностью квазиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. Корреляционное исследование разбивается на серию независимых измерений в группе испытуемых. В случае простого корреляционного исследования группа однородна. В случае сравнительного корреляционного исследования мы имеем несколько подгрупп, различающихся по одному или нескольким критериям. Результаты таких измерений дают матрицу вида Р х О. Обрабатываются данные корреляционного исследования путем вычисления корреляций по строкам или по столбцам матрицы. Корреляция по строкам дает сравнение испытуемых. Корреляция столбцов дает информацию о связи измеряемых переменных. Часто выявляются временные корреляции, т. е. изменение структуры корреляций во времени.

Ниже рассмотрены основные типы корреляционного исследования.

Сравнение двух групп. Применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного параметра. Средние результаты у двух групп сравнивают с помощью t-критерия Стьюдента. При необходимости для сравнения дисперсий показателя в двух группах также может быть использован t-критерий Фишера (см. 7.3).

Одномерное исследование одной группы в разных условиях. План этого исследования близок к экспериментальному. Но в случае корреляционного исследования мы не управляем независимой переменной, а лишь констатируем изменение поведения индивида в разных условиях.

Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Близнецовый метод основывается на следующих положениях: генотипы монозиготных близнецов сходны на 100 %, а дизиготных близнецов – на 50 %, среда развития как дизиготных, так и монозиготных пар одинакова. Дизиготные и монозиготные близнецы разбиваются на группы: в каждой – один близнец из пары. У близнецов обеих групп измеряется интересующий исследователя параметр. Затем вычисляются корреляции между параметрами -корреляция) и между близнецами -корреляция). Сравнивая внутрипарные корреляции монозиготных и дизиготных близнецов, можно выявить доли влияния среды и генотипа на развитие того или иного признака. Если корреляция монозиготных близнецов надежно выше корреляции дизиготных близнецов, то можно говорить о существующей генетической детерминации признака, в противном случае говорят о средовой детерминации.

Многомерное корреляционное исследование. Проводится для проверки гипотезы о связи нескольких переменных. Отбирается экспериментальная группа, которая тестируется по определенной программе, состоящей из нескольких тестов. Данные исследования заносятся в таблицу «сырых» данных. Затем эта таблица обрабатывается, подсчитываются коэффициенты линейных корреляций. Корреляции оцениваются на статистические различия.

Структурное корреляционное исследование. Исследователь выявляет различие в уровне корреляционных зависимостей между одними и теми же показателями, измеренными у представителей разных групп.

Лонгитюдное корреляционное исследование. Оно строится по плану временных серий с тестированием группы через заданные промежутки времени. В отличие от простого лонгитюда исследователя интересуют изменения не столько самих переменных, сколько связей между ними.

План этот применяется крайне редко. В большинстве учебников по эксперимен­тальной психологии он даже не упоминается. Кэмпбелл также утверждает, что этот план ни разу не был реализован.

Гораздо чаще, чем приведенные выше «экстравагантные» планы, применяются схемы квазиэкспериментов, которые имеют общее название «дискретные времен­ные серии». Для классификации этих планов можно выделить два основания: иссле­дование проводится 1) с участием одной группы или нескольких; 2) с одним воздей­ствием либо серией. Следует заметить, что планы, в которых реализуется серия од­нородных или разнородных воздействий с тестированием после каждого воздействия, получили в советской и российской психологической науке по традиции на­звание «формирующие эксперименты». По своей сути они, конечно, являются ква­зиэкспериментами со всеми присущими таким исследованиям нарушениями внеш­ней и внутренней валидности.

Используя такие планы, мы с самого начала должны отдавать себе отчет в том, что в них отсутствуют средства контроля внешней валидности. Невозможно про­контролировать взаимодействие предварительного тестирования и эксперименталь­ного воздействия, ликвидировать эффект систематического смешения (взаимодей­ствия состава групп и экспериментального воздействия), проконтролировать реак­цию испытуемых на эксперимент и определить эффект взаимодействия между различными экспериментальными воздействиями.

Квазиэкспериментальные планы, построенные по схеме временных серий на од­ной группе, по структуре сходны с экспериментальными планами для одного испы­туемого.

План дискретных временных серий чаще всего используется в психологии раз­вития, педагогической, социальной и клинической психологии. Суть его состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем исследова­тель воздействует на испытуемых экспериментальной группы, варьируя независи­мую переменную, и проводит серию аналогичных измерений. Сравниваются уров­ни, или тренды, зависимой переменной до и после воздействия. Схема плана выгля­дит так:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фо­новых событий, которые происходят в течение исследования. Чтобы ликвидировать эффект «истории», рекомендуют использовать экспериментальную изоляцию испы­туемых.

Модификацией этого плана является другой квазиэксперимент по схеме времен­ных серий, в котором воздействие перед замером чередуется с отсутствием воздей­ствия перед замером:

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, по­лученных в эксперименте, серии разбивают на две последовательности и сравнива­ют результаты тех замеров, где было воздействие, с результатами тех замеров, где оно отсутствовало. Для сравнения данных используется t -критерий Стьюдента с числом степеней свободы п - 2 (где п - число ситуаций одного типа).

Планы временных серий часто реализуются на практике (как я уже заметил, в советской педагогической психологии формирующий эксперимент считался чуть ли не единственным вариантом доказательного исследования). При их реализации час­то наблюдается известный «эффект Хотторна». Впервые его обнаружили Диксон и Ротлизбергер в 1939 г., когда проводили исследование на заводах Хотторна в Чика­го. Предполагалось, что изменение системы организации труда позволит повысить его производительность. В результате оказалось, как выявили опросы рабочих, что само по себе участие в эксперименте повысило их мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы конт­ролировать этот эффект (по своей сути он не отличается от плацебо-эффекта в ква­зиэкспериментах, проводимых по методу временных серий), используется конт­рольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

Квазиэксперимент позволяет контролировать действие фактора фоновых воздей­ствий (эффект «истории»). Обычно именно этот план рекомендуется исследовате­лям, проводящим эксперименты с участием естественных групп в детских садах, школах, клиниках или на производстве. Его можно назвать планом формирующего эксперимента с контрольной выборкой. Реализовать этот план весьма трудно, но в том случае, если удается провести рандомизацию групп, он превращается в план «истинного формирующего эксперимента».

Возможна комбинация этого плана и предыдущего, в котором чередуются серии с воздействием и его отсутствием на одной выборке.

5.2.3 Планыeх-post-facto

В заключение рассмотрим еще один специфический метод, который часто применяется в психологии. У него есть несколько наименований: экспери­мент, на который ссылаются, эксперимент ex-post-facto и т.д. Он часто применяет­ся в социологии, педагогике, а также в нейропсихологии и клинической психологии. В социологических исследованиях его часто использовали в 1930-40-е гг. Тогда же социолог Ф. С. Чейз ввел название этого метода и разработал схемы анализа дан­ных. В социологии и педагогике стратегия его применения состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия (по­зитивного значения независимой переменной) выступает некоторое реальное собы­тие из их жизни. Отбирается группа «испытуемых», подвергшаяся воздействию, и группа, не испытавшая его. Отбор осуществляется на основании данных об особен­ностях «испытуемых» до воздействия; в качестве сведений могут выступать личные воспоминания и автобиографии, сведения из архивов, анкетные данные, медицин­ские карты и т.д. Затем проводится тестирование зависимой переменной у предста­вителей «экспериментальной» и контрольной групп. Данные, полученные в резуль­тате тестирования групп, сопоставляются и делается вывод о влиянии «естествен­ного» воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием (лучше - рандомизацией) и тестированием после воздействия.

Эквивалентность групп достигается либо методом рандомизации, либо методом попарного уравнивания, при котором сходные индивиды относятся к разным груп­пам. Метод рандомизации дает более надежные результаты, но применим лишь то­гда, когда выборка, из которой мы формируем контрольную и основную группы, до­статочно велика.

Этот план реализуется во многих современных исследованиях. Типичным явля­ется исследование посттравматического стресса, который возникает у некоторых лиц, оказавшихся в ситуациях, выходящих за пределы обычного жизненного опыта, связанных с угрозой для здоровья человека и его жизни. Посттравматический стресс встречается у многих (но не у всех) участников войны, жертв насилия, свидетелей и жертв природных и техногенных катастроф и т.д. Изучение причин возникновения посттравматического стресса проводится по следующей схеме: выделяется выборка лиц, перенесших воздействие боевой ситуации, катастрофы и т.п., тестируется на предмет наличия посттравматического синдрома; результаты сопоставляются с ре­зультатами контрольной выборки. Наилучшей стратегией формирования основной и контрольной выборки является предварительный отбор «испытуемых» для тести­рования на основе анкетных данных и рандомизация групп. Но в реальности может проводиться диагностика только тех лиц, перенесших воздействие травматического фактора, которые сами обращаются с просьбой пройти обследование к психологам либо врачам. Таким образом, может существовать риск, что выборка добровольцев будет сильно отличаться от всей популяции перенесших травматическое воздей­ствие. В первую очередь эти отличия проявляются в повышенной частоте встречае­мости синдрома посттравматического стресса. Эффект воздействия травматическо­го фактора на популяцию будет преувеличен. И вместе с тем эксперимент ex-post-facto - единственно возможный способ проведения таких исследований (над этими проблемами работает лаборатория психологии посттравматических состояний Ин­ститута психологии РАН, руководитель - Н. В. Тарабрина).

Метод ex-post-facto часто применяется в нейропсихологии: травмы головного мозга, поражения определенных структур предоставляют уникальную возможность для выявления локализации психический функций. Травмы коры больших полуша­рий во время войны (в первую очередь второй мировой) дали, как это ни кощун­ственно звучит, богатейший материал нейропсихологам и нейрофизиологам, в том числе - отечественным (работы Лурии и его школы).

5.3. Корреляционное исследование

Читателю следует обратиться к гл. 6. В ней подробно изложена тео­рия психологических измерений. Детальная характеристика особенностей психо­логического измерения и тестирования необходима не только сама по себе, но и для того, чтобы можно было подойти к выяснению особенностей наиболее распростра­ненной схемы современного психологического эмпирического исследования - кор­реляционного.

Теория корреляционного исследования, основанная на представлениях о мерах корреляционной связи, разработана К. Пирсоном и подробно излагается в учебниках по математической статистике. Здесь рассматриваются лишь методические ас­пекты корреляционного психологического исследования.

Стратегия проведения корреляционного исследования сходна с квазиэкспери­ментом. Отличие от квазиэксперимента лишь в том, что управляемое воздействие на объект отсутствует. План корреляционного исследования несложен. Исследова­тель выдвигает гипотезу о наличии статистической связи между несколькими пси­хическими свойствами индивида или между определенными внешними уровнями и психическими состояниями. При этом предположения о причинной зависимости не обсуждаются.

Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными. В психологии в качестве переменных могут выступать психи­ческие свойства, процессы, состояния и др.

«Корреляция» в прямом переводе означает «соотношение». Если изменение од­ной переменной сопровождается изменением другой, то можно говорить о корреля­ции этих переменных. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции позволяет отвергнуть гипотезу о при­чинно-следственной связи переменных. Различают несколько интерпретаций нали­чия корреляционной связи между двумя измерениями:

1. Прямая корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой. Примером является закон Хика: скорость переработ­ки информации пропорциональна логарифму от числа альтернатив. Другой пример: корреляция высокой личностной пластичности и склонности к смене социальных установок.

2. Корреляция, обусловленная 3-й переменной. 2 переменные (а, с) связаны одна с другой через 3-ю (в), не измеренную в ходе исследования. По правилу транзитив­ности, если есть R (а, b) и R (b, с), то R (а, с). Примером подобной корреляции явля­ется установленный психологами США факт связи уровня интеллекта с уровнем доходов. Если бы такое исследование проводилось в сегодняшней России, то резуль­таты были бы иными. Очевидно, все дело в структуре общества. Скорость опозна­ния изображения при быстром (тахистоскопическом) предъявлении и словарный запас испытуемых также положительно коррелируют. Скрытой переменной, обу­словливающей эту корреляцию, является общий интеллект.

3. Случайная корреляция, не обусловленная никакой переменной.

4. Корреляция, обусловленная неоднородностью выборки. Представим себе, что выборка, которую мы будем обследовать, состоит из двух однородных групп. Напри­мер, мы хотим выяснить, связана ли принадлежность к определенному полу с уров­нем экстраверсии. Считаем, что «измерение» пола трудностей не вызывает, экстра­версию же измеряем с помощью опросника Айзенка ETI -1. У нас 2 группы: мужчи­ны-математики и женщины-журналистки. Неудивительно, если мы получим линейную зависимость между полом и уровнем экстраверсии-интроверсии: боль­шинство мужчин будут интровертами, большинство женщин - экстравертами.

Корреляционные связи различаются по своему виду. Если повышение уровня од­ной переменной сопровождается повышением уровня другой, то речь идет о поло­жительной корреляции. Чем выше личностная тревожность, тем больше риск заболеть язвой желудка. Возрастание громкости звука сопровождается ощущением по­вышения его тона. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. По данным Зайонца, число детей в семье отрицательно коррелирует с уровнем их интеллекта. Чем боязливей особь, тем меньше у нее шансов занять доминирующее положение в группе.

Нулевой называется корреляция при отсутствии связи переменных.

В психологии практически нет примеров строго линейных связей (положитель­ных или отрицательных). Большинство связей - нелинейные. Классический при­мер нелинейной зависимости - закон Йеркса-Додсона: возрастание мотивации первоначально повышает эффективность научения, а затем наступает снижение продуктивности (эффект «перемотивации»). Другим примером является связь меж­ду уровнем мотивации достижений и выбором задач различной трудности. Лица, мо­тивированные надеждой на успех, предпочитают задания среднего диапазона труд­ности - частота выборов на шкале трудности описывается колоколообразной кривой.

Математическую теорию линейных корреляций разработал Пирсон. Ее основа­ния и приложения излагаются в соответствующих учебниках и справочниках по ма­тематической статистике. Напомним, что коэффициент линейной корреляции Пир­сона г варьируется от -1 до +1. Он вычисляется путем нормирования ковариации переменных на произведение их среднеквадратических отклонений.

Значимость коэффициента корреляции зависит от принятого уровня значимости а и от величины выборки. Чем больше модуль коэффициента корреляции, тем бли­же связь переменных к линейной функциональной зависимости.

5.3.1 Планирование корреляционного исследования

План корреляционного исследования является разновидностью ква­зиэкспериментального плана при отсутствии воздействия независимой переменной на зависимые. В более строгом смысле: тестируемые группы должны быть в эквива­лентных неизменных условиях. При корреляционном исследовании все измеряемые переменные - зависимые. Фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная.

Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых Р. Различают простое и сравнительное корреляци­онные исследования. В первом случае группа испытуемых однородна. Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким определенным критериям. В общем виде план такого исследования описывается матрицей вида: Р х О (испытуемые х измерения). Результатом этого исследования является матрица корреляций. Обработку данных можно вести, срав­нивая строки исходной матрицы или столбцы. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как ко­эффициенты сходства-различия людей между собой. Разумеется, Р -корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной раз­мерности, в частности с помощью Z-преобразования:

Коррелируя между собой столбцы, мы проверяем гипотезу о статистической свя­зи измеряемых переменных. В этом случае их размерность не имеет никакого значе­ния.


Такое исследование называется структурным, так как в итоге мы получаем мат­рицу корреляции измеренных переменных, которая выявляет структуру связей меж­ду ними.

В исследовательской практике часто возникает задача выявить временные кор­реляции параметров или же обнаружить изменение структуры корреляций парамет­ров во времени. Примером таких исследований являются лонгитюды.

План лонгитюдного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Лонгитюдное исследование - это промежуточный вариант между квазиэкспериментом и корреляционным исследованием, так как время интерпретируется исследовате­лем как независимая переменная, определяющая уровень зависимых (например, личностных черт).

Полный план корреляционного исследования представляет собой параллелепи­пед Р х О х Р, грани которого обозначаются как «испытуемые», «операции», «вре­менные этапы».

Результаты исследования можно анализировать по-разному. Помимо вычисле­ния Р- и О- корреляций возникает возможность сравнения матриц Р х О , получен­ных в разные периоды времени, путем подсчета двухмерной корреляции - связи двух переменных с третьей. То же самое касается и матриц Р х Т и Т х О.

Но чаще исследователи ограничиваются обработкой другого типа, проверяя ги­потезы об изменении переменных во времени, анализируя матрицы Р х Т по отдель­ным измерениям.

Рассмотрим основные типы корреляционного исследования.

1. Сравнение двух групп. Этот план лишь условно можно отнести к корреляци­онным исследованиям. Он применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного психологического свойства или состояния. Допустим, у вас есть желание выяснить, отличаются ли мужчины и женщины по уровню экстраверсии. Для этого вы должны создать две репрезентативные выборки, уравненные по прочим значимым для экст­раверсии-интроверсии параметрам (по параметрам, влияющим на уровень экстра­версии-интроверсии), и провести измерение с помощью теста EPQ. Средние ре­зультаты у 2 групп сравниваются с помощью t -критерия Стьюдента. При необходи­мости сравниваются дисперсии показателя экстраверсии по критерию F.

Простейшее сопоставление 2 групп содержит в себе источники ряда артефактов, характерных для корреляционного исследования. Во-первых, возникает проблема рандомизации групп - они должны четко разделяться по выбранному критерию. Во-вторых, реальные измерения происходят не одновременно, а разновременно:

R" О 1 -

R" - О 2

В-третьих, хорошо, если тестирование внутри группы проводят одновременно. Если же отдельных испытуемых тестируют в разное время, то на результате может сказаться влияние временного фактора на величину переменной.

Пол без особых усилий (в том числе без хирургического воздействия) поменять сегодня нельзя, но можно перейти из одной учебной группы в другую, а также из класса в класс.

Если исследователь задался целью сравнить две учебные группы по уровню ус­певаемости, он должен позаботиться о том, чтобы не произошло их «перемешива­ния» в ходе исследования.

Эффект неодновременности измерении в двух группах (в случае предположения о значимости этого фактора) можно было бы «убрать» введением двух контрольных групп, но ведь тестировать их тоже придется в другое время. Удобнее разделить пер­воначальные группы пополам и тестирование (по возможности) провести по следу­ющему плану:

R" О 1 -

R" - О 2

__________________

R" О 3 -

R" - О 4

Обработка результатов для выявления эффекта последовательности осуществ­ляется методом двухфакторного анализа 2 х 2. Сравнение естественных (нерандо­мизированных) групп ведется по тому же плану.

2. Одномерное исследование одной группы, в разных условиях. План этого ис­следования аналогичен предыдущему. Но по своей сути он близок к эксперименту, так как условия, в которых находится группа, различаются. В случае корреляцион­ного исследования мы не управляем уровнем независимой переменной, а лишь кон­статируем изменение поведения индивида в новых условиях. Примером может слу­жить изменение уровня тревожности детей при переходе из детского сада в 1-й класс школы: группа одна и та же, а условия различные.

Главные артефакты этого плана - кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).

Схема этого плана выглядит очень просто: А О 1 В О 2 , где А и В - разные условия. Испытуемые могут отбираться из генеральной популяции случайным образом или представлять собой естественную группу.

Обработка данных сводится к оценке сходства между результатами тестирова­ния в условиях А и В. Для контроля эффекта последовательности можно произвес­ти контрбалансировку и перейти к корреляционному плану для двух групп:

А О 1 В О 2

В О 3 А О 4

В этом случае мы можем рассматривать А и В как воздействия, а план - как квазиэксперимент.

3. Корреляционное исследование попарно эквивалентных групп. Этот план ис­пользуется при исследовании близнецов методом внутрипарных корреляций. Дизи-готные или монозиготные близнецы разбиваются на две группы: в каждой - один близнец из пары. У близнецов обеих групп измеряют интересующие исследователя психические параметры. Затем вычисляется корреляция между параметрами (О -корреляция) или близнецами (Р -корреляция). Существует множество более слож­ных вариантов планов психогенетических исследований близнецов.

4. Для проверки гипотезы о статистической связи нескольких переменных, ха­рактеризующих поведение, проводится многомерное корреляционное исследова­ние. Оно реализуется по следующей программе. Отбирается группа, которая пред­ставляет собой либо генеральную совокупность, либо интересующую нас популя­цию. Отбираются тесты, проверенные на надежность и внутреннюю валидность. Затем группа тестируется по определенной программе.

R А(О 1) В(О 2) С (О 3) D(О 4) .... N(О n),

где А, В, С... N - тесты, О i - операция тестирования.

Данные исследования представлены в форме матрицы: т х п, где т - количе­ство испытуемых, п - тесты. Матрица «сырых» данных обрабатывается, подсчиты­ваются коэффициенты линейной корреляции. Получается матрица вида т х п, где п - число тестов. В клеточках матрицы - коэффициенты корреляции, по ее диаго­нали - единицы (корреляция теста с самим собой). Матрица симметрична относи­тельно этой диагонали. Корреляции оцениваются на статистические различия сле­дующим образом: сначала r переводится в Z -оценки, затем для сравнения r приме­няется t -критерий Стьюдента. Значимость корреляции оценивается при ее сопос­тавлении с табличным значением. При сравнении r эксп. и r теор. принимается гипотеза о значимом отличии корреляции от случайной при заданном значении точности (a= 0,05 или a= 0,001). В некоторых случаях возникает необходимость вычисле­ния множественных корреляций, частных корреляций, корреляционных отношений или редукции размерности - уменьшения числа параметров.

Для уменьшения числа измеренных параметров используются различные мето­ды латентного анализа. Применению их в психологическом исследовании посвяще­но множество публикаций. Главной причиной артефактов, возникающих при прове­дении многомерного психологического тестирования, является реальное физиче­ское время. При анализе данных корреляционного исследования мы отвлекаемся от неодновременности проводимых измерений. Кроме того, считается, что результат последующего измерения не зависит от предыдущего, т. е. не существует эффекта переноса.

Перечислим основные артефакты, которые возникают в ходе применения этого плана:

1. Эффект последовательности - предшествующее выполнение одного теста мо­жет повлиять на результат выполнения другого (симметричный или асимметрич­ный перенос).

2. Эффект научения - при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.

3. Эффекты фоновых воздействий и «естественного» развития приводят к неконт­ролируемой динамике состояния испытуемого в ходе исследования.

4. Взаимодействие процедуры тестирования и состава группы проявляется при ис­следовании неоднородной группы: интроверты хуже сдают экзамены, чем экст­раверты, «тревожные» хуже справляются со скоростными тестами интеллекта. Для контроля эффектов последовательности и переноса следует пользоваться тем же приемом, что и при планировании экспериментов, а именно - контрбалан­сировкой. Только вместо воздействий меняется порядок проведения тестов.

Таблица 5.14

Для 3 тестов полный план корреляционного исследования с контрбалансиров­кой выглядит следующим образом:

1-я группа: А В С

2-я группа: С А В

3-я группа: В С А

где А, В, С - различные тесты. Однако я не знаю ни одного случая, когда бы в отече­ственных корреляционных исследованиях контролировались эффекты тестирова­ния и переноса.

Приведу один пример. Нам необходимо было выявить, как влияет вид задания на успешность выполнения сменяющих одна другую задач. Мы предположили, что для испытуемых не безразлично, в какой последовательности им даются тесты. Были выбраны задания на креативность (из теста Торренса) и на общий интеллект (из теста Айзенка). Задачи давались испытуемым в случайном порядке. Оказалось, что если задание на креативность выполняется первым, то скорость и точность реше­ния задачи на интеллект снижается. Обратного эффекта не наблюдалось. Не вдава­ясь в объяснения этого явления (это сложная проблема), заметим, что здесь мы столкнулись с классическим эффектом асимметричного переноса.

5. Структурное корреляционное исследование. От предшествующих вариан­тов эта схема отличается тем, что исследователь выявляет не отсутствие или нали­чие значимых корреляций, а различие в уровне значимых корреляционных зависи­мостей между одними и теми же показателями, измеренными у представителей раз­личных групп.

Поясним этот случай примером. Допустим, нам необходимо проверить гипотезу о том, влияет ли пол родителя и пол ребенка на сходство или различие их личност­ных черт, например уровня нейротизма по Айзенку. Для этого мы должны провести исследование реальных групп - семей. Затем вычисляются коэффициенты корре­ляции уровней тревожности родителей и детей. Получаются 4 основных коэффици­ента корреляции: 1) мать-дочь; 2) мать-сын; 3) отец-дочь; 4) отец-сын, и два дополнительных: 5) сын-дочь; 6) мать-отец. Если нас интересует лишь сравне­ние сходства-различия первой группы корреляций, а не исследование ассортативности, то мы строим 4-клеточную таблицу 2 х 2 (табл. 5.14).

Корреляции подвергаются Z -преобразованию и сравниваются по t- критерию Стьюдента.

Здесь приведен простейший пример структурного корреляционного исследования. В исследовательской практике встречаются более сложные версии структурных корреляционных исследований. Чаще всего они проводятся в психологии индивидуально­сти (Б. Г. Ананьев и его школа), психологии труда и обучения (В. Д. Шадриков), пси­хофизиологии индивидуальных различий (Б. М. Теплов, В. Д. Небылицын, В. М. Ру-салов и др.), психосемантике (В. Ф. Петренко, А. Г. Шмелев и др.).

6. Лонгитюдное корреляционное исследование. Лонгитюдное исследование - вариант квазиэкспериментальных исследовательских планов. Воздействующей пе­ременной психолог, проводящий лонгитюдное исследование, считает время. Оно яв­ляется аналогом плана тестирования одной группы в разных условиях. Только усло­вия считаются константными. Результатом любого временного исследования (в том числе и лонгитюдного) является построение временного тренда измеряемых пере­менных, которые могут быть аналитически описаны теми или иными функциональ­ными зависимостями.

Лонгитюдное корреляционное исследование строится по плану временных се­рий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитюдном исследовании следует учи­тывать эффект выбывания: не всех испытуемых, первоначально принимавших учас­тие в эксперименте, удается обследовать через какое-то определенное время. Воз­можно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.

Структурное лонгитюдное исследование отличается от простого лонгитюда тем, что нас интересует не столько изменение центральной тенденции или разброса ка­кой-либо переменной, сколько изменение связей между переменными. Такого рода исследования широко распространены в психогенетике.

Валидность исследования – это характеристика достоверности его результатов. Выделяют внутреннюю и внешнюю валидность экспериментального исследования. Внутренняя валидность заключается в вопросе о том, насколько в установленном в эксперименте факте отра­жена подлинная связь “причина – следствие”. Д. Кемпбелл так определяет внутреннею валидность: действительно ли именно экспериментальное воздействие (независимая переменная) привело к изменениям в данном эксперименте (зависимая переменная).

Внешняя валидность касается того, насколько обобщаемым и экстраполируемым является установ­ленный в эксперименте факт для генеральной совокупности в целом: можно ли распространить полученные в эксперименте результа­ты на представителей генеральной совокупности, на других людей, не участвовавших в эксперименте.

Д. Кэмпбелл выделил факторы, нарушающие внутреннюю валидность психологического эксперимента. Первая группа факторов назевается факторами выборки :

1) cелекция – неэквивалентность групп по составу, вызывающая появление систематической ошибки в результатах;

2) cтатистическая регрессия – частный случай селекции, связанный с отбором групп на ос­нове “крайних” показателей измеренных переменных, например, высоко- и низкоактивные участники;

3) отсев участников – неравномерное выбывание испытуе­мых из сравниваемых групп;

4) естественное развитие участников , являющееся следствием течения времени.

Вторая группа факторов, нарушающих внутреннюю валидность психологического эксперимента, называется побочными факторами :

1) фактор фона, или “истории” – конкретные события, которые могут произойти в период проведения эксперимента и повлиять наряду с экспериментальным воздействием на поведение участников;

2) фактор тестирования – влияние процедуры измерения на результаты повторного тестирования;

3) инструментальная погрешность , ненадежность измерительного инструмента;

Факторы, нарушающие внешнюю валидность эксперимента:

1) условия проведения эксперимента как фактор, вызываю­щий неадекватную реакцию испытуемых на участие в исследовании;

2) взаимное наложение экспериментальных воздействий - остаточные “следы” более ранних экспериментальных воздей­ствий - “научение”.

Таким образом, основными характеристиками эксперимента как базового метода исследования являются выделение зависимой, независимой, внешней переменных; формирование контрольной и экспериментальной групп; контроль валидности, в частности предварительным планированием эксперимента. Элементом планирования выступает выбор конкретного исследовательского плана.

Вопросы для самопроверки

1. В чем заключаются признаки причинно-следственных связей?

2. В чем состоит отличие независимой и внешней переменных?

3. Каковы фундаментальные признаки экспериментального исследования?

4. В чем заключается процедура контроля в психологическом эксперименте?

5. Какие существуют способы контроля внешних переменных?

6. С какой целью в эксперимент вводят контрольную группу?

7. В чем состоит суть критерия репрезентативности при формировании эксперименталь­ной выборки?

8. Чем отличается внутренняя валидность экспериментального исследования от внешней?

9. Что такое рандомизация?

10. В чем заключается процедура манипулирования независимой переменной?

Тема 4. планирование эксперимента

Исследовательский план – это порядок действий экспериментатора со специально отобранными группами участников исследования.

В современной психологии выделяют четыре базовых исследовательских плана (дизайна, стратегии, схемы) проведения эмпирических психологических исследований:

1) введение какого-либо воздействия в контролируемые условия и измерение эффекта его влияния на поведение уча­стников (истинное экспериментальное исследование );

2) выбор группы, обладающей определенными свойствами, напри­мер, группы подростков с асоциальным поведением, измерение психологи­че­ских ха­рактеристик этой группы и их сравнение с аналогичными харак­тери­стиками контрольной группы, например, группы подростков с просоциальным пове­дением (сравнительное исследование );

3) наблюдение поведения людей в естественных условиях и фиксирова­ние вербальных и невербальных показателей (исследование с применением метода наблюдения );

4) выявление характера связи между двумя изучаемыми характеристиками у одной и той же группы людей (корреляционное исследование ).

Рассмотрим первый и второй исследовательские планы.

Истинные экспериментальные планы

Ранее были обозначены фундаментальные признаки экспериментального исследования (тема 3).

1. Наличие процедуры непосредственного манипулирования уровнями независимой переменной.

2. Контроль сопутствующих внешних переменных. Рандомизации участников эксперимента как частный случай контроля внешних переменных, связанных с индивидуальными особенностями испытуемых.

3. Наблюдение и фиксирование изменений зависимой переменной в контрольной и экспериментальной группах.

Наличие данных признаков характерно для истинных экспериментальных исследований , которыепозволяютс высокой вероятностью установить причинно-следственные связи между явлениями.

Истинное экспериментальное исследование строится по 4-м планам, выделенным Д. Кэмпбеллом, которые различаются способом контроля валидности. При их описании используем следующие символы:

R – процедура рандомизации участников исследования.

X – процедура экспериментального воздействия в виде манипулирования уровнями независимой переменной.

X 1 , X 2 (X с нижним индексом в виде арабской цифры) – разные уровни независимой переменной.

О – наблюдение и фиксирование изменений зависимой переменной.

O 1 , O 2 (O с нижним индексом в виде арабской цифры) – количество наблюдений зависимой переменной.

О I , O II (О с верхним индексом в виде римской цифры) – моменты времени наблюдений зависимой переменной.

Контрольная и экспериментальная группы обозначаются соответственного КГ и ЭГ.

План 1. План для двух рандомизированных групп с тестированием после воздей­ствия . (План Р.А. Фишера).

Равенство экспериментальной и контрольной групп является необ­ходимым условием применения этого плана и достигается рандомизацией. Если рандомизация проведена качественно, то этот план позволяет контролировать боль­шинство факторов, нарушающих валидность эксперимента.

После проведения рандомизации как процедуры уравнивания групп осуще­ствляется экспериментальное воздействие (Х). Если необходимо использовать не один уровень воздействия, то применяются пла­ны с несколькими экспериментальными группами (по числу уровней воздействия) и одной контрольной.

Поскольку предварительное тестирование отсут­ствует, исключен эффект тестирования. Однако при проведении большинства психологических экспериментов необходимо жестко фиксировать исходный уровень зависимой переменной, например, интеллект, тревож­ность, знания, статус личности в группе и т.п. Данный контроль возможен с помощью процедуры рандомизации. Если возникает сомнение по поводу качества ее проведения, применяют план с предварительным тестированием.

План 2. План для двух рандомизированных групп с предварительным и итоговым тестированием (план “тест-воздействие-ретест”).

ЭГ R O 1 I X O 2 II

КГ R O 3 I O 4 II

Этот план контролирует фактор “фона”, или “истории”, так как в промежутке между пер­вым и вторым тестированием обе группы подвергаются одинаковым “фоновым” воздействиям. Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффек­ты неэквивалентности групп – при помощи проце­дуры рандомизации.

Главный фактор, нарушающий внешнюю валидность этого плана, – взаимодействие тестирования с экспериментальным воздействием. Напри­мер, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет создания установки на запоми­нание.

Для контроля данного фактора, снижающего внешнюю валидность, используется план Р.Л. Соломона, предложенный им в 1949 г.

План 3. План Соломона включает исследование двух экспериментальных и двух контрольных групп.

ЭГ 1 R O 1 I X O 2 II

КГ 1 R O 3 I O 4 II

ЭГ 2 R X O 5 II

План Соломона представляет собой объединение двух ранее рассмотренных пла­нов: первого, когда не производится предварительное тестирование, и второго – “тест-воздействие-ретест”. С помощью “первой части” плана можно контроли­ровать эффект взаимодействия первого тестирования и экспериментального воздей­ствия.

Сравнение O 2 и O 4 позволяет выявить эффект экспериментально­го воздействия - влияние независимой переменной на зависимую. Сравнение O 1 и O 2 , а также O 3 и O 4 показывают эффект предварительного тестирования.

План 4. Лонгитюдный план.

ЭГ 1 R O 1 I X O 2 II

КГ 1 R O 3 I O 4 II

ЭГ 2 R O 5 I X O 6 III

КГ 2 R O 7 I O 8 III

В случае необходимости проверить сохранение во времени эф­фекта воздействия независимой переменной на зависимую, например, выяснить, приводит ли новый метод обучения к долгосрочному запоминанию материала, применяют лонгитюдныйплан.

Планы сравнительного исследования

Сравнительные исследования – это виды исследований, в которых отсутствуют или нарушаются обозначенные выше фундаментальные признаки истинного экспериментального исследования. Сравнительные исследования также называют квазиэкспериментальными. Квазиэксперимент (от лат. quasi – напоминающий, подобный) – план исследования, при котором экспериментатор отказывается от полного контроля за переменными ввиду его неосуществимости по объективным причинам.

По мнению В.Н. Дружинина, квазиэкспериментальные планыявляются попыткой учета объективной реальности жизни при проведении эмпирических исследований. Условия, в которые ставит жизнь, а также практические задачи исследователей не всегда позволяют реализовать планы “истинных экспериментов”, использовать схемы контроля внешних переменных. … Исследователь осознает те внешние перемен­ные, которые он не может контролировать. … Квазиэкспериментальный план используется тогда, когда применение истинного плана невозможно.

В качестве основных выделяют два типа квазиэкспериментальных планов: 1) планы экспериментов для неэквивалентных (неодинаковых по одному или нескольким признакам) групп; 2) планы ex-post-facto, когда исследуются участники уже происшедшего события.

План 1. План для неэквивалентных групп

В исследовании участвуют две естественные группы, например, два параллельных школьных класса. Обе группы тестируются. Затем одна группа подвергается воздействию, ста­вится в особые условия деятельности, а другая – нет. Через определенное время обе группы проходят тестирование повторно. Разница результатов первичного тестирования двух групп (О 1 и О 3) позволяет установить меру их эквивалентности в отношении измеряе­мой зависимой переменной. Результаты первого и второго тести­рования обеих групп сопоставляются. Для выявления эффекта действия независимой переменной сравнивают О 2 и О 4 . Значимость различий показателей будет свиде­тельствовать о влиянии независимой переменной на зависимую. Различие О 2 и О 4 свидетельствует о естественном развитии и фоновом воздействии.

План 2. План ex-post-facto .

В плане ex-post-factoэкспериментатор сам не воздействует на испытуемых. В качестве воздействия (независимой переменной) выступает некоторое реальное собы­тие из их жизни. Отбирается группа “испытуемых”, подвергшаяся воздействию, и группа, не испытавшая его. Отбор осуществляется на основании личных воспоминаний и автобиографий, сведений из архивов, анкетных данных, медицин­ских карт и т.д. Затем проводится тестирование зависимой переменной у предста­вителей “экспериментальной” и контрольной групп. Данные, полученные в резуль­тате тестирования групп, сопоставляются и делается вывод о влиянии “естествен­ного” воздействия на дальнейшее поведение испытуемых.

Вопросы для самопроверки

1. Каковы фундаментальные признаки истинного экспериментального исследования?

2. Какие факторы нарушения валидности позволяет контролировать план Р.А. Фишера?

3. Что такое квазиэксперимент?

4. Чем отличаются истинные эксперименты от квазиэкспериментов?

5. С какой целью в плане Соломона используют две контрольные и две экспериментальные группы?

6. Что подразумевают под лонгитюдным планом исследования?

7. Позволяют ли сравнительные исследования устанавливать причинно-следственные связи?

8. В чем состоит суть реализации плана ex-post-facto?