Матметоды в психологии
Структура:
-Проблема – вопрос
-Цель и задачи
-Гипотеза – о взаимосвязи явлений реальности (не понятий!)
Уровни гипотез:
1. Теоретический – в терминах теории
2. Операциональный (исследовательский)- изучение в способах взаимодействия с окружающей реальности — методы и методики
На операционализации можно наколоться – она должна проводиться корректно.
3. Статистический
-Способы проверки гипотез – экспериментальный план, подтверждение и статистических гипотез
-Подтверждение операциональных гипотез с помощью статистических — описание результатов
-Интерпретация – переход от операциональных к теоретическим гипотезам
-Выводы
Явления реальности= экспериментальные переменные
Какие переменные я использую?
Генеральная совокупность – совокупность лиц и ситуаций, относительно которых мы строим гипотезу. Из нее мы выбираем репрезентативную выборку.
Статистические методы нужны, потому что перенос с выборки на генеральную совокупность – вероятностный процесс
Стратегии исследования:
-поисковая
-подтверждающая (верификационная)
Алгоритм обработки данных.
1. ПРОСТРАИВАНИЕ СВЯЗЕЙ МЕЖДУ СТРУКТУРОЙ ИССЛЕДОВАНИЯ И СТРУКТУРОЙ СТАТОБРАБОТКИ
А. Определение экспериментальных переменных — какие конкретно явления реальности мы изучаем.
Б. Какие термины используем для обозначения этих явлений
В. Определение способов взаимодействия с этими явлениями
Г. Формулировка теоретических и операциональных гипотез и определение задач исследования
Д. Выражение результатов методик в числовой форме. В проективных методиках – объектизирование признаков. Комплексные признаки, отнесение к тем или иным категориям. Классификация
2. ПОДГОТОВИТЕЛЬНАЯ СТАТИСТИЧЕСКАЯ РАБОТА С ДАННЫМИ.
А. Создание таблиц
Б. Определение шкал измерения переменных
В. Описательные статистики
Д. Проверка нормальности всех интервальных переменных
Е. Проверка гипотез
21.09.12
Нормальное распределение.
Распределение – некое расположение числовых параметров.
Есть возможность описывает некую форму распределения, как функцию.
Модель Гаусса –«колокол»
Свойства:
— нормально распределенными являются те явления природы, на которые влияют множество случайных факторов.
— простое в математическом отношении (среднее арифметическое и мода совпадает)
— описание кривой – с помощью двух параметров: среднее и стандартное отклонение
— в нормальном распределении возможен переход от параметров к количеству наблюдений (и обратно). В диапазон «среднее плюс-минус стандартное отклонение» попадает 68 % испытуемых.
Плюс-минус две сигмы – 96%. Плюс-минус три сигмы – 99%. На этом строятся нормы в психодиагностике.
Большинство тестовых методик построены так, чтобы на выходе получить нормальное распределение. Это не свойство реальности, а именно свойство методики.
Проверка нормальности распределения.
1. Графический.
— непрерывность
— одномодальность (одна вершина) . Полимодальные распределения в некоторых случаях могут считаться как два нормальных распределения.
-симметрия ( относительно среднего). Skewness – коэффициент симметрии (абсолютная симметрия – 0). Относительно симметричное –до +/- 0,25
— эксцесс (Kurtosis) – соотношение ширины к высоте (у нормальное распределения э. равен 0)
2. Статистический
— Критерий Шапира-Уилка (выборка от 15 до 70)
-Критерий Колмогорова –Смирнова с поправкой Лиллифорса (выборка больше 70)
Если при проверки значимость P меньше 0,05 – распределение не является нормальным
Проверка гипотез.
Сначала – переменные, выдвижение гипотез.
Гипотезы (обычно в дипломах) сформулированы в терминах связи между чем-то и чем-то.
Каждое явление должно быть представлено неким набором параметров. В каких шкалах измерены переменные А и B?
В/ А |
Номинальная |
Ранговая |
Интеравльная |
Номинальная |
Пыщ-пыщ |
Сравнение средних |
|
Ранговая |
Анализ различия между группами – сравнение средних |
Корреляция Спирмена |
Корреляция Спирмена |
Интервальная |
Корреляция Спирмена |
Корреляция Пирсона |
Если шкала номинальная, мы не можем использовать корреляцию.
ПРовена нормальность в SPSS
Descriptives statistics – Explore – Поставить галочку в Normal (описательные статистики – исследовать)
Анализ корреляций.
Только числовые переменные.
Облако точек может иметь выраженный тренд – который демонстрируется с помощью регрессионной прямой.
Коэффициент корреляции –числовой аналог линейной регрессии, угол наклона прямой.
Корреляций – анализ совместного возрастания/убывания переменных.
С помощью корреляции можно выявлять только линейные зависимости.
Регрессионная прямая строится на основе наименьшего квадрата расстояний от точек до прямой.
Работая с корреляциями, надо убедиться, что у нас нет выброса (отдельно стоящих точек в графике), которые утягивает прямую.
Бывает группировка данных: два облака точек. Вероятно, есть еще какой-то третий фактор, который не измерен и который заставляет данные делиться на две группы.
Прежде, чем строить график, нужно построить диаграмму рассеивания.
Коэффициент корреляции – мера связи двух числовых переменных.
не проверяет гипотезу о связи – лишь показывает, насколько.
Коэффициент корреляции можно и нужно использовать, когда нужно проверить соотношение двух числовых рядов (например, ценности мужа и жены).
Подтверждение/опровержение гипотезы о связях.
Посчитав корреляцию, надо посмотреть на уровень значимости, который показывает вероятность, что на генеральной совокупности корреляция не будет равно 0. Если вероятность меньше 5 процентов, можно принять гипотезу о связи.
Проверка на уровне значимости 0,07 – если там что-то обнаружилось, то можно говорить о «тенденции, не достигающий статистической значимости»
Объем выборки решает.
Порядок работы с корреляциями.
0. Удостовериться, что именно корреляции должны использоваться
1. Посмотреть диаграмму рассеивания (графики – scatter plot — simple)
2. Щелкнуть график — fit line, прямая подгонка — линейная регрессия. Получаем квадрат регрессии, из которого берем корень и получаем КК
· Dаtes – select cases ( отборы наблюдений) — if condition is satisfight — if — задаем параметр (например группа 1)
В последней графе в таблице – фильтр, можно выкидывать данные.
3. Annalyze – Correlate – Bivariate. Смотрим табличку.
Формулировка вывода.
Корреляция не показывает направление связи.
Причинно-следственная связь:
Временное следование
Числовая зависимость
Не должно быть третьего фактора C
ДЗ
Первый отчет
Кусок из курсовой — на примере двух-трех переменных описательные статистики и посчитать связи между переменными
Формат:
-вордовский документ
Под корреляцию – задачу, гипотезу, обоснование выбора метода, графики, принятие решение о выбросах.
vlmokhov@gmail. com
stat в теме письма
19.10.12
Анализ различий между двумя выборками – одна переменная числовая, другая — номинальня
Выбор метода:
1. Модель (характер зависит перменной)
-Параметрическая модель:
*интервальная шкала измерения
*нормальное распределение
-Непараметрическая модель:
*Ранговая шкала измерения
Параметрическая модель
(интервальная шкала, N распределение)
T-критерий Т-критерий
Независимые выбрки Зависимые выборки
1. Критерий знаков
2. Критерий Вилкоксона 1. Критерий Манна-Уитни
2. Критерий Колмогорова — Смирнова
Непараметрическая модель
Зависимые выборки:
Существуют пары значений, принадлежащих одному испытуемому (пример, повтороные измерения)
Независимые выборки:
Пар значений не существует (различия между мужчинами и женщинами)
Т-критерий. Реальные условия применений
-Интервальная шкала измерения зависимых перменных
-Распределение зависимых переменных не сильно отличается от нормального (графическая оценка нормальности)
— Объем выборок относительно велик (больше 15)
— Большие выборки – вне зависимости от формы распределения
Табличка результатов
второй столбик – значимость различий дисперсий (тест Левена)
если больше пяти сотых – не различаются (смотрим первый уровень значимости) , если меньше – различаются, надо смотреть второй уровень значимости
Гипотеза о различии.
Если модели непараметрические, мы, в первую очередь, берем Критерии Вилкоксона и Манна-Уитни. Результаты их мы интерпретируем, как сравнение средних, но внутренняя логика у них другая.
Критерий знаков и Критерий Колмогорова –Смирнова.
Критерий Вилкоксона – оценка измерений (например, от первого ко второму измерению). Критерий знаков – оценивает сам факт изменения (было или не было)