Stacks Image p13159_n13115
Вышла книга автора сайта!
Теоретическая валидизация в социологическом исследовании: Методология и методы
Проверка статистических гипотез.

В процессе проверки статистических гипотез исследователь на основании полученных данных проверяет гипотезу, согласно которой все выявленные взаимосвязи между явлениями или различия между группами являются результатом случайных ошибок.
Проверка статистических гипотез состоит из следующих этапов: 1) Проверка допущений. 2) Формулировка статистических гипотез. 3) Определение уровня альфа (p-значения). 4) Расчет эмпирического значения критерия и количества степеней свободы. 5) Использование теоретического распределения: определение критического значения и его сопоставление с эмпирическим значением. Рассмотрим основы проверки статистических гипотез на примере критерия независимости хи-квадрат. Этот критерий позволяет на основании данных таблицы сопряженности проверить есть ли взаимосвязь между двумя переменными. Он является непараметрическим, т.е. таким критерием, который не требует проверки допущений о форме распределения выборочных статистик.
Этап 1. Для использования критерия хи-квадрат, данные должны удовлетворять всего двум допущениям: а) Используются независимые случайные выборки. Независимые выборки имеют место в том случае, когда отбор респондентов в одну выборку никак не влияет на отбор респондентов в другую.
Во-первых, эти данные должны быть получены от студентов, отобранных случайным образом (например, с помощью случайного отбора из общего списка студентов того или иного вуза). В таком случае, выборки будут также и независимыми - не важно, кто был отобран последним, далее может быть отобран любой парень или девушка, еще не попавшие в выборку.
б) Переменные относятся к номинальной шкалы. А поскольку номинальные шкалы являются наиболее "слабыми", использование порядковых и метрических переменных также возможно (после того, как количество их категорий будет уменьшино до необходимого количества).
Для примера обратимся к представленной ниже таблице, с помощью которой проверяется влияние пола студентов на успешность их обучения:
Успешность
Пол
Вместе
Женский
Мужской
Были тройки
16
12
28
Четыре-пять
20
4
24
На отлично
10
0
10
Вместе
46
16
62
Зеленым цветом обозначены маргинальные частоты по строкам и столбцам. Они понадобятся в дальнейшем для расчета ожидаемых частот.
Этап 2. Статистические гипотезы делятся на два вида - нулевую и альтернативную. В зависимости от статистического метода, нулевая гипотеза утверждает либо отсутствие различий между группами (при сравнении средних значений или пропорций), либо отстуствие связи между переменными. В свою очередь, альтернативная гипотеза утверждает обратное нулевой - наличие различий или наличие связи. Все эти утверждения имеют отношение именно к генеральной совокупности, так как выявленные в выборке связи между переменными или различия между группами могут быть вызваны случайными ошибками и не иметь отношения к генеральной совокупности. В нашем случае нулевая гипотеза будет утверждать отсутствие связи между полом студентов и их успешностью, альтернативная - наличие таковой.
Этап 3. Обычно величина альфа должна быть 0,05 или менее. Тогда наш вывод, основанный на примененении статистического критерия, будет верным с вероятностью 95% или выше.
Этап 4. Эмпирическое значение статистического критерия - это специальное значение, вычисленное на основании имеющихся данных с использованием того или иного теоретического распределения. Эмпирическое значение позволяет оценить вероятность того, что выборочные данные были получены в результате случайных ошибок. Для подавляющего большинства методов проверки статистических гипотез большие эмпирические значения с большей вероятностью указывают именно на существование связей или различий (т.е. на слабое влияние случайных ошибок выборки).
В случае хи-квадрат, прежде чем перейти к расчету эмпирического значения, необходимо рассчитать ожидаемые частоты (fe) в ячейках, характерные для ситуации полного отстуствия связи между переменными, а потом сравнить их с имеющимися частотами (fo). Для этого по каждой ячейке необходимо умножить маргинальную частоту по столбцу на маргинальную частосту по строке и разделить на общее количество наблюдений:
Stacks Image 651
где MFR - маргинальная частота по строке, MFC - маргинальная частота по столбцу, N - общее количество наблюдений.
Для нашего примера расчет ожидаемых частот будет иметь следующий вид:
Stacks Image 662
Соответственно таблица с теоретическим распределением, для которого характерно полное отсутствие связи между переменными будет выглядеть так:
Успешность
Пол
Вместе
Женский
Мужской
Были тройки
20,8
7,2
28
Четыре-пять
17,8
6,2
24
На отлично
7,4
2,6
10
Вместе
46
16
62
Если различия между этими частотами и частотами, полученными в процессе исследования, достаточно велики, будет принята альтернативная гипотеза, если же нет - нулевая.
Определение величины различий осуществляется с помощью специального показателя, который и является эмпирическим (или же экспериментальным) значением критерия:
Stacks Image 1329
Для нашего случая эмпирическое значение критерия будет равно:
Stacks Image 1335
Кроме эмпирического значения большинство методов проверки статистических гипотез предполагает расчет количества степеней свободы (df), которое используется при определении критического значения, то есть той величины, с которой необходимо сравнить эмпирическое значение. Именно такое сравнение позволяет оценить достаточно ли велико эмпирическое значение (оно должно превышать критическое) для того, чтобы отказаться от нулевой гипотезы и принять альтернативную. Для хи-квадрат df = (r-1)(c-1), где r - количество строк в таблице, а c - количество столбцов. Соответственно, в нашем случае df = (3-1)(2-1) = 2.
Этап 5. Все методы проверки статистических гипотез предполагают использование тех или иных распределений выборочных статистик, позволяющих определять критическое значение в каждом конкретном исследовании. Критическое значение, как и эмпирическое, является специальной величиной, которая задает некоторую границу, превышение которой говорит о том, что имеющиеся результаты с очень низкой вероятностью (эта вероятность равна величине альфа) могли быть получены вследствие случайных ошибок.
Распределение хи-квадрат, используемое для анализа таблиц сопряженности, меняет свой вид в зависимости от количества степеней свободы. Соответственно меняется и распределение критических значений (на рисунке df обозначается как k):
Stacks Image 13675
Само критическое значение в каждом конкретном случае определяются с помощью таблиц критических значений. В случае хи-квадрат такая таблица имеет два параметра - количество степеней свободы и уровень альфа.
После определения критического значения, его необходимо сравнить с эмпирическим - если критическое значение больше, принимается нулевая гипотеза (т.к. вероятность получения результата вследствие случайных ошибок слишком велика), если же эмпирическое значение больше, принимается альтернативная гипотеза.
Для нашего примера, альфа равное 0,05 и df равное 2, дают критическое значение равное 5,99. С учетом того, что эмпирическое значение больше критического (8,9 > 5,99), можно принять альтернативную гипотезу. При этом вероятность ошибочности такого решения составляет 5%.
Всегда важно помнить, что делая статистический вывод исследователь рискует сделать ошибку вне зависимости от того какую гипотезу он принял - нулевую или альтернативную. Такие ошибки называются статистическими и делятся на две группы - первого и второго рода. При ошибках первого рода на основании данных выборки принимается альтернативная гипотеза, в то время как для генеральной совокупности верна нулевая. Соответственно, при ошибке второго рода на основании данных выборки принимается нулевая гипотеза, в то время как для генеральной совокупности верна альтернативная.
free counters
Яндекс.Метрика