logo
Первоисточники / Мангейм Д

Измерение связи и статистической значимости

В том случае, если знание значений одной переменной по определенному случаю позволяет сделать некоторые предположения относительно соответствующих значений другой переменной, между этими переменными существует связь 1. Если, например, мы исследуем взаимосвязь между численностью населения какой-либо страны и долей взрослых, получивших высшее образование (принимая во внимание, что мы располагаем такими данными), то возможны три вывода: (1) более крупные страны [c.408] обычно имеют большую долю взрослых, получивших высшее образование, чем менее крупные; (2) малые страны обычно имеют большую долю взрослых, получивших высшее образование, чем более крупные, и (3) систематических различий нет; некоторые страны из обеих групп имеют относительно высокую долю таких людей, а другие – тоже из обеих групп – относительно низкую. Если исследование покажет, что верен случай 1 или случай 2, то мы можем использовать знание значений независимой переменной – количество населения, – для того чтобы примерно представить или предсказать значения зависимой переменной – доля взрослых, получивших высшее образование – для любой из взятых стран. В первом случае для густонаселенных стран можно предсказать и относительно высокую долю взрослых с высшим образованием, а для малонаселенных стран – более низкую их долю. Во втором случае наши предположения будут прямо противоположны. В обоих случаях, хотя мы можем и не угадать каждый случай точно, мы будем чаще всего правы, поскольку между этими переменными существует связь. И конечно, чем теснее связь между двумя переменными, тем более вероятно, что наши догадки в каждом отдельном случае будут верны. Если существует полная зависимость значений одной переменной от значений другой, т. е. высокие значения одной переменной вызывают высокие значения другой или, наоборот, высокие значения одной вызывают низкие значения другой, мы можем вывести одну из другой с довольно большой степенью точности. Все это в корне отличается от третьего случая, который не позволяет с достаточной долей точности предугадать значения переменной образование, основываясь на знании количества населения. Если признаки по двум переменным распределяются, по сути дела, произвольно, то считается, что эти переменные не имеют связи.

Чтобы понять, как же выглядит эта самая “сильная связь”, рассмотрим две схематические карты, изображенные на рис. 15.5. (см. с. 434-435), которые представляют уровень убийств в Вашингтоне в 1988 г. На схеме 15.5а указаны известные рынки, производящие торговлю наркотиками в столице. На схеме 15.5б показаны места, где происходили убийства. Обе схемы отражают данные, полученные в городской полиции. Легко заметить, что [c.409] сосредоточение точек, обозначающих места продажи наркотиков и убийств, практически одинаково, и таким образом выявляется связь между двумя этими феноменами.

Понятно, что между переменными может существовать более или менее сильная связь. Естественно, возникает вопрос, насколько сильна эта связь. На помощь приходит статистика. Из статистики возьмем показатель, который называется коэффициентом связи. Коэффициент связи – это показатель, который обозначает степень возможности определения значений одной переменной для любого случая, базируясь на значении другой. В нашем примере этот коэффициент может показать, насколько знание количества населения страны поможет в определении доли взрослых, получивших высшее образование. Чем больше коэффициент, тем сильнее связь и, следовательно, выше наши возможности прогноза. Вообще коэффициент колеблется в переделах от 0 до 1 или от –1 до 1, где значения, близкие к единице, обозначают относительно сильную связь, а значения, близкие к 0, – относительно слабую. Как было в случае с одномерной статистикой – и по тем же причинам, – каждый уровень измерения требует своего типа исчислений, и поэтому каждый из них требует своего способа измерения связи.

В дополнение к величине связи полезно также знать направление или форму взаимоотношений между двумя переменными. Еще раз обратите внимание на вышеприведенный пример, особенно на варианты 1 и 2. Мы уже предположили, что, чем теснее связаны признаки, тем больше будет коэффициент связи и тем выше шансы угадать долю взрослых с высшим образованием на основании знаний о количестве населения в данной стране. Очевидно, однако, что наши прогнозы относительно каждого случая будут совершенно противоположны. В первом случае большие значения одной переменной вероятнее всего связаны с большими значениями другой, тогда как во втором случае большие значения одной переменной вероятнее всего связаны с меньшими значениями другой. Такие связи называются связями, имеющими разное направление. А такой тип связей, как в первом случае, когда обе переменные возрастают и убывают одновременно, называется прямой, или положительной, связью. Тип связей второго случая, когда значения постоянно изменяются в [c.410] разных направлениях, называется обратной, или отрицательной, связью. Эта добавочная информация – о знаке (плюс или минус) перед коэффициентом связи – способна сделать наши предположения более эффективными. Таким образом, коэффициент, равный –0,87 (отрицательный и близкий к единице), может описывать относительно сильную взаимосвязь, в которой значения двух данных переменных обратно связаны (изменяются в разных направлениях), коэффициент же, равный 0,10 (положительный – знак “плюс” обычно опускают – и близкий скорее к 0), может описывать слабую прямую связь.

Для всех случаев понятие направления или формы имеет разный смысл для разных уровней измерения. На номинальном уровне, где цифры играют роль просто обозначений, концепция направления вообще не имеет смысла и, соответственно, номинальные коэффициенты связи не изменяют знака. Все они положительны и просто показывают силу связи. На интервальном же уровне, наоборот, знаки могут не только изменяться, но и иметь достаточно сложную геометрическую интерпретацию. Проверка на связь на этом уровне измерений обладает очень высокими прогностическими способностями, причем знак коэффициента является в этом случае ключевым элементом.

Наконец, несколько слов о проверке статистической значимости, хотя обсуждение этого сюжета будет сознательно ограничено2. Если мы делаем предположительно репрезентативную выборку некоторого определенного размера и используем эту выборку для формулирования каких-то выводов о той генеральной совокупности, из которой она была сделана, мы несколько рискуем получить неверные выводы. Это так, потому что существует вероятность, что выборка, по сути дела, нерепрезентативна и что в действительности ошибка измерений превышает уровень, допустимый для выборки данного размера (см. табл. А.2 и А.3 в приложении А). Вероятность подобных неверных обобщений в принципе известна, однако в каждом отдельном случае мы не всегда можем сказать, имеются они или нет. Для доверительного уровня 0,95 вероятность этого составит 0,05 или 1 – 0,95, для доверительного уровня 0,99 – 0,01. Эти величины 0,05 и 0,01 или 5% и 1% свидетельствуют о том, что любое обобщение, [c.411] сделанное по выборке и относящееся к генеральной совокупности, даже подпадающее под подсчитанный уровень ошибки выборки, просто-напросто неверно.

Проверки на статистическую значимость играют ту же роль для оценки измерений связи. Они определяют, насколько вероятна связь, зафиксированная между двумя признаками в выборке. Давайте попробуем пояснить этот пункт.

Продолжая наш пример, представьте, что у нас есть совокупность из 200 стран, для которых доподлинно известно, что коэффициент связи между количеством населения и долей взрослых, получивших высшее образование, равен 0, т. е. в реальности такой связи нет. Представьте далее, что в силу тех или иных причин мы считаем необходимым взять выборку только в 30 стран и подсчитать для них связь между этими двумя переменными. Он также может оказаться равным 0,но в действительности это маловероятно, поскольку сила связи теперь зависит не от всех 200 стран, а только от 30 и, возможно, будет отражать их характерные особенности. Другими словами, величина коэффициента предопределена тем, какие именно 30 стран мы выберем. Если случайно мы выберем те 30 стран, которые действительно репрезентативны относительно всех 200, связь не обнаружится. Но тот же случай может привести нас к тому, что мы выберем такие 30 стран, для которых связь между количеством населения и уровнем образования необычайно высока, скажем 0,60. В этом случае наш подсчитанный со всей тщательностью коэффициент будет характеризовать данную выборку, но, если мы распространим эту характеристику на генеральную совокупность, наши выводы будут неверны. Зная это, конечно, необходимо отвергнуть измерение связи на основании именно этой выборки.

Проблема заключается в том, что в действительности мы не знаем глубинные параметры совокупности, например истинную степень связи признаков в ней. Безусловно, причина, по которой мы вынуждены прибегать к выборкам, прежде всего в том, что мы просто не в состоянии изучать совокупности в целом. А отсюда в свою очередь следует, что чаще всего мы будем иметь в распоряжении только те проверки связей, которые основаны на выборках. Более того, эти подсчеты будут основаны только на одной выборке. Тогда встает вопрос, насколько можно [c.412] быть уверенным в том, что проверка связей, основанная на единственной подгруппе генеральной совокупности, точно отражает глубинные характеристики этой совокупности. Задача проверки на статистическую значимость и заключается в том, чтобы дать цифровое выражение этой уверенности, измерить возможность или вероятность того, что мы делаем верные, или, наоборот, неверные обобщения.

Для того чтобы увидеть, как все это работает, давайте продолжим наш пример. Представьте, что мы сделали не одну выборку в 30 стран из всей совокупности в 200 стран, а 100 или даже 1000 отдельных и независимых выборок равного размера и что для каждой подсчитан коэффициент связи.Поскольку верный для всей совокупности коэффициент, по сути, равен 0, большинство коэффициентов в наших 100 или 1000 выборках тоже будут равны 0 или близки к этому. Они ведь, кроме всего прочего, основаны на измерении характеристик одних и тех же стран в конце концов. Некоторые комбинации из 30 стран могут показать относительно высокие значения (это если нам случайно удастся выбрать те страны, где эти переменные связаны по типу высоких или низких связей), но большинство будет близким к параметрам всей совокупности. Безусловно, чем ближе к истинному значению коэффициента, тем большее количество выборок будет его иметь. Эти распределения, по сути дела, будут всегда располагаться по нормальной кривой, которую мы упомянули ранее. Это показано на рис. 15.1, где высота кривой в любой точке представляет количество выборок, для которых коэффициент связи имеет значение, отмеченное на оси ординат.

Рис. 15.1. Кривая нормального распределения для коэффициента для выборки из 30 случаев.

Какова же тогда вероятность того, что любое значение коэффициента – это просто случайное отклонение от истинного нулевого параметра? Или, другими словами, если мы возьмем выборку из какой-нибудь совокупности и выявим в этой выборке устойчивую связь, но при. этом нам не будут с определенностью известны соответствующие характеристики всей совокупности, каковы шансы того, что мы ошибемся, перенося такую сильную связь с выборки на всю совокупность? Нормальная кривая имеет некоторые особенности,которые мы не будем здесь обсуждать, не позволяющие нам ответить на этот вопрос с достаточной точностью. [c.413]

Представьте, к примеру, что мы сделали из генеральной совокупности в 200 стран выборку в 30 стран, для которых коэффициент связи равен –0,75, а глубинных параметров мы не знаем. Насколько вероятно, что соответствующий коэффициент для всей совокупности будет равен 0? Исходя из рис. 15.1, ответ должен звучать: не очень. Часть плоскости, заключенная под графиком, представляет все 100 или 1000 (собственно, любое количество) коэффициентов, при этом истинный коэффициент равен 0. Меньшая ее часть – левее значения –0,75 – представляет долю таких коэффициентов, которые отрицательны по направлению и более или равны 0,75 по значению. Эти случаи составляют очень маленькую часть от всех коэффициентов выборок. По этой причине шансы того, что при любой попытке сформировать выборку мы сделаем именно такую выборку, очень малы. Если в этой области лежит, например, 5% всех выборок, то только один раз из 20 может случиться так, что из всей совокупности с истинным коэффициентом, равным 0, мы сделаем выборку с коэффициентом –0,75. Тем не менее в данном случае мы имеем именно такую выборку. Другими словами, мы сделали выборку с такими характеристиками, которые имеют 5%-ную вероятность быть ошибочным отражением совокупности, где две рассматриваемые переменные не связаны друг с другом. Таким образом, если на основании этой выборки мы сделали вывод, что на самом деле эти две [c.414] переменные связаны друг с другом в генеральной совокупности (т.е. если мы интерполировали результаты, полученные на основании выборки), то следует ожидать, что на 5% мы не правы. Конечно, это же значит, что на 95% мы правы, а это неплохие шансы. И конечно, уровни статистической значимости в 0,05 (5%-ная вероятность ошибок), 0,01 (1%-ная вероятность ошибок) и 0,001 (0,1 от 1%-ной вероятности ошибок) – это общепринятые стандарты в политологических исследованиях.

Если мы опять взглянем на рис. 15.1, станет ясно, что более экстремальные значения, такие, как –0,75, реже способны дать заметную ошибку при обобщениях, чем те, которые расположены ближе к центру (например, гораздо большая доля выборок из этой группы покажет коэффициенты, равные и превышающие –0,50 и т. д.). В конце концов может показаться, что никогда нельзя быть уверенным в правильности утверждения о наличии слабых связей, поскольку никогда нельзя устранить достаточно большую вероятность того, что они просто случайно появились в совокупности с истинным нулевым коэффициентом. Однако вполне возможно решить эту проблему простым увеличением размеров выборки. Если вместо 30 признаков мы включим в выборку 100 или 150, мы не только будем располагать меньшим количеством выборок для начала расчетов, но и при наличии истинного коэффициента они вероятнеевсего будут располагаться вокруг нулевого значения. По сути дела, нормальная кривая будет постоянно стремиться к сжатию в середине, как изображено на рис. 15.2, пока не придет в конце концов к единственно возможному варианту – истинному параметру. [c.415]

Рис. 15.2. Распределение выборки разного размера при генеральной совокупности, равной 200 случаям

По ходу дела все меньше и меньше предельных значений будут располагаться по краям кривой, пока наконец при достаточно больших выборках даже коэффициенты связи со значением 0,10 или 0,01 не покажут приемлемый уровень статистической значимости. Теперь мы можем сделать вывод, что определенные сочетания достаточно экстремальных значений и достаточно больших выборок позволяют нам уменьшить до допустимого уровня вероятность неверных обобщений по нашим данным.

Однако не всегда коэффициенты связи распределяются нормально и не все проверки статистической значимости производятся по такой же логической схеме. Но в большинстве случаев принцип тот же, и если вы поняли его, то вы поймете как необходимость, так и пользу измерения статистической значимости.

В этой главе мы также кратко обсудим наиболее распространенные способы измерения связи и значимости для каждого из трех уровней измерений. При этом если процедуры, необходимые для подсчета каждого из трех измерений будут различными, то цель в каждом случае, так же как и интерпретация результатов, окажется примерно одинаковой, поскольку любой вид коэффициента связи призван показать нам, до какой степени наши предположения относительно значений одной переменной могут определяться знанием значений (имеется в виду по тем же случаям) другой, а каждая проверка значимости говорит о том, насколько вероятно (возможно), что любые наблюдающиеся в выборке связи возникают вследствие выборочных процедур, а не являются отражением истинного положения дел в генеральной совокупности. Нигде эти двойные функции не становятся более очевидными, как в статистических измерениях базового типа– номинальных.

Примеры, иллюстрирующие эту статистику, подразумевают сравнение переменных, которые используются на одном уровне измерения. Однако исследователи часто хотят найти соотношения между переменными, находящимися на разных уровнях измерения (таких, как одноуровневая независимая переменная, например, социоэкономический статус и зависимая номинальная переменная – партийная принадлежность). Чтобы выбрать правильную статистику для этого случая, вам необходимо придерживаться простого правила: использовать статистику, разработанную для низшего уровня измерений, не игнорируя [c.416] при этом данные для измерений высококачественного уровня. Вполне законно вы можете применять статистику для номинальных признаков с одноуровневыми данными, но совершенно невозможно использовать одноуровневую статистику для номинальных измерений. Это означает, что, когда вы проводите сравнение переменных, которые измеряются на разных уровнях, вы должны так выбирать статистический критерий, чтобы он соответствовал нижнему из двух уровней. [c.417]