Репрезентативная выборка
Фактически мы начнем не с одного, а с трех вопросов: что такое выборка? когда она является репрезентативной? что она собой представляет?
Совокупность – это любая группа людей, организаций, интересующих нас событий, относительно которых мы хотим сделать выводы, а случай, или объект, – любой элемент такой совокупности1.Выборка – любая подгруппа совокупности случаев (объектов), выделенная для анализа. Если мы захотим изучить деятельность законодателей штата по принятию решений, мы могли бы исследовать такую деятельность в законодательных органах штатов Виргиния, Северная Каролина и Южная Каролина, а не во всех пятидесяти штатах и, исходя из этого, распространить полученные данные на генеральную совокупность, из которой были выбраны эти три штата. Если мы хотим исследовать систему предпочтений избирателей Пенсильвании, мы могли бы сделать это, опросив 50 рабочих компании “Ю. С. Стил” в Питсбурге, и распространить результаты опроса на всех избирателей штата. Аналогично, если мы хотим измерить умственные способности студентов колледжей, мы могли быпротестировать всех игроков защиты, зарегистрированных в штате Огайо в данном футбольном сезоне, и затем распространить полученные результаты на генеральную совокупность, частью которой они являются. В каждом примере мы действуем следующим образом: устанавливаем подгруппу внутри генеральной совокупности, довольно [c.154] подробно изучаем эту подгруппу, или выборку, и распространяем наши результаты на всю совокупность. Это и есть основные этапы формирования выборки.
Однако представляется совершенно очевидным, что каждая из этих выборок имеет существенный недостаток. К примеру, хотя законодательные органы Виргинии, Северной Каролины и Южной Каролины и являются частью совокупности законодательных органов штатов, они в силу исторических, географических и политических причин, скорее всего, будут действовать очень схожим образом и совсем иначе, чем законодательные органы таких отличающихся от них штатов, как Нью-Йорк, Небраска и Аляска. Хотя пятьдесят рабочих-сталелитейщиков в Питсбурге действительно могут быть избирателями штата Пенсильвания, они в силу социально-экономического статуса, образования и жизненного опыта, вполне возможно, будут иметь взгляды, отличные от взглядов многих других людей, точно так же являющихся избирателями. И точно так же, хотя футболисты штата Огайо и являются студентами колледжей, они в силу самых разных причин вполне могут отличаться от других студентов. Иными словами, хотя каждая из этих подгрупп действительно является выборкой, члены каждой из них систематически отличаются от большинства остальных членов совокупности, из которой они выбраны. В качестве отдельной группы ни одна из них не является типичной с точки зрения распределения признаков мнений, мотивов поведения и характеристик в генеральной совокупности, с которой она ассоциируется. Соответственно, политологи сказали бы, что ни одна из этих выборок не является репрезентативной.
Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 30% избирателей Пенсильвании принадлежат к “синим воротничкам”, около 30% репрезентативной [c.155] выборки для этих избирателей (а не 100%, как в приведенном выше примере) должны быть из числа “синих воротничков”. И если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Инымисловами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью.
Возможно, пояснить это поможет графическая иллюстрация. Предположим, мы хотим изучать модели членства в политических группах среди взрослого населения США. На рис.5.1 изображено три круга, разделенных на шесть равных секторов. Рис.5.1а представляет всю рассматриваемую совокупность. Члены совокупности расклассифицированы в соответствии с политическими группами (такими, как партии и группы интересов), к которым они относятся. В этом примере каждый взрослый принадлежит по меньшей мере к одной и не более чем к шести политическим группам; и эти шесть уровней членства в одинаковой степени распространены в совокупности (отсюда равные сектора). Предположим, мы хотим исследовать мотивы вступления людей в группу, выбор группы и модели участия, однако из-за ограниченности ресурсов мы в состоянии обследовать только одного из каждых шести членов совокупности. Кого же отобрать для анализа?
Рис. 5.1. Формирование выборки из генеральной совокупности
Одну из возможных выборок заданного объема иллюстрирует заштрихованная область на рис.5.1б, однако она явно не отражает структуру совокупности. Если бы мы делали обобщения на основе этой выборки, мы пришли бы к выводу: (1) что все взрослые американцы принадлежат к пяти политическим группам и (2) что все групповое поведение американцев совпадает с поведением тех, кто принадлежит именно к пяти группам. Однако мы знаем, что первый вывод не верен, и это может зародить в нас сомнение относительно валидности второго. Таким образом, [c.156] выборка, изображенная на рис.5.1б, нерепрезентативна, поскольку она не отражает распределение данного свойства совокупности (часто называемого параметром) в соответствии с его реальным распространением. Про такую выборку говорят, что она смещена в направлении к членам пяти групп или смещена в направлении от всех остальных моделей членства в группах. Опираясь на такую смещенную выборку, мы обычно приходим к ошибочным выводам относительно генеральной совокупности.
Ярче всего это может быть продемонстрировано на примере катастрофы, постигшей в 30-е годы журнал “Литэрари дайджест”, который организовал опрос общественного мнения относительно результатов выборов. “Литэрари дайджест” представлял собой периодическое издание, в котором перепечатывались редакционные статьи из газет и другие материалы, отражавшие общественноемнение; этот журнал был очень популярен в начале века. Начиная с 1920 г. журнал проводил широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте рассылались избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившиеся журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как притакой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. На выборах Ландон проиграл инвалиду – [c.157] Франклину Д. Рузвельту – практически с тем же результатом, с которым должен был победить. Доверие к “Литэрари дайджест” было столь сильно подорвано, что вскоре после этого журнал перестал выходить. Что же произошло? Все очень просто: в голосовании, проведенном “Дайджест”, использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, во время Великой депрессии 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, фактически выборка, использовавшаяся в опросе, организованном “Дайджест”, была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта был такой хороший результат.
Как же решить эту проблему? Возвращаясь к нашему примеру, сравним выборку на рис.5.1б с выборкой на рис.5.1в. В последнем случае для анализа также отобрана шестая часть совокупности, однако каждый из основных типов совокупности представлен в выборке в той пропорции, в которой он представлен во всей совокупности. Такая выборка демонстрирует, что один из каждых шести взрослых американцев принадлежит к одной политической группе, один из шести – к двум и т.д. Такая выборка позволит также выявить другие различия между ее членами, которые могли бы соотноситься с участием в разном числе групп. Таким образом, выборка, представленная на рис.5.1в, является репрезентативной выборкой для рассматриваемой совокупности.
Конечно, данный пример является упрощенным по крайней мере с двух чрезвычайно важных точек зрения. Во-первых, большинство совокупностей, интересующих политологов, более разнообразно, чем та, что приведена в примере. Люди, документы, правительства, организации, решения и т.п. отличаются друг от друга не по одному, а по гораздо большему числу признаков. Таким образом, репрезентативная выборка должна быть такой, чтобы каждая из основных, отличная от других область была [c.158] представлена пропорционально ее доле в совокупности. Во-вторых, ситуация, когда реальное распределение переменных, или признаков, которые мы хотим измерить, заранее неизвестно, встречается гораздо чаще, чем противоположная, – возможно, оно не измерялось в предшествующей переписи населения. Таким образом, репрезентативная выборка должна быть построена так, чтобы она могла точно отражать существующее распределение даже тогда, когда мы не в состоянии прямо оценить ее валидность. Процедура формирования выборки должна иметь внутреннюю логику, способную убедить нас, что, будь мы в состоянии сравнить выборку с переписью, она действительно оказалась бы репрезентативной.
Чтобы обеспечить возможность точного отражения сложной организации данной совокупности и определенную степень уверенности в том, что предлагаемые процедуры способны сделать это, исследователи обращаются к методам статистики. При этом они действуют по двум направлениям. Во-первых, используя определенные правила (внутреннюю логику), исследователи решают вопрос о том, какие именно конкретные объекты им изучать, что именно включать в конкретную выборку. Во-вторых, используя совсем другие правила, они решают, сколько объектов выбрать. Мы не будем подробно изучать эти многочисленные правила, рассмотрим лишь их роль в политологическом исследовании. Начнем рассмотрение со стратегий выбора объектов, образующих репрезентативную выборку. [c.159]
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания вступительная статья
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания предисловие
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- Введение
- 1. Процесс исследования
- Формулирование теории
- Операционализация теории
- Выбор адекватных методов исследования
- Наблюдение за поведением
- Анализ данных
- Интерпретация результатов
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания подготовка к исследованию
- 2. Создание теории: понятия и гипотезы в политологии
- Что такое теория?
- Логика построения теории
- Компоненты теории
- Проверка и совершенствование теории
- Роль гипотез
- Формулирование гипотез
- Заключение
- Дополнительная литература к главе 2
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 3. От абстрактного к конкретному: операционализация и измерение
- Операционализация: связь между теорией и наблюдением
- Операционные определения
- Измерение
- Уровни измерения
- Рабочая гипотеза
- Ошибка измерения
- Валидность
- Типы валидизации
- Надежность
- Заключение
- Дополнительная литература к главе 3
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 4. Работа по плану: как составить программу исследования
- Цель и программа исследования
- Учет в программе исследования альтернативных конкурирующих гипотез
- Экспериментальные программы исследования
- Программа классического эксперимента
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Формирование групп
- Полевые эксперименты и неэкспериментальные программы
- Квазиэкспериментальные программы
- Выбор программы исследования
- Факторы, угрожающие валидности
- Факторы, угрожающие внутренней валидности
- Факторы, угрожающие внешней валидности
- Дополнительная литература к главе 4
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 5. Кто, что, где, когда: проблема выборки
- Репрезентативная выборка
- Процедуры формирования репрезентативной выборки
- Установление необходимого объема выборки
- Краткие характеристики выборок разного объема
- Заключение
- Дополнительная литература к главе 5
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания методы сбора данных
- 6. Опрос
- Этапы проведения опроса
- Концептуализация
- Подготовка инструментария
- Планирование опроса и построение выборки
- Проблемы, связанные с финансированием опроса
- Обучение и инструктаж персонала
- Предварительное тестирование
- Проведение опроса
- Наблюдение за ходом опроса (мониторинг)
- Контрольная проверка
- Вторичный анализ данных опроса
- Дополнительная литература к главе 6
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 7. Интервьюирование
- Выборочное интервьюирование
- Формулирование вопросов
- Отбор интервьюеров
- Направленное интервьюирование
- Методика направленного интервьюирования
- Специализированное интервьюирование
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 8. Шкалирование
- Построение шкалы: две основные проблемы
- Шкалирование по лайкерту
- Шкалирование по гуттману
- Шкалирование по тёрстоуну
- Метод семантического дифференциала
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 9. Контент-анализ
- Подготовка к контент-анализу
- Проведение содержательного контент-анализа
- Проведение структурного контент-анализа
- Некоторые проблемы, возникающие в ходе контент-анализа
- Дополнительная литература к главе 9
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 10. Источники и применение сводных данных
- Типы сводных данных
- Проблемы, связанные с использованием сводных данных
- Источники сводных данных
- Сбор сводных данных
- Заключение
- Дополнительная литература к главе 10
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 11. Поверх границ: практика сравнительных исследований
- Выявление “кочующих” вопросов
- Поиск эквивалентной меры
- Отбор стран для изучения
- Отбор независимых наблюдений
- Отбор материала
- Заключение
- Дополнительная литература к главе 11
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания обработка данных
- 12. Подготовка и обработка данных
- Кодирование: что все эти цифры значат?
- Книга кодов и кодировальный бланк
- Макет кодировки для исследования “Информационные агентства о некоторых странах”
- Как обработать данные
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 13. Описание данных: построение таблиц, диаграмм, гистограмм
- Перечневая таблица
- Голоса белых и чернокожих избирателей, поданные за демократов в 1960 - 1976 гг., % *
- Линейная диаграмма
- Секторная диаграмма и гистограмма
- Двусторонняя гистограмма
- Расовые различия на президентских выборах 1964 г., %
- Расовые различия на президентских выборах 1972 г., %
- Некоторые предостережения
- Дополнительная литература
- Далее 14. Статистика I: анализ одномерных распределений к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 14. Статистика I: анализ одномерных распределений
- Измерение средней тенденции и дисперсии
- Частотное распределение: типы занятий респондентов
- Измерения для номинальных переменных
- Измерения для порядковых переменных
- Уровни образования по трем массивам
- Измерения для интервальных переменных
- Заключение
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 15. Статистика II: изучение взаимосвязей между двумя переменными
- Измерение связи и статистической значимости
- Измерение связи и значимости для номинальных переменных
- Определение партийности на основании партийной принадлежности отца (1)
- Определение партийности на основании партийной принадлежности отца (2)
- Определение партийности на основании партийной принадлежности отца (3)
- Значения, используемые для получения χ2
- Измерение связи и значимости для порядковых переменных
- Обобщенная таблица взаимной сопряженности признаков
- Измерение связи и значимости для интервальных переменных
- Значения, используемые для вычислений по уравнению регрессионной прямой
- Значения, используемые при определении коэффициента корреляции (r)
- Заключение
- Дополнительная литература
- Далее: 16. Статистика III: изучение взаимосвязей между несколькими переменными к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 16. Статистика III: изучение взаимосвязей между несколькими переменными
- Анализ таблиц
- Соотношение между получением образования в колледже и политическим мировоззрением
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для мужчин
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для женщин
- Множественная регрессия
- Интерпретация результатов множественной регрессии
- Решение общих проблем множественной регрессии
- Анализ временных рядов
- Заключение
- Дополнительная литература
- Далее: 17. Математическое моделирование к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 17. Математическое моделирование
- Процесс моделирования
- Зачем нужны модели?
- Примеры математических моделей политического поведения
- Другие типы моделей
- Сложности, связанные с моделированием
- Заключение
- Дополнительная литература
- Далее: 18. Некоторые обобщения к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 18. Некоторые обобщения
- Разработка гипотезы, измерения и программы исследования
- Сбор и анализ данных
- Контрольный бланк для оценки исследований
- Контрольный бланк для оценки исследования
- Заключение
- К оглавлению Примечание