Краткие характеристики выборок разного объема
Допустимый процент ошибки выборки | Степень уверенности | + |
0,95 | 0,99* | |
± 1 | 10 000 | 22 500 |
± 2 | 2 500 | 5 625 |
± 3 | 1 111 | 2 500 |
± 4 | 625 | 1 406 |
± 5 | 400 | 900 |
± 10 | 100 | – |
* Для большей наглядности имеющееся в исходной таблице значение 0,997 округлено до 0,99.
Возможно использовать эти три таблицы каждым из двух методов.
Мы, возможно, захотим задать определенный уровень ошибки выборки, который мы согласны допустить, и степень уверенности, с которой будем действовать. Предположим, что взяты, соответственно, числа ±4% и 0,99. Первое число означает, что любое измерение, которое мы могли бы произвести в нашей выборке, отклоняется не более чем на четыре процента вверх или вниз от истинного значения того же признака в более обширной совокупности. Если, например, мы устанавливаем, что в проводимом исследовании 43% респондентов сообщают о своей солидарности с демократической партией, мы будем считать, что в случае полной переписи населения реальное количество приверженцев демократической партии будет составлять 43% ± 4% или находиться в пределах приблизительно от 39 до 47%. В соответствии с таблицей (если посмотреть на пересечение строки ± 4% и столбца 0,99) для достижения данной степени точности с уверенностью 99% мы должны иметь выборку, состоящую по крайней мере из 1406 объектов. Если мы хотим уменьшить величину ошибки (повысить точность) до, скажем, ± 2% [c.178] (т.е. оценить количество демократов более точно, в пределах от 41 до 45%), мы должны увеличить объем выборки по крайней мере до 5625 объектов. Из таблицы отчетливо видно, что при любой степени уверенности повышение точности требует увеличения выборки.
Второе число, о котом мы говорили, обозначает вероятность того, что наша выборка действительно репрезентативна для более обширной совокупности в рамках заданной степени точности. В данном контексте 0,95 (95% уверенности) означает, что из 100 выборок данного объема, полученных из одной и той же совокупности, 95выдержат тест на точность, а 0,99 (99% уверенности) означает, что 99 из 100 выборок данного объема, полученных из одной и той же совокупности, будут точны настолько, насколько это было предсказано. Таким образом, вероятность того, что любая конкретная выборка будет давать желаемую точность, равна, соответственно, 95:5 (т.е. 19:1) и 99:1.
Как и следовало ожидать, для каждого уровня ошибки выборки необходимый объем выборки значительно больше в том случае, когда мы хотим достичь 99, а не 95% уверенности. Так, в нашем примере с демократами видно, что при величине ошибки 4% выборка объемом 625 объектов позволяет с 95%-ной уверенностью утверждать, что доля демократов среди населения находится где-то между 39 и 47%, тогда как то же самое утверждение с 99%-ной уверенностью требует выборки объемом по меньшей мере 1406 объектов. Вообще говоря, чем ниже ошибка выборки и чем выше степень уверенности, тем лучше будет то исследование, которое мы проводим. Для политологического исследования степень уверенности 0,95 или 0,99 принято считать вполне приемлемой.
Таблицу такого вида можно использовать иначе. Если, к примеру, мы анализируем исследование, в котором используется выборка, состоящая из 2500 объектов, то тогда можно обратиться к таблице и установить ошибку выборки и степень уверенности. Посмотрев в табл.5.1, видим, что интерпретация может быть неоднозначной. Мы можем считать, что 2500 объектов дают ошибку выборки ± 3% с уверенностью 0,99 или ошибка выборки ±2% с уверенностью 0,95. Каждая из этих интерпретаций в равной степени приемлема, а вместе они помогают прояснить взаимоотношения между точностью и [c.179] уверенностью. При одном и том же количестве объектов мы будем в состоянии располагать высокой степенью уверенности относительно менее точного результата или несколько меньшей степенью уверенности относительно более высокой точности. Однако нельзя одновременно и вкушать от пирога исследования, и оставлять его нетронутым.
Конечно, в идеале мы всегда предпочитаем действовать с минимальными ошибками и с максимальной уверенностью. К сожалению, в дело часто вмешиваются практические соображения. Например, стоимость одного личного интервью в исследовательском проекте может равняться 50 долларам, включая собственно расходы на интервью, расходы на транспорт и пр. Это означает,что при 99%-ной уверенности стоимость снижения величины ошибки с ±3 до ±2% может составлять 130 000 долларов. Во многих случаях различие в качестве результатов не стоит производимых дополнительных затрат, а в гораздо большем числе случаев средств просто нет. Таким образом, важную роль в ограничении объема выборки играют ограничения на ресурсы. В большинстве наиболее значительных опросов общественного мнения, а также в большинстве наиболее значительных исследовательских проектов в области политологам используются выборки объемом приблизительно 1400–1600 респондентов. Такие исследования дают результаты с точностью 3–4% и со степенью уверенности 0,99 и считаются одновременно и возможными, и достаточно точными. Проекты, использующие контент-анализ или другие относительно менее дорогостоящие методы сбора данных, часто тяготеют к верхнему правому углу таблицы.
Прежде чем мы завершим обсуждение проблемы объема выборки, следует затронуть еще один вопрос, хотя он, несомненно, менее очевиден и интуитивно менее привлекателен, чем все то, о чем мы говорили ранее. Внимательное изучение табл. А.2 и A.3 приложения А показывает, что, достигнув определенного предела, размер совокупности не влияет на объем выборки, которая должна ее представлять. В то время как доказательство этого утверждения выходит за рамки настоящей книги, вытекающие из него следствия касаются нас вплотную. Ведь, в сущности, наличие такого верхнего предела означает, что практически одна и та же выборка, если она должным образом [c.180] сформирована, может быть в равной степени репрезентативна для населения г.Роанока (штат Виргиния), г. Нью-Йорка, Соединенных Штатов и всего Западного полушария. Размер совокупности является важным фактором при определении объема выборки лишь в случае относительно небольших совокупностей.
Итак, подводя итоги, следует подчеркнуть, что, формируя выборку, необходимо очень внимательно следить за тем, чтобы не только отобрать из данной совокупности достаточное количество объектов, но и взять такую группу, которая, как представляется, будет действительно репрезентативной с точки зрения распределения характеристик внутри данной совокупности. Должное внимание на этом этапе процесса исследования в дальнейшем окупится сторицей. Наоборот, небрежность при формировании выборки может нанести непоправимый вред любому исследованию. [c.181]
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания вступительная статья
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания предисловие
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- Введение
- 1. Процесс исследования
- Формулирование теории
- Операционализация теории
- Выбор адекватных методов исследования
- Наблюдение за поведением
- Анализ данных
- Интерпретация результатов
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания подготовка к исследованию
- 2. Создание теории: понятия и гипотезы в политологии
- Что такое теория?
- Логика построения теории
- Компоненты теории
- Проверка и совершенствование теории
- Роль гипотез
- Формулирование гипотез
- Заключение
- Дополнительная литература к главе 2
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 3. От абстрактного к конкретному: операционализация и измерение
- Операционализация: связь между теорией и наблюдением
- Операционные определения
- Измерение
- Уровни измерения
- Рабочая гипотеза
- Ошибка измерения
- Валидность
- Типы валидизации
- Надежность
- Заключение
- Дополнительная литература к главе 3
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 4. Работа по плану: как составить программу исследования
- Цель и программа исследования
- Учет в программе исследования альтернативных конкурирующих гипотез
- Экспериментальные программы исследования
- Программа классического эксперимента
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Формирование групп
- Полевые эксперименты и неэкспериментальные программы
- Квазиэкспериментальные программы
- Выбор программы исследования
- Факторы, угрожающие валидности
- Факторы, угрожающие внутренней валидности
- Факторы, угрожающие внешней валидности
- Дополнительная литература к главе 4
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 5. Кто, что, где, когда: проблема выборки
- Репрезентативная выборка
- Процедуры формирования репрезентативной выборки
- Установление необходимого объема выборки
- Краткие характеристики выборок разного объема
- Заключение
- Дополнительная литература к главе 5
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания методы сбора данных
- 6. Опрос
- Этапы проведения опроса
- Концептуализация
- Подготовка инструментария
- Планирование опроса и построение выборки
- Проблемы, связанные с финансированием опроса
- Обучение и инструктаж персонала
- Предварительное тестирование
- Проведение опроса
- Наблюдение за ходом опроса (мониторинг)
- Контрольная проверка
- Вторичный анализ данных опроса
- Дополнительная литература к главе 6
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 7. Интервьюирование
- Выборочное интервьюирование
- Формулирование вопросов
- Отбор интервьюеров
- Направленное интервьюирование
- Методика направленного интервьюирования
- Специализированное интервьюирование
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 8. Шкалирование
- Построение шкалы: две основные проблемы
- Шкалирование по лайкерту
- Шкалирование по гуттману
- Шкалирование по тёрстоуну
- Метод семантического дифференциала
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 9. Контент-анализ
- Подготовка к контент-анализу
- Проведение содержательного контент-анализа
- Проведение структурного контент-анализа
- Некоторые проблемы, возникающие в ходе контент-анализа
- Дополнительная литература к главе 9
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 10. Источники и применение сводных данных
- Типы сводных данных
- Проблемы, связанные с использованием сводных данных
- Источники сводных данных
- Сбор сводных данных
- Заключение
- Дополнительная литература к главе 10
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 11. Поверх границ: практика сравнительных исследований
- Выявление “кочующих” вопросов
- Поиск эквивалентной меры
- Отбор стран для изучения
- Отбор независимых наблюдений
- Отбор материала
- Заключение
- Дополнительная литература к главе 11
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания обработка данных
- 12. Подготовка и обработка данных
- Кодирование: что все эти цифры значат?
- Книга кодов и кодировальный бланк
- Макет кодировки для исследования “Информационные агентства о некоторых странах”
- Как обработать данные
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 13. Описание данных: построение таблиц, диаграмм, гистограмм
- Перечневая таблица
- Голоса белых и чернокожих избирателей, поданные за демократов в 1960 - 1976 гг., % *
- Линейная диаграмма
- Секторная диаграмма и гистограмма
- Двусторонняя гистограмма
- Расовые различия на президентских выборах 1964 г., %
- Расовые различия на президентских выборах 1972 г., %
- Некоторые предостережения
- Дополнительная литература
- Далее 14. Статистика I: анализ одномерных распределений к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 14. Статистика I: анализ одномерных распределений
- Измерение средней тенденции и дисперсии
- Частотное распределение: типы занятий респондентов
- Измерения для номинальных переменных
- Измерения для порядковых переменных
- Уровни образования по трем массивам
- Измерения для интервальных переменных
- Заключение
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 15. Статистика II: изучение взаимосвязей между двумя переменными
- Измерение связи и статистической значимости
- Измерение связи и значимости для номинальных переменных
- Определение партийности на основании партийной принадлежности отца (1)
- Определение партийности на основании партийной принадлежности отца (2)
- Определение партийности на основании партийной принадлежности отца (3)
- Значения, используемые для получения χ2
- Измерение связи и значимости для порядковых переменных
- Обобщенная таблица взаимной сопряженности признаков
- Измерение связи и значимости для интервальных переменных
- Значения, используемые для вычислений по уравнению регрессионной прямой
- Значения, используемые при определении коэффициента корреляции (r)
- Заключение
- Дополнительная литература
- Далее: 16. Статистика III: изучение взаимосвязей между несколькими переменными к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 16. Статистика III: изучение взаимосвязей между несколькими переменными
- Анализ таблиц
- Соотношение между получением образования в колледже и политическим мировоззрением
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для мужчин
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для женщин
- Множественная регрессия
- Интерпретация результатов множественной регрессии
- Решение общих проблем множественной регрессии
- Анализ временных рядов
- Заключение
- Дополнительная литература
- Далее: 17. Математическое моделирование к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 17. Математическое моделирование
- Процесс моделирования
- Зачем нужны модели?
- Примеры математических моделей политического поведения
- Другие типы моделей
- Сложности, связанные с моделированием
- Заключение
- Дополнительная литература
- Далее: 18. Некоторые обобщения к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 18. Некоторые обобщения
- Разработка гипотезы, измерения и программы исследования
- Сбор и анализ данных
- Контрольный бланк для оценки исследований
- Контрольный бланк для оценки исследования
- Заключение
- К оглавлению Примечание