Измерения для интервальных переменных
Интервальные данные, безусловно, предоставляют нам наиболее полную информацию, включая категоризацию, ранжирование и установление интервалов. Интервальные значения могут быть подвержены любым арифметическим манипуляциям. Следовательно, приступая к исчислению средней тенденции и дисперсии для интервальных данных, мы можем и должны принять эту информацию о дополнительных возможностях во внимание.
Главной единицей для интервальных данных является среднее геометрическое, определяющее место средней точки в распределении с позиций как количества признаков от каждого конца распределения до этой точки, так и расстояние между ней и каждым признаком. Среднее геометрическое распределения – это то, что многие люди обычно связывают с термином “среднее арифметическое”. [c.401]
Давайте проиллюстрируем нахождение среднего геометрического на примере рис. 14.2. Если все признаки распределения имеют равные веса, и если они расположены на оси на равных интервалах так, что признаки с предельными значениями наиболее удалены от средней точки в том или ином направлении, а случаи с равными значениями расположены на равноудаленных точках оси, то точка среднего геометрического будет расположена в центре оси, где сумма значений и интервалов одной стороны уравновешивается суммой значений и интервалов другой. Как ясно из рисунка, и веса (количество признаков) и интервалы (крайние значения) важны для определения среднего геометрического.
Среднее геометрическое распределения, обозначаемое , вычисляется по следующей формуле:
,
где Xi – значение каждого отдельного случая; N – количество случаев; – знак суммы всех отдельных случаев от 1 доN.
Обратите внимание, что в подсчете используются сложение и деление, два арифметических действия, произведенные с самими значениями (что принципиально отлично от просто количества случаев с данным значением) с подсчетом как всех значений, так и интервалов. Это и есть те манипуляционные возможности, которые отличают интервальные данные от данных более низких уровней измерения.
Заметьте, однако, еще, что, как видно из рис. 14.2г, именно потому, что среднее геометрическое чувствительно к величине интервалов, оно зависит от кренов в распределении, которые вызываются наличием одного или нескольких предельных признаков. Иными словами, небольшое количество случаев с предельными значениями может сделать значение среднего геометрического меньше или больше, чем реально репрезентативное. Давайте посмотрим, как это может получиться. [c.402]
Возьмем группу из 11 человек, 10 из которых зарабатывают 10.000 долларов в год, а один – 1 млн. Значение среднего геометрического дохода для этой группы – 100.000 долларов.
Но 10 из 11 членов группы зарабатывают, по сути дела, десятую часть этого количества. Таким образом, среднее геометрическое, хотя и точно подсчитанное, тем не менее не так репрезентативно, как, скажем, медиана, которая в другом случае равна 10.000 долларов. Вообще говоря, статистические процедуры с меньшими возможностями (предназначенные для более низких уровней измерения) всегда можно использовать в анализе данных, и, хотя они теряют некоторую информацию (например, расстояние до предельного значения, как здесь), иногда с их помощью можно получить более значимые результаты. Поспешим отметить, однако, что обратное неверно; статистические процедуры с высоким уровнем возможностей не имеют ни малейшей ценности для шкал низких уровней.
Наиболее часто употребляемый способ измерения дисперсии для интервальных данных, стандартное отклонение, из всех видов статистических процедур, которые мы используем, вероятно, один из интереснейших. На первый взгляд может показаться, что если мы хотим определить, насколько по отношению к распределению в целом типично среднее геометрическое, то все, что нужно сделать, – это измерить расстояние от его точки до каждого случая, сложить их и разделить на количество случаев N. Иными словами, мы подсчитаем среднее геометрическое расстояний вокруг среднего геометрического распределения по формуле:
Чем больше дисперсия для данного распределения, тем менее типично среднее геометрическое, и, чем меньше дисперсия, тем более типично среднее геометрическое. [c.403]
Но если мы попробуем сделать все это на примере, скажем, рис. 14.2в, возникнут некоторые проблемы. Применив формулу к этому случаю, мы получим:
Даже в случае распределения с таким сильным отклонением, как в примере с доходами, мы получим:
И в любом случае среднего геометрического для любого распределения результат будет тот же. Причина проста. Мы, по сути дела, определили среднее геометрическое как такую точку, где все веса и интервалы уравновешены, точку или значение, относительно которых все остальное сбалансировано. Следовательно, при подсчете среднего геометрического вряд ли стоит удивляться, что мы получим [c.404] как раз то, что предполагалось. Тем не менее искушение измерить дисперсию путем измерения близости признаков к или удаления их от среднего геометрического сохраняет свою притягательность. Введем понятие стандартного отклонения.
Стандартное отклонение (s) является тем математическим инструментом, который может помочь выполнить вашу задачу. По сути дела, это процедура, которая сводит на нет свойства разнонаправленных интервалов уравновешивать друг друга путем простого возведения в квадрат утих интервалов (и избавляясь таким образом от отрицательных значений), измерения разброса квадратов интервалов вокруг среднего геометрического и затем извлечения из результата квадратного корня, с тем чтобы вернуться к начальным единицам интервалов. Формула, по которой все это вычисляется, напоминает прежнюю, акромe возведения в квадрат и извлечения квадратного корня. Формула эта такова:
где Xi – значение каждого отдельного случая; – среднее геометрическое;N – количество случаев; – знак суммы всех отдельных случаев от 1 доN.
Таким образом, для примера на рис. 14.2в
Она выражена в тех же единицах, что и исходные данные. Если переменные измеряются в одних и тех же или единицах, то стандартное отклонение может основой для выяснения репрезентативности средних геометрических; чем больше стандартное отклонение, ее репрезентативно среднее геометрическое. Но если единицы принципиально отличны или если анализируется одна переменная, интерпретация стандартного отклонения уже не столь проста.
Существует одно исключение из этого: переменные, чье [c.405] распределение близко к нормальному, т.е. такие, у которых существует единственная мода в самом центре распределения, а частоты симметрично убывают по направлениям к предельным значениям (графическое изображение нормального распределения, с которым вы, наверно, хорошо знакомы, – это просто колоколообразная кривая). Известно (из рассуждений, которые не входят в рамки нашего разговора), что в таких случаях 68,3% всех случаев лежат в пределах одного стандартного отклонения, отсреднего геометрического (± s), 95,5% – в пределах двух стандартных отклонений от среднего геометрического (± 2s) и 99,7% – в пределах трех стандартных отклонений от среднего геометрического ( ± 3s). Фактически в случае таких распределений мы для любой точки можем определить, на сколько стандартных отклонений ниже или выше среднего геометрического она находится, и затем использовать эту информацию для выяснения относительного положения двух признаков в одной переменной или, наоборот, относительного значения двух переменных для одного и того же признака. Позволяет это сделать нам стандартная оценка, (z), которая вычисляется по следующей формуле:
Представьте, что мы располагаем данными, например, по затратам на образование на душу населения в каждом штате, количеству работающих преподавателей на 1000 студентов в каждом штате и количеству награжденных выпускников средней школы на 100.000 населения в каждом штате в определенном году и что значения этих переменных по штатам распределяются по кривой, близкой к нормальной. Представьте затем, что мы хотим использовать эти данные для изучения политики в области образования в Аризоне и Виргинии. Мы сначала подсчитаем среднее геометрическое () и стандартное отклонение (s) для каждой переменной по всем 50 штатам, затем определим соответствующие стандартные оценки (z) для каждой переменной по двум нужным нам штатам. Результатом будут два набора значений в стандартных единицах (уже не в долларах, количестве учителей и документов, а в количестве стандартных отклонений от среднего [c.406] геометрического), которые могут быть использованы для определения индексов политики в области образования, для выяснения относительной позиции Аризоны и Виргинии среди других штатов или для стандартизации при необходимости cравнения принципиально отличных измерений. Таким образом, при использовании стандартного подсчета стандартное отклонение может оказаться очень полезным. [c.407]
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания вступительная статья
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания предисловие
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- Введение
- 1. Процесс исследования
- Формулирование теории
- Операционализация теории
- Выбор адекватных методов исследования
- Наблюдение за поведением
- Анализ данных
- Интерпретация результатов
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания подготовка к исследованию
- 2. Создание теории: понятия и гипотезы в политологии
- Что такое теория?
- Логика построения теории
- Компоненты теории
- Проверка и совершенствование теории
- Роль гипотез
- Формулирование гипотез
- Заключение
- Дополнительная литература к главе 2
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 3. От абстрактного к конкретному: операционализация и измерение
- Операционализация: связь между теорией и наблюдением
- Операционные определения
- Измерение
- Уровни измерения
- Рабочая гипотеза
- Ошибка измерения
- Валидность
- Типы валидизации
- Надежность
- Заключение
- Дополнительная литература к главе 3
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 4. Работа по плану: как составить программу исследования
- Цель и программа исследования
- Учет в программе исследования альтернативных конкурирующих гипотез
- Экспериментальные программы исследования
- Программа классического эксперимента
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Программа эксперимента с двумя контрольными группами, разработанная р.Соломоном
- Формирование групп
- Полевые эксперименты и неэкспериментальные программы
- Квазиэкспериментальные программы
- Выбор программы исследования
- Факторы, угрожающие валидности
- Факторы, угрожающие внутренней валидности
- Факторы, угрожающие внешней валидности
- Дополнительная литература к главе 4
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 5. Кто, что, где, когда: проблема выборки
- Репрезентативная выборка
- Процедуры формирования репрезентативной выборки
- Установление необходимого объема выборки
- Краткие характеристики выборок разного объема
- Заключение
- Дополнительная литература к главе 5
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания методы сбора данных
- 6. Опрос
- Этапы проведения опроса
- Концептуализация
- Подготовка инструментария
- Планирование опроса и построение выборки
- Проблемы, связанные с финансированием опроса
- Обучение и инструктаж персонала
- Предварительное тестирование
- Проведение опроса
- Наблюдение за ходом опроса (мониторинг)
- Контрольная проверка
- Вторичный анализ данных опроса
- Дополнительная литература к главе 6
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 7. Интервьюирование
- Выборочное интервьюирование
- Формулирование вопросов
- Отбор интервьюеров
- Направленное интервьюирование
- Методика направленного интервьюирования
- Специализированное интервьюирование
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 8. Шкалирование
- Построение шкалы: две основные проблемы
- Шкалирование по лайкерту
- Шкалирование по гуттману
- Шкалирование по тёрстоуну
- Метод семантического дифференциала
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 9. Контент-анализ
- Подготовка к контент-анализу
- Проведение содержательного контент-анализа
- Проведение структурного контент-анализа
- Некоторые проблемы, возникающие в ходе контент-анализа
- Дополнительная литература к главе 9
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 10. Источники и применение сводных данных
- Типы сводных данных
- Проблемы, связанные с использованием сводных данных
- Источники сводных данных
- Сбор сводных данных
- Заключение
- Дополнительная литература к главе 10
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 11. Поверх границ: практика сравнительных исследований
- Выявление “кочующих” вопросов
- Поиск эквивалентной меры
- Отбор стран для изучения
- Отбор независимых наблюдений
- Отбор материала
- Заключение
- Дополнительная литература к главе 11
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания обработка данных
- 12. Подготовка и обработка данных
- Кодирование: что все эти цифры значат?
- Книга кодов и кодировальный бланк
- Макет кодировки для исследования “Информационные агентства о некоторых странах”
- Как обработать данные
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 13. Описание данных: построение таблиц, диаграмм, гистограмм
- Перечневая таблица
- Голоса белых и чернокожих избирателей, поданные за демократов в 1960 - 1976 гг., % *
- Линейная диаграмма
- Секторная диаграмма и гистограмма
- Двусторонняя гистограмма
- Расовые различия на президентских выборах 1964 г., %
- Расовые различия на президентских выборах 1972 г., %
- Некоторые предостережения
- Дополнительная литература
- Далее 14. Статистика I: анализ одномерных распределений к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 14. Статистика I: анализ одномерных распределений
- Измерение средней тенденции и дисперсии
- Частотное распределение: типы занятий респондентов
- Измерения для номинальных переменных
- Измерения для порядковых переменных
- Уровни образования по трем массивам
- Измерения для интервальных переменных
- Заключение
- Дополнительная литература
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 15. Статистика II: изучение взаимосвязей между двумя переменными
- Измерение связи и статистической значимости
- Измерение связи и значимости для номинальных переменных
- Определение партийности на основании партийной принадлежности отца (1)
- Определение партийности на основании партийной принадлежности отца (2)
- Определение партийности на основании партийной принадлежности отца (3)
- Значения, используемые для получения χ2
- Измерение связи и значимости для порядковых переменных
- Обобщенная таблица взаимной сопряженности признаков
- Измерение связи и значимости для интервальных переменных
- Значения, используемые для вычислений по уравнению регрессионной прямой
- Значения, используемые при определении коэффициента корреляции (r)
- Заключение
- Дополнительная литература
- Далее: 16. Статистика III: изучение взаимосвязей между несколькими переменными к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 16. Статистика III: изучение взаимосвязей между несколькими переменными
- Анализ таблиц
- Соотношение между получением образования в колледже и политическим мировоззрением
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для мужчин
- Гипотетические отношения между получением образования в колледже и политическим мировоззрением для женщин
- Множественная регрессия
- Интерпретация результатов множественной регрессии
- Решение общих проблем множественной регрессии
- Анализ временных рядов
- Заключение
- Дополнительная литература
- Далее: 17. Математическое моделирование к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 17. Математическое моделирование
- Процесс моделирования
- Зачем нужны модели?
- Примеры математических моделей политического поведения
- Другие типы моделей
- Сложности, связанные с моделированием
- Заключение
- Дополнительная литература
- Далее: 18. Некоторые обобщения к оглавлению примечания
- Красным шрифтом в квадратных скобках обозначается конец текста на соответствующей странице печатного оригинала данного издания
- 18. Некоторые обобщения
- Разработка гипотезы, измерения и программы исследования
- Сбор и анализ данных
- Контрольный бланк для оценки исследований
- Контрольный бланк для оценки исследования
- Заключение
- К оглавлению Примечание