logo
Первоисточники / Мангейм Д

Как обработать данные

Когда кодировка данных закончена, мы обращаемся к их обработке, с тем чтобы прийти к каким-либо выводам. Понятно, что в работе с большим количество случаев и переменных путаница может быть абсолютно непреодолимой. Если мы хотим преодолеть эту трудность и добиться максимальной простоты, точности и емкости анализа, нужно положиться на компьютер. Конечно, компьютер – очень сложная система, но ее основные принципы несложно понять.

Компьютеры состоят из комплектов выключателей (кнопок), которые используются для набора информации посредством простых кодов. Можно проиллюстрировать это, пользуясь аналогией с выключателями света в вашем [c.370] доме. Выключатель может выполнять только два типа операций. Он либо включен, либо выключен, посредством постановки в ту или иную позицию выключатель (и свет) могут быть использованы для передачи информации. Если, например, вы хотите, чтобы в канун Дня всех святых ваши дети навестили вас, вы информируете об этом, включая свет у дверей вашего дома. Если вы не хотите, чтобы вас беспокоили, вы не станете включать свет. По сути дела, вы передаете сообщение посредством замыкания и размыкания электрической цепи. Точно так же, сочетая комплекты выключателей и лампочек и используя двоичную систему исчисления (описанием которой мы сейчас не станем заниматься), вы можете составлять все более и более сложные информационные сообщения. Построение такой системы кодов по типу “да – нет” и использование ее для обмена информацией можно представить себе как программирование ваших действий с выключателями света. Собственно говоря, так компьютер и работает, конечно, в гораздо большем и более сложном масштабе. Обычный компьютер состоит из многих тысяч маленьких выключателей, запрограммированных на сбор и обработку информации точно таким путем.

Некоторые виды анализа – особенно такие, в которых задействованы очень большие объемы данных или очень сложные процедуры обработки, – производятся на компьютерах типа “мэйнфрейм”, но большинство политологических исследований могут быть сделаны и на достаточно быстрых персональных компьютерах с большой памятью. Для “общения” с компьютером мы используем различные средства – от пишущей машинки консоли до оптической “мышки” и светочувствительного пера. Информация, вводимая в компьютер с помощью клавиатуры (или какими-то другими средствами), конвертируется в электронные коды, которые хранятся в виде, предварительно оговоренном. Каждой строке информации соответствует строка в кодировочной таблице. Таким образом, продолжая разговор о нашем примере, чтобы ввести коды 821 статей о трех запрашиваемых странах, мы должны были напечатать их в 821 строке данных на клавиатуре.

Некоторые программы пригодны для проведения статистического анализа на персональных компьютерах. Они различаются по форме и возможностям. Одни – особенно [c.371] разработанные для компьютеров “Apple” или IBM совместимых систем, использующих программное обеспечение типа “Windows”, – ориентированы на визуальные (графические) команды. Другие – IBM совместимые системы, использующие операционную систему MS-DOS, – ориентированы на текстовые команды. Разнообразие аппаратного и программного обеспечения слишком велико, чтобы подробно рассматривать его на этих страницах. Однако что касается ввода данных, то в наиболее современных программах используется обычно формат, называющийся “электронные таблицы”*.

При использовании электронных таблиц сначала необходимо пометить и определить значение колонок для ввода данных, установив параметры (число колонок, необходимых для каждой переменной, тип и определяющие метки). Затем производят ввод данных построчно, причем в каждой строке должен быть представлен отдельный случай или наблюдение. Соответствующие колонки заполняются цифрами или буквами. Все это выглядит достаточнознакомо, ибо процедура совершенно совпадает с созданием программного бланка (coding sheet), которое мы описали выше.

Когда данные введены в компьютер, их нужно обрабатывать. Это значит, что мы должны “проинструктировать” компьютер, каковы наши требования к их обработке. Какие случаи нам нужно проанализировать? Какие подсчеты должны быть выполнены? В какой форме мы хотим получить результаты?

Полезно уметь писать компьютерные программы, но нет никакой необходимости создавать свою собственную программу, для того чтобы проанализировать большинство данных, привлекаемых для политологического исследования. Пригодное для этого программное обеспечение включает в себя очень сложные и хитроумные программы, выполняющие разнообразные статистические, аналитические, текстовые и другие операции. Но даже если программы сами по себе сложны, то использовать их [c.372] очень легко. В каждой имеется своеобразная “поваренная книга” для обработки данных. Эта “книга”, или учебник, содержит пошаговые инструкции по использованию программы и выполнению определенных задач. В сущности, компьютер задает нам разные вопросы, посылая на экран сообщения типа: “Хотите ли вы, чтобы я вывел на экран эти данные в виде таблицы?” или “Вы хотите посчитать среднее квадратическое отклонение для этих случаев?” Следуя инструкциям, мы отвечаем “да” или “нет” и указываем на специфические процедуры, которые мы хотим проделать. Форма и суть этих инструкций меняются в зависимости от пакета, но в целом функции их одинаковы. Таким образом, на самом деле нет необходимости создавать программы, поскольку есть возможность пользоваться уже имеющимися в компьютере.

В заключение хочется сделать еще три замечания. Во-первых, довольно распространено явление, когда люди, не имеющие прежнего опыта работы с компьютером, теряются и слегка побаиваются его. Такие чувства понятны, однако нельзя позволять им становиться препятствием в обучении. При наличии всех закрытых программ, руководств и консультационных служб, которые сейчас существуют, использование компьютера значительно облегчается по сравнению с прежними временами. Когда, наконец, вы преодолеете свои сомнения, то, возможно, обнаружите, что попались компьютеру “на крючок” и получите огромное удовольствие от общения с ним.

Во-вторых, не стесняйтесь ошибаться. Внимательный ввод данных и считывание предотвратят многие ошибки, И, как в любой новой сфере, вы вскоре найдете пути улучшения работы. Это – обычное дело. Если подумать, ошибки и их исправление – один из наиболее важных моментов обучения. Следите за своими ошибками там, где это возможно, не отказывайтесь от помощи там, где это необходимо, и не прекращайте своих попыток.

И наконец, не увлекайтесь. Компьютеры по природе своей бестолковы; они обрабатывают информацию, они точно следуют командам, но они не думают. Используя пакеты программ, которые мы здесь описали, вы можете с легкостью заставить компьютер выполнять сложнейшие статистические расчеты, какие только можно вообразить, данных такого низкого уровня, что результаты, несмотря [c.373] на впечатляющую внешнюю форму, будут бессмысленны. Соответственно, очень важно, чтобы вы заранее продумывали и понимали статистические и аналитические процедуры, которые предстоит осуществить компьютеру, и отбирали только те, которые соответствуют вашим данным. Эти процедуры будут предметом обсуждения нескольких следующих глав. [c.374]