Приглашаем посетить сайт

Мода (modnaya.ru)

Социология: Энциклопедия (2003)
ОБРАБОТКА ДАННЫХ

В начало энциклопедии

По первой букве
А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

ОБРАБОТКА ДАННЫХ

ОБРАБОТКА ДАННЫХ - комплекс процедур, направленных на преобразование и обобщение данных социологического исследования. В отечественной социологии термин трактуется очень широко. Обычно к О.Д. относят процедуры проверки и кодирования заполненного инструментария, в том числе пропущенных значений; ввода данных в компьютер; проверки и исправления введенных данных; перекодировки и преобразования переменных; проверки репрезентативности выборки и, при необходимости, ее взвешивания; простейшие процедуры статистического анализа данных - построение распределений частот и таблиц сопряженности .

При любом способе сбора информации общим требованием является обязательная фиксация ее в документах. Если в исследовании одновременно используется несколько документов, из них после заполнения необходимо сформировать рабочие массивы. Материалы, относящиеся к одному респонденту, следует собрать в комплекты, контролируя полноту каждого комплекта. Одновременно производится проверка, кодирование и нумерация документов, причем всем документам, относящимся к одному респонденту, присваиваются одинаковые номера. Если для групп респондентов заполнены некоторые общие документы (например, карточка предприятия или семьи), в каждый вид индивидуального инструментария должен быть внесен общий идентификатор - предприятия, семьи, - который позволит в дальнейшем связать ответы респондента с характеристиками группы.

При проверке документов следует обращать внимание на принадлежность респондента к генеральной совокупности, полноту комплекта и полноту заполнения каждого документа, правильность заполнения инструментария. К типичным ошибкам заполнения инструментария относится наличие нескольких ответов там, где предусматривался только один, наличие нелегитимных пропусков, логические ошибки.

Кодированию, в первую очередь, подлежат открытые вопросы и пропущенные значения. В сложных случаях для открытых вопросов разрабатываются специальные кодификаторы. При кодировании пропущенных значений важно знать причину отсутствия ответа. Основные причины можно упорядочить по степени легитимности: 1) вопрос не относится к респонденту ("структурный пропуск"); 2) респондент не понимает вопрос, не знает ответа или не имеет сложившегося мнения; 3) респондент отказывается отвечать на вопрос, уклоняется от ответа; 4) ответа нет по неизвестной причине. Первые три вида пропусков следует считать легитимными. Структурные пропущенные значения обычно исключают из анализа соответствующего вопроса. Незнание ответа или отказ отвечать в некоторых случаях можно содержательно интерпретировать и использовать в анализе данных. Поэтому интервьюеры должны как можно более точно фиксировать причину пропуска. Отсутствие ответа по неизвестной причине не является легитимным и должно быть отнесено к категории серьезных ошибок интервьюирования.

Ввод данных в компьютер производится с помощью текстовых редакторов или, что предпочтительнее, специальных программ или подсистем для ввода и редактирования данных, которые имеются в большинстве программных статистических средств. Преимущество специального программного обеспечения состоит в том, что оно позволяет организовать контроль качества данных непосредственно в процессе их ввода. Это, в первую очередь, контроль соответствия диапазону допустимых значений, проверка логической совместимости ответов, следование процессу ввода логике анкеты (автоматизация структурных пропусков).

Проверка и чистка введенных данных заключается в нахождении и исправлении ошибок, не обнаруженных при вводе. На этом этапе основное внимание уделяется логическим ошибкам. Если качество ввода не контролировалось автоматически, следует также проверить введенные данные на принадлежность к диапазону допустимых значений.

Программное обеспечение обработки данных, в том числе наиболее популярный среди социологов статистический пакет SPSS , обычно предоставляет возможность хранить вместе с данными исследования и выводить на печать тексты вопросов анкеты и ответов на них. Как правило, это делается посредством присвоения "меток" переменным и их отдельным значениям. Задание таких меток также входит в число процедур О.Д.

Современная методология неукоснительно требует, чтобы инструментарий исследования был максимально удобным для заполнения и точного фиксирования информации, и чтобы ввод данных в компьютер, во избежание ошибок, производился в полном соответствии с заполненным документом. Это требование часто противоречит логике решения задачи или требованиям статистических методов анализа данных, поэтому, в случае необходимости, переменные должны быть перекодированы и преобразованы соответствующим образом.

Предварительная проверка репрезентативности выборки осуществляется по так называемым "контролируемым", например, социально-демографическим, показателям. При необходимости, выборка может быть взвешена ( Выборки взвешивание) с помощью весовых переменных, предусмотренных в большинстве статистических программах. При использовании методов случайной выборки дополнительный опрос отдельных групп респондентов не рекомендуется; изъятие из массива уже заполненных "избыточных" документов запрещено. Если выборка невелика, проверку распределения "контролируемых" показателей можно сделать вручную на этапе проверки заполнения инструментария.

Статистическая О.Д. предусматривает в первую очередь получение важнейших количественных характеристик выборки, одномерных распределений и всевозможных таблиц; расчет ошибок выборки по важнейшим показателям; оценивание характеристик генеральной совокупности; анализ связей между переменными, решение прикладных задач и проверку гипотез исследования. Это может потребовать применения достаточно сложных методов статистического анализа - корреляционного , регрессионного , дисперсионного , факторного , кластерного и других.

О.В. Терещенко

В начало энциклопедии