Обработка эмпирических данных исследования

После непосредственного проведения исследования, когда получены все необходимые первичные данные, перед многими исследователями встаёт вопрос:" А что дальше?" Как правильно обработать полученные данные, правильно составить сводные таблицы, проверить данные, провести статистическую обработку – на эти вопросы и призвана ответить данная статья. Обработка эмпирических данных исследования делится обычно на несколько этапов:

Первичная обработка данных

  • Составление таблиц
  • Преобразование формы информации
  • Проверка данных.

Математико - статистическая обработка данных

  • Анализ первичных статистик
  • Оценка достоверности отличий
  • Нормирование данных
  • Корреляционный анализ
  • Факторный анализ

Составление таблиц

В большинстве случаев обработку данных целесообразно начать с составления сводных таблиц.

Сводная таблица данных – это своеобразный «аккумулятор» всех данных, полученных в результате проведённого исследования, в идеале она должна содержать данные всех испытуемых по всем методикам исследования. Обычно сводные таблицы составляются в программе Microsoft Office Excel, либо Word, Access.

Основой для сводной таблицы исходных данных является следующая форма. Каждая строка содержит значения всех показателей одного испытуемого. В каждом столбце (поле) записаны значения одного показателя по всем испытуемым. Таким образом, в каждой ячейке (клетке) таблицы записано только одно значение одного показателя одного испытуемого. В самой верхней строке даны номер испытуемого по порядку, ФИО (или какой-нибудь другой идентификатор), измеренные показатели, шкальные оценки и т.п. Эта строка облегчает ориентировку в таблице. В каждой последующей строке записана ФИО испытуемого и значения всех, измеренных у него параметров; разумеется, для всех испытуемых в одном и том же порядке показателей.

Последовательность признаков может быть упорядочена по разным основаниям. В первых столбцах лучше разместить демографические или социально-демографические показатели: пол, возраст, уровень образования (если важен) и т.д. Затем по убывающей значимости (предполагаемой информативности) приведены измеренные в исследовании параметры. Параметры, полученные с помощью одной методики, удобнее располагать компактно – в одной группе (рядом друг с другом), например, все шкалы одной методики, шкалы следующей и т.д. Пример сводной таблицы данных в формате Excel можете посмотреть тут.

Испытуемых можно перечислить в алфавитном порядке, но лучше использовать этот принцип на самом нижнем уровне деления. Сначала лучше разделить испытуемых по их принадлежности к каким-либо подгруппам, которые будут сравниваться между собой. Внутри этих подгрупп полезно упорядочить испытуемых по полу, возрасту или другому, важному для вас, параметру.

Преобразование формы информации

В таблицу целесообразно внести все интересующие вас признаки в форме десятичного числа, то есть предварительно пересчитать минуты в десятичные доли часа, секунды – в десятичные доли минуты, количество месяцев – в десятичную долю года и т.д. Это необходимо, поскольку формат данных для большинства используемых сейчас компьютерных программ накладывает свои ограничения. Старайтесь также без особой необходимости не заносить в таблицу различные текстовые символы (точки, запятые, тире и т.п.).

Всю информацию, которую можно закодировать числами, лучше перевести в числовую форму. Это даст больше возможностей для разных видов обработки данных. Исключением является первая строка, в которой записаны названия (чаще краткие названия – аббревиатуры) измеренных показателей. В виде чисел в таблицу можно вписать информацию и о тех параметрах выборки, которые предположительно могут оказаться значимыми факторами, но имеются у вас в качественных показателях. Наиболее простыми операциями могут быть: числовое кодирование (мужчины – 1, женщины – 2; прошедшие обучение – 1, не прошедшие – 2 и т.п.) и перевод качественных показателей в ранги.
Ранжирование уровня образования
Ранг Уровень образования
1 Менее 5 классов
2 5-8 классов или училище с дипломом о неполном среднем образовании
3 9-11 классов или училище о полоном среднем образовании
4 Техникум или колледж, или 1-2 курса ВУЗа
5 3-6 курсов ВУЗа без диплома о высшем образовании
6 ВУЗ с дипломом
7 Аспирантура, ординатура или другие формы постдипломного образования со сроком обучения 2 года и более
Для перевода в числа должностного уровня можно принять градации, приведённые в таблице ниже:
Ранжирование должностного статуса
Ранг Должностной статус, категория
1 Подсобные рабочие, технические исполнители
2 Квалифицированные рабочие, вспомогательный персонал среднего уровня квалификации
3 Инженерно-технические работники, специалисты со средним специальным и высшим образованием
4 Работники нижнего руководящего звена (бригадиры, начальники участков и т.п.), руководители подразделений, имеющие в подчинении исполнителей, специалисты высокой квалификации, преподаватели, имеющие учёную степень
5 Работники среднего руководящего звена (начальники цехов, отделов и т.д.), руководители основных структурных подразделений, имеющих в своём составе подразделения нижнего уровня, заместители руководителей предприятий, ведущие специалисты
6 Работники верхнего руководящего звеня (руководители предприятий, учреждений и организаций, их первые заместители, главные специалисты)
Описанное числовое кодирование полезно для предварительного (разведочного) анализа – немного шансов выявить отчётливые закономерности, но проделать эту работу полезно. Включение, например, в корреляционный анализ таких числовых величин может обнаружить существование или отсутствие взаимосвязей с другими параметрами, позволит не тратить время на более сложные процедуры.

Проверка данных

После создания таблицы на бумаге или компьютере необходимо проверить качество полученных данных. Для этого часто достаточно внимательно осмотреть массив данных. Начать проверку следует с выявления ошибок (описок), которые заключаются в том, что неправильно написан порядок числа. Например, 100 написано вместо 10, 9,4 – вместо 94 и т.п. При внимательном просмотре по столбцам это легко обнаружить, поскольку сравнительно редко встречаются параметры, которые сильно варьируют. Чаще всего значения одного параметра имеют один порядок или ближайшие порядки. При наборе данных на компьютере важно соблюдать требования к формат данных в используемой статистической программе. Прежде всего это относится к знаку, которые должен отделять в десятичном числе целую часть от дробной (точка или запятая).

Математико-статистическая обработка данных

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы. Однако в полной мере эти преимущества могут быть использованы, если исследователь имеет необходимый уровень подготовки в этой области. Обычно, чем мощнее компьютерная программ (чем более широкие у неё возможности), тем больше времени она требует для освоения. Таким образом, затрачивать время на её изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно. Очень часто использование таких программ для решения даже несложных задач также требует определённой суммы умений.

Для того, чтобы избежать лишних сложностей и временных затрат, гораздо эффективнее обратиться к профессионалам. Они качественно и профессионально проведут всю необходимую математико-статистическую обработку данных вашего исследования: анализ первичных статистик, оценку достоверности различий, нормирование данных, корреляционный и факторный анализ и т.п. Подробнее с услугами, которые предлагает АГ «СтатЭксперт» вы можете ознакомиться тут.


Литература: 1. Куликов Л.В. Психологической исследование: методические рекомендации по проведению. – СПб., Речь, 2002. – 148 с.