- Код статьи
- S0132-16250000352-3-
- DOI
- Тип публикации
- Статья
- Статус публикации
- Опубликовано
- Авторы
- Том/ Выпуск
- Том 404 / Номер 12
- Страницы
- 42-54
- Аннотация
- Статья посвящена проблемам оценки качества первичных данных массовых опросов в процессе подготовки рабочих файлов для решения задач многомерного анализа. К числу подобных проблем относится введение критериев качества, часть из которых носит общий характер для различных способов анализа, а часть – специфический и зависящий от предполагаемой исследовательской практики. В нашем случае таковой является типологический анализ для цели реконструкции социальных типов как объектов функционального управления. На примере первичных данных опроса рабочих промышленных предприятий оценивается качество переменных и объектов для цели типологизации. Предлагается логика «борьбы» с пропущенными (отсутствующими) данными, опирающаяся на предметно-ориентированный подход. В основе последнего лежит идея восстановления (импутации) значений не исходных переменных, а индексов, играющих, в частности, роль классификационных признаков. Это те переменные, которые подаются на вход процедур разбиения объектов на классы. Выделяются несколько шагов в процессе формирования рабочих файлов для типологического анализа: оценка качества переменных, соответствующих первой части типообразующих признаков и используемых дляформирования классификационных признаков (шаг 1); уточнение факторной структуры этих переменных (шаг 2); формирование классификационных признаков (шаг 3); присвоение значений индексам для случаев пропущенных данных (шаг 4); включение в рабочий файл переменных из второй и третьей части типообразующих признаков (шаг 5).
- Ключевые слова
- качество данных, типологический анализ, пропущенные данные, импутация данных, типообразующие признаки, классификационные признаки, индексы
- Дата публикации
- 01.12.2017
- Всего подписок
- 4
- Всего просмотров
- 558