Методология

Анкета РСИ  

В РСИ используются четыре вида вопросов

 

  • Международные вопросы из анкеты ESS – перевод на русский язык, локализация, адаптация, гармонизация с русскими версиями в других странах и с предыдущими волнами исследования ЦЕССИ

  • Национальные вопросы, включенные в список необходимых в международной базе данных (уровень образования, национальность респондента, доход, религия, профессия респондента, супруги (а), родителей, отрасль экономики, где работает респондент, регион проживания респондента).

  • Российские вопросы – включены только в России, не входят в международную базу данных.

  • Методические вопросы а) MTMM; б) Вопросы для интервьюера.

 

Все интервью в РСИ проводятся только на русском языке. По правилам ESS в исследование включаются языки, которые считают своим основным более 5% населения страны. В России таких языков нет, хотя в отдельных регионах доля людей с основным не-русским языком существенно превышает 5%. В целях международной сопоставимости данных и выполнении единого правила другие языки помимо русского в исследование не включены.

 

Перевод международных вопросов проводится методом TRAPD (Translation, Review, Adjudication, Pretesting and Documentation)  – обсуждение, редактирование, предварительное тестирование и документирование [Harkness, 2003]. Это групповой тип перевода с командным обсуждением, включает перевод анкеты параллельно двумя переводчиками. В экспертную группу для обсуждения в России входят А.В. Андреенкова, А.В. Федотов, А.Е. Бронникова, В.Г. Андреенков, В.С. Магун, М.Г. Руднев, специалисты в отдельных направлениях социологических знаний для перевода ротационных модулей.

 

Гармонизация анкеты на русском языке проводится со странами, использующих русский язык для опроса (Латвия, Литва, Эстония, Израиль, Грузия, Украина). Для волны 9-10 использовалась новая процедура общего перевода анкеты на русский язык специалистами ЦЕССИ, а затем международное обсуждение и адаптация этой версии для отдельных стран.

 

Предварительное тестирование анкеты проводится качественным и количественным методом. На первом этапе тестирования используются когнитивными интервью (от 10 до 25) с респондентами из разных социально-экономических и социально-демографических групп. Количественные претест состоит из тестирования неполной версии анкеты (основные и проблемные вопросы) с когнитивным пробированием, и количественный претест полной анкеты без дополнительных вопросов с отчетом интервьюеров по каждому интервью.

 

Подготовка программы для проведения интервью в компьютеризированной системе CAPI (askia.com) осуществляется специалистами ЦЕССИ (руководитель группы Е.В. Обиюх). В программу входит блок Отбора респондента и сведения о контактах, Основное интервью, Вопросы для интервьюера о ходе интервью. Визуальные вспомогательные материалы (карточки) для респондента в Волнах 9-10 используются в трех формах: бумажной печатной, электронной на индивидуальном устройстве (планшете) и электронной на центральном сервере онлайн.

Построение выборки

Генеральная совокупность РСИ:

 

наличное население РФ в возрасте 15 лет и старше, проживающее в не-институциональных жилых помещениях, независимо от национальности, гражданства, языка и юридического статуса. В выборку включаются все, проживающие в отобранном домохозяйстве в течение срока опроса (2-3 месяца). Таким образом в опрос включаются трудовые мигранты, временно переехавшие лица, проживающие в жилых помещениях, студенты в общежитиях, но не включаются гости, приехавшие на короткий срок. К жилым помещениям относятся квартиры в многоквартирных домах, частные жилые дома, студенческие или другие общежития длительного проживания.

Исключены из выборки: a) поселения с «закрытым» режимом посещения, некоторые труднодоступные и малонаселенные районы Крайнего Севера, Сибири, Дальнего Востока и Северного Кавказа (всего менее 5% от общей численности населения); б) проживающие в институциональных образованиях, таких как тюрьмы, военные поселения, дома престарелых, монастыри; в) проживающие в местах временного проживания людей - гостиницы, пансионаты, дома отдыха, больницы; г) находящиеся по любым причинам за пределами страны дольше срока проведения опроса (2-3 месяца).

Модель выборки:

 

четырехступенчатая стратифицированная кластерная территориальная выборка [Андреенков, 2009].

Общая модель выборки сохранялась на протяжении всех волн исследования. Однако, конкретный дизайн и реализация выборки отличались.

Волны 3-6. Стратификация по 10 социально-экономическим зонам, Волна 7-10 – по федеративным округам (в базе данных включены переменные и СЭЗ и ФО в каждой волне).

Волны 3-6 4-ступенчатая выборка. Первичной единицей отбора ступали Первичной единицей отбора (ПЕО) выступают городские и сельские населенные пункты (всего 157 тысяч), вторичной (ВЕО) – избирательные участки. На третьем этапе отбора единицей являлись домохозяйства, на четвертом – индивидуальные респонденты [Андреенков, 2009]. В волнах 7-10 3-ступенчатая выборка. Первичной единицей отбора (ПЕО) выступают избирательные участки. На втором этапе отбора единицей являлись домохозяйства, на четвертом – индивидуальные респонденты

Волны 3-6 Отбор респондента внутри домохозяйства с помощью набора случайно распределенных Бланков отбора на бумаге, Волны 7-10 – автоматический случайный отбор респондента из членов домохозяйства системой CAPI.

Этапы построения выборки Волна 9-10.

 

Стратификация

Стратификация ПЕО по географическому признаку - восемь федеральных округов. Общее количество отобранных ПЕО - 131. 15 крупнейших городов России представляют собой «самопредставительные» ПЕО (Ni > N/150) – численность составляющего эти города населения превышает средний размер ПЕО и они отобраны с вероятностью 1. В сумме эти города составляют 19% общего населения, соответственно они составляют 30 ПЕО. Остальные 116 ПЕО отобраны внутри каждой страты с вероятностью, пропорциональной численности населения страты от 15 лет и старше, методом систематического случайного отбора.

Ступень 1

Случайный отбор двух избирательных участков в каждом ПЕО с равной вероятностью. Участники сформированы на основе списка избирательных участников на последних общенациональных выборках в Госдуму РФ (ЦИК). Те участки, где численность избирателей существенно меньше среднего размера участка в 2000 избирателей, географически соседствующие участки объединены в общую выборочную единицу.

Ступень 2

Предварительная перепись всех домохозяйств в отобранных избирательных участках методом физического обхода, наличных списков или геолокационной информации. Централизованный отбор домохозяйств из собранной базы данных.

Ступень 3

Перепись членов домохозяйства 15 лет и старше проводится во время первого контакта с домохозяйством. Размещение членов домохозяйства в список в определенном методикой порядке – сначала все мужчины от самого старшего до самого младшего, потом все женщины по возрасту, начиная со старшей. Отбор респондента внутри домохозяйства проводится компьютерной программой CATI методом случайного отбора.

эффективный и полный размер выборки

 

Полный размер выборки рассчитывается на основе формулы дизайн-эффекта для данного типа выборки при целевом эффективном размере в 1500 респондентов.

Дизайн-эффект и размер выборки.

  • Deff_p = 1.25, в соответствии с распределением домохозяйств с разным составом

  • Deff_c = 1+(16.3-1)*0.02 = 1.306

  • Deff = 1.25 * 1.306 = 1.6325

Вариации в вероятности отбора при подсчете deff_p не учитываются, так как могут нивелироваться за счет вариаций в уровне кооперации. Расчетный уровень кооперации – 70%.

  • Общее количество отобранных единиц (домохозяйств) = 3,785

  • Запланированное количество интервью (Net sample size) = 3,785 ´ 0.7 = 2650

  • Эффективный размер выборки = 2,650 / 1.6325 = 1623.

Реализация выборки

Метод сбора информации в опросе – личные интервью по месту жительства респондента в Волнах 3-6 с помощью бумажных анкет, Волны 7-10 – компьютеризированное интервью CAPI на планшетах.

Каждая отобранная выборочная единица (домохозяйства) посещается не менее 4 раз при несостоявшемся интервью.

Для увеличения уровня кооперации и достижимости со стороны респондентов используются следующие методы:

Интервьюеры и их стимулирование:

отбор интервьюеров по особым характеристикам, главная из которых – опыт работы в больших академических опросах, в том числе в прошлых волнах РСИ

специальное обучение интервьюеров методам контакта с респондентами

поощрение интервьюеров и полевых менеджеров за достижение определенного уровня кооперации (выше среднего по региону)

поощрение интервьюеров за дополнительные посещения респондентов,  проведение интервью после полученного отказа

Информационная поддержка

информационные письма в отобранные домохозяйства с объяснением целей и важности исследования

«визитные карточки» исследования с контактной информацией

«Горячая линия» для вопросов об исследовании

Размещение информации о проведении исследования и с просьбой об участии на сайте РСИ.

Организационные меры:

требование не менее 4-разового посещения каждого отобранного домохозяйства в разные дни недели и разное время суток, чтобы увеличить вероятность застать респондента

применение методов конвертации «отказов» - повторные попытки убедить респондента принять участие в исследовании уже после того, как был получен первоначальный отказ от участия с помощью замены интервьюера, новой аргументации-мотивации для участия в опросе, выборе другого времени для посещения.

удлинение срока полевых работ, чтобы увеличить вероятность застать мобильную часть респондентов

Стимулирование респондентов:

вознаграждение респонденту за участие в опросе. В Волнах 3-9 вознаграждение предлагалось только респондентам из нескольких регионов с самым низким уровнем кооперации. В Волне 10 вознаграждение предлагалось всем респондентам.

Документирование информации о контактах с отобранными единицами отбора (Контактная база данных):

история всех контактов – время контакта, субъект контакта, результат

условия, при которых проходил контакт

причины отказов

социально-демографический профиль отказавшихся от интервью

Информация об общем уровне достижимости (response rate), детальный анализ результатов контактов и сравнение основных социально-демографических и территориальных характеристик достигнутой выборки представлен в Методических отчетах к каждой волне исследования.

Организация полевых работ

Средняя длительность интервью составляет 60 минут. В каждой волне исследования участвовали 200-250 интервьюеров, их работу которых организовывали и контролировали 70-90 полевых менеджера в разных частях страны.

Исследование проводится согласно «Декларации о профессиональной этике»[1]. В частности:

 

a) Все респонденты информируются о том, что участие в опросе добровольное, до проведения процедуры отбора респондента в семье

 

b) Для респондентов, не достигших совершеннолетнего возраста, получено устное согласие родителей на участие в опросе;

 

c) Выполняются процедуры сохранения анонимности и конфиденциальности индивидуальных ответов респондентов. Вся контактная и идентификационная информация не включается в основную базу данных и хранится отдельно, и сразу после окончания проекта она будет уничтожена.

 

d) Волна 10. Санитарные меры по защите здоровья респондента и интервьюера (включающие в теплые месяцы приоритет проведения интервью вне помещения после отбора по месту жительства, предложение видеоинтервью, рекомендована вакцинация для всех интервьюеров за 2 недели до начала поля, контроль за состоянием здоровья интервьюеров в ходе поля, информация о заболевших в семье в начале интервью и перенос интервью в случае положительного ответа, соблюдение защитных мер в течение интервью, антисептическая обработка материалов после каждого интервью).

 

[1] Declaration on Professional Ethics 2010 https://www.isi-web.org/index.php/activities/professional-ethics/isi-declaration

 

Контроль качества

Контроль качества полевых работ проводился методом повторных звонков, проверялись 25% интервью каждого интервьюера.

 

Данные прошли внутреннюю логическую проверку на:

а) несуществующие значения,

б) внутреннюю противоречивость,

в) большое количество пропущенных данных в одном интервью,

г) интервью, длина которых была больше или меньше средней на 25%, а также на и другие существенные параметры.

 

Во всех случаях, когда возникают сомнения, интервью включалось в специальную группу для проверки и уточнения данных методом повторного звонка. В отдельных (немногочисленных) случаях, когда работа интервьюеров признавалась неудовлетворительной и не соответствующей принятым стандартам, все интервью этих интервьюеров исключались из базы данных, полевые работы проводились снова другой группой интервьюеров по новой выборке.

Обработка данных

В волнах 3-8 при использовании анкет на бумаге, данные вводились в базу данных централизованно группой обработки ЦЕССИ в Москве. Для контроля качества использовался двойной ввод 20% анкет, логическая проверка качества и ряд визуальных проверок. Начиная с волны 9 все данные поступают в центральную базу данных с локальных планшетов. Данные проверяются менеджером по обработке на основе комментариев интервьюеров и полевых менеджеров, а также автоматические проверки в рамках контроля качества, которые включают соотнесение общей длины, отдельных разделов и отдельных вопросов со средними значениями, пропорции пропущенных данных в отдельных вопросах и в целом по анкете, сходности типа заполнения между разными анкетами одного интервьюера. При идентификации проблем, интервью отправляются на дополнительную проверку методами повторного обращения к респонденту.

 

Данные в централизованной базе данных проходят процедуру анонимизации. Цель процедуры – избежать даже потенциальной возможности в прямой или косвенной идентификации конкретного респондента. Для этого используется правило минимального размера клетки на пересечении разных параметров. В РСИ используется агрегация географической информации о месте проживания респондентов на минимальном уровне – область. Более детальная информация (конкретный населенный пункт) наряду с информацией о профессии респондента, национальности, языке, дате рождения могла бы вести к потенциальной идентификации респондента.

Использование данных, веса

 

Для корректировки выборочных смещений из-за дизайна выборки (кластеризации) и дифференцированного не-ответа рассчитаны два веса – дизайн-вес (dweight) и пост-стратификационный вес (pspwght).

  • Dweight – дизайн вес учитывает различия в вероятности отбора на этапах выборки.
  • Pspweight – постстратфикационный демографический вес строится на основе сравнения данных выборки и Всероссийской переписи населения (2002 для волн 3-6, 2010 год для волн 6-9, 2020 год для волны 10) по следующим параметрам: -пол-возраст внутри 8 регионов.

Литература

Андреенкова А. В. Цифровизация социальных контактов среди студенческой молодежи в России во время пандемии коронавируса //Мониторинг общественного мнения: экономические и социальные перемены. 2020. № 6. С. 403—426. https://doi.org/10.14515/ monitoring.2020.6.1749.

Андреенкова А.В. Стабильность и изменения социальных установок россиян и европейцев в 2002-2016 гг. // Социологические исследования, N10, 2018, p. 66-76.

Андреенков В.Г. Методологические проблемы и решения в современных международных сравнительных исследованиях // Россия в Европе / Под ред. А.В. Андреенковой, Л.А. Беляевой. М.: Academia, 2009. С. 13–46.

Магун В.С., Руднев М.Г., Шмидт П. Европейская ценностная типология и базовые ценности россиян // Вестник общественного мнения. Данные. Анализ. Дискуссии, 2015. Т. 121. № 3-4. С. 74-93.

Frey C., Osborne M. A. (2013). The Future of Employment: How Susceptible are Jobs to Computerization? UK: University of Oxford.

Harkness J.A. (2003). Questionnaire translation/ in: Cross-cultural survey methods, eds. by J.A. Harkness, F.J.R. Van de Vijver, P. Ph. Mohler. New York: John Wiley and Sons. P. 35–56.

Hargittai E. (2008). The Digital Reproduction of Inequality/ in: Social Stratification, ed. by D. Grusky. Boulder, CO: Westview Press. P. 936–944.

Jowell R., Roberts C., Fitzgerald R., Eva G. (eds.). (2007). Measuring attitudes cross-nationally: Lessons from the European Social Survey. Sage Publications Inc.

Kossek E.E., Lewis S., Hammer L.B. (2010). Work–life initiatives and organizational change: Overcoming mixed messages to move from the margin to the mainstream. Human Relation: 63. P. 3-19.

Putnam R.D. (2000). Bowling Alone. The Collapse and Revival of American Community. New York: Simon and Schuster

Rokeach M. (1973). The nature of human values. London: Collier-Macmillan.

Tillmann R. (2020). Measurement of social position in surveys // FORS Guide No. 10, Version 1.0. Lausanne: Swiss Centre of Expertise in the Social Sciences FORS.

Turkle S. (2012). Alone Together. New York: Basic Books.