Документ опубликован на сайте www.fom.ru
http://bd.fom.ru/report/cat/sci_sci/sotsiologiya/penta




Описание выборки еженедельных всероссийских опросов населения

20.11.2003 [report] [ Методология ]




Содержание

1. Исследуемая совокупность
2. Конструкция выборки

  • 2.1. Особенности конструкции выборки
  • 2.2. Первая ступень отбора
  • 2.3. Вторая ступень отбора
  • 2.4. Третья ступень отбора
  • 2.5. Отбор респондента в домохозяйстве
  • 2.6. Общие параметры выборки


  • 1. Исследуемая совокупность
    Исследуемой совокупностью является городское и сельское население Российской Федерации в возрасте от 18 лет и старше.
    Из исследуемой совокупности исключено население Чеченской Республики – из-за невозможности проведения опросов в этом регионе. Также в исследуемую совокупность не входят люди, не имеющие определенного места жительства в России (поскольку основой для отбора служат домохозяйства, и опросы всегда проводятся по месту жительства респондентов).
    Самостоятельным объектом исследования является взрослое население Москвы. Поэтому в Москве выборка имеет "флюс".

    2. Конструкция выборки
    Используется многоступенчатая стратифицированная территориальная случайная выборка.

    2.1. Особенности конструкции выборки
    Конструкция выборки имеет две особенности.
    Первая особенность заключается в том, что выборка состоит из двух половин, каждая из которых репрезентирует население России и может использоваться независимо. При небольшом числе опрашиваемых (до 1500 человек) целесообразно использовать одну из половинных выборок. При числе опрашиваемых 2000 человек и больше лучше использовать полную выборку.
    Фонд "Общественное мнение" использует преимущества такой конструкции выборки следующим образом. Еженедельные общероссийские опросы населения проводятся поочередно по одной из половинных выборок: в четные недели опрос проводится по одной половинной выборке, в нечетные – по другой. При этом часть вопросов анкеты повторяется в двух опросах подряд. В результате каждую неделю имеются репрезентативные данные по всей России, а для повторяющихся вопросов имеются более точные оценки по результатам опросов двух последних недель, что соответствует полной выборке. При этом интервьюеры во всех точках выборки имеют одинаковую постоянную нагрузку. Кроме этого, такая конструкция выборки при необходимости позволяет проводить два опроса в неделю – каждый по своей части выборки. При этом нагрузка на интервьюеров не является чрезмерной, т.к. каждая точка выборки участвует только в одном опросе.
    Второй особенностью выборки является опрос дополнительного числа респондентов в Москве – так называемый "флюс". Планируемый размер выборки для России составляет 1500 человек, из которых на Москву приходится всего 86. Чтобы можно было отдельно анализировать данные по Москве, размер выборки здесь увеличен до 600 человек. В итоге общий планируемый размер выборки составляет 2014 человек. Непропорциональность в распределении выборки при анализе компенсируется весовыми коэффициентами.

    2.2. Первая ступень отбора
    Единицами отбора первой ступени являются административные районы (а также города республиканского, краевого, областного и окружного подчинения, не относящие к территории ни одного из районов, т.е. расположенные на границе двух или более районов (В дальнейшем для простоты такие города тоже будут называться районами.)).
    Административные районы сгруппированы в страты (Теория выборки предъявляет к стратам следующие требования: они должны быть по возможности однородными (т.е. состоять из похожих районов) и не сильно различаться по численности населения.). Страты формируются в границах экономико-географических регионов (Во время проектирования выборки еще не существовало деления России на Федеральные округа.) России, т.е. в каждую страту входят административные районы только одного региона. Для Калининградской области, не входящей ни в один из 11 экономико-географических регионов, сформирована отдельная страта.
    В качестве стратообразующих используются следующие признаки, характеризующие административные районы:

  • географическое положение,
  • доля городского населения в районе или наличие в нем центра субъекта Федерации или крупных городов,
  • плотность населения,
  • национальный состав населения,
  • принадлежность районов одному субъекту Федерации или субъектам Федерации одного типа (областям и краям или национальным республикам и округам).


  • В каждом экономико-географическом регионе при стратификации используется свой набор из двух–трех перечисленных выше признаков, наиболее значимых для этого региона. В страту объединяются районы, схожие друг с другом по этим признакам.
    Всего сформировано 98 страт. Две страты значительно превосходят остальные по численности населения: Москва (8389,7 тыс. человек) и Санкт-Петербург (4728,2 тыс. человек). Одна страта, состоящая только из районов Калининградской области, имеет наименьшую численность населения (951,4 тыс. человек). Численность населения остальных страт различается незначительно – она варьируется от 1063,5 до 1681,5 тысяч человек. Средний размер этих страт равен 1387,8 тыс. человек, т.е. отклонения в размерах страт от среднего не превышают 23,5%.
    Из 98 страт 9 состоят только из одного района. Это либо район с крупным областным центром, либо просто крупный областной центр. Эти 9 страт являются саморепрезентирующими, в них на первой ступени отбор не проводится. Каждый район (город), образующий саморепрезентирующую страту, входит в выборку с вероятностью единица и представляет в ней только сам себя. В число саморепрезентирующих страт входят два крупнейших города России – Москва и Санкт-Петербург.
    В каждой из остальных несаморепрезентирующих 89 страт отбирается по одному административному району, который представляет в выборке все районы своей страты. Отбор проводится с вероятностью, пропорциональной численности населения районов (Использовались данные Госкомстата России на 1 января 1999 года.).
    Таким образом, в выборку входят 98 административных районов (или городов республиканского, краевого, областного и окружного подчинения).
    При разбиении полной выборки на две половины Москва и Санкт-Петербург были включены в каждую из этих половин, т.к. без этих городов невозможно репрезентировать Россию. Остальные 96 страт были распределены поровну. Таким образом, в каждую из половинных выборок входят по 50 районов.
    Общий размер выборки распределяется между стратами пропорционально численности населения в стратах. Исключение составляет Москва, в которой размер выборки непропорционально увеличен и равен 600 респондентам.

    2.3. Вторая ступень отбора
    Единицами отбора второй ступени являются избирательные участки. В каждом административном районе, выбранном на первой ступени, отбирается по 3 избирательных участка. Исключение составляют Москва и Санкт-Петербург, где отбирается 40 и 10 избирательных участков соответственно. Отбор участков проводится с вероятностью, пропорциональной размеру участка.
    Размер участка измеряется числом домохозяйств, расположенных на его территории. Поскольку официальные данные о числе домохозяйств на участке отсутствуют, оно рассчитывается на основе имеющейся информации об участке. Для городов применяется один из двух способов расчета, в зависимости от имеющейся информации.

    I. Если известно число избирателей на участке, то число домохозяйств на участке рассчитывается так:

    число домохозяйств = (численность населения города/число избирателей в городе)*(число избирателей на участке/средний размер домохозяйства)

    II. Если число избирателей на участке неизвестно, то применялась следующая формула:

    число домохозяйств = численность населения города/(число участков в городе * средний размер домохозяйства)

    В крупных городах, имеющих внутреннее деление на городские районы или округа, расчет проводится отдельно по районам или округам.
    В сельских населенных пунктах, для которых известна численность населения и число участков, число домохозяйств на участке вычисляется теми же двумя способами. Если же данные по отдельным сельским населенным пунктам отсутствуют, то расчеты проводятся сразу для всего сельского населения района (это равносильно отбору сельских участков с равной вероятностью).
    При расчетах использовались следующие источники данных. Численность населения городских населенных пунктов (а также городских районов и округов) была взята из ежегодного бюллетеня Госкомстата России. В расчетах использовались данные на 1 января 1999 г., т.к. во время построения выборки данные за 2000 год еще не были опубликованы. Число избирателей на участке, в городе или в районе, а также число избирательных участков в городе или в районе было взято из постановлений городских, районных, областных, краевых или республиканских администраций с описаниями избирательных участков по выборам Президента РФ (март 2000 г.) или депутатов Государственной Думы (декабрь 1999 г.). Средний размер домохозяйств по субъектам РФ был взят из справочника Госкомстата России с результатами последней микропереписи населения (1994 г.) (Данными о среднем размере домохозяйств по отдельным городам или районам мы не располагаем.).
    Отбор избирательных участков (с вероятностью, пропорциональной размеру участка) реализуется методом систематического отбора. При этом используется неявная стратификация. Перед началом отбора участки каждого административного района упорядочиваются следующим образом. Сначала идут избирательные участки городов – причем города, если в районе их несколько, располагаются в порядке убывания численности населения. Затем идут сельские избирательные участки. Сельские участки, а также участки внутри городов размещаются в порядке их географического расположения, т.е. участки, граничащие друг с другом на местности, в списке тоже находятся рядом (нумерация участков, как правило, соответствует такому порядку). Таким образом, при систематическом отборе обеспечивается относительно равномерное распределение попавших в выборку участков по всей территории административного района, а также между городами с различной численностью населения и селами.
    В результате отобрано и включено в выборку 378 избирательных участков из 202 населенных пунктов (в том числе 80 участков – в Москве).
    В еженедельных общероссийских опросах, которые проводятся по половинной выборке, задействованы 189 избирательных участков из 102 населенных пунктов (в том числе 40 – в Москве).
    Планируемый размер выборки, приходящийся на административный район, распределяется поровну между всеми отобранными избирательными участками района. На одном избирательном участке опрашивается от 8 до 11 человек – в зависимости от района. Исключение составляет Москва, где на каждом участке опрашивается по 15 человек.

    2.4. Третья ступень отбора
    Единицами отбора третьей ступени являются домохозяйства. Отбор домохозяйств на избирательном участке проводится случайным маршрутным методом. Он состоит в том, что интервьюер последовательно обходит домохозяйства, расположенные на территории участка, и отбирает определенные домохозяйства для проведения опроса, выдерживая при отборе заданный интервал (шаг отбора). Таким образом, маршрутный метод реализует процедуру случайного систематического отбора. Особенность метода состоит в том, что список домохозяйств не составляется заранее, а формируется интервьюером непосредственно в ходе опроса.
    Применение маршрутного метода в условиях проведения регулярных опросов (всероссийские опросы проводятся каждую неделю) во многом упрощается. Становится не столь принципиальным выбор начальной точки маршрута и последовательность обхода домохозяйств на участке. При проведении одного опроса интервьюер обходит только малую часть домохозяйств участка. В следующем опросе он продолжает обход с того места, где остановился в прошлый раз. И так продолжается до тех пор, пока все домохозяйства избирательного участка не будут включены в маршрут. После завершения работы на одном участке отбирается новый (повторяется вторая ступень отбора), и интервьюер переходит туда. Обычно интервьюер работает на одном участке от трех до шести месяцев.
    Поскольку интервьюер в ходе нескольких опросов обходит все домохозяйства участка, каждое из них имеет шанс войти в выборку одного из опросов.

    Последовательность обхода домохозяйств
    Порядок обхода домохозяйств зависит от описания избирательного участка и регламентируется специальной инструкцией. В описаниях избирательных участков крупных городов перечислены, как правило, названия всех улиц и номера всех домов, входящих в участок. В этом случае интервьюер обходит дома в том же порядке, в каком они указаны в описании. Обход квартир одного дома происходит в порядке возрастания их номеров, а если номера квартир отсутствуют, то интервьюер движется слева направо и снизу вверх.
    Если вся улица расположена на территории одного участка, то номера домов по этой улице в описании участка могут отсутствовать. В этом случае интервьюер движется от начала улицы – сперва по одной ее стороне, затем по другой. При этом он старается не пропустить ни одного дома, включая и дома, расположенные в глубине застройки.
    Если в описании участка названия улиц не указаны (это бывает, когда населенный пункт входит в участок целиком), интервьюер должен составить список улиц самостоятельно. Он может сначала внести в список только часть улиц населенного пункта (или одну улицу), а потом по мере проведения опроса пополнять свои записи. Составленный интервьюером список улиц передается руководителю опроса вместе с анкетами. Если в населенном пункте остались улицы, не внесенные в данный список, это должно быть отмечено особо.
    Избирательные участки, в которых не указаны названия улиц, наиболее сложны для построения случайного маршрута. Здесь порядок обхода участка выбирается самим интервьюером. Однако это обстоятельство не имеет принципиального значения, т.к. в ходе нескольких последовательных всероссийских опросов все улицы и домохозяйства участка должны быть пройдены интервьюером, а значит, все они имеют ненулевую вероятность войти в выборку одного из опросов.

    Шаг отбора домохозяйств
    При применении маршрутного метода домохозяйства отбираются не подряд, а с некоторым интервалом, называемым шагом отбора. От величины шага отбора зависит, насколько территориально удалены друг от друга домохозяйства, в которых проводился опрос. В близко расположенных домохозяйствах возрастает вероятность получения похожих ответов на вопросы анкеты, т.к. респонденты живут в похожих условиях, могут работать на одном предприятии или принадлежать к одной социальной группе (например, дома, заселенные преимущественно сотрудниками одного предприятия, или элитные дома). Схожесть ответов респондентов, вызванная особенностью построения выборки, увеличивает статистическую погрешность выборки (за счет увеличения дизайн-эффекта).
    Увеличение шага отбора уменьшает взаимную корреляцию ответов респондентов, но усложняет работу интервьюера. В еженедельных всероссийских опросах Фонда "Общественное мнение" применяется переменный шаг отбора, который зависит от числа домохозяйств (квартир) в доме. Зависимость величины шага от числа квартир представлена в таблице.

    Количество домохозяйств (квартир) в доме
    Шаг отбора
    1 – 10
    2
    11 – 25
    5
    26 – 50
    10
    51 и более
    20


    Правила применения шага отбора подробно изложены в инструкции интервьюеру. Соответствующее шагу отбора число домохозяйств отсчитывается только после успешно проведенного интервью. Если же в отобранном домохозяйстве никого не застали дома или получен отказ, то интервьюер обращается в соседнюю (следующую по порядку) квартиру. Таким образом, интервал между домохозяйствами, в которых проведено интервью, либо равен шагу отбора, либо на несколько домохозяйств больше. Величина шага подобрана так, чтобы в одном доме нельзя было провести более пяти интервью (за исключением больших домов с числом квартир более 100).
    Применение переменного шага отбора приводит к отклонениям от равной вероятности отбора домохозяйств. Домохозяйства из малоквартирных домов или из районов индивидуальной застройки получают больший шанс попасть в выборку. Но на практике эти отклонения бывают не очень существенными, т.к. на одном участке часто попадаются дома однотипной застройки.

    Выбор начальной точки маршрута
    Когда интервьюер впервые приходит на избирательный участок, для него начальной точкой маршрута служит первый дом из описания участка. При повторных опросах на участке начальной точкой маршрута служит домохозяйство, где было проведено последнее интервью предыдущего опроса. Именно к этому домохозяйству добавляется шаг отбора. Поскольку величина шага отбора меняется в зависимости от числа домохозяйств в доме, а в случае недостижимости респондентов шаг отбора становится равным единице, практически каждое домохозяйство участка получает шанс попасть в выборку.

    2.5. Отбор респондента в домохозяйстве
    В домохозяйстве отбирается один респондент для взятия интервью. Отбор респондента проводится в соответствии с заданными квотами. Применяется связная квота по полу и возрасту и отдельная квота по уровню образования (высшее или нет).
    Применение квот при отборе респондентов вызвано следующими причинами. При еженедельном цикле проведения всероссийских опросов населения на полевой этап исследования отводится всего два дня. За это время не удается организовать полноценных повторных посещений тех респондентов, которые оказались недостижимыми при первом посещении. Особенные сложности с повторными посещениями возникают в удаленных точках, куда интервьюеры вынуждены выезжать. В этих условиях недостижимость достигает в среднем 50%, а возникающие из-за этого смещения выборки в сторону увеличения доли людей пенсионного возраста, а также доли женщин становятся систематическими.
    Таким образом, применение квот на последнем этапе отбора является во многом вынужденной мерой при имеющихся временных, а также финансовых ограничениях. Тем не менее, на практике эта мера привела ко вполне приемлемым результатам. Основным негативным моментом применения квот является отступление от принципов построения вероятностной выборки.

    2.6. Общие параметры выборки
    Полная всероссийская выборка включает 203 городских и сельских населенных пункта из 63 субъектов Российской Федерации. В выборку входит 378 избирательных участка (в том числе 80 избирательных участков Москвы). Общий размер выборки составляет 4028 человек. Из них 3000 человек представляют пропорциональную всероссийскую выборку (в том числе 172 человека приходится на Москву), а 1028 человек составляют дополнительную выборку для Москвы. В итоге суммарная выборка для Москвы составляет 1200 человек.
    Полная выборка состоит из двух частей, половинных выборок. Каждая половинная выборка самостоятельно репрезентирует население России. Еженедельные всероссийские опросы населения проводятся поочередно по одной из половинных выборок. В каждую половинную выборку входят Москва и Санкт-Петербург, являющиеся отдельными субъектами Российской Федерации. Кроме того, в первую половинную выборку входит 102 населенных пункта из 42 субъектов РФ, а во вторую половинную выборку – 98 населенных пунктов из 44 субъектов РФ. Каждая из половинных выборок включает по 189 избирательных участков, из которых 40 избирательных участков приходится на Москву.
    Планируемый размер половинной выборки составляет 2014 человек. Из них 1500 человек представляют пропорциональную всероссийскую выборку (в том числе 86 человек приходится на Москву), а 514 – дополнительную выборку для Москвы. В итоге суммарная половинная выборка для Москвы составляет 600 человек.
    На каждом избирательном участке, за исключением Москвы, опрашивается от 8 до 11 человек. В Москве на каждом избирательном участке опрашивается по 15 человек. Это соотношение выдерживается и для полной, и для половинной выборки.

    Список точек всероссийского еженедельного опроса