Проведение выборочных исследований: сбор и анализ данных

РефератПомощь в написанииУзнать стоимостьмоей работы

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной (случайной). Если этот шанс (вероятность) неизвестен, то выборка называется невероятностной (неслучайной). К сожалению, в большинстве социологических исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать… Читать ещё >

Проведение выборочных исследований: сбор и анализ данных (реферат, курсовая, диплом, контрольная)

Основные понятия

Рассмотрим основные понятия, используемые при проведении выборочных исследований.

Прежде всего необходимо получить информацию о параметрах «группы», среди членов которой будет проводиться социологическое исследование. Такая «группа» в статистике называется генеральной совокупностью или просто совокупностью. Иногда совокупность является достаточно малой по своей численности, и исследователь может изучить всех ее членов. Обычно же это сделать невозможно: изучить, например, мнение всех жителей города (крупной организации) относительно определенных событий. Следовательно, проводится изучение только части совокупности, называемой выборкой.

Выборка является базовым уровнем проводимых исследований.

Необходимо отметить, что поскольку выборка является частью изучаемой совокупности, полученные от выборки данные, скорее всего, не будут в точности соответствовать данным, которые можно было бы получить от всех единиц совокупности. Различие между данными, полученными от выборки, и истинными данными называется ошибкой выборки. Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки. Эти вопросы будут рассмотрены ниже.

Формирование выборки прежде всего основывается на знании контура выборки (sampling frame), под которым понимается список всех единиц совокупности, из которого выбираются единицы выборки. Например, если при проведении телефонного опроса в качестве совокупности рассматривать всех жителей города Москвы, то в качестве контура можно рассматривать телефонный справочник, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что не все жители имеют телефоны, многие пользуются мобильными телефонами.

Существуют три главные проблемы формирования выборки.

Прежде всего исходя из сути рассматриваемой задачи необходимо определить, кто является единицей выборки. Например, жители определенного возраста.

Очень важным является также определение контура выборки. Например, список всех домовладельцев определенного региона. И наконец, необходимо решить вопрос об объеме выборки, который определяет число изучаемых единиц выборки. Объем выборки очень редко зависит от размера совокупности. Поэтому объем выборки для одного региона не обязательно существенно меньше объема выборки для государства в целом.

При формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы.

Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной (случайной). Если этот шанс (вероятность) неизвестен, то выборка называется невероятностной (неслучайной). К сожалению, в большинстве социологических исследований из-за невозможности точного определения размера совокупности не представляется возможным точно рассчитать вероятности. Поэтому термин «известная вероятность» скорее основан на использовании определенных методов формирования выборки, чем на знании точных размеров совокупности.

Вероятностные методы включают в свой состав: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и является одинаковой для всех единиц по совокупности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности.

Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел.

При использовании метода формирования выборки вслепую единицы совокупности в соответствии с их фамилиями, названиями или другими признаками вносятся в карточки, которые в перемешанном виде помещаются в какую-то непрозрачную емкость (ящик, коробку и т. п.). Из данной емкости кто-то случайным образом вытягивает число карточек, определяемое объемом выборки.

В таблицах случайных чисел содержатся числа, порядок включения которых в таблицу осуществлен случайным образом. Единицам совокупности присваивают порядковые номера. В таблице случайных чисел выбирается любая начальная точка и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирается необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки.

Использование простого случайного отбора гарантирует, что каждая единица совокупности известна и имеет равные шансы быть включенной в выборку.

Однако, чтобы можно было эти методы использовать, необходимо предварительно определить каждую единицу совокупности, что при больших размерах совокупности сделать достаточно сложно, а порой и невозможно.

Данный недостаток существенно снижается при использовании компьютера для присвоения единицам совокупности номеров и формирования выборки. При телефонном интервью компьютер может генерировать случайным образом телефонные номера: он имеет генератор случайных чисел.

Начальная часть метода систематического отбора соответствует начальной части метода простого случайного отбора: необходимо получить полный список единиц генеральной совокупности.

Однако далее вместо присвоения порядковых номеров используется показатель «интервал скачка», рассчитанный как отношение размера совокупности к объему выборки. Например, если используется телефонный справочник и интервал скачка был определен равным 250, то это означает, что каждый 250-й телефонный номер включается в выборку. Однако для определения начальных страницы и колонки справочника используются случайные числа.

Очевидно, что данный метод является более экономичным и быстрым по сравнению с методом простого случайного отбора. Случайные числа используются только на начальной стадии его реализации.

Однако такой метод дает менее репрезентативные результаты по сравнению с методом простого случайного отбора.

ш Особенно широко метод систематического отбора используется, когда для различных видов совокупностей имеются различные справочники, списки, спецификации и тому подобные материалы.

Другим методом вероятностного отбора является кластерный отбор, основанный наделении совокупности на подгруппы, каждая из которых представляет совокупность в целом. Базовая концепция данного метода очень похожа на базовую концепцию метода систематического отбора, однако реализация этой концепции осуществляется по-другому. Предположим, что исследуется мнение населения какого-то региона относительно какого-то события. Регион разбивается на четко определяемые части (кластеры), например области. Исследователь может считать, что выделенные кластеры являются идентичными и мнение населения этих областей характерно для региона в целом. Далее одна из областей (один кластер) выбирается случайным образом, определяется совокупность для этой области, в ней проводится соответствующее исследование, а выводы обобщаются на совокупность всего региона (одноступенчатый подход).

Формирование выборки можно осуществить и на основе двухступенчатого подхода. В этом случае после первоначального случайного формирования выборки кластеров (в нашем примере случайным образом выбирается несколько областей) используется один из вероятностных методов для проведения исследований среди единиц выборки. Очевидно, что репрезентативность результатов, полученных на основе исследований для группы кластеров, является более высокой, чем для одного кластера. Однако этот подход является более дорогим по сравнению с одноступенчатым подходом.

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик. Говоря другими словами, каждая выборка достаточно полно характеризует всю совокупность, различные крайности в выборке уравновешивают друг друга. Такая ситуация на практике встречается крайне редко. Скажем, исследуется мнение жителей определенного региона относительно какой-то социальной проблемы. Население больших, средних и малых городов, сельской местности данного региона отличается по уровню образования, доходу, образу жизни и т. п.

В случае несимметричного распределения совокупности последняя разделяется на различные подгруппы (страты), например, по уровню доходов, образования, и выборки формируются из этих подгрупп. Такой метод носит название стратифицированного отбора.

При использовании данного метода прежде всего следует выбрать некоторую наблюдаемую характеристику (признак), характеризующую каждую единицу совокупности, например, уровень дохода.

Далее для каждой страты с помощью случайного отбора формируется выборка.

Если размер выборки для определенной страты пропорционален размеру страты по отношению всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимо использовать весовые коэффициенты, уравновешивающие размеры страт.

При применении невероятностных методов отбора формирование выборки осуществляется без использования понятий теории вероятностей, вследствие чего невозможно рассчитать вероятность включения в выборку единицы совокупности.

Кратко охарактеризуем следующие невероятностные методы отбора: отбор на основе принципа удобства, отбор на основе суждений, формирование выборки в процессе обследования и формирование выборки на основе квот.

Смысл метода отбора на основе принципа удобства заключается в том, что формирование выборки осуществляется самым удобным с позиций исследователя образом, например с позиций минимальных затрат времени и усилий, с позиции доступности респондентов. Выбор места исследования и состава выборки производится субъективным образом, например, опрос жителей осуществляется на улице, ближайшей к месту жительства исследователя. Очевидно, что многие представители совокупности не принимают участия в опросе.

Данный метод скорее применяется для поиска респондентов с заданными характеристиками. Например, в универсаме путем первоначального задания вопросов выявляется, что собой представляют опрашиваемые, и только некоторые из их числа подвергаются дальнейшему обследованию. Данный метод является дешевым и простым.

Отбор на основе суждения основано на использовании мнения квалифицированных специалистов, экспертов относительно состава выборки. На основе такого подхода часто формируется состав фокусгруппы, участники которой подбираются исходя из определенных требований, сформированных исследователями. Результаты работы фокусгруппы могут служить основой для крупномасштабных региональных опросов, проведенных на основе вероятностных методов.

Формирование выборки в процессе опроса основано на расширении числа опрашиваемых на основе предложений респондентов, которые уже приняли участие в обследовании. Первоначально исследователь формирует выборку намного меньшую, чем требуется в проводимом исследовании, затем она по мере проведения обследования расширяется. Данный метод применяется там, где контуры выборки являются очень ограниченными.

Формирование выборки на основе квот (квотный отбор) предполагает предварительное, исходя из целей исследования, определение численности групп респондентов, отвечающих определенным требованиям (признакам). Например, в целях исследования было принято решение, что на улице должно быть опрошено пятьдесят мужчин и пятьдесят женщин. Интервьюер проводит опрос, пока не выберет установленную пз квоту. Такой метод обычно применяется в случае, когда имеется четкое суждение о характеристиках респондентов, мнение которых целесообразно изучить в проводимом исследовании. Он дает возможность контролировать деятельность интервьюеров, ограничивая выбор респондентов определенными требованиями.

На практике имеет место параллельное использование нескольких методов формирования выборки. Например, формирование выборки для оценки мнения населения России относительно какого-либо события может осуществляться по следующей схеме [5]:

1. Россия согласно ее административно-территориальному делению делится на 89 субъектов Федерации.
2. Осуществляется случайным образом выбор девяти субъектов (исключая Москву и С.-Петербург).
3. Все населенные пункты (исключая Москву и С.-Петербург) в зависимости от численности населения делятся на пять групп: до 1000 жителей, от 1000 до 10 000 (поселки), от 10 000 до 100 000, от 100 000 до 500 000, свыше 500 000 (города). Москва и С.-Петербург исследуются отдельно.
4. На основе квотного метода устанавливается, что для каждого из девяти выбранных субъектов Федерации исследуется три города и два поселка (по крайней мере, по одному населенному пункту из этих двух типов поселков и трех типов городов должно принадлежать каждой категории). Для этого берется каждый пятый населенный пункт из справочника Госкомстата по результатам последней переписи населения России и определяется, в какую из категорий он попадет (систематический отбор). Так поступают до тех пор, пока не наберется нужное количество населенных пунктов.

Если, дойдя до конца списка, не будет найдено квотное число населенных пунктов, процесс выбора населенных пунктов начинается сначала, но берется каждый четвертый населенный пункт и так далее.

5. Выбирается случайным образом в каждом выбранном городе и поселке по меньшей мере 20 респондентов.

Таким образом, кроме Москвы и С.-Петербурга должно быть проинтервьюировано 900 респондентов. В Москве и С.-Петербурге опрашивается по 50 респондентов. В итоге должно быть проинтервьюировано 1000 респондентов.

Показать весь текст

Заполнить форму текущей работой