Помощь в учёбе, очень быстро...
Работаем вместе до победы

Совокупности данных и их исследование

РефератПомощь в написанииУзнать стоимостьмоей работы

Первая из этих характеристик называется объемом выборки (п) и представляет собой количество наблюдений, вошедших в выборку. Разность между самым большим значением, входящим в выборку, и самым маленьким дает размах выборки: Все средние величины зависят от размаха и объема выборки и в случае значительного размаха могут неадекватно характеризовать совокупность. В этом случае для характеристики… Читать ещё >

Совокупности данных и их исследование (реферат, курсовая, диплом, контрольная)

Развитие земельно-имущественных отношений характеризуется множеством событий, процессов и явлений. Если объединить все подобные элементы, схожие друг с другом по какому-то признаку, то получим генеральную совокупность. Для статистического анализа и последующего прогнозирования в большинстве случаев нет возможности использовать все наблюдения, составляющие эту совокупность, следовательно, исследуют ее на основе анализа части данных, называемых выборкой.

Выборочная совокупность (выборка) — это группа случайно отобранных членов генеральной совокупности.

Для повышения качества прогнозирования необходимо тщательно отбирать представителей, образующих выборку. Главное требование к выборке — репрезентативность.

Репрезентативность — это способность выборки отражать свойства генеральной совокупности.

Применяют два метода образования выборки: повторный и бесповторный. В бесповторном методе наблюдение, отобранное в выборку, не возвращается в генеральную совокупность при следующих этапах отбора. При применении повторного метода отобранный представитель генеральной совокупности после описания и обследования перед следующим отбором возвращается в генеральную совокупность.

Независимо от применяемого метода формирования выборки ее репрезентативность достигается при следовании двум условиям:

  • 1) отбор членов выборки должен проводиться случайно;
  • 2) размер выборки должен быть достаточным.

При случайном отборе представителей выборки каждый член генеральной совокупности имеет шансы попасть в выборку, следовательно, выборка будет нести в себе тот же набор свойств, что и генеральная совокупность. Но это работает при однородности генеральной совокупности. Если она неоднородная, то ее сначала делят на однородные группы, из которых случайным образом набирают выборку.

Чем больше выборка, тем больше вероятность, что она будет качественно отражать все свойства генеральной совокупности и, следовательно, выводы сделанные в отношении выборки, будут справедливы и для генеральной совокупности.

Даже уменьшая объем исследуемых данных переходом к выборке, мы все равно имеем дело со значительным набором данных, который сложно окинуть одним взглядом. Поэтому выборки обычно характеризуют небольшим набором значений, называемых описательными характеристиками.

Первая из этих характеристик называется объемом выборки (п) и представляет собой количество наблюдений, вошедших в выборку. Разность между самым большим значением, входящим в выборку, и самым маленьким дает размах выборки:

Средняя величина выборки есть общая характеристика совокупности по количественному признаку. Размер средней величины выборки характеризует уровень признака, относимый ко всей выборке1.

Средняя величина выборки есть общая характеристика совокупности по количественному признаку. Размер средней величины выборки характеризует уровень признака, относимый ко всей выборке1

Средние величины бывают четырех видов: простая средняя арифметическая, средневзвешенная арифметическая, средняя гармоническая и средневзвешенная гармоническая.

Средняя арифметическая рассчитывается делением суммы всех значений выборки на их количество:

Совокупности данных и их исследование.

где X — средняя арифметическая; X, — i-e выборочное значение; п — объем выборки.

При расчете данной величины все значения выборки равноправны. С помощью средней арифметической можно, например, рассчитать среднюю площадь крестьянско-фермерского хозяйства в районе.

Средневзвешенная арифметическая учитывает важность или частоту распространения каждого значения. Для этого значения выборки умножаются на их веса:

Совокупности данных и их исследование.

где Хвз — средняя взвешенная арифметическая; Р, — вес г-го значения.

Средневзвешенную целесообразно применять, например, при расчете средней цены земельных участков из выборки совершенных за месяц сделок. Из-за отличий участков по площади вычисление простой средней арифметической может дать искаженный результат. В этом случае целесообразно вычислить средневзвешенную.

Средняя гармоническая вычисляется как величина обратная средней арифметической и рассчитывается из обратных значений выборки:

Средняя взвешенная гармоническая также учитывает вес или частоту каждого значения:

Средняя взвешенная гармоническая также учитывает вес или частоту каждого значения:

Совокупности данных и их исследование.

Все средние величины зависят от размаха и объема выборки и в случае значительного размаха могут неадекватно характеризовать совокупность. В этом случае для характеристики середины выборки используют медиану и моду.

Медиана — это значение, находящееся в середине упорядоченной совокупности.

Например, если пять муниципальных районов расставить в порядке возрастания их площади, то площадь третьего района будет медианой данной выборки.

Модой называют наиболее часто встречающееся значение исследуемого показателя в выборке. Так, если из 10 случаев отказов в постановке объекта недвижимости на государственный кадастровый учет 5 отказов совершены по причине предоставления неполного пакета документов, то это и будет модальной причиной отказа.

Кроме средних показателей выборки важные характеристики совокупности дает набор вариативных описательных показателей: относительный размах выборки, относительное линейное отклонение, среднее отклонение, дисперсия и коэффициент вариации.

Абсолютный размах выборки был рассмотрен ранее, а его относительная интерпретация позволяет оценить, какую он составляет долю от среднего уровня выборки:

Среднее линейное отклонение показывает среднюю разницу между значениями выборки и средней величиной:

Среднее линейное отклонение показывает среднюю разницу между значениями выборки и средней величиной:

Совокупности данных и их исследование.

С помощью отношения среднего линейного отклонения к средней величине можно рассчитать коэффициент линейного отклонения, или относительное линейное отклонение:

Совокупности данных и их исследование.

Кроме данных отклонений также используют среднее квадратическое отклонение, являющееся абсолютной мерой колеблемости значений выборки:

Дисперсией выборки называют квадрат среднеквадратического отклонения:

Дисперсией выборки называют квадрат среднеквадратического отклонения:

Коэффициент вариации показывает однородность выборки. Также этот показатель используют для оценки доли, которую составляет среднеквадратичное отклонение от средней величины:

Коэффициент вариации показывает однородность выборки. Также этот показатель используют для оценки доли, которую составляет среднеквадратичное отклонение от средней величины:

Совокупности данных и их исследование.

Пример 2.2.

Аналитик Дмитрий Обухов собрал данные о сделках аренды земельных участков за последний год и свел их в табл. 2.6.

Таблица 2.6

Сделки аренды земельных участков.

Вид объекта недвижимости

Площадь, м2

Удельная цена сделки/ предложения, руб/м2

Земельный участок 1.

1554,00.

6464,61.

Земельный участок 2.

4801,00.

12,46.

Земельный участок 3.

800,00.

1,25.

Вид объекта недвижимости

Площадь, м2

Удельная цена сделки/ предложения, руб/м2

Земельный участок 4.

20,00.

440,49.

Земельный участок 5.

2208,00.

3,99.

Земельный участок 6.

887,00.

139,40.

По собранным материалам Обухов рассчитал основные показатели, характеризующие выборку (табл. 2.7).

Основные статистические характеристики выборки.

Таблица 2.7

Показатель

Значение

Объем выборки, ед.

Размах выборки, руб/м2

6325,21.

Среднее арифметическое, руб/м2

1177,03.

Среднее взвешенное, руб/м2

997,87.

Относительный размах выборки, %.

Среднее линейное отклонение, руб/м2

1762,53.

Коэффициент линейного отклонения, %.

Среднеквадратическое отклонение, руб/м2

Дисперсия, руб/м2

6 738 475.

Коэффициент вариации выборки, %.

На основе расчетов, произведенных в табл. 2.7, аналитик сделал следующие выводы:

  • 1) собранная выборка очень неоднородна: ее размах почти равен ее максимальному значению и в 5 раз больше среднеарифметической цены участка. Высокий коэффициент вариации подтверждает тезис о неоднородности;
  • 2) в среднем цена каждого участка колеблется относительно среднего на 2596 руб/м2;
  • 3) участки с небольшими площадями во много раз дороже больших участков, что делает средневзвешенное значение более приемлемым в практическом использовании при условии выбора площади участка в качестве веса;
  • 4) использование данной выборки для практических расчетов чревато большими ошибками и неверно сделанными выводами. Для дальнейшей работы рекомендуется исключить из выборки земельный участок 1, улучшив тем самым показатели однородности. В этом случае коэффициент вариации снизится до 158%, а СКО до 189 руб/м2.
Показать весь текст
Заполнить форму текущей работой