Помощь в учёбе, очень быстро...
Работаем вместе до победы

Ввод в действие жилых домов на 1000 человек населения за 2003 год

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Где fi — эмпирические абсолютные частоты (Observed Frequency); Где — значение признака у i-й единицы совокупности; Standard (Standard error) средняя (стандартная) ошибка выборки: Формулы полученных статистических характеристик: Valid N объем выборки (число единиц в совокупности). Std.err. (Standardized skewness) стандартизованная асимметрия: Std.err. (Standardized kurtosis) стандартизованный… Читать ещё >

Содержание

  • Введение
  • 1. Постановка задачи
  • 2. Ввод данных
  • 3. Анализ эмпирического распределения
    • 3. 1. Графическое и табличное представление вариационного ряда распределения
    • 3. 2. Расчет основных характеристик вариационного ряда
    • 3. 3. Сглаживание эмпирического распределения, проверка гипотезы о законе распределения
  • 4. Выборочное наблюдение
    • 4. 1. Определение объема выборки
  • Формирование выборочной совокупности
    • 4. 2. Статистическая обработка результатов выборочного наблюдения
    • 4. 3. Проверка статистических гипотез о значении генеральной средней и о равенстве двух генеральных средних
    • 4. 4. Графическое представление результатов выборочного наблюдения
  • Заключение
  • Список использованных источников

Статистические ряды распределения являются одним из наиболее важных элементов статистического анализа данных. Они представляют собой составную часть метода статистических сводок и группировок, ни одно из статистических исследований невозможно провести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения/

Статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном, рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализа информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: коэффициенты; абсолютные, относительные, средние величины и т. д., с помощью которых можно проводить статистический анализ изучаемых процессов и явлений [3].

Статистические ряды распределения характеризуют состав наблюдаемой совокупности, позволяют судить о ее однородности, структуре, закономерностях распределения, позволяют осуществить прогнозирование изучаемых процессов и явлений.

Таким образом, статистические ряды распределения являются базисным методом для любого статистичского анализа.

Статистический ряд может быть представлен в виде таблицы, в одной графе которой указываются варианты или интервалы, а в другой соответствующие им частоты.

Первым этапом изучения вариационного ряда является его графическое изображение. Дискретный вариационный ряд изображается в виде так называемого полигона распределения частот, являющегося разновидностью статистических ломаных. Для изображения интервального ряда применяются полигон распределения частот и гистограмма частот.

Средняя величина это обобщающий показатель, характеризующий типический уровень явления. В качестве структурных средних чаще всего используют показатели моды наиболее часто повторяющегося значения признака и медианы величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой не меньше его.

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т. е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов. Наиболее простым является расчет показателя размаха вариации R как разницы между максимальным (Xmax) и минимальным (Xmin) наблюдаемыми значениями признака. Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Дисперсия признака определяется на основе квадратической степенной средней. Показатель, равный, называется средним квадратическим отклонением.

1. Постановка задачи

Целью данной работы является статистический анализ данных, содержащих сведения о вводе в действие жилых домов на 1000 человек населения в 2003 году. Данные размещены на официальном сайте Государственной службы статистики [6]. Требуется охарактеризовать состав наблюдаемой совокупности, сделать вывод о ее однородности, структуре, закномерностях распределения, используя различные методы статистического анализа данных.

Табл. 1.1

Ввод в действие жилых домов на 1000 человек населения в 2003 году

(квадратных метров общей площади)

Российская Федерация 252

Центральный федеральный округ 351

Белгородская область 444

Брянская область 162

Владимирская область 185

Воронежская область 317

Ивановская область 105

Калужская область 210

Костромская область 144

Курская область 226

Липецкая область 288

Московская область 622

Орловская область 280

Рязанская область 217

Смоленская область 250

Тамбовская область 222

Тверская область 201

Тульская область 135

Ярославская область 158

г. Москва 428

Северо-Западный федеральный округ 234

Республика Карелия 117

Республика Коми 158

Архангельская область 71

в том числе Ненецкий автономный округ 227

Вологодская область 196

Калининградская область 244

Ленинградская область 267

Мурманская область 15

Новгородская область 159

Псковская область 151

г. Санкт-Петербург 379

Южный федеральный округ 231

Республика Адыгея 130

Республика Дагестан 201

Республика Ингушетия (1990 г. ;

включая Чеченскую Республику) 42

Кабардино-Балкарская Республика 238

Республика Калмыкия 172

Карачаево-Черкесская Республика 156

Республика Северная Осетия ;

Алания 192

Чеченская Республика (1990 г. ;

включая Республику Ингушетия) ;

Краснодарский край 309

Ставропольский край 232

Астраханская область 580

Волгоградская область 153

Ростовская область 229

Приволжский федеральный округ 245

Республика Башкортостан 358

Республика Марий Эл 203

Республика Мордовия 174

Республика Татарстан 414

Удмуртская Республика 201

Чувашская Республика 415

Пермский край 148

Кировская область 108

Нижегородская область 165

Оренбургская область 240

Пензенская область 163

Самарская область 263

Саратовская область 179

Ульяновская область 133

Уральский федеральный округ 228

Курганская область 101

Свердловская область 174

Тюменская область 363

в том числе:

Ханты-Мансийский автономный округ — Югра 403

Ямало-Ненецкий автономный округ 249

Челябинская область 206

Сибирский федеральный округ 164

Республика Алтай 113

Республика Бурятия 188

еспублика Тыва 65

Республика Хакасия 183

Алтайский край 162

Красноярский край 195

в том числе:

Таймырский (Долгано;

Ненецкий) автономный округ 175

Эвенкийский автономный округ 420

Иркутская область 84

в том числе Усть-Ордынский

Бурятский автономный округ 22

Кемеровская область 178

Новосибирская область 211

Омская область 154

Томская область 226

Читинская область 89

в том числе Агинский Бурятский автономный округ 128

Дальневосточный федеральный округ 122

Республика Саха (Якутия) 276

Приморский край 105

Хабаровский край 98

Амурская область 116

Камчатская область 35

в том числе Корякский автономный округ ;

Магаданская область 39

Сахалинская область 79

Еврейская автономная область 55

Чукотский автономный округ 373

2. Ввод данных

Поскольку это одномерный массив данных, число переменных (признаков) равно единице, число наблюдений 77. Города Москва и С-Петербург исключены как очевидные выбросы, по Корякскому автономному округу и по Чеченской республике данных нет. В целях обеспечения однородности выборки убираем из рассмотрения регионы, входящие в более крупные административные образования (например, Таймырский автономный округ, входящий в Красноярский край). Исходные данные помещены в рабочую книгу с именем Workbook3. stw, под именем Var1.

Создаем рабочую книгу и вводим данные:

Рис

2.1 Ввод данных

Копируем данные в MS Excel и редактируем таблицу, чтобы она лучше читалась:

Табл. 2.1

Номер региона Ввод в действие жилых домов на 1000 человек населения в 2003 году Номер региона Ввод в действие жилых домов на 1000 человек населения в 2003 году Номер региона Ввод в действие жилых домов на 1000 человек населения в 2003 году Номер региона Ввод в действие жилых домов на 1000 человек населения в 2003 году

1 444 21 196 41 174 61 162

2 162 22 244 42 414 62 195

3 185 23 267 43 201 63 84

4 317 24 15 44 415 64 178

5 105 25 159 45 148 65 211

6 210 26 151 46 108 66 154

7 144 27 130 47 165 67 226

8 226 28 201 48 240 68 89

9 288 29 42 49 163 69 276

10 622 30 238 50 263 70 105

11 280 31 172 51 179 71 98

12 217 32 156 52 133 72 116

13 250 33 192 53 101 73 35

14 222 34 309 54 174 74 39

15 201 35 232 55 363 75 79

16 135 36 580 56 206 76 55

17 158 37 153 57 113 77 373

18 117 38 229 58 188

19 158 39 358 59 65

20 71 40 203 60 183

3. Анализ эмпирического распределения

Анализ распределений направлен на выявление закономерност изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности.

Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные. Учитывая то, что для дальнейшей работы могут понадобиться исходные данные в первоначальном виде, ранжированию можно подвергнуть их специально созданную резервную копию.

Ввод в действие жилых домов на 1000 человек населения за 2003 год (реферат, курсовая, диплом, контрольная)

Формулы полученных статистических характеристик:

Valid N объем выборки (число единиц в совокупности).

Показатели центра:

Mean средняя арифметическая:

(3.2.)

где — значение признака у i-й единицы совокупности;

n объем совокупности (Valid N).

Geometric mean геометрическая средняя:

. (3.3.)

Median медиана:

если n четное, (3.4.)

если n нечетное. (3.5.)

Mode мода (Мо) определяется непосредственно по исходным данным.

Frequency частота модального значения.

Показатели рассеяния:

Variance дисперсия:

(3.6.)

где — средняя арифметическая.

Standard deviation среднее квадратическое (стандартное) отклонение:

. (3.7.)

Standard (Standard error) средняя (стандартная) ошибка выборки:

. (3.8.)

Minimum минимальное значение признака в совокупности: Xmin .

Maximum максимальное значение признака в совокупности: Xmax.

Range размах вариации: R = Xmax Xmin. (3.9.)

Lower (Lower quartile) нижний (первый) квартиль:

(3.10.)

,

где floor округление до ближайшего целого;

ceiling округление до ближайшего большего.

Upper (Upper quartile) верхний (третий) квартиль:

.

Quartile (Interquartile range) межквартильный размах: Q3 Q1.

Показатели формы распределения:

Skewness асимметрия:

. (3.11.)

Std.err. (Standardized skewness) стандартизованная асимметрия:

Kurtosis коэффициент эксцесса (куртозис):

. (3.12.)

Std.err. (Standardized kurtosis) стандартизованный куртозис.

Коэффициент вариации (принято рассчитывать в процентах):

. (3.13)

На основе этого показателя делается вывод об однородности или неоднородности совокупности по изучаемому признаку.

Вычисляем: = 48,2(%). Т.к. коэффициент вариации > 12%, совокупность нельзя считать однородной.

3.3. Сглаживание эмпирического распределения,

проверка гипотезы о законе распределения

Построение модели эмпирического распределения, т. е. сглаживание его тем или иным теоретическим распределением, реализуется в меню Statistics/Distribution Fitting.

В качестве теоретической модели, возможно, использовать разные типы распределений. В окне процедуры они объединены в две группы:

Continuous Distributions непрерывные распределения;

Discrete дискретные распределения.

Сначала вводим переменную (кнопка Variable = Var2), в подменю Distribution можно выбираем закон распределения. На закладке Quick находятся кнопки Summary: Observed and expected distribution (пересчет наблюдаемого и ожидаемого распределения) (кнопка Summary в правом углу меню аналогична) и Plot of observed and expected distribution (построение наблюдаемого и ожидаемого распределения). Первая означает вывод расчетной таблицы теоретических и эмпирических частот с расчетом выбранных критериев согласия. Вторая кнопка обеспечивает вывод гистограммы эмпирического распределения с наложением на нее кривой теоретического распределения.

В закладке Options задаем расчет критерия согласия Пирсона Chi-square test/Combine categories: ставим метку на поле Chi-square test/Combine categories.

Chi-square test позволяет решать задачу проверки гипотезы о законе распределения, результат оценки представляется в табличном виде. Расчет критерия производится по следующей формуле:

(3.14.)

где fi — эмпирические абсолютные частоты (Observed Frequency);

fi-абсолютные частоты теоретического распределения (Expected Frequency);

к число интервалов.

Результаты сглаживания:

Рис. 3.5. Проверка гипотезы о нормальном распределении переменной Var2

Рис. 3.6. Проверка гипотезы о прямоугольном распределении

переменной Var2

Показать весь текст

Список литературы

  1. Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание). — СПб.: — 2003. 688 с.
  2. Статистика.: Учебник / Под ред. проф. И. И. Елисеевой. М.: ООО ВИТРЭМ, 2005. 448с.
  3. М.Р., Ганченко О. И., Петрова Е. В. Практикум по общей теории статистики. М. Финансы и статистика — 2005. 332 с.
  4. В.Г., Козарезова Л. О. Основы теории статистики. М: Финансы и статистика — 2004.
  5. www.statsoft.ru сайт компании StatSoft Russia (документация по STATISTICA 6.0).
  6. www.gks.ru
Заполнить форму текущей работой