Этап 1 Постановочный Целью этой работы является изучение зависимости уровня образования от среднедушевого размера доходов населения области. А именно, выявление фактора, оказывающего существенного влияние на уровень образовании населения. А также построение модели, которую можно было бы использовать для прогнозирования уровня образования населения.
Этап 2 Априорный Изучив сложившуюся ситуацию, можно выделить следующие факторы, оказывающие влияние на уровень образования населения в области: среднедушевой доход населения, численность населения, наличие ВУЗов, местоположение области, средний возраст населения области и пр.
Изучив данные по каждому из этих факторов, оставляем для исследования один. Предполагаем, что наиболее существенным фактором уровень среднедушевого дохода населения в области Итак, результативный признак Y — численность студентов в области, фактор Х — среднедушевой доход населения области.
Этап 3 Информационный Для изучения влияния именно фактора Х, постараемся отобрать в выборку однородные участки, т. е. с примерно одинаковыми характеристиками, и за один и тот же период времени.
В выборку отобрано 24 области РФ. По данным Федеральной службы государственной статистики на сайте HTTP://WWW.GKS.RU получены данные о среднемесячных доходах населения в июле 2006 г. о численности населения областей на 01.01.2006 и о количестве студентов ВУЗов. На основании этих данных рассчитаем процент студентов в общем населении областей.
Статистические данные приведены в таблице 1.
Таблица 1
Статистические данные о количестве студентов ВУЗов и среднемесячном доходе населения по областям РФ
№ п/п Название области Численность населения на 1.01.2006 Численность студентов на 1.01.2006 Доля студентов в обшей численности населения Средне-душевой доход, руб.
У Х
1 Псковская область 724,6 20,5 2,83% 6235,5
2 Новгородская область 665,4 22,8 3,43% 7146,3
3 Мурманская область 864,6 32,6 3,77% 10 437
4 Тамбовская область 1130,4 35 3,10% 6319,5
5 Астраханская область 994,2 36,8 3,70% 6565,1
6 Тверская область 1406,6 39,4 2,80% 7045,2
7 Читинская область 1128,2 41,2 3,65% 6756,7
8 Тульская область 1599,8 41,3 2,58% 6381,4
9 Вологодская область 1235,4 42,7 3,46% 8628,3
10 Архангельская область 1291,4 46,8 3,62% 9045,3
11 Владимирская область 1472,6 47,4 3,22% 4619,8
12 Ульяновская область 1335,9 50,9 3,81% 6553,6
13 Пензенская область 1407,9 51,5 3,66% 5471,2
14 Белгородская область 1511,4 64,4 4,26% 6876,5
15 Волгоградская область 2635,6 100 3,79% 8087,8
16 Кемеровская область 2838,5 104,2 3,67% 9432,5
17 Иркутская область 2526,9 122,7 4,86% 8634,2
18 Челябинская область 3531,3 152,6 4,32% 8409,5
19 Самарская область 3189 170,5 5,35% 11 242
20 Свердловская область 4409,7 208,8 4,74% 10 825
Предварительный анализ стат. данных
Основные расчёты были проведены с помощью программы Excel (распечатки прилагаются).
(Или: Для удобства вычислений в ходе решения будем достраивать исходную таблицу данных до вспомогательной таблицы (см. расчетную таблицу ниже), округляя и занося в неё промежуточные результаты).
Поле корреляции и линия регрессии Сначала построим поле корреляции — точки с координатами (хi, уi), и по их расположению сформулируем предположение о связи Y и X.
Рис. 1. Корреляционное поле зависимости доход — доля студентов
Визуальный анализ полученного поля корреляции показывает, что точки располагаются вдоль некоторой воображаемой возрастающей прямой линии, но сильно рассеянной полосой. Т. е. можно сказать, что прослеживается прямая зависимость между среднедушевым доходом населения и долей студентов в населении области.
Проверим наши предположения аналитически, с помощью расчётов на следующих этапах.