Предельные теоремы.
Математическая статистика для социологов
Опыт показывает, что распределение суммы независимых случайных величин, у которых дисперсии нс отличаются резко друг от друга, довольно быстро приближается к нормальному. Уже при числе слагаемых, большем десяти, распределение суммы можно заменить нормальным. Теорема Ляпунова (1901) — распределение суммы независимых случайных величин Xr Xv Xv …, Хп приближается к нормальному закону распределения… Читать ещё >
Предельные теоремы. Математическая статистика для социологов (реферат, курсовая, диплом, контрольная)
При изучении результатов наблюдений над реальными массовыми случайными явлениями (выборочными значениями изучаемых случайных величин) часто исследуются закономерности, обладающие свойством устойчивости при рассмотрении разных выборок. Суть устойчивости состоит в том, что конкретные свойства каждого явления почти не сказываются на среднем результате. Наблюдаемые на выборке характеристики случайных величин при неограниченном увеличении количества и объема выборок становятся практически неслучайными. Предельные теоремы, о которых идет речь ниже, фактически устанавливают зависимость между случайностью и необходимостью. По смыслу эти теоремы можно разбить на две большие группы — центральную предельную теорему и закон больших чисел (хотя по сути они отражают одно и то же).
Центральная предельная теорема
Центральной предельной теоремой обычно называют группу утверждений (точнее, каждое утверждение из этой группы), которые устанавливают связь между законом распределения суммы случайных величин и его предельной формой — нормальным законом распределения. Формулировки отличаются условиями, которые накладываются на исходные случайные величины.
Прежде всего напомним формулировку (в упрошенном виде[1]) одной из известных теорем А. М. Ляпунова (1857—1918) (впервые, но в более простом виде, эта теорема была доказана П Л. Чебышевым (1821−1894) в 1887 г.).
Теорема Ляпунова (1901) — распределение суммы независимых случайных величин Xr Xv Xv …, Хп приближается к нормальному закону распределения при неограниченном увеличении я, если выполняются следующие условия:
- • все величины имеют конечные математические ожидания и дисперсии;
- ? ни одна из величин по своему значению резко не отличается от остальных и оказывает ничтожное влияние на их сумму.
Таким образом, предельное распределение суммы случайных величин в условиях рассмотренной теоремы не зависит от вида распределений самих случайных величин.
Опыт показывает, что распределение суммы независимых случайных величин, у которых дисперсии нс отличаются резко друг от друга, довольно быстро приближается к нормальному. Уже при числе слагаемых, большем десяти, распределение суммы можно заменить нормальным.
Теорема Ляпу нова справедлива и для дискретных случайных величин.
Отметим, что центральная предельная теорема имеет важное значение для социолога, поскольку объясняет причину большого распространения в природе (в том числе — в обществе) нормального распределения, оправдывает делаемые зачастую априори, без проверки, предположения о нормальности тех распределений, которые анализируются в социологических исследованиях. Приведем пример.
В ряде методов шкалирования предполагается, что мнение человека о любом объекте плюралистично. Это означает, что если бы у нас был инструмент измерения такого мнения и мы имели бы возможность использовать его много раз, то, вообще говоря, каждый раз получали бы разные значения. Этим значениям отвечало бы некоторое распределение вероятностей. Важное для нас утверждение состоит в том, что при этом обычно полагают, что указанное распределение нормально (это делается, например, в методе парных сравнений — одном из известных способов получения экспертных оценок[2]). И такую посылку вполне можно принять, если опереться на центральную предельную теорему.
Другая формулировка теоремы Ляпунова
Если случайная величинаЛГимеет математическое ожиданиеЛ/Л1 и дисперсию DX, то распределение среднего арифметического X = = (2Л^)/я, вычисленного по наблюдавшимся значениям случайной величины в и независимых испытаниях, проведенных в одинаковых условиях, при я -* оо приближается к нормальному с математическим ожиданием MX и дисперсией DX/ п. Другими словами,.
(в таких случаях говорят, что X имеет асимптотически нормальное распределение с указанными параметрами; «асимптотически» означает, что распределение тем ближе к нормальному, чем больше объем выборки).
Или, в других обозначениях, то же самое может быть записано следующим образом:
Именно этот вариант формулировки теоремы Ляпунова будет активно использоваться нами далее.
Заметим, что в соответствии с этой формулировкой дисперсия средних, рассчитанных для случайных выборок объема и из совокупности с дисперсией о2, равна а2/л.
То, что в соответствии с соотношением (4.1) средние арифметические значения рассматриваемого признака А", вычисленные для разных выборок, как бы сосредоточиваются вокруг математического ожидания^, дает некоторые основания для использования выборочного среднего арифметического для оценки последнего. Еще одно основание для такого использования дает закон больших чисел.