Помощь в учёбе, очень быстро...
Работаем вместе до победы

Исследование распределений статистик многомерного анализа данных при нарушении предположений о нормальности

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Сегодня в связи с бурным развитием и внедрением персональных компьютеров, особую актуальность приобретает задача обеспечения высокого качества пакетов прикладных статистических программ. Несмотря на то, что, рынок насыщен различными пакетами программных систем статистического анализа, реализуемые в них методы и алгоритмы сильно отстают от последних достижений в области статистических… Читать ещё >

Содержание

  • ГЛАВА 1. Постановка задач исследования
    • 1. 1. Основные понятия и определения
    • 1. 2. Задачи корреляционного анализа
      • 1. 2. 1. Критерии проверки гипотез о векторе математических ожиданий и ковариационной матрице
      • 1. 2. 2. Критерии проверки гипотез о коэффициентах корреляции
      • 1. 2. 3. Критерии проверки гипотез о корреляционном отношении
    • 1. 3. Цели исследования распределений статистик корреляционного анализа при нарушении предположения о нормальности
    • 1. 4. Проблемы моделирования многомерных псевдослучайных величин
    • 1. 5. Выводы
  • ГЛАВА 2. Исследование критериев проверки гипотез о математических ожиданиях и дисперсиях при вероятностных законах, отличающихся от нормального
    • 2. 1. Классические критерии проверки гипотез о математических ожиданиях и дисперсиях
    • 2. 2. Распределения статистик 71, Т2, ТА при нарушении предположений о нормальности
    • 2. 3. Выводы
  • ГЛАВА 3. Исследование критериев проверки гипотез о векторе математических ожиданий и ковариационной матрице
    • 3. 1. Классические критерии проверки гипотез о векторе математических ожиданий и ковариационной матрице
      • 3. 1. 1. Проверка гипотез о векторе математических ожиданий
      • 3. 1. 2. Проверка гипотез о ковариационной матрице
    • 3. 2. Исследование распределений статистик критериев в случае принадлежности наблюдений нормальному закону
    • 3. 3. Исследование распределений статистик при законах, отличающихся от нормального
    • 3. 4. Уточнение моделей распределений статистик рассматриваемых критериев
    • 3. 5. Выводы
  • ГЛАВА 4. Исследование критериев проверки гипотез о коэффициентах корреляции
    • 4. 1. Классические критерии проверки гипотез о коэффициентах корреляции
      • 4. 1. 1. Проверка гипотез о коэффициентах парной корреляции
      • 4. 1. 2. Проверка гипотез о коэффициентах частной корреляции
      • 4. 1. 3. Проверка гипотезы о коэффициенте множественной корреляции
    • 4. 2. Исследование распределений статистик критериев для различных многомерных законов
      • 4. 2. 1. В случае принадлежности наблюдений многомерному нормальному закону
      • 4. 2. 2. В случае принадлежности наблюдений многомерным законам, моделируемым на основе семейства симметричных распределений
      • 4. 2. 3. Случай принадлежности наблюдений многомерному закону Стьюдента
    • 4. 3. Выводы
  • ГЛАВА 5. Исследование критериев проверки гипотез о корреляционном отношении
    • 5. 1. Классические критерии проверки гипотез о корреляционном отношении
    • 5. 2. Влияние различных способов группирования и количества интервалов на оценку корреляционного отношения
    • 5. 3. Исследование распределений статистики критерия проверки гипотезы о незначимости корреляционного отношения
    • 5. 4. Исследование распределений статистики критерия линейности регрессии Xi по Xj
    • 5. 5. Выводы
  • ГЛАВА 6. Описание программной системы
    • 6. 1. Общая характеристика программной системы
    • 6. 2. Краткое описание интерфейса программной системы
      • 6. 2. 1. Основная программа
      • 6. 2. 2. Вспомогательная программа
    • 6. 3. Моделирование псевдослучайных величин
      • 6. 3. 1. Моделирование одномерных распределений
      • 6. 3. 2. Моделирование псевдослучайных нормальных векторов
      • 6. 3. 3. Моделирование многомерных величин по законам, отличным от нормального
      • 6. 3. 4. Моделирование псевдослучайных векторов, подчиняющихся многомерному распределению Стьюдента
      • 6. 3. 5. Моделирование функциональной линейной зависимости между Х{иХу
    • 6. 4. Пример использования программной системы при обработке данных в медицине
    • 6. 5. Выводы

Исследование распределений статистик многомерного анализа данных при нарушении предположений о нормальности (реферат, курсовая, диплом, контрольная)

Современное состояние и актуальность темы исследований. Существует множество работ по многомерному статистическому анализу [13,31,36,44, 45,47,94,95,108,114], содержание которых указывает на актуальность и эффективность применения соответствующего математического аппарата в различных областях знаний, таких как экономика, биология и медицина. При этом в практике статистического анализа возникает существенно больше постановок задач, чем предлагается решений в классической математической статистике [101]. Разнообразие статистических гипотез, выдвигаемых в процессе статистического анализа в различных приложениях, оказывается существенно шире предлагаемого классическим аппаратом. Классический аппарат включает в себя ограниченный перечень задач проверки статистических гипотез, для которых найдены предельные распределения статистик, используемых в соответствующих критериях. Поэтому классические результаты оказываются применимыми при выполнении достаточно строгих предположений, которые на практике часто не имеют места.

С другой стороны, для обнаружения закономерных связей можно использовать аппарат анализа данных [53,54,63,64], когда рассматриваемые объекты представляются как «черные ящики». В данном случае на анализируемые данные не накладываются какие—либо строгие ограничения. Но применение такого подхода обычно привязано к определенному классу задач, например, распознавание образов, и поэтому далеко не всегда удается использовать методы анализа данных в растущем множестве различных статистических задач.

Таким образом, можно говорить о наличии в математической статистике множества «пробелов», которые чаще всего связаны с проверкой разного рода статистических гипотез. В этом случае вопрос обычно упирается в необходимость нахождения предельного распределения статистики построенного критерия или распределения статистики при заданном объеме выборки" Как правило, нахождение предельного закона для статистики критерия проверки конкретной гипотезы аналитическими методами оказывается чрезвычайно сложной задачей, а задач, требующих разрешения, — слишком много [124].

В большинстве случаев отсутствие необходимых теоретических результатов объясняется сложностью и трудоемкостью получения решений аналитическими методами. Можно констатировать, что количество и уровень сложности задач, выдвигаемых практикой, возрастают настолько быстро, что ресурсы человеческого интеллекта, его производительность просто не в состоянии обеспечить решение такого множества задач без создания и использования соответствующих вычислительных технологий.

Сегодня в связи с бурным развитием и внедрением персональных компьютеров, особую актуальность приобретает задача обеспечения высокого качества пакетов прикладных статистических программ. Несмотря на то, что, рынок насыщен различными пакетами программных систем статистического анализа [22,115], реализуемые в них методы и алгоритмы сильно отстают от последних достижений в области статистических исследований. С одной стороны это объясняется, прежде всего, тем, что подробное описание последних результатов исследований очень сложно отыскать в литературных источниках, поэтому они остаются труднодоступными для разработчиков программного обеспечения. К сожалению, с другой стороны необходимо отметить и то, что в некоторых работах встречаются ошибки применения статистических методов [98], что также не облегчает быстрое внедрение новых методов в программные пакеты.

Перспективы программного обеспечения по статистическому анализу данных обсуждались в работах [27−30,38], современные проблемы внедрения прикладной статистики поднимались в [100]. Расширяющиеся использование ЭВМ и их совершенствование в свою очередь отражается на развитии статистических методов и использовании статистических методов в приложениях [14,32,35,42,48,56,65,104,109,116,120].

Вышесказанное подчеркивает необходимость (а практика уже показывает возможность [61,67,81,82,86,89,90]) развития компьютерных методов исследования статистических закономерностей, компьютерных методов исследования свойств оценок и статистик различных критериев проверки статистических гипотез, построения вероятностных моделей для исследуемых закономерностей. Это позволяет с меньшими интеллектуальными затратами получать фундаментальные знания в области математической статистики, и, следовательно, осуществлять корректные статистические выводы при анализе данных в различных прикладных областях.

В последние годы при исследовании некоторых задач математической и прикладной статистики получено множество результатов, связанных с исследованием распределений статистик критериев согласия в случае проверки простых и сложных гипотез [84,86−88], с исследованием статистических свойств различных оценок [69,91], полученных как раз благодаря применению методов компьютерного моделирования. Накопленный опыт в данной области показал, что с использованием методов статистического моделирования и последующего анализа можно получать результаты по точности не уступающие аналитическим. Например, при оценивании параметров распределений некоторых законов в случаях проверки сложных гипотез с использованием методов статистического моделирования, когда наиболее часто применяют метод Монте-Карло [37,49,51,52,113], были получены таблицы процентных точек для предельных распределений статистик непараметрических критериев [5,17,23,24,117−119,121]. В этой связи появилась обоснованная уверенность, что с использованием данного подхода можно закрывать многие существующие в прикладной статистике «пробелы», применяя относительно простой вычислительный и математический аппарат.

В различных приложениях статистического анализа многомерных случайных величин одну из ключевых позиций занимают задачи корреляционного анализа [122]. В процессе решения задач корреляционного анализа выявляется наличие и характер взаимосвязи величин, взаимозависимости величин при устранении влияния совокупности других или зависимости одной случайной величины от группы величин. Вычисляются оценки коэффициентов и матриц парной, частной и множественной корреляции, проверяются различные статистические гипотезы относительно параметров многомерного распределения и коэффициентов корреляции. На основании результатов корреляционного анализа может делаться вывод о наличии и характере функциональной зависимости или предпочтительности для описания исследуемого объекта регрессионной модели того или иного вида.

В основе существующего аппарата корреляционного анализа лежит предположение о принадлежности наблюдаемого случайного вектора многомерному нормальному закону. Базируясь на этом, получены предельные распределения статистик, используемых в критериях многомерного анализа [2,16,33,57−59].

На практике, исследователь далеко не всегда имеет дело с нормальным законом [16,94,99]. Как правило, многие исследователи вообще не придают значения проверке этого важного предположения корреляционного анализа, либо они вынуждены «в силу обстоятельств» работать только с многомерными величинами, имеющим нормальное распределение, как это сделано в работах [31,114]. Например, в нашей жизни достаточно мало экономических процессов, отклонения которых распределены по нормальному закону. Поэтому данное ограничение приводит к сужению области применения корреляционного анализа в экономике. Естественно, возникает вопрос о справедливости выводов, получаемых на основании результатов корреляционного анализа при нарушении основного предположения. В доступной литературе ответ на данный вопрос найден не был, хотя можно найти указания на робастность некоторых критериев, применяемых в многомерном анализе.

Целью данной диссертационной работы явилось стремление разобраться, что будет происходить с распределениями различных статистик корреляционного анализа, если наблюдаемый закон будет отличаться от многомерного нормального.

Немаловажен и такой аспект. Большинство наиболее весомых результатов в математической статистике имеет асимптотический характер. На практике же всегда имеют дело с ограниченными объемами наблюдений. И свойства используемых статистик в таких ситуациях порой существенно отличаются от асимптотических. Не являются исключением и предельные распределения статистик корреляционного анализа, которые получены для выборок многомерных величин с объемом п —> оо [2,33,57,58]. На практике исследователю важно знать конечные объемы выборок, начиная с которых можно пользоваться найденными предельными законами. Поэтому в процессе проводимых исследований можно оценить объемы выборок, которые могут быть рекомендованы как достаточные для принятия правильного решения по соответствующему критерию корреляционного анализа.

Очевидно, что ответить на поставленные вопросы, используя аналитические методы, чрезвычайно сложно из-за нетривиальности возникающих задач. Поэтому в основу проводимого исследования положена развиваемая на кафедре прикладной математики НГТУ методика компьютерного моделирования и анализа статистических закономерностей.

Цели и задачи исследований. Основной целью диссертационной работы является исследование поведения (предельных) законов распределений статистик многомерного анализа в случае принадлежности наблюдаемых случайных величин многомерным законам распределения, отличным от нормального.

Для достижения поставленной цели было предусмотрено решение следующих задач:

— исследование эмпирических распределений статистик корреляционного анализа в случае многомерного нормального закона для подтверждения теоретических результатов и выявления скорости сходимости распределений к соответствующим предельным;

— моделирование многомерных законов, отличных от нормального, с заданными вектором математических ожиданий, ковариационной матрицей и задаваемой мерой отклонения от нормального;

— исследование распределений статистик, используемых при проверке гипотез о векторе математических ожиданий и ковариационной матрице, в случае многомерных законов, отличающихся от нормального;

— исследование распределений статистик, используемых при проверке гипотез о парном, частном и множественном коэффициентах корреляции, в случае многомерных законов, отличающихся от нормального;

— исследование влияния способов группирования и количества интервалов на оценку корреляционного отношения, исследование критериев, используемых при проверке гипотез о корреляционном отношении;

— исследование критериев проверки гипотез о математическом ожидании и дисперсии в одномерном случае при наблюдениях, не подчиняющихся нормальному закону.

Методы исследования. Для решения поставленных задач использовался аппарат теории вероятностей, математической статистики, вычислительной математики, математического программирования, статистического моделирования.

Научная новизна диссертационной работы заключается в:

— результатах исследования распределений статистик многомерного анализа данных при нарушении предположений о нормальном законе многомерных случайных величин;

— результатах исследования распределений статистик критериев, используемых при проверке гипотез о математическом ожидании и дисперсии, в случае принадлежности наблюдений семейству симметричных распределений;

— методе моделирования многомерных случайных величин по законам, заданным образом отличающихся от нормального.

Основные положения, выносимые на защиту.

1. Результаты исследования сходимости распределений статистик многомерного анализа к предельным распределениям в зависимости от объема выборки при наблюдаемом нормальном законе случайных векторов.

2. Подход и алгоритм моделирования многомерного закона распределения, отличающегося от нормального, с заданными вектором математических ожиданий и ковариационной матрицей.

3. Результаты исследований распределений статистик многомерного анализа для ситуаций, когда наблюдаемый многомерный закон отличается от нормального.

4. Результаты исследований распределений статистик критериев, используемых для проверки гипотез о математическом ожидании и дисперсии.

Практическая ценность и реализация результатов. Результаты исследования распределений статистик классического корреляционного анализа позволяют существенно расширить сферу корректного применения ряда критериев на многомерные законы, в достаточно широких пределах отличающиеся от нормального (более островершинных или более плосковершинных). Для законов такого вида показано, что распределения статистик, используемых в критериях проверки гипотез о векторе математических ожиданий и о нулевых значениях парного, частного и множественного коэффициентов корреляции, по-прежнему хорошо описываются классическими предельными распределениями. В случае других исследуемых критериев выявлена явная зависимость от наблюдаемого многомерного закона. Предложен метод моделирования многомерных случайных векторов с задаваемым параметром отклонения от многомерного нормального закона.

Апробация работы. Основные результаты исследований докладывались на Новосибирской межвузовской НТК «Интеллектуальный потенциал Сибири» (Новосибирск, 2000) — Российской НТК «Информатика и проблемы телекоммуникаций» (Новосибирск, 2000, 2001, 2002, 2003, 2004) — V международной конференции «Актуальные проблемы электронного приборостроения АПЭП-2000» (Новосибирск, 2000) — Региональной НТК студентов, аспирантов, молодых ученых «Наука. Техника. Инновации» (Новосибирск, 2001) — Всероссийской НТК «Информационные системы и технологии ИСТ-2001» (Нижний Новгород, 2001) — VI международной конференции «Актуальные проблемы электронного приборостроения АПЭП-2002» (Новосибирск, 2002) — Региональной конференции «Вероятностные идеи в науке и философии» (Новосибирск, 2003) — всероссийской НТК «Информационные системы и технологии ИСТ-2004» (Нижний Новгород, 2004). Исследования по теме диссертации были поддержаны грантом Минобразования РФ (проект № А03−2.8−280), вошли составной частью в работы, поддержанные Российским фондом фундаментальных исследований (проект № 00−01−913) и грантом Минобразования РФ (проект № Т02−3.3−3356).

Публикации. По теме диссертации опубликовано 16 печатных работ. Среди которых 8 публикаций отражают основные результаты исследований.

Структура работы. Диссертация состоит из введения, 6 глав основного содержания, включая 11 таблиц и 48 рисунков, заключения, списка использованных источников и приложения.

6.5. Выводы.

1. В соответствии с целями диссертационной работы разработана программная система, которая реализует рассмотренные критерии классического корреляционного анализа, позволяет идентифицировать распределения статистик критериев через моделирование, осуществлять проверку гипотез для многомерных законов отличающихся от нормального по найденным распределениям статистик критериев.

2. В результате предложенного изменения метода моделирования псевдослучайных нормальных векторов реализована универсальная процедура, позволяющая на базе одномерного распределения моделировать многомерные псевдослучайные величины с заданными вектором математических ожиданий и ковариационной матрицей.

Для исследований выбрано семейство распределений (6.4), позволяющее моделировать псевдослучайные величины, подчиненные как многомерному нормальному закону (параметр формы = 2), так и по закону отличному от нормального. Это было подтверждено численными исследованиями, в том числе маргинальных функций распределения моделируемых многомерных законов.

3. Реализована процедура моделирования псевдослучайных векторов, подчиняющихся га—мерному распределению Стьюдента с р степенями свободы, с заданными вектором математических ожиданий и ковариационной матрицей.

Разработанная программная система была использована Илюшенко А. Е.

55] для расчета коэффициентов межвидовой сопряженности 4х-польной матрицы для массива данных в диссертационной работе на соискание ученой степени кандидата биологических наук «Группировки почвенных водорослей сосновых фитоценозов в режиме рекреационной нагрузки».

В диссертационной работе на соискание ученой степени кандидата медицинских наук Вихман Е. А. «Некоторые особенности изолированной систолической артериальной гипертензии у мужчин пожилого возраста» программная система применялась для уточнения наличия связей и их характера при рассмотрении показателей периферической, центральной гемодинамики, данных метаболизма у пациентов с изолированной систолической артериальной ги-пертензией пожилого возраста.

Программное обеспечение используется на факультете прикладной математики и информатики НГТУ при проведении лабораторных работ по курсу «Компьютерные технологии анализа данных и исследования статистических закономерностей» по специальности 10 200 —прикладная математика и информатика, результаты исследований закономерностей многомерного анализа при нарушении предположений включены в курс «Методы статистического анализа», читаемых по направлению магистерской подготовки 510 200 —прикладная математика и информатика.

ЗАКЛЮЧЕНИЕ

.

В соответствии с целями исследований на базе разработанного программного обеспечения получены следующие основные результаты:

1. Показано, что получаемые методами компьютерного моделирования эмпирические распределения статистик корреляционного анализа в случае многомерного нормального закона хорошо согласуются с классическими предельными распределениями этих статистик. Для статистик различных критериев получены оценки объемов выборок п, начиная с которых распределения соответствующих статистик хорошо согласуются с предельными.

2. Реализована универсальная процедура, позволяющая на базе семейства распределений (6.4) моделировать псевдослучайные величины с заданными математическим ожиданием и ковариационной матрицей, распределенные как по многомерному нормальному закону, так и по законам отличным от нормального.

3. Показано, что распределения статистик, используемых при проверке гипотез о векторе математических ожиданий, устойчивы к отклонениям многомерного закона от нормального в достаточно широких пределах: значимого изменения распределений статистик не происходит. Как в случае более островершинных по сравнению с нормальным, так и в случае более плосковершинных многомерных законах распределения данных статистик по—прежнему хорошо описываются классическими результатами, полученными в предположении о нормальности наблюдаемого вектора. Аналогичная ситуация наблюдается и в одномерном случае при проверке гипотез вида, Но: ¡-л — /но.

4. Показано, что распределения статистик критериев, используемых при проверке гипотез о ковариационной матрице, существенно зависят от вида наблюдаемого многомерного закона. В случае принадлежности наблюдений тп—мерным законам, хорошо описываемым моделями, получаемыми в соответствии с разработанной процедурой моделирования, для распределений статистик L и Ь2 найдены аналитические модели законов, описывающие распределения этих статистик при определенных значениях размерности га и параметре формы Л.

Аналогичные результаты получены в одномерном случае для критериев проверки гипотез вида #0: а2 = Oq при известном и неизвестном математическом ожидании: построены модели распределений и таблицы процентных точек для соответствующих статистик в случае принадлежности наблюдений семейству распределений (6.4).

5. Показано, что распределения статистик критериев, используемых при проверке гипотез вида Hq: г^ = 0 для парных, частных и множественных коэффициентов корреляции, устойчивы к отклонениям наблюдаемого многомерного закона от нормального. Эмпирические распределения данных статистик по—прежнему хорошо описываются предельными законами, полученными в предположении о нормальности наблюдаемых величин.

В то же время, в случае многомерных законов с «тяжелыми хвостами» наблюдается значимое отличие распределений статистик t, tp и F соответствующих критериев от предельных классических.

6. Используемые в критериях проверки гипотез о равенстве заданному значению парного или частного коэффициента корреляции статистикиzq и Zq существенно зависят от наблюдаемого многомерного закона. В то же время показано, что при |го| < 0.15 для проверки гипотез вида Hq: Tij = го можно пользоваться классическими результатами.

7. Показано, что оценка корреляционного отношения сильно зависит от количества интервалов группирования. Показано, что разбиение области определения на интервалы равной частоты является наиболее предпочтительным для вычисления оценок р2^.

8. Показано, что распределение статистики критерия проверки гипотезы вида, Но pfj = 0 в случае многомерного нормального закона хорошо согласуется с теоретическим предельным распределением, полученным в классическом корреляционном анализе. В случае многомерных законов, отличающихся от нормального в достаточно широких пределах (более островершинных или более плосковершинных), изменения предельного распределения статистики ^ не происходит.

Показаны вычислительные проблемы, возникающие при проверке гипотез вида, Но: р^ = г?, и плохая сходимость распределения статистики к предельному.

Полученные результаты расширяют сферу корректного применения методов классического многомерного анализа в приложениях. Разработанное программное обеспечение используется при проведении научных исследований и в учебном процессе.

Показать весь текст

Список литературы

  1. Alqallaf F. A., Konis К. P., Martin R. D. Scalable robust covariance and correlation estimates for data mining // Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining. 2002. — Pp. 14−23.
  2. Anderson T. W. An Introduction to Multivariate Statistical Analysis. — Third edition. — Wiley-Interscience, 2003. — 752 pp.
  3. Bose R. C, Roy S. N. The exact distribution of the studentized D2-statistic // Sankhya. 1938. — Vol. 4. — Pp. 19−38.
  4. Bose R. C., Roy S. N. The use and distribution of the studentized D2-statistic, when the variances and covariances are based on К samples // Sankhya.— 1938. Vol. 4. — Pp. 535−542.
  5. Chandra M., Singpurwalla N. D., Stephens M. A. Statistics for test of fit for the Extrem-Value and Weibull distribution // J. Am. Statist. Assoc. — 1981.— Vol. 76.-P. 375.
  6. Chen E. H. A random normal number generator for 32-bit-word computers // J. Am. Statist. Assoc. 1971. — Vol. 66. — Pp. 400−403.
  7. Devlin S. J., Gnanadesikan R., Kettenring J. R. Robust estimation and outlier detection with correlation coefficient // Biometrika.— 1975.— Vol. 62.— Pp. 531−545.
  8. Fisher R. A. The distribution of the partial correlation coefficient // Metron. — 1924. Vol. 3. — Pp. 329−332.
  9. Fisher R. A. The general sampling distribution of the multiple correlation coefficient // Proc. Roy. Soc. 1928. — Vol. A121. — Pp. 654−673.
  10. Gayen A. K. The frequency distribution of the Radial standard deviation // Ann. Math. Soc. 1951.-Vol. 2. — Pp. 188−202.
  11. Hotelling H. A generalized T-test and measure of multivariate dispersion // Proceedings of the Second Berkeley Symposium on Mathematical Statistics and Probability. — University of California Press, 1951. — Pp. 23−42.
  12. Hotelling H. New light on the correlation coefficient and its transforms // J. Roy. Stat. Soc. 1953. — Vol. B 15. — Pp. 193−225.
  13. Huseby J. R., Schwertman N. C., Allen D. M. Computation of the mean vector and dispersion matrix for incomplete multivariate data // Communs Statist. — 1980. Vol. 9. — Pp. 301−309.
  14. Johnson M. E. Multivariate Statistical Simulation: A Guide to Selecting and Generating Continuous Multivariate. — John Wiley & Sons, 1987. — 240 pp.
  15. L’Ecuyer P., Touzin R. On the Deng-Lin random number generators and related methods // Statistics and Computing. — 2004. — Vol. 14. — Pp. 5−9.
  16. Lumley T., Diehr P., Emerson S. The importance of the normality assumption in large public health data sets // Annual Review of Public Health. — 2002. — Vol. 23.-Pp. 151−169.
  17. Pearson E. S., Hartley H. O. Biometrica tables for Statistics. — Cambridge: University Press, 1972. — Vol. 2. — 634 pp.
  18. Pearson K. On the coefficients of Racial likeness // Biometrika.— 1926, — Vol. 18.-Pp. 105−117.
  19. Pearson K. Note on standardization of method using the coefficients of Racial likeness // Biometrika. 1928. — Vol. 20B. — Pp. 376−378.
  20. Shevlyakov G. L. On robust estimation of a correlation coefficient // Journal of Mathematical Sciences. 1997. — Vol. 83, no. 3. — Pp. 90−94.
  21. Shevlyakov G. L., Lee J. W. Robust estimators of a correlation coefficient: Monte Carlo and asymptotics // Korean Journal of Mathematical Sciences. — 1997.- Vol: 4.- Pp. 205−212.
  22. Stein P. G., Matey J R., Pitts K. A review of statistical software for the Apple Macintosh // The American Statistician.— 1997.— Vol. 32, no. 1.— Pp. 67−82.
  23. Stephens M. A. Use of Kolmogorov-Smirnov, Cramer-von Mises and related statistics without extensive table // J. R. Stat. Soc. — 1970.— Vol. 32.— Pp. 115−122.
  24. Stephens M. A. EDF statistics for goodness of fit and some comparisons II J. Am. Statist. Assoc. — 1974. Vol. 69. — Pp. 730−737.
  25. Wllks S. S. Moments and distribution of estimates of population parameters from fragmentary samples // Ann. Math. Stat. — 1932.— Vol. 3. — Pp. 163— 195.
  26. P. А., Колегова H. В. Байесовские оценки для некоторых характеристик многомерного t-распределения стьюдента // Мат. межд. научн.-практ. конференции «САКС-2001». — Т. 2.— Красноярск: САА, 2001.— С. 291−292.
  27. С. А Программное обеспечение персональных ЭВМ по статистическому анализу данных // Компьютер и экономика: экономические проблемы компьютеризации общества, — М.: Наука, 1991.— С. 91−107.
  28. С. А. Программное обеспечение персональных ЭВМ по статистическому анализу данных (проблемы, тенденции, перспективы отечественных разработок) // Заводская лаборатория. Диагностика материалов.- 1991.-Т. 57, № 1.-С. 54−58.
  29. С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983. — 471 с.
  30. С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Исследование зависимостей. — М.: Финансы и статистика, 1985. — 487 с.
  31. С. А., Мхитарян В. Прикладная статистика и основы эконометрики. Учебник для вузов. М.: ЮНИТИ, 1998.- 1022 с.
  32. А. Д., Алексеев А. И., Горский Н. Д. Анализ данных на ЭВМ (на примере системы СИТО). — М.: Финансы и статистика, 1990. — 192 с.
  33. Т. Введение в многомерный статистический анализ. — М.: Физ-матгиз, 1963.— 500 с.
  34. А. Программирование в С++ Builder 6. — М.: Бином, 2002.- 1152 с.
  35. А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. М.: Мир, 1982. — 488 с.
  36. ., Хуанъ К. Д. Многомерные статистические методы для экономики. — М.: Статистика, 1979. — 317 с.
  37. Н. П., Шрейдер Ю. А. Метод статистических испытаний Монте-Карло и его реализация в цифровых машинах. — М.: Физматгиз, 1961.— 266 с.
  38. Л. С. Статистический анализ на персональном компьютере // Мир ПК.- 1992.- № 2. С. 89−97.
  39. ГОСТ Р 50 779.53−98. Приемочный контроль качества по количественному признаку для нормального распределения. Часть 1. Стандартное отклонение известно. — М.: Изд-во стандартов, 1998. — 23 с.
  40. В. В. Вероятностные модели: Справочник. В 2-х ч.— Новосибирск: Изд-во НЭТИ, 1992.- Т. 2.- 188 с.
  41. В. В. Вероятностные модели: Справочник. В 2-х ч. — Новосибирск: Изд-во НЭТИ, 1992.- Т. 1.- 198 с.
  42. М.И., Петрович M. Л. Программное обеспечение ЭВМ: Библиотека прикладных программ БИМ. Вып. 20. (Прикладная статистика. Корреляционный анализ.). — Минск: Институт математики, АН БССР, 1989. 187 с.
  43. В. И., Лемешко Б. Ю., Постовалов С. Н. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Методические рекомендации. Часть I. Критерии типа х2- — Новосибирск: Изд-во НГТУ, 1998.- 126 с.
  44. Д. Эконометрические методы. — М.: Статистика, 1980.— 446 с.
  45. С. А. Прикладной многомерный статистический анализ.— М.: Финансы и статистика, 1982. — 216 с.
  46. Дьяконов В. Maple 6: учебный курс. — СПб.: Питер, 2001.— 608 с.
  47. И. И., Семенова Е. В. Основные процедуры многомерного статистического анализа. — Л.: УЭФ, 1993.— 78 с.
  48. И. С. Методы, алгоритмы, программы многомерного статистического анализа: Пакет ППСА. — М.: Финансы и статистика, 1986. — 232 с.
  49. С. М. Метод Монте-Карло и смежные вопросы.— М.: Наука, 1975.-471 с.
  50. С. М. О датчиках случайных чисел // Заводская лаборатория. Диагностика материалов. — 1993. — Т. 59, № 7. — С. 48−50.
  51. С. М., Михайлов Г. А. Курс статистического моделирования. — М.: Наука, 1976.-320 с.
  52. С. М., Михайлов Г. А. Статистическое моделирование. — М.: Наука, 1982.-296 с.
  53. Н. Г. Анализ данных и анализ знаний // Анализ последовательностей и таблиц данных. Вып. 150: Вычислительные системы. — Новосибирск: 1994.-С. 3−17.
  54. Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: Изд-во Ин-та математики, 1999. — 270 с.
  55. А. Е. Группировки почвенных водорослей сосновых фитоценозов в режиме рекреационной нагрузки: Автореф. дисск-та биолог.наук. / ГУ. Н., 2003. — 21 с.
  56. КемениД., СнеллД. Кибернетическое моделирование. — М.: Сов. радио, 1972.- 192 с.
  57. М., Стъюарт А. Теория распределений, — М.: Наука, 1966.— 588 с.
  58. М., Стъюарт А. Статистические выводы и связи. — М.: Наука, 1973.-900 с.
  59. М., Стъюарт А. Многомерный статистический анализ и временные ряды. — М.: Наука, 1976. — 736 с.
  60. . Ф. К проблеме моделирования случайных векторов // Вестник НовГУ — № 3.- Новгород: 1996. С. 87−89.
  61. Компьютерные методы исследований статистических закономерностей / Б. Ю. Лемешко, С. Н. Постовалов, С. С. Помадин и др. // Тезисы докладов всероссийской НТК «Информационные системы и технологии ИСТ-2001».- Нижний Новгород: 2001.- С. 87−89.
  62. Г. Введение в теорию оценивания по группированным и частично группированным выборкам. — М.: Наука, 1966. — 176 с.
  63. Г. С. Методы обработки разнотипных экспериментальных данных.— Новосибирск: Наука, 1981.— 157 с.
  64. Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений.— Новосибирск: Изд-во Ин-та математики, 1999. — 212 с.
  65. . Ю. Корреляционный анализ многомерных наблюдений случайных величин: Программная система. — Новосибирск: Изд-во НГТУ, 1995.- 39 с.
  66. . Ю. Статистический анализ одномерных наблюдений случайных величин: Программная система. — Новосибирск: Изд-во НГТУ, 1995.- 125 с.
  67. . Ю. Компьютерные методы исследований статистических закономерностей // Сб. «Моделирование, автоматизация и оптимизация наукоемких технологий». — Новосибирск: Изд-во НГТУ, 2000. — С. 1819.
  68. . Ю., Ванюкевич О. Н. Проверка гипотез о дисперсии при нарушении предположений о нормальности // Сб. научных трудов НГТУ. — Новосибирск: Изд-во НГТУ, 2002. № 3(29).- С. 27−32.
  69. . Ю., Гилъдебрант С. Я., Постовалов С. Н. К оцениванию параметров надежности по цензурированным выборкам // Заводская лаборатория. Диагностика материалов. — 2001. — Т. 67, № 1. — С. 52−64.
  70. . Ю., Помадин С. С. Корреляционный: анализ наблюдений многомерных случайных величин при нарушении предположений о нормальности // Сибирский журнал индустриальной математики. — 2002. — Т. 5, № 3(11).-С. 115−130.
  71. . Ю., Помадин С. С. Проверка гипотез о математических ожиданиях и дисперсиях в задачах метрологии и контроля качества при вероятностных законах, отличающихся от нормального // Метрология. — 2004.-№ 4.-С. 3−15.
  72. . Ю, Постовалов С. Я. О распределениях статистик непараметрических критериев согласия при оценивании по выборкам параметров наблюдаемых законов // Заводская лаборатория. — 1998. — Т. 64, № 3. — С. 61−72.
  73. . Ю, Постовалов С. Н. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Методические рекомендации. Часть II. Непараметрические критерии. — Новосибирск: Изд-во НГТУ, 1999.- 85 с.
  74. . Ю., Постовалов С. Я. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. — 2001.- Т. 67, № 7.- С. 62−71.
  75. . Ю., Постовалов С. Н. Применение непараметрических критериев согласия при проверке сложных гипотез II Автометрия. — 2001. — № 2.-С. 88−102.
  76. . Ю., Постовалов С. Н. Непараметрические критерии при проверке сложных гипотез о согласии с распределениями Джонсона // Доклады СО АН ВШ.- 2002. № 1(5).- С. 65−74.
  77. . Ю., Постовалов С. Я. Компьютерные технологии анализа данных и исследование статистических закономерностей: учеб. пособие. Новосибирск: Изд-во НГТУ, 2004.- 120 с.
  78. . Ю., Чимитова Е. В. Методика компьютерного моделирования в исследовании статистических закономерностей // Тезисы докладов региональной НТК «Наука. Техника. Инновации». — Т. 2.— НТИ-2001, 2001.-С. 46−48.
  79. . Ю., Чимитова Е. В. Построение оптимальных L-оценок параметров сдвига и масштаба распределений по выборочным квантилям // Сибирский журнал индустриальной математики. — 2001. — Т. 4, № 2. — С.166−183.
  80. . Ю., Чимитова Е. В. Оптимальные L-оценки параметров сдвига и масштаба распределений по выборочным квантилям // Заводская лаборатория. Диагностика материалов. — 2004. — Т. 70, № 1. — С. 54−66.
  81. В. П., Ижевский П. В. Об использовании прикладной статистики при подготовке диссертационных работ по медицинским и биологическим специальностям // Бюллетень ВАК РФ. —1997. — № 5. — С. 56−61.
  82. В. П., Ижевский П. В. Применение статистики в медицине и биологии: анализ публикаций 1990−1997 гг.// Сибирский медицинский журнал. 1997. — № 3−4. — С. 64−74.
  83. Э. Статистические методы в эконометрии. — М.: Статистика, 1976.-325 с.
  84. . М. Maple V Power Edition. — М.: Информационно-издательский дом «Филинъ», 1998. — 240 с.
  85. П. В., Зограф И. А. Оценка погрешностей результатов измерений. — JL: Энергоатомиздат, 1991. — 303 с.
  86. А. И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат // Заводская лаборатория. Диагностика материалов. — 1985. — Т. 51, № 1. — С. 60−62.
  87. Орлов А./f/. Часто ли распределение результатов наблюдений является нормальным? // Заводская лаборатория. Диагностика материалов. — 1991. Т. 57, № 7. — С. 64−66.
  88. А. И. О современных проблемах внедрения прикладной статистики и других статистичесих методов // Заводская лаборатория. Диагностика материалов. — 1992. — Т. 58, № 1. — С. 61−1 А.
  89. А. И. Некоторые нерешенные вопросы в области математических методов исследования П Заводская лаборатория. Диагностика материалов. 2002. — Т. 68, № 3. — С. 52−56.
  90. В. Р., Шевляков Г. Л. Робастные методы оценивания коэффициента корреляции // Автоматика и Телемеханика. — 1987. — Т. 27, № 3. — С. 70−80.
  91. M.JI. Численное исследование на ЭВМ некоторых алгоритмов прикладной статистики 7/ Заводская лаборатория. Диагностика материалов.- 1991.- Т. 57, № 7.- С. 56−64.
  92. М. П., Давидович М. И. Статистическое оценивание и проверка гипотез на ЭВМ. — М.: Финансы и статистика, 1989. — 192 с.
  93. Подбельский В: В. Язык Си++: Учеб. пособие. — М.: Финансы и статистика, 1995.-560 с.
  94. Ю. /^ Вероятностное моделирование на электронных вычислительных машинах. — М.: Сов. радио, 1971. — 400 с.
  95. С. С. К проверке гипотез о математических ожиданиях и дисперсиях при законах, отличающихся от нормального // Сборник научных трудов НГТУ. 2003. — № 4(34). — С. 41−46.
  96. Д. А. Многомерный математический анализ. — М.: Высшая школа, 1989.-271 с.
  97. Pao С. Р. Линейные статистические методы и их применения.— М.: Наука, 1968.-548 с.
  98. Г. В. Методика изучения временных зависимостей в последовательностях случайных чисел // Заводская лаборатория. Диагностика материалов. — 1986. — Т. 52, № 1. — С. 56−58.
  99. Р 50.1.033−2001. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат. — М.: Изд-во стандартов, 2002.-87 с.
  100. Р 50.1.037−2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть II. Непараметрические критерии. — М.: Изд-во стандартов, 2002. 64 с.
  101. И. М. Численные методы. — М.: Наука, 1973. — 312 с.
  102. СошниковаЛ. А., Тамашевич В. Н., УебеГ. Многомерный статистический анализ в экономике: Учеб. пособие для вузов / Под ред. В. Н. Тамаше-вича. М.: ЮНИТИ-ДАНА, 1999. — 598 с.
  103. Статистические и математические системы // Каталог «Тысячи программных продуктов». — 1995. — № 2. — С. 88−92.
  104. Д. У. Анализ результатов наблюдений / Под ред. В. Э. Фигурнова.-М.: Мир, 1981.- 693 с.
  105. Ю. Н. О предельном распределении статистик Колмогорова-Смирнова для сложной гипотезы // Изв. АН СССР. Сер. Машем. — 1984.-Т. 48, № 6.-С. 1314−1343.
  106. Ю. Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. д-ра физ.-мат. наук. / МГУ. — М., 1985. — 33 с.
  107. Ю. Н., Макаров А. А. Анализ данных на компьютере. — М.: Финансы и статистика, 1995. — 384 с.
  108. Ю.Н., Макаров А. А. Статистический анализ данных на компьютере / Под ред. В. Э. Фигурнова. М.: ИНФРА, 1997. — 528 с.
  109. Тюрин Ю: H., Саввушкина H. Е. Критерии согласия для распределения Вейбулла-Гнеденко // Изв. АН СССР. Сер. Техн. Кибернетика. — 1984. — № 3. — С. 109−112.
  110. Э., Ренц Б. Методы корреляционного и регрессионного анализа. — М.: Финансы и статистика, 1988. — 302 с.
  111. Л. Введение в математическую статистику. — М.: Наука, 1976.-520 с.
  112. . Нетрадиционные методы многомерного статистического анализа. — М.: Финансы и статистика, 1988. — 263 с.
Заполнить форму текущей работой