Распределение данных
По смыслу задачи каждое значение в одной выборке зависит от соответствующего значения в другой, поэтому вместо двух измерений рассмотрим их разность. Если верна гипотеза H0, т. е. эффект отсутствует, то статистика Стьюдента Т имеет распределение Стьюдента с n-1 степенями свободы. Полученное значение статистики Стьюдента попадает в критическую область с заданным уровнем значимости, поэтому… Читать ещё >
Распределение данных (реферат, курсовая, диплом, контрольная)
Задание 1
Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).
Лист2, столбец, А Статистическая задача.
Вычислить основные статистические характеристики распределения данных: объем наблюдений, среднее значение, медиану, дисперсию, стандартное отклонение, минимальное и максимальное значения выборки, размах (широту) выборки, асимметрию, эксцесс.
Проверить значимость отклонения от нуля коэффициентов асимметрии и эксцесса с заданным уровнем значимости:
б = 0.10.
Результаты.
Объём выборки | ||||
Среднее | 121,529 703 | |||
Медиана | 121,5 | |||
Дисперсия | 5,943 870 209 | |||
Станд.отклонение | 2,438 005 375 | |||
Минимум | 115,2 | |||
Максимум | ||||
Размах | 14,8 | |||
границы | ||||
Асимметрия | 0,229 715 932 | (-0,389; 0,389) | незначимо | |
Эксцесс | 0,868 236 435 | (-0,65; 0,77) | значимо | |
Задание 2
распределение отклонение эксцесс значимость Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).
Лист2, столбец, А Статистическая задача. Построить гистограмму выборочных данных по заданным интервалам группировки:
X0 = 113.25 — правая граница первого интервала (от — до X0),
= 1 — ширина интервалов,
r = 16 — общее число интервалов с учётом двух крайних.
Найти оценку моды распределения.
На график гистограммы наложить график функции плотности гипотетического распределения:
H0: нормальное.
Результаты.
Мода распределения =121,53.
Задание 3
Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).
Лист2, столбец, А Статистическая задача. Построить график эмпирической функции распределения выборочных данных, совмещенный с графиком функции распределения гипотетического распределения:
H0: нормальное.
Вычислить максимальное расхождение между эмпирической и гипотетической функциями распределения.
Результаты.
Задание 4
Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).
Лист2, столбец, А Статистическая задача. Проверить (по критерию хи-квадрат) гипотезу согласия выборочных данных с гипотетическим распределением:
б=0.01, H0: нормальное.
Результаты.
Группированные | ||
среднее | 121.53 | |
дисперсия | 5.944 | |
границы | частоты | ч2 (i— n pi)2/ n pi | ||
выборочные i | ожидаемые n pi | |||
113.25 | 0,34 518 824 | 0,345 188 | ||
114.25 | 0,108 255 433 | 0,1 082 554 | ||
115.25 | 0,362 335 206 | 1,1 222 105 | ||
116.25 | 1,27 215 438 | 0,7 211 | ||
117.25 | 2,466 715 838 | 0,8 721 132 | ||
118.25 | 5,17 616 122 | 6,185Е-05 | ||
119.25 | 8,645 859 537 | 0,6 409 978 | ||
120.25 | 12,62 003 256 | 0,304 627 | ||
121.25 | 15,60 489 144 | 1,3 588 704 | ||
122.25 | 16,34 604 295 | 0,1 673 539 | ||
123.25 | 14,504 973 | 2,81 722 | ||
124.25 | 10,90 364 163 | 0,1 102 386 | ||
125.25 | 6,943 392 251 | 0,5 439 378 | ||
126.25 | 3,745 499 088 | 2,124 862 | ||
127.25 | 1,711 493 588 | 0,2 957 786 | ||
127.25 | 0,957 517 088 | 1,1 349 882 | ||
Всего | ч2=10,514 717 | |||
15 степеней свободы | a15=0,213 824 | ||
13 степеней свободы | a13=0,348 601 | ||
1%-ое критическое значение | |||
гипотеза нормальности | отвергается | ||
с критическим уровнем значимости | бcrit = 0.348 601 | ||
Вывод. Данные слабо значимо свидетельствуют против предположения о нормальности распределения выборки.
Задание 5
Описание данных. Измерялось верхнее артериальное давление до и после проведения комплекса оздоровительных мероприятий в некоторой группе пациентов. Каждое значение представляет собой среднее арифметическое многократных измерений давления у одного пациента в течение дня.
Sheet2, столбцы В, С Статистическая задача. Проверить гипотезу отсутствия эффекта оздоровительных мероприятий по критерию Стьюдента (в предположении нормальности распределения наблюдений) при заданном уровне значимости и выбранной альтернативе относительно истинного среднего значения:
б=0.05, K: Уменьшится.
Результаты.
До | После | Разность | ||
Объём выборки | ||||
Среднее | 153,5 434 783 | 124,3 492 754 | 29,1 942 029 | |
Станд.отклонение | 8,950 612 938 | 7,317 016 561 | 5,451 602 186 | |
Станд.ошибка среднего | 1,85 421 252 | 0,887 318 593 | 0,661 103 872 | |
Статистика Стьюдента | T=44.16 | |||
5%-ая критическая область | > 1,667 572 281 | |||
Гипотеза отсутствия эффекта | отвергается | |||
с критическим уровнем значимости | бcrit <0.001 | |||
Вывод. Данные подтверждают предположение об уменьшении давления после лечения.
По смыслу задачи каждое значение в одной выборке зависит от соответствующего значения в другой, поэтому вместо двух измерений рассмотрим их разность. Если верна гипотеза H0, т. е. эффект отсутствует, то статистика Стьюдента Т имеет распределение Стьюдента с n-1 степенями свободы. Полученное значение статистики Стьюдента попадает в критическую область с заданным уровнем значимости, поэтому мы отвергаем гипотезу об отсутствии эффекта.
Пояснения:
Альтернатива: уменьшится, тогда бcrit =1-S (t). Поэтому мы используем бcrit =СТЬЮДРАСП (x, n — 1,1), а для критической константы СТЬЮРАСПОБР.
Задание 6
Описание данных. Измерялось содержание некоторой примеси в пищевом продукте до и после специальной обработки. Нет оснований предполагать нормальность распределения данных.
Sheet2, столбцы E, F
Статистическая задача. Проверить гипотезу отсутствия влияния обработки на содержание примеси по критерию знаков при заданном уровне значимости и ожидаемом эффекте:
б=0.05, Ожидается: Уменьшается.
Результаты.
Частота ожидаемого эффекта | ||
30 из 30 | ||
5%-ая критическая область | >20 | |
Гипотеза отсутствия эффекта | отвергается | |
с критическим уровнем | бcrit << 0.001 | |
Вывод. Данные высоко значимо подтверждают предположение о влиянии специальной обработки на величину примеси.
Пояснения:
Критический уровень значимости по формуле биномиального распределения равен:
бcrit=1-sup P Mm (*)
При условии, что p0,5.
Очевидно, что supremum достигается при p=0.5.
Критическую константу же мы находим, исходя из заданного уровня значимости варьируя число успехов.
Задание 7
Описание данных. Фиксировалось среднее значение нескольких измерений в течение суток верхнего артериального давления у пациентов в двух, не связанных между собой, группах. Можно предположить, что для каждого пациента усредненный результат представляет собой реализацию нормальной случайной величины с одинаковой для обеих групп дисперсией.
Sheet2, столбцы G, H
Статистическая задача. При заданном уровне значимости б и альтернативе K проверить по критерию Стьюдента гипотезу о том, что математическое ожидание наблюдений в 1-й группе отличается в ту или иную сторону от математического ожидания во 2-й группе:
б=0.05, K: 1-ая группа меньше.
Результаты.
Группа A | Группа B | ||
Объём наблюдений | |||
Среднее | 168,9 571 429 | 168,455 | |
Станд.отклонение | 10,58 261 474 | 9,77 453 196 | |
Станд.ошибка среднего | 2,96 625 156 | 1,56 517 776 | |
Статистика Стьюдента T | 0,198 | ||
5%-ая критическая область | > 1.667 916 | ||
Гипотеза совпадения групп | принимается | ||
с критическим уровнем значимости | бcrit = 0.58 | ||
Вывод. Расхождение в измерениях артериального давления у пациентов в двух группах статистически незначимо. Группы можно считать однородными.
Задание 8
Описание данных. Измерялось содержание витаминов группы В (в у. е.) в овощах, выращенных с использованием двух различных типов удобрений.
Sheet2, столбцы I, J
Статистическая задача. При заданном уровне значимости б и альтернативе K проверить по критерию Вилкоксона гипотезу о том, что функции распределения измерений в каждой группе совпадают:
б=0.01, K: 1-ая гр. Меньше Результаты.
Объемы выборок | n1=29 | n2=19 | |
Сумма рангов 1-й выборки | |||
Среднее значение (стат Виликсона) | 710,5 | ||
1%-я критическая область | >599.7 | ||
Гипотеза идентичности групп | принимается | ||
с критическим уровнем значимости | бcrit =0,19 | ||
Вывод. Тип удобрения влияет на витамины в овощах.
Задание 10
Описание данных. Измерялось содержание сахара в крови в двух группах больных сахарным диабетом. Исследователь не обладает никакой информацией о типе распределения измерений в группах, а также о возможном соотношении между этими распределениями.
Sheet2, столбцы M, N
Статистическая задача. При заданном уровне значимости б и границах интервалов разбиения проверить по критерию хи-квадрат гипотезу об однородности измерений в группах:
б=0.1; X0=13 Д=2 r=7
Результаты.
Относительные частоты | ||||
Границы | Группа А | Группа В | ч2 | |
0,147 059 | 0,12 381 | 0,206 753 | ||
0,127 451 | 0,38 095 | 5,30 203 | ||
0,107 843 | 0,85 714 | 0,262 227 | ||
0,68 627 | 0,57 143 | 0,108 662 | ||
0,107 843 | 0,114 286 | 0,19 328 | ||
0,88 235 | 0,66 667 | 0,311 397 | ||
>19 | 0,352 941 | 0,514 286 | 3,97 815 | |
У | 9,36 384 | |||
Объём | ||||
10%-я критическая область | >10,644 | |||
Гипотеза однородности групп | принимается | |||
с критическим уровнем значимости | бcrit = 0.1715 | |||
Вывод. Группы больных не значимо различаются по содержанию сахара в крови.
Задание 11
Описание данных. Измерялась длина хвоста редкой породы ящериц.
Sheet2, столбец O
Статистическая задача. Предполагая нормальность распределения выборочных данных, построить доверительный интервал для среднего значения длины хвоста ящериц изучаемой породы при заданном уровне надежности:
Q = 0.9, Граница: верхняя.
Результаты.
Выборочное среднее | 51,816 | |
Дисперсия | 27,2 728 | |
Объём выборки | ||
Станд. ошибка среднего | 0,750 379 | |
б квантиль | 1,299 439 | |
90%-ый доверительный интервал для среднего всей совокупности | 51,98 323 | |
Пояснения:
Найдем — выборочное среднее, — выборочную дисперсию. Отношение стандартного отклонения и корня из числа степеней свободы дает нам стандартную ошибку среднего.
Опорная функция монотонно убывает и имеет распределение Стьюдента S с (n-1) степенью свободы. Вычисляем верхнюю квантиль (tб), т. е. решение уравнения S (t)=1-б. Тогда верхняя доверительная граница для среднего
Задание 12
Описание данных. Измерялась наполняемость консервной банки со шпротами, произведенными на экспериментальной производственной линии.
Sheet2, столбец P
Статистическая задача. Предполагая нормальность распределения выборочных данных, построить доверительный интервал для дисперсии при заданном уровне надежности:
Q=0.95, Граница: Двусторонняя.
Результаты.
Объём выборки | ||
Дисперсия | 22,915 | |
1-б квантиль распределения | 39,80 128 | |
б квантиль распределения | 74,46 832 | |
90%-ая двусторонняя граница для дисперсии для станд. отклонения | [17.53 974; 32.8169] [4.188 047; 5.728 604] | |
Пояснения:
Квантили хи-квадрат распределения находятся по следующим формулам:
= ХИ2ОБР (1-p; m).
= ХИ2ОБР (p; m).
Строятся доверительные границы
и .