Для анализа выборочных значений используются две главных статистических оценки: точечная и интервальная оценки.
Пример 12.1
Рассмотрим следующие значения прочности на разрыв для четырех фортепианных струн: 28,7; 27,9; 29,2; 26, 5 psi (фунт/кв. дюйм)[1].
Если допустить, что эти образцы являются представительной выборкой популяции фортепьянных струн, то можно получить следующее средневыборочное значение р, т. е. точечную оценку для популяции:
А что же с риском? — А пока никак. Имеем только некую цифру (точку), что с нее взять? Двинемся дальше к интервальной оценке.
Пусть известно, что допустимое стандартное отклонение (а = 2 psi) от р, а допустимый риск, а = ±2,5%. Что это означает на физическом уровне? А вот что. При, а = ±2,5% доверительный 95%-иый интервал, в пределах которого лежат допустимые значения предела прочности струи, вычисляется так:
Но что это за магическое число 1,96? Да его все знают из курса теории вероятностей — это 95% значений прочности струн из выборки. Попал в сегмент — повезло, за брак не «выдрали». Проблема в границах, хвостах распределения, которое мы по умолчанию приняли нормальным.
Риск заключается в хвостах этого распределения (именно об этом предупреждает Z (a) = 1,96. Но где взять это а? Все просто — берем таблицу процентных точек нормального распределения (см., например, [32, с. 492], правда, там обозначено Z (а) =иа). В клеточках таблицы находим эту самую а, и видим, что Z (а) = 1,96. Приведем откорректированный вариант данной таблицы, где в клетки прямо вписаны риски (табл. 12.2, жирным шрифтом выделен результат решения примера 12.1).
Таблица 12.2
Откорректированная таблица процентных точек нормального распределения.
Z. | 0,00. | 0,01. | 0,02. | 0,03. | 0,04. | 0,05. | 0,06. | 0,07. | 0,08. | 0,09. |
| | | | | | | | | | 13,79. |
| | | | | | | 14,46. | | | |
1,9. | 2,87. | 2,81. | 2,74. | 2,68. | 2,62. | 2,56. | 2,50. | 2,44. | 2,38. | 2,33. |
2,5. | 0,62. | 0,60. | 0,59. | 0,57. | 0,55. | 0,54. | 0,52. | 0,51. | 0,49. | 0,4. |
Формулировка задачи оценивания может быть также следующей. Пусть случайная выборка объема п взята из большой совокупности изделий и имеет стандартное отклонение в 1 мкм. Размер выборки уже определен так, чтобы был обеспечен 5%-ный риск превышения +0,1 мкм границы допуска над средневыборочным значением ц. Требуется продумать и аргументировать: какое из значений объема п выборки лучше всего подходит (г.е. то число изделий, которое было выбрано (число изделий выборки), — это число еще предстоит найти. А потом только решить, какое из следующих чисел: 384, 40, 200 или 100 — лучше подходит).
Итак, с нормальным распределением в случае, когда цио известны, мы разобрались. А что делать, если о неизвестна? Ответ таков: использовать критерий Стыодента1.
- [1] Откровение для не слишком радивого студента: 1 г/см2 = 1 psi • 70,31, но «пси» как-топохоже на звук перетянутой оборванной струны, которая бьет не в щеку, а в деку гитары, издавая «пси».