Помощь в учёбе, очень быстро...
Работаем вместе до победы

Анализ первичных статистик

РефератПомощь в написанииУзнать стоимостьмоей работы

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение — модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Графически характер такого распределения описывается кривой К. Гаусса (рис. 7.1). Такой характер распределения часто встречается в исследовании… Читать ещё >

Анализ первичных статистик (реферат, курсовая, диплом, контрольная)

Для определения способов математико-статистической обработки, прежде всего, необходимо оценить характер распределения данных по всем исследуемым психологическим признакам. Для психологических признаков, имеющих нормальное распределение или близкое к нормальному, можно использовать методы параметрической статистики, которые во многих случаях являются более мощными, чем методы иепараметрической статистики. Достоинством последних является то, что они позволяют проверять статистические гипотезы независимо от формы распределения [17,25,40,60].

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение — модель варьирования некоторой случайной величины, значения которой определяются множеством одновременно действующих независимых факторов. Графически характер такого распределения описывается кривой К. Гаусса (рис. 7.1). Такой характер распределения часто встречается в исследовании психических явлений, особенно в больших выборках, поэтому исследователь в области психологии чаще всего в каждом случае выявляет характер распределения исследуемого признака.

Количественные зависимости частот и значений показателей признака при нормальном распределении.

Рис. 7.1. Количественные зависимости частот и значений показателей признака при нормальном распределении

Характер распределения выявляется главным образом с целью определиться в методах математико-статистической обработки данных.

Если характер распределения показателей психологического признака имеет нормальную или близкое к нормальной форме распределения признака, описываемой кривой Гаусса, то мы можем использовать параметрические методы математической статистики, как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками по-критерию Стьюдента, F-критерию Фишера, коэффициент корреляции Пирсона и др.

Если кривая распределения показателей психологического признака далека от нормальной, то мы вынуждены будем использовать непараметрические методы математической статистики: расчет достоверности отличий по критерию Q Розенбаума (для малых выборок), по критерию U Манна — Уитни, коэффициент ранговой корреляции Спирмена, факторный, многофакторный, кластерный и другие методы анализа.

Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, насколько данная методика соответствует (т.е. «работает», валидна) данной выборке.

В приложении 3 приведена классификация задач и основные рекомендуемые математико-статистические методы их решения, которые используются в психологии.

Основными важнейшими первичными статистиками, характеризующими распределение исследуемого признака, являются следующие.

Средняя арифметическая — это величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике се обозначают буквой (М) или (X). Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений.

Среднее квадратичное отклонение (обозначаемое греческой буквой, а — сигма) и называемое также основным, или стандартным, отклонением) — мера разнообразия входящих в группу объектов; она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах — разность между наибольшим и наименьшим значением в ряду. Однако сигма полнее характеризует разброс значений относительно средней арифметической.

Следует иметь в виду, что сигма (а) — величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по сути приведение к одинаковому масштабу величины (а).

Для нормального распределения существуют точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант (см. рис. 7.1):

  • 1) слева и справа от средней арифметической лежит 50% вариант;
  • 2) в интервале от М — 1ст до М + 1ст * 68% вариант;
  • 3) в интервале от М — 1,96а до М + 1,96а * 95% вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения психологического признака.

Следующими по важности характеристиками распределения показателей признака являются такие первичные статистики, как коэффициент асимметрии и эксцесс.

Коэффициент асимметрии — показатель скошенности распределения в левую или правую сторону по оси абсцисс. Если правая ветвь кривой длиннее левой — говорят о правосторонней (положительной) асимметрии (рис. 7.2); если левая ветвь длиннее правой — говорят о левосторонней (отрицательной) асимметрии (рис. 7.3).

Правосторонняя асимметрия.

Рис. 7.2. Правосторонняя асимметрия.

Левосторонняя асимметрия.

Рис. 7.3. Левосторонняя асимметрия.

Показатели эксцессивности распределения.

Рис. 7.4. Показатели эксцессивности распределения Эти параметры позволяют составить первое приближенное представление о характере распределения:

Эксцесс — показатель островершинности. Кривые, более высокие в своей средней части — островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины — с прогибом в средней части (рис. 7.4).

  • • у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и +1);
  • • эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2—4.

Однако это только приблизительная оценка. Точную и строгую оценку нормальности распределения можно получить, используя один из существующих методов проверки. (См., например, Суходольский Г. В. Основы математической статистики для психологов. СПб., 1998; Математические методы в психологии. СПб., 2003.).

В более простом варианте показатели асимметрии и эксцесса с их ошибками репрезентативности определяются по следующим формулам [60, с. 232−233]:

Анализ первичных статистик.

где А — асимметрия; В — эксцесс; (X, — М) — центральные отклонения; т — ошибка средней арифметической; п — количество испытуемых; а — стандартное отклонение.

Вычислить показатели асимметрии и эксцесса эмпирического распределения можно, используя функцию «Описательная статистика» в программе Excel. Данную операцию мы рассмотрим в пункте 7.2.3.

Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз:

Анализ первичных статистик.

где t — коэффициент асимметрии эксцесса.

Общей причиной отклонения формы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости [40, с. 61].

Такие эмпирические отклонения от нормального вида, как правоили левосторонняя асимметрия или незначительный эксцесс (или бимодальное распределение), довольно часто встречаются на практике. Связано это с особенностями экспериментальной выборки и используемыми измерительными процедурами.

В то же время рассматриваемые методы статистического анализа эмпирических данных вполне допускают отклонения от нормального распределения (одни — в большей степени, другие — в меньшей).

Но если требуется убедительное обоснование полученных результатов и производимых по ним вычислений, следует использовать в качестве дополнительных несложные методы непараметрической статистики.

Следующий момент, на который следует обратить особое внимание, относится к интерпретации психологического значения, выявляемого данным характером распределения. Что же выявляет кривая Гаусса в характеристике психологических явлений? Какой психологический смысл раскрывает кривая распределения данных, оценок, тестовых баллов исследуемого психологического признака?

Следует иметь в виду, что кривая распределения тестовых баллов (оценок, результатов выполнения заданий и т. д.), с одной стороны, отражает свойства пунктов, из которых составлен тест (задание), а с другой — характеризует состав выборки испытуемых, т. е. насколько успешно они справляются с заданием, насколько данный тест (задание) дифференцирует выборку по соответствующему качеству, признаку.

Если кривая имеет правостороннюю асимметрию[1], то это значит, что в тесте преобладают трудные задания (для данной выборки) (см. рис. 7.2); левосторонняя асимметрия указывает, что большинство пунктов в тесте — легкие (слабые) (см. рис. 7.3).

Таким образом, имеется два варианта объяснения:

  • 1) тест (задание) плохо дифференцирует испытуемых с низким уровнем развития способностей (свойств, качеств, характеристик): большинство испытуемых получают примерно одинаковый, низкий балл. Следовательно, тест необходимо упростить;
  • 2) тест хуже дифференцирует испытуемых с высоким развитием способностей (свойств, качеств, характеристик): большинство испытуемых получают достаточно высокий балл. Следовательно, текст необходимо усложнить.

Анализ эксцесса кривой распределения позволяет сделать следующие выводы в зависимости от формы распределения показателей (данных, вариант) психологического признака:

  • • когда возникает значительный положительный эксцесс (эксцессивная кривая) и вся масса баллов скучивается вблизи среднего значения (см. рис. 7.4, а), возможны следующие объяснения:
    • — ключ составлен неверно — объединены при подсчете отрицательно связанные признаки, которые взаимоуничтожают баллы. Но в практике психолога, который работает с валидными и надежными методиками, такие случаи исключаются (кроме собственной невнимательности и безответственности),
    • — испытуемые применяют, разгадав направленность теста (опросника), специальную тактику «медианного балла» — искусственно балансируя ответы «за» и «против» одного из полюсов измеряемого психологического признака;
  • • если подбираются пункты, тесно положительно коррелирующие между собой (т.е. испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс, принимающий форму плато (см. рис. 7.4, б);
  • • максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения — до образования двух вершин — двух мод (с «провалом» между ними — см. рис. 7.4, в). Такая бимодальная конфигурация распределения баллов указывает на то, что выборка испытуемых разделилась на две категории, подгруппы (с плавным переходом между ними): одни справились с большинством заданий (согласились с большинством вопросов), другие — не справились (не согласились). Такое распределение свидетельствует, что в основе заданий (пунктов) лежит какой-то один общий признак, соответствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, знание, умение), то они справляются с большинством пунктов, заданий, в противном случае — не справляются [42, с. 55—561.

Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант. Большие величины эксцесса и асимметрии часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру для компьютерной обработки. Грубые промахи при введении данных в обработку можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки.

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные — трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.

Другой причиной больших показателей эксцесса и асимметрии могут быть недостаточная надежность и валидность методик, используемых для данной популяции.

В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое, всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобщения, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются ошибками репрезентативности.

Репрезентативность — степень соответствия выборочных показателей генеральным параметрам.

Статистические ошибки репрезентативности показывают, в каких пределах могут отклоняться от параметров генеральной совокупности (от математического ожидания или истинных значений) наши частные определения, полученные на основе конкретных выборок. Очевидно, величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей вокруг их генеральных параметров.

В связи с этим в число первичных статистик обязательно входит статистическая ошибка средней арифметической. Формула для ее вычисления такова:

Анализ первичных статистик.

где тм — ошибка средней арифметической; п — число значений признака.

В психологии считается, что она показывает, на сколько показатель средней арифметической, полученной на данной выборке, может отличаться (варьировать) в ту или иную сторону (+ или -) в генеральной совокупности. Вот почему желательно указывать эту ошибку при оформлении табличных значений, полученных результатов исследования.

Перечисленные основные первичные статистики позволяют оценить характер распределения данных в экспериментальном массиве и использовать основные методы параметрической и непараметрической статистики для обоснования результатов эмпирического психологического исследования.

  • [1] При условии, что тестовые баллы по результатам обследования чем выше, тем лучшеразвито данное свойство, способность или качество.
Показать весь текст
Заполнить форму текущей работой