Помощь в учёбе, очень быстро...
Работаем вместе до победы

Типы переменных. 
Статистика. 
Автоматизация обработки информации

РефератПомощь в написанииУзнать стоимостьмоей работы

Обычно, при внесении в компьютер информации для статистической обработки, ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз. Текстовые переменные. Содержат все допустимые символы. Различают короткие (не больше восьми… Читать ещё >

Типы переменных. Статистика. Автоматизация обработки информации (реферат, курсовая, диплом, контрольная)

Обычно, при внесении в компьютер информации для статистической обработки, ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз.

Различные методы анализа данных ориентированы на данные определенного типа. Для получения интерпретируемых результатов перед применением программы исследователь должен определить тип обрабатываемых соответствующим методом переменных.

Поскольку в дальнейшем методика автоматизированной обработки социологической информации будет излагаться применительно к пакету SPSS, рассмотрим типы переменных, предусмотренные в этом пакете.

Статистический пакет SPSS работает с типами переменных, список которых приведен в табл. 6.

Основные типы переменных для работы с пакетом SPSS.

Тип переменных.

Описание.

Numeric.

(численный).

Вещественное число с фиксированной точкой. Максимальное число символов: 40. Указывается в текстовом поле Width. Максимальное число цифр после десятичного знака: 16. Указывается в текстовом поле Decimal Places.

Comma.

Вещественное число с фиксированной точкой. В качестве десятичного знака используется точка. Тысячи отделяются друг от друга запятой.

Dot.

Scientific.

notation.

Вещественное число с фиксированной точкой. В качестве десятичного знака используется запятая. Тысячи отделяются друг от друга точкой Вещественное число с плавающей точкой.

Date.

Дата и время.

Dollar.

Денежный формат. В этом случае перед данными автоматически проставляется знак доллара.

Custom.

currency.

В данном случае пользователю предоставляется возможность построить свой формат.

String.

Текстовые переменные. Содержат все допустимые символы. Различают короткие (не больше восьми символов) и длинные (больше восьми символов) строковые переменные Большинство процедур SPSS используют короткие текстовые переменные или вообще не работают с ними.

При вводе и выводе данных надо учитывать следующие особенности их форматирования.

Численные форматы. В численных форматах десятичным разделителем может быть либо точка, либо запятая. Тип десятичного разделителя зависит от настроек диалогового окна Язык и стандарты (Regional Settings) на панели управления Windows. Точное значение переменной хранится внутри программы, а Редактор данных отображает на экране лишь заданное число десятичных разрядов. Значения, которые имеют больше десятичных разрядов, округляются. Для вычислений применяется точное значение.

Строковые форматы. В длинных строковых переменных значения дополняются пробелами до максимальной длины. Например, в строковой переменной длины 10 значение «SPSS» хранится внутри программы как «SPSS».

Форматы даты и времени. В форматах даты в качестве разделителей между значениями дня, месяца и числа могут применяться косая черта, дефис, пробел, запятая или точка. Можно выбрать один из нескольких форматов даты (dd-mm-yyyy, dd-mmm-yy, mm/dd/yyyy и т. д.). Дата в формате ddmmm-yy отображается с разделителем-дефисом и сокращением названия месяца из трех букв. Дата в форматах dd/mm/yy и mm/dd/yy отображается с разделителем-косой чертой и номером месяца вместо названия.

Всего доступно 27 различных форматов даты и времени. В форматах времени в качестве разделителе между значениями часов, минут и секунд могут использоваться двоеточие, точка или пробел.

При сборе данных, как правило, не удается избежать пропущенных значений. Во многих статистических методах, прежде всего одномерных, учет пропущенных значений не составляет проблемы, так как кроме соответствующего уменьшения количества наблюдений не нужно вносить никаких дополнительных изменений в расчетный метод.

Однако при двумерном, а тем более при многомерном анализе пропущенные значения в списках переменных создают более значительные проблемы, так как одного отсутствующего значения достаточно, чтобы сделать всю выборку непригодной для анализа.

Впрочем, для многих методов анализа в пакете SPSS предусмотрены специальные процедуры для выхода из такой ситуации. В SPSS допускаются два вида пропущенных значений:

  • • Пропущенные значения, определяемые системой SPSS. Если в матрице данных есть незаполненные численные ячейки, система SPSS самостоятельно идентифицирует их как пропущенные значения. Этот факт отражается в матрице данных с помощью запятой.
  • • Пропущенные значения, задаваемые пользователем. Если в определенных случаях у переменных отсутствуют значения, например, если на вопрос не был дан ответ, ответ неизвестен, или существуют другие причины, пользователь может с помощью специальной процедуры объявить эти значения как пропущенные. Пропущенные значения можно исключить из последующих вычислений.
Показать весь текст
Заполнить форму текущей работой