Помощь в учёбе, очень быстро...
Работаем вместе до победы

Хранилища данных. 
Информационные технологии в менеджменте (управлении)

РефератПомощь в написанииУзнать стоимостьмоей работы

Физическое ХД является репозиторием информации из оперативных источников данных. Позволяет только читать детальные и агрегированные данные, которые полностью очищены и интегрированы. Сбор (интеграция) поступающих из оперативных баз данных, внешних источников, архивов корпорации детализированных данных в едином хранилище с их согласованием и агрегацией. Виртуальное ХД — это система… Читать ещё >

Хранилища данных. Информационные технологии в менеджменте (управлении) (реферат, курсовая, диплом, контрольная)

Хранилище данных (ХД) — это предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений и единого места сбора и хранения данных организации.

В основе создания хранилища данных лежат две основные идеи.

  • 1. Сбор (интеграция) поступающих из оперативных баз данных, внешних источников, архивов корпорации детализированных данных в едином хранилище с их согласованием и агрегацией.
  • 2. Разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа.

Существует два типа ХД: виртуальное и физическое.

Физическое ХД является репозиторием[1] информации из оперативных источников данных. Позволяет только читать детальные и агрегированные данные, которые полностью очищены и интегрированы.

Достоинства и недостатки физического ХД сведены в табл. 14.1.

Виртуальное ХД — это система, предоставляющая доступ к обычной регистрирующей системе, которая эмулирует работу с ХД. Такое ХД можно организовать двумя способами:

Таблица 14.1

Достоинства и недостатки физического ХД

Достоинства.

Недостатки.

Непротиворечивость информации.

Один набор процессов извлечения и бизнес-правил.

Общая семантика.

Централизованная управляемая среда.

Легко создаваемые и наполняемые витрины данных.

Единый репозиторий метаданных.

Реализация требует больших затрат.

Высокая ресурсоемкость.

Потребность в системах и ресурсах в масштабе всего предприятия.

1) создать ряд «представлений» в базе данных; 2) использовать специальные средства доступа к базе данных (например, продукты класса desktop OLAP).

Основными преимуществами такой организации ХД можно считать простоту, невысокую стоимость реализации, единую платформу с источником информации, отсутствие сетевых соединений между источником информации и ХД. А серьезными проблемами является значительное время обработки запросов, интеграция данных с другими источниками, отсутствие истории, чистота данных, зависимость от доступности и структуры основной базы данных.

Создание ХД из независимых источников представляет собой многоэтапный процесс, включающий извлечение, преобразование и очистку, загрузку.

Извлечение данных представляет собой перенесение данных из разнородных источников в базу данных, где их можно модифицировать и добавить в хранилище.

Преобразование — устранение несоответствий в схеме данных и в соглашениях о значениях атрибутов. Например, в оперативной базе данных имя клиента хранится в трех полях: Фамилия, Имя, Отчество, а в хранилище — в одном (Имя клиента).

Очистка данных необходима для устранения аномалий и дублирования.

Преобразованные и очищенные данные при загрузке подвергаются дополнительной обработке: проверке на целостность, сортировке, агрегированию и индексированию.

Эффективное взаимодействие различных компонентов ХД реализуется с помощью метаданных — информации о структуре, размещении и трансформации данных. Различают административные метаданные (информация, требуемая для на;

стройки и использования ХД), бизнес-метаданные (бизнестермины и определения), а также оперативные метаданные (информация о происхождении перенесенных и преобразованных данных, статус и статистика использования данных и др.).

Таким образом, данные в ХД — это надежный источник, на основе которого строятся аналитические информационные системы.

  • [1] Репозиторий, хранилище — место, где хранятся и поддерживаются данные.
Показать весь текст
Заполнить форму текущей работой