Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Распределенная система баз данных: таксономия
Система мультибаз данных это распределенная система, которая служит внешним интерфейсов для доступа к множеству локальных СУБД или структурируется как глобальный уровень над локальными СУБД.
Различные классы систем мильтибаз данных. Сильносвязанные системы
Распределенные базы данных
Мультибазы данных с глобальной схемой
Федеративные базы данных
Неоднородные системы мультибаз данных с общим языком доступа
Однородные системы мультибаз данных с общим языком доступа.
Интероперабельные системы. Слабосвязанные системы
Однородные распределенные базы данных.
Мультибазы данных с глобальной схемой
Причины:
Сложности создания глобальной схемы:
Клиентские приложения могут быть распределены на множестве узлов. Каждое приложение для осуществления операции над локальной БД должно иметь доступ к глобальной схеме.
Первый подход: |
Второй подход: |
Глобальная схема централизована, поддерживается на одном узле. Недостатки:
|
Глобальная схема распределена по всем узлам корпоративной сети, где могут выполняться клиентские приложения. Недостатки:
|
Федеративная база данных
Сложности:
Федеративная БД промежуточная модель между управлением распределенной информацией архитектурой «клиент-сервер» и мультибазами данных с глобальной схемой.
Однородные / неоднородные системы мультибаз данных с общим языком доступа.
Интероперабельные системы
Клиентские приложения
Классическая архитектура мультибазы данных с глобальной схемой
Сервисы словарей и справочников
Сервисы баз данных предприятия
Менеджер транзакций
Механизм обработки распределенных запросов
Интегрирующий слой: глобальная схема или другой механизм интеграции.
Oracle Rdb VMS DB2 Xbase
другие менеджеры данных
системы поиска файлов
Объективные СУБД
Другие реляционные модели
Концептуальная архитектура мультибаз данных.
Сервисы баз данных.
Для включения в системы менеджеров данных, не относящихся к категории СУБД, необходимы дополнительные сервисы БД, которые должны обеспечивать:
Медиаторы
Медиатор это программный модуль, предназначенный для «упрощения, абстрагирования, сокращения, слияния и объяснения данных», которыми обмениваются приложения и БД в некоторой среде.
Интегральная целостность данных в системах мультибаз данных.
Политранзакция транзакция глобального уровня, способная генерировать «последовательности взаимосвязанных транзакций, обеспечивающих взаимную непротиворечивость на множестве взаимосвязанных баз данных»
Трудности:
Нерешенные проблемы
Нерешенные проблемы:
Хранилище данных
Основные понятия
Хранилище данных (ХД) предметно-ориентированный, интегрированный, некорректируемый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений
Хранилище данных должно предложить такую среду накопления данных, которая оптимизирована для выполнения сложных аналитических запросов.
Источник данных различные приложения, которые могут выполняться на разных платформах.
Архитектура хранилища данных (Data Warehouse)
Источник данных 1 (операционная БД)
Хранилище Данных (data Warehouse) Обработанные выходные данные(data mart n)
Извлечение данных
Принципы организации
Принцип организации хранилища данных предполагает разделение структур хранения данных для
Хранилище данных
Оперативной обработки выполнения аналитических запросов
Это позволяет в рамках одной системы поддержки и принятия решений объединить две подсистемы, удовлетворяющие противоречивым требованиям.
Существует 4 основополагающих принципа:
Предметная ориентация означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они описывают, а не с приложениями, в которых они используются.
Позволяет хранить в хранилище данных только те данные, которые нужны для анализа. Это существенно сокращает затраты на носители информации и повышает безопасность доступа к данным.
Интегрирует информацию в хранилище данных, отражающую разные точки зрения на одну предметную область.
Интеграция
Данные, отражающие один и тот же объект реального мира в разных системах, описывают его по-разному.
Операция чтения/записи над БД
Информационная система руководителя
Приложение 1
Операционная БД
Информационный запрос
Хранилище данных
Операционная БД
Приложение 2
Периодическое пополнение ХД
Постоянство данных заключается в том, что
Данные в хранилище данных
При этом:
Постоянство данных позволяет существенно повысить скорость доступа к данным.
Изменение во времени
В хранилище данных данные должны соответствовать последовательным интервалам времени и быть согласованы во времени. С другой стороны для анализа данных важно знать не только значение данных, но и время их появления, а также изменения показателей предметной области.
Проектирование хранилища данных
При проектировании хранилищ данных особое значение приобретают следующие процессы работы с данными
Извлечение данных
Операция извлечения данных
Извлечение перемещение информации от источника данных в базу хранилища данных
Хранилище данных
База хранилища данных
Источник данных 2
Источник данных 1
Специальные компоненты хранилища данных должны обеспечить своевременное извлечение данных и преобразование к единому формату на основе информации из словаря метаданных.
Словарь метаданных включает в себя:
Преобразование данных
Процесс преобразования данных должен обеспечивать подготовку информации к хранению в том виде, который оптимизирован для быстрого исполнения запросов, необходимых для принятия решений
Преобразование данных заключается в анализе необработанных данных и решений, как они будут представлены конечному пользователю
Для разработки эффективного процесса преобразования необходимо
Хорошо проработанная модель данных модель технологии принятия решений
Извлечение знаний
Помимо извлечения данных для принятия решений весьма актуален процесс извлечения знания (Data Mining) в соответствии с информационными потребностями пользователя.
В процессе извлечения знаний должны решаться следующие задачи:
Номер фрагмента для кадого кортежа определяется применением хеш-функции к какому-либо его атрибуту.
Фрагментация хешированием в меньшей степени подвержена «Перекосам»
Активные базы данных
Традиционные БД пассивные
Не являются активными «игроками» в ИС, а играют организационную роль, направленную на обеспечение, хранения данных.
Вся процедурная логика | Сфера управления данными.
Активные БД
Процедурные элементы общей среды встраиваются в СУБД.
Технология АБД:
Данные + операции и процедуры.
Хранятся вместе.
Абд система следующая правилам Событие-Условие-Действие
Принципы АБД:
Эти возможности выносятся из программ приложений в саму БД, обеспечивая более тесную связь системных данных и операции над данными, чем это было принято в традиционных пассивных управляемых СУБД системах.
Логика обработки
АБД предусматривают возможности, позволяющие содержать логику обработки (до некоторой степени) в самой БД так, чтобы она управлялась СУБД, а не прикладным программным обеспечением приложений.
Средства мониторинга для активизации триггеров.
АБД предусматривают возможности, позволяющие обеспечивать некоторую форму мониторинга событий и условий, которые воздействуют на данные и могут инициировать обработку, управляемую БД.
Триггеры
АБД предусматривают возможности использования некоторых средств с помощью которых события и условия допускают некоторую логику внутри базы данных.
Конструкции АБД
В создании активных сред помогают следующие основные конструкции БД.
Ограничения простые конструкции, имеющие вид от спецификации связей первичного и внешнего ключей, используемых в ограничениях целостности в реляционных БД.
Ограничения могли бы рассматриваться как первое средство для встраивания нужных правил в БД вместо использования для этой цели логики приложений.
Ограничения обычно ассоциируются с конкретными объектами БД, как таблицы и определенные столбцы.
Утверждение представляет собой самостоятельную декларацию в схеме, используемую для спецификации ограничения, которое может затрагивать больше одной таблицы.
Преимущество перед основными ограничениями.
Утверждения самостоятельные сущности, которые не обязательно должны содержаться в определении какой-либо таблицы.
Так как дано бизнес-правило охватывает несколько таблицы БД, более естественно представить его в отдельном виде.
Хранимые процедуры.
-Программируемая логика
Хранимая процедура представляет собой просто модуль прикладной программы с той лишь разницей, что он относится к БД, а не к внешней программной системе, использующей эту БД. Хранимые процедуры могут определяться относительно одной или более таблиц БД, точно так же как ограничения и утверждения.
Триггеры
Ключевые компоненты, обеспечиюващие превращение БД в активную среду.
Средства для:
После операции встауки, обновления и/или удаления может быть запущен триггер, который приведет в результате к вычислению бизнес-правил или к выполнению определенных действий.
Ограничения БД
По существующей в настоящее время технологии в моделях АБД существуют следующие ограничения.
Объектно-ориентированные системы управления базами данных (ОО СУБД)
Мотивация: необходимость поддержки сложных приложений, адекватно представляющих объекты реального мира.
Достоинства и недостатки ОО СУБД
Мотивация
Цель: обеспечение тесных связей между ИС и системами реального мира.
Проблема: потеря семантика.
Потеря семантики
Объектры реального мира обладают свойствами и функциями, применимыми к ним, которые обеспечивают определение и классификацию этих объектов.
Объекты связываются друг с другом:
При моделировании объектов реального мира и отображении их в структуры данных, большая часть информация о них теряется. Системы БД не поддерживают семантику объектов и процессов внутренними модельными средствами.
Мотивация ООБД и ОО СУБД
Шаг 1:
Создание структур, учитывающих специфику приложений и способных удерживать семантику, реализовывается с помощью семантически богатой модели данных, отображающейся в поддерживающие таблицы реляционной БД
Недостатки:
Шаг 2:
Попытка встроить семантику в сам механизм управления базой данных и исключить промежуточные уровни отображения.
ОО СУБД
ODMG представляет ООСУБД как «СУБД, которая соединяет в себе возможности БД с возможностями объектного языка программирования».
ООСУБД используется для того, чтобы расширить этот язык (ЯП) средствами долговременного хранения данных, управления параллелизмом, спецификациями ассоциативных запросов, а также другими возможностями БД.
Характерные черты среды ОО СУБД
Характеристики ООБД
Особенности разработки
Совместное использование информации всеми участниками разработки ООБД (в отличие от традиционных методологий)
Объектно-ориентированная методология.
Разработчики приложений
Библиотека классов
Проектирование
База данных
Приложения ООБД
Программисты на ОО-языках
Реляционные СУБД
Гибридные СУБД
Объектно-ориентированные СУБД
Расширенные реляционные СУБД