Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Тема: Информационные системы и базы данных.
Учебные вопросы:
Во всех сферах деятельности человека, связанных с необходимостью сбора, обработки и использования большого количества информации давно возникла идея использования информационных систем.
Первыми такими информационными системами стали библиотеки, архивы, адресные и телефонные справочные бюро и др.
Информационная система это комплекс, предназначенный для хранения информации в специальным образом организованной форме, обеспечивающей её накопление и обработку.
Любая ИС должна выполнять три основные функции:
Работа с ИС, реализованными в бумажном виде, сопряжена с большими затратами труда.
Компьютеризация позволила создать ИС, на несколько порядков повысив эффективность их работы и расширив среду их применения.
Компьютеризированные ИС получили название базы данных.
Появились:
Возникновение баз данных было вызвано накоплением больших количеств информации в виде данных. Возникли потребности в организации, хранении и эффективности использовании данных.
База данных на ЭВМ это организованная совокупность данных, предназначенная для длительного хранения во внешней памяти ЭВМ и постоянного их использования.
Организовать совокупность данных это значит расположить их в памяти ЭВМ в соответствии с определённым порядком. Первые технологии организации хранения документов возникли во второй половине 80х годов ХХ века.
Этому способствовали разработки ряда понятий:
Различными информационные объекты становятся из за своих уникальных свойств (например, имя или адрес). С точки зрения информатики каждый объект должен быть уникальным для обеспечения работы автоматических систем. В тех случаях, когда информационный обмен происходит между людьми и техническими устройствами используется принцип двойной адресации. Он заключается в применении средства преобразования адресов из одной формы в другую (FAT, NTFS таблицы размещения файлов).
Структура данных в виде записей (records) похожая на список, но отличающаяся тем, что может содержать данные разных типов. Для каждого типа данных в записи выделено отдельное поле. Поля образуют структуру записи. Данные соседних полей отделяются друг от друга символомразделителем (часто ).
Таблица (table) представляет собой информационный объект контейнерного типа. Она обеспечивает эффективный доступ к данным за счет того, что записи располагаются в цепочке контейнеров (ячейках) таблицы, имеющих собственную систему адресации. Кроме того, каждая запись в таблице имеет уникальное имя.
Файловая структура также использует в качестве структурных единиц контейнеры файлы. Кроме того структура включает в себя ряд контейнеров, способных включать в себя другие контейнеры вплоть до файлов папки. Файл имеет уникальное свойство имя (способ символьной адресации).
Требования к хранению данных обобщённо сводятся всего к требованиям экономичности и эффективности. На практике выполнение этих двух требований одновременно не получается.
Понятие база данных изначально связана с компьютерными системами, их историей и развитием.
В основе любой БД лежит модель данных, информационная структура. Термин «модель данных», впервые введенный в 1970х годах основоположником теории баз данных Джорджем Коддом, отображает совокупность правил создания структур данных в БД, последовательности их изменения.
Модель данных является средством интерпретации как содержимого будущей БД, так и реализации операций по обработке и управлению данными.
Для организации БД используют три типа информационных структур (моделей данных) иерархическую, сетевую и реляционную.
В иерархической БД существует упорядоченность элементов в записи (информационные объекты). Для неё характерна подчинённость объектов нижнего уровня объектам верхнего уровня.
Сетевая БД отличается большей гибкостью, так как дополнительно к вертикальным «иерархическим» связям в ней существует возможность установления горизонтальных связей. Это облегчает процесс поиска нужных данных, так как исчезает необходимость обязательного прохождения всех иерархических ступеней. Сетевая структура данных представляет собой произвольный граф.
Пример: Глобальная сеть Интернет. Связь между элементами осуществляется с помощью гиперссылок.
Реляционными (от английского relation отношения) являются БД, содержащие информацию, организованную в виде связанных логическими связями таблиц.
Характеризуется простотой структурных данных, удобными для пользователя табличным представлением, большими возможностями для автоматизации работы (посредством объектов форм, запросов, отчетов) с данными, ликвидацией избыточности (дублирования) данных при хранении (в отличие от иерархической модели). Реляционная связь между таблицами превращает базу данных в мощный инструмент для автоматизации работы с данными.
Реляционная модель данных предполагает использование некоторых новых понятий.
Отношение представляет собой двумерную таблицу, состоящую из заголовка и содержательной части.
Содержательная часть отношения состоит из компонентов:
Отношение
Домены |
|||
Кортежи |
001 |
А |
А |
002 |
А |
А |
|
003 |
А |
А |
|
Первичный ключ |
Атрибуты |
Для отношения также предусматривается уникальный идентификатор (первичный ключ, часто являющийся и индексом). В качестве уникального идентификатора могут выступать один или несколько атрибутов, значения которых являются уникальными в пределах данного отношения, определяющих его (идентификатор) однозначно.
Использование ключей в реляционной БД вызнано необходимостью обеспечить целостность данных. Это свойство, благодаря которому данные сохраняют заранее определённый вид и качество.
Связь между несколькими отношениями
Отношение 1 |
||||
Первичный ключ |
Внешний ключ 1 |
Внешний ключ 2 |
А |
А |
Отношение 2 |
||||
Первичный ключ |
А |
А |
||
Отношение 3 |
||||
Первичный ключ |
А |
А |
А |
Планирование конфигурации базы данных.
Построение любой базы данных необходимо для хранения и использования информации о какойлибо предметной области (всё начинается с предметной области).
Проведение большой предварительной работы является, как правило, наименее понятным аспектом создания БД. Эту работу лучше сначала проводить без компьютера.
При разработке БД принято выделять уровни моделирования, которые служат переходом от предметной области к реализации БД на конкретной СУБД:
Представляет описание части реального мира, которое должно охватывать реальные объекты и процессы. Так, в качестве предметной области можно выбрать работу отдела кадров предприятия, учёт успеваемости студентов вуза и т.д. предметная область многогранна и включает в себя массу понятий и данных. Задача состоит в определении, какие понятия и данные должны быть отраженные в будущей БД, для обеспечения решения стоящих перед ней задач.
Основным понятием на данном этапе является информационный объект. Это информационное описание некоторой сущности предметной области (реального объекта) или связанных с ним событий, процессов.
Реальная сущность описывается своими признаками именованными свойствами.
Информационный объект. Это информационное описание некоторой сущности предметной области (реального объекта) или связанных с ним событий, процессов. Информационный объект образуется совокупностью логически связанных атрибутов, представляющих качественные и количественные характеристики. Информационный объект это обобщенное понятие, имеющее множество реализаций экземпляров.
Каждый экземпляр информационного объекта характеризуется уникальным набором конкретных значений атрибутов.
Между информационными объектами определяются связи, описывающие их взаимодействие. Связь характеризуется классом принадлежности, показывающим обязан ли каждый экземпляр информационного объекта участвовать в связи (обычно: обязан 1, не обязан -2) и степенью связи, определяющей максимальное количество экземпляров одного информационного объекта, связанных с одним экземпляром другого (обычно 1 или * - много).
Организация и установка порядка полей в нескольких отношениях, установление связей между ними для исключения дублирования информации называется нормализация.
Установление соотношений между данными в отдельных отношениях, понимание того, куда лучше всего разнести информацию по разным отношениям и определение ключевых полей и индексов это навыки, лежащие в основе качественного планирования БД.
Пример: фрагмент инфологической модели ВУЗа:
№ зачетной книжки
Студент
ФИО
Наименование
Факультет
Дата поступления
Семестр
Вид контроля
Предмет
Название
Количество часов
изучает
1, *
изучается
Обучаются
1, *
Обучают