Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
5.2. Організація баз даних автоматизованої інформаційної системи
Для задоволення інформаційних потреб усіх користу-начів в АІС існує банк даних (БнД) один з основних ком¬понентів інформаційного забезпечення ІС, який ще нази¬вають системою БД, що не змінює смислове навантаження цього поняття.
До БнД входять такі складові: обчислювальна система (сукупність апаратного або технічного та програмного за¬безпечення); БД; СУБД; словник даних (метаданих); група адміністратора БД. Структуру БнД показано на схемі 13.
Інформаційним ядром цієї системи є база даних.
База даних динамічна модель, яка відображає семантику ПС та інформаційні запити кінцевих користувачів ІС.
На всіх етапах життєвого циклу БД складається з двох компонентів: структури та даних. На різних рівнях абс¬тракції опису БД її структура зображується по-різному, ліс показано на схемі 14.
на концептуальному шфологічному рівні структура БД ефективно відображається у вигляді ЕК-діаграми діаграми "Епігіу Ке1а<;іоіі8пір" ("Сутність зв'я¬зок"), запропонованої у 1976 р. П. Ченом; на концепту¬альному даталогічному рівні вона є або ієрархічною, або мережною, або реляційною, або об'єктно-орієнтованою, або об'єктно-реляційною, або багатовимірною, або гібрид¬ною моделлю даних. На фізичному рівні структура БД це структура файлів даних і допоміжних файлів.
Самі файли даних також складаються з двох компо¬нентів: структури та даних. Структура файла в реляційній моделі (схема 15) це ім'я, тип поля, його довжина, точ¬ність (для числових полів).
Структура ідеальної БД має бути чіткою, ясною і про¬зорою. БД має бути вільною від баластної інформації: дублювання даних, синонімів, омонімів, груп даних, що повторюються, обчислювальних елементів.
Елементи даних, які обчислюються, не можуть збері¬гатися тільки в разі транзакційної або операційної БД, яка, на відміну від аналітичної, не містить агрегатів да¬них. Оскільки транзакційна БД є обов'язковим елементом будь-якої ІС та здебільшого реляційною, у подальшому матеріал орієнтовано на цю категорію БД.
БД повинна містити мінімальну кількість елементів даних, які несуть максимум інформації про стан ПС. Еле¬менти БД мають бути організовані оптимальним спосо¬бом, тобто таким чином, щоб забезпечити сталість БД у ро-
на концептуальному шфологічному рівні структура БД ефективно відображається у вигляді ЕК-діаграми діаграми "Епігіу Ке1а<;іоіі8пір" ("Сутність зв'я¬зок"), запропонованої у 1976 р. П. Ченом; на концепту-альному даталогічному рівні вона є або ієрархічною, або мережною, або реляційною, або об'єктно-орієнтованою, або об'єктно-реляційною, або багатовимірною, або гібрид¬ною моделлю даних. На фізичному рівні структура БД це структура файлів даних і допоміжних файлів.
Самі файли даних також складаються з двох компо¬нентів: структури та даних. Структура файла в реляційній моделі (схема 15) це ім'я, тип поля, його довжина, точ¬ність (для числових полів).
Структура ідеальної БД має бути чіткою, ясною і про¬зорою. БД має бути вільною від баластної інформації: дублювання даних, синонімів, омонімів, груп даних, що повторюються, обчислювальних елементів.
Елементи даних, які обчислюються, не можуть збері¬гатися тільки в разі транзакційної або операційної БД, яка, на відміну від аналітичної, не містить агрегатів да¬них. Оскільки транзакційна БД є обов'язковим елементом будь-якої ІС та здебільшого реляційною, у подальшому матеріал орієнтовано на цю категорію БД.
БД повинна містити мінімальну кількість елементів даних, які несуть максимум інформації про стан ПС. Еле¬менти БД мають бути організовані оптимальним спосо¬бом, тобто таким чином, щоб забезпечити сталість БД у ро-
ню, екранних форм, звітів та інших компонентів ПЗ). Нині найбільшою популярністю користуються СУБД реляційного типу Словник метаданих сам по собі є БД, що містить дані про дані, тобто інформацію про саму БД, і є інструментом адміністратора БД У словнику корисно мати такі дані: ім'я, тип, довжи- іну, точність, допустимі значення кожного елемента даних; назви файлів даних і допоміжних файлів, що забезпечують доступ до даних; адреси цих файлів, кількість записів, які зберігаються (мають формуватися автоматично при роботі з даними); дати реєстрації змін у структурах да- і них (теж мають формуватися автоматично); дані про адміністраторів, які керують файлами, та іншу інформацію.
Система управління БД разом з обчислювальною системою та словником БД є інструментальним засобом розроблення та супроводу БД
Адміністратор БД особа або група осіб, які відповідають за загальне керування БД.■]
До обов'язків адміністратора БД належать: визначення інформаційного змісту БД, структури зберігання та
стратегії доступу, взаємодія з користувачами, визначення контролю повноважень і процедур перевірки вірогідності І даних, а також стратегії відновлення даних, керування ефективністю БД.
5.3. Формулювання та аналіз вимог до бази даних
Будь-яка ІС за своєю природою є антропоморфною. Розробник такої системи мимоволі використовує досвід оброблення інформації вручну або за допомогою комплек¬су інструментальних засобів попереднього покоління.
Особливо це стосується оброблення економічної інфор¬мації, яку від технічної відрізняє не тільки наявність ве¬ликих текстових масивів і даних, що часто повторюються, а й наявність багатого досвіду ручного або автоматизова¬ного оброблення. Зокрема, такий досвід накопичено у про¬цесі розв'язування задач, пов'язаних з обробленням фі¬нансової та комерційної інформації, обліком і зберіганням фондів та засобів підприємств й установ, обліком просу¬вання товарів, виконанням біржових та банківських опе¬рацій і багатьох інших задач.
Не випадково автори технології SSADM (Structured System Analysis and Design Method) методології струк¬турного аналізу та проектування систем наполягають на максимальній спадковості робіт під час проектування. З 1993 p. SSADM є національним стандартом проектуван¬ня автоматизованих систем у Великобританії, а з 1998 р. основою європейського стандарту.
Тому надзвичайно важливим і відповідальним етапом проектування як ІС, так і БД, є передпроектна стадія, на якій проводяться співбесіди з виконавцями робіт, що під¬лягають автоматизації. Власне вони в перспективі й бу¬дуть користувачами ІС та БД.
У процесі проектування БД (як і при проектуванні ІС) потрібно дотримуватись принципів системної єдності, роз¬витку, сумісності, стандартизації.
Завдання створення єдиної системи БД для великого підприємства неймовірно складне. Виняток становлять порівняно невеликі підприємства й установи.
Часто різні підрозділи організації використовують різні позначення для одних і тих самих елементів даних і по-різному організовують процес оброблення цих даних. Поетапне впровадження ІС на підприємстві за таких обс¬тавин зводиться до трудомісткого та хворобливого проце¬су узгодження розробок локальних ІС різних підрозділів.
Сфера застосування БД має визначатися незалежно від будь-якої прикладної задачі в межах певної ПС, а при змі¬ні меж ПС повинна відбивати інформаційні потреби яко¬мога всіх підрозділів підприємства чи установи. Іншими словами, БД має бути універсальною, придатною для розв'язання багатьох прикладних задач і відкритою для подальшого нарощування її структури. Для цього вона має бути логічно та фізично незалежною.
Проте організації часто не мають коштів для розроб¬лення логічної моделі ПС, що охоплювала б інтереси всіх підрозділів. Як правило, БД розробляють і впроваджують поетапно.
Тому системному аналітику слід точно визначити по¬тенційну сферу застосування БД як щодо майбутнього стикування локальних розробок між собою, так і щодо можливого розширення функцій організації загалом. Не випадково нині розрізняють системних аналітиків зі стра¬тегічного планування автоматизації управління підпри¬ємством і системних аналітиків постановників кон-кретного завдання автоматизації.
З метою визначення сфери потенційного застосування БД рекомендується використовувати функціональну схе-
му підприємства та схему інформаційних потоків між під¬розділами.
Вимоги до БД, що розроблюється, або властивості, які вона повинна мати, на сьогодні є класичними. До них на¬лежать:
- функціональна повнота властивість БД, що забез¬печує повноту відповідей на інформаційні запити користу¬вачів ІС. Забезпечується повнотою збирання інформації про стан ПС і запити потенційних користувачів ІС;
- мінімальна (керована) надмірність властивість БД, що дає змогу мати в ній понад необхідний мінімум да¬них тільки ті, які використовуються для зв'язування за¬писів, що описують різноманітні об'єкти ПС. Надмірність даних є причиною аномалій (включення, вилучення, реда¬гування даних) і, як наслідок, стає причиною порушення таких важливих властивостей БД, як цілісність, несупе-речливість, логічна і фізична незалежність, розширюва¬ність. Мінімальна надмірність досягається вилученням елементів даних, що дублюються, обчислювальних еле¬ментів даних, нормалізацією логічного подання даних;
- цілісність БД властивість БД, що дає змогу збері¬гати певні обмеження значень даних при всіх модифікаці¬ях БД. У БД розрізняють такі види цілісності: цілісність домену; цілісність таблиці; цілісність посилання; ціліс¬ність, обумовлену правилами бізнесу;
- цілісність домену властивість, що забезпечує при¬належність кожного елемента логічного запису певному домену. Ця властивість забезпечується засобами СУБД за допомогою параметрів, які визначає розробник: ім'я поля, тип даних, довжина поля, точність для числових полів, ді¬апазон числових змінних;
- цілісність таблиці властивість, що забезпечує унікальність кожного логічного запису в ній;
- цілісність посилання властивість, що забезпечує синхронне поновлення даних у семантично зв'язаних таб¬лицях;
- цілісність, обумовлена правилами бізнесу, забезпе¬чується спеціальними процедурами перевірки та вилучен¬ня логічних записів, що не відповідають вимогам семанти¬ки ПС;
- цілісність, пов'язана з поняттям несуперечливос-ті даних, обумовлюється багатьма чинниками. Одним із найбільш очевидних джерел суперечливості БД є наяв¬ність омонімів і синонімів в описі даних. У процесі зби¬рання інформації дані уточнюються й омоніми та синоні-
ми вилучаються зі схеми даних. Найбільш серйозним джерелом суперечливості даних є наявність ненормалізо-ваних відношень у логічній моделі ПС. На етапі проекту¬вання реалізації виконується нормалізація логічного по¬дання даних.
Ще одним джерелом суперечливості даних є помилки введення. В цьому разі спрацьовує відоме правило "TITо ввів, те й одержав".
Найпотужнішим засобом вилучення помилок введен¬ня є його дублювання. Проте такий захід потребує дуб¬лювання обчислювальних потужностей і виконавців, спеціальних процедур порівняння введених даних, що не завжди доцільно з фінансових міркувань. Частіше вико¬ристовують спеціальні процедури перевірки даних, які вводяться.
Одним із важливих заходів зменшення кількості по¬милок є запобігання повторному введенню даних із клаві¬атури. Повторно необхідні значення вводять вибором їх із раніше організованих довідників у скролінговому режимі (тобто режимі перегляду). З метою зниження кількості помилок введення там, де це можливо, передбачають під¬становку обчислених (наприклад, нарощуваних за лічиль¬ником) значень замість їх введення з клавіатури.
Найбільш очевидним для розробника-програміста джерелом суперечливості даних є повторення даних у ключових полях файлів, яке інтерпретується як порушен¬ня цілісності таблиці.
Створення унікального індексного або ключового фай¬ла чи спеціальної процедури, що запобігатиме дублюван¬ню записів з однаковим ключем, є недостатнім заходом за¬хисту від суперечливості даних. У разі повторення значен¬ня унікального ключа у спеціальному вікні треба вивести повідомлення для користувача про дублювання даних і пе¬редбачити можливість вибору: залишити попереднє зна¬чення чи ввести нове.
Наступним джерелом суперечливості даних є несин-хронне поновлення інформації у файлах БД, яке інтерпре¬тується як порушення цілісності посилань. Абсолютно неприпустимим з точки зору суперечливості даних є зміна параметра тільки в одному файлі, якщо він присутній в ін¬ших.
При вилученні залежності від шляху в ієрархічних і мережних фрагментах моделі даних в залежні записи включають ключі породжувальних записів. Загалом на¬віть не дуже складна даталогічна модель є складною мережею. При "розв'язуванні" зв'язку М:М створюють додат¬ковий запис-зв'язок з ключами записів, що зв'язуються. В усіх наведених ситуаціях ключі повторюються в різних файлах, несинхронне поновлення яких призводить до по¬рушення цілісності посилань або суперечливості даних.
Синхронність поновлення даних забезпечується роз¬робленням спеціальних програмних процедур.
Важливим фактором забезпечення несуперечливості даних є врахування часу. Дані, що зберігаються, актуаль¬ні протягом певного проміжку часу. Навіть якщо при ручному обробленні інформації параметр "Дата" в доку¬ментах відсутній, слід його включити в модель даних, ос¬кільки він може відіграти значну роль у процесі введення даних у БД.
Не менш суттєвим є уточнення системної дати обчислю¬вальної системи перед початком роботи з нею, тому що ця дата часто не відповідає дійсності. Для цього слід надати можливість користувачеві за потреби змінити поточну дату;
- узгодженість БД властивість, що дає змогу забез¬печити видачу однакової відповіді на один і той самий за¬пит усім користувачам ІС. Забезпечується спеціальними процедурами розмежування доступу користувачів до да¬них і відповідною організацією інтерфейсу користувача;
- відновлюеаність БД властивість, що дає змогу за¬безпечити відновлення даних після будь-якої нештатної ситуації в системі. Забезпечується спеціальними процеду¬рами регулярного страхового копіювання файлів даних і допоміжних файлів на вінчестер та періодичним копію¬ванням даних на ГМД або стримерні магнітні стрічки;
- безпечність БД властивість, що дає змогу забезпе¬чити захист даних від навмисного чи випадкового доступу до даних, їх модифікації або руйнування. Забезпечується спеціальними процедурами паролювання доступу до да¬них або процедурами аутентифікації;
- ефективність БД властивість, що дає змогу забез¬печити мінімальний час відгуку системи на запити корис¬тувачів при обмеженнях ємності пам'яті та виконанні всіх вимог до БД. Забезпечується оптимальним вибором тех¬нічного і програмного забезпечення, ОС, СУБД, побудо¬вою оптимальної логічної та фізичної моделей даних;
- логічна і фізична незалежність властивість, що забезпечує можливість зміни загальної логічної структу¬ри даних без зміни подання прикладних програм про дані та зміни фізичної структури даних без зміни їхньої логіч¬ної структури. Забезпечується нормалізацією логічного
подання даних й організацією на фізичному рівні універ¬сальних програмних модулів, що відповідають принци¬пам структурного підходу до програмування;
- розширюваність (відкритість) БД властивість, що забезпечує зміну логічної та фізичної моделей даних при зміні меж ПС тільки завдяки доданню нових струк¬турних компонентів БД. Забезпечується оптимальною ор¬ганізацією даних на логічному та фізичному рівнях;
дружність інтерфейсу користувача властивість БД, що забезпечує користувачеві комфортний доступ до даних в інтерактивному режимі. Ця вимога не належить до класичних. Вона зумовлена необхідністю роботи корис¬тувача ІС в інтерактивному режимі, задовольняється ре¬тельним розробленням сценарію діалогу: меню, вхідних і вихідних екранних форм, твердих копій документів, ек¬ранних форм сервісного обслуговування БД.
Більшість вимог до БД пов'язані між собою. Вони задо¬вольняються на різних етапах проектування БД різними засобами. Загальна вимога до всіх етапів проектування по¬лягає в недопущенні дублювання даних.
Цілісність БД пов'язана з несуперечливістю або вірогід¬ністю та мінімальною надмірністю, несуперечливість із мінімальною надмірністю. Логічна та фізична незалеж¬ність пов'язана з мінімальною надмірністю, несуперечли¬вістю, цілісністю БД. Ефективність залежить від мінімаль¬ної надмірності, несуперечливості, логічної та фізичної незалежності БД. Розширюваність пов'язана з логічною та фізичною незалежністю і мінімальною надмірністю БД.
Головним засобом забезпечення таких вимог до БД, як мінімальна надмірність, цілісність, несуперечливість, ло¬гічна та фізична незалежність, є нормалізація логічного подання даних.
Відповідність властивостей БД та етапів її проектуван¬ня наведено в табл. 6.