< Попер   ЗМІСТ   Наст >

Сучасні інформаційні сховища

В теперішній час використання баз даних не дає бажаного результату від автоматизації діяльності організації. Причина проста: реалізовані функції значно відрізняються від функцій ведення бізнесу, так як дані, зібрані в базах, не адекватні інформації, яка потрібна особам, які приймають рішення. Рішенням даної проблеми стала реалізація технології автоматизованого банку даних та інформаційних сховищ [8, 9].

Автоматизований банк даних

Автоматизований банк даних (АБД) – це система інформаційних, математичних, програмних, мовних, організаційних і технічних засобів, які необхідні для інтегрованого накопичення, зберігання, ведення, актуалізації, пошуку і видачі даних. АБД класифікують за ознаками:

  • 1) за призначенням,АБД бувають:
    • – інформаційно-пошуковими;
    • – спеціалізованими за окремими галузями науки та техніки;
    • – банками даних для автоматизації задач організаційно-економічного управління;
    • – банками даних для систем автоматизації наукових досліджень і виробничих випробувань;
    • – банками даних для систем автоматизованого проектування.
  • 2) за архітектурою обчислювального середовища, АБД бувають централізованими і розподіленими.
  • 3) за видом інформації, що зберігається, розрізняють: банки даних, банки документів і банки знань.
  • 4) за мовою спілкування користувача з БД розрізняють: системи з базовою мовою (відкриті системи) та власною мовою (закриті системи). У відкритих системах мовним засобом спілкування з БД є одна з мов програмування, наприклад Фортран, Паскаль тощо. У таких системах для спілкування з БД потрібний посередник, тобто програміст, який володіє вибраною мовою програмування. Закриті системи мають власну мову спілкування, яка набагато простіша за мови програмування. Тому в таких системах не потрібний посередник-програміст для спілкування з БД. Самі користувачі за відповідної підготовки зможуть працювати з БД.

Основними складовими компонентами АБД є база даних і система управління БД (СУБД) [8, 9].

База даних- це пойменована, структурована сукупність взаємопов'язаних даних, які характеризують окрему предметну область і перебувають під управлінням СУБД. БД являє собою інтегроване сховище даних, яке призначене для використання багатьма споживачами і забезпечення незалежності даних від прикладних програм. Зв'язок кінцевих користувачів та прикладних програм з БД відбувається через СУБД, яка є інтерфейсом між користувачами і БД.

Під предметною областю розуміють один чи кілька об'єктів управління, інформація яких моделюється за допомогою БД і використовується для розв'язування різних функціональних задач. Усі дані, які зберігаються в БД, поділяють на фонд і архів даних. Такий поділ пов'язаний із різницею в технологічних режимах використання даних.

Фонд даних – це активні дані, з якими постійно працюють прикладні програми, які зберігаються на вінчестері і перебувають безпосередньо під управлінням СУБД.

Архіви – це копії файлів БД, які зберігаються на різних носіях. В архівах зберігаються неактивні дані, що вже відпрацювали, але які необхідно зберігати згідно із законодавчими та нормативними актами досить тривалий час. В архівах також можуть зберігатися страхові копії файлів БД, які використовуються для відновлення БД на випадок її зруйнування через різні збої.

Особливістю БД є те, що вона складається з даних та їх опису. Опис даних називають метаданими. Метадані дають змогу реалізувати незалежність даних від прикладних програм. При файловій організації даних потрібно в кожній прикладній програмі повністю описати структури відповідних інформаційних файлів, незалежно від того, скільки полів обробляється в тій чи іншій програмі. При використанні БД у програмі потрібно описувати лише поля, потрібні для обробки. Отже, метадані є незалежними від прикладних програм і являють собою самостійний об'єкт для зберігання.

В АБД існує ще таке поняття, як словник даних (СД). СД дуже важливий, особливо в умовах колективного використання даних, оскільки забезпечує вирішення проблеми вірогідності, надлишковості і контролю за раціональним зберіганням та використанням даних.

Словник даних (репозитарій) необхідний для збереження метаданих. Словник даних може містити відомості про джерело інформації" формати та взаємозв'язок між даними" відомості про частоту виникнення і характер використання даних, терміни коригування і осіб, відповідальних за це, і т. інш. Отже, СД являє собою базу даних про дані як особливий вид ресурсу.

Одне з основних призначень СД – документування даних. Йому відводиться роль засобу централізованого ведення та управління даними на всіх етапах проектування системи, а також забезпечення ефективної взаємодії між всіма користувачами в розподіленій БД. У СД може бути занесена інформація про місце фізичного зберігання даних, а також відомості про обмеження секретного характеру, безпеки, доступу та інші питання, що характеризують фізичні параметри БД.

Пакет програм ведення СД може інтегруватися із СУБД чи бути незалежним. На сучасному ринку програмних засобів є СУБД, які мають у своєму складі засоби автоматизованого ведення СД.

Словник – це один із важливих компонентів, що містить імена користувачів; права та привілеї, які їм надаються; імена об'єктів БД (таблиць та їх представлень, індексів, синонімів тощо); перелік обмежень на таблиці; журнальну інформацію, наприклад, відомості про доступ до таблиць та внесення до них змін. Інформація словника розбита за категоріями: для кінцевого користувача, проектувальника і адміністратора. Словник відображає та зберігає поточний стан бази даних, всі зміни в структурах БД записуються в словник безпосередньо після виконання процедур щодо їх зміни.

Словником даних користуються всі користувачі в обсязі, який дозволяють їх привілеї.

До складу АБД обов'язково входить такий компонент, як СУБД, що є комплексом програмних і мовних засобів загального та спеціального призначення, необхідних для створення БД, підтримки її в актуальному стані, маніпулювання даними й організації доступу до них різних користувачів чи прикладних програм в умовах чинної технології обробки даних.

Усі численні функції СУБД можна згрупувати так:

  • 1. Управління даними. Завданнями управління даними є підготовка даних та їх контроль, занесення даних до бази, структуризація даних, забезпечення їх цілісності, секретності.
  • 2. Доступ до даних. Пошук і селекція даних, перетворення даних до форми, зручної для подальшого використання.
  • 3. Організація і ведення зв'язку з користувачем; ведення діалогу, видача діагностичних повідомлень про помилки в роботі з БД і т.д.

До складу АБД, крім БД і СУБД, входять мовні, технічні та організаційні засоби. Розглянемо кожний із них.

Мова опису даних (МОД) застосовується на різних рівнях абстракції: зовнішньому, логічному і внутрішньому. Мови опису даних на логічному (концептуальному) і внутрішньому рівнях незалежні і різні. Проте в більшості промислових СУБД немає поділу на дві окремі мови опису логічної і фізичної організації даних, а існує єдина мова, яка ще називається мовою опису схем.

Якщо логічний і фізичний рівні розділені, то до складу СУБД має входити мова зберігання даних.

Мова опису даних на зовнішньому рівні – це мова, яка використовується для опису потреб користувачів та прикладних програм, при створенні інфологічній моделі БД. Ця мова не має нічого спільного з мовами програмування. Наприклад, мовними засобами для інфологічного моделювання є звичайна мова чи її підмножина, а також мова графів і матриць.

Мова маніпулювання даними (ММД) – це мова, яка використовується для обробки даних, їх перетворень і написання програми. ММД може бути базовою чи автономною. Базова мова (відкриті системи) – це одна з традиційних класичних мов програмування. Використання базових мов як ММД звужує коло осіб, які можуть безпосередньо звертатися до БД, оскільки для цього потрібне знання мови програмування. У такому разі для спрощення спілкування кінцевих користувачів з БД у деяких СУБД передбачена мова ведення діалогу і мова запитів, які простіші для опанування порівняно з мовою програмування. Автономна ММД (закрита система) – це власна мова СУБД, яка дає змогу виконувати різні операції з даними.

У сучасних СУБД для спрощення процедур пошуку даних у БД передбачена мова запитів. Найпоширенішими мовами запитів є дві мови SQL та QBE.

Мова запитів SQL (StructuredEnglish QueryLanguage) була створена фірмою ШМ у рамках роботи над проектом побудови системи управління реляційними базами даних на початку 70-х років. Американським національним інститутом стандартів (ANSI) ця мова покладена в основу стандарту мов реляційних баз даних, яка була прийнята і Міжнародною організацією стандартів (ISO). Ядром існуючого зараз стандарту SQL-86, який часто називають SQL-2 чи SQL-92, є функції, які реалізовані практично в усіх відомих комерційних варіантах мови, а повний стандарт включає такі удосконалення, які ще деяким розробникам потрібно буде реалізувати.

Крім стандарту SQL-86, існує комерційний стандарт мови SQL, який розроблений консорціумом виробників баз даних SQL Access Group. Ця група створила такий варіант мови, який використовується більшістю систем і дозволяє їм "розуміти" одна одну. Було розроблено стандартний інтерфейс мови CLI (CommonLanguagelnterface) для всіх основних варіантів мови SQL. Фірмою Microsoft цей інтерфейс було формалізовано, і він отримав назву ODBC (OpenDatabalseConnectiviti) – відкритий доступ до даних. ODBC – це драйвер, що забезпечує інтерфейс доступу до даних, які зберігаються, під управлінням різних СУБД. За допомогою ODBC вирішується проблема розуміння СУБД одна одною.

Мова запитів QBE (QueryByExample) – це реалізація запитів за зразками у вигляді таблиць. Для визначення запиту до БД користувач повинен заповнити таблицю QBE, яка надається системою, і визначити в ній критерії пошуку, вибору та перетворення даних.

До інших мовних засобів можна віднести мову ведення словника даних.

До технічних засобів АБД належать процесори, пристрої вводу і виводу даних, запам'ятовуючі пристрої, модеми, канали зв'язку. У кожному конкретному разі, залежно від особливостей СУБД та особливостей об'єкта управління, проектується і різна конфігурація технічних засобів. У технічній документації на СУБД зазначається мінімальна конфігурація технічних засобів, яка необхідна для організації БД, а також подаються різні обмеження на склад і кількість технічних засобів.

Поряд з універсальними технічними засобами запроваджуються спеціальні машини баз даних, які безпосередньо призначені лише для зберігання та ведення баз даних. Потреба створення спеціальних машин БД, які реалізують на апаратному рівні функції СУБД, пов'язана з необхідністю звільнення обсягів пам'яті, що мають відводитися для зберігання даних на тих ЕОМ, які виконуватимуть операції обробки даних.

Організаційні засоби АБД охоплюють персонал, який пов'язаний зі створенням і веденням БД а також систему нормативно- технологічної та інструктивно-методичної документації з організації та експлуатації БД.

Певна посадова особа (група осіб), яка забезпечує створення, ведення і підтримку БД в актуальному стані, називається адміністратором АБД. Основні функції адміністратора:

  • – спільна робота з проектувальниками задач для визначення умов використання БД;
  • – розроблення опису БД і початкове завантаження її;
  • – підтримка цілісності БД, організація захисту зберігання даних;
  • – відновлення БД у разі виникнення помилок програмного забезпечення чи збоях пристроїв, які призводять до руйнування БД;
  • – нагромадження статистики щодо роботи з БД, реорганізація та реструктуризація БД згідно зі зміною потреб, забезпечення безпеки даних шляхом санкціонування доступу до них.

В умовах монопольного використання ПК функції адміністратора виконуються користувачем і частково програмістом, відповідальним за супровід тієї чи іншої системи. Користувач відповідає за завантаження БД та її підтримку в актуальному стані, програміст – за функції відновлення БД у випадках її зруйнування. В умовах колективного використання ПЕОМ, об'єднаних в мережу, функції адміністратора виконуються спеціально призначеними адміністраторами.

Розвиток засобів обчислювальної техніки, створення запам'ятовуючих пристроїв прямого доступу створили передумови для вирішення проблем незалежності, неузгодженості і надлишковості даних, а також сприяли створенню нової концепції організації інформаційного забезпечення (ІЗ) – концепції інтеграції даних, яка дістала назву автоматизованого банку даних (АБД). Головні переваги організації ІЗ у вигляді АБД такі:

  • 1. Багаторазовість використання даних: одні й ті самі дані можуть використовуватися для розв'язування різних задач.
  • 2. Економія витрат на створення й ведення ІЗ: організація ІЗ у вигляді БД характеризується нижчою вартістю на створення і меншими витратами на внесення змін у БД, оскільки зміни на фізичному рівні не завжди потребують внесення змін до прикладних програм.
  • 3. Зменшення надлишковості даних. Необхідність розв'язування нових задач забезпечується за рахунок існуючих файлів у БД, а не шляхом створення нових файлів. Дублювання даних у БД потрібне лише для забезпечення оперативності пошуку даних і організації зв'язку між файлами БД. Таке дублювання не є надлишковим і називається ненадлишковим дублюванням даних.
  • 4. Швидкість обробки непередбачених запитів до системи. Для обробки таких запитів найчастіше не вимагається створення нової програми мовами програмування, оскільки ці процедури виконуються за допомогою спеціальних мовних засобів (мови запитів і мови генерації звітів), які входять до складу СУБД.
  • 5. Простота і зручність внесення змін за рахунок єдиної системи ведення БД, яка підтримується засобами СУБД.
  • 6. Логічна та фізична незалежність даних від прикладних програм. Концепція автоматизованого банку даних побудована на інтеграції даних, які зберігаються окремо від прикладних програм. Тому немає потреби повністю описувати логічну та фізичну структури файлів, які обробляються у прикладній програмі.
 
< Попер   ЗМІСТ   Наст >