Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Інструментарій оперативної аналітичної обробки

Скачати 59.05 Kb.

Інструментарій оперативної аналітичної обробки




Скачати 59.05 Kb.
Дата конвертації10.06.2017
Розмір59.05 Kb.


ІНСТРУМЕНТАРІЙ ОПЕРАТИВНОЇ АНАЛІТИЧНОЇ ОБРОБКИ

Ларіна К.І.

Науковий керівник: к.т.н., доц. Огнева А.М.

Хмельницький національний університет


Технологія створення СППР містить такі напрямки:

- нагромадження і збереження даних на основі інформаційних сховищ;

- інтелектуальний аналіз даних.

Аналіз даних Аналіз даних - розділ математики, що займається розробкою методів обробки даних незалежно від їх природи.

Зусилля комерційних компаній і наукових кіл привели до серйозного технологічного прогресу в рішенні задач збереження даних. Це знайшло відображення в безлічі комерційних продуктів, що доступні для кожної з трьох основних операцій: поповнення сховища даних з незалежних транзакційних систем; збереження даних і керування ними; аналіз даних з метою прийняття обґрунтованих бізнес-рішень. Однак, незважаючи на достатню кількість комерційного інструментарію, ці напрямки залишаються важливими для дослідження.

Ці питання співвідносяться з двома основними компонентами системи підтримки прийняття рішень: інструментарій оперативної аналітичної обробки та пошуку даних та базові інструменти для заповнення сховища даних.

Сховище даних (англ. data warehouse) - предметно орієнтований, інтегрований, незмінний набір даних, що підтримує хронологію і здатний бути комплексним джерелом достовірної інформації для оперативного аналізу та прийняття рішень.

Система підтримки прийняття рішень (СППР; англ. Decision Support System, DSS) - комп'ютеризована система, яка шляхом збору та аналізу великої кількості інформації може впливати на процес прийняття управлінських рішень в бізнесі та підприємництві.

Базові інструменти — засоби збору, перетворення і агрегування даних — служать для поповнення сховища з зовнішніх джерел. У КІС використовуються декілька оперативних інформаційних систем, що автоматизують щоденну діяльність підприємства.

Інформацíйна систéма (англ. Information system) - сукупність організаційних і технічних засобів для збереження та обробки інформації з метою забезпечення інформаційних потреб користувачів.

Ці системи виступають у ролі джерел даних для ТСД, вони можуть бути реалізовані самими різними способами: розміщатися на центральній обчислювальній машині, або ж являти собою додаток з архітектурою клієнт/сервер, або відноситися до прикладних систем третіх фірм із власними сховищами інформації, а також являти собою комбінацію перерахованих варіантів реалізації. Завдання полягає в тім, щоб ідентифікувати джерела даних і доставляти з них інформацію в ТСД відповідно до продуманого розкладу. Задача збору інформації в сховище із самих різних джерел даних називається придбанням даних .

Перетворення даних являє собою процес очищення інформації і перевірки її вірогідності, у ході якого відтинаються всі неточні дані. У результаті перевірки всі значення відповідають стандартним визначенням. Після завершення всіх процедур трансформації дані попадають у ТСД.

Моніторинг, інформаційна підтримка оперативного керування, динамічний аналіз і інші питання вирішуються при цьому в рамках природного функціонування ТСД і не торкаються діяльності робітників БД і локальних інформаційних систем.

Вирішити цю задачу можливо за допомогою програмних агентів - спеціально створених самостійних програм, що відслідковують визначені події, виконують деякі попереджуючі дії відповідно до задач поставлених ним людиною і впливають на конкретні програмні об'єкти. Якщо вважати, що поводження агента задається деякою програмою (алгоритмом), то теорія мереж Петрі служить зручним інструментом для формального опису поводження ПА.

Теорія мереж - це галузь комп'ютерних та мережевих наук, яка є частиною теорії графів. Вона застосовується у багатьох дисциплінах, включаючи статистичну фізику, фізику елементарних частинок, інформатику, біологію, економіку, дослідження операцій та соціологію.

Формальний апарат для аналізу роботи Па задовольняє таким вимогам: наочність представлення структурно-тимчасових особливостей функціонування ПА та строгість обґрунтування. За допомогою апарату мереж Петрі може бути зображена структура системи і простежені зміни станів у часі. Тому моделювання і аналіз ПА, що використовується в процесі завантаження та поповнення тематичних сховищ даних для аналізу задачі перспективного функціонування СППР, проведемо за допомогою формалізму ієрархічних мереж Петрі.

При аналізі моделі ПА необхідно розглянути наступні питання: як взаємодіють окремі компоненти системи; чи є в системі потенційно "вузькі" місця; чи можуть у системі виникнути порушення функціонування, збої і як можна них локалізувати; чи можна спростити систему, замінивши її окремі компоненти; чи може система виконувати ті функції, для яких призначена. Тобто дослідника в першу чергу цікавлять структурні характеристики і властивості.

У таких випадках модель системи повинна бути структурно подібна самій системі. Це означає, що модель можна будувати вроздріб, як і систему. Композиційний підхід до побудови мереж Петрі припускає можливість побудови більш складних мереж з менш складних складових.

Складні мережі (англ. Complex networks) - це мережі (графи), що володіють нетривіальними топологічними властивостями. Складні мережі широко поширені у природі.

Моделі  на  основі  мереж  Петрі  дозволяють  досліджувати  два  види  властивостей:  обумовлені  початковим  маркіруванням  і  не  залежні  від  неї. Властивості, що  відносяться  до  першої  групи,  називаються  поведінковими,  а  властивості  другої  групи – структурними.

Основою мережі Петрі є поняття умовно-подійної системи. Компоненти системи і їх дій представляються абстрактними подіями. Сукупність дій, що виникають як реалізація подій при функціонуванні системи, створить процес, породжуваний цією системою.

Для того, щоб подія відбулася необхідна поява ситуації, у якій ця подія може бути реалізована. При цьому ситуація визначається як сукупність деяких умов виникнення події. Тобто подія реалізується, якщо виконані умови її реалізації. Умова має ємність: умова не виконана (ємність дорівнює нулеві), умова виконана (ємність дорівнює одиниці), умова виконана з n-кратним запасом (ємність дорівнює n, де n - ціле позитивне число).

Роботу мережі необхідно представити як сукупність спрацьовувань переходів. Перехід спрацьовує, якщо виконані всі умови реалізації відповідної події. Виконання умови в мережах Петрі відображається розміткою відповідного місця, тобто розміщенням у ньому одного або декількох маркерів відповідно до ємності умови. У графічному представленні маркер позначається крапкою усередині відповідного місця.

Спрацьовування переходу - неподільна дія, що змінює розмітку його вхідних і вихідних місць у такий спосіб: з кожного вхідного місця маркер вилучається, а в кожне вхідне місце - додається. Тим самим реалізація події змінює стан безпосередньо зв'язаних з ним умов: постумови виникнення події перестають існувати, зате виникають постумови здійснення події.

Умовами для розглянутої системи є:

а) ПА чекає;

б) запит надійшов;

в) ПА обробляє запит;

г) запит оброблений.

Розглянемо основні події, що відбуваються в системі при роботі ПА по заповненню ТСД інформацією, яка знаходиться в ІБДП.

t1 - запит на пошук інформації;

Інформаці́йний по́шук (ІП) (англ. Information retrieval) - наука про пошук неструктурованої документальної інформації. Особливо це відноситься до пошуку інформації в документах, пошук самих документів, добуття метаданих з документів, пошуку тексту, зображень, відео та звуку у локальних реляційних базах даних, у гіпертекстових базах даних таких, як Інтернет та локальні інтранет.

t2 - звертання до файлу метаданих для збору інформації про дату останнього запису.

При коригуванні записів ТСД це будуть такі події:

t3- звертання до АБД мережі для збору інформації про внесені в ІБДП змінах;

t4 - пошук та збір інформації за запитом ПА;

t6 - групування та запис даних.

При пошуку інформації в ІБДП виконуються наступні події:

t5 - здійснення пошуку інформації, яка має зміни ;

t6 - групування інформації , яка має зміни, та запис даних.

У моделі факт паралельності дій відображається рівнобіжними гілками мережі. Очевидно, що подія t6 є ідентичною для обох гілок . Для того, щоб синхронізувати незалежні дії ПА, у модель введені елементи, що регламентують роботу ПА. Це додатковий маркер в позиції Р3. Додатковий маркер дозволяє спрацьовування тільки одного з дозволених переходів. Цим у моделі забезпечується попередньої перевірки наявності змінених записів в ІБДП.

Графічне представлення мережі Петрі – служить для одночасної візуалізації всіх місць і переходів заданої мережі, а також зв'язків між ними. Функціонування мережі Петрі описується формально за допомогою множини послідовностей спрацьовувань і множини досяжних у мережі розміток. Ці поняття визначаються через правила спрацьовування переходів мережі.
Предметом дослідження мереж Петрі є вивчення процесу їх функціонування, тобто можливих послідовностей спрацьовування переходів і властивості одержуваних при цьому розміток мережі. Запуски можуть здійснюватися до тих пір, поки існують дозволені переходи, після цього запуск припиняється. Завершення процесу функціонування приводить мережу до розмітки, яка називається кінцевої (досягнення тупикової розмітки). Перевіримо цю властивість мережі Петрі (кінцевість функціонування мережі). Для цього потрібно відповісти на таке запитання для даної конкретної мережі (рис.3.) - чи існує така послідовність спрацьовування переходів, що приводить мережу до тупикової розмітки (тобто розмітці, при якій жоден перехід не може спрацювати).

Аналіз поведінкових властивостей мережі досліджуваних при аналізі функціонування ПА дозволяє стверджувати, що вона завжди приходить до тупикової розмітки - мережа завжди зупиняється, коли усі маркери зібрані в позиції P6. Обмеженість - це властивість мережі не допускати перевищення кількості фішок у конкретній або довільній позиції деякого фіксованого числа. Якщо в жодній позиції мережі при будь-якій послідовності спрацьовувань переходів кількість маркерів не перевищує K, то таку мережу називають K-обмеженою. Т.ч. мережа на рис.1 є обмеженою - при будь-якому спрацьовуванні мережі кількість маркерів у будь-якій позиції не перевищить 3.


Література

  1. Питерсон Дж. Теория сетей Петри и моделирование систем. - М.: Мир, 1984.- 264 с.

  2. Огнева А.М. Методи організації і пошуку інформації в інформаційно-аналітичних системах // Вісник Технологічного університету Поділля. – 2003.- №.

    Хмельницький національний університет - вищий навчальний заклад України у місті Хмельницькому.



  3. Огнева А.М. Розробка структури та методики побудови тематичних сховищ даних // Вісник Технологічного університету Поділля.–2003. №2. Т2(50)


Скачати 59.05 Kb.

  • Технологічного університету Поділля