Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Реферат актуальність теми

Скачати 29.99 Kb.

Реферат актуальність теми




Скачати 29.99 Kb.
Дата конвертації16.04.2017
Розмір29.99 Kb.
ТипРеферат

РЕФЕРАТ

Актуальність теми. Очевидно, що величезні масиви даних, накопичені в організаціях, містять багато корисної інформації, яку можна і потрібно використовувати для оптимізації роботи. Для цього потрібно узагальнити минулий досвід, знайти закономірності, витягти правила і використовувати ці знання в процесі управління. Прості методи аналізу, на зразок візуалізації, в цьому випадку не можуть допомогти. Вони дозволяють відповісти на питання: "що було", а необхідно отримати відповідь на питання: "що треба робити". Для цього потрібні механізми побудови моделей, здатні знаходити нетривіальні закономірності у великих обсягах даних, - Data Mining системи. Data Mining - це процес виявлення у вхідних даних раніше невідомих нетривіальних практично корисних і доступних інтерпретації знань, необхідних для прийняття рішень у різних сферах людської діяльності.

Об’єктом дослідження є процес комбінаторної оптимізації розв’язання однієї з підзадач Data Mining, а саме - задачі класифікації.
Комбінаторна оптимізація (англ. Combinatorial optimization) - розділ теорії оптимізації. Розглядає задачі оптимізації множина розв'язків яких дискретна або може бути зведена до дискретної.
Отримання да́них (англ. Data Mining) - виявлення прихованих закономірностей або взаємозв'язків між змінними у великих масивах необроблених даних. Зазвичай поділяють на задачі класифікації, моделювання та прогнозування.
Класифіка́ція (фр. , англ. classification походить від лат. classis - клас і facio - роблю) - система розподілення об'єктів (процесів, явищ) за класами (групами тощо) відповідно до визначених ознак. Інколи вживають термін категоризація у значенні «розподілення об'єктів на категорії».


Предметом дослідження є евристичні методи розв’язання задачі класифікації.
Задача класифіка́ції - формалізована задача, яка містить множину об'єктів (ситуацій), поділених певним чином на класи. Задана кінцева множина об'єктів, для яких відомо, до яких класів вони відносяться.


Мета роботи: Розробка метаевристичного методу для розв’язання задачі класифікації об’єктів, ефективнішого за швидкодією та якістю розв’язків, ніж аналогічні відомі методи за рахунок застосування нових критеріїв відбору елементів класифікаційної моделі й нових способів прогнозування невідомої мітки класу.

Методи дослідження. У роботі використовуються методи евристичної оптимізації.

Наукова новизна роботи полягає в наступному:

  1. Запропоновано алгоритм мурашиної колонії для розв’язання однієї з підзадач Data Mining, а саме - задачі класифікації, який забезпечує прискорення обробки великих обсягів даних та достатню якість отриманих розв’язків.
    Мурашиний алгоритм (алгоритм оптимізації мурашиної колонії, англ. ant colony optimization, ACO) - один з ефективних поліноміальних алгоритмів для знаходження наближених розв'язків задачі комівояжера, а також аналогічних завдань пошуку маршрутів на графах.


  2. Запропоновані нові критерії відбору елементів класифікаційної моделі, яка є виходом алгоритму.

  3. Запропоновані нові способи прогнозування невідомої мітки класу.

  4. Визначені параметри, які найбільшим чином впливають на результати роботи алгоритму.


Практична цінність отриманих в роботі результатів полягає в тому, що запропонована методика дають змогу покращити якість згенерованих класифікаційних правил ніж існуючі аналоги.

Апробація роботи. Основні положення і результати роботи були представлені на VІI науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг – ПМК’2015» (Київ, 15 – 17 квітня 2015 року) та VІ науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг – ПМК’2014» (16-18 квітня 2014 року).



Структура та обсяг роботи. Магістерська дисертація складається з вступу, трьох розділів та висновків.

У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, сформульовано мету і задачі досліджень, показано наукову новизну отриманих результатів і практичну цінність роботи, наведено відомості про апробацію результатів і їхнє впровадження.

У першому розділі розглянуті задачі в області Data Mining, особливості та існуючі алгоритми для рішення задач.

У другому розділі наведено та проаналізовано алгоритм мурашиної колонії, опис основних кроків алгоритму.

У третьому розділі описано розроблений алгоритм для рішення задачі класифікації, запропонований опис модифікацій до основних кроків алгоритму для покращення отриманих результатів.

У четвертому розділі наведено схему розробленого програмного продукту, структуру компонентів програми та отримані результати.
Програ́мний проду́кт (англ. programming product) - це: програмний засіб, програмне забезпечення, які призначені для постачання користувачеві (покупцеві, замовникові). програма, яку може запускати, тестувати, виправляти та змінювати будь-яка людина.


У висновках наведено аналіз результатів проведеної роботи.

Робота виконана на 81 аркушах, містить 7 додатків та посилання на список використаних літературних джерел з 16 найменувань. У роботі наведено 10 рисунків та 7 таблиць.



Ключові слова: Data Mining, аналіз даних, класифікація, мурашиний алгоритм, класифікаційна модель.


Скачати 29.99 Kb.

  • Об’єктом дослідження
  • Предметом дослідження
  • Методи дослідження.
  • Структура та обсяг роботи.
  • Ключові слова