Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Компоненти інформаційної системи підтримки рішень для наукових періодичних видань

Скачати 333.1 Kb.

Компоненти інформаційної системи підтримки рішень для наукових періодичних видань




Скачати 333.1 Kb.
Сторінка1/3
Дата конвертації03.06.2017
Розмір333.1 Kb.
ТипАвтореферат
  1   2   3

Міністерство освіти і науки України

Національний університет “Львівська політехніка”



Мриглод Олеся Ігорівна

УДК 004.6, 004.94




Компоненти інформаційної системи підтримки рішень
для наукових періодичних видань

05.13.

Періодичне видання - серіальне видання (зазвичай друковане), що виходить через певні проміжки часу, має заздалегідь визначену постійну щорічну кількість і назву нумерованих чи датованих, однотипово оформлених випусків, які не повторюються за змістом, мають однакову назву.
Система підтримки прийняття рішень (СППР; англ. Decision Support System, DSS) - комп'ютеризована система, яка шляхом збору та аналізу великої кількості інформації може впливати на процес прийняття управлінських рішень в бізнесі та підприємництві.
06 – Інформаційні технології




Автореферат

дисертації на здобуття наукового ступеня

кандидата технічних наук

Львів – 2009

Дисертацією є рукопис.

Інформаці́йні техноло́гії, ІТ (використовується також загальніший / вищий за ієрархією термін інформаційно-комунікаційні технології (Information and Communication Technologies, ICT) - сукупність методів, виробничих процесів і програмно-технічних засобів, інтегрованих з метою збирання, опрацювання, зберігання, розповсюдження, показу і використання інформації в інтересах її користувачів.

Робота виконана у Національному університеті "Львівська політехніка"



Науковий керівник:

доктор технічних наук, старший науковий співробітник



Сікора Любомир Степанович,

Національний університет «Львівська політехніка»

Міністерства освіти і науки України,

професор кафедри автоматизованих систем управління



Офіційні опоненти:

доктор технічних наук, професор



Пасічник Володимир Володимирович,

Національний університет «Львівська політехніка»

Міністерства освіти і науки України,

завідувач кафедри інформаційних систем та мереж


кандидат технічних наук, старший науковий співробітник

Досин Дмитро Григорович,

Фізико-механічний інститут ім. Г.В.

Володи́мир Володими́рович (? - після 1218) - руський князь з роду Ростиславичів, династії Рюриковичів. Син галицького князя Володимира Ярославича. Онук Ярослава Осмомисла. У хрещенні - Іва́н. На думку історика Леонтія Войтовича, 1218 року разом із старшим братом Васильком був претендентом на галицький престол, якого угорці намагалися використати у боротьбі за Галицьку спадщину.
Інформацíйна систéма (англ. Information system) - сукупність організаційних і технічних засобів для збереження та обробки інформації з метою забезпечення інформаційних потреб користувачів.
Дмитро́ Па́влович Григоро́вич (*25 січня 1883, Київ - †26 липня 1938, Москва) - український та радянський авіаконструктор, творець першого гідроплану.
Автоматизо́вана систе́ма керува́ння (АСК), Автоматизована система управління (АСУ), Комп'ютерна система управління (КСУ) - автоматизована система, що ґрунтується на комплексному використанні технічних, математичних, інформаційних та організаційних засобів для управління складними технічними й економічними об'єктами.
 Карпенка

Національної академії наук України,

вчений секретар інституту,

завідувач лабораторії системного аналізу науково-технічної інформації

Захист відбудеться «____» _______ _________ 2009 р. о _____ год.

на засіданні спеціалізованої вченої ради Д 35.052.14 у Національному університеті «Львівська політехніка» (79013, м. Львів–13, вул. С. Бандери, 28а, ауд. 807, V корпус).
З дисертацією можна ознайомитись у бібліотеці Національного університету
«Львівська політехніка» (79013, м. Львів, вул. Професорська, 1).

Автореферат розісланий «____»________________ 2009 р.

Вчений секретар

спеціалізованої вченої ради Д 35.052.14,

кандидат технічних наук, доцент Батюк А. Є.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Актуальність теми. Аналіз наукових періодичних видань, їх моніторинг та підвищення якісного рівня – важливі задачі в контексті загальної підтримки національної науки. Облік та кількісний аналіз потоку публікацій у науковій періодиці нині є найбільш вживаними і об’єктивними підходами до оцінювання продуктивності у науковій сфері.

Кі́лькісний ана́ліз (англ. quantitative analysis) - розділ аналітичної хімії, в якому визначають кількісний склад речовини - вміст її компонентів за елементарним складом, іонний складом, складом за структурою органічної сполуки (в органічній хімії) та ін.
Нау́ка - сфера діяльності людини, спрямована на отримання (вироблення і систематизацію у вигляді теорій, гіпотез, законів природи або суспільства тощо) нових знань про навколишній світ. Основою науки є збирання, оновлення, систематизація, критичний аналіз фактів, синтез нових знань або узагальнень, що описують досліджувані природні або суспільні явища та (або) дозволяють будувати причинно-наслідкові зв'язки між явищами і прогнозувати їх перебіг.
Водночас досі не існує однозначних і загальноприйнятих критеріїв оцінювання наукових періодичних видань. Існуючі методи оцінювання та рейтингування наукової періодики базуються, в основному, на даних про рівень цитування опублікованих у них робіт та експертних оцінках. Проте в умовах, коли інформація про цитування є недоступною, зростає роль іншої релевантної інформації, що може бути одержана з «внутрішніх даних про видання». Потенціал використання цих можливостей досі практично не задіяний.

Інформаційний підхід до аналізу складних систем та процесів уже знайшов широке застосування нині у різних галузях науки. Зокрема, в якості складної системи, коли мова іде про наукове періодику, зручно розглядати як окреме наукове видання, так і сукупість наукових періодичних видань. Актуальною задачею є облік та дослідження потоків наукової інформації всередині цих систем та інтелектуальний аналіз даних про публікації у виданнях.

Наукова публікація - це опублікований опис наукового дослідження, що містить аналіз сутності певної наукової проблеми, методи і результати її дослідження, науково обґрунтовані висновки. Завданням наукових публікацій є знайомити науковий світ з результатами досліджень окремих вчених та груп науковців.
Складна́ систе́ма - система, поняття, що широко використовується в сучасній науковій літературі і вказує на специфічні особливості об'єктів дослідження практично в усіх розділах природничих та гуманітарних наук.
Аналіз даних - розділ математики, що займається розробкою методів обробки даних незалежно від їх природи.
Знання, одержані в результаті таких досліджень, дають можливість, з одного боку, комплексно оцінювати стан вибраного наукового періодичного видання та підвищити ефективність керування ним, а, з іншого боку, охарактеризувати еволюцію наукової сфери та перебіг внутрішніх процесів у ній, а також сформулювати нові ефективні алгоритми для пошуку наукової інформації. Зростання ефективності керування науковою періодикою – як на рівні конкретного видання, так і на рівні групи видань – веде до підвищення їх якісного рівня, що, в свою чергу, підвищує рівень та конкурентоспроможність національної науки загалом.

Розвинуті у роботі положення ґрунтуються на результатах досліджень українських та зарубіжних вчених: П. Гроса та Е. Гроса (вперше почали аналізувати наукові цитування), А. Лотки (перші спроби кількісного аналізу продуктивності наукової праці на основі вивчення частотного розподілу публікацій), В. Налімова та Г. Доброва (роботи з наукознавства та наукометрії), Ю. Гарфілда (розробив основні засади сучасних методів оцінювання наукової періодики) та інших. Крім загальних наукометричних засад, у роботі використано ре­зуль­тати, одержані в області аналізу динаміки людської поведінки та вивчення складних мереж і систем такими вченими як: М.

Складні мережі (англ. Complex networks) - це мережі (графи), що володіють нетривіальними топологічними властивостями. Складні мережі широко поширені у природі.
 Ньюмен, С. Дороговцев, Й. Мендес, Р. Альберт, А.-Л. Боробаші.

Зв’язок роботи з науковими програмами, планами, темами. Робота виконана в рамках науково-дослідної теми «Нейромережні технології класифікації лексико-семантичної інформації для систем дистанційної освіти» («ДБ/СДО»), а також за темами: «Особливості критичної поведінки конденсованих систем під впливом зовнішнього поля, структурного безладу, фрустрації та анізотропії», № держреєстрації 0105U002081; «Аналітичні та чисельні дослідження скейлін­гових властивостей та фазових переходів у багаточастинкових системах», № держреєстрації 0108U001152. Участь автора полягала у дослідженні ефектів тісного світу та безмасштабності, явищ кореляції та впорядкування у складних мережах, дослідження їх статистичних характеристик (0105U002081); дослі­дженні розподілу часів очікування у динаміці складних систем на підставі аналізу статистики редакційного опрацювання статей, поданих до друку в наукові журнали (0108U001152);
Науковий журнал, академі́чний журна́л або науковий журнал, що рецензується або рецензований науковий журнал - журнал, в якому публікуються роботи із певної галузі академічної науки. Статті, що надсилаються до таких журналів, перед публікацією рецензуються незалежними фахівцями, які зазвичай, не входять до складу редакції журналу, а ведуть дослідження в областях, близьких до тематики статті.
розробленні структури багатовимірних баз даних («ДБ/СДО»).

Мета і задачі дослідження. Метою роботи є розроблення методів і компонент інтелектуального опрацювання даних для синтезу ефективної інформаційної системи моніторингу та підтримки прийняття рішень у роботі з науковими періодичними виданнями.

Досягнення поставленої мети передбачало розв’язання таких задач:



  • аналіз існуючих методів і засобів оцінювання наукової періодики;

  • розроблення інформаційної структури бази даних наукового періодичного видання та програмних засобів для автоматизованого її наповнення;

  • адаптація існуючих методів теорії складних мереж для інтелектуального аналізу даних про публікації у виданні;

  • розроблення методу виявлення тематики наукового періодичного видання;

  • удосконалення інформаційного пошуку в рамках наукового періодичного видання через застосування методів теорії складних мереж;
    Програ́мне забезпе́чення (програ́мні за́соби) (ПЗ; англ. software) - сукупність програм системи обробки інформації і програмних документів, необхідних для експлуатації цих програм.
    Інформаці́йний по́шук (ІП) (англ. Information retrieval) - наука про пошук неструктурованої документальної інформації. Особливо це відноситься до пошуку інформації в документах, пошук самих документів, добуття метаданих з документів, пошуку тексту, зображень, відео та звуку у локальних реляційних базах даних, у гіпертекстових базах даних таких, як Інтернет та локальні інтранет.


  • побудова та аналіз імітаційної моделі процесу опрацювання та прийняття до друку статей, надісланих до редакції наукового журналу.

Об’єкт дослідження – інформаційні процеси у системі моніторингу та підтримки прийняття рішень для наукових періодичних видань.

Предмет дослідження – методи і засоби інтелектуального опрацювання даних в інформаційних системах моніторингу та підтримки прийняття рішень для наукових періодичних видань.

Методи дослідження. У дисертаційній роботі використано: теорії інформаційних керуючих систем та складних систем, методи системного аналізу для оцінювання складності об'єкту керування та виявлення шляхів зменшення невизначеності в системі; теорію баз даних для створення бази даних наукового періодичного видання; методи теорії складних мереж та елементи теорії графів для аналізу даних, моделювання взаємозв’язків між ними та візуалізації результатів аналізу; методи кореляційного аналізу, математичної статистики та теорії ймовірнос­тей для аналізу даних;
Кореляційний аналіз - це статистичне дослідження (стохастичної) залежності між випадковими величинами (англ. correlation - взаємозв'язок). У найпростішому випадку досліджують дві вибірки (набори даних), у загальному - їх багатовимірні комплекси (групи).
Теорія графів - розділ математики, що вивчає властивості графів. Наочно граф можна уявити як геометричну конфігурацію, яка складається з точок (вершини) сполучених лініями (ребрами). У строгому визначенні графом називається така пара множин G = (V, E), де V є підмножина будь-якої зліченної множини, а E - підмножина V × V.
Математична статистика - розділ математики та інформатики, в якому на основі дослідних даних вивчаються імовірнісні закономірності масових явищ. Основними задачами математичної статистики є статистична перевірка гіпотез, оцінка розподілу статистичних імовірностей та його параметрів, вивчення статистичної залежності, визначення основних числових характеристик випадкових вибірок, якими є: вибіркове середнє, вибіркові дисперсії, стандартне відхилення. Прикладом перевірки таких гіпотез є з'ясування питання про те, змінюється чи не змінюється виробничий процес з часом. Прикладом оцінки параметрів є оцінка середнього значення статистичної змінної за дослідними даними. Для вивчення статистичної залежності використовують методи теорії кореляції. Загальні методи математичної статистики є основою теорії похибок.
методи теорії систем масового облуго­вування для аналізу часових характеристик роботи редакційного колегії наукового періодичного видання.
Теорія систем (загальна теорія систем) - спеціально-наукова і логіко-методологічна концепція дослідження об'єктів, які є системами. З розвитком системології теорія систем набула необхідної уніфікації та універсальності, вичерпної однозначності та завершеності.


Наукова новизна одержаних результатів. На основі виконаних теоретичних та експериментальних досліджень розв’язано актуальну наукову задачу: розроблено методи та засоби інтелектуального опрацювання даних для синтезу ефективних інформаційних систем моніторингу та підтримки прийняття рішень у роботі з науковими періодичними виданнями. При цьому отримано такі наукові результати:

  • вперше розроблено метод інтелектуального аналізу даних про публікації з використанням теорії складних мереж, який дає можливість окреслити те­матичний спектр наукового періодичного видання, підвищити ефективність керування виданням через відбір близьких за тематикою статей;

  • удосконалено метод інформаційного пошуку близьких за тематикою авторів або публікацій у рамках наукового періодичного видання із застосуванням алгоритмів виявлення структури складних мереж для вибору близьких за тематикою рецензентів та підвищення наукового рівня видання;

  • вперше розроблено метод аналізу роботи редакційної колегії наукового видання з використанням теорії систем масового обслуговуван­ня, що ґрунтується на часових характеристиках процесу опрацювання ста­тей;

  • удосконалено технологію комплексного оцінювання наукових періодичних видань, що полягає у доповненні результатами інтелектуального аналізу даних, отриманих безпосередньо з публікацій, для підвищення якості прийняття управлінських рішень.

Практичне значення одержаних результатів та їх впровадження:

  • розроблений метод інтелектуального аналізу даних про публікації для окреслення тематики наукового періодичного видання може засто­совуватися при здійсненні рубрикації видання для оптимального роз­міщення матеріалу та класифікації статей, а також при вивченні зміни тематичного спектру видання з часом;

  • удосконалений метод інформаційного пошуку близьких за тематикою авторів або публікацій у рамках видання може використовуватися редколегією видання як у процесі підтримки управлінських рішень, так і для реалізації пошуку через веб-інтерфейс для користувачів мережі Інтернет;
    Інтерне́т (від англ. Internet), міжмере́жжя - всесвітня система взаємосполучених комп'ютерних мереж, що базуються на комплекті Інтернет-протоколів. Інтернет також називають мережею мереж. Інтернет складається з мільйонів локальних і глобальних приватних, публічних, академічних, ділових і урядових мереж, пов'язаних між собою з використанням різноманітних дротових, оптичних і бездротових технологій.


  • розроблений метод аналізу роботи редакційної колегії дає можливість отри­мати інформацію про часові характеристики опрацювання статей у редакції наукового періодичного видання, ззовні оцінити режим його роботи та наповненість «портфеля»;

  • побудована імітаційна модель процесу редакційного опрацювання матеріалів у науковому періодичному виданні дає можливість оцінити ефективність роботи редакційної колегії та визначити умови, за яких система перестає працювати оптимально.
    Модель (в широкому значенні) - образ (в тому числі умовний - зображення, опис, схема, креслення, графік, план, мапа) або прообраз (зразок) якогось об'єкту або системи об'єктів, що застосовується за певних умов як їх «замінник».


Особистий внесок здобувача. Усі основні наукові результати, викладені в дисертації, отримані автором особисто. У роботах, виконаних із співавторами, автору належить: проведення огляду проблемної області [1]; збір, аналіз та інтерпретація даних про українські наукові періодичні видання у мережі Інтернет та у базі даних Web of Science [7, 17]; автоматизація збору даних, побудова розподілів та їх аналіз [2, 3, 10, 14]; метод комплексного підходу до аналізу наукового періодичного видання для керуванням ним як складною та важко формалізовуваною системою [4, 18, 19]; побудова імітаційної моделі роботи редакційної колегії періодичного наукового видання, її застосування та аналіз результатів моделювання [5, 11]; розділ про мережі співпраці та наукового співавторства [6]; створення бази даних та робота із нею, синтез складних мереж та їх аналіз, побудова часових характеристик редакційного опрацювання статей [8]; моделювання та аналіз складних мереж, метод контекстного інформаційного пошуку в рамках видання [12, 13, 15].

Апробація роботи. Основні положення та результати дисертаційних досліджень доповідались і обговорювалися на наукових семінарах кафедри автоматизованих систем управління Національного університету «Львівська політехніка» та Інституту фізики конденсованих систем НАН України, а також на таких науково-технічних конференціях: Міжнародній науково-технічній конференції «Комп’ютерні науки та інформаційні технології» (CSIT), Львів, 2007 та 2008;
Система керування, також Система управління (англ. control system) - систематизований набір засобів впливу на підконтрольний об'єкт для досягнення цим об'єктом певної мети. Об'єктом системи керування можуть бути як технічні об'єкти так і люди.
International PhD Workshop «OWD», Вісла, Польща, 2007 та 2008; Міжнародній конференції молодих науковців «Комп’ютерні науки та інженерія (CSE), Львів, 2006; International workshop MECO32, Лядек Здруй, Польща, 2007; International workshop MECO33, Пухберг/Велс, Австрія, 2008; Міжнародній науково-технічній конференції «Інтелектуальні системи в промисловості і освіті – 2007», Суми, 2007; Міжнародній конференції з автоматичного управління «Автоматика 2006», Вінниця, 2006;
Автомати́чне керува́ння (англ. automatic control) - виконання без безпосередньої участі людини певних впливів на об'єкт керування, необхідних і достатніх для одержання цілеспрямованого його функціювання із заданою точністю.
«International conference on infinite particle systems III», Казімеж Дольний, Польща, 2007; Міжнародній конференції «Интеллектуальные системы принятия решений и прикладные аспекты информационных технологий» (ISDMIT’2007), Євпаторія, 2007; Міжнародній науково-практичній конференції «Обробка сигналів і негауссівських процесів», Черкаси, 2007; Науковій конференції «Бібліотечно-інформаційне партнерство: від локальних мереж до глобальної взаємодії», Харків, 2006; Науковій конференції, присвяченій 60-річчю І.О. Вакарчука, «Нові напрямки у фізиці та астрофізиці», Львів, 2007; ХІХ науковій сесії наукового товариства ім.
Науко́ве товари́ство - товариство, яке об'єднує фахівців з певної наукової дисципліни (гуманітарної, природничої, технічної). Діяльність товариства зазвичай поширюється на певний регіон, державу або мовний чи культурний простір.
 Шевченка, Львів, 2008.

Публікації. Основний зміст дисертаційної роботи викладено у 19 дру­кованих працях, серед них 5 опубліковано у фахових наукових виданнях з технічних наук, 4 ­­– у фахових виданнях з фізико-математичних наук та 10 – у збірниках науково-технічних конференцій.

Структура та обсяг дисертації. Дисертаційна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел (114 найменувань) та додатків. Загальний обсяг дисертації – 135 сторінок. Робота містить 103 сторінки основного тексту та ілюструється 47 рисунками та 8 таблицями.
ОСНОВНИЙ ЗМІСТ РОБОТИ

У вступі наведено загальну характеристику роботи, обґрунтовано її актуальність, сформульовані мета і основні задачі дослідження, визначені наукова новизна роботи та практична цінність отриманих результатів. Подано відомості про особистий внесок автора, апробацію результатів роботи та публікації.

У першому розділі проаналізовано сучасний стан та тенденції розвитку наукометричних дисциплін. Наука як об’єкт вивчення є однією із складних та важко формалізовуваних систем, дослідження та аналіз яких вимагає комбінування методів та засобів різних галузей науки. Усі кількісні аспекти наукознавства зосередив у собі його окремий напрямок – наукометрія. Однією із центральних наукометричних проблем є проблема оцінювання наукової продуктивності, вирішення якої прямо пов’язане із вивченням сукупності наукових публікацій, що є основною формою вираження та фіксації наукових результатів.
Наукова стаття - вид наукової публікації, який описує дослідження чи групу досліджень, пов'язаних однією темою, та виконана її науковими авторами. Наукові статті публікуються в періодичних наукових журналах або в неперіодичних збірниках наукових робіт.
Саме це визначає актуальність досліджень із оцінювання та рейтингування окремих наукових статей та наукових видань загалом. Існує цілий ряд показників, які застосовуються для обліку та моніторингу наукової періодики, проте жоден із них не є універсальним та абсолютно об’єктивним. Сучасний рівень інформаційних технологій дає можливість акумулювати та опрацьовувати значні обсяги різноманітних даних, а методи видобутку знань допомагають виявити приховані властивості досліджуваного об’єкту, у даному випадку – системи наукового періодичного видання.

Проведений огляд інформаційних джерел показав, що існуючі методи аналізу наукових періодичних видань використовують, в основному, дані про одержані ними цитування. Сучасні інформаційні сервіси, що створені у галузі наукової періодики, націлені, насамперед, на порівняльний аналіз масиву видань на основі даних, що акумулюються нині у спеціально розроблених базах даних. Проте використання інформації із таких інформаційних систем не може забезпечити повної інформаційної підтримки процесу керування конкретним науковим періодичним виданням чи їх групою (ряд причин: обмежений та/або платний доступ до інформації; достатньо загальний характер цієї інформації, що є не достатнім для вичерпного опису окремого видання; відсутність інформації про видання, які не потрапили у відповідну базу даних, тощо).

У розділі обґрунтовується необхідність використання для аналізу нау­кових періодичних видань даних, що вільно доступні з самих публікацій, та їх опрацювання для одержання нових знань. Наприкінці розділу подані висновки та виділено основні задачі, які мають бути розв'язані в дисертаційній роботі.

  1   2   3


Скачати 333.1 Kb.

  • Інформаційні технології Автореферат
  • Науковий керівник
  • ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ Актуальність теми.
  • Зв’язок роботи з науковими програмами, планами, темами.
  • Мета і задачі дослідження.
  • Методи дослідження .
  • Наукова новизна одержаних результатів .
  • Практичне значення одержаних результатів та їх впровадження
  • Особистий внесок здобувача .
  • Апробація роботи.
  • Структура та обсяг дисертації.
  • ОСНОВНИЙ ЗМІСТ РОБОТИ У вступі