Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Звіт за договором №02/2010 від 27. 07. 2010 про виконання наукових досліджень за темою: Впровадження сучасних інформаційних технологій та систем інформаційно-аналітичної підтримки у сфері організації науково-дослідної роботи що виконується в

Скачати 380.62 Kb.

Звіт за договором №02/2010 від 27. 07. 2010 про виконання наукових досліджень за темою: Впровадження сучасних інформаційних технологій та систем інформаційно-аналітичної підтримки у сфері організації науково-дослідної роботи що виконується в




Скачати 380.62 Kb.
Сторінка8/9
Дата конвертації10.03.2017
Розмір380.62 Kb.
ТипЗвіт
1   2   3   4   5   6   7   8   9

3.3. Планування зовнішнього вигляду та розробка дизайну


Сайт побудований на основі теми “Marinelli”, яка має фіксовану ширину, оптимізовану для відображення на моніторах з роздільною здатністю не менше ніж 1024px по ширині. Для позиціонування елементів в даній темі не використовуються таблиці, а все будується на основі блоків та каскадних таблиць стилів.

Каскадні таблиці стилів (англ. Cascading Style Sheets або скорочено CSS) - спеціальна мова, що використовується для опису сторінок, написаних мовами розмітки даних.

Такий підхід значно сприяє правильному індексуванню вмісту пошуковими серверами і, як наслідок, очікується покращення відповідності результатів пошуку. Основна навігація по сайту здійснюється за допомогою багаторівневого випадаючого головного меню, яке продубльоване в нижній частині сторінки. Головне меню сайту складається з 8 основних пунктів. Підпунктів другого рівня понад 40. Загалом всіх пунктів меню — понад 100. В правій частині сторінки передбачена область для показу інформаційних блоків з другорядними меню, статистикою сайту та інших даних.

Графічне оформлення сайту реалізовано з використанням мінімуму графічних зображень, що робить його завантаження швидким. В кольоровій гамі переважають м'які пастельні тони (Рис. 10).



Рис 10. Головна сторінка сайту Інституту.

3.4. Наповнення сайту


На сайті розміщено інформацію про історію, наукову, освітню та видавничу діяльність, основні здобутки, відділи та інші структури інституту, розрахунковий кластер, друковані матеріали, тощо. Серед персоналу інституту проведено анкетування та створено окремі записи для всіх наукових працівників. Ці дані анкетування представляються у вигляді окремих сторінок, а також в підсумковій таблиці. Більшість матеріалів викладено двома мовами: українською та англійською.

З попереднього сайту перенесено наступні сторінки:



  • архів подій;

  • архів семінарів;

  • сторінки конференцій;

  • архів препринтів;

  • журнал Condesed Matter Physics.

Налаштовано систему управління правами, що дозволяє дати ряду працівників Інституту можливість створювати нові сторінки, перекладати їх та вносити правки. Зокрема всі працівники інституту отримали права на редагування сторінок з персональною інформацією, затверджено перелік працівників, відповідальних за створення оголошень про семінари та редагування сторінок відповідних відділів.

Вся інформація розподілена по 8 основних розділах, що відображені в головному меню:



  • Про Інститут — загальна інформація, історія, дирекція, контакти;

  • Структура — відділи та інші структурні одиниці;

  • Дослідження — напрямки досліджень, основні здобутки, міжнародна співпраця;

  • Конференції та події — анонси конференцій та семінарів, оголошення, архів подій;

  • Персонал — список працівників, члени НАН України, стипендіати;

  • Видавнича діяльність — монографії та інші видання працівників інституту, список статей та препринтів, журнал;

  • Навчання — інформація для студентів, аспірантів та докторантів;

  • Корисна інформація — інститутські ресурси та посилання на інші наукові сайти.

Загальна кількість записів різних типів становить:



  • Сторінка — 185 (з них 125 українською)

  • Оголошення — 2 (двома мовами);

  • Семінар — 230 (двома мовами);

  • Працівник — 81 (двома мовами);

  • Динамічних сторінок — 8 (двома мовами; деякі сторінки відображаються в кількох модифікаціях та в режимах блоків).



4. Створення програмного забезпечення для науковометричного аналізу та оптимізації роботи щоквартального наукового журналу “Condensed Matter Physics”.

На першому етапі виконання завдань проекту, пов’язаних із впровадженням інформаційних технологій у процес підготовки та керування науковим періодичним виданням «Condensed Matter Physics», було проведено аналіз існуючих проблем та виділено такі основні напрямки для майбутньої роботи:



  1. покращення існуючої версії веб-сторінки видання із використанням нових можливостей (зручний пошук, інтеграція з існуючими електронними бібліотеками та архівами, більш зручний формат викладення матеріалів, тощо);

  2. розробка компонент системи оперативного моніторингу та підтримки прийняття експертних рішень на основі аналізу поточних та ретроспективних даних;

  3. розробка компонент для формування системи «електронної редакції», що передбачає автоматизацію ряду редакційних процесів при виконанні функцій на усіх рівнях класичної управлінської піраміди: операційному, функціональному та стратегічному.

Нижче описано кроки, що виконувались в рамках проекту впродовж звітного періоду.

Звітний (податковий) період - період, за який платник податку зобов'язаний проводити розрахунки податку та сплачувати його до бюджету.

На даний момент завдання під першим пунктом перебуває на етапі обговорень та розроблення нової структури веб-сторінки видання (Рис. 11).




Рис. 11. Структура нової веб-сторінки журналу з врахуванням розміщення
нової інформації та засобів пошуку. Сірим кольором позначено блоки,
яких немає у структурі старої версії веб-сторінки.

Серед нових елементів передбачається запровадження декількох видів пошуку по журналу:



  • простий пошук за авторами та назвами статей, що реалізований як контекстний аналіз вмісту веб-сторінки, включаючи PDF-файли із архіву публікацій;

  • пошук засобами зовнішніх ресурсів на зразок Google Scholar (http://scholar.google.com.ua/) та сервера наукових препринтів arXiv Корнельського університету (http://arxiv.org/);

  • детальніший пошук по журналу з можливістю фільтрації результатів за роками, пошуку за ключовими словами та номерами PACS, знаходження публікацій, близьких за змістом до шуканої, тощо.

Зокрема, останній вид пошуку вимагає нетривіальної реалізації та може бути виконаний як із використанням можливостей сучасних веб-технологій та, відповідно, аналізу вмісту веб-сторінки, так і шляхом використання власної бази даних журналу та інтелектуальних методів аналізу даних типу Data Mining (кластеризація, асоціативні правила тощо).

Серед нововведень, які плануються при впровадженні нової веб-сторінки журналу, – розділи для розміщення інформації про ще не опубліковані статті, що є прийнятими до друку та знаходяться на різних етапах роботи. Оприлюднення такого роду інформації є корисним як для авторів статей, які ще до одержання твердої копії випуску можуть вичерпно цитувати свої роботи, так і для видання загалом, яке в перспективні має шанс одержати більшу кількість вхідних цитувань за рахунок швидшого он-лайн доступу до матеріалів.

Ще одним з перспективних напрямків роботи є розробка компонент системи оперативного моніторингу та підтримки прийняття експертних рішень. На першому кроці виконання цього комплексного завдання здійснюється загальний огляд технологій систем інформаційної підтримки прийняття рішень (СППР), а подальша робота буде пов’язана із використанням класичної архітектури такого роду систем в якості кістяка та реалізацією окремих методів і підходів, специфічних вже для галузі наукометрії, а зокрема – аналізу та дослідження діяльності наукової періодики.

Тео́рія рі́шень - царина досліджень, яка математичними методами досліджує закономірності вибору людьми найвигідніших із можливих альтернатив і має застосування в економіці, менеджменті, когнітивній психології, інформатиці та обчислювальній техніці.

Уся інформація, що використовується в процесі прийняття рішень, може бути умовно поділена на три категорії: формалізована, частково формалізована та неформалізована. Крім того, частина корисної інформації відсутня у чистому вигляді – її необхідно одержувати з великих обсягів вихідних даних (процес видобутку знань або Data Mining). Для підтримки прийняття рішень у різних ситуаціях, що відрізняються переважаючим типом інформації та рівнями керування, існують різні категорії інформаційних систем.

Інформацíйна систéма (англ. Information system) - сукупність організаційних і технічних засобів для збереження та обробки інформації з метою забезпечення інформаційних потреб користувачів.

У випадку роботи з переважно неструктурованою інформацією на рівні стратегічного рівня керування знаходиться умовна зона підтримки рішень, в якій доцільно використовувати СППР і/або експертні системи, на виході яких отримуються також неструктуровані рішення.

Експе́ртна систе́ма - це методологія адаптації алгоритму успішних рішень однієї сфери науково-практичної діяльності в іншу. З поширенням комп'ютерних технологій це тотожна (подібна, заснована на оптимізуючому алгоритмі чи евристиках) інтелектуальна комп'ютерна програма, що містить знання та аналітичні здібності одного або кількох експертів щодо деякої галузі застосування, і здатна робити логічні висновки на основі цих знань, тим самим забезпечуючи вирішення специфічних завдань (консультування, навчання, діагностування, тестування, проектування тощо) без участі експерта (фахівця в конкретній проблемній галузі). Також визначається як система, яка використовує базу знань для вирішення завдань (видачі рекомендацій) у деякій предметній галузі. Цей клас програмного забезпечення спочатку розроблявся дослідниками штучного інтелекту в 1960-ті та 1970-ті і здобув комерційне застосування, починаючи з 1980-х. Часто термін система, заснована на знаннях використовується як синонім експертної системи, однак можливості експертних систем ширші за можливості систем, заснованих на детермінованих (обмежених, реалізованих на поточний час) знаннях.

Згідно із визначенням, СППР є одним із видів інформаційних систем керування і використовується для аналізу (моделювання) реальної формалізованої ситуації, у якій людина-менеджер (експерт) повинна прийняти рішення, прорахувавши різні варіанти потенційної поведінки системи (змінюючи її вхідні параметри). Такі системи використовуються як для коротко-, так і довгосторокового планування тактичного та стратегічного характеру в автоматизованому режимі [3]. Можна виділити три основні задачі, які вирішуються за допомогою СППР, що включає такі підсистеми (Рис. 2): ввід, зберігання та аналіз даних. Окремо варто розглянути саме підсистему аналізу даних, що може реалізовувати функції інформаційно-пошукового аналізу на базі реляційних СУБД (систем управління базами даних) та запитів SQL (Structured Query Language), функції оперативного аналізу на основі технології оперативного аналітичного опрацювання даних OLAP (On-line analytical processing) з використанням концепції багатовимірного представлення даних, а також функції інтелектуального аналізу даних шляхом впровадження методів та алгоритмів Data Mining.



Рис. 12. Узагальнена архітектура системи підтримки прийняття рішень [4].


Користуючись засобами СППР для аналізу даних, експерт-аналітик повинен володіти відповідною кваліфікацією, оскільки система не генерує правильні рішення, а лише надає дані у зручному для аналізу вигляді (звіти, таблиці, графіки, діаграми, тощо). Таким чином, функція візуалізації даних є однією з найважливіших функцій інформаційної системи.

Зазвичай виділяють кілька етапів створення інформаційних систем: формулювання вимог до системи, проектування, реалізація, тестування, введення в дію, експлуатація та супровід. Найбільш відповідальним, важко формалізовуваним та найдорожчим з точки зору виправлення помилок є перший етап – формулювання вимог до майбутньої системи. На основі сукупності цих вимог проходить етап проектування, відбувається розробка схеми бази даних, виробляється набір специфікацій для модулів системи, розробляється архітектура системи загалом та здійснюється вибір платформи (платформ) і операційної системи [5].

Сукупність вимог до інформаційної СППР визначається, перш за все, множиною цілей конкретної системи керування. Отже, одним із найважливіших етапів є визначення поточного стану системи, основних її параметрів та бажаного стану, формулювання ієрархічного дерева задач для системи керування у відповідності до рівнів управління. Наступний етап передбачає проектування інформаційної системи, визначення набору її принципових компонент та їх взаємозв’язків. Згідно загальної ієрархії СППР, показаної на Рис. 12, для підтримки прийняття рішень щодо наукового періодичного видання можна виділити низку особливостей кожної з підсистем:



  • підсистема вводу даних повинна містити інтерфейс для ручного вводу певних даних оператором, модуль автоматизованого опрацювання файлів різних форматів для розпізнавання характерних частин документів (публікацій), а також – модуль збору оперативних даних з веб-сторінки видання;

  • основою підсистеми зберігання інформації повинна бути багатовимірна база даних із відповідною структурою та допустимою надлишковістю даних, яка б давала можливість здійснювати не лише операційне опрацювання даних, але й їх інтелектуальний аналіз;

  • підсистема аналізу повинна забезпечувати можливості для усіх трьох рівнів аналізу [4]: інформаційно-пошукового (для реалізації інформаційного пошуку по базі даних, виконання простих запитів до СУБД), оперативного (для побудови залежностей між різними параметрами з точки зору багатовимірності даних) та інтелектуального (для пошуку певних закономірностей в акумульованих даних, побудови моделей, прогнозування).

З точки зору керування наукове періодичне видання є системою, яку можна розглядати на різних рівнях: стратегічне планування здійснюється на рівні видавця, тактичні завдання вирішуються органом редакційної колегії, а оперативні технічні задачі виконуються працівниками редакції. На кожному із цих трьох рівнів керування необхідно забезпечити відповідну інформаційну підтримку, при чому найбільш різнопланова інформація є необхідною для прийняття тактичних рішень після задання стратегічного вектора. У Табл. 1 наведено перелік даних, які є основою для моніторингу та опису наукового стану періодичного видання у будь-який момент часу.

Момент часу - точка на часовій осі. Про події, що відповідають одному моменту часу, говорять як про одночасні.

Табл. 1. Сукупність даних, необхідних для інформаційної підтримки процесу керування науковим періодичним виданням.



Зовнішні дані

Внутрішні дані

Зовнішній моніторинг

Нормативна база

Поточний моніторинг

позиція у міжнародних рейтингах;

дані про цитованість та розрахунок індексів (імпакт-фактор, індекс Гірша, тощо);

дані з мережі Інтернет;

реферованість



законодавство України;

вимоги та стандарти ВАК України;

міжнародні стандарти;

політика видавця



дані про статті;

дані про авторів;

дані про рецензентів;

дані про часові рамки протікання редакційних процесів


Дані, що віднесені до «зовнішніх», при наявності відповідних умов та доступу до джерел є фактично готовими до використання, тобто можуть бути прямо використані для проведення аналізу окремих видань чи порівняння серед групи видань. Так звані «внутрішні» дані генеруються всередині самої системи видання та можуть характеризувати як публікації та їх авторів, так і роботу рецензентів, членів редколегії чи технічних редакторів. До внутрішніх даних наукового періодичного видання належать (Табл. 1): дані про статті (обсяг, дата опублікування, координати в журналі, ключові слова, тематичні індекси, прізвища авторів, кількість процитованих джерел та їх особливості, анотації, тощо), авторів (країна проживання, місце роботи, сукупність співавторів у даному журналі, тощо), а також – всі дані, що характеризують роботу редакційної колегії на різних етапах (дані про тривалість редакційних процесів, призначених рецензентів, тематичний розподіл серед редакторів, сукупність правил та вимог журналу, тощо). До внутрішніх даних можна також віднести набір формальних відомостей про видання в цілому. Проте використання більшості цих внутрішніх даних вимагає значних затрат часу та зусиль. Адже спочатку потрібно їх зібрати, привести до необхідного вигляду, і лише після цього можна приступати до їх аналізу. Для виконання цих завдань необхідним кроком є розробка бази даних наукового періодичного видання.





Рис. 13. Структура бази даних видання «Condensed Matter Physics».


Структура бази даних наукового періодичного видання визначається спектром задач, які покликана вирішувати інформаційна система підтримки рішень.

Система підтримки прийняття рішень (СППР; англ. Decision Support System, DSS) - комп'ютеризована система, яка шляхом збору та аналізу великої кількості інформації може впливати на процес прийняття управлінських рішень в бізнесі та підприємництві.

Серед таких задач можна виділити вивчення сукупності власних авторів та зокрема тих, кого можна назвати «типовими авторами» для конкретного видання; групування авторів згідно їх домінуючих наукових інтересів; виявлення наукових «авторитетів» у різних напрямках досліджень; тощо. Не менш важливими є задачі аналізу всього масиву статей, опублікованих у виданні за певні часові проміжки з метою визначення тематично пов’язаних статей та при потребі – реалізації їх поділу за рубриками чи розширеного інформаційного пошуку. Аналіз джерел, процитованих у статтях, дає можливість виявити їх типовий вік та тип (статті, монографії, тези тощо) і визначити найбільш цитовані конкурентні наукові видання. Таким чином, можна виділити три основні «виміри», на яких вирішуються задачі інформаційної системи: дані про авторів, дані про статті, дані про цитовані джерела. Відповідно до наведених вище міркувань, створена база даних журналу «Condensed Matter Physics» (Рис. 13) відображає усі рівні «внутрішніх» даних.

Наступним і не менш важливим є етап наповнення створеної бази даних. В залежності від кожного конкретного випадку, можна обирати ті чи інші методи автоматизації цього процесу. Основним джерелом «внутрішніх» даних служать самі тексти публікацій, які можуть зберігатись у різних форматах: *.doc, *.ps, *.pdf тощо. Умови задачі автоматизованого одержання необхідних даних у відповідному представленні відрізняються для кожного окремого випадку. Задача наповнення бази даних видання «Condensed Matter Physics» спрощується тим, що статті готуються до друку, а також зберігаються у форматі LaTeX, сама концепція якого забезпечує певну структурованість матеріалу.



Рис. 14. Фрагмент мережі співавторства журналу «Condensed Matter Physics». Візуалізація цієї та частини інших мереж здійснена за допомогою програмного пакету Pajek [10].


Подальша задача аналізу «внутрішніх» даних наукового періодичного видання є фактично задачею видобутку знань. Базуючись на статистичних даних про статті, опубліковані у журналі, можна одержати корисну інформацію та використати її для підтримки прийняття управлінських рішень. Особливістю такого підходу є те, що він дає можливість детально проаналізувати видання, не втручаючись у його роботу. Таке дослідження, базуючись на «внутрішніх» даних про видання, що можуть бути одержані з самих публікацій, не вимагає проведення експертних суб’єктивних оцінок чи використання даних із зовнішніх джерел (про одержані цитування, про позицію в рейтингах видань, тощо). Вивчення цих «внутрішніх» даних включає в себе різні методи аналізу, починаючи від статистичних, що виявляють частотні характеристики тих чи інших параметрів, і закінчуючи методами виявлення так званих шаблонів (patterns) – закономірностей, що властиві вибіркам даних, які виражені у формі, зрозумілій людині-експерту. Зокрема, зручні засоби для представлення та аналізу великого обсягу взаємопов’язаних даних [6–9] дає теорія складних мереж. На Рис. 14 наведено фрагмент мережі співаторства журналу «Condensed Matter Physics» для ілюстрації способу представлення взаємопов’язаних даних про авторство статей у цьому виданні.

Отже, наступним кроком у напрямку створення системи моніторингу та інформаційної підтримки прийняття рішень для наукового періодичного видання є застосування методів аналізу даних та візуалізації одержаних результатів для їх використання в редакційній роботі.

1   2   3   4   5   6   7   8   9


Скачати 380.62 Kb.

  • 3.4. Наповнення сайту