Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Звіт за договором №02/2010 від 27. 07. 2010 про виконання наукових досліджень за темою: Впровадження сучасних інформаційних технологій та систем інформаційно-аналітичної підтримки у сфері організації науково-дослідної роботи що виконується в

Скачати 380.62 Kb.

Звіт за договором №02/2010 від 27. 07. 2010 про виконання наукових досліджень за темою: Впровадження сучасних інформаційних технологій та систем інформаційно-аналітичної підтримки у сфері організації науково-дослідної роботи що виконується в




Скачати 380.62 Kb.
Сторінка5/9
Дата конвертації10.03.2017
Розмір380.62 Kb.
ТипЗвіт
1   2   3   4   5   6   7   8   9

2. Електронна бібліотека, документообіг, система збереження даних

2.1. Електронна бібліотека Інституту фізики конденсованих систем

У Вступі вже згадано про необхідність створення засобів централізованого збереження і каталогізації електронних публікацій у вигляді електронної бібліотеки. До неї було сформульовано наступні вимоги:



  1. працівники ІФКС повинні мати можливість працювати з нею в локальній мережі, користуючись звичними засобами, бажано виключно браузерами. Встановлення додаткового програмного забезпечення на комп’ютерах користувачів не повинне бути необхідним;

  2. відображення наявних матеріалів має бути структурованим;

  3. необхідним є повнотекстовий пошук по матеріалах.

Після аналізу існуючих систем керування документами, у зв’язку з складними вимогами до бібліотеки та різнорідністю форматів, що використовуються, було вирішено реалізувати відповідну програмну частину самостійно.

2.1.1. Апаратна частина Бібліотеки

Для реалізації повнотекстового пошуку сервер, на якому розташовано бібліотеку, повинен володіти достатньою швидкодією, зокрема, щоби ефективно виконувати індексацією. Було вибрано комп’ютер з двома процесорами AMD Athlon - 2000, 2Гб оперативної пам’яті. При цьому час повної переіндексації наявного масиву документів складає 30-40 годин. Критичним також є дисковий простір для розташування інфраструктури бібліотеки, публікацій та пошукового індексу, для чого виділено жорсткий диск розміром 500 Гб. Додатково на комп’ютер встановлено жорсткий диск розміром 80Гб для завантаження операційної системи.



2.1.2. Програмне забезпечення Бібліотеки

Файли з публікаціями (книгами, статтями) знаходяться в директоріях, ієрархія яких відповідає вибраній логічній структурі матеріалів. Кожна категорія ієрархії знаходиться в окремій директорії. Якщо публікація або категорія публікацій належить кільком категоріям вищого рівня, замість дублювання використовуються символічні посилання файлової системи. Описана ієрархічна структура формує каталог бібліотеки.

Тверди́й диск або Тверди́й магні́тний диск, або Накопичувач на магнітних дисках (англ. Hard (magnetic) disk drive, англ. HDD), у комп'ютерному сленгу - «вінчестер» (від англ. winchester), - магнітний диск, основа якого виконана з твердого матеріалу.

Фа́йлова систе́ма - спосіб організації даних, який використовується операційною системою для збереження інформації у вигляді файлів на носіях інформації. Також цим поняттям позначають сукупність файлів та директорій, які розміщуються на логічному або фізичному пристрої.

Ієрархічна структура - множина будь-чого, частково упорядкована так, що існує тільки один елемент цієї множини, який не має попереднього, а всі інші елементи мають тільки один попередній; багаторівнева форма організації об'єктів з чіткою приналежністю об'єктів нижнього рівня певному об'єкту верхнього рівня.

Цей підхід є найбільш простим та природнім. Метаінформація, така як автори, назва книги, статті чи іншої публікації, рік публікації, мова, технічна інформація про файл і т.д., зберігається в файлі, з тією ж назвою, що і описувана публікація чи категорія та додатковим суфіксом-«розширенням». Для публікацій це “.bibitem_xml”, для категорій – “bibcat_xml”. Внутрішній формат файлів – XML.

Формат файлу (або тип файлу) в інформатиці - це усталений стандарт запису інформації у файлі даного типу. Спосіб кодування інформації або даних залежить від застосованої комп'ютерної програми. Часто формат файлу визначається його розширенням.

Таке рішення не є обов’язково єдиним (іншим варіантом було б використання виділеної бази даних), проте є найбільш простим у використанні та підтримці, а накладні витрати, пов’язані з доступом до цих файлів та їх зберіганням достатньо малі. Крім того, при потребі, легко здійснити перехід на інші схеми роботи з метаданими.

На Рис. 5 наведено приклад такого файлу опису публікації.




Рис.5. Приклад файлу метаданих.

Для книг, що зберігаються в бібліотеці рекомендується формат іменування файлів, який є де-факто стандартом в Інтернеті. Приклад такого імені файлу:


frame1
Він примусово не нав’язується програмним забезпеченням, проте є найбільш зручним і для нього розроблено ряд програм, зокрема для генерації відповідних файлів опису метаданих та генерації правильного імені файлу за метаданими.

Відображення вмісту бібліотеки відбувається з використанням парсера, написаного мовою PHP та http-сервера Apache. Завдяки цьому для роботи з бібліотекою можна використовувати будь-який браузер. Для кожної категорії відображаються всі підкатегорії та всі публікації поза підкатегоріями, що їй належать. Для прикладу на Рис. 6 показано першу сторінку відображення категорії «Квантова теорія поля».





Рис.6. Сторінка відображення категорії «Квантова теорія поля».

В бібліотеці використовуються наступні формати публікацій: PDF, DJVU, RTF, DOC-формат Microsoft Word, ppt-формат Microsoft PowerPoint, відповідні формати OpenOffice, звичайні текстові файли txt, тощо.

Для повнотекстового пошуку використовується система індексації та пошуку MnoGoSearch. Вона здатна працювати зі всіма перерахованими форматами, зокрема з OCR-шарами DJVU та сканованих PDF. Ця система є програмою з відкритими вихідним кодом (Open Source) для UNIX-подібних операційних систем.

Початковий код (англ. source code; також перекладається українською як вихідний код, програмний код, джерельний код, первинний код, текст програми, у професійному середовищі також сирцевий код, у контексті код або сирці) - будь-який набір інструкцій або оголошень, написаних комп'ютерною мовою програмування у формі, що її може прочитати і модифікувати людина.

Microsoft Word (повна назва Microsoft Office Word, часто вживаються - MS Word, WinWord або просто Word) - текстовий процесор, що випускається фірмою Майкрософт, входить до складу офісного пакету «Microsoft Office».

UNIX-подібна операційна система (інколи скорочено як *nix) - операційна система, яка виникла під впливом UNIX. Термін включає в себе вільні/відкриті операційні системи, утворені від UNIX компанії Bell Labs або емульовані його можливості, комерційні і запатентовані розробки, а також версії, засновані на сирцевому коді UNIX.

З її допомогою можна шукати за різними комбінаціями ключових слів та фраз, здійснювати пошук у вже знайденому, пошук за підкатегоріями, використовувати різноманітні фільтри. В майбутньому можливим є використання морфологічного пошуку за схожими словами. Доступ до пошуку також здійснюється через веб-сервер, а для передачі інформації використовуються прості html-форми, з якими можна працювати практично будь-яким браузером. На Рис. 7 показано вигляд пошукового меню.



Рис. 7. Пошукове меню бібліотеки.

Систему розмежування доступу до різних категорій бібліотеки реалізовано з використанням http-аутентифікації.

Базовою операційною системою є Linux, дистрибутив Debian. Варто зауважити, що оскільки всі засоби та інструменти, які використовувалися при розробці програмної частини бібліотеки, є Open Source та кросплатформенними, то з незначними змінами вона здатна працювати і під керуванням OS Windows.

Допоміжні програми реалізовано на мові C , їх графічний інтерфейс користувача (GUI) написано на базі бібліотеки wxWidgets.

Відкрите програмне забезпечення (англ. open-source software) - програмне забезпечення з відкритим сирцевим кодом.

Графі́чний інтерфе́йс кори́стувача́ (ГІК, англ. GUI, Graphical user interface) - тип інтерфейсу, який дозволяє користувачам взаємодіяти з електронними пристроями через графічні зображення та візуальні вказівки, на відміну від текстових інтерфейсів, заснованих на використанні тексту, текстовому наборі команд та текстовій навігації.


1   2   3   4   5   6   7   8   9


Скачати 380.62 Kb.

  • 2.1.1. Апаратна частина Бібліотеки
  • 2.1.2. Програмне забезпечення Бібліотеки