Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Розпізнавання графічної інформації у "abbyy fineReader"

Скачати 192.89 Kb.

Розпізнавання графічної інформації у "abbyy fineReader"




Скачати 192.89 Kb.
Дата конвертації24.05.2017
Розмір192.89 Kb.
ТипЛабораторна робота

ЛАБОРАТОРНА РОБОТА № 7
Розпізнавання графічної інформації

у “ABBYY FineReader”

Тема: розпізнавання графічної інформації у “ABBYY FineReader”

Мета: опанувати роботу з програмою “FineReader”. Навчитися розпізнавати документ за допомогою програми “FineReader”. Одержати навички щодо коригування зображень засобами графічного редактора “Photoshop” для їх подальшого розпізнавання
Теоретичні відомості

Сканування – це процес одержання графічної копії оригінального зображення.

Програма (фр. programme письмове оголошення, порядок денний, від грец. prógramma вказівка) - заздалегідь затверджена (визначена) дія.
Кре́слення - дисципліна зі створення стандартизованих технічних малюнків, що виконуються фахівцями інженерами, архітекторами тощо.
Гра́фіка (нім. Graphik, грец. graphikos «написаний») - вид образотворчого мистецтва, для якого характерна перевага ліній і штрихів, використання контрастів білого і чорного та менше, ніж у живописі, використання кольору.
Пра́ця - цілеспрямована діяльність людей зі створення матеріальних і духовних благ, необхідних для задоволення потреб кожного індивіда і суспільства в цілому.
Графічний редактор - прикладна програма (або пакет програм), що дозволяє її користувачеві створювати і редагувати зображення на екрані комп'ютера і зберігати їх в графічних форматах файлів, наприклад, JPEG, PNG, GIF, TIFF.
Сканувати документ можна по-різному. Наприклад, за допомогою сканера або фотоапарата.
Фотокамера - прилад для фіксації зображень матеріальних об'єктів за допомогою світла на спеціальному носії (зазвичай фотоплівці або у формі комп'ютерного файлу на електронній карті пам'яті).
Сканер (англ. scanner) - пристрій, призначений для створення зображень певних об'єктів шляхом обробки променів, які відбиваються від поверхні об'єкта або проходять крізь об'єкт. В більш вузькому значенні - пристрій для отримання комп'ютерного цифрового зображення.
І в тому і в іншому випадках результатом буде растровий графічний файл.
Результат, пі́дсумок, (заст. ску́ток, вислід) - кінцевий наслідок послідовності дій. Можливі результати містять перевагу, незручність, вигоду, збитки, цінність і перемогу. Результат є етапом діяльності, коли визначено наявність переходу якості в кількість і кількості в якість.
Цей файл може бути кольоровим або чорно-білим, мати різну роздільність, може бути представлений у різних форматах (найчастіше «*.jpg» або «*.tif»). Важливо розуміти головне: растровий файл – це набір точок. Те, що на екрані або друкованому аркуші він виглядає як текст, ще ні про що не свідчить. Опрацювати цей «текст» програмою «MS Word» або «MS Excel» неможливо.
Алгори́тм (латинізов. Algorithmi за араб. ім'ям узб. математика аль-Хорезмі) - набір інструкцій, які описують порядок дій виконавця, щоб досягти результату розв'язання задачі за скінченну кількість дій; система правил виконання дискретного процесу, яка досягає поставленої мети за скінченний час.
Усе, що ви зможете з ним зробити – це вставити його у вигляді готового об’єкта. Відкоригувати растровий файл можна лише у спеціальній програмі – графічному редакторі. При цьому працювати з ним можна як з рисунком, а не як з текстовим документом.

Слід розрізняти відмінність між текстом і сканованим документом. Уявіть, що вводиться документ до програми «MS Word», набираючи його на клавіатурі. Щоразу, натискаючи клавішу, до комп’ютера потрапляє її код. Фактично цей код і зберігається у документі фомату «MS Word». У цьому випадку для кожної букви документа відомо її походження.

Клавіату́ра (англ. keyboard) - сукупність розміщених у певному порядку клавіш пристрою, що використовується для введення і редагування даних, а також керування виконанням окремих операцій.
Документа́ція - сукупність офіційно визнаних, взаємопов'язаних та складених у визначеній формі документів, які містять передбачувану інформацію про виріб, процес або діяльність даного підприємства. Відповідно до області застосування Документа́цій поділяється на бухгалтерську, конструкторську, нормативну, технічну, товарну, тощо.
Наприклад, перший символ цього абзацу має код «0194», це буква «В», другий – код «0224», це символ «а» тощо. При друці або виведенні тексту на екран виконується ВІЗУАЛІЗАЦІЯ документа.
Візуалізація - унаочнення, створення умов для візуального спостереження.
Тобто, виходячи з кодів, що є в тексті «MS Word» формує їх графічне зображення, іншими словами, «промальовує» букви. Коли коригується документ у програмі «MS Word», змінюються коди символів у документі. Саме тому одне натискання клавіші може змінити лише один символ. У графічному зображенні цього немає. Сканер нічого не друкує. Він вводить піксели (крапки) зображення. Будучі розташовані у певному порядку, ці піксели виглядають як текст, і не більше того. Той факт, що якась частина цього зображення – це символ «В», якась частина – символ «а» комп’ютеру невідома. Для нього ці символи – усього лише вибудуваний певним чином набір пікселів. Тому й відредагувати ці піксели програмою «MS Word» не можна.

Для того, щоб перетворити графічний файл до текстового документу, його потрібно розпізнати. Цим займаються спеціальні програми оптичного розпізнавання образів (OCR).

О́птика (англ. optics) - розділ фізики, в межах якого вивчається природа оптичного випромінювання (світла), досліджуються процеси випромінювання світла, його поширення в різноманітних середовищах і взаємодії з речовиною.
Те́кстовий файл - форма подання послідовності символів у комп'ютері, де кожен символ із задіяного набору символів кодується одним байтом чи послідовністю двох, трьох і т. д. байтів. На відміну від терміна «текстовий формат», що характеризує вміст даних, термін «текстовий файл» стосується файлу та характеризує його як контейнер, який зберігає такі дані.
Тео́рія розпізнава́ння о́бразів - розділ кібернетики, що розвиває теоретичні основи й методи класифікації і ідентифікації предметів, явищ, процесів, сигналів, ситуацій і т. п. об'єктів, які характеризуються кінцевим набором деяких властивостей і ознак.
Однією з найпоширеніших програм цього класу є програма «FineReader». Незважаючи на відмінності у деталях, мета у цих програм одна. Вони аналізують зображення, намагаючись знайти фрагменти із певним змістом.
Фрагмент (лат. fragmentum - уламок, шматок, скалка) - яка-небудь частина цілого.
Ана́ліз (від грец. αναλυσις - «розклад») - розчленування предмету пізнання, абстрагування його окремих сторін чи аспектів. Метод дослідження, який вивчає предмет, уявно чи реально розчленовуючи його на складові елементи, як-от частини об'єкта, його ознаки, властивості, відношення, відтак розглядає кожен з виділених елементів окремо в межах єдиного цілого; протилежний метод - синтез.
Це можуть бути символи тексту, таблиці, малюнки. Тобто програма розпізнавання намагається з’ясувати структуру документа: знайти букви, слова, речення, орієнтуючись на специфіку їх зовнішнього вигляду. Потім вона формує текстовий документ, перевіряє його за системою словників, граматичних правил та пропонує користувачеві для остаточного контролю. Коли перевірку завершено, результат роботи програми розпізнавання можна зберегти у формат текстового процесора «MS Word» або електронної таблиці «MS Excel».
Словни́к - упорядкований в алфавітному чи тематичному порядку список заголовних слів, лексикографічно опрацьованих.
Грама́тика (грец. γραμματική, від γράμμα - «літера», «написання») - термін, який вживається в двох пов'язаних значеннях: як будова мови і як розділ мовознавства, що вивчає граматичну будову мови.
Табличний процесор (англ. electronic spreadsheet - електронний аркуш або електронна таблиця) - це інтерактивний, комп'ютерний застосунок для налагодження, аналізу та збереження даних у табличному форматі.
Те́кстовий проце́сор (англ. word processor) - комп'ютерна програма-застосунок, що дозволяє виконувати операції набору, редагування та оформлення тексту.
І тільки після можна отримати «нормальний» документ, з яким можна працювати.

Звичайно, на практиці не все так просто. Алгоритм розпізнавання – процес складний, у випадку неякісних зображень програма розпізнавання припуститься чисельних помилок. Щоб мінімізувати їх кількість, треба чітко уявляти, які мають бути зображення для доброго розпізнавання, як їх можна виправити у графічному редакторі, яким чином треба організувати сам процес розпізнавання.

Кількість - в Арістотелівській логіці друга з 10 категорій (класів, розрядів, які спрощують процес розумового визначення будь-якої речі), побічна обставина матеріальних речей , за допомогою якої вони поширюються в просторі, вимірюються якоюсь математичною нормою і здатні бути поділеними на окремі частини.

Які зображення можна розпізнати.

Щоб процес розпізнавання був успішним, графічне зображення повинне відповідати певним вимогам, а саме:



  • графічний файл повинен мати роздільність десь близько 300 dpi. До речі, це «стандартна» роздільність для цифрового фотоапарата;

  • лінійний розмір зображення при цій роздільності повинен бути зіставленим з оригіналом. Малоймовірно, щоможна розпізнати сторінку документа з роздільною здатністю 300 dpi розміром з поштову марку;
    Оригінал - (від лат. originalis - первісний) - первісний, справжній.
    Пошто́ва ма́рка - цінний папір, що є свідоцтвом оплати поштового відправлення. Використовується шляхом наклеювання на предмет поштової пересилки і наступного погашення поштовим штемпелем.


  • для розпізнавання тексту зображення може бути чорно-білим або у відтінках сірого. Переваг роботи з кольоровими зображеннями в цьому випадку немає.

Це, так би мовити, технічні вимоги до малюнків для розпізнавання. Зрозуміло, є й інші не менш важливі умови для успішного виконання цієї роботи. Наприклад, зображення повинне бути досить контрастним, букви – із чітко обкресленими краями. Будь-яке «сміття» на сканованому зображенні у вигляді позначок олівцем, плям, дефектів паперу програма розпізнавання спробує ідентифікувати як символи. Усунення подібних дефектів – не наше завдання.
Задача - проблемна ситуація з чітко визначеною метою, яку необхідно досягти; в більш вузькому сенсі задачею називають також цю саму мету, що дана в рамках проблемної ситуації, тобто те, що необхідно виконати.
Необхідно зробити так, щоб їх було якомога менше.
Як розпізнати документ у програмі FineReader

Спочатку слід навчитись розпізнавати якісні зображення.

FineReader - застосунок для оптичного розпізнавання символів, розроблена російською компанією ABBYY.
Тобто такі, що не потребують опрацювання. Такі зображення можуть бути отримані зі сканера, або внаслідок копіювання фрагментів екрана. Для прикладу візьмемо для розпізнавання фрагмент тексту з таблицею, що зображений на рис. 1:




Для розпізнавання будемо використати програму «FineReader 8.0» компанії ABBYY ( http://www.abbyy.ua/ ), скачавши демонстраційну версію з http://www.abbyy.ru/Download/.


Інтерфейс програми FineReader

Вікно програми зображено на рис. 2. У ньому представлено меню, під ним – панелі інструментів.

Пане́ль інструме́нтів (англ. toolbar) - елемент графічного інтерфейсу користувача, призначений для розміщення на ньому кількох інших елементів.

Нижче панелі інструментів знаходяться п'ять великих іконок для керування програмою, а саме: «Scan&Read», «Открыть», «Распознать», «Проверить», «Microsoft Word». Основна частина вікна розбита на чотири області. Перелічимо їх у порядку зліва-направо й зверху-вниз. У лівій частині вікна міститься область сторінок документа. Кожна сторінка – це окреме зображення. Праворуч від області сторінок розташоване віконце «Изображение». У ньому ми бачимо фрагмент відсканованого документа, а також його розмітку (про неї поговоримо трохи пізніше). У правій частині вікна показаний результат розпізнавання. Це – текстовий документ, його можна правити прямо в програмі FineReader.

У нижній частині вікна розташована область зі збільшеною копією зображення. Між областю сторінок і віконцем «Изображение» перебуває робоче меню для розмітки малюнка перед його розпізнаванням.


Послідовність дій щодо розпізнавання документу

Щоб розпізнати сканований документ, потрібно зробити так:

1. Завантажити одне або декілька зображень до програми FineReader.

2. Відредагувати зображення, щоб очистити його від «сміття», усунути перекручування рядків й т. і. Цей етап потрібен не завжди.

3. Розмітити зображення, тобто вказати, Як FineReader повинен інтерпретувати окремі ділянки малюнка.

О́бласть - місцевість, земля, край; частина якоїсь території (країни, держави, материка, суші тощо), виділена для районування за певною особливою ознакою (природними умовами, історичними традиціями, етнічними або економічними особливостями, адміністративно-політичним значенням та ін.)
Інтерпретатор мови програмування (interpreter) - програма чи технічні засоби, необхідні для виконання інших програм, вид транслятора, який здійснює пооператорну (покомандну, построкову) обробку, перетворення у машинні коди та виконання програми або запиту (на відміну від компілятора, який транслює у машинні коди всю програму без її виконання).
Звичайно така операція потрібна при складному форматуванні документа. Для простих випадком операцію розмітки FineReader прекрасно виконує в автоматичному режимі. 4. Розпізнати документ.

5. Переглянути результат роботи. Якщо FineReader помилився, можна відредагувати документ або поправити розмітку й повторити розпізнавання.

6. Імпортувати результат розпізнавання до зовнішнього додатку, наприклад, до програми Word або Excel.
Завантаження зображень

У нашому випадку дані для розпізнавання перебувають на жорсткому диску у вигляді графічних файлів.

Імпорт - ввезення товарів, послуг (іноді може вживатися щодо капіталу, знань, технологій)
Автома́тика (грец. αύτόματος - самодіючий) - галузь науки і техніки, яка розробляє технічні засоби і методи для здійснення технологічних процесів без безпосередньої участі людини.
Тверди́й диск або Тверди́й магні́тний диск, або Накопичувач на магнітних дисках (англ. Hard (magnetic) disk drive, англ. HDD), у комп'ютерному сленгу - «вінчестер» (від англ. winchester), - магнітний диск, основа якого виконана з твердого матеріалу.
Натискаємо кнопку «Открыть» (на рис. 2 вона зображена з номером «1»). З'явиться вікно Провідника. У ньому знаходимо папку, виділяємо потрібні файли й клацаємо на кнопці «Открыть» або натискаємо «Enter». Завантажені зображення з'являться в області сторінок.

Для швидкого завантаження зображень користуйтеся комбінацією «Ctrl O» (англійська буква «O»). Можете також скористатися меню «Файл → Открыть».

Кнопка «Scan&Read» служить для початку процесу сканування документа. Якщо ви користуєтеся сканером, включіть його, покладіть документ і натисніть «Scan&Read». Подальша робота залежить від моделі сканера й має бути викладена в інструкції до нього. Через цю кнопку можна й завантажити документ. Клацніть на маленькому трикутнику в лівій частині іконки «Scan&Read».

Трику́тник у евклідовій геометрії - геометрична фігура, яка складається з трьох точок, що не лежать на одній прямій, і трьох відрізків, що їх сполучають. Трикутник з вершинами A, B, і C позначається ABC.
Розкриється список можливих дій. Серед них буде й операція «Открыть и распознать». Точно так, розкривши список дій кнопки «Открыть», ви побачите рядок «Сканировать изображение… Ctrl K»... Таким чином, кнопки «Scan&Read» й «Открыть» багато у чому взаємозаміняють одна одну.


Автокоригування зображень

Операції коригування зображення зосереджені в меню «Изображение». Розберемо ті можливості, які доводиться використати найчастіше.

Можливість - це дія, що може відбутися або ні (можливо, приїду, а, можливо, і ні). Можливість можна забезпечити чи покладатись на «авось» та якось буде. Альтернатива дає шанс, але не гарантує без відповідних дій забезпечення результату і адекватності та конструктиву діяльності.

ПОВОРОТ ЗОБРАЖЕННЯ. Текст при розпізнаванні повинен бути зорієнтований «зверху вниз» і випливати «зліва направо». Якщо сторінка документа сканована з поворотом, її прийде переорієнтувати. Для цього ввійдіть в «Изображение → Повернуть/Отразить изображение». З'явиться меню з п'яти пунктів: «Повернуть по часовой стрелке», «Повернуть против часовой стрелки», «Повернуть на 1800», «Зеркально отразить относительно вертикали», «Зеркально отразить относительно горизонтали». На практиці звичайно вистачає перших двох можливостей.
КОРИГУВАННЯ РОЗДІЛЬНОЇ ЗДАТНОСТІ. Якщо зображення скановано з «неправильним» розділенням, зверніться до меню «Изображение → Исправить разрешение» або «Ctrl Shift T». У вікні встановіть потрібні параметри. Звичайне значення за замовчуванням «300dpi» змінювати не слід. Якщо всі сторінки скановані з низьким розділенням, переустановіть перемикач «Исправить разрешение» у положення «Всех изрображений пакета».

Перемика́ч або вимикач, іноді ту́мблер (англ. tumbler від to tumble - «гойдатися», «хитатися») - електронний компонент, електромеханічний пристрій для розмикання електричного кола або перемикання електричного струму з одного провідника на інший.
Розді́льна - місто у західній частині Причорноморської низовини, районний центр Роздільнянського району Одеської області; 18015 меш. (2016). Відстань до облцентру становить близько 87 км і проходить автошляхами Т 1618 та E95.
Поло́ження - нормативно-правовий або локально-правовий акт, що визначає основні правила організації та діяльності державних органів, структурних підрозділів органу, а також установ, організацій і підприємств (філій), що їм підпорядковуються, тимчасово створюваних комісій, груп, бюро і т. ін.

ОЧИЩЕННЯ ЗОБРАЖЕНЬ ВІД ДЕФЕКТІВ. Тепер спробуємо поліпшити якість картинки. Відразу скажемо: серйозні дефекти зображення Finereader не виправить. Він може прибрати лише незначні дефекти, такі як смітинки на папері, невеличкі плями й т. і. Причому цю операцію він зробить інтелектуально: текст залишиться у первісному стані, його пошкоджено не буде. Щоб поліпшити зображення і прибрати з нього незначні дефекти треба діяти так:

– виділити одну або кілька сторінок документа;

– викликати меню «Изображение → Обработать изображение → Очистить изображение от мусора».


«ВИРІВНЮВАННЯ» РЯДКІВ. Один з типових дефектів сканування – це деформація рядків тексту.
Деформа́ція (від лат. deformatio - «спотворення») - зміна розмірів і форми твердого тіла під дією зовнішніх сил (навантажень) або якихось інших впливів (наприклад, температури, електричних чи магнітних полів).
Ось приклад: при скануванні книги текст, що міститься біля її переплету звичайно виглядатиме нерівним. У цьому випадку рядки тексту на сканованому зображенні будуть виглядати не прямими, а трохи деформованими. Виправити такий дефект може операція усунення деформації рядків. Правда, упоратися із цим завданням вона зможе не завжди!

Щоб вирівняти рядки у відсканованому зображенні зробіть так.

– виділіть одну або кілька сторінок документа;

– зверніться до меню «Изображение → Обработать изображение → Устранить искажение строк».

Користуйтесь інструментом вирівнювання рядків обережно. У деяких випадках він може відробити неправильно. Тому не застосовуйте вирівнювання відразу до всіх сторінок документа. Обробляйте їх по однієї, щораз переглядаючи отриманий результат. Цими можливостями ми поки що й обмежимося.

Розмітка документу

Інформацію в електронному документі можна умовно розділити на три категорії: текст, таблиця й малюнок.

Електро́нний докуме́нт - документ, інформація в якому зафіксована у вигляді електронних даних, включаючи обов'язкові реквізити документа. Електронний документ може бути створений, переданий, збережений і перетворений електронними засобами у візуальну форму.
При розпізнаванні програмі FineReader бажано «знати», з чим вона має справу. У принципі, аналізуючи сторінку, виявити її структуру FineReader може й самостійно. Але при складному форматуванні можливі помилки. Наприклад, якщо в документ вставлене зображення вікна Windows. FineReader напевно спробує розпізнати текст меню цього вікна, хоча за змістом нічого такого робити не потрібно.

У простих випадках опирайтеся на автоматичну розмітку тексту. Якщо форматування йде в декількох колонках, перемежовується малюнками, таблицями – робіть розмітку самі.

Принцип (лат. principium - начало, основа) - це твердження, яке сприймається як головне, важливе, суттєве, неодмінне або, принаймні, бажане. У повсякденному житті принципами називають внутрішні переконання людини, ті практичні, моральні та теоретичні засади, якими вона керується в житті, в різних сферах діяльності.
Форматува́ння (formatting) - процедура створення структур порожньої файлової системи вказаного типу - розподіл доріжок магнітного диска (дискети, твердого диска) чи іншого носія інформації (наприклад, SSD чи флеш-накопичувача) на фізичні чи логічні записи, що виконується перед першим використанням диска.
Виправляти помилки FineReader-а вийде довше. Тому треба освоїти «ручну» розмітку документа, тим більше, що зробити це зовсім не складно.

Подивіться на панель інструментів розмітки ліворуч від області сторінок. Почнемо з іконки з буквою «Т»: це інструмент для визначення текстового блоку. Клацніть на іконці лівою кнопкою миші. Поставте покажчик на зображенні документа там, де повинен починатися фрагмент тексту. Утримуючи натиснутої ліву кнопку миші, обведіть текстовий блок. Відпустите ліву кнопку миші. У документі з'явилася прямокутна область зеленого кольору.

Озна́чення, ви́значення чи дефіні́ція (від лат. definitio) - роз'яснення чи витлумачення значення (сенсу) терміну чи поняття. Слід зауважити, що означення завжди стосується символів, оскільки тільки символи мають сенс що його покликане роз'яснити означення.
Прямоку́тник - це чотирикутник, усі кути якого прямі. Протилежні сторони прямокутника рівні. Є окремим випадком паралелограма.
Вона повинна охоплювати фрагмент зображення, що FineReader тепер буде розглядати як текст. На рис. 2 текстовий блок охоплює всю частину документа, за винятком таблиці. Він позначений номером 1.

Щоб видалити блок розмітки потрібно виділити його щигликом миші й нажати клавішу «Del». Щоб змінити розмір блоку виділите його й розтягніть за кут або границю так, як ви міняєте розмір вікна Windows.

Таким же чином ви можете виділити блок з таблицею або малюнком. Ці іконки розташовані нижче інструмента виділення текстового блоку. З областями малюнків все зрозуміло: ці ділянки зображення FineReader розпізнавати не буде. Він перенесе їх у результуючий документ «як є». А от з таблицями має сенс познайомитись докладніше. Зазвичай розпізнавання таблиці робиться так.

- Вибираємо інструмент визначення блоку з таблицею.

- Акуратно обводимо фрагмент зображення, де міститься таблиця. Зайвий простір при цьому краще не чіпати, але й зовнішня границя таблиці повинна

повністю перебувати всередині блоку:


- Клікаємо усередині створеного блоку правою кнопкою миші. З контекстного меню (рис. 3) вибираємо «Анализ структуры таблицы».

- Переглядаємо результат розмітки. Особливу увагу звертаємо на те, як розташувались окремі осередки таблиці. Для цього є сенс послідовно клацати лівою кнопкою миші по осередках таблиці в області розмітки й аналізувати правильність їхнього розташування.

- Якщо FineReader усе зробив правильно, переходимо до наступного етапу роботи.

А що робити в тому випадку, якщо при розмітці таблиці є певні помилки? Наприклад, FineReader не розпізнав бліду лінію границі й об'єднав декілька осередків в один? Для цього на панелі розмітки блоків є інструменти: «Добавить вертикальную линию», «Добавить горизонтальную линию» й «Удалить линии». Користуватися ними дуже просто.

Користува́ння - добування з речей їхніх корисних властивостей (наприклад, збирати врожай, вживати продукти харчування, носити одяг і взуття). Одна з трьох класичних правомочностей власника (нарівні з володінням і розпорядженням).
Клацніть на іконці «Добавить вертикальную линию». Переведіть покажчик миші у віконце «Изображение» на таблиці. Разом з покажчиком по зображенню буде переміщатися вертикальна лінія розмітки. Поставте її на потрібне місце й клацніть лівою кнопкою миші. Таким же чином додайте всі відсутні вертикальні лінії в розмітці таблиці. Щоб закінчити роботу в режимі додавання ліній виберіть інший інструмент розмітки.

За таком ж алгоритмом розберіться з горизонтальними лініями.

Покажчики - довідковий матеріал, який допомагає читачеві швидко знайти потрібний текст у виданні.
Додавання - бінарна арифметична операція, суть якої полягає в об'єднанні математичних об'єктів.
Горизонталь, ізогіпса (англ. contour lines, horizontal, isohyps, нім. Höhenkurve f, Horizontale f; рос. горизонталь, изогипса; від дав.-гр. ισος - равний і дав.-гр. ὕψος - висота) - лінія на плані (карті), яка з'єднує точки земної поверхні з однаковою абсолютною висотою.
Інструмент «Удалить линии» допоможе стерти зайві лінії розмітки таблиці. При роботі з таблицями часто доводиться поєднувати або розділяти окремі осередки таблиці. Зробити це простіше всього через праву кнопку миші. Поставите покажчик на осередок таблиці. Клацніть правою кнопкою миші. З контекстного меню (рис. 3) виберіть пункт «Ячейки таблицы». У ньому є три розділи: «Разбить ячейки», «Объединить ячейки», «Объединить строки». Якщо FineReader помилково злив кілька осередків в одну, скористайтеся з можливості «Разбить ячейки». Якщо буде потрібно об'єднання осередків в одне ціле, виділіть їх і зверніться до пункту «Объединить ячейки» контекстного меню.
Розпізнаємо зображення

Коли розмітка сторінок завершена, натисніть «Ctrl Shift R» – розпізнати всі сторінки. Цю дію можна виконати через меню «Процесс → Распознать → Распознать все» або розкривши список доступних дій кнопки «Распознать».

Стежте за тим, яка мова встановлена для розпізнавання. Вибрати мову можна прямо на панелі інструментів FineReader. Наприклад, на рис. 2 встановлена пара «Русский и английский». Щигликом миші розкрийте список і виберіть варіант, що підходить для вашого випадку.

Результат розпізнавання можна подивитися у віконці «Текст» (рис. 2). Уважно прогляньте його. Спочатку переконаєтеся, що FineReader правильно обробив структуру документа. Якщо це не так, відкоригуйте розмітку й заново розпізнайте сторінку. При повторному розпізнаванні не обов'язково заново обробляти весь документ. Ви можете обмежитися поточною або декількома виділеними сторінками. Виділіть сторінку й клацніть на кнопці «Распознать» або натисніть «Ctrl R».


Зберігаємо результат

Робота над великими документами може забрати багато часу й проходити в декілька сеансів.

Докуме́нт - базова теоретична конструкція, яка відноситься до всього, що може бути збережене або представлене, щоб служити як доказ для певної мети.
Щоб зберегти результат роботи в програмі FineReader використовується поняття пакет. Пакет поєднує вихідні зображення, їхню розмітку, результати обробки в тім стані, що було на момент створення пакета. Зберегти пакет можна через меню «Файл → Сохранить пакет как…». 10 З'явиться вікно, ідентичне вікну Провідника. Вибираємо папку, вказуємо ім'я пакета й результат збережений.

Пакет являє собою безліч файлів. Щоб не вносити сум'яття, не зберігайте пакет у папку, де вже є якісь дані. Краще завжди зберігати пакет в окремому каталозі.
Імпортуємо результат

Імпорт потрібний для збереження результатів у зовнішньому додатку або буфері обміну.

Кліпборд (англ. clipboard) або сховок - проміжне сховище даних, що призначається для переносу або копіювання між програмами або частинами однієї програми.
Щоб зберегти поточну сторінку в Word клацніть на останній іконці з номером 4 і написом «Microsoft Word» (рис. 2). Відкриється вікно Word з розпізнаним документом. Це не єдиний спосіб імпортування даних. Клацніть на значку розкриття списку кнопки «Microsoft Word». З'являться такі варіанти: «Мастер сохранения результатов», «Сохранить страницы…», «Передать страницы в…», «Передать все страницы в…», «Опции».

Через «Сохранить страницы…» можна записати результат розпізнавання на диск. При записі є можливість вибрати всі або поточну сторінки, а також визначити формат файлу для збереження.

Формат файлу (або тип файлу) в інформатиці - це усталений стандарт запису інформації у файлі даного типу. Спосіб кодування інформації або даних залежить від застосованої комп'ютерної програми. Часто формат файлу визначається його розширенням.

Звичайно користуються пунктами «Передать страницы в…» і «Передать все страницы в…». Ці дві можливості відрізняються тільки тим, що в першому випадку імпортується поточна або кілька виділених сторінок, у другому випадку FineReader передасть всі сторінки документа. Обоє меню містять кілька розділів. Їхня кількість залежить від установлених програм на вашому комп'ютері. Можна обмежитися трьома: «Microsoft Word», «Microsoft Excel» й «Буфер обмена». Виберіть один із зазначених пунктів. FineReader викличе додаток і передасть у нього результат розпізнавання.


Розпізнавання таблиці складної структури

Таблиці неоднорідної структури – звичайна річ у практиці менеджера, економіста і бухгалтера.

Еконо́міка або економічні науки (від дав.-гр. οἶκος, oíkos - «дім» та дав.-гр. νόμος - «закон») - комплекс суспільних наукових дисциплін про господарство, а саме - про організацію та управління матеріальним виробництвом, ефективне використання ресурсів, розподіл, обмін, збут і споживання товарів та послуг.
Бухга́лтер (нім. Buchhalter, Buch - книга, Halter - тримач) - керівник операційних робітників, контролер законності і правильності здійснення операцій у банку, організатор технології цих операцій не тільки у своєму відділенні банку, але і на підприємствах та в організаціях, які обслуговує даний банк.
Керівни́к, також мéнеджер - найманий робітник, зайнятий професійною організаторською діяльністю в органах керування підприємства, фірми, установи, наділений суб'єктом власності визначеними повноваженнями.
Тому, завершуючи тему розпізнавання документів, дамо пораду, як з ними працювати.

Перш ніж розпізнавати складну таблиці постарайтеся визначити її «базову структуру». Визначити той «оптимальний» набір рядків і колонок, що згодом мінімізує витрати на поділ й об'єднання осередків. Коли структура проясниться, зробіть ручну розмітку таблиці.

Вибір структури дуже важливий. Не поспішаєте починати обробку документа, поки не продумаєте це питання. Гляньте для приклада на бланк податкової накладної, зображений на рис. 4.

Пода́тки - це встановлені вищим органом законодавчої влади обов'язкові платежі, які сплачують фізичні та юридичні особи до бюджету у розмірах і термінах, передбачених законодавством.
Спробувавши розпізнати документ «напряму», в автоматичному режимі, ви, швидше за все, одержите кашу з текстових полів, фрагментів таблиць і т.п. Упорядкувати таку абракадабру буде складніше, ніж набрати бланк «з нуля». У той же час проблема вирішується просто.
Абракада́бра (лат. abracadabra - у загальновживаному значенні це будь-яке незрозуміле слово або незрозумілий, безглуздий набір букв або слів, нісенітниця. Абракада́бра - заклинання, від грец. abraxos - назва божества і давньоєврейського dabar - слово).
Проблема - складне теоретичне або практичне питання, що потребує розв'язання, вивчення, дослідження. Проблема - об'єкт (питання, недолік чи потреба чогось,завада від надлишку чи наявності чогось, процес) явище збуджуючого характеру як стимул діяльності спонукаючого характеру - незадоволений попит чи нереалізовані потреби (нестача або відсутність, надлишок або наявність чого-небудь), дефект, вада, чи загроза що змушує цілеспрямовано ліквідувати проблему шляхом уникнення взаємодії чи зміни стану об'єкту, себе чи свого ставлення до подій.
Більшість частин документа вкладається в 11 колонок.
Більшість - велика частина чого-небудь, або кількісне переважання прихильників якоїсь ідеї чи рішення над їхніми противниками. Вважається найпершою засадою демократичного способу прийняття спільних рішень, головною й необхідною умовою обрання кандидата на виборну посаду.
Вони пронумеровані й показані у верхній частині малюнка. При розмітці виділили блок типу «Таблица». Інструментами «Добавить вертикальную линию», «Добавить горизонтальную линию» розмітили таблицю. Зазначте, зробили це вручну. Після цього пройшлися по таблиці, поєднуючи окремі осередки заголовка в групи. Результат розпізнавання такого складного документа був чудовий. Нагадаємо, що поєднувати й розділяти осередки зручно через праву кнопку миші (пункти «Разбить ячейки», «Объединить ячейки»). Якщо ви вдало вибрали структуру для ручної розмітки, найбільш складні таблиці вам не страшні.




Коригування зображень перед їх розпізнаванням. Як перезняти зображення

Якщо ви користуєтеся сканером, сміло пропустіть цей розділ або прочитайте його «по діагоналі». Матеріал цей для тих, хто збирається «сканувати» документи цифровим фотоапаратом або камерою мобільного телефону.

Цифрова́ ка́мера, або цифрови́й апара́т - пристрій, що використовується для зйомки відео та створення фото-знімків або ж обох, в якому світлочутливим матеріалом є матриця або кілька матриць, що складаються з окремих пікселів, сигнал з яких представляється, обробляється і зберігається в самому апараті в цифровому вигляді.
Стільниковий телефон - автономний мобільний телефон, призначений для роботи в мережах стільникового зв'язку; використовує приймач радіодіапазону і традиційну телефонну комутацію для здійснення телефонного зв'язку на території зони покриття мережі.
От кілька простих порад по організації процесу.

Ахіллесова п'ята будь-якого фотоапарата – чутливість до висвітлення. Чим більше буде світла, тим кращим буде результат. Знайдіть можливість добре освітити документ, перш ніж скопіювати його.

– Добийтеся рівномірного висвітлення сторінки документа з усіх боків. Іноді дзеркальце з протилежної сторони від джерела світла допомагає вирішити проблему.

– Стежте, щоб тінь від вашого тіла (або його частини) не падала на документ. Забрати темну пляму на аркуші буде непросто. Навчіться критично оцінювати предмет, що фотографуєте.

Ахілле́с, також Ахілл (грец. Aχιλλευς) - син царя мірмідонян у Фессалії Пелея та морської богині Фетіди, внук Еака, герой Троянської війни.
Джере́ла сві́тла - природні тіла або технічні пристрої різної конструкції і різними способами перетворення енергії, основним призначенням яких є отримання світлового випромінювання з різною довжиною хвилі, - як видимої частини спектру, так і невидимі для людського ока промені (наприклад, інфрачервоні).
Критика - розгляд якогось явища, предмета, особи; його аналіз та оцінка згідно з існуючими нормами, масштабами, цінностями.[Джерело?] Аналіз і оцінка когось чи чогось із метою виявлення та усунення вад, хиб.

– Стежте за нахилом камери (телефону). Типова помилка при перефотографуванні документів – зйомка під неправильним кутом. У цьому випадку геометрія зображення буде перекручена.

Геоме́трія (від дав.-гр. γη - Земля і μετρέω - вимірюю; землеміряння) - розділ математики, наука про просторові форми, відносини і їхні узагальнення.
Замість прямокутного аркуша ви одержите подобу трапеції.
Трапе́ція - це чотирикутник, дві протилежні сторони якого паралельні. Паралельні сторони називаються основами трапеції (сторони AB та DC на малюнку). Інші сторони називаються бічними сторонами (сторони AD та CB).
Усунути цей дефект можна. Але краще тримаєте камеру строго перпендикулярно площини документа.
Перпендикуля́рність - бінарне відношення між різними об'єктами (векторами, прямими, підпросторами тощо) в евклідовому просторі. Окремий випадок ортогональності.


Штучний спалах та його використання

– Використайте його. Це дасть досить світла, зображення вийде чітким, контрастним. Але головне – всі зображення будуть приблизно однакові. Тому коректувати їх прийдеться по одній схемі. А це спрощує завдання.

– При роботі зі спалахом не знімайте з близької відстані. Швидше за все, спалах «пересвітить» кадр, документ вийде занадто світлим. Можна перезнімати з відстані 70-90 см. Точне значення вам підкаже досвід спілкування з вашою моделлю фотокамери. Щоб оригінал не вийшов дуже дрібним, виберіть ступінь збільшення (зуммування) в 1,5, максимум в 2 рази. Тоді й спалах кадр не «пересвітить» і геометричні перекручування, характерні для оптики недорогої фотокамери, будуть мінімальні.

– Максимально використайте площу кадру. Стежте, щоб не було великих полів між краями аркуша й границями зображення. До речі, цей критерій вам підкаже ступінь зуммування.

– Не встановлюйте граничне збільшення: швидше за все, виникнуть проблеми з різкістю зображення.

І останнє. Запам'ятаєте, від якості зйомки залежить обсяг роботи з коректування зображення. Чим акуратніше ви перезняли оригінал, менше прийде його коректувати. Витративши лічені секунди на поліпшення умов висвітлення, ви можете заощадити години роботи над поліпшенням фотокопії.

Лічені секунди (англ. Split Second) - британський фантастичний бойовик 1992 року.
Можливо, у вашій моделі фотоапарата є вбудовані засоби для поліпшення якості зображень, у тому числі – при перефотографуванні документів. Про це читайте в інструкції до фотоапарата. Ми ж зупинимося на тих проблемах, які виникають незалежно від технічних деталей. Це в першу чергу порушення геометрії, світла, тону.


Послідовність дій з коригування зображень

Отже, документи перезняті, файли переписані до жорсткого диску. Перш ніж приступити до розпізнавання, потрібно подивитися, що ми маємо у розпорядженні. А одержали ми, скоріш за все, зображення як на рис. 5.



Це зображення одержано за допомогою камери мобільного телефону з розділенням 2 Мегапіксела в приміщенні. Звичайно, високої якості очікувати не доводиться. На зображенні є всі типові проблеми для цього випадку. Центр і краї засвічені нерівномірно. Папір виглядає сірим, у той час як реально він білого кольору. Є геометричні перекручування, текст на сторінці має трапецієподібну форму. Подивимося, що можна зробити. Для роботи нам знадобиться редактор растрової графіки. Зупинимо свій вибір на PhotoShop CS3. Мабуть, це кращий професійний редактор.
Adobe Photoshop ([əˈdəubɪ ˈfəutəʃɔp], Едоубі Фотошоп) - графічний редактор, розроблений і поширюваний фірмою Adobe Systems. Цей продукт є лідером ринку в області комерційних засобів редагування растрових зображень, і найвідомішим продуктом фірми Adobe.
Примі́щення - частина внутрішнього об'єму будівлі, обмежена будівельними елементами, з можливістю входу і виходу.
Профе́сія (фах) - відокремлений («окреслений») у рамках суспільного поділу праці комплекс дій та відповідних знань, що вимагає відповідної освіти.
PhotoShop – різноманітна й складна програма. Про її можливості ходять легенди. Ми не збираємося докладно їх вивчати. Нам потрібний тільки результат. Тому основні прийоми коректування будемо розглядати без докладних коментарів.
Комента́р (від лат. commentārium - записки, тлумачення) - * Тлумачення певного тексту або книги.
Приймайте їх як є і дійте за принципом «роби як я».
Завантажуємо файл

Викликаємо PhotoShop через «Пуск → Программы». Відкриваємо в ньому зображення. Для цього тиснемо «Ctrl O», з'явиться вікно Провідника. У ньому знаходимо файл подвійним щигликом відкриваємо в програмі. Вікно PhotoShop.


Коригуємо розмір зображення

Це перше, з чого ми почнемо. І ось чому. Матриця камери була 2 Мегапікселя.

Пі́ксель (іноді пі́ксел, англ. pixel, скорочено від англ. PICture'S ELement - елемент зображення) - найдрібніша одиниця цифрового зображення в растровій графіці. Він являє собою неподільний об'єкт прямокутної (зазвичай квадратної) форми, що має певний колір.
Це означає, що оригінал, займаючи весь кадр, буде розміром приблизно 9х12 см у розділенні 300 dpi. Тепер має сенс повернути розміри до первісних: великі букви FineReader розпізнає краще.

Натискаємо «Alt Ctrl I» («Изображение → Размер изображения»). З'явиться вікно, показане на рис. 7. Вимірюємо (приблизно) розмір оригіналу. Досить визначити один вимір, наприклад – ширину. Вводимо отримане значення в поле «Ширина».

Прапорці «Інтерполяція» й «Зберегти пропорції» повинні бути включені. Значення параметра «Дозвіл» повинне бути не менш «300 dpi».

У нашому випадку ширина зображення була близько 21 см. Вказали у поле «Ширина» значення «21» і натиснули «Ок».
Якщо ви все зробили правильно, розмір зображення (у мегабайтах) повинен зміниться.

Пара́метр (від дав.-гр. παραμετρέω) - відмірюю, розмірюю)(рос. параметр, англ. parameter, нім. Parameter m, Kennwert m, Kenngrösse f, Kennzahl f) - величина, що нею характеризують якусь властивість, стан, розмір або форму об'єкта, робочого тіла, процесу, явища або системи тощо.
Мегабайт (megabyte) - одиниця виміру обсягу даних. Дорівнює 1 048 576 (220) байт або 1024 кілобайт.



Прибираємо зайві деталі

– Натискаємо «М», букву «М» натискайте на англійській клавіатурі. Ми вибрали інструмент «Прямоугольное выделение».

– Утримуючи натиснутою ліву кнопку миші, обведіть із невеликим запасом корисну площу зображення.

– Відпустіть ліву кнопку миші. Навколо виділеної області з'явиться пунктирна рамка.

– Викличте меню «Изображение → Кадрировать».

Photoshop прибере фрагменти документа, що розташовані поза виділеною областю:





Коригуємо геометрію

– Поставте покажчик миші на ліву лінійку вікна із зображенням (рис. 6).

– Утримуючи ліву кнопку миші, перемістіть її покажчик на область документа. З'явиться вертикальна напрямна.

– Повторіть операцію, перетягнувши напрямну з верхньої лінійки на документ.

У такий спосіб ми одержали орієнтири для контролю перпендикулярності.

Орієнти́р - у військовій справі - характерний, добре видимий на місцевості нерухомий предмет (природний або штучний) або елемент рельєфу, який, як правило, нанесений на топографічні та спеціальні карти з точно визначеними географічними координатами, за допомогою якого легко орієнтуватися на місцевості, визначати напрям при маневруванні та управлінні військами або організації стрільби і знаходження цілей.

– Натискаємо «Ctrl A» (символ «А» тиснемо на англійській клавіатурі). Ми виділили весь документ. Довкола нього з'явиться пунктирна рамка.

Натискаємо «Ctrl Т» («Редактирование → Свободная трансформация») . Навколо зображення з'явиться прямокутна область із прямокутними мітками на краях і на кожній стороні. Розтягуючи область, ми збільшуємо розмір зображення в тому або іншому напрямку. Але нам потрібно інше: спотворити його. Для цього потрібно «розтягти» нижню частину зображення вправо. Ставимо покажчик миші на прямокутну мітку в правому нижньому куті. Натискаємо «Ctrl» і тягнемо мітку вправо, поки текст не вирівняється відносно напрямних. Дуже наочно.

Познайомтеся з можливостями трансформації в PhotoShop самостійно, відкривши меню «Редактирование → Трансформирование…».


Коригуємо яскравість

– Натискаємо «Shift D», зняти виділення (про всякий випадок).

– Дивимося на значок виділення областей (рис. 6). Якщо він прямокутний, то тиснемо «М», потім «Shift М». Значок виділення стане овальним. Якщо значок був овальний, просто натискаємо «М».

– Утримуючи натиснутої ліву кнопку миші, обводимо більше яскравий фрагмент зображення (у центрі). Відпускаємо ліву кнопку миші.

– Натискаємо «Q». Зображення покриється червоною «поволокою». Залишиться тільки «отвір» у центрі» із чіткими краями.

– Натискаємо «Фильтр → Размытие → Размытие по Гауссу». З'явиться вікно з єдиним параметром. «Радиус». Збільшуйте цей параметр, щоб домогтися дуже плавного розмиття країв «отвору». Звичайне значення радіуса становить 150-200.

– Натисніть «Ок», щоб закрити вікно.

– Натисніть «Q». Червона «маска» пропаде (ми перейшли в режим роботи із зображенням) .

– Натисніть «Ctrl I» (інвертувати виділену область).

– Натисніть «Ctrl L». З'явиться вікно, зображене на рис. 8. Ставимо покажчик миші на центрального повзунка й, утримуючи натиснутої ліву кнопку, плавно переміщаємо його вправо. Краї зображення повинні стати світлішими.

Описаний прийом вимагає певного досвіду. Від того, наскільки вдало побудована виділена область, як плавно вона розмита залежить результат вирівнювання. Ви можете повторити процес з іншим розміром виділеної області. Але в кожному разі описаних спосіб дозволяє одержати прийнятний результат.

– Натискаємо «ОК».

– Знімаємо виділену область «Ctrl D».

– Знову вибираємо «Ctrl L».

– Посвітлюючи зображення, переміщаємо правого повзунка вліво. Щоб підвищити щільність тексту, переміщаємо лівого повзунка йому назустріч – вправо.

Не прагніть одержати текст на ідеально білому фоні. Текст на сіруватому фоні FineReader чудово розпізнає. Головне, щоб фон був більш-менш рівномірним.

Щоб закрити вікно, натискаємо «Ок»:

Зберігаємо документ «Shift Ctrl S» («Сохранить как…») або «Ctrl S» (просто «Сохранить»).

Одержаний результат (рис. 9). Зверніть увагу, – цей результат отриманий за допомогою мобільного телефону з посередньою камерою. Залишається тільки розпізнати файл.


Завдання до виконання роботи

Вхідну інформацію для виконання роботи студент обирає сам. Це має бути текстовий документ (або декілька різних документів) на паперовому носії. Мета роботи – розпізнавання вибраного документу. У документі для розпізнавання має бути не менше 5 таблиць та 5 рисунків. Крім того, рисунки мають бути розташовані за текстом. Розпізнавання сторінок, де розташовано один рисунок, не розглядається.


Оформлення звіту

  1. Титульна сторінка.

  2. Мета роботи.

  3. Хід виконання роботи.

  4. Висновки по роботі.

  5. У верхньому колонтитулі вказати: групу, прізвище, ініціали, номер лабораторної роботи. Наприклад: ПФ-14-1 Петренко В.С. №4.

  6. Колонтитул титульної сторінки повинен бути не заповненим!!!

  7. Оформлення звіту передбачає покроковий опис з використанням елементів “Print Screen”.


Параметри сторінки

  • формат паперу А4;

  • поля: верхнє – 2 см, нижнє – 2 см, ліве – 3 см, праве – 1,5 см;

  • шрифт Times New Roman, 14pt.


Скачати 192.89 Kb.