Первая страница
Наша команда
Контакты
О нас

    Головна сторінкаПошук зображень

Скачати 194.48 Kb.

Пошук зображень
Скачати 194.48 Kb.
Сторінка1/5
Дата конвертації13.04.2017
Розмір194.48 Kb.
  1   2   3   4   5

Пошук зображень


Пошук зображень в Інтернеті вже давно став звичним: користувач очікує від пошукової системи точної, швидкої і повної відповіді подібно до пошуку текстової інформації. Більшість популярних пошукових систем поруч з пошуком веб-сторінок з текстовою інформацією втілюють можливість пошуку зображень.
Більшість - велика частина чого-небудь, або кількісне переважання прихильників якоїсь ідеї чи рішення над їхніми противниками. Вважається найпершою засадою демократичного способу прийняття спільних рішень, головною й необхідною умовою обрання кандидата на виборну посаду.
Кори́стува́ч - той, хто користується чим-небудь - майном, землею, комп'ютером тощо.
Можливість - це дія, що може відбутися або ні (можливо, приїду, а, можливо, і ні). Можливість можна забезпечити чи покладатись на «авось» та якось буде. Альтернатива дає шанс, але не гарантує без відповідних дій забезпечення результату і адекватності та конструктиву діяльності.
Інтерне́т (від англ. Internet), міжмере́жжя - всесвітня система взаємосполучених комп'ютерних мереж, що базуються на комплекті Інтернет-протоколів. Інтернет також називають мережею мереж. Інтернет складається з мільйонів локальних і глобальних приватних, публічних, академічних, ділових і урядових мереж, пов'язаних між собою з використанням різноманітних дротових, оптичних і бездротових технологій.
Текст (від лат. textus - тканина, з'єднання) - загалом зв'язана і повністю послідовна сукупність знаків. Наука, що вивчає тексти називається герменевтикою.
Пошуко́ва систе́ма (або скорочено пошукови́к) певна база даних - онлайн-служба (апаратно-програмний комплекс з веб-інтерфейсом), що надає можливість пошуку інформації в Інтернеті. У просторіччі під пошуковою системою розуміють веб-сайт, на котрому розміщено інтерфейс (фронт-енд) системи.

Першу пошукову систему по зображеннях випустила компанія Picsearch у 2001 року. У тому ж році запустив свій пошук по картинкам Google. Серед російських пошуковиків, що втілили сервіс пошуку зображення став Яндекс.

Росі́йська Федера́ція або Росі́я (рос. Российская Федерация, рос. Россия МФА: [rɐˈsʲːijə]) - держава у північній Євразії, федеративна змішана республіка, столиця - Москва. З площею 17 098 246 км² Росія є найбільшою за територією країною у світі, що охоплює більше однієї восьмої площі суходолу Землі та дев'ятою за чисельністю населення із населенням 143 мільйони чоловік (2013).
Зображення в 2002 році. У 2003 р. цей сервіс додав Yahoo!.

На початковому етапі пошук зображень ґрунтувався виключно на отриманні та аналізі метаданих, які безпосередньо пов'язані з зображеннями: атрибути відповідних HTML тегів, заголовки сторінок, тексти посилань на зображення. З часом, для пошуку зображень почали застосовувати текст, що розташований навколо картинки. На той час пошук зображень обмежувався знаходженням текстової інформації і визначенням ступеня належності до зображення.

Посилання (англ. reference), також поклик - посилання у паперових і електронних документах - уривок, витяг з якого-небудь твору, на який посилаються у викладі, з точною назвою джерела й вказівкою на відповідну сторінку.
Атрибу́т (attribute) - невід'ємна, необхідна для забезпечення цілісності об'єкта (предмета) або суб'єкта (людини) властивість, його частина, додаток.
Метада́ні, у загальному випадку, - це дані, що характеризують або пояснюють інші дані. Наприклад, значення «123456» само по собі недостатньо виразно. А якщо значенню «123456» зіставлено достатньо виразне ім'я «поштовий індекс» (що вже є метаданими), то в цьому контексті значення «123456» більш осмислено - можна витягати інформацію про місцеположення адресата, що має даний поштовий індекс.
Ана́ліз (від грец. αναλυσις - «розклад») - розчленування предмету пізнання, абстрагування його окремих сторін чи аспектів. Метод дослідження, який вивчає предмет, уявно чи реально розчленовуючи його на складові елементи, як-от частини об'єкта, його ознаки, властивості, відношення, відтак розглядає кожен з виділених елементів окремо в межах єдиного цілого; протилежний метод - синтез.
Озна́чення, ви́значення чи дефіні́ція (від лат. definitio) - роз'яснення чи витлумачення значення (сенсу) терміну чи поняття. Слід зауважити, що означення завжди стосується символів, оскільки тільки символи мають сенс що його покликане роз'яснити означення.

Паралельно з пошуком зображень за метаданими розвивається інший напрямок - пошук зображень за вмістом, що ґрунтується на технології комп'ютерного зору. Вона покликана навчити машину дивитися на зображення очима людини, розуміти й аналізувати його вміст: кольори та форми об'єктів, їх текстуру, взаємне розташування. Набір метаданих, що характеризують зображення є обмеженим, а комп'ютерний зір дозволяє значно розширити кількість атрибутів, які враховуються при пошуку картинок і ранжируванні результатів.

Результат, пі́дсумок, (заст. ску́ток, вислід) - кінцевий наслідок послідовності дій. Можливі результати містять перевагу, незручність, вигоду, збитки, цінність і перемогу. Результат є етапом діяльності, коли визначено наявність переходу якості в кількість і кількості в якість.
Характер (термін «характер» - грецького походження, він означає «риса», «ознака», «відбиток»)- це сукупність відносно стійких індивідуально-своєрідних якостей особистості, що виявляються у поведінці, діяльності та ставленні до людей, колективу, до себе, речей, роботи і тощо.
Кількість - в Арістотелівській логіці друга з 10 категорій (класів, розрядів, які спрощують процес розумового визначення будь-якої речі), побічна обставина матеріальних речей , за допомогою якої вони поширюються в просторі, вимірюються якоюсь математичною нормою і здатні бути поділеними на окремі частини.

Люди по-різному розуміють схожість зображень. Для одних - важливіше колірна схожість, для інших - схожість форм, для третіх - текстур, а іноді - все разом в однаковій пропорції. Які ж критерії є визначальними?

Зазвичай, це сукупність факторів при певному домінуванні одного з них. Система має визначити, який чинник є важливішим в кожному конкретному випадку.

При пошуку схожих зображень, на відміну від роботи фільтрів, порівняння щораз відбувається з новою картинкою-зразком, а не з однією і тією ж моделлю. Тому, потрібно навчити машину аналізувати не окремі властивості зображення, а всю їх сукупність. Вона повинна за соті частки секунди знаходити серед мільйонів проіндексованих картинок зображення, які максимально схожі на картинку-зразок, враховуючи при цьому уявлення про подібність у різних користувачів.

Порівняння (лат. comparatio) - це троп, у якому один предмет, подія зіставляються з іншими, у яких ці особливості виявлені різко, яскраво. Порівняння виконують зображальну і емоційно-оціночну роль.
Мільйон - число, назва величини 10 6 = 1000000 =1000000} .

Сервіси контентного інтернет-пошуку зображень


В сучасному Інтернеті існує кілька способів пошуку зображень.

 1. Універсальний пошук за непрямими ознаками. Він є подібним до пошуку веб-сторінок, оскільки аналізуються різні елементи: назви файлів, теги HTML-розмітки, посилання, підписи і тексти, що знаходяться поряд з картинкою на веб-сторінці. Такий спосіб дозволяє використовувати накопичені індексні бази і забезпечує широке охоплення ресурсів. Пошуковий запит складається з ключових слів, що вводяться користувачем.
  Охо́плення - це вид маневру який здійснюється у тактичній і вогневій взаємодії з військами, що діють з фронту. З'єднання, військові частини та підрозділи, які здійснюють охоплення, підтримуються з фронту вогневими засобами, що знаходяться у розпорядженні командувача (командира).
  Техноло́гія (від грец. τεχνολογια, що походить від грец. τεχνολογος; грец. τεχνη - майстерність, техніка; грец. λογος - (тут) передавати) - наука («корпус знань») про способи (набір і послідовність операцій, їх режими) забезпечення потреб людства за допомогою (шляхом застосування) технічних засобів (знарядь праці).
  Ключове́ сло́во - слово, або сталий вислів природної мови, яке використовують для вираження деякого аспекту змісту документа (або запиту); слово, яке має істотне смислове навантаження. Воно може служити ключем під час пошуку інформації в інтернеті чи на сторінці сайту.
  Існують також додаткові можливості - фільтри, що дозволяють відібрати зображення за розміром, кольором чи іншими ознаками. При такому підході результат пошуку буде мати значний відсоток помилок та інформаційного шуму.

 2. Долучення до процесу індексування людини. Такий підхід застосовується на численних фотохостингах і фотосервісах, коли опис вмісту зображень покладається безпосередньо на користувачів, наприклад, за допомогою детальних «анкет» зображень, що припускають якісний та детальний опис. Однак, більш поширеним є фолксономічний підхід з вільним індексуванням за допомогою тегів. В такому способі є свої переваги і недоліки. З одного боку, автор краще за інших може розповісти про фотографію. З іншого - далеко не в кожного автора вистачить бажання і вільного часу детально проіндексувати велику кількість фотографій.
  Індексува́ння - присвоєння документу набору ключових слів або кодів, які слугують вказівником змісту документа і використовуються для його пошуку. Слід не плутати поняття «індексування» та "індексацію, оскільки ці поняття різні.
  Відпочи́нок, дозвілля - проведення часу, метою якого є відновлення нормального стану організму.


 3. Технологія автоматичного розпізнавання картинок.
  Автома́тика (грец. αύτόματος - самодіючий) - галузь науки і техніки, яка розробляє технічні засоби і методи для здійснення технологічних процесів без безпосередньої участі людини.
  Загальною назвою є «контентний пошук зображень» (CBIR, Content Based Image Retrieval). Під час індексування графіки CBIR-система працює не з текстовими ознаками, а безпосередньо з характеристиками зображення. Індексуються колірна гамма картинки і текстура, розпізнаються і записуються обриси предметів та їх розташування в кадрі. Отримані дані використовуються для формування запиту або ж для порівняння картинок, для виявлення візуально схожих зображень.

  Дана технологія пропонує користувачам оригінальні засоби складання пошукових запитів, тому вона має свої обмеження.

  Оригінал - (від лат. originalis - первісний) - первісний, справжній.
  Кращі CBIR-пошуковики, зазвичай, пропонують комбіновані інструменти, що поєднують можливості кількох технологій індексування.
  Інформаці́йні техноло́гії, ІТ (використовується також загальніший / вищий за ієрархією термін інформаційно-комунікаційні технології (Information and Communication Technologies, ICT) - сукупність методів, виробничих процесів і програмно-технічних засобів, інтегрованих з метою збирання, опрацювання, зберігання, розповсюдження, показу і використання інформації в інтересах її користувачів.


  1   2   3   4   5


Скачати 194.48 Kb.

 • Сервіси контентного інтернет-пошуку зображень