Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



Створення інтелектуалізованої системи усного діалогу васильєва Ніна Борисівна, Яценко

Скачати 32.18 Kb.

Створення інтелектуалізованої системи усного діалогу васильєва Ніна Борисівна, Яценко




Скачати 32.18 Kb.
Дата конвертації28.05.2017
Розмір32.18 Kb.

СТВОРЕННЯ ІНТЕЛЕКТУАЛІЗОВАНОЇ СИСТЕМИ УСНОГО ДІАЛОГУ

Васильєва Ніна Борисівна, Яценко Валентина Віталіївна

Міжнародний науково-навчальний центр інформаційних технологій та систем, відділ розпізнавання та синтезу звукових образів
Київ, Україна


n.
Інформа́тика (рос. информатика, англ. informatics, information science; нім. Informatik f) - теоретична та прикладна (технічна, технологічна) дисципліна, що вивчає структуру і загальні властивості інформації, а також методи і (технічні) засоби її створення, перетворення, зберігання, передачі та використання в різних галузях людської діяльності.
vassilleva@gmail.com
, yatsenko.valya@gmail.com

У наш час дуже стрімко розвиваються комунікаційні системи, інформаційні технології та мобільні пристрої.

Інформаці́йні техноло́гії, ІТ (використовується також загальніший / вищий за ієрархією термін інформаційно-комунікаційні технології (Information and Communication Technologies, ICT) - сукупність методів, виробничих процесів і програмно-технічних засобів, інтегрованих з метою збирання, опрацювання, зберігання, розповсюдження, показу і використання інформації в інтересах її користувачів.
Смартфо́ни (з англ. smart - розумний, і англ. phone - телефон) - окрема категорія телефонів, які - на відміну від простих стільникових телефонів - мають більше оперативної пам'яті і власний потужний, як для кишенькових пристроїв процесор, працюють під операційною системою Symbian 6.
Також збільшилася потреба в доступі до великої кількості інформації. Тому розробники повинні створити новий тип систем, які б дозволяли людині отримувати необхідну інформацію, користуючись властивими їй засобами (мовлення, жести, міміка тощо). Такі системи називають діалоговими. Діалогові системи призначені для вирішення деяких задач автоматично, тобто без присутності людини-експерта [1].

Спектр застосування діалогових систем неймовірно широкий. Їх застосовують для автоматичної перевірки знань, як автоматичні служби підтримки користувачів, як розважальні програми тощо. Існують діалогові системи типу “людина—комп’ютер”, що дають змогу отримувати інформацію про розклад руху транспорту, поточний стан банківського рахунку та бронювати квитки на потяг тощо.

Ба́нківський раху́нок - рахунок, на якому обліковуються власні кошти, вимоги, зобов'язання банку стосовно його клієнтів і контрагентів та які дають можливість здійснювати переказ коштів за допомогою банківських платіжних інструментів.
Інший тип систем – “людина—комп’ютер—людина”. Це системи більш інтелектуального рівня, оскільки вони не тільки розпізнають мовлення користувача, а й забезпечують взаємодію з користувачем найбільш природним способом — голосом. Одним із застосуванням такої системи є переклад з однієї мови на іншу шляхом “мовлення—мовлення”, тобто автоматизація паперового розмовника-перекладача [2]. Такі автоматизовані розмовники на основі технології інтерпретації мовленнєвого сигналу є досить актуальними в наш час. Спілкуючись із іноземцем, користувач отримує переклад фрази іншою мовою у візуальній або звуковій формі, що значно спрощує спілкування.

Підхід, коли використовується багаторівнева структура смислової інтерпретації мовлення є найбільш продуктивним при створенні систем диктування та систем усного діалогу для флективних мов з відносно вільним порядком слідування слів (для слов’янських мов). Конструювання багаторівневої системи дає можливість розподілити науково-дослідну роботу між експертами в акустиці, фонетиці, лінгвістиці та інформатиці.

Результат розпізнавання залежить від багатьох факторів, у тому числі й від того, який рівень деталізації слова використовувати (фонеми, склади, морфеми). Підвищення рівня складності елементу розпізнавання призводить до покращення надійності та коректності [3]. Похибки розпізнавання, які можуть виникати, мають бути контрольовані таким чином, щоб отримати правильний підсумковий результат послівного розпізнавання та/або смислової інтерпретації мовлення. Такий підхід може бути використаний при створенні багатомовних систем автоматичного розпізнавання мовлення.

Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))- процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу.

Задача розпізнавання мовленнєвого сигналу вирішується шляхом автоматичного аналізу сигналу з метою визначення послідовності слів, які передаються цим сигналом. А задача змістовної інтерпретації мови вирішується за допомогою автоматичного оброблення мовленнєвого сигналу з метою виявлення змісту, що передається сигналом, та представлення цього змісту в деякій канонічній формі, зручній для формування кроків подальшої взаємодії між людиною і комп’ютером.

Канонічна форма - така форма, що однозначно репрезентує об'єкт. Її часто плутають зі схожим поняттям нормальна форма. В булевій алгебрі деяка булева функція може бути виражена у канонічному вигляді з використанням мінтермів або макстермів.

Кінцевою метою створення інтелектуальної системи усного діалогу, реалізованої на основі задач розпізнавання та змістовної інтерпретації злитого мовлення, які виконуються в єдиному взаємопов’язаному процесі “мовлення—мовлення”, є виявлення змісту повідомлення, його інтерпретація та відповідна реакція [1, 2].

Надійність та коректність розпізнавання мовлення залежить від вибраного мовленнєвого образу (фонеми, склади, морфеми). Покращення результатів розпізнавання відбувається як за рахунок ускладнення лінгвістичної частини, так і за рахунок використання найбільш відповідних акустичних моделей [3, 4]. Планується дослідити вплив лінгвістичної та акустичної складових технології розпізнавання мовлення на покращення результатів змістовної інтерпретації висловлювань у системі усного діалогу.



Список використаної літератури

  1. Т.К. Винцюк. Анализ, распознавание и смысловая интерпретация речевых сигналов. – Киев. Наукова думка, 1987.

  2. В.В. Яценко. Параметризація типів речень предметної області для системи усного фразника-перекладача.
    Предме́тна о́бласть (ПрО) - множина всіх предметів, властивості яких і відношення між якими розглядаються в науковій теорії. В логіці - гадана область можливих значень предметних змінних логічної мови.
    // Науково-теоретичний журнал Штучний Інтелект (ШІ’2011), №4, стор. 134-142.

  3. Васильєва Н.Б. Дослідження невідповідності шкали акустичної та лінгвістичної моделей розпізнавання злитого українського мовлення. // НТЖ Штучний Інтелект (ШІ’2012), №3, стор.  118-125.

  4. Васильєва Н.Б. Використання граматик вільного порядку слідування фонем і складів для пофонемного розпізнавання злитого мовлення. // НТЖ Штучний Інтелект (ШІ’2011), №4. стор. 80-86.

Каталог: attachments -> article
article -> Методичні рекомендації щодо ефективного засвоєння граматики. Особливість посібника багатство дидактичних ігор та вправ, різноманітних за формою та змістом
article -> Створення відеокліпу. Додавання відео ефектів, налаштування часових параметрів аудіо- та відеоряду
article -> Інформаційні технології навчання в умовах інформатизації освіти
article -> Державний стандарт професійно-технічної освіти дспто 8312. Io. 63. 21-2014
article -> Державний стандарт професійно-технічної освіти дспто 7111. Со. 10. 00-2014
article -> Пояснювальна записка Скориговано за зауваженнями експертизи 104. 011. 00. 000-пз-01-01 Технічний директор


Скачати 32.18 Kb.