Первая страница
Наша команда
Контакты
О нас

    Головна сторінка



3 Голосовий інтерфейс

Скачати 142.36 Kb.

3 Голосовий інтерфейс




Скачати 142.36 Kb.
Сторінка1/4
Дата конвертації28.05.2017
Розмір142.36 Kb.
  1   2   3   4

3.5. Голосовий інтерфейс


Важливим завданням розробки технічних систем є забезпечення інтуїтивного і природного інтерфейсу з користувачем, оскільки сучасні комп'ютерні програми орієнтовані на користувачів і розвиваються відповідно до їх зростаючих потреб.

Техні́чна систе́ма (ТС) - це штучно створена сукупність елементів і відношень (зв'язків) між ними, які утворюють цілісну структуру об'єкта, що має властивості, які не зводяться до властивостей елементів і призначена для виконання корисних функцій.

Однією з природних форм взаємодії для людини є мова. Голосовий інтерфейс користувача спроможний забезпечити зручний і гнучкий спосіб взаємодії людини з комп'ютером, оскільки для його використання не потрібно опановувати новими навичками.

Ринок мовних технологій стрімко розвивається, втім, створення голосових інтерфейсів є досить складним і комплексним завданням, що вимагає від розробника знань в різних предметних областях, таких як комп'ютерні науки, лінгвістика та психологія поведінки людини.

Голосовий інтерфейс якісним чином змінює спосіб, а отже і ефективність взаємодії користувача з системою. Голосовий пошук від компанії Google і голосовий асистент Siri від компанії Apple є цьому яскравими прикладами, підтверджуючи нагальну необхідність впровадження мовних технологій, зокрема розпізнавання і синтез мови.

Си́нтез мо́влення (СМ) - перетворення друкарського тексту у мовний сигнал (в широкому сенсі - відновлення форми мовного сигналу за його параметрами.

Google Google Inc. (вимовляється /ˈguːgl/, «ґу́ґл») - американська публічна транснаціональна корпорація, яку заснували 1998 року аспіранти Стенфордського університету Ларрі Пейдж і Сергій Брін. Найпопулярніший пошуковий сервіс станом на 2016 рік, має у власності, зокрема YouTube і Blogger.

Складність розпізнавання мови полягає в тому, що сукупність таких характеристик голосу і мови як тембр, гучність, висота, темп, інтонація, якість дикції роблять мову кожної людини неповторною і унікальною як відбитки пальців.

Розпізнава́ння мо́влення (англ. speech recognition) або мо́влення-у-те́кст (англ. speech to text (STT))- процес перетворення мовленнєвого сигналу в текстовий потік. Не варто плутати із визначенням розпізнавання мови, оскільки «розпізнати мову» безпосередньо означає лише дати відповідь на питання, до якої мови належить сегмент мовленнєвого сигналу.

Завданням комп'ютерної техніки та програмного забезпечення є розпізнавання сказані людиною слова в будь-яких умовах без попередньої адаптації під конкретний голос.

  1   2   3   4


Скачати 142.36 Kb.