У вас вопросы?
У нас ответы:) SamZan.net

темах розпізнання мови виконується оцифровка звукової інформації її ідентифікація з кодами які містяться в

Работа добавлена на сайт samzan.net: 2016-03-30

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 5.4.2025

15.01.13 - Мультимедійні пристрої

Технічні засоби мультимедіа

План:

1. Системи мовного вводу і виводу інформації.

Існує дві технології мовного спілкування із компютером:

- системи розпізнання мови;

- системи синтезу мови;

В системах розпізнання мови виконується оцифровка звукової інформації, її ідентифікація з кодами, які містяться в електронних тезаурусних словниках, необхідна автоматична корекція кодів і генерація відповідних її  символів слів і речень.

По характеру мови, яка розпізнається, системи мовного вводу розділяють на:

1) системи, які орієнтовані на розпізнання окремих слів, команд і питань;

2) системи, які розпізнають речення і звязану мову;

3) системи ідентифікації по зразку мови.

Системи, які орієнтовані на розпізнання окремих слів, команд і питань зазвичай звуть системами мовного управління. Їх основна задача - забезпечити виконання компютерною системою дій, які задаються голосом. Найбільше розповсюдження такі системи отримали в автоматичних телефонних службах. В них можна ввести голосом номер телефону викликаємого абонента або його імя. Можна задати просте питання автоматичній довідковій службі.

Системи розпізнання речень і звязаної мови поділяються на:

- системи роздільної диктовки;

- системи розпізнання звязаної мови.

Системи роздільної диктовки простіше в розробці і технічній реалізації, але вони потребують від користувача не зовсім природного вимовляння фраз з короткою паузою перед кожним наступним словом. Активний словник системи нараховує десятки тисяч слів і може поповнюватись користувачем. В системі додатково аналізуються спектральні (частотні) характеристики кожної букви, виділяються і зберігаються її окремі фонеми (елементи спектру). На основі цього аналізу створюються фонетичні моделі букв і слів, які формуються. Точність розпізнання досягає 90%. Найбільш складні проблеми виникають при розпізнанні звязаної мови. При промові звязаної мови більше впливає емоційна складова інформації, яка вводиться і при злитній промові слів декілька змінюється їх звучання. Все це ускладнює розпізнання.

Ідентифікація по зразку мови відноситься до біометричних технологій ідентифікації людини по його унікальним фізичним признакам, таким як, відбитки пальців, малюнок радужної оболонки очей. Мова подібна підпису, характеризується множиною постійних фізичних параметрів. Мета систем ідентифікації по зразку мови - ідентифікувати конкретного відомого системі користувача і виявити самозванця.

Системи синтезу мови.

Системи мовного вводу інформіції базуються або на вибірці із словника готових оцифрованих звукових послідовностей або н а синтезаторах мови. Самим простим варіантом є вибірка готових звукових послідовностей, але за великого розміру звукових файлів вивід великої кількості слів ускладнює ситуацію. В таких простих системах часто використовуються меню, по яких користувач може вибрати ті вислови, які він хотів би почути. При наявності потрібних записів у базу даних їх текст починає звучати. Такі системи використовуються в будильниках у автомобільних навігаційних системах.

Формування мовного виводу більш функціонально повними синтезаторами мови виконується у декілька етапів. На 1 етапі відфільтровуються шумові символи тексту (знаки пунктуації, лапки, скобки). Ця задача вирішується модулем нормалізації, який також обробляє контекстно-залежні скорочення, формати дат. часу, грошових одиниць. Модуль перетворення на 2-му етапі переводить текст з орфографічного у фонетичний формат (з букв у звуки). Модуль аналізу виконує одночасно лексико-графічну і синтаксичну обробку для вибору варіанту ритму і інтонації. Фонетичний модуль отримав від модуля аналізу фонетичне представлення вихідного тексту збагачує звучання мови дифтонгами, трифтонгами, чотирьохзвучаннями і іншими корисними складовими. Модуль обробки звуку перетворює фонетичні дані у звукові сигнали: хвильові послідовності, які генеруються (з частотою 10КГц) модулюються фонетичним потоком. На цій стадії виконується управління гучністю, швидкістю мови і тембром голосу. Засоби відтворення, редагування і виводу інформації мультимедіа.

Мультимедійні компютери

Оснащені СД-ДВД-РОМ, камерою, колонками. Здебільшого використовується міді-сумісна звукова карта. До неї через розємне зєднання можна підключати електронні музичні інструменти (синтезатор, гітару і інші).

Звукова карта разом із двума колонками призначена для відтворення високоякісного стереозвука і мікрофоном для запису людської мови, музики і звуків. Відеокарта має забезпечити повноекранної синхронізованої трансляції відео з адекватним передаванням руху.




1. Монтаж водоподъемного оборудования
2.  Цель работы4 2
3. Концепции развития современных технологий и энергетики
4. тематики и информатики - Миловидов В
5. Утверждена постановлением Госкомстата РФ от 5 января 2004 г1
6.  Адм наказание за совершение адм
7. Тема 3. ПРОИЗВОДСТВЕННЫЕ ВРЕДНОСТИ И МЕТОДИ ЗАЩИТЫ ЧЕЛОВЕКА ОТ ИХ ОТРИЦАТЕЛЬНОГО ВЛИЯНИЯ Определени
8. Тигран Петросян
9. тема основанная на конституционных методах правления[2]
10. I ГРАФИКИ Теоретические вопросы Условия возрастания функции на отрезке