КРИТЕРИИ КАЧЕСТВА ЕЯ-ИНТЕРФЕЙСА
АКТУАЛЬНЫЕ ПРОБЛЕМЫ ПРИ РЕАЛИЗАЦИИ САРР
система СИНТЕЗА РЕЧИ
ВИДЫ ЕЯ-СИСТЕМ
СТРУКТУРНАЯ СХЕМА СИСТЕМ ОБЩЕНИЯ С БД
348.75K
Категория: ИнформатикаИнформатика

Естественный языковой интерфейс

1.

2.

ЕСТЕСТВЕННЫЙ ЯЗЫКОВОЙ ИНТЕРФЕЙС
Естественный языковой интерфейс – это такой интерфейс, при котором
общение с ИС происходит на естественном для пользователя языке
ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ ЕЯ ИНТЕРФЕЙСА
Мобильность и
оперативность
•Позволяет общаться с ИС в ограниченных
или экстремальных условиях
•Расширение круга пользователей ИС
Не требует специальной
подготовки пользователя
Освобождение рук и
зрительного канала
восприятия
•Важно например при управлении автомобилем ;
• Позволяет использовать ИС людям с
ограниченными возможностями и т.д.

3. КРИТЕРИИ КАЧЕСТВА ЕЯ-ИНТЕРФЕЙСА

ГИБКОСТЬ
Определяет разнообразие типов
принимаемых запросов
ПОЛНОТА
Пространство правильно понимаемых
запросов
НАДЕЖНОСТЬ
Определяет правильность принципов
построения ЕЯ-интерфеса
ДРУЖЕСТВЕННОСТЬ
Определяет меру удобства
использования ЕЯ-интерфейса

4.

СИСТЕМЫ РАСПОЗНАВАНИЯ РЕЧИ
Изначально ЕЯ интерфейс разрабатывался для построения STT ( Speech To Text )систем преобразования речевого сигнала в компьютерный текст.
Речевой
сигнал
Модель анализа
речевого сигнала
Модель
распознавания речи
и принятия решения
База данных и
знаний
Dragon –
NaturallySpeaking
1997 год
Voice Search от
Google
2009 год
Siri от Apple
2011 год
Распознанное
сообщение
и другие

5.

ПРОЦЕСС РАСПОЗНАВАНИЯ РЕЧИ
Процесс распознавания речевого сигнала заключается в преобразовании
данного сигнала из аналоговой формы в цифровую с последующей обработкой
специальными алгоритмами.
Речевой
сигнал
Микрофон
Аналого
Цифровой
Преобразо
ватель
(АЦП)
Алгоритмы
обработки
цифрового
сигнала
Методы достаточно
сложны в описании и
не рассматриваются
в данной работе
Математические
методы
распознавания
речи
Метод скрытых
марковских
моделей
Метод скользящего
окна (алгоритм
Витерби)
Метод модлей
заполнителей
Распозна
нное
сообщен
ие
И др.

6. АКТУАЛЬНЫЕ ПРОБЛЕМЫ ПРИ РЕАЛИЗАЦИИ САРР

Система автоматического распознавания речи, является одним из наиболее
сложных компонентов ЕЯ-систем, поэтому и на сегодняшний день при ее
реализации приходится сталкиваться с обширным кругом проблем:
Акустические помехи
внешней среды
Искажения вносимые
микрофонным трактом
Эффект реверберации в
замкнутых помещениях
Наиболее
сложные
проблемы
Различная дикция у людей
Изменение громкости речи
диктора (в частности эффект
Ломбарда)
Большие объемы словарей
Реализация шаблонов слитной
речи

7. система СИНТЕЗА РЕЧИ

СИСТЕМА СИНТЕЗА РЕЧИ
С развитием технологий ЕЯ-системы становятся диалоговыми, т.е способными не
только распознавать речь пользователя, но и синтезировать ее. Система синтеза
речи «Text To Speech» или «TTS».
Компьютерные
текст
RHVoice
Модель
генерации
речевых параметров
Модель
генерации
речевого сигнала
База данных и знаний
Acapela
ESpeak
и другие
Синтезированная
речь

8.

ОБОБЩЕННАЯ СХЕМА ДИАЛОГОВОЙ
ЕЯ-СИСТЕМЫ
Ведение диалога
Выполнен на базе системы
распознавания речи
Анализ смысла
высказываний
Интерпретация
высказываний
Формирование
и обработка
перехватов
инициативы
Выполнен на базе
системы генерации речи
Генерация смысла
высказываний
Синтез
высказываний

9. ВИДЫ ЕЯ-СИСТЕМ

ВОПРОСОТВЕТНЫЕ
СИТСТЕМЫ
СИСТЕМЫ
ОБЩЕНИЯ С БД
ЕЯСИТЕМЫ
СИСТЕМЫ
ОБРАБОТКИ
СВЯЗНЫХ ТЕКСТОВ
ДИАЛОГОВЫЕ
СИСТЕМЫ
РЕШЕНИЯ ЗАДАЧ

10. СТРУКТУРНАЯ СХЕМА СИСТЕМ ОБЩЕНИЯ С БД

ЕЯ-форма
ЕЯ-запрос ответа на
запрос
ЛИНГВИСТИЧЕСКИЙ
АНАЛИЗАТОР
СУБД
Морфологический
анализ
Лингвистические
словари
Синтаксический
анализ
Знания ПО и
метаописание БД
Проблемный
анализ
SQL-запрос
Поля
таблиц
БД
База данных
English     Русский Правила