Помощь в учёбе, очень быстро...
Работаем вместе до победы

Информативные признаки на основе линейных спектральных корней в системах распознавания речевых команд

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Существенный вклад в развитие систем распознавания речи (СРР) внесли советские и российские ученые В.Н. Трунин-Донской, Т. К. Винцюк, Н. Г. Загоруйко, JLJL Мясников, зарубежные ученые Д. Д. Маркел, А. Х. Грей, Б. Гоулд, Г. Фант и др. Множество современных идей при создании систем распознавания речи взято из области цифровой обработки сигналов. Большой вклад в теоретическом и практическом планах… Читать ещё >

Содержание

  • 1. АНАЛИЗ ПРОБЛЕМЫ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
    • 1. 1. Формирование и восприятие речи человеком
    • 1. 2. Классификация речевых единиц
    • 1. 3. Общая структура и классификация систем автоматического распознавания речи
    • 1. 4. Современные разработки в области речевых технологий
      • 1. 4. 1. IBM ASR ViaVoice
      • 1. 4. 2. Microsoft Speech SDK
      • 1. 4. 3. Санкт-Петербургский институт информатики и автоматизации Российской академии наук
      • 1. 4. 4. Сектор Цифровой Обработки и Распознавания Речевых Сигналов ВЦ РАН
      • 1. 4. 5. Центр речевых технологий
      • 1. 4. 6. Фирма «Стэл — Компьютерные Системы»
      • 1. 4. 7. Кафедра Математической теории интеллектуальных систем МГУ
      • 1. 4. 8. Фирма «Одитек»
      • 1. 4. 9. Кафедра «Цифровой обработки сигналов» СПБ ГУТ
      • 1. 4. 10. Белорусская компания «Сакрамент»
      • 1. 4. 11. Объединенный институт проблем информатики НАН Беларуси
      • 1. 4. 12. Vocative Russian ASR Engine
      • 1. 4. 13. SPIRIT ASR Engine
      • 1. 4. 14. Программный комплекс Dragon NaturallySpeaking
      • 1. 4. 15. Набор программных библиотек НТК
      • 1. 4. 16. Набор программных библиотек Sphinx
    • 1. 5. Методы выделения признаков речевых сигналов
      • 1. 5. 1. Спектральный иформантный анализ
      • 1. 5. 2. Вейвлет преобразования
      • 1. 5. 3. Линейное предсказание
    • 1. 6. Методы сравнения с эталонными единицами
      • 1. 6. 1. Динамическое программирование
      • 1. 6. 2. Скрытые Марковские модели
      • 1. 6. 3. Нейронные сети
  • Выводы
  • 2. ВЫДЕЛЕНИЕ ПЕРВИЧНЫХ ПРИЗНАКОВ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ АППАРАТА ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ
    • 2. 1. Структура разработанной системы распознавания речевых команд
      • 2. 1. 1. Общее описание модулей системы
      • 2. 1. 2. Схема функционирования системы
    • 2. 2. Решение задачи линейного предсказания
      • 2. 2. 1. История создания метода линейного предсказания и его преимущества
      • 2. 2. 2. Постановка задачи линейного предсказания
      • 2. 2. 3. Вычисление коэффициентов линейного предсказателя
      • 2. 2. 4. Выбор метода нахождения параметров модели
      • 2. 2. 5. Автокорреляционный алгоритм Левинсона-Дарбина
      • 2. 2. 6. Особенности вычисления коэффициентов линейного предсказания при возбуждении белым шумом
      • 2. 2. 7. Переход к линейным спектральным корням
    • 2. 3. Использование ЛСК в качестве информативных признаков для распознавания PC
    • 2. 4. Оценка возможности сокращения подпространства признаков векторов ЛСК
  • Выводы
  • 3. РАЗРАБОТКА МЕТОДИКИ РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД ПО СЛОВАРЮ ОГРАНИЧЕННОЙ ДЛИНЫ
    • 3. 1. Методика формирования словаря эталонов
    • 3. 2. Поиск по словарю с помощью выделения центров тяжести
      • 3. 2. 1. Процедура классификации входного PC по словарю эталонов
      • 3. 2. 2. Распознавание отдельно стоящих фонем
    • 3. 3. Поиск по словарю методом динамического программирования
      • 3. 3. 1. Метод динамического программирования
      • 3. 3. 2. Распознавание отдельных слов
      • 3. 3. 3. Распознавание целых командных слов на базе слогов
      • 3. 3. 4. Процедура нечеткого поиска строк по словарю
      • 3. 3. 5. Поиск слов в слитной речи и выделение пауз между словами
    • 3. 4. Критерий для оценки достоверности распознавания команд
    • 3. 5. Выбор оптимальных параметров для расчета линейных спектральных корней
    • 3. 6. Построение иерархического словаря в соответствии с лексической моделью языка
    • 3. 7. Оптимизация поиска команд по словарю с применением метода кластеризации
    • 3. 8. Оценка качества формирования словаря
  • Выводы
  • 4. ПРОГРАММНЫЙ КОМПЛЕКС ДЛЯ АНАЛИЗА И РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ
    • 4. 1. Функциональные возможности
    • 4. 2. Алгоритмическая модель системы
      • 4. 2. 1. Общее описание
      • 4. 2. 2. Первичная настройка и обучение системы
      • 4. 2. 3. Процедура распознавания входящей голосовой команды
      • 4. 2. 4. Функция расчета ЛСК на сигнале произвольной длительности (LSK)
      • 4. 2. 5. Функция расчета ЛСК на окне сигнала (LSKW)
      • 4. 2. 6. Функция расчета коэффициентов экстраполятора (EXTRP)
      • 4. 2. 7. Функция расчета одного корня уравнения по методу Ньютона (ROOT)
      • 4. 2. 8. Функция расчета производной произвольного порядка (DXFX)
      • 4. 2. 9. Функция расчета всех корней уравнения по методу Ньютона (ROOTS)
    • 4. 3. Описание пользовательского интерфейса
      • 4. 3. 1. Общий вид системы
      • 4. 3. 2. Константы
      • 4. 3. 3. Отчет «Траектории двух ЛСК в плоскости»
      • 4. 3. 4. Отчет «Поиск эталона по сигналу»
      • 4. 3. 5. Отчет «Поиск эталонов по сигналу»
      • 4. 3. 6. Отчет «Поиск команды по словарю»
      • 4. 3. 7. Отчет «Поиск команды по словарю методом половинного деления»
      • 4. 3. 8. Отчет «Траектории трех ЛСК в пространстве»
      • 4. 3. 9. Отчет «Траектории сравнения сигналов»
      • 4. 3. 10. Отчет «Просмотр значений ЛСК»
      • 4. 3. 11. Отчет «Сравнение центров эталонов и сигналов»
      • 4. 3. 12. Отчет «Влияние параметров ЛСК на поиск команды по словарю»
      • 4. 3. 13. Отчет «Оценка разделения сигналов по МДС»
      • 4. 3. 14. Отчет «Сравнение каждого с каждым»
      • 4. 3. 15. Формат файла входного речевого сигнала
    • 4. 4. Техническая реализация, программные и аппаратные требования
    • 4. 5. Исследование инвариантности системы к основным параметрам PC
    • 4. 6. Сравнение ЛСК с другими методами получения первичных признаков
  • Выводы

Информативные признаки на основе линейных спектральных корней в системах распознавания речевых команд (реферат, курсовая, диплом, контрольная)

Актуальность темы

В настоящее время по мере роста объемов информации компьютерная техника все больше и больше проникает в человеческую жизнь. Происходит совершенствование интерфейса человек-компьютер. Изобретаются новые способы отображения информации, модернизируются устройства ввода, продолжаются поиски такого интерфейса, который устроил бы всех. На эту роль сейчас претендует интерфейс речевой. Собственно говоря, это как раз то, к чему человечество всегда стремилось в общении с компьютером.

Работы в этом направлении велись еще в то время, когда о графическом интерфейсе никто даже и не помышлял. За сравнительно короткий период был выработан исчерпывающий теоретический базис, и практические достижения обуславливались только производительностью компьютерной техники. В 60−70х годах были созданы устройства, способные распознавать десяток речевых команд.

Существенный вклад в развитие систем распознавания речи (СРР) внесли советские и российские ученые В.Н. Трунин-Донской, Т. К. Винцюк, Н. Г. Загоруйко, JLJL Мясников, зарубежные ученые Д. Д. Маркел, А. Х. Грей, Б. Гоулд, Г. Фант и др. Множество современных идей при создании систем распознавания речи взято из области цифровой обработки сигналов. Большой вклад в теоретическом и практическом планах внесли A.A. Пирогов, A.A. Ланнэ, JL Рабинер, Р. Шафер, Д. Макхоул и др.

Современные разработки, как правило, основываются на бионической модели восприятия речи человеком. Такие системы являются иерархическими, детерминированными, с обучением и состоят из нескольких взаимосвязанных уровней. Выделяются акустическая (получение первичных признаков речевых сигналов) и лингвистическая (работа со словарями) составляющие.

Системы распознавания слитной речи строятся на базе вероятностных моделей грамматики языка. На словарях объемом до 5000 слов достоверность распознавания целых фраз составляет более 95%, что считается достаточным для обеспечения успешного речевого ввода текста на ПК.

Для задачи голосового управления различными устройствами необходимо распознавание отдельных речевых команд. Как правило, такой способ управления требует высокой надежности (99% точности распознавания). Зачастую команды произносятся в условиях повышенной зашумленности, например на производстве. Современные разработки в лабораторных условиях достигают 95% точности на словарях до 100 команд и требуют обучающие выборки больших объемов (10 и более вариантов произнесения каждого слова разными дикторами).

Таким образом, проблема построения эффективных алгоритмов распознавания речевых команд является актуальной.

Целью диссертационной работы является исследование линейных спектральных корней в качестве первичных признаков речевых сигналов, исследование методов работы со словарями эталонов в задаче распознавания речевых команд.

Для достижения поставленной цели необходимо в ходе выполнения теоретических и экспериментальных исследований решить следующие задачи:

1. провести обзор моделей систем распознавания речи, проанализировать структуру их модулей, выявить основные недостатки;

2. произвести обоснованный выбор метода формирования первичных признаков речевых сигналов;

3. выбрать принцип построения и работы со словарями эталонов;

4. уточнить математическую модель системы распознавания речевых команд;

5. разработать программный комплекс для проведения исследований и тестирования модели распознавания;

6. осуществить проверку предложенных алгоритмов распознавания речевых команд на тестовых выборках, произвести сравнение с существующими СРР.

Научная новизна заключается в результатах расчетно-экспериментальных исследований сигналов речевого командного управления, исследованиях первичных информативных признаков речевых сигналов, принципов построения словарей эталонов и алгоритмов распознавания речевых команд.

Методы исследования. Решение указанных задач осуществлено на основе общих методов системного анализа, теории цифровой обработки сигналов, программирования, методов математической статистики и теории вероятностей.

В качестве инструмента для исследований автором разработан программный комплекс, позволяющий анализировать речевые сигналы, работать с базами данных словарей, производить различные математические расчеты и получать табличное и графическое представление результатов.

Основные положения, выносимые на защиту:

1. Результаты исследования первичных информативных признаков речевых сигналов, сформированных на основе семейства линейных спектральных корней.

2. Алгоритмы расчета линейных спектральных корней для речевых сигналов и принцип работы со словарем эталонов при распознавании речевых команд.

3. Обобщенная модель распознавания речевых команд с оценкой качества словаря эталонов и достоверности принятия решений.

4. Результаты разработки и практической реализации программного комплекса для анализа и распознавания речевых сигналов.

Практическая ценность. Результаты работы могут быть использованы при построении командных систем голосового управления различными процессами и устройствами.

Результаты внедрения. Результаты научных исследований и практические разработки используются в ООО «ОДИТЕК», г. Санкт-Петербург. Теоретические результаты внедрены в учебный процесс СПбГУТ им. проф. М.А. Бонч-Бруевича.

Апробация работы. Основные положения, выводы и практические результаты диссертационной работы обсуждались:

• Научная конференция «Вычислительные и информационные технологии в науке, технике и образовании» / ПГУ, Павлодар (Казахстан), 2006.

• Научная сессия «IX Невские чтения» / НИЯК, СПб, 2007.

• IV Всероссийская межвузовская конференция молодых ученых / ИТМО, СПб, 2009.

По теме диссертационной работы опубликовано 8 печатных работ (в том числе одно свидетельство об официальной регистрации программы для ЭВМ), из них 3 работы опубликованы в рецензируемых научных изданиях, входящих в перечень изданий, рекомендуемых ВАК.

Объем и структура диссертации. Диссертационная работа включает введение, четыре главы, заключение, список литературы и приложения. Вся работа изложена на 191 страницах текста, включающих в себя 18 страниц приложений, 70 рисунков, 10 таблиц. Количество библиографических ссылок — 81.

Основные результаты работы состоят в следующем:

1. Произведен анализ современных систем распознавания речи. Выявлены основные недостатки алгоритмов распознавания речевых команд — недостаточная надежность и большой объем обучающей выборки.

2. Выполнено исследование линейных спектральных корней в качестве информативных первичных признаков речевых сигналов, приведено обоснование их алгоритма расчета.

3. Выбран принцип формирования словарей эталонов речевых команд и обосновано использование метода нелинейного временного выравнивания (динамического программирования) для поиска по словарям.

4. Уточнена алгоритмическая модель системы распознавания командных слов, готовая к реализации в программной или аппаратной среде.

5. Определен критерий для оценки достоверности распознавания речевой команды, позволяющий отсеивать ложные срабатывания алгоритма распознавания.

6. Предложена методика оценки качества сформированного словаря эталонов, позволяющая выявить похожие по звучанию речевые команды.

7. Показано решение задачи поиска различных речевых единиц (ключевых слов, слогов или пауз) в непрерывном речевом потоке на базе используемых методов распознавания.

8. Разработан программный комплекс, позволяющий анализировать речевые сигналы, работать с базами данных словарей, производить различные математические расчеты и получать табличное и графическое представление результатов исследований.

9. Проверена работа системы распознавания в сравнении с другими методами получения первичных признаков на одинаковых наборах эталонных и тестовых данных. Для ЛСК получен наименьший процент ошибок 2.87%, что позволяет говорить о возможности успешного использования данных признаков в более сложных системах распознавания речи.

Заключение

.

Большое разнообразие и изменчивость речевых сигналов определяют основные трудности при распознавании речи. В речевом сигнале содержится информация не только о том, что сказано, но и о том, кто говорит, каково эмоциональное состояние человека, каков темп речи и т. д. Поскольку органы речеобразования практически постоянно находятся в состоянии перестройки, в устной речи трудно указать границы отдельных речевых единиц (фонем или слогов). Поэтому одним из основных направлений развития современных СРР является поиск такой системы акустических признаков и методов их выделения, которые позволили бы уверенно извлекать из речевых сигналов информацию, относящуюся к смысловой части сообщения.

Показать весь текст

Список литературы

  1. И. В. Акатьев Д.Ю., Распознавание речевых сигналов на основе корреляционного метода, Электронный ресурс. / http://zhurnal.ape.relarn.ru/articles/2003/131 .pdf Режим доступа свободный. — Загл. С экрана.
  2. О.В. Анализ эталонного метода распознавания раздельной речи основанного на нечетком сопоставлении Электронный ресурс., / http://masters.donntu.edu.ua/publ2002/fvti/vasilenko.pdf Режим доступа свободный. — Загл. С экрана.
  3. Т.К. Анализ, распознавание и интерпретация речевых сигналов. -Киев: Наукова думка, 1987.
  4. Т.К. Распознавание слов устной речи методами динамического программирования М.: Кибернетика, 1968, № 1, С.15−22.
  5. Н., А. Коваль, С. Коваль, И. Опарин, Е. Погарева, П. Скрелин, Н. Смирнова, А. Таланов. Синтезатор русской речи по тексту нового поколения // Труды международной конференции «Диалог'2005», Звенигород, 1−6 июня, 2005 г.
  6. В.И., Галунов Г. В. Один подход к автоматическому распознаванию речи Электронный ресурс. / http://www.auditech.ru/article/cntrid/click.php?action=download&id=9 Режим доступа свободный. — Загл. С экрана.
  7. А.Л., Скрипкин В. А. Методы распознавания. Учебное пособие для вузов М., Высшая школа, 1984 г.
  8. ГОСТ 21 950–93. Оценка качества речевого канала.
  9. П.Дегтярев Н. П., Параметрическое и информационное описание речевых сигналов Минск: Объединенный институт информатики HAH Беларуси, 2003, 216 С.
  10. Т., Шевчук В. Алгоритмы сегментации с применением быстрого вейвлет-преобразования. // Труды международной конференции «Диалог», Москва, 2003 г.
  11. Н.Г. Методы распознавания и их применение. М., Советское радио, 1972 г.
  12. A.B., Петровский A.A. Методы построения устройств распознавания речи на базе гибрида нейронная сеть/скрытая Марковская модель // Нейрокомпьютеры: разработка, применение, 2002, № 12. с. 26 — 36.
  13. С. Ю., Сарана Д. В. Система автоматического распознавания речи SPIRIT ASR Engine. // Цифровая обработка сигналов, 2003 г, № 3.
  14. В.В., Таланов А. О. Автоматический поиск ключевых слов внепрерывном потоке речи на основе технологии «распознавание через синтез» // Труды международной конференции «Диалог 2006», Бекасово, 31 мая 4 июня 2006 г.
  15. C.B. Разработка и исследование метода распознавания фонем русского языка на основе аппарата линейного предсказания. // Диссертационная работа, Санкт-Петербург 2004 г.
  16. Э.Г. Анализ параметров речевого сигнала создающих восприятие элементарных звуков речи // Труды международной конференции «Диалог 2006», Бекасово, 31 мая 4 июня 2006 г.
  17. Коваль C. JL, Смирнова Н. С., Хитров М. В. К проблеме разработкифонетического уровня в системах автоматического распознавания речи // Труды международной конференции «Диалог», Москва, 2002 г.
  18. И. Психологический словарь. Электронный ресурс. / http://vocabularv.ru/dictionary/478/. Режим доступа свободный. — Загл. С экрана.
  19. В., Чучупал В., Маковкин К., Чичагова А. Проектирование и внедрение русская телефонная базы (TeCoRus). // «Речь и компьютер», Москва, 1999, с. 179−181.
  20. A.A. Бортовые информационные системы: Курс лекций / Под ред. В. А. Мишина и Г. И. Клюева. 2-е изд. перераб. и доп. — Ульяновск: УлГТУ, 2004. — 504 с.
  21. A.A. Новая теория линейных спектральных корней // Труды 3-ей Международной конференции «Цифровая обработка сигналов и ее применение», Москва, 2000 г. 29 ноября 1 декабря с. 118−125.
  22. A.A., Улахович Д. А. Передача информации о состоянии фильтра-предсказателя с помощью спектральных пар // Радиоэлектроника и связь. -1991г.-№ 1.
  23. A.A. Современные технологии распознавания речи // Труды международной конференции «Диалог», Москва, 2005 г.
  24. Ли У. Методы автоматического распознавания речи. М.: Мир, 1983.
  25. Ли И.В., Ронжин А. Л. Проектирование речевого диалога // Труды СПИИРАН, Вып. З, т. 1 СПб.: Наука, 2006, С. 320−338.
  26. И.Л. Многоканальная система распознавания речи. Московский // VI всероссийская конференция «Нейрокомпьютеры и их применение». Сборник докладов. Москва 16−18 февраля 2000 г.
  27. И.Д. Кластерный анализ. М.: Финансы и статистика. 1988.
  28. Д.Д., Грей А. Х. Линейное предсказание речи: Пер. с англ. М: Связь, 1980.
  29. М.С. Фонемная сегментация речевого сигнала с использованием вейвлет-преобразования. // Труды V всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям 1−3 ноября 2004, г. Новосибирск.
  30. С. Точность распознавания речи доходит до 90%. // Cnews: издание о высоких технологиях Электронный ресурс. Режим доступа: http://cnews.ni/reviews/index.shtrnl72007/12/24/280 965 2. свободный. — Загл. С экрана.
  31. В.Г., Златоустова JI.B. Измерение параметров речи. М.: Радио и связь, 1987.
  32. JI.JI. Объективное распознавание звуков речи // ЖТФ 1943 № 3, С. 109−115
  33. А. В., Шафер Р. В. Цифровая обработка сигналов. М.: Связь, 1979
  34. Р.К. Речевое управление роботом: лингвистика и современные автоматизированные системы. Изд.2 М.: Букинист., 2005 г.
  35. Л.Р. Скрытые марковские модели и их применение в избранных приложениях при распознавании речи: Обзор // ТИИЭР, т. 77, № 2, февраль 1989 г.
  36. А.Л., Карпов A.A., Ли И.В. Автоматическая система распознавания русской речи Sirius // Научно-теоретический журнал «Искусственный интеллект, Донецк, 2005, № 3, С. 590−601.
  37. А.Л., Карпов A.A., Ли И.В. Речевой и многомодальный интерфейсы М.: Наука, 2006.
  38. Л.Р., Шафер Р. В. Цифровая обработка речевых сигналов.- М.: Радио и связь, 1981.
  39. Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы М.: Горячая линия, 2007 г.
  40. Сайт лаборатории речевых и многомодальных интерфейсов Санкт-Петербургского института информатики и автоматизации РАН http://www.spiiras.nw.ru/speech/index.html
  41. Сайт санкт-петербургского центра речевых технологий http://www.speechpro.ru/
  42. Сайт кафедры математической теории интеллектуальных систем МГУhttp://intsvs.msu.ru/invest/speech/
  43. Сайт компании «Стэл Компьютерные Системы» http://www.stel.ru/speech/
  44. Сайт компании «Одитэк» Санкт-Петербург http://www.auditech.ru/
  45. Сайт компании «Сакрамент» Белоруссия http://www.sakrarnent.com/
  46. Сайт объединенного института проблем информатики НАН Беларусии http://www.uiip.bas-net.bv/
  47. Сайт сектора автоматического распознавания речи и цифровой обработки сигналов РАН http://www.ccas.ru/depart/chuchu/doc ru/Frames.htm
  48. Сайт компании Nuance Corporation http://www.nuance.com
  49. Сайт проекта НТК, Кэмбриджский университет, Великобритания http://htk.eng.cam.ac.uk/
  50. Сайт кафедры ЦОС Санкт-Петербургского Государственного университета телекоммуникаций им. Проф.М.А. Бонч-Бруевича http://www.dsp.sut.ru/
  51. Сайт проекта Sphinx, университет Карнэги Мэллон, США http://cmusphinx. sourceforge. net/sphin х4/
  52. Сайт проекта IBM ASR ViaVoice http://www-01 .ibm.com/software/pervasive/embedded viavoice/
  53. Сайт проекта Microsoft Speech SDK http://www.microsoft.com/downloads/details.aspx7FamilyID-5e86ec97−40a7−453f-bOee-6583 1 71 b4530&displaylang=en#Qverview
  54. Сайт компании Vocative Санкт-Петербург http://www.vocative.ru/
  55. А.И., Улахович Д. А., Арбузов С. М., Соловьева Е. Б. Основы цифровой обработки сигналов СПб. БХВ, 2005.
  56. В.Н. Истинные и ложные цели в распознавании и синтезе речи. //
  57. Речевая информатика.- Киев: Ин-т кибернетики АН УССР, 1989.- С. 40−45.
  58. В.Н. Синтез речи. М.: Наука, 1992
  59. . Язык программирования С++ М.: Бином, 2001.
  60. JI.A. Интеллектуальные роботы и системы управления // Нейрокомпьютеры: разработка и применение, № 8−9, 2005 г.
  61. И.Т., Файн B.C. Распознавание образов. — М.: Наука, 1977.
  62. Д.А., Сергеев М. В. Статистические свойства спектральных корней русской речи. // Труды учебных заведений связи / СПбГУТ.-СПб, 1988, № 64
  63. Г. Акустическая теория речеобразования. М.: Наука, 1964
  64. Дж.Л. Анализ, синтез и восприятие речи М.Связь, 1968
  65. A.B., Фролов Г. В. Синтез и распознавание речи. Современные решения. Электронный ресурс. / http://www.frolov-lib.ru/books/hi/ch01.html. Режим доступа свободный. — Загл. с экрана.
  66. Я., Хейдоров.И.Э., Алиев P.M. Поиск ключевых слов с использованием решетки слогов // Труды международной конференции «Диалог», Москва, 2009 г.
  67. А.И., Сорокин В. Н. Сегментация речи на кардинальные элементы. //Информационные процессы, Т. 6. 2006. № 3. С. 177−207
  68. Л.А., Венцов A.B. и др. Физиология Речи. Л., Наука, 1976
  69. В.Я., Маковкин К. А. Система распознавания слитно-произносимых названий цифр для телекоммуникационных приложений. /М.:ВЦ РАН, 1997.
  70. В.Я. К вопросу об оптимальном выборе алфавита моделей звуков русской речи для распознавания речи // Журнал «Искусственный интеллект». 2002 № 2 С. 575−579
  71. В.Ю. К проблеме пофонемного распознавания // Журнал «Искусственный интеллект». 2005 № 4 С. 662−668
  72. Г. Применение вейвлетов для ЦОС / М.: Техносфера, 2007
  73. , S. 50 years of progress in speech and speaker recognition // Proceedings of SPECOM'2005, Patras, Greece, 2005, pp. 3−9
  74. Ronzhin A.L., Rafael M.Y. Survey of Russian Speech Recognition Systems // SPECOM'2006, St. Petersburg, 25−29 June 2006
  75. Theodoridis S., Koutroumbas K. Pattern Recognion // USA: Academic Press, 2006
  76. Young, S. The НТК Book // Cambridge University Engineering Department, 20 021. Опубликованные работы
  77. , К.К. Влияние основных физических параметров речи на качество ее распознавания / К. К. Гладышев. 2007. СПбГУТ. 9 с. Деп. в ВИНИТИ 26.06.07. № 676-В2007.
  78. Свидетельство об официальной регистрации программы для ЭВМ 2 007 614 250 РФ. Программа распознавания речевых информационных сигналов / К. К. Гладышев и др. // Информационный бюллетень официальной регистрации РосАПО. 2007.
  79. , К.К. Проблема выбора эталонной единицы при распознавании речи / К. К. Гладышев // Журнал научных публикаций аспирантов и докторантов. 2008. — № 9. — С.244−247 (на момент выхода публикации входил в перечень ВАК).
  80. , К.К. Система поиска ключевых слов в непрерывном речевом потоке / К. К. Гладышев // Естественные и технические науки. 2009. — № 1. — С. 242−244 (входит в перечень ВАК).
  81. , К.К. Система автоматического распознавания речевых команд / К. К. Гладышев, Е. А. Шульгин // Известия высших учебных заведений. Приборостроение. 2009. — № 3. — С. 17−21 (входит в перечень ВАК).
Заполнить форму текущей работой