Разработка и исследование метода распознавания фонем русского языка на основе аппарата линейного предсказания
Диссертация
Состояние проблемы и задачи исследования. К настоящему времени известно большое число моделей и методов выделения первичных (акустических) признаков PC. Одним из самых перспективных методов многие исследователи (Ю.А. Косарев, С. В. Виноградов, Н. Г. Загоруйко, Д. Макхоул и др.) считают аппарат линейного предсказания (ЛП): полученные на основе ЛП признаки обладают рядом практически полезных… Читать ещё >
Содержание
- I. АНАЛИЗ ПРОБЛЕМЫ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
- 1. 1. Основные задачи построения систем распознавания. И f 1.2 ВОСПРИЯТИЕ УСТНОЙ РЕЧИ
- 1. 3. Общая структура распознающей системы
- 1. 4. анализ состояния исследований по проблеме автоматического распознавания речи
- 1. 5. Обзор рынка программных средств
- 1. 6. сравнительный анализ методов выделения признаков речевых сигналов
- 1. 6. 1. Анализ сигнала возбуждения г олосового тракта
- 1. 6. 2 Анализ клиппированного сигнала
- 1. 6. 3 Формантный анализ
- 1. 6. 4. Спектральный анализ
- 1. 6. 5. Корреляционный анализ
- 1. 6. 6. Скрытое марковское моделирование
- 1. 6. 7. Вейвлет-преобразование
- 1. 6. 8. Линейное предсказание
- 1. 7. Выводы
- 2. ФОРМИРОВАНИЕ РАБОЧЕГО СЛОВАРЯ ПРИЗНАКОВ ФОНЕМ
- 2. 1. Оценка параметров речевого сигнала
- 2. 2. анализ точности модели линейного предсказания
- 2. 3. Статистические свойства ЛСК
- 2. 4. Выбор метода оценки ошибки разделения фонем в подпространствах ЛСК
- 2. 4. 1. Использование статистичьског о критерия на основе гистограмм
- 2. 4. 2. Использование метода динамических сгущений
- 2. 5. Расчет ошибки разделения фонем с использованием МДС
- 2. 5. 1. Оцшка разделимости фонем в двумерном подпространстве ЛСК
- 2. 5. 2. Оценка разделимости фоньм в трехмерном подпространстве ЛСК
- 2. 5. 3. Оце нкл размерности вектора признаков
- 2. 6. Применение преобразования Карунена-Лоэва для сокращения размерности векторов признаков
- 2. 7. Влияние ранжирования признаков на размерность векторов признаков
- 2. 8. Оценка влияния параметров расчета ЛСК на качество разделения фонем
- 2. 9. Выводы
- 3. ФОРМИРОВАНИЕ КЛАСТЕРОВ ФОНЕМ НА ОСНОВЕ РАБОЧЕГО СЛОВАРЯ ПРИЗНАКОВ
- 3. 1. Поиск оптимальных параметров расчета ЛСК
- 3. 1. 1. Выбор размера bplml иного окна
- 3. 1. 2. Выбор шага временного окна
- 3. 2. Формирование признаковых подпространств
- 3. 3. Значения ЛСК — признаки первого уровня
- 3. 3. 1. формирование дерева принятия решений (ДПР)
- 3. 3. 2. Поиск стартового подпространства ДПР
- 3. 3. 3. Формирование узлов (переходов) ДПР
- 3. 3. 4. связь размерности подпространств и величины ошибки в узлах ДПР
- 3. 4. Признаки второго уровня
- 3. 4. 1. формирование кластеров фонем на основе скользящих средних ЛСК
- 3. 4. 2. скользящие дисперсии как дополнительные признаки фонем
- 3. 4. 3. Собственные векторы ковариационных матриц фонем — альтернативные признаковые подпространства
- 3. 5. Выводы
- 3. 1. Поиск оптимальных параметров расчета ЛСК
- 4. РАСПОЗНАВАНИЕ ФОНЕМ НА ОСНОВЕ ЛСК
- 4. 1. Метод распознавания на основе ЛСК с использованием ДПР
- 4. 1. 1. Процедура обучения
- 4. 1. 2. Исследование алгоритма распознавания
- 4. 2. Метод распознавания на основе СС ЛСК
- 4. 2. 1. Процедура обучения
- 4. 2. 2. Исследование алгоритма распознавания
- 4. 2. 3. Нейтрализация влияния дифтонгов
- 4. 3. Распознавание на основе комбинированного алгоритма с нейтрализацией влияния дифтонгов
- 4. 4. ВЫВОДЫ
- 4. 1. Метод распознавания на основе ЛСК с использованием ДПР
Список литературы
- Сапожков М.А. Речевой сигнал в кибернетике и связи. М.: Связь, 1963. 452 с.
- Fralik S.C. Learning of recognize pattern without a teacher. // IEEE Trans.- 1997.- IT-13.-№ 1.
- Айвазян C.A., Бажаева З. И., Староверов O.B. Классификация многомерных наблюдений.- М.: Статистика, 1974.
- Арчер Т., Уайтчепел Э. «Visual С++ .net». Издательство «Диалектика», 2003.
- Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сиг-налов.-М: Связь, 1980.
- Вентцель Е.С. Теория вероятностей.- М.: Наука, 1964.
- Виноградов С.В. Методы предварительной обработки речевого сигнала в системах распознавания речи. Л., ЛИИАН, 1987 г.
- Вокодерная телефония. Методы и проблемы. Под. ред. А. А. Пирогова.
- Выгодский Я.Н. Справочник по элементарной математике. М.: Наука, 1967.
- Г. Корн, Т. Корн «Справочник по высшей математике». Издательство «Наука», Москва, 1984.
- Г. Н. Воробьева, А. Н. Данилова «Практикум по вычислительной математике».
- Г. Стренг «Линейная алгебра и ее применение». Издательство «Мир», 1980.
- Галунов В.И. Бионическая модель системы распознавания речи. // Исследование моделей речеобразования и речевосприятия.- Л.: 1981, С. 36−51.
- Галунов В.И., Жаков М. Л. и др. Первичный анализ в системах автоматического распознавания. // Тез. докл. 15 Всесоюз. шк.-семинара" Автоматическое распознавание слуховых образов".- Таллинн: ИК АН ЭССР, 1989.- С. 49−58.
- Горелик A. JL, Скрипкин В. А. Методы распознавания. Учебное пособие для вузов- М., Высшая школа, 1984 г.
- Загоруйко Н.Г. Комбинированный метод принятия решений. Сб. тр. ИМСО АНСССР «Вычислительные системы» вып. 19, Новосибирск, 1965.
- Загоруйко Н.Г. Методы распознавания и их применение. М., Советское радио, 1972 г.
- Загоруйко Н.Г., Елкина В. Н., Емельянов С. В., Лбов Г. С. Пакет прикладных программ ОТЭКС. М.: Финансы и статистика, 1986.
- Зигангиров К.Ш., Сорокин В. Н. Об использовании последовательного декодирования для распознавания слитной речи. // ППИ. 1977 № 4. с. 81−88.
- Зяблов В.В. Речевая информатика. М.: Наука, 1989.
- Кельманов А.В. О некоторых проблемах построения систем распознавания инвариантных к диктору. // Тез. докл 15 Всесоюз.шк.-семинара" Автоматическое распознавание слуховых образов".- Таллинн: ИК АН ЭССР, 1989.- С. 103−104.
- Косарев Ю.А. Естественная форма диалога с ЭВМ. Л.: Машиностроение. Ле-нингр. отд- ние, 1989. — 143с.
- Косарев Ю.А., Естественная форма диалога с ЭВМ Л., Машиностроение, 1989 г.
- Кулагина О.С. Исследования по машинному переводу. -М.: Наука, 1979.
- Ланнэ А.А. Оптимальный синтез линейных электрических цепей. — М: Связь, 1969.
- Ланнэ А.А., Матюшкин Б. Д., Улахович Д. А. Основы цифровой обработки сигналов.-Л: ВАС, 1995.
- Ланнэ А.А., Улахович Д. А. Передача информации о состоянии фильтра-предсказателя с помощью спектральных пар // Радиоэлектроника и связь. 1991 г.29,3033,34,35,36,37.38,39.40,41.
- Лбов Г. С. Методы обработки разнотипных экспериментальных данных. Новосибирск: Наука (Сибирское отделение), 1981.
- Любимов А.Ю., Евсиков М. М. Линейное предсказание речи это просто // Монитор № 4, 1995.
- Люблинская В.В. Восприятие речи. Общие представления и подходы к исследованию. // Тез. докл. 15 Всесоюз. шк.-семинара «Автоматическое распознавание слуховых образов». Таллинн, ИК АН ЭССР, 1989. — С.32−36. Макхоул Д. Линеное предсказание. Обзор.
- Маркел Д Д., Грей А. Х. Линейное предсказание речи: Пер. с англ. М: Связь, 1980.
- Мышкис А.Д. Лекции по высшей математике. М: Наука, 1969.
- Покровский Н.Б. Расчет и измерение разборчивости речи. М.: Связь, 1962.391с.
- Попов Э.В. Общение с ЭВМ на естественном языке. М., Наука, 1982 г. Рабинер Л. Р., Шафер Р. В. Цифровая обработка речевых сигналов.- М.: Радио и связь, 1981.
- Файн B.C. Распознавание образов и машинное понимание естественного языка. -М.: Наука, 1987.
- Чичагов А.В., Математическое моделирование сигналов. /М.:ВЦ РАН, 1995.
- Чучупал В.Я., Маковкин К. А. Распознавание последовательностей слов для компьютерной телефонии. /Современные речевые технологии. Сборник трудов 9 сессии Российского акустического общества. -М.: ГЕОС, 1999, с. 81−84.
- Чучупал В.Я., Маковкин К. А. Система распознавания слитно-произносимых названий цифр для телекоммуникационных приложений. /М.:ВЦ РАН, 1997.
- Улахович Д.А., Сергеев М. В. Статистические свойства спектральных корней русской речи. // Труды учебных заведений связи / СПбГУТ.-СПб, 1988, № 64.
- Бьерн Страуструп «Язык программирования С++. Специальное издание». Издательство «Бином», 2001.1. ОПУБЛИКОВАННЫЕ СТАТЬИ
- Кисляков С.В. Ортогональные полиномы в распознавании речевых сигналов // 51-я НТК: тез. докл. / СПбГУТ. СПб, 1998.
- Кисляков С.В., Шульгин Е. А. Применение преобразования Карунена-Лоэва для классификации фонем при дикторонезависимом распознавании речи // Труды учебных заведений связи / СПбГУТ. СПб, 2000. № 166.
- Кисляков С.В., Симонина О. А. Модель дикторонезависимого распознавания речи. // 2-я Межд. НТК «Техника и технология связи» / СПбГУТ. СПб, 2000.
- Кисляков С. В. Шульгин Е.А. Анализ признаков речевых фонем, полученных на основе полинома Гурвица // 53-я НТК: тез. докл. / СПбГУТ. СПб, 2001.
- Кисляков С.В. Некластерный алгоритм разделения согласных звуков речи независимо от диктора // 53-я НТК: тез. докл. / СПбГУТ. СПб, 2001.
- Кисляков С.В. Выбор порядка ЛП-модели при построении системы распознавания речи // 54-я НТК: тез. докл. / СПбГУТ. СПб, 2002.
- Кисляков С.В. Современное состояние проблемы создания систем речевого диалога человека и ЭВМ // 54-я НТК: тез. докл. / СПбГУТ. СПб, 2002.
- Кисляков С.В., Шульгин Е. А. Оценка качества признаков речевых единиц в задаче распознавания // 55-я НТК: тез. докл. / СПбГУТ. СПб, 2003.
- Фундаментальные аспекты новых информационных и ресурсосберегающих технологий: Отчет / рук. Е. А. Шульгин. НИР № 190−93−054. СПб, 2002.1. ПРИЛОЖЕШ1М