Алгоритмы распознавания речевых команд в управляющих системах
Диссертация
Развитие области знаний, связанной с анализом и распознаванием речевого сигнала началось с решения задач передачи человеческой речи по узкополосным каналам связи с полосой пропускания меньшей, чем у обычной телефонной линии. Решение этой задачи привело к созданию вокодеров, устройств выполняющих сокращение частотной полосы речевых сигналов для линий дальней связи. Первым успехом в данной области… Читать ещё >
Содержание
- 1. Анализ систем и методов распознавания речевого сигнала
- 1. 1. Анализ структур систем распознавания речи
- 1. 2. Анализ методов спектрального представления речевого сигнала
- 1. 3. Анализ методов подавления помех в речевом сигнале
- 1. 4. Анализ методов сегментации речевого сигнала
- 1. 5. Анализ методов распознавания речи
- 2. Математическое описание частотно-временной структуры речевого сигнала
- 2. 1. Анализ речевого сигнала на разных частотно-временных масштабах
- 2. 2. Пакетное вейвлет-преобразование как способ представления сигнала на разных частотно-временных масштабах
- 2. 3. Метод сегментации спектрограмм речевого сигнала
- 3. Разработка алгоритмов распознавания речевых команд
- 3. 1. Разработка алгоритмов получения пакетной вейвлет-спектрограммы речевого сигнала
- 3. 2. Разработка алгоритмов формирования эталона
- 3. 3. Разработка алгоритмов сравнения текущего образа с эталоном
- 4. Экспериментальное исследование работы алгоритмов распознавания
- 4. 1. Методика и средства проведения экспериментов
- 4. 2. Цель экспериментальной работы и выбор критериев качества
- 4. 3. Исследование работы алгоритмов, выполняющих распознавание путем сопоставления спектрограмм пакетного вейвлет-преобразования
- 4. 4. Исследование работы алгоритмов, выполняющих распознавание путем сопоставления функций ошибки моделирования спектрограмм пакетного вейвлет-преобразования
- 4. 5. Исследование работы алгоритмов, выполняющих распознавание путем сопоставления функций ошибки моделирования при двухмасштабном частото-временном представлении сигнала
- 4. 6. Результаты экспериментов по распознаванию изолированных слов
Список литературы
- Адаптивные фильтры / под. ред. Коуэна К.Ф.Н., Гранта П. М. М.: Мир, 1988.-392 с.
- Астафьева Н.М. Вейвлет-анализ: основы теории и примеры применения / Успехи физических наук, т. 166, № 11, 1996. С. 1145 — 1170.
- Афанасьев А.А. Адаптивный кодек речевых сигналов на основе систем с переменной структурой. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Ахмед Н., Рао К. Р. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980
- Бендат Дж., Пирсол А. Прикладной анализ случайных данных. М.: Мир, 1989.-540 с.
- Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов. М.: Мир, -1989.-448 с.
- Введение в цифровую фильтрацию / Под. ред. Р. Богнера, А. Константинидиса. -М.: Мир, 1976.-216 с.
- Вокодерная телефония. Методы и проблемы / Под ред. А. А. Пирогова. -М.: «Связь», 1974.-536 с.
- Воробьев В.И., Грибунин В. Г. Теория и практика вейвлет-преобразования. -СПб.: НИН В.Г. ВУС, 1999. 204 с.
- Выхованец B.C. Адаптивная алгебра в цифровой обработке сигналов. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Ганин А.Н. Модель квантования вейвлет коэффициентов. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Гольденберг JI. Цифровая обработка сигналов: Справочник. М.: Радио и связь. — 1985. -312 с.
- Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера. — 2006.- 1072 с.
- Гурьев Ю.Ю. Марковская нелинейная фильтрация речевого сигнала из смеси со стационарным шумом // Радиотехника. 1983. № 12, с. 48 — 51.
- Дженкинс Г., Ватте Д. Спектральный анализ и его приложения, т.1, т. 2 — М.: Мир, 1983.
- Дремин И.М., Иванов О. В., Нечитайло В. А. Вейвлеты и их использование / Успехи физических наук, т. 171, № 5, 2001. С. 466 — 501.
- Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. -512 с.
- Дыранов Ю.В., Костров В. В., Власов С. Ю. Векторное квантование коэффициентов усиления в CELP-кодере речи. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Дьяконов В.П. Вейвлеты. От теории к практике. М.: COJIOH-P, — 2002. -448 с.
- Дюран Б., Одел П. Кластерный анализ. М.: Статистика, 1977, 128 с.
- Жиляков Е.Г., Байдиков А. Н. Об обработке речевых сигналов. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Иванов А.В., Петровский А. А. Методы построения устройств распознавания речи на базе гибрида нейронная сеть/скрытая Марковская модель. // Труды 8-ой всеросийской конференции «Нейрокомпьютеры и их применение» НКП-2002. Москва, 2002.
- Кастельянс Г., Кочетков Ю. А., Суарез X. Цифровая обработка речевых сигналов для их классификации. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Кобелев В.Ю. Адаптивное вейвлет-преобразование сигналов. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Ласточкин А.В., Кобелев В. Ю. Метод удаления шума на основе вейвлет обработки, адаптирванный к разрывным сигналам. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Мальцев А.А., Польдин О. В., Силаев A.M. Оптимальная цифровая фильтрация сигналов с учетом воздействия случайных импульсных возмущений. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Маркел Дж.Д., Грэй А. Х. Линейное предсказание речи. М.: Связь, 1980. -308 с.
- Методы автоматического распознавания речи / под ред. У. Ли. т.1, т. 2.- М.: Наука, 1983.
- Назаров М.В., Прохоров Ю. Н., Ковязин В. И. Алгоритмы адаптивной Марковской Фильтрации зашумленных речевых сигналов // Радиотехника. 1983. № 12, с. 10−15.
- Нейроинформатика / А. Н. Горбань, В.Л.Дунин-Барковский, А. Н. Кирдин и др. Новосибирск: Наука. Сибирское предприятие РАН, 1998. — 296с.
- Оссовский С. Нейронные сети для обработки информации. -М.: Финансы и статистика, 2002. 344с.
- Патрик Э. Основы теории распознавания образов. М.: Сов. радио, 1980. — 480 с.
- Пересада В. Автоматическое распознавание образов. JL: Энергия, 1970. — 92 с.
- Перов А.И., Соколов Г. Г. Сравнительный анализ нейросетевых и статистических алгоритмов в задачах обнаружения сигналов. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Пономарев Е.П., Прохоров Ю. Н. Адаптивная линейная фильтрация речевых сигналов. В кн.: Описание и распознавание объектов в системах искусственного интеллекта. М.: Наука., 1980, с. 32 — 41.
- Применение цифровой обработки сигналов / Под. ред. Э. Оппенгейма. М.: Мир, 1980.-550 с.
- Прохоров Ю.Н. Оценка параметров и фильтрация речевых сигналов при действии широкополосных помех. В кн. Речевая информатика: Сб. науч. трудов. Киев.: Ж, 1989, с. 81 — 86.
- Рабинер Л.Р., Шафер Р. В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. — 496 с.
- Рабинер Р., Гоулд Б. Теория и применения цифровой обработки сигналов. — М.: Мир, 1978.-848 с.
- Рассел С., Норвиг П. Искусственный интеллект: современный подход. -М.: Изд. Дом «Вильяме», 2006. 1408 с.
- Робинсон Э. История развития спектрального оценивания // ТИИЭР. 1982. -т. 70, № 9. — С. 6 — 32.
- Сапожков М.А., Михайлов В. Г. Вокодерная связь. М.: Радио и связь, 1983. -248 с.
- Сергиенко А.Б. Цафровая обработка сигналов. СПб.: Питер, 2003. — 608 с.
- Стефанов A.M., Стефанова И. А. Эффективное использование интегрирующей способности слуха при цифровой обработке сигналов. //докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Терентьев В.М., Илюхин А. А. Алгоритмы оптимальной фильтрации состояний цепей Маркова с зашумленными наблюдениями. // докл. 3-ей междунар. конф. «Цифровая обработка сигналов и ее применения» (DSPA-2000), Москва, 2000.
- Уидроу Б., Стирнз С. Адаптивная обработка сигналов. М.: Радио и связь. -1989.-440 с.
- Уоссермен Ф. Нейрокомпьютерная техника. 1992. -230 с.
- Уэлстид С. Фракталы и вейвлеты для сжатия изображений в действии. М.: Изд. Триумф, 2003. — 320 с.
- Федяев О.Н., Гладунов С. А. Распознавание речевых слов по низкочастотным гармоникам с помощью нейросетей. // Труды 8-ой всеросийской конференции «Нейрокомпьютеры и их применение» НКП-2002. Москва, 2002.
- Физиология речи. Восприятие речи человеком. JL: Наука, 1976. — 388 с.
- Фу К. Последовательные методы в распознавании образов. М.: Наука, 1971.-256 с.
- Фукунага К. Введение в статистическую теорию распознавания. М.: Наука, 1979.-368 с.
- Хайкин С. Нейронные сети. М.: Изд. Дом «Вильяме», 2006. — 1104 с.
- Чуй К. Введение в вэйвлеты. М.: Мир, 2001. — 412 с.
- Acero S. Acoustical and Environmental Robustness in Automatic Speech Recognition. The Ph. D. thesis. Carnegie Mellon University. USA. 1990.
- Alphonso I.J. Network training for continuous speech recognition. The Master thesis. Mississippi Sate University. USA. 2001.
- Backstrom T. Time-Delay Neural Networks and NN/HMM Hybrids: A Family of Connectionst Continuous-Speech Recognition Systems. Laboratory of Acoustics and Audio Signal Processing Helsinki University of Technology. 2002.
- Bultheel A. Wavelets with applications in signal and image processing, NALAG, 2003.
- Cariani P. Temporal codes, timing nets, and music perception // Jornal of New Music Research, 2001. Vol. 30. — Pp. 107−135.
- Edwards R.T. An Overview of Temporal Backpropagation Standford University. USA. 1991.
- Fu-Hua Liu Environmental Adaptation for Robust Speech Recognition. The Ph. D. thesis. Carnegie Mellon University. USA. 1994.
- Goodwin M.M. Adaptive Signal Models: Theory, Algorithms, and Audio Applications. The Ph. D. thesis. University of California. USA. 1997.
- Gopinath R.A., Burrus C.S. Wavelets and filter banks. In Charles K. Chui, editor, Wavelets: A Tutorial in Theory and Applications, pp. 603 654. Academic Press, San Diego, CA, 1992.
- Goswami J., Chan A. Fundamentals of Wavelets: Theory, Algorithms, and Applications, John Wiley & Sons Inc., NY, 1998.
- Gouvea E.B. Acoustic-Feature-Based frequency Warping for Speaker Normalization. The Ph. D. thesis. Carnegie Mellon University. USA. 1998.
- Gupta M., Gilbert A., Robust speech recognition using wavelet coefficient features, Proc. of IEEE Automatic Speech Recognition and Understanding Workshop, Italy, 2001.
- Gustafsson F. Adaptive Filtering and Change Detection. Cloth, Wiley, 2001.
- Herley С., Vetterli M. Wavelets and Recursive Filter Banks, IEEE Trans. Signal Processing, vol. 41, no. 8, pp. 2536 2556, Aug. 1993.
- Huerta J.M. Speech Recognition in Mobile Environments. The Ph. D. thesis. Carnegie Mellon University. USA. 2000.
- Huseyin H., Nishan C. Musical instrument recognition with wavelet envelopes. European Acoustics Association (Hg). in: Proceedings of Forum Acusticum Sevilla 2002.
- Jian Lu Signal Recovery and Noise Reduction with Wavelets. The Ph. D. thesis. Dartmouth College. USA. 1993.
- Kasper K., Reininger H., Wust H. Strategies for Reducing the Complexity of a RNN Based Speech Recognizer, IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol.6, pp.3354−3357 (1996).
- Kurth F., Clausen M., «Filter bank tree and M-band wavelet packet algorithms in audio signal processing,» IEEE Trans. Signal Processing, vol. 47, pp. 549−554, Feb. 1999.
- Long C., Datta S. Wavelet Based Feature Extraction for Phoneme Recognition. Proc. Of 4th Int. Conf. of Spoken Language Processing, Philadelphia, USA, Vol. 1 (1996)264−267
- Mertins A. Signal Analisys: Wavelets, Filter Banks, Time Frequency Transforms and Applications, John Wiley & Sons Ltd., NY, 1999.
- Micheli-Tzanakou E. Supervised and unsupervised pattern recognition: feature extraction and computational intelligence, CRC Press LLC, 2000.
- Minker W. Speech And Human-Machine Dialog, Kluwer Academic Publishers, NY, 2004.
- Morena P. Speech Recognition in Noisy Environments. The Ph. D. thesis. Carnegie Mellon University. USA. 1996.
- Narayanaswamy S. Pen and Speech Recognition in the User Interface for Mobile Multimedia Terminals. The Ph. D. thesis. University of California. USA. 1996.
- Oja E. Principal components, minor components and linear neural networks // Neural Networks, 1992. Vol 5. — Pp.927 — 935.
- Picone J. Signal Modeling Techniques In Speech Recognition. Proc. of the IEEE. 1993.
- Potamianos G., Graf H., Cosatto E. An Image Transform Approach for HMM Based Automatic Lipreading. In Proc. IEEE International Conference on Image Processing, volume III, pages 173−177, Chicago, 1998.
- Rabiner L.R. A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition. In Рос. of the IEEE, vol. 77, no 2, pp. 257 286.
- Ramakrishnan B.R. Reconstruction of Incomplete Spectrograms for Robust speech Recognition. The Ph. D. thesis. Carnegie Mellon University. USA. 2000.
- Rudnicky A.I., Hauptmann A.G. Survey of Current speech Technology. Carnegie Mellon University. USA. 1994.
- Sarikaya R., Hansen J.H.L., «High Resolution Speech Feature Parameterization for Monophone Based Stressed Speech Recognition,» IEEE Signal Processing Letters, Vol. 7, No. 7, Pages 182−185, July 2000.
- Seekings P., Potter J. Classification of marine acoustic signals using Wavelets & Neural Networks Proceeding of 8th Western Pacific Acoustics conference (Wespac8), Australia, April 7−9, 2003.
- Shapiro J. Embeded Image Coding Using Zerotrees Of Wavelet Coefficients. IEEE Transactions on Signal Processing, Vol. 41, No. 12 (1993), p. 3445−3462.
- Stergiopoulos S. Signal Processing Concept Similarities among Sonar, Radar, and Medical Imaginging Systems, CRC Press LLC, 2001.
- Storm H. Noise Reduction of Speech Signals with Wavelets. The Ph. D. thesis. Goteborg University. Sweden. 1997.
- Sullivan T.M. Multi-Microphone Correlation-Based Processing for Robust Automatic Speech Recognition. The Ph. D. thesis. Carnegie Mellon University. USA. 1996.
- Tan В., Fu M., Spray A., Dermody P. The Use of Wavelet Transforms in Phoneme Recognition. The Fourth International Conference on Spoken Language Processing (ICSLP), Philadelphia, October, 1996.
- Tzanetakis G., Essl G., Cook P. R. «Audio Analysis Using the Discrete Wavelet Transform,» In Proceedings of of WSES International Conference, Acoustics and Music: Theory and Applications (AMTA), Skiathos, Greece, 2001.
- Wei Xu, Rudnicky A. Can Artificial Neural Networks Learn Language Models. Carnegie Mellon University. USA. 2000.
- Wickerhauser, M.V. (1991), «INRIA lectures on wavelet packet algorithms,» Proceedings ondelettes et paquets d’ondes, 17−21 June, Rocquencourt France, pp. 31−99.
- Wornell G. Signal Processint with Fractals: A Wavelet-based Approach, Prentice Hall, NJ, 1996.
- Xiong Z., Ramchandran K., Orchard M. Wavelet Packet Image Coding Using Space-Frequency Quantization. IEEE Trans, on Image Processing, vol. 7, no. 6., pp. 892−898, June 1998.
- Yosiaki Ohshima Environmental Robustness in Speech Recognition using Physiologically-Motivated Signal Processing. The Ph. D. thesis. Carnegie Mellon University. USA. 1993.169