Исследование и разработка методов обработки речевых сигналов с использованием векторного квантования в системах информационного обмена
Диссертация
При переходе от обычного векторного квантователя к векторному квантователю с управлением сигналом тон-шум снижение средней величины ошибки квантования составляет 3,9 дБ в диапазоне скоростей от 0,7 до 1,1 бит на параметр, а при переходе от квантователя с управлением сигналом тон-шум к квантователю с управлением сигналом тон-шум текущего и предыдущего кадра выигрыш в средней величине ошибки… Читать ещё >
Содержание
- 1. НИЗКОСКОРОСТНЫЕ КОДИРУЮЩИЕ СИСТЕМЫ ДЛЯ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА 12 Вводные замечания
- 1. 1. Структура и методы сокращения избыточности в низкоскоростных кодирующих систем речевого сигнала
- 1. 1. 1. Кодеры с линейным предсказанием
- 1. 1. 2. Векторные квантователи.'
- 1. 2. Направления развития применения векторного квантования параметров представления речевого сигнала
- 1. 1. Структура и методы сокращения избыточности в низкоскоростных кодирующих систем речевого сигнала
- Выводы
- 2. УЧЕТ МЕЖКАДРОВЫХ ЗАВИСИМОСТЕЙ В РЕЧЕВОМ СИГНАЛЕ ПРИ ВЕКТОРНОМ КВАНТОВАНИИ
- 2. 1. Предпосылки использования параметров функции возбуждения в качестве управляющих сигналов
- 2. 2. Разработка способа обработки речевого сигнала на основе векторного квантования с управлением сигналом тон/шум
- 2. 2. 1. Разработка векторных квантователей речевых сигналов с управлением сигналом тон-шум
- 2. 2. 2. Разработка векторных квантователей с конечным числом состояний речевых сигналов с управлением сигналом тон-шум
- 2. 2. 3. Разработка алгоритма построения векторного квантователя с конечным числом состояний с управлением сигналом тон-шум
- 2. 2. 4. Алгоритм построения функции следующего состояния
- 2. 3. Моделирование
- Выводы
- 3. ИССЛЕДОВАНИЕ И РАЗРАБОТКА ВЕКТОРНОГО КВАНТОВАТЕЛЯ НИЗКОСКОРОСТНОЙ КОДИРУЮЩЕЙ СИСТЕМЫ РЕЧЕВОГО СИГНАЛА
- 3. 1. Влияние модуля вектора разделения на формирование кодовой книги
- 3. 2. Формирование кодовых книг векторных квантователей и исследование характеристик
- 3. 3. Разработка быстрого алгоритма поиска эталонного вектора на основе инвариантных относительно метрики преобразованиях и исследование характеристик
- Выводы
- 4. ОЦЕНКА ВЫЧИСЛИТЕЛЬНЫХ ЗАТРАТ И ТРЕБОВАНИЙ К ПАМЯТИ ПРИ ПОСТРОЕНИИ ВЕКТОРНЫХ КВАНТОВАТЕЛЕЙ РЕЧЕВЫХ СИГНАЛОВ
- 4. 1. Оценка затрат на память при построении ВК
- 4. 2. Оценка вычислительных затрат при построении ВК
- 4. 3. Оценка затрат на память при реализации ВК
- Выводы
Список литературы
- G.Davidson, M. Yong Real-Time Vector Excitation Coding of Speech at 4800 BPS // ICASSP, DALLAS, 1987, pp.2189−2192.
- J.M. Tribolet and R.E. Crochiere, Frequency Domain Coding of Speech // IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-27, no. 5, pp. 512−530, Oct. 1979.
- M. Berouti, J. Makhoul An Adaptive-Transform Baseband Coder // Speech Communication Papers: 97th Meeting of the Acoustical Society of America, J.J. Wolf and D.H. Klatt, Eds. Cambridge, MA, June 1979, pp.377−380.
- B.S. Atal Predictive Coding of Speech at Low Bit Rates // IEEE Trans. Commun., vol. COM-30, no. 4, pp. 600−614, Apr. 1982.
- Chong Kwan Un, Won Yong Sung A 4800 BPS LPC Vocoder with Improved Excitation // ICASSP, DENVER, 1980, pp.142−145.
- D.P.Prezas, J. Picone Fast and Accurate Pitch Detection Using Pattern Recognition and Adaptive Time-Domain Analysis //ICASSP, TOKYO, 1986, pp. 109−112.
- F.J.Charpentier Pitch Detection Using the Short-Term Phase Spectrum // ICASSP, TOKYO, 1986, pp. l 13−116.
- D.G.Childers, H.T.Hu Speech Synthesis By Excited Line AR Prediction // Journal of acoustic soc. of America, V.96, № 4, Okt.1994, pp.2026−2036.
- S.Narayan, J.P.Burg Spectral Estimation of Quasi-Periodic Data // ICASSP, DALLAS, 1987, pp.944−947.
- J.P.Adoul, P. Mabillean Fast CELP Coding Based on Algebraic Codes // ICASSP, DALLAS, 1987, pp.1957−1960.
- Дж. Макхоул. Векторное квантование при кодировании речи /ТИИЭР, 1985, т.73, N11, стр.19−61.
- H.Koyama, A. Gersho Fully Vector-Quantized Multipulse LPC at 4800 BPS // ICASSP, TOKYO, 1986, pp. 445−448.
- A.Le Guyader, P. Combesure A Robust 16 kbits/s Vector Adaptive Predictive Coder for Mobile Communications // ICASSP, TOKYO, 1986, pp. 857−860.
- K.Ganesan, M. Marlot Efficient Algorithm for Combining Vector Quantization and Stochastic Modeling for Speaker-Independent Speech Recognition // ICASSP, TOKYO, 1986, pp. 1069−1071
- Satorie, Kazunari 8 Kb/s Speech Coder with Pitch Adaptive Vector Quantizer//ICASSP, TOKYO, 1986, pp. 1697−1700.
- P.Zheng, H.J.Zhang A New Idea of Code Book Design in Vector Quantization of Speech // ICASSP, DALLAS, 1987, pp. 1352−1353.
- J.Picons, G.R.Doddingtor Low Rate Speech Coding Using Contour Quantization//ICASSP, DALLAS, 1987, pp. 1653−1656.
- Y.Shobam Vector Predictive Quantization of the Spectral Parameters for Low Rate Speech Coding // ICASSP, DALLAS, 1987, pp. 2181 -2184.
- J.H.Chen, A. Gersho Real-Time Vector APC Speech Coding at 4800 BPS with Adaptive Postfiltering// ICASSP, DALLAS, 1987, pp. 2185−2188.
- R.Garcia-Gomez Vector Quantized Multipulse-LPC //ICASSP, DALLAS, 1987, pp. 217−2200.
- B.S. Atal Predictive Coding of Speech at Low Bit Rate // IEEE Trans. Commun., vol. COM-30, no. 4, Apr. 1982, pp. 600−614.
- B.S. Atal, S.L. Hanauer Speech Analysis and Synthesis by Linear Prediction of Speech Wave // J. Acoust. Soc. Amer., vol. 50, no. 2, Aug. 171, pp. 637−655.
- Linde Y., Buzo A., Gray R.M. An Algorithm for Vector Quantizer Design //IEEE Transaction on Communication, vol. COM-28, January 1980, pp.84−95.
- Патент РФ 2 166 804. МКИ 7 G 10 L 13/02. Способ преобразования речи и устройство для его осуществления /В.В. Костров, Ю. В. Дыранов, С.Ю. Фабричный//Б.И. 2001. -№ 13.
- Фабричный С.Ю. Особенности построения векторных квантователей речевых сигналов // Научные труды муромских ученых: Сб. науч. трудов Ми ВлГУ. Владимир: ВлГУ, 1997. — С. 167−171. / Соавт. Костров В.В.
- Фабричный С.Ю. Кодирование нестационарных сигналов при наличии межкадровых корреляционных связей // Научные труды муромских ученых: Сб. науч. трудов Ми ВлГУ.- Владимир: ВлГУ, 1999.- С. 125−127.
- Фабричный С.Ю. Исследование ВККЧС с маркировкой переходов с учетом параметров функции возбуждения // XXVI Гагаринские чтения: Тезисы докладов Всерос. междун. молодежной науч. конф. Т.1. — МГАТУ, 2000. С. 290. / Соавт. Дубиневич Р.В.
- Фабричный С.Ю. Исследование характеристик ВККЧС с быстрым поиском эталонов при учете параметров функции возбуждения // XXVI Гагаринские чтения: Тезисы докладов Всерос. междун. молодежной науч. конф. Т.1. — МГАТУ, 2000. С. 432. / Соавт. Зайцев Д.С.
- Foster J., Gray R.M., Dunham M.O. Finite-State Vector Quantization for Waveform Coding// IEEE Transactions on Information Theory, vol.-31, № 3, May 1985, pp. 348−359.
- Satoshi Imai, Yashiharu Abe Cepstral Synthesis of Japanese from CV Syllable Parameters // ICASSP, DENVER, 1980, pp. 557−560
- Masakasu Imai, S. Inokuchi Frequency Identification by Complex Spectrum // ICASSP, TOKYO, 1986, pp. 117−120.
- J.Hansen, S. Nandkumar Objective speech quality assessment and the RPE-LTP coding algorithm in different noise and language conditions // Journal Of Acoustic Soc. Of America, V.97, № 1, Jan. 1995, pp. 609−627
- F.K.Soong, M.M.Soudhy A Frequency-Weighted Itakura Spectral Distortion Measure and its Application to Speech Recognition in Noise // ICASSP, DALLAS, 1987, pp. 625−628.
- F.Itakuba, T. Umezaki Distance Measure for Speech Recognition Based о the Smoothed Group Delay Spectrum // ICASSP, DALLAS, 1987, pp. 1257−1260
- D.H.Friedman Formulation of Vector Distanse Measure for the Instantaneous-Frequency Distribution of Speech // ICASSP, DALLAS, 1987, pp. 1748−1751
- N.Kitawaki, H. Nagabuchi Objective Quality Evaluation for Low-Bit-Rate Speech Coding Systems // IEEE Jour. Sel. Areas In Communication, V.2, FEB. 1988, pp. 242−248.
- Фабричный С.Ю. Построение структурированной кодовой книги векторного квантователя сигналов // Методы и устройства передачи и обработки информации: Межвузовский сборник научных трудов. — СПб: Гидрометеоиздат, 2001. С. 148−154. / Соавт. Костров В.В.
- T.C.Chen A Fast Algorithm for Uniform Vector Quantization // ICASSP, DALLAS, 1987, pp. 1344−1347
- V.Ramamoorthy, S. Abdul-Jabbar A Reduced Search Vector Quantizer for Speech // ICASSP, TOKYO, 1986, pp.3035−3038.
- M.R.Soleymani, S.D.Morgeraff A High-Speed Search Algorithm for Vector Quantization // ICASSP, DALLAS, 1987, pp.1946−1948.
- A.Lowty S. Hossein Binary Search Trees for Vector Quantization // ICASSP, DALLAS, 1987, pp.2205−2208.
- R.M.Schwartz., S.E.Roucos. A Comparison of Methods for 300−400 B/S Vocoders // BBN, 10 Moulton St., Cambridge, MA 22 038. C.69.
- Фабричный С.Ю. Построение векторных квантователей по нескольким критериям // Радиоэлектроника и электроника в народном хозяйстве: Тезисы докладов НТК студентов и аспирантов ВУЗов России. Т.1. -МЭИ, 1998. -С.58−59.
- Фабричный С.Ю. Векторное квантование параметров нестационарных сигналов // XXIV Гагаринские чтения: Тезисы докладов Всерос. междун. молод, научн. конф. МГАТУ, 1998. — С. 147. / Соавт. Назаров А.С.
- Фабричный С.Ю. Применение неэвклидовых расстояний при эффективном кодировании нестационарных сигналов // Научные труды муромских ученых: Сб. научн. трудов Ми ВлГУ. Владимир: ВлГУ, 1999. -С.112−113./Соавт. Костров В.В.
- Фабричный С.Ю. Быстрый алгоритм поиска кодового вектора при векторном квантовании речевых сигналов // Направления развития систем и средств связи: Сборник докладов НТК. Воронеж, 1996. С. 864 870. / Соавт. Костров В.В.
- Фабричный С.Ю. Быстрый алгоритм поиска при векторном квантовании речевых сигналов // Обработка сложных сигналов с применением цифровых устройств и функциональной электроники: Межвузовский сборник научных трудов. — Рязань: РГРТА, 1996. — С. 10−15.
- Дж.Д.Маркел, А. Х. Грей Линейное предсказание речи. -М.: Связь, 1980.-308 с.
- F. Itakura, S. Saito Analysis Synthesis Telephony Based Upon the Maximum Likelihood Method.// Report of 6yh Int. Cong. Acoust. ed. By Y. Kohasi, Tokyo, C-5−5, C. 17−20, 1968.
- Коротаев Г. А. Эффективный алгоритм кодирования речевого сигнала на скорости 4.8кбит/с и ниже //Зарубежная радиоэлектроника 1996.-N3.
- Леусенко А.Е., Цупрев Н. И., Сычев И. В., Шапиро Д. А. Выбор интервала анализа речевого сигнала // Науч. техн. прогресс в пищ. промети.: Междунар. науч. техн. конф. Могилёв, 22−24 ноября, 1995: Тез. докл. -Могилёв, 1995.
- Nakata Kazuo, Tanaka Katsunori An Efficient Coding of Speech by Recursive and Adaptive AR Process Identification // J.Acoust. Soc. Jap. E.-1994.- 15, N6.
- Горьков И.Л. Аппаратно-програмный комплекс для анализа речевых сигналов // Вопр. повыш. качества упр. движ. объектами.- Спб, 1995.
- Леусенко А.Е., Цупрев Н. И., Сычев И. В., Шапиро Д. А. Сегментация речевых сигналов//Соврем. пробл. радиотехн., электрон, и связи.: Науч. техн. конф., Минск, 4−5 мая, 1995.- Минск, 1995.
- Yang Н., Koh S.N., Sivaprakasapillai P. Speech Coding Based on Multi-Band Excitation and Lenear Prediction Coefficient // J. Elec. and Electron. Eng. Austral.- 1994.- 14, N2.
- Rosenberg Aaron E., Soong Frank K.P. Technique for Modifying Reference Vector Quantized Speech Feature Signals// Пат. 5 377 301 США, МКИ G 10 L 9/00/ AT and T Corp.- N184768- Заявл. 21.1.94- Опубл. 27.12.94- НКИ 395/2.31
- Behme Holger, Brandt Wolf Pieter, Strube Hans Werner Speech Processing by Hierarchical Segment Classification // Proc. Int. Jt. Conf. Neural Networks, Nagoya, Oct. 1993: IJCNN'93 -Nagoya. Vol. 1. C. 279−282.
- Zhao Heming, Zhou Xudong A New Acoustic Perceptual Model //J. Electron. (China). 1995.- 12, N1.
- Hermes Dik J., Rump H. H. Perception of Prominence in Speech Information Induced by Rising and Falling Pitch Movement // J. Acoust Soc. Amer.- 1994. 96, N1.
- Hou Zezhang, Pavlovic Chaslav V. Effects of Temporal Smearing on Temporal Resolution, Frequency Selectivety, and Speech Intelligibility //J.Acoust. Soc. Amer.- 1994.- 96, N3.
- Kitamura Tatsuya, Akagi Masato Speaker Individualities in Speech Envelopes // J. Acoust. Soc. Jap. E.- 1995.- 16, N5.
- Watkins Anthony J., Makin Simon J. Perceptual Compensation for Spesker Sdifferences and for Spectral-envelope Distortion // J. Acoust. Soc. Amer.- 1994.-96, N3.
- Кругликов С.Ю. Оценка формантной разборчивости речи на основе автокорреляционной функции // Моск. техн. ун-т связи и инфор-мат.- М., 1995.- Рус.- Деп. в ЦНТИ «Информсвязь.» 23.8.95, 2058-св95.
- Assmann Peter F., Summerfield Quentin The Contribution of Waveform Interactions to the Perception of Concurrent Vowels // J. Acoust. Soc. Amer.- 1994.- 95, N1.
- Волкова Ю.В. Компактное представление речевых сигналов на основе точного кепстрального анализа // Моск. техн. ун-т связи и инфор-мат.- М., 1994.: ил.- Библиограф.: 3 назв.- Рус.- Деп. в ЦНТИ «Информсвязь» 11.11.94,2029.
- Волкова Ю.В., Попов О. Б. Малопараметрическое описание речевого сигнала // Обраб. сигналов в системах двухсторон. телефон, связи.:
- Межрегион, конф. и выст. интеллект, продуктов, Москва Пушкино, 1721 окт., 1994: Тез. докл. и кат. выст.- М., 1994.
- Erkelens J.S., Broersen Р. М. Т. Equivalent Distortion measures for Quantization of LPC model // Electron. Lett.- 1995.- 31, N17.
- Воеводин B.B., Тыртышников E.E. Вычислительные процессы с теплицевыми матрицами — М.: Наука, гл. ред. физ.-мат. лит., 1987. — 320 с.
- Сапожков A.M., Михайлов В. Г. Вокодерная связь. -М.: Радио и связь, 1983.-248 с.
- Д. Даджион, Р. Мерсеро Цифровая обработка многомерных сигналов / Под. ред. Л. П. Ярославского. М.: Мир, 1988 г. — 488 с.
- Применение цифровой обработки сигналов / Под. ред. Э. Оппен-гейма. М.: Мир, 1980 г. — 552 с.
- Воробьёв В. И. Стамбулов Т.Т. Оценка возможных путей сопряжения среднескоростных и высокоскоростных речепреобразующих устройств// Сб. науч. тр. / Воен. ин-т правительств, связи.- 1994.- N1.
- Журавлев В.И., Шалимов И. А. Методы передачи речи по сетям связи// Телекоммуникации. 2002, № 4, с. 13−24.
- Омельченко А.В., Пресняков А. И. Статистический синтез алгоритмов оценивания периода основного тона речевых сигналов.// Радиоэлектрон. и информат. 1999, № 1, с. 22−25.
- Главный конструктор ОАО МЗ РИП ^/^^-^В.В. Блохин
- Нач отдела № 3 ^ е.М. Маминов
- Начал!.ник учебного отдела
- Заведующий кафедрой радиотехники д.т.н., профессорС
- За веду ю щ и й л аборато р и я м и кафедры радиотехники1. Т.Н. Педя1. В.В. Ромашов1. В.В. Синев