Принципы построения и разработка DSP-ядер с оптимальным по производительности конвейером для вычислительных и управляющих систем
Диссертация
В разработанных DSP-кластерах используется метод аппаратной поддержки синхронизации вычислительных потоков, основанный на использовании буфера обмена XBUF. Буфер обмена XBUF представляет собой многопортовый регистровый файл и допускает одновременное чтение одной и той же ячейки со стороны нескольких абонентов. Механизм синхронизации основан на том, что каждая ячейка XBUF снабжена дополнительным… Читать ещё >
Содержание
- ГЛАВА 1. ОБЗОР МЕТОДОВ ПОСТРОЕНИЯ И ОПТИМИЗАЦИИ КОНВЕЙЕРА СОВРЕМЕННЫХ МИКРОПРОЦЕССОРОВ
- 1. 1. Архитектура современных микропроцессоров
- 1. 2. Конвейеризация как основной метод повышения производительности современных микропроцессоров
- 1. 3. Архитектурные особенности сигнальных процессоров
- 1. 3. 1. Общая характеристика сигнальных процессоров
- 1. 3. 2. Сигнальные процессоры Texas Instruments
- 1. 3. 3. Сигнальные процессоры Analog Devices
- 1. 4. Организация конвейера сигнальных процессоров
- 1. 5. Реализация сигнальных процессоров в виде DSP-ядер для вычислительных и управляющих систем на кристалле
- 1. 6. Критерии, уровни и методы оптимизации систем на кристалле
- 1. 6. 1. Критерии оптимизации проектируемых СнК
- 1. 6. 2. Уровни и методы оптимизации СнК
- 1. 7. Известные методы оптимизации структуры конвейера инструкций микропроцессора
- 1. 8. Сравнительный анализ особенностей и недостатков существующих методов построения конвейера сигнальных процессоров и DSP-ядер
- 1. 9. Цели и задачи диссертационной работы
- Выводы
- ГЛАВА 2. ПРИНЦИПЫ ПОСТРОЕНИЯ ОПТИМАЛЬНОГО ПО ПРОИЗВОДИТЕЛЬНОСТИ КОНВЕЙЕРА ИНСТРУКЦИЙ DSP-ЯДРА НА ОСНОВЕ УЧЕТА СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИК ИСПОЛНЯЕМЫХ
- ПРИЛОЖЕНИЙ
- 2. 1. Анализ влияния программных переходов и зависимостей по данным в исполняемом
- приложении на производительность конвейера
- 2. 2. Определение статистических характеристик программной трассы путем построения и редукции графа зависимостей по данным
- 2. 3. вывод математической зависимости производительности процессора от числа фаз конвейера
- 2. 4. Определение оптимальной глубины конвейера для
- приложений с наличием программных переходов и зависимостей по данным
- 2. 5. Сравнение полученных формул с ранее известными
- Выводы
- ГЛАВА 3. РАЗРАБОТКА СЕРИИ DSP-ЯДЕР С ОПТИМАЛЬНЫМ ПО ПРОИЗВОДИТЕЛЬНОСТИ КОНВЕЙЕРОМ С УЧЕТОМ ХАРАКТЕРИСТИК ТЕХНОЛОГИЧЕСКОГО БАЗИСА
- 3. 1. Разработка аппаратной структуры серии масштабируемых DSP-ядер Elcore-xx™
- 3. 2. Проблема построения DSP-ядра с оптимальным конвейером в конкретном технологическом базисе: схемотехнический подход
- 3. 2. 1. Определение глубины конвейера: постановка задачи
- 3. 2. 2. Учёт временных характеристик библиотеки элементов
- 3. 2. 3. Оценка предельного быстродействия конвейера
- 3. 3. Анализ влияния временных характеристик внутрикристальной памяти на выбор структуры конвейера DSP-ядра
- 3. 3. 1. Временные характеристики внутрикристальной памяти
- 3. 3. 2. Влияние временных характеристик внутрикристальной памяти на структуру конвейера
- 3. 3. 3. Повышение производительности конвейера за счет выбора структуры памяти
- 3. 4. Определение глубины конвейера: функциональный подход
- 3. 4. 1. Модификация адреса памяти программ
- 3. 4. 2. Модификация адреса памяти данных
- 3. 4. 3. Зависимость по данным в исполняемой программе: краевые случаи
- 3. 4. 4. Зависимость по данным в исполняемой программе: общий случай
- 3. 5. Формирование управляющих сигналов как фактор ограничения производительности конвейера DSP-ядра
- 3. 6. Комплексная методика оптимизации конвейера DSP-ядра
- Выводы
- ГЛАВА 4. РЕЗУЛЬТАТЫ РАЗРАБОТОК, ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ И ВНЕДРЕНИЯ СЕРИИ DSP-ЯДЕР В РАМКАХ АППАРАТНО-ПРОГРАММНОЙ ПЛАТФОРМЫ «МУЛЬТИКОР»
- 4. 1. Определение оптимальной глубины конвейера DSP-ядра для
Список литературы
- Микропроцессоры. В 3-х кн. // Нестеров П. В.,.Шаньгин В. Ф, Горбунов В.Л.и др.- Под ред. Преснухина Л. Н. М.: «Высшая школа», 1986. Кн. 1: Архитектура и проектирование микроЭВМ. Организация вычислительных процессов. 495 с.
- Таненбаум Э. Архитектура компьютера, 4-е изд. Спб.: Питер, 2003. — 704 с.
- Столлингс В. Структурная организация и архитектура компьютерных систем. Проектирование и производительность. 5-е издание. Москва, 2002. 896 с.
- Микропроцессоры и микропроцессорные комплекты интегральных микросхем. Под ред. Шахнова В. А. М.: «Радио и связь», 1988. T. I, (Т.2) — 368 е., (368 с.)
- Хамахер К., Вранешич 3., Заки С. Организация ЭВМ, 1-е изд. Спб.: Питер, 2003.-848 с.
- Ульянов М.В. Архитектуры процессоров. М.: МГАПИ, 2002. — 68 с.
- Микропроцессорные системы. Под ред. Пузанкова Д. В. «Политехника», С. Петербург, 2002.-935 с.
- Современные высокопроизводительные компьютеры. Информационно-аналитический обзор. М.:ЦИТ, 1997.
- Von Neumannn J. First Draft of a Report on the EDVAC. Moore School, University of Pensylvania, 1945.
- Flynn M. Very high-speed computing system // In proceddings of IEEE. 1966. N 54. P.1901−1909.
- Flynn M. Some Computer Organisations and Their Effectiveness // In proceddings of IEEE Trans. Computers. 1972. V.21. N 9. P.948−960.12. http://www.analog.com/13. http://www.ti.com/
- Коуги П.М. Архитектура конвейерных ЭВМ // Пер. с англ.— М.: Радио и связь, 1985.-360 с.
- Каган Б.М. Электронные вычислительные машины и системы. М.- Энергоатом-издат, 1991.-592 с.
- Hartstein A. and Puzak T. R. The optimum pipeline depth for a microprocessor. //Proceedings of the 29th Annual International Symposium on Computer Architectures, pp. 7 13,2002.
- Hrishikesh M., Jouppi N., Farkas K., Burger D., Keckler S. and Shivakumar P. The optimal logic depth per pipeline stage is 6 to 8 F04 inverter delays // Proceedings of the 29th Annual Int Symposium on Computer Architectures, pp.14 24, 2002.
- Sprangle E. and Carmean D. Increasing processor performance by implementing deeper pipelines // Proceedings of the 29th Annual International Symposium on Computer Architectures, pp. 25 35, 2002.
- Srinivasan V., Brooks D., Gschwind M., Bose P., Zyuban V., Strenski P. N. and Emma P. G. Optimizing pipelines for power and performanc. // Proceedings of the 35th Annual IEEE/ACM International Symposium on Microarchitecture, pp.333 -344, 2002.
- Kunkel S.R. and Smith J.E. Optimal pipelining in supercomputers // Proceedings of the 13th Annual International Symposium on Computer Architectures, pp. 404 411, 1986.
- Emma P.G., Davidson E.S. Characterization ob Branch and Data Dependencies in Programs for Evaluating Pipeline Performance // IEEE Trans. On Computers, Vol. C-36, N0.7, July 1987, pp.859−875.
- Hartstein A., Puzak T.R. Optimum Power/Performance Pipeline Depth // Proceedings of the 36th International Symposium on Microarchitecture (MICRO-36'03), pp.117 -125, 2003.
- MIPS32™ Architecture For Programmers. Volume I: Introduction to the MIPS32™ Architecture. MIPS Technologies. March 12, 2001.
- Солонина А., Улахович Д., Яковлев JI. Алгоритмы и процессоры цифровой обработки сигналов. С-Пб, «БХВ-Петербург», 2002 г. 464 с.
- TMS320C64x Technical Overview. Texas Instruments. SPRU395B January 2001.
- TMS320C64x/C64x+ DSP CPU and Instruction Set Reference Guide. Texas Instruments. SPRU732H October 2008.
- TMS320DM6467 Digital Media System-on-Chip. Texas Instruments. SPRS403E -December 2007.
- ADSP-219x/2192 DSP Hardware Reference Revision 1.1, April 2004 Part Number 82−2 001−01 Analog Devices, Inc.
- TigerSHARC®Embedded Processor ADSP-TS203S 2006 Analog Devices, Inc.
- ADSP-TS201 TigerSHARC® Processor Programming Reference Revision 1.1, April 2005 Part Number 82−810−01 Analog Devices, Inc.
- ADSP-TS201 TigerSHARC® Processor Hardware Reference Revision 1.1, December 2004 Part Number 82−815−01 Analog Devices, Inc.
- Кривченко И. Системы на кристалле: общее представление и тенденции развития. Компоненты и технологии.№ 6, 2001 г.
- Бухтеев А. Методы и средства проектирования систем на кристалле. Chip News № 4, 2003. с. 4 -14.
- РТМ «Сложно-функциональные блоки. Общие требования к разработке» «, децимальный номер ШИЛГ 430 109.004 РМ. ФГУП «НИИМА «Прогресс», Москва, 2002.
- РТМ «Состав информации и форматы её передачи для цифровых СФ блоков», децимальный номер ШИЛГ 430 109.002 РМ. ФГУП «НИИМА «Прогресс», Москва, 2002.
- РТМ «Состав и форматы передачи информации для тестирования цифровых СФ блоков», децимальный номер ШИЛГ 430 109.003 РМ. ФГУП «НИИМА «Прогресс», Москва, 2002.
- Немудров В., Мартин Г. Проектирование систем на кристалле. Техносфера. 2004 г., 216 с.
- Michael J. Flynn, Patrick Hung, Kevin W. Rudd. Deep-Submicron Microprocessor Design Issues // IEEE Micro, Vol. 19, No. 4, July/Aug. 1999, pp. 11−22.
- Marc Duranton. The challenges for high performance embedded systems // Proceedings of 9th EUROMICRO Conference on Digital System Design (DSD'06), 2006, pp.3−7.
- Borkar S. Design Challenges of Technology Scaling // IEEE Micro, Vol. 19, No. 4, July/Aug. 1999, pp. 23−29.
- Ullman J.D. Computational Aspects of VLSI. // Computer Science Press, Rockville, Md., 1984, pp. 42−79.
- Vikas Agarwal, Hrishikesh Stephen, Keckler W., Doug Burger. Clock Rate versus IPC: The End of the Road for Conventional Microarchitectures // Proceedings of the 27 Annual International Symposium on Computer Architecture, 2000, pp.248 259.
- Беляев А.А. Организация программного конвейера DSP-ядер серии ELcore-xx™ IP-Библиотеки «МУЛЬТИКОР» // Проблемы разработки перспективных микроэлектронных систем. Сборник научных трудов. И1111М РАН, 2005. С. 508−511.
- Artisan Components. 1st Silicon (Malaysia) Sdn. Bhd. 0.25mm Process 2.5-Volt // SAGETM Standard Cell. Library Databook. — September 2002. — Release 2.0.
- Преснухин H., Воробьев H.B., Шишкевич A.A. Расчет элементов цифровых устройств. Москва, Издательство Высшая школа, 1991. 384 с.
- Антонова С.С., Беляев А. А., Епанчинцев А. Г., Заболотный А. Е., Максимов В. А., Назаров С. И., Петричкович Я. Я. Динамический D-триггер с третьим состоянием по выходу. Авторское свидетельство SU № 1 774 472 А1, 1992 г.
- Петричкович Я.Я., Филатов В. Н., Заболотный А. Е., Максимов В. А. Конвейеризация суммирующих устройств // Электронная техника. Сер. 10. Микроэлектронные устройства, 1987, вып. 5/65/, с. 3−6.
- Филатов В.Н., Петричкович Я. Я., Максимов В. А., Заболотный А. Е. Конвейеризация схем с помощью графов» // Электронная техника. Сер. 10. Микроэлектронные устройства, вып. 1/61/, 1987, с. 42−47.
- Markovic D., Stojanovic V., Nikolic В., Horowitz М. А, and Brodersen R.W. Methods for true energy-performance optimization // IEEE J. Solid-State Circuits, vol. 39, pp. 1282−1293, Aug. 2004.
- Chandrakasan A. P, Sheng S., Brodersen R.W. Low power CMOS digital design //IEEE J. Solid-State Circuits, vol. 27, pp. 473184, Apr. 1992.58. http://www.elvees.ru
- Солохина Т.В., Александров Ю. Н., Петричкович Я. Я. Сигнальные контроллеры компании «Элвис»: первая линейка отечественных DSP // Электроника: Наука, Технология, Бизнес. 2005. — № 7. — С. 70−77.
- Беляев А.А. Влияние программных переходов и зависимостей по данным в исполняемом программном коде на производительность конвейера DSP-ядра //Известия высших учебных заведений. Электроника. № 3, 2009. М., МИЭТ, 2009 г.-С. 75 -80.
- Беляев А.А. Неконвейеризуемые операции как фактор ограничения производительности DSP-ядра // Известия высших учебных заведений. Электроника. № 4, 2009. М., МИЭТ, 2009 г. — С. 56 — 60.
- Солохина Т.В., Петричкович Я. Я., Глушков А. В., Беляев А. А., и др. Время кентавров: Микросхемы серии Мультикор-llxx (MC-llxx) для встраиваемых и мобильных применений // Chip News. № 8(71). — 2002 г. — С. 10−17.
- Александров Ю.Н., Беляев А. А., Глушков А. В., Петричкович Я. Я., Солохина Т. В. и др. Новая отечественная платформа СБИС «МУЛЬТИКОР» для высокоточной скоростной обработки информации и управления объектами // Цифровая обработка сигналов», 2001,№ 3, с.25−38.
- Солохина Т.В., Петричкович Я. Я., Александров Ю. Н., Герасимов Ю. М., Забо-лотнов И.В., Алексеев М. Н., Беляев А. А. и др. Микросхемы базовых серий «МУЛЬТИКОР». Сигнальный микроконтроллер 1892ВМ2Т (МС-24) // Chip News. № 2(95). — 2005 г. — С. 20−31.
- Солохина Т.В., Петричкович Я. Я., Александров Ю. Н., Герасимов Ю. М., Забо-лотнов И.В., Алексеев М. Н., Беляев А. А. и др. Микросхемы базовых серий «МУЛЬТИКОР». Сигнальный микроконтроллер 1892ВМ2Т (МС-24) // Chip News. № 3(95). — 2005 г. — С. 20−26.
- Петричкович Я.Я., Солохина Т.В. SoC серии «МУЛЬТИКОР» первый шаг и положительная динамика развития // Компоненты и технологии, № 5, 2003 г., с. 104−106.
- Петричкович Я.Я., Солохина Т.В. SoC серии «МУЛЬТИКОР» первый шаг и положительная динамика развития // Компоненты и технологии, № 6, 2003 г., с. 140−143.
- Беляев А.А. Влияние глубины конвейера на производительность процессора. // Известия высших учебных заведений // Электроника. № 6 (80), 2009. М., МИЭТ, 2009 г.-С. 50−53.
- Беляев А.А., Солохина Т. В., Юдинцев В. А. Современные устройства цифровой обработки сигналов. Вместе или врозь? // Электроника: Наука, Технологии, Бизнес. 1/2009, с.28−35.
- Беляев А.А., Александров Ю. Н., Глушков А. В., Солохина Т. В., Петричкович Я. Я. Отечественные трехядерные сигнальные микроконтроллеры с производительностью 1,5 GFLOPS // Электроника: Наука, Технологии, Бизнес. 6/2006, с.73−78.78. http://www.multicore.ru
- Беляев А.А. Сигнальный микроконтроллер для видеоприложений. // Вопросы радиоэлектроники, Серия общетехническая, Выпуск 2, Москва, 2006 г., с.48−58.
- Петричкович Я.Я. Электронные системы обеспечения безопасности на основе интегральных интеллектуальных датчиков. Дисс. доктора техн. наук, Москва, 2006.-359 с.
- Pennebaker W.B., Mitchell J.L. JPEG Still Image Data Compression Standard// VNR, New York, 1992.
- Беляев А.А. Оптимизация по критерию быстродействия приложений для DSP-ядер ELcore-xx™ с различной глубиной конвейеризации // Вопросы радиоэлектроники. Серия ЭВТ, выпуск 3. Москва, 2008, С.99−112.