Обеспечение отказоустойчивости вычислительной системы с автоматическим распределением ресурсов
Диссертация
При разработке структуры и алгоритмов функционирования ВСАРР возникает проблема организации системы автоматического контроля и обеспечения отказоустойчивости при выполнении вычислений. В такой вычислительной системе параллельные вычислительные процессы имеют сложную структуру, основанную на принципе потока данных. В случае возникновения неисправности (сбоя, отказа) при выполнении таких процессов… Читать ещё >
Содержание
- Глава 1. Обзор методов обеспечения отказоустойчивости в современных вычислительных системах
- 1. 1. Основные понятия отказоустойчивости вычислительных систем
- 1. 2. Исследование методов обнаружения ошибок и восстановления функционирования вычислительных систем после обнаружения сбоя
- 1. 3. Исследование практически реализованных отказоустойчивых вычислительных систем
- Выводы к первой главе
- Глава 2. Исследование архитектуры и особенностей организации отказоустойчивого функционирования вычислительной системы с автоматическим распределением ресурсов
- 2. 1. Исследование принципов организации вычислительных процессов в системе с автоматическим распределением ресурсов
- 2. 2. Анализ архитектуры и определение роли и задач системы контроля и обеспечения отказоустойчивости вычислительной системы с автоматическим распределением ресурсов
- 2. 3. Параметры надежности вычислительной системы с автоматическим распределением ресурсов
- 2. 4. Исследование вариантов реализации структуры отказоустойчивого исполнительного устройства ВСАРР
- Выводы ко второй главе
- Глава 3. Разработка алгоритмов функционирования системы обеспечения отказоустойчивости вычислительной системы с автоматическим распределением ресурсов
- 3. 1. Разработка алгоритмов работы системы аппаратного контроля МИУ
- 3. 2. Разработка алгоритма передачи информации, необходимой для восстановления вычислительного процесса, на исправный модуль МИУ в случае возникновения отказа одного из модулей
- 3. 3. Разработка алгоритма передачи информации, необходимой для восстановления вычислительного процесса, на исправное МИУ в случае возникновения отказа одного из МИУ
- 3. 4. Разработка алгоритмов работы системы аппаратного контроля МАП
- 3. 5. Разработка алгоритма реализации контрольных точек в графе задачи, выполняемой на
- ВСАРР
- Выводы к третьей главе
- Глава 4. Создание аппаратных средств для контроля выполнения операций в макете блока вещественной арифметики ИУ ВСАРР и пересылки сообщений о возникающих неисправностях на HOST-машину
- 4. 1. Анализ современных тенденций развития элементной базы цифровой схемотехники
- 4. 2. Выбор элементной базы и определение конструктивов для реализации макета ВСАРР
- 4. 3. Инструментальные средства и методика проектирования макета ВСАРР
- 4. 4. Разработка аппаратных средств для контроля выполнения операций в макете блока вещественной арифметики ИУ ВСАРР и пересылки сообщений о возникающих неисправностях на HOST-машину
- Выводы к четвертой главе
Список литературы
- Курейчик В.М., Родзин С. И. Контролепригодное проектирование и самотестирование СБИС: проблемы и перспективы. М.: Радио и связь, 1994.
- Родзин С.И. Программно-аппаратные методы и модели обеспечения отказоустойчивости и самотестируемости вычислительных систем/ Проблемы и перспективы развития устройств автоматики, связи и ВТ. Ростов-Дон: РГУПС, 2000.
- Согомонян Е.С., Слабаков Е. В. Самопроверяемые устройства и отказоустойчивые системы. — М.: Радио и связь, 1989.
- Журавлев Ю.П., Котелюк Л. А., Циклинский Н. И. Надежность и контроль ЭВМ. — М.: Сов. Радио, 1978.
- Селлерс Ф. Методы обнаружения ошибок в работе ЭЦВМ. М.: Мир, 1972.
- N.Suri, C. Walter, M.Hugue. Advances in Ultra-Dependable Distributed Systems// IEEE Computer Society Press, Los Alamitos, Ca. 1995
- Akers S., Krishnamurthy B. A Group-Thoretic Model for Symmmetric Interconnection Networks/ЛЕЕЕ Tr. On Сотр., V.38, N 4, April 1989, pp.555−565.
- Smith T. High Performance Fault-Tolerant Real Time Computer Architecture.//FTCS-16, Vienna, Austria, 1986.
- Jonson D. The Intel 432: A VLSI Architecture for Computer Systems.//Computer, V.17, N3, August 1984, pp. 40−48
- Васильев Н.П. и др. Самовосстанавливаемая управляющая ВС.// В книге III Всесоюзное совещание по технической диагностике. М., Наука, 1975.
- Согомонян Е.С. Отказоустойчивые избыточные структуры.// Автоматика и телемеханика, 1986, N10.
- Wakerly J. Trippled Modular System Organization.// IFIP Congress, Stokholm, Sweden, 1974.
- Ведешенков В. А. Об организации само диагностируемых цифровых систем.// Автоматика и телемеханика, N7,1983.
- Гарднер X. Полностью аппаратное резервирование без участия программ// Электроника, 1983, N2, стр. 39−43.
- Wallance J.J. Barnes W.W. Designing for Ultrahigh Availability: the Unix RTR Operating System// Computer, 1984, N8, pp. 31−39.
- Харченко B.C. Модели и алгоритмы реконфигурации отказоустойчивых систем с адаптивной многоярусной мажоритарно-резервированной структурой.// Автоматика и телемеханика, N8,2000.
- Кривоносое А.И., Меховской Н. Ф. и другие. Эскизный проект. Бортовая цифроваявычислительная машина унифицированной космической платформы. КБЭ (г.Харьков), 1990, печ.
- Каравай М.Ф., Согомонян Е.С. Reliability Analysis of Redundant Systems.// FTCS-8, Toulouse, France, 1978.
- Веселовский Г. Г., Куприянова M.B. Анализ некоторых комбинаторных свойств двоичного гиперкуба.// Автоматика и телемеханика, N8, 1997, стр. 178−187.
- J. R. Sklaroff, «Redundancy Management Technique for Space Shuttle Computers,» IBM J. Res. Develop. 20, pp. 20−28 (Jan. 1976).
- Preparata F. On the Connection Assignment Problem of Diagnosable System.// IEEE Tr. On Electr. Computers, EC-16,1967.
- Кеннет А. Многопроцессорная архитектура для обработки транзакций.// Электроника, т. 56, N2, 1983.
- Сагг R. The Tandem global update protocol.// Tandem Syst. Rev. 1,2,1985.
- Rennels D. FT computing Concepts and Examples.// IEEE Tr. On Сотр., V. C-33, N 12, Dec., 1984.
- Lala J. et al. A Design Appoach for Ultra-Reliable Real-Time Systems.// Computer, V 24, N 5, May, 1991.
- Cristian F. Understanding Fault-Tolerant Distributed Systems.// Communication of ACM, V 34, N2, Febr. 1991, pp. 57−78.
- Lapri J. et al. Definition and Analysis of Hardware- and Software- Fault Tolerant Architecture.// Computer, V 23, N 7, July 1992.
- Analog Devices: New Product Applications ADSP 21xx SHARC Processors, 1999.
- Шнитман В.З. Современные высокопроизводительные компьютеры Электронный ресурс. // Центр Информационных Технологий. 1996. — Режим доступа: http://citforum.ru/hardware/svk/contents.shtml. — Загл. с экрана.
- Каравай М.Ф. Математические основы отказоустойчивости.// Методы и системы технической диагностики. Саратов: изд. СГУ, 1990. Вып. 14. 4.1 С.3−7.
- Agerwala Т., J.L.Martin, J.H.Mirza and others «SP2 System Architecture» // IBM Systems Journal, Vol. 34, M 2,1995.
- Кузьминский M., Волков Д. Современные суперкомпьютеры: состояние и перспективы // Открытые Системы. 1995. — № 6
- Мокрушин JI.A. Концепция компьютеров потока данных: Обзор-реферат. // JL: ЛЭТИ, каф. ИИТ, 1990
- Agervala Т., Arvind. Data Flow Systems // Computer. Vol.15. — No.2. Feb, 1982. — P. 10−13
- Buck J.T., Scheduling dynamic dataflow graphs with bounded memory using the token flowmodel // Thesis of dissertation for the degree of Doctor of Philosophy, University of California at Berkeley, 1993
- Dennis J., Data Flow Supercomputers // Computer. Vol.13. — No. l 1. Nov, 1980. — P.48−56
- Dennis J.,. The Evolution of’Static' Data-Flow Architecture // Advanced Topics in Dataflow Computing, ed. L. Bic and J.-L. Gaudiot, Prentice Hall, 1991. P.35−91
- Kavi K.M., J. Arul, R. Giorgi. Execution and Cache Performance of the Scheduled Dataflow Architecture // Journal of Universal Computer Science, Vol. 6, no. 10,2000
- Culler D., «The Explicit Token Store» // Journal of Parallel and Distributed Computing, vol.10,289−308,1990.
- Гиндбург A., M. Милчев, Ю. Солоницын, «Периферийные устройства» // СПб: ПИТЕР, 2001
- Гордеев А.В., Молчанов А. Ю. «Системное программное обеспечение» // СПб: ПИТЕР, 2002
- J. Silc, В. Robic, Т. Ungerer. Asynchrony in parallel computing: From dataflow to multithreading // Parallel and Distributed Computing Practices. March 1998. — Vol.1, No.l. -P.56−82.
- J.B. Denis, G.R. Gao. Multithreaded Architectures: Principles, Projects and Issues // ACAPS Technical Memo 29, MIT, 1994.
- Arvind, A.T. Dahbura, A. Caro. Computer Architecture Research and the Real World // Computation Structures Group Memo 397, MIT Laboratory for Computer Science, Cambridge, MA, April 23,1997.
- Фетисов H.C. Архитектура многопроцессорной вычислительной системы потока данных // Препринт № 11. м.: ВЦКП АН СССР, 1991.
- С. Ruggiero, J Sargeant. Control of Parallelism in the Manchester Dataflow Machine // In Functional Programming Languages and Computer Architecture, number 274 in Lecture Notes in Computer Science, P. l-15. SpringerVerlag, 1987.
- Мокрушин JI.A. Концепция компьютеров потока данных: Обзор-реферат. JL: ЛЭТИ, каф. ИИТ, 1990.
- K.R. Traub, G.M. Popadopoulos, M.J. Beckerle, J.E. Hicks, J. Young. Overview of the Monsoon Project // Proceedings of the 1991 IEEE International Conference on Computer Design, Cambridge, MA, October 1991.
- Бурцев B.C.,"Система массового параллелизма с автоматическим распределением аппаратных средств суперЭВМ в процессе решения задачи." В сб. Вычислительные машины с нетрадиционной архитектурой.// СуперЭВМ. Выпуск 2, М. ВЦКП РАН, 1994 г., с.3−37.
- Клямко Э.И. Схемный и тестовый контроль автоматических цифровых вычислительных машин. М.: Советское радио, 1963.
- Akers S.B., On a Theory of Boolean Functions, J. Soc. Ind. Math., 7,4, 1959.
- Hsiao M.Y., An Algebraic Transformation Method of Simplifying Boolean Functions, Nat. Electron. Conf., Chicago, CP, 63−1468, October, 1963.
- Г. Чжен, Е. Мэннинг, Г. Метц, Диагностика отказов цифровых вычислительных систем. М.: Мир, 1972.
- Сапожников Р.А., Бессонов А. А., Шоломицкий А. Г., Надежность автоматических управляющих систем. М.: Высшая школа, 1964.
- Янкевич Е.А., Градов Е. С., Торчигин С. В., Макетирование исполнительного устройства процессора гибридной архитектуры // С. А. Лебедев и развитие отечественной вычислительной техники, Москва, 2002, стр. 176−180
- Армстронг Ж.П. Моделирование цифровых систем на языке VHDL. М.: Мир, 1992.
- Соловьев В.В. Проектирование цифровых систем на основе программируемых логических интегральных схем. М.: «Горячая линия-Телеком, Радио и связь», 2001.
- Стешенко В.Б. ПЛИС фирмы «Altera»: Элементная база, система проектирования и языки описания аппаратуры. М.: «Додэка-ХХГ, 2002.
- Яицков А.С. VHDL язык описания аппаратных средств: Учеб. пособие. — М.: МАТИ-РГТУ „ЛАТМЭС“, 1998.
- Разевиг В.Д. Система проектирования цифровых устройств OrCAD. М.:"Солон-Р», 2000.
- Антонов А.П., Мелехин В. Ф., Филиппов А. С. Обзор элементной базы фирмы ALTERA. -СПб.: Файнстрит, 1997.
- Altera Corporation. APEX 20К Programmable Logic Device Family. Data Sheet. August 1999. ver.2.02.
- Altera Corporation. Hardcopy Stratix device family. Data sheet. June 2003.
- Altera Corporation. FLEX 10KE Embedded Programmable Logic Family. Data Sheet. June1999. ver.2.01.
- Altera Corporation. Quartus Brochure. October 1999.
- Шнитман B.3., Кузнецов С. Д. Аппаратно-программные платформы корпоративных информационных систем Электронный ресурс. // Центр Информационных Технологий. 1996. — Режим доступа: http://citforum.ru/hardware/appkis/contents.shtml. -Загл. с экрана.
- Шнитман В.З., Кузнецов С. Д. Серверы корпоративных баз данных Электронный ресурс. // Центр Информационных Технологий. 1997. — Режим доступа: http://citforum.ru/database/skbd/contents.shtml. — Загл. с экрана.
- Пескова С.А., Гуров А. И., Кузин A.B. Центральные и периферийные устройства электронных вычислительных средств- под ред. О. П. Глудкина. — М.: Радио и связь, 1999.
- Опадчий Ю.Ф., Глудкин О. П., Гуров А. И. Аналоговая и цифровая электроника. М.: Радио и связь, 1996.
- Левин И.И. Модульно-наращиваемая многопроцессорная вычислительная система со структурно-процедурной организацией вычислений на основе ПЛИС-технологии. // Научно-теоретический журнал «Искусственный интеллект».- 2003. № 4. — С. 446−453.
- Кузьминский М., Волков Д. Современные суперкомпьютеры: состояние и перспективы // Открытые Системы. 1995. — № 6. — С.33−40.
- Гиндбург А., М. Милчев, Ю. Солоницын, «Переферийные устройства» // СПб: ПИТЕР, 2001
- БВО блок вещественных операций1. БГП буфер готовых пар
- БПЦСО блок простых целочисленных и специальных операций1. БК буфер команд
- БЦО блок целочисленных операций1. ВМ вычислительная машина
- ВСАРР вычислительная система с автоматическим распределением ресурсов1. ИС интегральная схема
- ИУ исполнительное устройство
- КМАП коммутатор модулей ассоциативной памяти
- МАП модуль ассоциативной памяти
- МИУ многопоточное исполнительное устройство
- ООЗУ общее оперативное запоминающее устройство
- ПЛИС программируемые логические интегральные схемы
- САПР система автоматизированного проектирования
- СВК схема встроенного контроля1. УУ устройство управления
- УУСК устройство управления системой контроля
- ФУ функциональное устройство