Вывод.
Нейропроцессоры

РефератПомощь в написанииУзнать стоимостьмоей работы

Для цифровых сигнальных процессоров и ПЛИС-систем оценка затруднена, так как нет конкретных данных о производительности нейроалгоритмов на устройствах этого типа. В современных DSP-процессорах из-за возможности одновременного выполнения нескольких инструкций о производительности можно говорить лишь в применении к конкретному алгоритму. Аналоговая микросхема Intel 80170NX ETANN показывает довольно… Читать ещё >

Вывод. Нейропроцессоры (реферат, курсовая, диплом, контрольная)

Сравнение быстродействия различных решений Сравнительная оценка производительности аппаратуры для реализации нейросред затруднительна. Это связано с тем, что разные архитектуры имеют очень большие различия в разрядности входных и выходных величин, разрядности весовых коэффициентов, топологии реализуемой нейросети, виде обрабатываемых величин (с плавающей или фиксированной запятой) и многих других важных параметрах. Кроме того, нет общепринятых оценок производительности, которые давались бы любым производителем. Для каждого чипа есть только некоторые показатели производительности, которые считаются разработчиками наиболее значимыми.

Тем не менее, для области нейросетевой обработки данных характерны следующие показатели быстродействия:

· CPS (connections per second). Число соединений (умножений с накоплением) в секунду.
· CPSPW (CPS per weight). CPPSPW = CPS/N_W, где N_W — число синапсов в нейроне. Фактически эта величина показывает число подсчетов выходов нейронов (количиство вычислений функций активации) в секунду.
· CPPS. CPPS = CPSЧB_WЧB_S, где B_W, B_S — разрядность весов и синапсов соответственно. Этот показатель учитывает разрядность и поэтому более правдоподобен для сравнения разнородных архитектурных решений.
· MMAC (multiplications and additions per second). Этот параметр обычно указывается для средств обработки сигналов (цифровых сигнальных процессоров и ПЛИС). Он не полностью соответствует показателю CPS.
· Время обработки. Этот показатель равен промежутку времени между поступлением входного сигнала и получением выходного сигнала нейросети.

Сравнение показателей производительности рассметренных в данной работе аппаратных решений представлено в талице.

Таблица 2.

Производительности нейроархитектур


Название.	Производительность.	Описание.
Intel 80170NX ETANN.	2G MAC.	Аналоговая схема, 6 бит веса.
Bellcore CLNN32.	100M CUPS, T = 3 мкс.	Гибридная схема, 4 бит веса.
НТЦ <> NM6403.	1.2 G MAC.	Для 32 бит данных, нейросигнальнный процессор
Datafactory SAND.	200M CPS.	Систолический процессор
Datafactory MiND.	800M CPS.	Плата ускорителя с 4 чипами SAND.
Adaptive Solutions CNAPS.	2.56 G MAC, 293M CUPS.	Систолический процессор с 64 внутренними процессорами.
Adaptive Solutions CNAPS Server II card.	10.24 G MAC.	Карта ускорителя с 4 чипами CNAPS.
Скан Инжиниринг Телеком XDSP-680.	220M MAC.	4 FPGA-чипа.
Analog Devices ADSP-2106x.	700M FLOPS.

К сожалению, приведенные данные не позволяют однозначно судить о быстродействии различных нейроустройств, хотя и позволяют сделать некоторые выводы. Например, виден линейный рост производительности систем на основе систолических процессоров с увеличением числа таких процессоров (этот факт с очевидностью следует из логики функционирования систолических процессоров). Но надо учитывать, что также линейно растет задержка между получением входных данных и выдачей выходного сигнала нейросети.

Аналоговая микросхема Intel 80170NX ETANN показывает довольно высокое быстродействие, но из таблицы видно (особенно если учесть малую разрядность обрабатываемых данных), что другие решения имеют более высокую производительность. Для однобитовых данных нейросигнальный процессор NM6403 имеет производительность 11.52G MAC.

Для DSP-чипов характерна оценка производительности по времени выполнения стандартных для обработки сигналов преобразований. В таблице представлены такие оценки для процессоров общего назначения, DSP компании Texas Instruments и нейросигнального процессора NM6403.

Таблица 3.

Выполнение стандартных преобразований.


Преобразование.	Intel Pentium II 300 МГц.	Intel PentiumMMX 200 МГц.	TI TMS320C40 50 Мгц.	НТЦ <> NM6403 40 Мгц.
Фильтр Собеля (размер кадра 384X288 байт), кадров/с.			6.8.
Быстрое преобразование Фурье (256 точек, 32 разряда), мкс.
Преобразование Уолша-Адамара (21 шаг, вх. данные 5 бит), с.	2.58.	2.80.		0.45.

Данные таблицы 3 показывают, что специализированные процессоры могут составить конкуренцию распространенным процессорам общего назначения при гораздо более экономичных параметрах. Но если учесть темпы роста производительности процессоров общего назначения, то очевидно, что за счет своих вычислительных возможностей рабочие станцие могут эффективно реализовывать нейроалгоритмы. Можно сделать вывод, что необходимость в платах нейроускорителей в скором времени отпадет, хотя специализированные нейровычислители будут превосходить в производительности платформы общего назначения.

Основные достоинства и недостатки различных решений.


Достоинства.	Недостатки.
Процессоры общего назначения.
· Гибкость · Наличие высокоуровневых библиотек и средств реализации · Совместимость с другими процессорами · Большие объемы памяти · Высокая разрядность	· Высокая стоимость систем · Архитектурная избыточность · Большое энергопотребление и тепловыделение · Необходимость множества периферийных схем · Сложность построения многопроцессорных систем
Цифровые сигнальные процессоры.
· Гибкость · Простота построения систем · Наличие стандартных библиотек	· Отсутствие совместимости с чипами других семейств · Отсутствие готовых решений · Сложность построения мультимикропроцессорных систем
Нейросигнальные процессоры.
Все достоинства DSP. · Высокая производительность для нейроалгоритмов · Наличие стандартных решений	· Отсутствие совместимости · Ориентация на конкретный вид нейросети
Достоинства.	Недостатки.
Систолические процессоры.
· Высокая производительность для нейроалгоритмов · Наличие стандартных решений · Простота масштабирования системы.	· Отсутствие совместимости · Увеличение задержки с ростом числа процессоров в системе · Отсутствие гибкости
ПЛИС-системы.
· Аппаратная реализация нейроалгоритмов · Наличие высокоуровневых средств построения систем · Совместимость на уровне языка описания схемы · Простота реализации системы · Возможность модификации архитектуры	· Неполное использование ресурсов чипа · Огранниченность ресурсов чипа
Реализация нейросети на заказном кристалле.
· Наивысшая производительность · Ориентация на конкретную систему	· Отсутствие совместимости · Высокая стоимость реализации · Большое время реализации

Показать весь текст

Заполнить форму текущей работой

Другие работы

Математическое описание задачи

Поток событий называется потоком без последействия, если для любых, не перекрывающихся участков времени число событий, попадающих на один из них, не зависит от числа событий, попадающих на другие. Это означает, что заявки попадают в систему не зависимо друг от друга. Интенсивность поступления потока заявок —. Простейшие потоки поступления заявок характеризуются показательным законом…

Реферат