НЕЙРОКОМПЬЮТЕРЫ - АРХИТЕКТУРА И РЕАЛИЗАЦИЯ


Нейроускорители на базе ПЛИС. - часть 3


Особенностью схемы управления перепрограммируемого вычислителя для систем обработки информации является наличие рабочей команды, управляющей шестью базовыми вычислительными элементами. Команда позволяет одновременно, за один такт, задавать различные режимы функционирования шести базовым вычислительным элементам и инкрементировать адреса обоих массивов памяти на любое число от 0 до 255, хранимое в регистрах инкремента, причем каждому массиву соответствует свой регистр. Команда может повторяться любое количество раз в соответствии со значением, хранимым в специальном регистре. Это позволяет выполнять основную команду без потерь на организацию циклов и переходов. Рабочая команда позволяет одновременно запускать оба контроллера локальной памяти, инкрементировать адресные регистры на требуемое значение, выставлять на адресные шины адреса из соответствующих регистров адреса, выставлять на шины управления БВЭ команды из соответствующих регистров БВЭ. Кроме того, рабочая команда осуществляет организацию обмена данными между контроллером внешней шины и локальной памятью.

Таблица 1.

Название алгоритма Pentium-100, с PentiumII-333, с Ultra SPARC, c ППВ, с
Свертка с ядром 4х4 3) 0.65 0.11 0.76 0.02
Медианный Фильтр 1.97 0.49 0.75 0.001
Повышение контрастности 0.51 0.13 1.31 0.004
Прямое поточечное сравнение с маской 32х32 4) 43.78 7.14 58.89 0.142
Поиск локальных неоднородностей 32х32 0.120 0.028 0.146 0.032
Умножение матрицы на матрицу 8.61 0.60 12.31 0.011

Оценки приведены для:

Pentium-100 при частоте 100 МГц, объем ОЗУ 16 Мбайт;

Pentium-333 при частоте 350 МГц, объем ОЗУ 128 Мбайт;,br>

UltraSPARC при частоте 200 МГц, объем ОЗУ 64 Мбайт;,br>

Вычислителя при частоте 33 МГц.

Методика быстрого создания нейровычислителей на ПЛИС приведена в [6]. Основные тенденции в проектировании нейровычислителей на ПЛИС - это увеличение плотности копоновки нейрокристаллов за счет уменьшения площади ежсоединений и функциональных узлов цифровых нейронов. Для решения этой задачи находят приенение:

  • применение оптических связей для передачи инфорации между нейронами.
  • модификации программно-аппаратной реализации функциональных элементов для нейровычислений.
  • оптимизация представления промежуточных данных в слоях нейронов - нейросети со сжатой формой внутренних данных.




- Начало -  - Назад -  - Вперед -