НЕЙРОКОМПЬЮТЕРЫ - АРХИТЕКТУРА И РЕАЛИЗАЦИЯ


Архитектура ADSP-процессоров - часть 3


Регистры повышенной точности предназначены для хранения и обработки 32-разрядных целых чисел и 40-разрядных чисел с плавающей точкой. Дополнительные регистры доступны как для АЛУ, так и для двух модулей регистровой арифметики. Основная функция этих регистров - генерация 32-разрядных адресов. Они также могут использоваться как счетчик циклов или как регистры общего назначения.

Адресуемое процессором пространство составляет 4Г 32-разрядных слов. На кристалле расположены два двухвходовых блока оперативной памяти RAM0 и RAM1, размером 4 Кбайт каждый, а также двухвходовой блок ROM, содержащий программу начальной загрузки.

Кэш команд процессора емкостью 128 32-разрядных слов содержит наиболее часто используемые участки кода, что позволяет сократить среднее время выборки команд. Высокая производительность TMS320C40 достигается благодаря внутреннему параллелизму процессов и многошинной организации процессора. Раздельные шины позволяют одновременно выполнять выборку команды, данных и прямой доступ в память.

Все больше завоевывающее популярность, в том числе и для нейро приложений, семейство процессоров TMS320C6x обладает рекордной производительностью 1600 MIPS. Благодаря этому возможен принципиально новый взгляд на существующие системы связи и телекоммуникаций. Высокая производительность микропроцессоров обеспечивается благодаря новой архитектуре VelociTIT с очень длинным командным словом (VLIW, Very Long Instruction Word). Архитектура VelociTI образована множеством параллельно работающих процессоров, которые позволяют выполнять несколько инструкций за один командный цикл. Именно такой параллелизм архитектуры процессора обеспечивает высокую производительность.

Сравнительная оценка производительности наиболее используемых сегодня в нейроприложениях DSP Analog Devices и TI приведена в таблице 2.

Таблица 2. Сравнительные характеристики [7].

Характеристика\процессорADSP21061TMS320C40/TMS320C44
Instruction Execution Time20 ns33 ns
Peak MFLOPS150 Peak MFLOPS60 Peak MFLOPS
Price (10,000 pcs)$49$176 ($99 w/C44)
Price/performance3.1 MFLOPS/$0.34 MFLOPS/$ (.6 w/C44)
 
Benchmark: 
1K pt Complex FFT.37 ms.97 ms
 
Core Features: 
Data Registers3212
Circular Buffers321 (Fixed Length)
 
I/O Capabilities: 
DMA Channels66
Serial Ports2 with TDM modeNone
Max throughput300 Mbytes/sec60 Mbytes/sec
On-Chip Memory32K x 32 Bit Words2K x 32 Bit Words
Total On-Chip Memory Size1,024 Kbit (1Mbit)64 Kbits
 
Multiprocessing Support6 processors through cluster bus6 processors through COMM ports (4 processors w/C44)
 
Host InterfaceParallelNone




- Начало -  - Назад -  - Вперед -