SHARCプロセッサ・ベンチマーク
SHARCプロセッサ・ベンチマーク
リアルタイム信号処理タスクは、大きなI/Oパワーと計算パワーを必要とします。SHARCプロセッサは、高速な演算ユニットを搭載し、1サイクル積和演算(MAC)を含むすべての命令を1サイクルで実行するだけでなく、最大のI/O帯域幅とメモリ・アクセス帯域幅を実現するように設計されています。コア速度、メモリ集積度、I/O帯域幅の優れたバランスによって、リアルタイム・アプリケーションに不可欠な持続性能を達成します。
ベンチマークの重要性は、特定のDSPの動作をアプリケーションの観点から実証できることにあります。ベンチマークの数値が小さいほど、アルゴリズムの実行は高速です。DSPがタスクを高速に実行できれば、プロセッサは与えられた時間でより多くのタスクを実行できます。DSPのサイクル時間やクロック速度、MIPSを見るだけでは、プロセッサの真の性能を正しく把握することはできません。したがって、クロック速度とサイクル時間だけでなく、アルゴリズムのベンチマークを解析することも重要です。
ADSP-21160N ADSP-21161N SIMD |
ADSP-21261 SIMD |
ADSP-21262 ADSP-21266 SIMD |
ADSP-21371 ADSP-21375 SIMD |
ADSP-21364 ADSP-21365 SIMD |
ADSP-21368 ADSP-21369 SIMD |
ADSP-2146x SIMD |
ADSP-2158x ADSP-SC58x SIMD |
|
クロック・サイクル | 100 MHz |
150 MHz | 200 MHz | 266 MHz | 333 MHz | 400 MHz | 450 MHz | 450 MHz per core (2 DSP cores) |
命令サイクル時間 | 10 ns | 6.67 ns | 5 ns | 3.75 ns |
3 ns | 2.5 ns | 2.22 ns | 2.22 ns per core |
MFLOPS (連続) | 400 MFLOPS | 600 MFLOPS | 800 MFLOPS | 1064 MFLOPS | 1332 MFLOPS | 1600 MFLOPS | 1800 MFLOPS | 3600 MFLOPS |
MFLOPS (ピーク) |
600 MFLOPS | 900 MFLOPS | 1200 MFLOPS | 1596 MFLOPS | 1998 MFLOPS | 2400 MFLOPS | 2700 MFLOPS | 5400 MFLOPS |
1024ポイント複素FFT (基数 4、ビット反転) ライブラリ・コード使用 FFT H/W・アクセラレータ使用 |
109.72 µs |
73.18 µs |
54.86 µs |
41.15 µs |
32.91 µs |
27.43 us |
24.36 µs |
24.58 µs |
N/A | N/A | N/A | N/A | N/A | N/A | 176.11 µs | 5.53 µs | |
FIRフィルタ(タップ当たり) |
5 ns | 3.3 ns | 2.5 ns | 1.88 ns | 1.5 ns | 1.25 ns | 1.11 ns | 1.11 ns |
IIRフィルタ (バイクワッド当たり) | 20 ns | 13.3 ns | 10 ns | 7.5 ns | 6 ns | 5 ns | 4.43 ns | 4.43 ns |
マトリックス乗算 (パイプライン) [3x3] * [3x1] [4x4] * [4x1] |
45 ns |
30 ns |
22.5 ns |
16.91 ns |
13.5 ns |
11.25 ns |
10.00 ns |
10.00 ns |
80 ns | 53.3 ns | 40 ns | 30.07 ns |
24 ns | 20 ns | 17.78 ns | 17.78 ns |
|
除算 (y/x) | 30 ns | 20 ns | 15 ns | 11.27 ns |
9 ns | 7.5 ns | 6.67 ns | 6.67 ns |
逆平方根 | 45 ns | 30 ns | 22.5 ns | 16.91 ns |
13.5 ns | 11.25 ns | 10.00 ns | 10.00 ns |
4.43 ns |