雑多な趣味の記録帳

tom01h.exblog.jp

2018年 03月 01日 ( 1 )

8bit 内積命令を使った推論プログラム その2

パラメタメモリのアドレス生成に Imm を加算する機能を追加して、アセンブラレベルのソフト最適化をしてみました。
BNNのACC命令では1個のデータを1度に32個のフィルタにかけるけど、内積では一度に2個のフィルタしかかけないので、やっぱり第1層の時間が支配的です。
f0054075_19401834.png
あと、内積アクセラレータはパイプライン動作出来るはずなのですが、zero-riscy がマルチステップ命令でしか対応できないので、4サイクルのマルチステップ命令になります。9回の内積演算の後にBNNアクセラレータにデータを移して、次のフィルタの準備をしているのが下の波形。
f0054075_19413465.png
大きな変更になるけど、2段パイプ卒業を考えるときかな?

[PR]
by tom01h | 2018-03-01 21:36 | PCとか | Trackback | Comments(0)