通用脉动阵列systolic array及矩阵乘法Matrix Multiplication
目录
- 脉动阵列的特点
- Matrix Multiplication矩阵乘法
- 通用SA(systolic array)发展趋势
- SIMD和SA处理器的比较
- Reference
脉动阵列的特点
优点:
结构简单,规整,控制方便
计算并行度高,吞吐量高
缺点:
具有一定的专用性

Matrix Multiplication矩阵乘法
下图原文有个小错误,A[J,K]应该是A[I,K]

为了得到3*3的C矩阵,要取6×9=54次数据,每个C的参数需要经过3次乘法和2次加法,需要计算9×(3次乘法+2次加法)
通过如下的脉动阵列只需要取18次数据就可以了。
第二列b和第二行a数据等待一个cycle再进入脉动阵列,因为第一行和第一列的a、b需要在P1内停留一个时钟进行计算,之后才传入P2和P4

通用SA(systolic array)发展趋势
用可编程开关进行SA重构,设计可重构的脉动阵列

关于可重构的SA阵列,部分论文有提到,例如如下这张图,我理解就是可重构的SA(先占个坑,后面研究明白了再详细分析一篇)

SIMD和SA处理器的比较
SIMD全称Single Instruction Multiple Data,单指令多数据流。脉动阵列和CPU专用指令相比,有不可替代性

Reference
百度文库https://wenku.baidu.com/view/d6aec1b9370cba1aa8114431b90d6c85ed3a881d.html?from=search.
博文https://blog.csdn.net/MaoChuangAn/article/details/88992191.
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
