这通常涉及数据传输,更具体地涉及具有不同访问时间的数据存储器之间的大矩阵的移动。
背景技术:
技术实现思路
1、在所描述的示例中,矩阵传输加速器经由数据传输处理器将外部数据存储器与本地数据存储器接口连接。数据可以包括输入特征映射存储元件,诸如大特征映射存储元件。可以通过列贴块/瓦片(tile)过程从外部数据存储器或本地数据存储器传输数据。可以部分或整体地、逐列或逐行处理或传输数据。如果以增量方式进行,则增量可以增量步长增加,直到每个单独部分完成。也可以对不完整的或者具有不相等数据部分或存储元件的任何信息执行填补(padding)。
1.一种存储器系统,包括:
2.根据权利要求1所述的存储器系统,其中所述存储器加速器被配置为将所述输入特征映射的第三列贴块集从所述外部存储器传输到所述数据存储器的所述第二部分,使得所述第三列贴块集覆写所述数据存储器中的所述第一列贴块集。
3.根据权利要求1所述的存储器系统,其中所述存储器加速器被配置为在所述第一列贴块集的所述传输之前将填补贴块集插入所述数据存储器的所述第二部分中,使得所述填补贴块集的每个贴块存储在所述数据存储器中,与所述填补贴块集的相邻贴块分隔所述预定数量的数据单元。
4.根据权利要求1所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与所述滤波器系数乘数相乘以产生输出特征映射,其中所述存储器加速器被配置为在所述乘法器进行所述第一列贴块集的乘法期间将所述第二列贴块集传输到所述数据存储器的所述第二部分。
5.根据权利要求4所述的存储器系统,其中所述存储器加速器被配置为在所述乘法器进行所述第一列贴块集的前半部分的乘法期间将所述第二列贴块集传输到所述数据存储器的所述第二部分。
6.根据权利要求1所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与所述滤波器系数乘数相乘以产生输出特征映射,其中:
7.根据权利要求1所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与所述滤波器系数乘数相乘以产生输出特征映射,其中:
8.根据权利要求7所述的存储器系统,其中所述存储器加速器被配置为将所述输出特征映射的第二列贴块集存储在所述数据存储器中,使得所述输出特征映射的所述第二列贴块集与所述输出特征映射的所述第一列贴块集交错。
9.根据权利要求1所述的存储器系统,其中所述存储器加速器被配置为:
10.根据权利要求9所述的存储器系统,其中所述存储器加速器被配置为,基于所述输入特征映射不是大的输入特征映射,在处理所述输入特征映射之前,将整个所述输入特征映射传输到所述数据存储器的所述第二部分。
11.根据权利要求1所述的存储器系统,进一步包括:
12.根据权利要求1所述的存储器系统,进一步包括:
13.一种方法,其包括:
14.根据权利要求13所述的方法,进一步包括:
15.根据权利要求14所述的方法,其中所述第二列贴块集的所述传输在对所述第一列贴块集的前半部分执行所述矩阵运算期间传输所述第二列集。
16.根据权利要求13所述的方法,进一步包括将所述矩阵的第三列贴块集从所述外部存储器传输到所述数据存储器,使得所述第三列贴块集覆写所述数据存储器中的所述第一列贴块集。
17.根据权利要求13所述的方法,进一步包括在所述第一列贴块集的所述传输之前将填补贴块集插入数据存储器中,使得所述填补贴块集的每个贴块被存储在所述数据存储器中,与所述填补贴块集的相邻贴块分隔所述预定数量的数据单元。
18.根据权利要求13所述的方法,其中:
19.根据权利要求13所述的方法,其中:
20.根据权利要求19所述的方法,进一步包括将所述输出特征映射的第二列贴块集存储在所述数据存储器中,使得所述输出特征映射的所述第二列贴块集与所述输出特征映射的所述第一列贴块集交错。
21.一种电路,其包括:
22.根据权利要求21所述的电路,其中:
23.根据权利要求21所述的电路,其中:
24.根据权利要求21所述的电路,进一步包括所述处理单元。
25.根据权利要求24所述的电路,其中所述处理单元包括矩阵乘法单元。
26.根据权利要求21所述的电路,其中:
27.根据权利要求21所述的电路,其中:
28.一种方法,其包括:
29.根据权利要求28所述的方法,其中:
30.根据权利要求28所述的方法,进一步包括:
31.根据权利要求28所述的方法,其中:
32.根据权利要求28所述的方法,其中:
33.一种存储器系统,其包括:
34.根据权利要求33所述的存储器系统,其中所述存储器加速器被配置为将所述输入特征映射的第三列贴块集从所述外部存储器传输到所述数据存储器,使得所述第三列贴块集覆写所述数据存储器中的所述第一列贴块集。
35.根据权利要求33所述的存储器系统,其中所述存储器加速器被配置为在所述第一列贴块集的所述传输之前将填补贴块集插入所述数据存储器中,使得所述填补贴块集的每个贴块存储在所述数据存储器中,与所述填补贴块集的相邻贴块分隔所述预定数量的数据单元。
36.根据权利要求33所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与滤波器系数乘数相乘以产生输出特征映射,其中所述存储器加速器被配置为在所述乘法器进行所述第一列贴块集的乘法期间将所述第二列贴块集传输到所述数据存储器。
37.根据权利要求36所述的存储器系统,其中所述存储器加速器被配置为在所述乘法器进行所述第一列贴块集的前半部分的乘法期间将所述第二列贴块集传输到所述数据存储器。
38.根据权利要求33所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与滤波器系数乘数相乘以产生输出特征映射,其中:
39.根据权利要求33所述的存储器系统,进一步包括乘法器,其耦合到所述数据存储器并且被配置为将所述输入特征映射与滤波器系数乘数相乘以产生输出特征映射,其中:
40.根据权利要求39所述的存储器系统,其中所述存储器加速器被配置为将所述输出特征映射的第二列贴块集存储在所述数据存储器中,使得所述输出特征映射的所述第二列贴块集与所述输出特征映射的所述第一列贴块集交错。
