如何用 Tenosr 进行科学运算#

可以通过 megengine.functional.xxx 形式调用的 API 被认为是通用 Tensor 运算，负责提供常见的科学运算接口，该部分的 API 设计尽可能地向 NumPy API 靠拢。所有的 API 都可以在 general-tensor-operations 中找到。

根据对 Tensor 形状的要求和影响，我们又可以把这些运算分为以下几大类：

元素级别运算（Element-wise）
归约运算（Reduction）

参见

并不是所有的 NumPy 中的计算接口都有提供对应的 MegEngine 实现，但在处理数据时，你可以选择先调用 NumPy 实现获得 ndarray, 然后将 NumPy ndarray 转化为 MegEngine Tensor ；
如果你不理解一些 API 的使用方法，可以查询 NumPy 中关于对应 API 用法的介绍。

元素级别运算（Element-wise）#

元素级别运算是 Tensor 运算中最常见的一大类，根据操作数的区别，它既可以指对 Tensor 中每个位置的元素进行相同的运算（即一元运算），也可以指在不同的 Tensor 之间的对应元素逐个进行相互运算（即二元或更多元运算），这些运算自身又可以根据运算性质简略地区分为：

算术运算（加减乘除等，参考 arithmetic-operations ）
三角函数与反三角函数（参考 trigonometric-functions 与 hyperbolic-functions ）
位运算（参考 bit-operations ）
逻辑运算（参考 logic-functions ）

在神经网络运算中，也有许多运算是元素级别的，比如激活函数 relu 等。

元素级别的含义#

如果两个元素在各自的 Tensor 内占据着相同的位置，那么我们可以称这两个元素是对应的，其中元素的位置由用于定位每个元素的索引确定。我们用下面两个 Tensor a 和 b 作为例子：

>>> a = megengine.Tensor([[1., 2.], [3., 4.]])
>>> b = megengine.Tensor([[9., 8.], [7., 6.]])

我们使用相同的索引 [0][0] 去获取分别获取两个 Tensor 中的元素：

>>> a[0][0]
Tensor(1.0, device=xpux:0)

>>> b[0][0]
Tensor(9.0, device=xpux:0)

可以发现，a 中值为 1 的元素对应着 b 中值为 9 的元素。其它 3 个位置的元素也分别对应。

备注

对应关系由相同的索引定义，它表明了 Tensor 之间必须具有相同的形状才能进行元素间操作。

以加法为例子，我们可以当作是两个矩阵之间进行了矩阵加法：

\[\begin{split}\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} + \begin{bmatrix} 9 & 8 \\ 7 & 6 \end{bmatrix} = \begin{bmatrix} 10 & 10 \\ 10 & 10 \end{bmatrix}\end{split}\]

>>> a + b
Tensor([[10.0 10.0]
 [10.0 100.]], dtype=int32, device=xpux:0)

警告

并不是形状完全相同的两个 Tensor 之间才能够进行元素级别的运算，如果两个 Tensor 的形状相互 “兼容”，则可以广播（Broadcast）至相同的形状进行运算。这个机制让 Tensor 计算变得非常灵活。

参见

人们也用 Component-wise / Point-wise 等术语来指代元素级别的运算。

与矩阵运算的对比#

与 + 类似，使用 * 可以用来计算矩阵的对应元素相乘，也叫哈达玛积（Hadamard product）：

\[\begin{split}\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix} \odot \begin{bmatrix} 9 & 8 \\ 7 & 6 \end{bmatrix} = \begin{bmatrix} 9 & 16 \\ 21 & 24 \end{bmatrix}\end{split}\]

>>> a = megengine.Tensor([[1., 2.], [3., 4.]])
>>> b = megengine.Tensor([[9., 8.], [7., 6.]])
>>> a * b
Tensor([[ 9. 16.]
 [21. 24.]], device=xpux:0)

警告

不同的框架和库对于一些运算符的定义不同。 在 Matlab 中使用 .* 和 .^ 表示元素级别的乘法和乘方，使用 * 和 ^ 表示矩阵乘法和乘方，参考官网解释： Array vs. Matrix Operations

一些人会将 * 误认为是矩阵乘法 matmul , 实际上在 MegEngine 中矩阵乘法对应的运算符是 @ .

>>> a @ b
Tensor([[23. 20.]
 [55. 48.]], device=xpux:0)

它对应于 functional 模块中提供的 matmul 接口：

>>> megengine.functional.matmul(a, b)
Tensor([[23. 20.]
 [55. 48.]], device=xpux:0)

参见

更多与线性代数有关的运算，请参考 linear-algebra-functions .

归约运算（Reduction）#

备注

归约运算能够减少一个 Tensor 中元素的数量。

我们可以理解成统计意义上的降维（Dimensionality reduction）。

一个最简单的例子是对 Tensor 中的元素求和，使用 sum 接口：

>>> a = megengine.Tensor([[1, 2, 3], [4, 5, 6]])
>>> b = megengine.megengine.functional.sum(a)
Tensor(21, dtype=int32, device=xpux:0)

>>> print(a.shape, b.shape)
(2, 3) ()

可以看到，我们对一个形状为 (2, 3) 的 Tensor 求和后得到了一个 0 维 Tensor.

警告

归约运算并不总是将输入 Tensor 归约为具有单个元素的 0 维 Tensor. 在传入 axis 参数且不为 None 时，则可以要求沿着轴进行规约，参考使用 axis 作为参数；
我们也可以通过设置参数 keepdims=True 来保持归约运算前后的维度不变。

参见

常见的 Tensor 归约运算还有：prod / mean 等，可在 statistical-functions 中找到相关 API 和例程。
想要了解更多关于规约的知识，可以参考维基百科中对 Reduction operator 的解释。