类似Python的数值计算库MatX带来作为操作符的变换及其他特性

MatX：NVIDIA 开发的 C++ 高性能数值计算库

MatX 是 NVIDIA 为其 GPU 开发的 C++ 库，旨在通过类似 Python scipy 或 MATLAB 的高级语法实现接近原生的数值计算性能。其最新版本带来了多项新功能，包括将变换作为运算符使用、新增的运算符（如 upsample、downsample、pwelch 等），以及通过运算符融合实现延迟求值的能力。

主要功能与特性

运算符融合（Operator Fusion）：
- 运算符融合是 MatX 的核心特性，旨在通过减少内存访问来提升性能。内存访问的成本通常比寄存器访问高数个数量级。
- 通过运算符融合，表达式不会立即求值，而是被转换为一个 C++ 类型，表示该表达式，并在需要时求值。例如：
```
auto op = (B * (cos(C) / D));
```
  这种方式允许将多个表达式组合在一起，并在需要时延迟求值。
变换作为运算符：
- 最新版本中，变换（如 FFT）可以作为运算符使用。例如：
```
(A = B * fft(C)).run();
```
  编译器能够识别乘法运算符的右侧是 FFT 变换，左侧是另一个表达式，并在编译时将两者融合。
- 这一新语法带来了与之前版本的重大改变。例如，之前使用 matmul(C, A, B, stream)，现在应改为 (C = matmul(A,B)).run(stream)。
新增运算符：
- upsample：通过在信号中插入零值来实现上采样。
- downsample：通过丢弃样本来实现下采样。
- pwelch：用于直接可视化信号的频谱，无需预处理。
多相信道化运算符（Polyphase Channelizer Operator）：
- 该运算符用于将输入信号分离为一组信道，通常用于将高采样率的宽带信号转换为多个低采样率的窄带信号。

其他改进

MatX 0.6.0 版本还包含许多其他改进，详细内容可参考官方发布说明。

总结来说，MatX 通过高级语法和运算符融合等技术，显著提升了数值计算的性能，同时提供了更多灵活且高效的运算符，适用于信号处理等复杂计算任务。