丰言的博客

竹杖芒鞋轻胜马,谁怕?一蓑烟雨任平生。

转载自
https://www.zhihu.com/people/openmmlab
https://mmdeploy.readthedocs.io/zh_CN/latest/tutorial/06_introduction_to_tensorrt.html

介绍以下内容:

  • 部署流水线 PyTorch - ONNX - ONNX Runtime/TensorRT 的示例及常见部署问题的解决方法
  • PyTorch 模型转换到 ONNX 模型的方法
  • 中间表示 ONNX 的定义标准
  • 推理引擎 ONNX Runtime、TensorRT 的使用方法
阅读全文 »

传统Transformer的Self Attention架构会带来\(O(n^2)\)的复杂度,总结一下对Self Attention结构进行优化的工作。

阅读全文 »