文章标签

嵌入式AI老司机

边缘设备部署Transformer模型：除了减写Flash，还有哪些框架层内存优化技巧？

作为一名长期在嵌入式AI领域摸爬滚打的工程师，我深知在边缘设备上跑大模型（比如Transformer）的痛苦——内存就那么点，动不动就OOM。用户提到了Flash写入优化，这确实是基础，但内存占用才是更棘手的瓶颈。除了量化、剪枝这些“老生...

2026/1/23 0 256 0 0 0 边缘计算内存优化