文章标签

嵌入式AI

物联网语音唤醒模型：不依赖硬件加速与后处理的算法级效率革命

在物联网（IoT）的世界里，特别是对于那些电池供电、计算资源极其有限的小型设备而言，实现高效且准确的语音唤醒（Voice Wake-up）功能，一直是个棘手的挑战。我们常常听到“模型量化”和“剪枝”这些优化手段，它们无疑效果显著。但若抛开...

2025/8/6 0 194 0 0 0 语音唤醒物联网AI 算法优化
嵌入式异构多核处理器上语音识别：实时推理与内存占用的深度优化策略

在当下这个万物互联的时代，语音识别技术已经不再是科幻电影里的情节，它正悄然渗透进我们生活的方方面面：智能音箱、车载系统、可穿戴设备……它们无不依赖于边缘侧强大的语音处理能力。然而，在嵌入式系统中实现高性能、低功耗的语音识别，尤其是在资源受...

2025/8/6 0 224 0 0 0 嵌入式AI 语音识别异构计算
在无FPU的Cortex-M0/M3 MCU上实现注意力机制浮点运算定点化的具体步骤与精度控制方法

在Cortex-M0/M3这类无硬件浮点单元（FPU）的MCU上运行注意力机制，将浮点运算完全转换为定点数（Q格式）运算是实现边缘AI推理的关键。以下为具体实现步骤和精度控制方法： 1. 定点数格式选择与量化策略 Q格式...

2026/1/23 0 147 0 0 0 定点数运算边缘AI优化 MCU浮点处理
边缘AI设备Flash寿命与实时性平衡：软件优化实践

在高性能嵌入式AI推理边缘设备中，我们常常面临一个两难的局面：AI模型参数的频繁更新（比如在线学习、A/B测试、个性化模型部署）和实时数据的快速记录（如传感器数据、推理结果、设备状态日志），都对作为主要非易失性存储介质的Flash内存提出...

2026/1/22 0 145 0 0 0 边缘AI 嵌入式系统 Flash优化
在Cortex-M这类MCU上部署Transformer：如何从模型结构入手做极致裁剪并平衡精度？

在Cortex-M这类资源极度受限的MCU上部署Transformer，框架优化（如使用CMSIS-NN或专用推理引擎）固然重要，但模型结构本身的极致裁剪往往是决定性因素。这不仅仅是“减小模型”，而是在精度、延迟、内存（RAM/Fla...

2026/1/23 0 185 0 0 0 嵌入式AI MCU部署
在资源受限的Cortex-M上部署Transformer：如何选择合适的注意力机制？

在Cortex-M系列MCU上部署Transformer模型，尤其是像BERT、GPT这样的大模型，是一个极具挑战性的工程问题。Cortex-M核心通常缺乏浮点运算单元（FPU），缓存有限（通常几十KB到几百KB），内存（RAM）更是捉襟...

2026/1/23 0 119 0 0 0 嵌入式AI 注意力机制
未来十年：RISC-V如何携手DSP与MCU，重塑嵌入式AI的异构计算版图

说起来，嵌入式AI这股浪潮，真是把我们这些搞硬件、搞系统的人推到了一个前所未有的十字路口。传统的MCU和DSP，虽然在各自领域里耕耘多年，性能和能效比也迭代了好几代，但在面对现在、尤其是未来十年嵌入式AI那些“变态”级的实时性、功耗和模型...

2025/7/27 0 447 0 0 0 RISC-V 嵌入式AI 异构计算
Softmax定点化：Cortex-M上指数计算查表与多项式近似的性能抉择

在嵌入式AI推理，尤其是面向低功耗Cortex-M系列微控制器时，Softmax函数的定点化处理是一个常见而关键的优化环节。Softmax的核心在于 exp(x) 指数运算，而浮点指数计算在资源受限的MCU上通常是性能瓶颈。本文将深入对比...

2026/1/23 0 195 0 0 0 Softmax定点化 Cortex-M优化指数函数近似
边缘设备部署Transformer模型：除了减写Flash，还有哪些框架层内存优化技巧？

作为一名长期在嵌入式AI领域摸爬滚打的工程师，我深知在边缘设备上跑大模型（比如Transformer）的痛苦——内存就那么点，动不动就OOM。用户提到了Flash写入优化，这确实是基础，但内存占用才是更棘手的瓶颈。除了量化、剪枝这些“老生...

2026/1/23 0 202 0 0 0 边缘计算内存优化

文章标签

嵌入式AI

物联网语音唤醒模型：不依赖硬件加速与后处理的算法级效率革命

嵌入式异构多核处理器上语音识别：实时推理与内存占用的深度优化策略

在无FPU的Cortex-M0/M3 MCU上实现注意力机制浮点运算定点化的具体步骤与精度控制方法

边缘AI设备Flash寿命与实时性平衡：软件优化实践

在Cortex-M这类MCU上部署Transformer：如何从模型结构入手做极致裁剪并平衡精度？

在资源受限的Cortex-M上部署Transformer：如何选择合适的注意力机制？

未来十年：RISC-V如何携手DSP与MCU，重塑嵌入式AI的异构计算版图

Softmax定点化：Cortex-M上指数计算查表与多项式近似的性能抉择

边缘设备部署Transformer模型：除了减写Flash，还有哪些框架层内存优化技巧？