类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

2025年10月02号 05点18分07秒

微控制器上的人工智能运作揭秘：操作符与内核解析

比特币加密货币的机构采用

钱财 qian.cx

How AI on Microcontrollers Works: Operators and Kernels

深入探讨微控制器上的人工智能实现机制，聚焦操作符与内核的工作原理与优化策略，剖析硬件资源受限环境下的推理性能提升路径，助力开发者抓住边缘AI时代机遇。

随着边缘计算和物联网技术的飞速发展，越来越多的人工智能推理任务开始在资源极其有限的微控制器上运行。所谓的边缘人工智能，其核心特点在于计算、内存和网络带宽的显著受限，而微控制器恰恰代表了这类极端受限硬件的典型范例。因此，理解微控制器上人工智能的具体工作机制，尤其是操作符（Operator）和内核（Kernel）如何协同完成推理任务，变得至关重要。本文将深入剖析这一过程，从模型权重的存在价值，到操作符定义及内核实现，再到硬件加速的多样化策略，全面呈现微控制器AI推理的真实面貌。微控制器执行人工智能推理的第一步是加载和解析模型数据。以Tensorflow Lite Micro（以下简称tflite-micro）为主流推理运行时，其使用.tflite模型文件，该文件通过FlatBuffers格式封装。

与其他模型格式不同，tflite文件不仅存储模型参数（权重），还包括完整的计算图信息，也就是说模型中的每一步运算都由操作符定义，运行时通过读取计算图，逐步调用对应内核完成计算。操作符在这里相当于编程语言中的指令集，不同操作符代表矩阵乘法、加法、卷积等基本运算；内核则负责具体实现这些操作符的计算功能。鉴于微控制器的资源受限，tflite-micro接口提供的操作符集相较于完整Tensorflow Lite大为精简。操作符的通用性与高效性成为关键考量点，因为每个操作符都必须能在尽可能有限的存储空间和计算周期内高效运行。以加法操作符（AddOp）为例，它既支持浮点数运算，也支持量化后的整数运算，其中量化版本可大幅降低存储和计算成本，体现出微控制器上人工智能推理不得不采用的优化策略。具体来看，AddOp根据输出数据的类型不同，调用不同的内核函数。

例如在处理有符号8位整数（kTfLiteInt8）时，内核EvalAddQuantized会执行带量化参数的加法运算。量化过程包括输入数据的偏移调整、多倍数与移位操作，保证整数计算后结果仍符合浮点数等价的计算精度范围。更复杂的情况如广播（broadcasting）机制，允许不同形状的张量进行兼容运算，内核会采用慢速的广播版本函数来逐元素完成加法。这种内核实现形式是最基础且硬件无关的，任何微控制器都能运行，但效率相对较低。为提升推理效率，微控制器厂商和开发者积极借助硬件扩展指令集，在内核实现中引入专门的加速函数。例如，ARM Cortex-M系列微控制器普遍支持DSP（数字信号处理）扩展以及新型的MVE（向量扩展，也称为Helium）指令集，这些特性能够大幅度并行处理矢量数据。

CMSIS-NN库充分利用这些扩展，提供了可选的内核实现，包括纯C实现、DSP指令优化实现与MVE指令优化实现。Tensorflow Lite Micro通过内核“移植”，集成CMSIS-NN的高效算子版本，使得相同的模型代码在支持这些扩展的芯片上运行速度提升数倍。具体到加法操作，启用CMSIS-NN的EvalAddQuantizedInt8函数将调用arm_elementwise_add_s8接口。在带有MVE指令支持的硬件环境下，代码通过SIMD向量操作批量处理四个元素，利用向量加载、加法和重新量化等指令极大地减少循环次数和执行时间。而在仅有DSP扩展的环境，则通过打包偏移量及数据，使用特殊16位加法指令一次处理多个元素，兼顾效率与兼容性。底层代码根据编译宏自动选择最优路径，实现无需人工干预的性能提升。

除了利用核心指令集扩展优化，部分高端微控制器更搭载专用的神经网络处理单元（NPU），例如ARM的Ethos-U系列。通过专用NPU，整个推理任务中部分或全部操作能够完全放弃通用CPU执行，而由专用硬件单元完成，带来更高的速度和能耗效率。在Tensorflow Lite生态中，针对Ethos-U NPU的模型会经过Vela编译器转换。该编译器将模型中的多个基本操作连锁替换为单个自定义ETHOSU算子，包含紧凑化的命令流和硬件加速器访问地址。推理时，微控制器CPU仅需调用专用内核函数，通知NPU执行推理，极大减轻CPU负担。尽管专用NPU提供强大性能优势，但其使用也带来兼容性挑战。

转为Ethos-U自定义算子后的模型无法在无此硬件支持的微控制器上运行，限制了模型移植的灵活性。相比之下，基于CMSIS-NN或纯C实现的内核，则兼顾通用性和性能，在设备生态多样的嵌入式领域显得更为实际和重要。微控制器上的人工智能推理正处于从软件逐步适配硬件加速的关键阶段。操作符和内核的设计不仅决定了推理的功能完整性，也直接左右性能天花板。在模型转换、运行时加载与执行流程中，合理利用硬件特性和自主优化内核模块是提升推理效率、减少功耗和降低延迟的核心手段。随着芯片架构的发展及边缘AI应用的丰富，开发者需要掌握操作符的结构、内核实现细节与硬件加速选项，方能设计出适合目标设备且高效的AI解决方案。

未来，随着更多硬件扩展指令和加速器的出现，推理框架将继续演进，支持更广泛的操作符和优化路径。例如，更多类型的量化技术、多核并行计算调度、异构计算资源协同使用，都有望进一步提升微控制器AI的表现和适用性。同时，推理编译器的智能优化能力也将越来越关键，自动识别硬件特性并生成匹配内核，简化开发流程。开发者应持续关注Tensorflow Lite Micro和相关生态的发展动态，紧随技术趋势，确保所构建的AI应用能够在边缘设备上实现理想的性能和功耗平衡。总的来说，微控制器上的AI推理是一个融合软硬件技术的系统工程。从模型到运营时环境的执行，操作符定义和内核实现环环相扣。

权重和计算图定义了模型结构，操作符充当了计算指令，而内核则是执行这些指令的具体算法和代码。通过引入架构扩展和加速库，实现了性能的质的提升。未来，随着边缘智能需求的增长，微控制器中AI的能力将日益成为智能设备的基础，带来更多创新和可能。

下一步

What's it like to work with an AI team of virtual scientists?

2025年10月02号 05点21分32秒与虚拟科学家AI团队共事的独特体验揭秘

探索虚拟科学家团队如何改变科研方式，提升创新效率和推动科学进步，以及研究人员在合作过程中的切身体会和挑战。

German children's program "Sendung mit der Maus" explaining AI and LLMs

2025年10月02号 05点22分33秒德国儿童节目《与老鼠一起学》揭秘人工智能与大型语言模型的奥秘

探索德国知名儿童节目《与老鼠一起学》如何以生动有趣的方式，向孩子们介绍人工智能（AI）及大型语言模型（LLM），帮助青少年理解科技发展的前沿知识，同时揭示人工智能背后的机制与实际应用。

2025年10月02号 05点23分59秒婴儿语音对语言起源的重要影响揭秘

探索人类特有的婴儿语音交流方式如何在语言进化过程中发挥关键作用，揭示语言起源的独特视角，助力理解人类沟通能力的形成机制。

Opendia – just use Dia on Chrome / arc, dont switch browsers

2025年10月02号 05点25分02秒 OpenDia：在Chrome与Arc浏览器中无缝连接AI模型的卓越工具

OpenDia是一款革命性的浏览器扩展工具，让用户无需切换浏览器即可通过Chrome、Arc及其他Chromium浏览器，实现与多款AI模型的无缝连接和自动化操作，极大提升工作效率与数字生活体验。

Stop Killing Games Initiative Marks 721K Signatures Ahead of 31st July Deadline

2025年10月02号 05点26分39秒停止消亡游戏运动掀起狂潮：72.1万签名冲刺7月底截止

停止消亡游戏运动正迅速聚集超过72万签名，呼吁游戏发行商确保游戏在官方支持终止后依然能正常运行，为玩家保留宝贵的数字游戏体验，尤其在欧洲引发广泛关注和参与。

NY man nearly lost Lamborghini, $200K in exotic car dealer’s ‘upgrade’ scheme — then helped catch the scammer

2025年10月02号 05点28分11秒纽约男子险丢兰博基尼与20万美元，揭秘豪车经销商升级骗局及抓捕过程

一起涉及兰博基尼的豪车升级骗局在纽约曝光，车主不仅差点失去珍贵车辆，还背负巨额债务。通过车主的努力和FBI介入，骗子终被捉拿归案，相关事件引发购车安全和诈骗防范的广泛关注。文章深入剖析事件始末，揭示豪车市场潜在风险及防范建议。

Paramount Agrees to Pay $16M to Settle Lawsuit by Trump

2025年10月02号 05点28分57秒派拉蒙同意支付1600万美元解决特朗普诉讼，影响影视行业格局

派拉蒙影业同意支付1600万美元以解决由特朗普提起的诉讼，引发影视行业关注。此次和解不仅体现了娱乐业法律纠纷的复杂性，也对未来影视版权和名誉权保护产生深远影响，成为业内热点话题。