Untether AI的故事既是一个关于技术创新的历程,也是一个关于市场判断失误的典型案例。创立于2018年,Untether AI的初衷是通过设计高性能低功耗的AI推理芯片,实现人工智能从数据中心向网络边缘的延伸,从而降低延迟提高系统的鲁棒性。与当时专注于极低功耗传感器或高性能大功率数据中心芯片的竞争者不同,Untether AI选择了在网络边缘分布式服务器中布局其AI芯片,试图开辟一个相对细分的市场。 他们的首款芯片runAI表现坚实,拥有每个加速卡达到2 PetaOps的算力以及8 TOPs/W的能效水平。这在2019年前后算是一项相当亮眼的成绩,解决了特定神经网络的推理任务并具有一定的商业潜力。随着第二代芯片speedAI的发布,功耗表现进一步优化至30 TOPs/W,科技含量进一步提升,然而风云突变的AI生态导致了这款芯片的发展陷入瓶颈。
Untether AI的困境源自于未能赶上生成式AI及大型语言模型(LLM)爆发的历史节点。2022年,速度更快且更加节能的speedAI问世,但就在它发布不久后,ChatGPT以及Stable Diffusion等生成式AI产品的爆发彻底改变了行业关注的焦点。市场的重心迅速转向对大规模模型进行加速,尤其是大语言模型的推理加速需求节节攀升。 Untether AI的技术路径并未朝着这种趋势倾斜。其芯片缺乏高带宽内存(HBM)、芯片间高效连接以及大容量的内存体系架构,而这些恰恰是支撑LLM推理时必不可少的条件。尽管其芯片在矩阵乘法的基础计算能力上表现出色,但无法满足变换器模型对内存访问速度及规模的高需求,导致在LLM市场无法与竞争对手抗衡。
无论是在算力规模还是内存层级设计上,Untether AI的芯片架构都未能实现足够的灵活性以适应日益多样化的AI计算需求。对此,Untether AI选择聚焦视觉推理领域,与汽车厂商通用汽车合作,从事自动驾驶辅助系统的研发,锁定智能城市、监控、机器人及农业等细分市场。然而,这些细分市场的规模远远赶不上LLM产业的爆发速度,且多处于生态尚未成熟、商业模式不够明朗的初期阶段,难以给予芯片公司可观的收入支撑。 随着市场主体纷纷将资源投入到能够驱动大规模生成模型和大语言模型的硬件平台打造,Untether AI的纯视觉推理芯片日渐边缘化。在MLPerf(机器学习性能基准测试)的2024年成绩发布中,Untether AI依旧聚焦于2015年大热的ResNet-50模型进行推理性能展示,显然已经跟不上行业的主流节奏。与此同时,其竞争对手们在数十亿乃至千亿级参数的LLM模型推理性能上持续实现突破和优化,显示出强大的市场吸引力和技术壁垒。
Untether AI最终被AMD收购,其团队被吸纳至后者,但核心产品线未能继续发展。外界普遍认为,这是因为Untether AI未能及时窥见并顺应AI行业发生的巨大转型。其过于专注于“边缘视觉推理芯片”的战略选择,尽管在技术上有一定深度,但忽视了生成式AI和大型语言模型对算力的巨大吸引力。 连同Untether AI,许多AI芯片创业公司均遭遇了类似的发展困境。它们初期专注的技术路线未能灵活调整以应对动态变化的AI市场需求,导致技术与市场之间出现了巨大断层。这提醒整个行业,技术创新须与市场动态紧密结合,尤其是在AI这样飞速发展的领域,只有前瞻性布局与充裕弹性设计才能帮助芯片公司立足于持续演进的生态系统。
拥有一支业界公认的高水平工程团队是Untether AI的宝贵资产,也是其被AMD青睐的关键原因。团队成员在芯片设计、系统架构及软件优化各环节展现了强大能力。收购后的整合为AMD增强了其AI推理能力布局,但Untether AI独立存在的失败仍给创业者敲响警钟:专注细分市场的战略风险不可低估,而及时捕捉下一代AI计算范式的风向比单纯技术追求更为重要。 未来的AI芯片产业将更加看重通用性和灵活性。大型语言模型仍是短期内主流AI应用的核心,边缘计算依然有其独特价值,但如何在这两者之间规划产品路线,将决定芯片公司的存亡。过于片面地聚焦某个技术细分领域而忽视整体趋势,必然导致资源浪费与市场边缘化。
此外,AI芯片设计也面临存储、互连及计算架构的深度协同挑战。Untether AI未能充分强化高带宽存储及跨芯片高速互联技术,影响了其产品对大模型的适配能力。行业观察者称,未来芯片的成功与否,将更多取决于是否能构建完善的生态体系,包括软件栈优化、硬件资源调配及功能模块扩展,这远超传统芯片算力的单一竞争。 Untether AI 的教训提供给整个AI硬件产业的重要启示是,技术创新必须与应用需求形态同步更新。尤其是在生成式AI与大模型日益主导的当下,保持敏锐的市场洞察、快速实施战略调整、提升产品灵活性已经成为芯片创业公司的生死关键。 尽管Untether AI未能成为行业的胜者,但其对未来芯片设计理念的探索及团队的专业积累仍值得肯定。
AMD接手相关人才有望将其技术优势融入更大平台,继续推动AI硬件发展。由此看来,创业公司与大型企业之间,或许更适合形成技术与资源互补的生态协作,而不仅是简单的市场竞争。 总体而言,Untether AI失败的根本原因是未能适应AI行业的快速进化和市场需求的剧烈转变。其专注边缘视觉推理的芯片技术固然先进,却缺乏对生成式AI和大型语言模型加速需求的有效支持。伴随行业集中度提升和技术门槛增加,未来AI芯片的成功将建立在对多样化应用弹性支持、灵活架构设计及生态系统构建上的综合实力。此案例为更多创业公司敲响警钟,唯有深刻洞察技术趋势,顺势而为,方能在变幻莫测的AI时代立稳脚跟。
。