近年来,人工智能尤其是大型语言模型的研发正成为全球科技竞争的焦点,华为作为中国科技巨头之一,其自主研发的盘古大模型备受关注。然而,一名自称为华为诺亚方舟实验室盘古大模型团队成员的内部爆料者,在公开渠道上揭开了盘古模型研发过程中的重重隐秘,指控其涉嫌套壳抄袭国内其他领先模型,尤其是由阿里巴巴千问团队和DeepSeek团队开发的先进AI模型。这一事件不仅颠覆了外界对盘古品牌的认知,也暴露了华为内部团队管理、技术积累和创新环境的诸多问题。爆料者详细叙述了盘古模型研发的艰难历程,从早期算力受限、模型训练细节,到团队成员离职潮,乃至高层内部对问题的知情与忽视,反映出一个在压力与管理束缚下求生存的项目现状。 据爆料内容,华为盘古大模型最初的研发是在昇腾芯片上进行,经过多轮模型结构、词表和训练策略的调整,但效果始终落后于市场领先的竞争对手。尤其是在tokenizer的选择和优化方面,团队经历了尝试失败与漫长的低效率阶段,这直接影响了模型的计算效率和性能表现。
内部研究人员一致认为,团队的创新能力受限于繁琐的流程管理和资源分配不均,导致技术积累缓慢甚至停滞。同时,爆料者对小模型实验室的做法提出强烈质疑,认为该部门利用套壳和续训的策略快速蹭热度,甚至将竞品模型参数简单迁移改造后作为自家成果推出,这种行为严重损害了研发团队的士气和华为盘古的品牌信誉。 更为引人关注的是,爆料者披露了所谓135B V2版本的盘古模型,指责其实际上是通过续训阿里千问Qwen 1.5型号110B模型而来,仅仅对模型层数、参数维度进行调整,名称和参数地址甚至直接沿用了Qwen模型的代码结构,显示其技术根基并非独立研发。这种行径被爆料者视作“业务造假”,并指出该模型还被广泛提供给下游客户使用,致使若干业务可能基于不真实技术成果运行。随后,小模型实验室又在训练718B moe超大模型时,涉嫌套壳DeepSeek v3模型,通过冻结原有模型参数进行续训,以此追赶并超越四纵团队自主从头训练的模型,引发了内部对于技术诚信的极大担忧。 在团队层面,爆料材料详细描绘了华为四纵团队与小模型实验室之间因资源分配和技术路线选择产生的矛盾与分裂。
四纵团队坚持自主创新,从头训练大型模型,艰苦攻关,不断克服算力和数据瓶颈,力求打造业内领先的国产模型。而小模型实验室则依赖套壳竞品的方式快速迭代,绕过繁琐流程,最终在内部获得荣誉与奖励。此种“只许州官放火不许百姓点灯”的管理现象愈发激化了士气低迷和人才流失,数十位核心技术人员陆续离职加盟字节、腾讯、DeepSeek等竞争对手企业,令华为面临技术人才储备的断档风险。 除此之外,爆料者还强调了华为内部程序繁杂、流程管理僵化的问题。相比之下,套壳模型的研发团队几乎无需严格遵守版本管理、模型血缘追溯等规范,这种“特权式”的操作模式形成鲜明对比,削弱了团队的公平性和透明度。由此引发的技术腐败和内部不满情绪,成为阻碍华为盘古模型技术进步的隐形杀手。
爆料者特别痛心于自己和战友们多年的努力被轻易剥夺和抹杀,同时也坦露了对公司政治环境的无力感和对未来职业前景的迷茫。 虽然爆料充满控诉和情绪,但其中不乏对华为及国产算力生态的期待。爆料者表示,华为绝非没有人才,关键在于如何为技术人员营造良好的研发生态,减少无谓的政治干预和流程束缚,合理分配资源和激励,实现技术真正的突破与领先。他呼吁华为吸取教训,打造世界一流的AI生态与研发环境,真正实现以创新驱动国产AI高质量发展。 此次事件引发外界对于中国AI产业发展轨迹与企业内部治理的广泛关注。作为国内AI大模型领域标志性企业,华为盘古项目饱受期待,其面临的技术难题不仅是产业发展瓶颈,也是管理模式和人才生态建设的试金石。
如何保障研发透明度、严守知识产权与学术规范,杜绝套壳续训等违规行为,构建公平竞争与创新激励的机制,将是华为乃至整个行业迈向世界一流的关键所在。 整体来看,华为盘古大模型的爆料事件,是一种对当前国内AI产业和企业研发文化的深刻反思。技术研发需要诚信和投入,更需环境的支撑与激励。未来,随着国内AI企业逐渐壮大,建立科学规范的管理机制与人才激励机制,将有助于推动中国AI技术走向全球领先,打造真正属于自主知识产权的世界级大模型体系。此次爆料虽然刺痛,但也或许成为催化华为乃至国产AI产业自我革新的契机。