随着人工智能技术的飞速发展,金融行业正迎来数字化转型的关键变革期。作为全球领先的数字银行之一,Nubank凭借其敏锐的技术洞察力,积极将基础模型整合进其人工智能平台,尝试通过大规模序列模型提升决策效率与客户体验。这一创新举措不仅展示了金融科技的巨大潜力,更标志着银行业迈向AI优先时代的重要一步。 Nubank于2024年7月成功收购人工智能初创企业Hyperplane,这一战略举措旨在快速且高效地将具备前沿技术的小团队整合进庞大的数字银行体系。Hyperplane拥有针对金融用户行为理解的基础模型开发专长,而Nubank则拥有多年应对金融行业技术落地挑战的丰富经验。双方的结合,加速了Nubank由传统银行向AI驱动银行的转型进程。
基础模型在该项目中的引入,充分体现了Nubank对提高预测能力与模型泛化性的追求。传统上,金融机构普遍依赖线性模型、梯度提升树和基于聚合特征的表格模型完成风险控制与客户行为分析等关键任务。尽管这些方法成熟稳定,但面临多样化客户行为和数据复杂性的现实,其提升空间日趋有限。通过引入大型的基于Transformer架构的基础模型,Nubank不仅能够更深入地挖掘客户交易序列中的潜在行为信号,还可构建更具适应性的预测系统。 项目设计阶段,Nubank坚持不破坏现有成熟体系的原则,依托其在数据基础设施、模型治理和部署方面的经验,构建与传统AI平台相兼容且具有拓展性的基础模型模块。这种稳健的设计思想确保了新旧技术的平滑过渡,降低了生产环境风险。
此外,团队重点关注了序列数据预处理、GPU及异构计算集群的扩展,以及复杂深度神经网络模型的训练部署。 序列数据预处理成为整个体系中的关键环节。金融交易数据因其时序性与非结构化特点,远比传统表格数据复杂且难以精准解读。为此,Nubank新开发了一套变换、验证、监控序列数据的高效工作流,确保数据质量和准确性,防止信息泄露。这不仅为模型提供了坚实的数据支撑,也符合行业内对于金融数据合规和安全的严格要求。 技术架构层面,Nubank构建了一套能够支持多样化模型训练和推理需求的异构集群体系。
通过引入Ray框架,实现了跨数百台GPU服务器的统一管理与调度。这套架构支持千亿级别的训练样本和万亿令牌规模的模型输入,保障了训练效率与成本的平衡。该体系还涵盖模型的生命周期管理,包括版本控制、质量报告、性能监测与自动化部署,大幅提升了研发效率和产品上线速度。 为了推动基础模型的持续进步,Nubank成立了专门的AI研究团队,聚焦于用户行为建模与因果推理。这些研究不仅借鉴了大科技公司的先进成果,如生成式推荐系统,也根据金融行业特点量身定制。研究团队致力于挖掘传统聚合特征无法捕捉的行为信号,推动AI技术与金融业务深度融合。
在基础设施建设之外,Nubank还开发了丰富的内部工具以支撑大规模团队协作。其中,模型目录系统允许工程师和研究员查看所有训练模型的详细信息并进行对比,模型视图则提供了一站式监控模型输入输出及训练参数的能力,报告工具支持快速生成可视化分析,方便评估效果与识别问题。这样的工具链极大地促进了跨团队高效协同与敏捷迭代。 项目启动以来的头八个月,Nubank在数据接入、模型训练和业务上线三个方面均取得显著成果。首先,团队成功接入并生产化了多种交易序列数据源,数据质量控制机制保证模型应用的可靠性。未来计划继续拓展至应用事件和产品使用信号,丰富模型信息维度。
训练方面,通过持续调整模型结构与规模,平均模型AUC指标提升达1.2%,这一增幅在金融模型领域堪称突破。最为关键的是,多个基于基础模型的挑战者模型已成功部署到核心业务决策引擎,实现实际效益。 Nubank的这一实践表明,基础模型不仅能在技术层面带来前所未有的数据洞察力和预测精度,更在业务层面推动了银行服务的智能化与个性化。面对多国、多文化、多样化客户需求,基础模型通过大规模学习丰富的客户行为序列,帮助银行设计更加灵活贴心的产品与风险控制策略,提升客户满意度的同时降低金融风险。 未来,Nubank计划继续深化基础模型研究,持续引入更多异构数据源,加强模型可解释性与因果推断能力,并将基础模型应用扩展到更多关键金融场景如信用评估、反欺诈和客户互动等。通过不断丰富和完善其AI平台,Nubank努力实现真正的AI优先银行愿景,推动金融科技创新走向成熟与普及。
总体来看,Nubank的实践为传统金融机构提供了宝贵范例,展示了如何结合金融行业独特优势,科学地设计与部署基础模型,实现技术与业务的深度融合。在数字经济时代,金融机构唯有积极拥抱AI革命,才能在激烈的市场竞争中保持领先地位,为全球客户带来更加智能和高效的金融服务体验。通过持续探索与实践,基础模型有望成为未来银行智能化转型的核心引擎,引领行业迈向崭新的未来。