近年来,人工智能技术的快速崛起极大地改变了企业的数据生态,尤其是生成式人工智能(Gen AI)的广泛应用,促使各类机构必须处理海量复杂的AI数据。根据Komprise最新的《AI、数据与企业风险》研究显示,约有80%的组织曾因员工使用生成式AI而遭遇数据泄露问题,甚至虚假或不准确的结果也频繁出现,给企业运营带来了极大风险。由此可见,AI数据的安全存储与有效管理已成为企业亟需解决的核心课题。企业在面对数据挑战时,既要筑牢基础设施,也要完善数据管理体系,而这两者的紧密结合是实现AI赋能商业价值的前提。基础设施建设方面,超过三分之二的受访企业将其视为支持AI项目的首要任务,其中9%甚至将基础设施列为仅次于网络安全的关键优先事项。随着AI模型对计算资源,尤其是GPU存储需求的增加,许多企业在存储容量扩展和性能优化方面投入大量资源。
有超过三分之一的受访者将扩容存储作为AI领域的第一大投资,约有31%关注为GPU配备高性能存储。值得注意的是,近半数企业表示这三种策略都同时是优先考虑的方向。除了硬件层面的投资,数据管理的复杂性同样令人头疼。55%的企业反馈在寻找及迁移合适的非结构化数据时遇到困难。透明的数据可视化和便捷的数据分类、分段方式严重缺失,进一步影响了整体数据治理的顺畅性和智能化水平。内部分歧也成为管理难题的体现,有约三分之一的受访者坦言,企业对AI数据管理和治理路径的认知存在明显分歧,导致策略难以统一,进而影响执行效果。
Komprise联合创始人Krishna Subramanian指出,随着企业逐渐意识到数据泄露可能导致机密信息无意泄露给公共大型语言模型(LLM),对强有力的AI治理和合规工具的需求正迅速增长。为规避风险,越来越多企业开始部署基于敏感数据分类和自动化流程的技术手段。据调研显示,73%的企业已采用数据分类与自动化工作流程,防止敏感数据被不当使用,其次超过一半的企业加强了内部政策制定与员工培训,确保数据处理符合合规规范。防范措施还包括限制公用生成式AI工具的访问,鼓励使用企业自建的AI平台,最大限度保证数据主权和安全。对企业来说,实现数据的清晰可视和科学分类是管理的关键环节。Subramanian强调,当前多数公司不会大规模训练自有模型,而是借助预训练模型,通过提供优质的企业数据提升AI推理效果,因此聚焦正确的数据筛选和治理显得尤为重要。
存储布局的演进也反映了这一趋势,企业开始更多投资于适合协同GPU计算的高性能存储和自动化数据管理平台,以满足非结构化数据庞大的处理需求。数据编目、标签以及自动化数据流的建设,有助于将企业核心数据准确喂入AI系统,实现智能推断和决策。随着AI推理市场逐渐兴起,未来企业使用AI的重点将更偏向于结合自有数据实现商业价值最大化,而非绝对依赖模型训练。已训练完成且基于公共数据开发的大型模型使得数据预处理和筛选成为更重要的竞争优势。综上所述,企业在AI数据存储与管理方面既面临严峻挑战,也获得前所未有的技术机遇。有效的AI数据治理需要从基础设施扩展、存储性能提升,到数据可视化、分类自动化、多方利益协调的全方位合作。
组织文化中的认知统一以及数据安全合规政策的严格执行,是保障企业数智化转型稳定推进的基础。展望未来,AI数据管理将不断融合智能化工具与自动化流程,通过精准的数据策划与多层防护,帮助企业驱动业务创新,实现可持续数字竞争力。在全球AI竞争加剧与数据量指数级增长的大背景下,那些能够在数据存储和治理中抢占先机的企业,将更具市场优势和创新潜力。每一个致力于AI赋能的科技领导者,均需深入了解行业趋势,积极拥抱技术革新,并致力构建稳健安全的AI数据生态系统,从而保障企业走向智能未来的稳步迈进。