类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

跟着我们

2025年10月01号 01点55分30秒

人工智能领域的真相：没有全新创意，只有全新数据集的力量

行业领袖访谈

钱财 qian.cx

There Are No New Ideas in AI Only New Datasets

深入探讨人工智能发展的核心动力为何不来自全新的理论创新，而是依赖于新型和更大规模的数据集，剖析数据驱动人工智能进步的本质及未来趋势。

在过去的十五年中，人工智能领域取得了令人瞩目的进步，尤其是在最近五年，这些进展几乎改变了我们与技术互动的方式。无论是智能助手、自动驾驶汽车，还是生成式语言模型的兴起，我们都感受到了技术飞跃带来的深刻影响。尽管看似不断涌现出众多创新和突破，但一场有趣的讨论正在人工智能社区中流传：真正推动AI飞速发展的，并非所谓的“全新想法”，而是对新数据集的发掘与利用。理解这一观点，首先要回顾AI发展的几个关键阶段。人工智能的突破，往往并非凭空出现的革命性理念，而是建立在以前已有的理论基础上，并结合了规模空前的大规模数据集。例如，2012年的AlexNet深度神经网络技术极大推动了计算机视觉的发展，而这场变革的核心驱动力量是大型标注数据集ImageNet的广泛应用。

随后，2017年谷歌提出的Transformer架构彻底改写了自然语言处理的技术路线，这一突破使得训练模型可以利用互联网上几乎所有的文本资源，形成了规模巨大的语言数据集资源库。紧接着，以人为反馈强化学习（RLHF）的引入，使得模型能够吸收人类评价，并优化生成结果的质量，从而形成一个独特的人类标注与交互数据源。最新阶段的“推理能力”提升，则依赖于诸如计算器、编译器这类自动验证工具的数据，这类数据帮助模型在逻辑和数学能力上实现质的飞跃。对比这几个发展阶段，从深度神经网络到大规模语言模型，再到精细的人类反馈和工具辅助推理，我们会发现每个阶段的根本推动力均是新型数据源的利用，而非全新机器学习理论本身。事实上，多数支撑这些突破的算法理念，如监督学习和强化学习，早在上世纪便已被提出，只是此前缺乏足够庞大且有组织的训练数据进行验证和应用。这一现象引发了一个极具启发性的问题：如果理论方法已存在多年，那么未来的突破将从何而来？答案很可能在于寻找和开发新的数据来源。

人工智能领域的“新创意”，或许更准确的说法，应围绕如何从全新、质量更高、形式更丰富的数据当中汲取智慧。例如，视频作为一个多维度的、动态的媒体形式，蕴藏着巨大的潜在价值。YouTube等平台每日记录的海量视频数据远超文本数据，这不仅包括语言内容，更包含肢体动作、环境信息、甚至文化背景。人工智能模型如果能够有效理解和应用这类数据，可能让机器学习跨入一个全新的境界。当然，仅仅拥有数据并不足以产生飞跃性的进展。合理、创新的训练方法、算法优化和硬件提升依然是重要的补充因素。

比如，近年在模型训练过程中引入的高效内存利用技术FlashAttention，推理速度优化的投机解码(speculative decoding)，以及更优的优化算法Muon等，都极大推动了训练和推理的效率，降低了成本，让数据的价值最大化成为可能。但是，这些技术改进更多是在精细打磨“如何更好地利用已有数据”，而非开辟全新的算法路径。数据的重要性还体现在研究者对于实验数据的上限意识上。即使是架构方面的创新，如由部分团队开发的状态空间模型（SSM），与Transformer在同等数据支持下的表现相当，也显示了一个重要事实：任何模型架构的优势，都受到其训练数据集实际承载信息量的极限制约。换句话说，只要数据集固定，模型改进的空间有限，唯有扩充数据多样性和规模，才可能打破现有瓶颈。从哲学角度审视这个问题，也映射了《痛苦的一课》（The Bitter Lesson）这一人工智能发展理念的精髓，即“计算机更喜欢从大量数据中自动学习，而非依赖人类手工设计的规则和技巧”。

这提示科研人员，过度追求“新算法、新模型”的同时，更需聚焦如何有效利用新数据资源，以及通过创新的数据采集、标注和生成手段，获取前所未有的训练素材。围绕未来发展的推测，视频数据显然是当前研究者和企业瞩目的焦点领域。大规模视频学习不仅需要海量的计算资源，更需要模型具备理解时间动态和空间语义的能力，这将激发全新理论与实践的结合。而且，视频结合语言、视觉、声音等多模态信息，为AI提供了更为丰富的学习语境，促进其向类人理解迈进。此外，机器人等物理交互设备采集的传感器数据也被认为是潜在的宝库，这些数据带有真实环境下的反馈和效果，有助于建构可用于推理和决策的稳健模型。然而，未来突破不仅仅依赖于数据的广度，更取决于科研生态的开放性与协作性。

如今全球有无数探索者和组织，共享研究成果、公开数据资源，在ArXiv和各大国际会议中激烈交流，形成了一个递进式的知识共同体。这种开放环境有利于将更多的创新理念迅速转化为实践，推动数据积累和模型训练方式不断迭代升级。最后，回顾人工智能发展史，我们得出启示：尽管技术创新不可或缺，但真正让AI不断跨越和成长的，是对新数据的发现与整合。未来的关键，是将海量多样、真实互动的丰富数据转化为“可学习”的形式，辅以持续的技术改良，才能引领AI进入新的里程碑。因此，希望科研人员和爱好者从当前对“新想法”的执念中抽身，将目光更多投向数据的多元开采和质量提升，共同推动人工智能迈向更加智慧的明天。

下一步

How ZachXBT traced a $31M Bitcoin donation to a flagged wallet

2025年10月01号 01点56分26秒揭秘ZachXBT如何追踪到3100万美元比特币捐赠背后的可疑钱包

深入解析匿名区块链调查员ZachXBT如何运用先进的工具和技术揭开一笔价值3100万美元比特币捐赠的真实来源，洞悉加密货币追踪背后的复杂过程及其对加密生态系统的深远影响。

HYPE Token Eyes $50 New ATH as Perps Trading Hits $1.571 Trillion Volume – Is This the Breakout?

2025年10月01号 01点58分01秒 HYPE代币瞄准50美元新高，永续合约交易量飙至1.571万亿美元，是否迎来爆发？

随着Hyperliquid在永续合约市场的卓越表现，HYPE代币正迈向全新的历史高点。本文深入解析其交易量激增背后的驱动力、技术指标及未来潜力，揭示这一热点Token的突破前景。

Fitch raises Boeing's outlook to stable as finances, production improve

2025年10月01号 01点59分43秒惠誉提升波音展望评级至稳定，财务及生产状况显著改善

惠誉国际评级机构近日将波音公司的信用展望从负面调整为稳定，肯定了其财务灵活性和生产能力的显著提升。作为全球领先的飞机制造商，波音在解决劳资纠纷并推动运营转型的背景下，展现出强劲的复苏势头，未来有望实现债务下降和持续现金流增长，为企业长期发展奠定坚实基础。

Stocks Open Higher, Aim to End First Half of 2025 With Record Close

2025年10月01号 02点06分38秒 2025年上半年股市收官在望创历史收盘新高指日可待

2025年上半年全球股市表现强劲，多项主要指数在多重利好因素推动下纷纷创出新高。本文深入分析了推动股市上涨的关键因素，探讨了经济政策、市场热点及未来走向，为投资者提供清晰的市场洞察和参考。

Stocks Haven’t Been This Expensive Since 2003. Earnings Need to Justify That

2025年10月01号 02点12分51秒股票价格高企至2003年以来最高水平，企业盈利需予以支撑

随着美国股市上涨至2003年以来的最高估值水平，投资者期待企业盈利能够支持当前的市场价格，探讨当前市场状况及未来走势的关键因素。

Oracle Stock Soars After New $30 Billion Cloud Deal

2025年10月01号 02点14分03秒甲骨文股价飙升，背后价值300亿美元云计算协议解析

随着甲骨文与新的300亿美元云计算协议签署，公司的市场表现和未来发展潜力备受关注。本文深入探讨了此次云协议的重要性、对甲骨文的影响以及云计算行业的发展趋势。

Google Signs Deal to Buy Fusion Energy From Future Virginia Plant

2025年10月01号 02点18分10秒谷歌与弗吉尼亚未来核聚变能源厂签署购电协议，助力绿色清洁能源新时代

谷歌与康姆韦尔斯富融合系统签订核聚变能源购电协议，计划从弗吉尼亚州未来的核聚变电厂采购至少200兆瓦电力，推动商业核聚变技术迈向规模化应用，有望彻底改变全球能源格局。