类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

请捐款 BTC

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全	区块链技术去中心化金融 (DeFi) 新闻山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

请捐款 BTC

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

请捐款 BTC

类别
NFT 和数字艺术元宇宙与虚拟现实加密交易所新闻加密初创公司与风险投资加密市场分析加密活动与会议	加密税务与合规加密货币的机构采用加密钱包与支付解决方案加密骗局与安全区块链技术去中心化金融 (DeFi) 新闻	山寨币更新投资策略与投资组合管理挖矿与质押比特币监管和法律更新稳定币与中央银行数字货币	行业领袖访谈首次代币发行 (ICO) 和代币销售

页面
主页关于条款	搜索

请捐款 BTC

2025年10月13号 21点55分01秒

深度解析SmolLM3：小体量多语种长上下文推理大型语言模型的革新之作

NFT 和数字艺术

钱财 qian.cx

SmolLM3作为一款开创性的小型多语种长上下文推理大型语言模型，凭借其卓越的性能和创新技法，引领了高效、智能语言模型的新潮流。本文深入剖析其设计理念、架构优化、训练策略与实际应用，为读者呈现一个全方位理解SmolLM3的视角。

随着人工智能领域的不断发展，语言模型的规模、性能以及应用场景需求日渐多样化，小体量模型因其高效灵活性越来越受到重视。SmolLM3作为一款出色的3B参数量级多语种长上下文推理大型语言模型，体现了这一趋势下的创新力量。它不仅在性能上超越同规模同类模型，更借助多项技术优化，赋予了长达128k上下文的推理能力，极大地丰富了语言理解和应用的广度与深度。SmolLM3的发布不仅仅是一个模型的面世，更是开源社区在高效多语种智能处理领域迈出的坚实步伐。SmolLM3基于变换器（Transformer）解码器架构，结合了多项先进技术，优化了算力消耗与推理效率。它采用分组查询注意力机制（Grouped Query Attention，GQA），通过将多头注意力划分为四组，有效地减少了键值缓存的规模，从而提升了推理阶段的存储效率同时保证性能。

相比传统多头注意力，GQA在保持模型表现的同时，实现了显著资源节省，成为SmolLM3架构亮点之一。在位置编码方面，SmolLM3引入了NoPE（No Positional Embeddings）策略，以《RoPE到NoRoPE及其迂回》的论文为技术基础，选择性地在每四层中去除旋转位置编码。此举有效增强了模型处理长序列时的稳定性与精度平衡，突破了纯旋转位置编码在长上下文推理中的限制，使模型能够既保持短文本表现，又显著提升长文本推理能力。针对训练过程中的块级文档遮蔽（Intra-Document Masking）机制，是SmolLM3确保长上下文训练稳定性和准确性的关键。通过训练阶段避开序列中不同文档间的相互干扰，模型在面对多文档长文本时，能够更专注于单文档关联语义，减少噪音影响，保证推理和理解的连贯性和准确性。SmolLM3训练过程分为三个主阶段，系统混合使用网页、数学和代码数据，历经11.2万亿标记的大规模训练数据沉淀。

第一阶段奠定模型基础，注重多样化网页语料，占比高达85%；代码与数学分别占据12%与3%。第二阶段调整数据比例，注入更多高质数学和代码数据，不断完善模型在推理和技术领域的表现。第三阶段进一步上采样数学与代码语料，强调推理能力的培养，特别加入了OpenMathReasoning等推理专用数据集，增强模型对复杂问题的逻辑判断能力。除了基础大规模预训练，SmolLM3还有专门的中期训练（Mid-training）环节，聚焦于长上下文扩展和推理能力提升。通过另外1000亿tokens的训练，模型从4k上下文顺利迁移至可处理64k上下文，再运用YaRN技术，在推断期间触达128k的上下文长度，为长文档处理和复杂对话提供了技术保障。此外，中期推理训练阶段，利用公开的推理数据集进行泛化推理能力的训练，使模型能够适应多样化、跨领域的推理任务，提升了模型的灵活性与智能推断能力。

SmolLM3另一个创新点是其双模式指令微调技术，允许用户灵活切换推理模式（/think）和非推理模式（/no_think），满足不同应用场景对推理深度和响应速度的需求。训练时通过合成数据增强推理轨迹，提高模型在多语种、多轮会话及代码和数学领域的实用性。为保障模型行为的对齐性和质量，SmolLM3采用Anchored Preference Optimization（APO）进行离策略模型对齐，提升生成内容的遵循度、准确性及人类偏好契合度。相较于传统的DPO，APO提供了更稳定的优化目标，使得模型在多轮任务中表现更加均衡。此外，针对推理训练对长上下文性能带来的影响，团队采用模型融合技术，结合推理细化阶段和长上下文中期训练的优势，成功恢复并强化了模型在长序列处理中的表现，使模型在保持推理强度的同时，不牺牲其文档理解能力。SmolLM3支持多语种应用，涵盖了英语、法语、西班牙语、德语、意大利语和葡萄牙语六种主要欧洲语言。

其多语种tokenizer基于LLaMA 3.2的设计，采用了高达128K词汇表，通过整合部分非英语语言特有的tokens，保证了跨语言文本的高效压缩率和信息表达能力，体现了其多语言环境下稳定高效的文本处理表现。模型评测覆盖了知识理解、常识推理、数学推算、代码生成等多项任务，在HellaSwag、ARC、BoolQ、GSM8K、HumanEval+等权威基准测试中均取得优异排名。尤其在数学推理和复杂推理任务中，相较同类3B模型展现出显著领先，同时于多语种任务中完成稳定表现，验证了其多领域全方位能力。实用层面，SmolLM3兼容主流机器学习框架，集成于transformers库和vllm推理引擎，方便开发者进行模型加载与应用。支持长达128k上下文令牌的生成，默认开启的推理模式/思考模式提升生成解释的详实度和逻辑性，且可随时通过系统提示切换推理状态以满足不同的推理深度需求。此外，模型原生支持工具调用功能，能够灵活处理标准XML格式工具及Python代码片段工具调用，为多任务、多模态场景拓展打下坚实基础。

对于本地运行，用户根据GPU或CPU环境安装相应依赖后，即可体验SmolLM3提供的高效推理和广泛多语种支持。鉴于其设计上的高效性和精巧的训练流程，SmolLM3在算力有限的条件下，依然可发挥出与更大参数模型相媲美的性能，为广大科研人员、工程师和终端用户提供了理想选择。总体而言，SmolLM3是当前小型多语种长上下文推理语言模型领域的里程碑之作。它不仅体现了通过架构创新、训练策略提升、数据精选和后期微调协同发展的工程智慧，也为未来轻量级智能模型的发展路线提供了宝贵参考。未来，SmolLM3的开源化和详细训练配方的发布，必将促进更多创新模型的涌现，推动自然语言处理技术向更高效、更智能和更实用的方向演进。随着人工智能的广泛普及和多语言智能需求的升级，SmolLM3将为智能对话系统、专业推理问答、多语种内容生成等领域提供强大支撑，助力实现真正多场景、多语言的智能服务。

。

下一步

2025年10月13号 21点55分53秒 2025年软件供应链攻击演变解析：NPM、PyPI及CI/CD的典型案例深度剖析

2025年，软件供应链攻击持续演进，恶意代码通过开源包管理器和CI/CD流程渗透开发环境，给企业安全带来了前所未有的挑战。本文深入分析NPM与PyPI两个主流生态中的最新攻击案例，揭示攻击手法的进阶与防御关键，帮助开发者和安全从业者构筑更坚固的防护体系。

2025年10月13号 21点56分56秒迈向后量子时代：全面解析后量子密码学支持扫描技术

随着量子计算技术的不断发展，传统密码学面临前所未有的挑战，各大国家和企业纷纷推动后量子密码学（PQC）技术的落地。本文深入探讨后量子密码学支持扫描技术的重要性、应用场景及未来发展趋势，助力机构实现安全合规的数字化转型。

2025年10月13号 21点58分20秒用户界面的未来：从命令行到对话式人工智能的演变

随着人工智能技术的迅速发展，用户界面正经历前所未有的变革。从最初的命令行界面到现代基于对话的智能交互方式，界面设计不断适应用户需求的变化，推动数字世界进入一个更加自然、高效和个性化的新时代。

2025年10月13号 21点59分22秒告别Windows 10：使用Zorin OS延长电脑寿命，绿色高效的最佳选择

随着Windows 10于2025年10月正式结束支持，数以亿计的电脑面临安全风险和功能限制。通过安装Zorin OS，用户不仅能免费升级操作系统，还能延长旧电脑寿命，节省开支，并为环保贡献力量。本文深入解析Windows 10生命周期结束的影响及Zorin OS的优势，助力用户安全、便捷地完成系统过渡。

2025年10月13号 22点06分39秒揭秘裙带关系的积极作用：职场中的隐形助力

探讨裙带关系在职场中的积极影响，分析其在招聘、团队管理和职场竞争中的潜在优势及合理利用方式，帮助读者全面认识这一复杂现象。

2025年10月13号 22点07分43秒 ZipPeek：Windows应用助力远程ZIP档案预览与文件下载的高效利器

ZipPeek是一款运行于Windows平台的轻量级应用，专为远程ZIP档案的预览和选择性文件提取设计。它通过智能技术减少数据传输，节省带宽与存储空间，助力用户在网络环境受限或文件庞大的情况快速获取所需文件。本文深入解析ZipPeek的功能特性、技术实现与使用场景，助您全面理解这一创新工具的优势与潜力。

2025年10月13号 22点09分07秒为什么ChatGPT让人们给我发邮件？揭示人工智能与人类交流的新现象

随着人工智能技术的迅速发展，生成式AI如ChatGPT在日常生活中的影响愈发广泛。本文深度剖析ChatGPT为何会建议用户联系特定记者的背后原因，并探讨生成式AI对人类认知和社交带来的深远影响。