在人工智能领域,随着技术的不断进步,各种新的AI模型相继诞生,旨在解决日益复杂的问题。最近,Anthropic公司发布了他们的新一代AI语言模型——Claude 3.7 Sonnet,添加了所谓的“扩展思维”能力。这一创新设计赋予了模型以更系统、更深刻的方式思考,使其可以逐步解决复杂问题,这一特性也使其在编码任务和其他应用场景中表现得毫不逊色。 Claude 3.7 Sonnet被称为市场上首个“混合推理模型”,用户可以根据需要选择快速响应或延展的可见推理过程。这项技术与OpenAI的o1和o3系列模型、谷歌的Gemini 2.0 Flash Thinking和DeepSeek的R1模型相似。与此同时,开发者通过Claude 3.7的API,可以精准指定模型在思考时使用的token数量,上限达到128,000个输出token。
Anthropic指出,其更新版本Claude 3.7相较于其前身Claude 3.5,在减少不必要的拒绝方面取得了显著成功,减少比例达到45%。从某种意义上说,Claude 3.7更倾向于接受用户的请求,并减少在伦理界限方面的顾虑,这使其在许多情况下表现得更加人性化。 在性能方面,Claude 3.7 Sonnet在编程任务上展现了卓越的能力。根据初步测试,Claude 3.7在处理实际软件问题和复杂任务时的表现堪称一流,相较于其他AI模型有显著优势。特别是在SWE-bench Verified和TAU-bench等基准测试中,Claude 3.7以其出色的成绩赢得用户好评。 对于开发者而言,Anthropic还在Claude的所有计划中推出了GitHub集成功能。
开发者现在可以直接将代码库连接到Claude,以便进行Bug修复、功能开发及文档编写等任务。此功能的引入,无疑将进一步提升与人工智能工具之间的互动与协作。 在使用Claude 3.7 Sonnet进行编码时,用户可以体验到它在复杂逻辑处理方面的能力。例如,在经过“扩展思维”模式时,Claude 3.7可以有效地分析和推理问题,比如对“马真塔”颜色名称起源的询问。这种反应不仅帮助用户获得了信息,还展现了Claude在推理过程中的周密思考。 在测试中,Claude 3.7被要求为用户创作五个原创新的爹爹笑话。
与以往简单的prompt不同,用户对其提出的请求更加具体:“创作五个在全世界都找不到的原创新的爹爹笑话。”Claude 3.7在这个任务中表现出色,虽然笑话的幽默感可能因人而异,但它确实尝试提供了独特的内容。通过这种方式,用户可以体验到AI在创造性任务中生成原创内容的新潜力。 此外,随着Claude 3.7 Sonnet的发布,Anthropic还推出了其首个自主代码助手Claude Code。这一工具能够直接在控制台终端中操作,进行代码库的搜索、文件的读取和编辑、测试的编写与执行等功能,甚至可以将修改后的代码提交到GitHub。经过公司内部测试,Claude Code能够在一段时间内完成以往需要45分钟才能完成的任务,这表明其在提高工作效率方面的巨大潜力。
随着用户反馈的不断汇聚,Anthropic计划对Claude Code继续进行改善与优化,使其能够更好地满足开发者的需求。同时,Claude 3.7 Sonnet可通过Claude官网、Claude应用程序、Anthropic API、Amazon Bedrock以及谷歌云的Vertex AI等多个平台获得,从而为广大用户提供便利。 总的来说,Claude 3.7 Sonnet的“扩展思维”能力使其在面对复杂问题时显得尤为出色。随着这一新功能的推出,它不仅提升了AI模型的应变能力,还为开发者提供了强大的工具来提高工作效率,推动软件开发与创新的进步。持续关注Claude 3.7 Sonnet的发展动态,将使我们能更好地理解这一新技术在未来可能带来的变革。