
这是5月23日的新闻,人类在今天(5月23日)北京时间举行的活动中为Claude Opus 4和Claude Sonnet 4推出了新一代语言模型,在结构化推理,软件工程和自主代理行为的领域中采取了重大步骤。 Claude Opus 4:复杂的推理支柱和IT软件的开发引用了一篇博客文章,即Claude Opus 4被定位为最有力的人类模型,旨在处理复杂的推理过程和软件开发方案。测试数据表明,在Banco SWE的参考点(评估实际GitHub问题的模型)和终端碱基测试(多个步骤终端代码任务模型的模型性能)中,模型的精度为72.5%。更明显的是,Opus 4在软件环境中表现出强烈的行为。 Rakuten测试数据显示,将近七个小时的代码生成和任务执行,建立G,由于记忆力的改善,更广泛的环境保留和更强大的内部计划机制,AI和上一代克劳德3作品(不到一个小时)的世界纪录。人类认为,其AI模型旨在成为自动化日常操作而不是消除工作的工具。 However, Marktechpost Media believes that after the launch of the Claude 4 series, the way in which the AI uses it will change, making it an auxiliary tool to complete a single task to a "broader and broader" coworkers ". Claude Sonnet 4: Universal choice to balance performance and cost. Sonnet 4 Claude replaced the previous generation of sonnet Claude 3.5 to improveSpeed and quality with a more stable architecture, but did not significantly increase计算机成本是针对中等大小的实现的,适用于需要成本绩效补偿的场景。具有许多建筑改进。它具有程序化,承认多个文件的导航,使用中间工具和结构化文本处理,并执行更好的延迟。它将成为免费Claude.AI用户的预定模型,使用API提供光线开发工具,用户助理和分析过程。技术突出显示模型和实现模式都具有混合推理功能,为低延迟的短任务提供了快速模式,并提供了需要深层推理和多个代理行为的复杂任务中的P modext。这种双向策略允许用户根据任务的复杂性分配计算机资源。此外,Claude Opus 4和Sonnet 4可以通过多个云平台进行访问,例如Anthrope的API Claude,Amazon Bedrock和Google Cloud Vertex AI,它们承认从自主代表到代码分析的广泛业务应用程序场景。