首页 > 2025年推理模型综合测评报告

2025年推理模型综合测评报告

发布时间：2025-06-04 22:41:53.0 分享

导读： InfoQ 研究中心在对推理模型的训练原理、能力表现等进行深入分析后，围绕逻辑推理、数学推理、语言推理、多步推理、幻觉控制五大核心领域共计300道测试题目，对包括DeepSeek-R1、k1.5、Claude-3.7-Sonnet-Reasoning、GLM-Z1、Doubao-1.5-thinking-pro、o3、文心 X1 Turbo、Qwen3-235B-A22B在内的八款热门推理模型进行了全面评估。

下载付件

2025年推理模型综合测评报告.pdf

vip

星球会员免费下载本站会员免费下载

温馨提示：本平台所有资料与知识星球平台同步发出，用户可根据需要选择平台加入，无需重复加入。

免费阅读6页，下载阅读完整文档

2025年推理模型综合测评报告

报告厅人工智能大模型

#免责声明#

来源： InfoQ，互联互通社区推荐阅读，版权归作者所有。文章内容仅代表作者独立观点，不代表互联互通社区立场，转载目的在于传递更多信息。如涉及作品版权问题，请联系我们删除或做相关处理！

推荐报告

2025大模型翻译技术及产业应用蓝皮书

详细内容请点击查阅...

上传时间：2025-06-05 22:42:02.0
2025年AI Agent+医疗行业研究报告

详细内容请点击查阅...

上传时间：2025-06-03 22:53:25.0
大模型及DeepSeek在运维场景中的应用

详细内容请点击查阅...

上传时间：2025-05-29 23:19:57.0
2025年AI营销新范式应用指南报告

详细内容请点击查阅...

上传时间：2025-05-29 23:07:17.0
AI工具深度测评与选型指南 v1.0

详细内容请点击查阅...

上传时间：2025-05-24 22:47:16.0
2025年大模型能力来源与边界报告

详细内容请点击查阅...

上传时间：2025-05-24 22:44:51.0