互联互通社区,专注于IT互联网交流与学习,致力于打造最具价值的IT互联网智库中心。

面向生产服务的大模型评估体系探讨  

发布时间:2024-03-11 16:33:07.0
导读: 面向生产服务场景,建立语言大模型、行业大模型、多模态大模型、智能体应用、安全评测等五大评测基准,围绕 评测数据、指标、方法与分析三大建设方向,高效开展综合全面的大模型评估评测。

模型接入生产系统时,需要经过一系列“全面考验”,接入生产开始服务后,要开展“持续考验”,根据用户市场真实反馈,形成动态反馈机制持续优化提升大模型的落地成效。
下载付件
温馨提示:本平台所有资料与知识星球平台同步发出,用户可根据需要选择平台加入,无需重复加入。

#免责声明#

来源: 中国移动,互联互通社区推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表互联互通社区立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!
推荐报告