快讯 | 详情

OpenAI将开源SimpleQA新基准,以衡量大模型真实性

原文链接 2024-10-31
当地时间10月30日,美国开放人工智能研究中心(OpenAI)宣布,为了衡量语言模型的真实性,将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。
上一篇
暂无