快讯 | 详情

OpenAI将开源SimpleQA新基准，以衡量大模型真实性

原文链接 2024-10-31

当地时间10月30日，美国开放人工智能研究中心（OpenAI）宣布，为了衡量语言模型的真实性，将开源一个名为SimpleQA的新基准。该基准可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。