豆包大模型团队开源基准测试集SuperGPQA。-24小时-虎嗅网

虎嗅APP虎嗅APP
公众号矩阵公众号矩阵
我要投稿我要投稿

0304

AI新技能

机器人们又get了什么新本领？

豆包大模型团队开源基准测试集SuperGPQA。

据豆包大模型团队官微消息，近日，豆包大模型团队开源SuperGPQA，一个领域全面且具备高区分度的知识推理基准测试。据介绍，该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系，不仅涵盖主流学科，更将轻工业、农业、服务科学等长尾学科纳入其中，展现出全面学科的覆盖广度，填补了长尾知识评估领域的空白。

【原文】

2025-03-04

0/500 虎嗅用户社区交流公约