1122

OpenAI公开o1模型测试方法。

OpenAI分享了两篇关于o1、GPT-4、DALL-E3等前沿模型的安全测试方法。一份是OpenAI聘请外部红队人员的白皮书,另外一份是通过AI进行多样化、多步骤强化学习的自动化安全测试论文。希望可以为更多的开发人员提供借鉴,开发出安全、可靠的AI模型。此外,为了增强安全性和提升测试效率,OpenAI会让AI与人类一起协作测试。这样做的好处是,人类为 AI 提供先验知识与指导,包括专家依专业判断设定测试目标、范围、重点及策略,助其实现针对性测试。

1天前
0
12
0/500 虎嗅用户社区交流公约