识别美食PK，Kimi和豆包谁赢了？-虎嗅网

出品｜虎嗅科技组

作者｜余杨

编辑｜苗正卿

头图｜视觉中国

有没有发现，降温后，下班回到楼道，家家户户的外卖似乎都香了很多。

这不是错觉，更不是变馋了。

科学研究表明，一方面，寒冷天气中，人体需要更多的能量来保持体温，高热量食物可以提供这些所需的能量。另一方面，在进化过程中，人类为了在食物稀缺的季节生存，会自然地增加脂肪储备以备不时之需。虽说现在有暖气，没有天寒地冻的威胁，但深藏在基因里的本能，还是会驱使人们寻求高热量食物。

另外，食物与情绪之间存在强链接，高热量食物如甜食可以刺激大脑释放多巴胺，有助于缓解压力和提升情绪。毕竟，”晚来天欲雪“的天气，白居易下了班，也要“红泥小火炉，能饮一杯无？”。

随着气温持续走低，是选择“贴膘”，还是继续做控卡达人呢？

控卡首先是得掐着热量吃饭。

但没几天就会发现，算热量太累了。于是想到，AI或许可以一试。拍照让AI估算食物热量，管理自己的热量摄入。

iPhone发布后新上线的一键拍照调用 AI 功能也发掘出了这个思路。最近，跃问app因为针对iPhone16开发了一键调用相机接入 AI 提问的功能而火出了圈。

这一方面释放出AI场景化的控卡垂类用户信号，另一方面也考验着 AI 的图像分析能力。

话不多说，今天我们就来浅浅测评AI的食物热量估算能力，push一下图像端侧AI应用能力生长。

今天参与测评的选手则包括Kimi、豆包、秘塔AI和跃问。

Prompt为：假设我中午把这些都吃完了，请问我一共摄入了多少热量，附件图片如下。

我们先粗略估算一下参考答案。

图中是：

一份漏奶华，大约250g，总热量约400kcal；

一份叉烧饭，叉烧约100g，青菜约40g，滑蛋约50g，米饭150g，总热量约600kcal；

一份烤香肠玉米蔬菜拼盘，甜玉米30g，嫩南瓜70g，烤肠120g，总热量约400kcal；

一份咖喱鱼蛋，共6个，约120g，总热量约120kcal；

一杯港式冰奶茶，约200ml，总热量约200kcal。

图中所有食物热量约为1720kcal。

饿了吗？记住这份标答。

Kimi

首先是Kimi，大约10秒钟Kimi就交了卷。

首先，Kimi十分懂中国人的胃，不仅准确识别了食物名，热量估算也大致准确。把奶茶识别成了热巧克力，倒也情有可原。

这直接抬高了我对接下来测评的期待。

豆包

然后是豆包：

豆包的食谱显然需要丰富一下。漏奶华也许可以约等于松饼，咖喱鱼蛋也可以约等于蘸酱了的炸丸子，但是鸡蛋盖饭上的肉直接被无视了，和标答的热量差额也就出来了。

不过，豆包还贴心的给出了食物的方位。

秘塔AI

秘塔的回答则是：

这是目前为止唯一一个识别出烤蔬菜的AI。

秘塔正确识别了玉米、烤蔬菜、香肠、咖喱鱼丸、奶茶。

漏奶华也可以约等于巧克力吐司，但芝士培根饭的芝士颜色，是不是深了点呢？

此外，秘塔的回答简单明了的同时，也缺失了食物数量的描述，总体来说，我认为秘塔不善此道。

跃问

最后到跃问：

有意思的是，按照跃问的文本输出逻辑来推算，其他的AI都是从上到下扫描识别食物，但跃问是从左到右扫描识别食物，因此奶茶在第二顺位？这个细节所显示的，可能是底层程序的差异。

另外，从跃问给出的答案来看，它对食物的尺寸和比例没有概念，从而把漏奶华识别成了提拉米苏。

同样，跃问也没有给出食物的数量，都是一块、一杯、一份的总量词描述，对于图片中的同类项合并能力还尚待观察。

语言陈述方面，我也建议，可以试着更加 AI 一些，不要“我建议你”。

总结

Kimi在食物识别和热量估算方面表现较好，尽管有小错误，但总体准确。
豆包对方位更敏感，但需要丰富食谱库。
秘塔AI在识别多样性上表现不错，但在食物数量和份量的描述上有所欠缺。
跃问的图片识别逻辑可能与其他AI不同，对图片所显示的食物尺寸、比例、数量等变量显然不够敏感。

不同AI在图像分析和食物热量估算方面的能力各有所长，也显示在实际应用中的潜力和需要改进的短板。

总的来说，成为人类的生活助理，AI们还得加把劲儿。

如果你有观点、想法或想看的测评，欢迎和我交流。如果你喜欢这期内容，别忘了一键三连，因为这也是我探索更新的动力，我们下期再见～