我们最新的 Gemini 模型在数学和科学基准测试中表现出色。这是一个令人难以置信的编码和复杂推理模型,
OpenAI 推出名为 “Images in ChatGPT” 的图像生成功能,已整合进 ChatGPT。
支持此功能的模型为 GPT-4o(omnimodal 模型),具备处理文本、图像、音频和视频的能力。
适用用户范围包括 ChatGPT Plus、Pro、Team 和免费版用户。
免费用户的使用限制与之前的 DALL·E 相同(例如每天可生成 3 张图像)。
DALL·E 用户仍可通过 自定义 GPT 访问原模型。
相比旧模型,新模型在两个方面有显著进步:
“Binding”能力大幅提升:能准确处理 15 至 20 个对象的属性(如颜色、形状)组合,而不是像旧模型那样在处理 5-8 个对象时就出现混淆。
文本渲染能力更强:能更清晰地在图像中呈现文字,减少错别字与混乱排版。
链接:https://www.theverge.com/openai/635118/chatgpt-sora-ai-image-generation-chatgpt
Palo Alto Networks 首席执行官 Nikesh Arora 在接受 CNBC 的 Jim Cramer 采访时,阐述了“Agentic AI(具备自主行动能力的 AI)”对网络安全带来的新威胁。
他以 Waymo 自动驾驶出租车 为例说明这种 AI 已经不仅限于生成式内容,而是具备了“手脚”——可以自主做出驾驶决策。
他表示:“你上了 Waymo 的车,相当于给 AI 装上了手脚,让它自己决定转弯、停车、行驶速度与路线。”
随着技术加速发展,攻击面不断扩大,黑客也在使用这些先进工具发动攻击。
Arora 在摩根士丹利技术会议上称,Agentic AI 的发展带来了“全新的威胁向量”,最明显的例子就是“AI 可以开车”。
伊利诺伊州众议员 Laura Faver Dias 推出 HB 2503 法案,旨在为K-12学校中的人工智能(AI)使用提供指导。
法案提议设立 专门工作组,制定教师与学生使用AI工具的规范,同时要求各学区向州教育委员会报告其AI使用情况。
Dias 认为 AI 发展迅速,学校缺乏指导,当前是制定政策的关键时机。
她表示:“我们知道自己落后了,需要在现实可行的时间框架内作出应对。”
来源:https://statescoop.com/illinois-bill-ai-k12-schools/
只需简单描述就能生成各种应用、网站和小游戏 和其他AI写代码的不一样,这玩意更像是给普通人用的,因为你看不到写代码的过程,它是"无代码编程 + 多智能体协作 + 多工具调用" 。 直接给你生成应用,没有中间过程,而且速度还挺快!
来源:https://console.bce.baidu.com/miaoda/design
合作亮点:
语音自动化点餐AI代理:利用英伟达Riva和Nvidia NIM微服务,开发能适应人类语音模式、理解复杂菜单和客户偏好的对话式AI,提升得来速和呼叫中心的运营效率。
计算机视觉增强运营:部署基于英伟达技术的计算机视觉,实时分析并优化得来速效率和后厨人力管理。
加速餐厅智能化:利用AI驱动的分析和代理评估餐厅表现,为经理提供个性化行动计划,借鉴顶尖门店的最佳实践。
来源:https://www.qsrweb.com/news/yum-brands-partners-with-nvidia-for-ai-technology/
这是一个与 Amazon Web Services(AWS)和 Anthropic 合作开发的 AI 财务智能平台,旨在帮助全球的首席财务官(CFO)利用人工智能提升财务效率、获得业务洞察,并推动企业增长。
该平台的核心是一套“财务自动化智能代理”(Finance Automation Agents),可用于自动化日常财务流程,例如月结、预测和预算编制,从而缩短周期时间,降低运营负担。
大众汽车集团阿根廷(Volkswagen Group Argentina)是首批采用该平台的客户之一,计划用它来区分短期与长期增长战略,并识别关键利润池。
只需提供商品图片,它就能让视频里的模特拿着或者穿戴该商品 不仅能把产品拿到模特手上,还能把项链挂到脖子上,衣服穿上身,鞋子上脚,沙发摆到客厅里… 电商各个品类都能适配。 -商品还原度高 -各个品类都能适配 -预制了5000多个模板,模板支持自定义修改
来源: