1 1 2 2 3 3 4 4 5 5 文集 深度 号外 热文 时间线

AI精选(299)-人工智能领域内的最新进展:

主理人:
今日精选,深度丰富、精彩纷呈!我们诚邀大家继续关注并订阅我们内容,AI时代不落后,让每一天都充满启发和价值

一、DuckDuckGo 强化 AI 搜索工具,但仍允许用户选择关闭

DuckDuckGo 计划加强 AI 在其搜索引擎中的应用,其 AI 生成的答案已正式脱离测试阶段,并且信息来源已扩展至整个互联网,而不仅仅是 Wikipedia。该公司还计划在 AI 聊天机器人 Duck.ai 中集成网页搜索,提高其回答问题的能力。DuckAssist 功能(AI 辅助回答)最早于 2023 年推出,旨在提供更简洁、非侵入式的 AI 回答,用户可以调整显示频率,甚至完全关闭 AI 生成的内容。目前,即便用户将 AI 生成回答的频率设为“经常”,这些 AI 回答仅占搜索结果的 20%,但 DuckDuckGo 计划逐步增加这一比例。

来源:https://www.theverge.com/news/624899/duckduckgo-ai-search-chatbot-plans

 

 

二、微软将在南非追加 2.97 亿美元投资 AI 和云基础设施

微软(Microsoft, MSFT.O)宣布将在 2027 年底前追加 54 亿南非兰特(约 2.97 亿美元),用于扩大南非的 云计算和人工智能(AI)基础设施,以满足该地区对 Azure 服务 日益增长的需求。微软全球副董事长兼总裁 Brad Smith 在约翰内斯堡的一场活动上宣布了这一计划。

微软还将资助 5 万名个人 参加高需求数字技能的技术认证考试,帮助提升当地的数字技能水平,以支持 AI 和云计算行业的发展。

来源:https://www.reuters.com/technology/artificial-intelligence/microsoft-invest-additional-54-billion-rand-south-africa-ai-infrastructure-2025-03-06/

 

 

三、亚马逊 Prime 正在测试 AI 辅助电影和剧集配音技术

亚马逊正在测试 AI 辅助配音技术,用于 Prime 视频流媒体服务上的部分电影和剧集。AI 配音技术的主要功能是替换原始音轨,提供翻译后的语言版本,以满足不同语言观众的需求。目前,该技术将用于 12 部授权作品,其中包括 2003 年的动画电影《El Cid: La Leyenda》

首批 AI 配音支持语言英语拉丁美洲西班牙语亚马逊采用“AI + 人工”混合模式:AI 负责初步配音本地专业人士 参与审核,确保配音质量

来源:https://apnews.com/article/amazon-prime-ai-dubbing-movies-ccf67a44f86e60e69a2677650a05ab3a

 

 

四、Taco Bell 推出 AI 工具辅助快餐店管理,

Taco Bell 母公司 Yum! Brands推出 AI 驱动的“Byte by Yum”管理工具,这是快餐行业最新的自动化和劳动力优化技术举措之一。

Yum! 已投资 10 亿美元 用于推动数字化和技术创新,进一步提升餐厅运营效率。该 AI 工具专为餐厅经理设计,帮助优化管理流程,提高运营效率,并减少人为错误。该消息是在 Yum! 投资者会议(3 月 6 日,纽约布鲁克林)上公布的,表明 Yum! 在技术投资方面的重大战略方向。

Taco Bell 的 AI 技术预计将 改善点餐、库存管理、员工调度 等关键业务流程,以降低运营成本并提升客户体验。

来源:https://www.reuters.com/business/yums-taco-bell-shows-off-ai-coach-fast-food-managers-2025-03-06/

 

 

五、Meta 计划为数亿家企业提供“代理式 AI”

Meta 正在大力投资生成式 AI,并采用开源策略,使 AI 创新可以广泛共享。Meta 的 Llama 大语言模型 (LLM) 已被全球开发者下载超过 8 亿次。即将推出的 Llama 4 将用于增强 AI 代理(Agentic AI),这些 AI 不仅能响应指令,还能进行推理和自主行动,如浏览网页和处理多种任务。

Meta AI 业务负责人 Clara Shih 认为,AI 代理将成为企业的标配,每家企业都将有自己的 AI 代理,就像今天企业拥有网站和电子邮件一样

Meta 目前的 AI 已被超过 7 亿消费者 使用,Shih 的目标是将这些 AI 技术应用到企业领域,特别是中小企业Meta 计划为无法负担 AI 团队的中小企业 提供 AI 代理,让它们也能享受 AI 创新的红利。

链接:https://www.cnbc.com/2025/03/06/meta-is-targeting-hundreds-of-millions-of-businesses-for-agentic-ai.html

 

 

 

六、GPT 4.5已经向所有Plus用户推送

 

所有付费用户现在可以使用GPT4.5了

 

 

 

七、腾讯发布图像到视频生成模型 HunyuanVideo-I2V

 

语义理解精准且运动自然 - 多模态理解,结合文本描述和图像信息,让生成的视频更符合用户需求 - 高一致性:确保 视频首帧 与输入图片高度一致,避免失真或风格变化。 -自然动态过渡:生成流畅的视频运动,支持人物、风景、物体的动态演绎 -最高支持 720P 视频

 

 

八、Spark-TTS:基于Qwen2.5模型的高效文本转语音(TTS)系统 

 

在多个基准测试上超越现有 TTS 方法,并结合 Qwen2.5 LLM 进行端到端生成。支持细粒度语音控制(性别、音调、语速等),远超传统 TTS。零样本语音克隆,能生成高质量个性化声音。采用 BiCodec 编码,简化架构,提升推理效率。 与 Qwen2.5 语言模型集成,使 TTS 任务可以直接由 LLM 处理,无需额外的声学模型。