2025-03-07

AI精选（299）-人工智能领域内的最新进展：

主理人：

今日精选，深度丰富、精彩纷呈!我们诚邀大家继续关注并订阅我们内容，AI时代不落后，让每一天都充满启发和价值

一、DuckDuckGo 强化 AI 搜索工具，但仍允许用户选择关闭

DuckDuckGo 计划加强 AI 在其搜索引擎中的应用，其 AI 生成的答案已正式脱离测试阶段，并且信息来源已扩展至整个互联网，而不仅仅是 Wikipedia。该公司还计划在 AI 聊天机器人 Duck.ai 中集成网页搜索，提高其回答问题的能力。DuckAssist 功能（AI 辅助回答）最早于 2023 年推出，旨在提供更简洁、非侵入式的 AI 回答，用户可以调整显示频率，甚至完全关闭 AI 生成的内容。目前，即便用户将 AI 生成回答的频率设为“经常”，这些 AI 回答仅占搜索结果的 20%，但 DuckDuckGo 计划逐步增加这一比例。

来源：https://www.theverge.com/news/624899/duckduckgo-ai-search-chatbot-plans

二、微软将在南非追加 2.97 亿美元投资 AI 和云基础设施

微软（Microsoft, MSFT.O）宣布将在 2027 年底前追加 54 亿南非兰特（约 2.97 亿美元），用于扩大南非的 云计算和人工智能（AI）基础设施，以满足该地区对 Azure 服务 日益增长的需求。微软全球副董事长兼总裁 Brad Smith 在约翰内斯堡的一场活动上宣布了这一计划。

微软还将资助 5 万名个人 参加高需求数字技能的技术认证考试，帮助提升当地的数字技能水平，以支持 AI 和云计算行业的发展。

来源：https://www.reuters.com/technology/artificial-intelligence/microsoft-invest-additional-54-billion-rand-south-africa-ai-infrastructure-2025-03-06/

三、亚马逊 Prime 正在测试 AI 辅助电影和剧集配音技术

亚马逊正在测试 AI 辅助配音技术，用于 Prime 视频流媒体服务上的部分电影和剧集。AI 配音技术的主要功能是替换原始音轨，提供翻译后的语言版本，以满足不同语言观众的需求。目前，该技术将用于 12 部授权作品，其中包括 2003 年的动画电影《El Cid: La Leyenda》。

首批 AI 配音支持语言：英语拉丁美洲西班牙语亚马逊采用“AI + 人工”混合模式：AI 负责初步配音本地专业人士 参与审核，确保配音质量

来源：https://apnews.com/article/amazon-prime-ai-dubbing-movies-ccf67a44f86e60e69a2677650a05ab3a

四、Taco Bell 推出 AI 工具辅助快餐店管理，

Taco Bell 母公司 Yum! Brands推出 AI 驱动的“Byte by Yum”管理工具，这是快餐行业最新的自动化和劳动力优化技术举措之一。

Yum! 已投资 10 亿美元 用于推动数字化和技术创新，进一步提升餐厅运营效率。该 AI 工具专为餐厅经理设计，帮助优化管理流程，提高运营效率，并减少人为错误。该消息是在 Yum! 投资者会议（3 月 6 日，纽约布鲁克林）上公布的，表明 Yum! 在技术投资方面的重大战略方向。

Taco Bell 的 AI 技术预计将 改善点餐、库存管理、员工调度 等关键业务流程，以降低运营成本并提升客户体验。

来源：https://www.reuters.com/business/yums-taco-bell-shows-off-ai-coach-fast-food-managers-2025-03-06/

五、Meta 计划为数亿家企业提供“代理式 AI”

Meta 正在大力投资生成式 AI，并采用开源策略，使 AI 创新可以广泛共享。Meta 的 Llama 大语言模型 (LLM) 已被全球开发者下载超过 8 亿次。即将推出的 Llama 4 将用于增强 AI 代理（Agentic AI），这些 AI 不仅能响应指令，还能进行推理和自主行动，如浏览网页和处理多种任务。

Meta AI 业务负责人 Clara Shih 认为，AI 代理将成为企业的标配，每家企业都将有自己的 AI 代理，就像今天企业拥有网站和电子邮件一样。

Meta 目前的 AI 已被超过 7 亿消费者 使用，Shih 的目标是将这些 AI 技术应用到企业领域，特别是中小企业。Meta 计划为无法负担 AI 团队的中小企业 提供 AI 代理，让它们也能享受 AI 创新的红利。

链接：https://www.cnbc.com/2025/03/06/meta-is-targeting-hundreds-of-millions-of-businesses-for-agentic-ai.html

六、GPT 4.5已经向所有Plus用户推送

所有付费用户现在可以使用GPT4.5了

七、腾讯发布图像到视频生成模型 HunyuanVideo-I2V

语义理解精准且运动自然 - 多模态理解，结合文本描述和图像信息，让生成的视频更符合用户需求 - 高一致性：确保视频首帧与输入图片高度一致，避免失真或风格变化。 -自然动态过渡：生成流畅的视频运动，支持人物、风景、物体的动态演绎 -最高支持 720P 视频

八、Spark-TTS：基于Qwen2.5模型的高效文本转语音（TTS）系统

在多个基准测试上超越现有 TTS 方法，并结合 Qwen2.5 LLM 进行端到端生成。支持细粒度语音控制（性别、音调、语速等），远超传统 TTS。零样本语音克隆，能生成高质量个性化声音。采用 BiCodec 编码，简化架构，提升推理效率。与 Qwen2.5 语言模型集成，使 TTS 任务可以直接由 LLM 处理，无需额外的声学模型。