AI精选(317)-人工智能领域内的最新进展:

主理人:
今日精选,深度丰富、精彩纷呈!我们诚邀大家继续关注并订阅我们内容,AI时代不落后,让每一天都充满启发和价值

一、Meta 发布 Llama 4 为其首个原生多模态模型

 

最高1000万上下文长度 与以往模型不同,Llama 4 从一开始就设计为原生支持文本、图像和视频的统一模型,通过“早期融合”(early fusion)技术,将文本和视觉数据直接整合到模型主干中,而非后期附加。 训练数据包括超过 30 万亿个 token... 可同时理解文本和图片,进行图文推理、问答、识别、描述等任务。 Llama 4 系列首批发布了两个可用模型:Llama 4 Scout 和 Llama 4 Maverick。并预告了一个仍在训练中的超大模型。

 

 

 

二、Luma 推出 Ray2 中的相机运动概念功能

 

一共20 多种经过精确调整的摄像机运动镜头,让 AI 视频也能拍出专业电影级镜头运动 而且这20 多种镜头还可以随意组合 看看这个效果展示,非常的nice,制作广告片效果非常的好。 用户只需通过文本输入即可实现复杂的镜头控制。比如: 推进、拉远(Zoom / Push) 左右环绕(Orbit) 升降镜头(Crane / Pedestal) 左右平移(Truck / Pan) 模拟手持抖动(Handheld) 

 

 

三、Amagi在2025年NAB展会上展示AI驱动的媒体解决方案

在2025年NAB展会上,Amagi公司展示了其基于AI的云广播解决方案,包括新的智能调度器,旨在优化内容编排和盈利能力。

AI在媒体和娱乐行业的应用有助于提升内容管理效率,为观众提供更个性化的体验,同时也可能改变传统的内容制作和分发模式。

来源:https://www.tvtechnology.com/news/2025-nab-show-exhibitor-insight-amagi?

 

 

 

四、微软展示AI重建版《Quake II》,Muse模型推动游戏开发新革命

微软展示AI生成版《Quake II》

微软通过自家的Muse AI模型,创建了一个可游玩的AI生成《Quake II》演示版。

该演示作为“Copilot for Gaming”计划的一部分,可以在浏览器中体验。

游戏画面较为基础,敌人模糊、交互简陋,并且可试玩时间受到限制。

Muse AI模型的背景与发展

Muse最初在2024年初以10fps和300x180分辨率演示,此次升级为640x360并具备可玩帧率。

虽然仍属早期尝试,但体现出Muse AI在生成游戏内容方面的潜力。

来源:https://www.theverge.com/news/644117/microsoft-quake-ii-ai-generated-tech-demo-muse-ai-model-copilot

 

 

五、NAB大会探讨AI对创意工作与艺术家的影响:“这是通才的时代”

I提升制作效率但非万能

在NAB展的“电影未来峰会”上,多位演讲者一致认为,AI能加快制作流程并降低成本,但仍无法取代所有创意工作。

AI适合用作辅助工具,而非彻底替代艺术家。

“通才时代”来临

Secret Level公司CEO Eric Shamlin指出:“这是通才的时代。”

他强调AI工具让更多人能够进行高质量创作,例如“在卧室里就能制作太空歌剧”。

创作的门槛降低,释放了前所未有的创意潜力。

推动责任性采用AI

Shamlin表明其承诺:“以负责任的方式使用AI,不取代艺术家,而是推动合理采纳。”

创意与控制的权衡

Storybook Studios创意总监Albert Bozesan表示,AI确实让制作更快更便宜,但也牺牲了部分创意控制。

他认为,AI不能完全胜任对话创作,“演员的表现力不可替代”。

来源:https://variety.com/2025/artisans/news/nab-ai-impact-jobs-creatives-smpte-1236360642/

 

 

 

 

 

六、谷歌因Gemini表现不佳更换负责人,寻求在AI竞赛中重新定位

领导层更替

谷歌更换了Gemini项目负责人:Sissie Hsiao被Josh Woodward取代,后者也是Google Labs负责人。

Woodward曾主导NotebookLM项目,即一款可将文档转化为播客的AI工具。

此次更换是为了“聚焦Gemini的下一阶段发展”,标志着谷歌在AI策略上的一次重大调整。

市场表现落后

尽管谷歌曾在AI领域开创先河(发明了transformer模型),但Gemini在美国AI聊天机器人市场的份额仅为13.5%。

对比来看,OpenAI的ChatGPT占据近60%的份额,微软的Copilot为14.4%,Gemini已从2024年初的16.2%下降。

来源:https://www.pymnts.com/artificial-intelligence-2/2025/google-replaces-gemini-head-after-lagging-ai-performance/

 

 

 

七、Runway 获得3.08亿美元融资,加速AI视频技术发展

融资概况

Runway,一家专注于AI视频生成技术的公司,在由General Atlantic领投的一轮融资中筹集了3.08亿美元

这轮融资也得到了其他投资机构的参与,具体投资人名单未完全披露。

公司定位

Runway是生成式AI视频领域的先行者,其技术可将文字或图像输入转化为高质量视频内容。

其产品Runway Gen-2是全球首个公开商用的文字生成视频模型之一。

资金用途

新融资将用于加速产品研发,提升模型性能,以及扩大商业化应用的覆盖范围。

还将加强基础设施投入,如训练数据、算力资源和多模态处理能力。

来源:https://www.reuters.com/technology/artificial-intelligence/ai-video-maker-runway-raises-308-million-general-atlantic-led-funding-round-2025-04-03/

 

 

八、哈佛商学院将AI课程列为MBA必修课,

课程名称与背景

哈佛商学院(HBS)已正式将名为**“Data Science and AI for Leaders”(数据科学与领导者的人工智能)的课程设为MBA学生的必修课**。

此课程取代了原有的数据科学课程,并首次于2025年春季学期实施。

课程设计与目标

课程由HBS教授Karim R. Lakhani和助理教授Iavor Bojinov联合授课。

教材不仅涵盖数据分析与机器学习,更重点教授AI在商业中的实际应用。

Bojinov指出,这门课程的开发反映了AI工具在社会和企业中的广泛应用。

来源:https://www.thecrimson.com/article/2025/4/4/hbs-makes-ai-class-required/