本文来自微信公众号:rct studio,原标题:《内容生成与消费科技:媒体、游戏和社交》,题图来自视觉中国
本文以内容生成的视角出发,讨论了信息、数字内容和人的关系,以及内容在媒体、游戏和社交等领域的发展逻辑、呈现方式以及未来的形态。
当我们以整体的方式来看到整个内容生产和消费时,会有 4 个不同的内容生成的阶段。
在第 1 阶段中,内容是由大规模的专业创意团队来产生(PGC),这些产品大多数都是针对单人的体验,当产品中增加同时参与内容交互的用户时,这些体验实际上并没有改变。比如大部分的专业新闻媒体、流媒体、非沙盒类游戏等内容。
社区、自媒体、沙盒游戏等 UGC 内容则属于第 2 阶段,而更广泛意义上的社交媒体、社交网络和社区会同时横跨1和2阶段。
第 3 阶段中,ABC 技术(AI, Big Data, Cloud)将协助人们更有效率地生成数字内容,这部分内容将会是天然的动态生成,也因此能够同时适应多人交互的动态体验。
第 4 阶段则是完全由 AI 自动生成大量且丰富的内容,从而支持 Metaverse 中用户的内容消耗需求。
从真实世界和虚拟世界的发展光谱来看,第 123 阶段都属于数字化的真实世界,而第 4 阶段则完全属于原生的虚拟世界。
在这基础上,我们进一步讨论了技术对于几个主要的内容领域(媒体、游戏、社区、社交等)的改变与影响,以及内容是如何从外部和内部实现智能生成。
技术将在虚拟世界中为人们带来新的社交关系,也会带来新的生产关系。自动化生成的内容体量正在加速爆发,我们当前所处的 UGC 和 PUGC 时代很快将会过去,人类会和 AI 将会共同创造更加动态、丰富且个性化的内容。
一、信息、数字内容和人
1. 内容=信息+载体
人生来就会和世界产生关系。以人为观测对象来看,在这个世界中能够与人产生关系的则是人和物体,人和人之间会交流,为了获取对方信息,从而产生了语言;而人为了获取物体的信息,则诞生了工具,通过使用工具的方式来获取物体的信息,从而使用物体完成各种目的,甚至将物体打造成工具本身。
信息本身的存在,并不会依赖于信息的传播方式、路径和对象,信息本身只和信息载体有关。也就是说,在我们从真实世界获取信息时,我们仅仅是通过某种合理的方式,获取了原本就存在的信息。
在获取、传递与接受信息的过程中,为了提高信息获取的效率,我们使用了各种载体。语言是一种虚拟的载体,声音是一种虚拟的载体,工具是一种实体的载体,物体是一种实体的载体。当然,虚拟的载体如果想要更加稳定、持续、有效地传播的话,一定需要实体的载体。
这个过程发生后,信息形态会发生改变,因为载体发生了变化。
严格来说,文字也是一种工具。同时,人们为了让语言以及背后的思想等信息,被稳定且有效地传播下去,出现了笔、纸、乐器、乐谱等工具,作为不同信息的载体,帮助信息在人之中留存和传播。
信息有了载体,就会成为内容。
内容的本质是信息,人是信息、物体是信息、人和人交流的语言是信息、人们拍摄的视频也是信息、人们每天买的东西也是信息。但严格来说,有了载体后的信息,就成为了内容。
同时,文字、图像、音乐、人、物体等等都是内容。在信息技术出现前,人们无法将人和其可以产生的信息,比如说的话,穿的衣服等,直接作为内容进行传播,如果想要和某人交流,只能前往拜访,或等对方出现。
对于文字、图像这一类本身就已经是作为信息载体的内容,就可以再次通过其他工具进行内容集成,比如人们使用纸张、雕刻等方式进行多次传播等。
2. 信息的形式
对于信息本身来说,处于底层的是逻辑类信息,能够让人以合理的方式认识并理解其他信息。
如果我们只有语言、文字、图像、形状、温度等信息和内容,我们确实能直接获取它们的信息,每个人也会有自己的理解方式对其进行描述。但如果不存在相似或者相同的逻辑部分,我们则无法和其他人对其进行交流。
逻辑类的信息往往不是处于物体表象层面的信息,而是在人们在理解和认知过程中的途径和方式。
我们日常使用的语言则属于自然语言,它是一种有穷语言。不同语言单位的发音,虽然各不相同,但语言的构成基础音位是有限的,通常只有 40 个左右。同时,由于词是通过有限个基础音位构成的,所以构成任何一种自然语言文字的词汇也是有限的。从而,对应的句子也是有限。
而在数学、逻辑和计算机科学中,形式语言则是通过精确的数学或机器可处理的公式来定义的语言。在形式语言的理论中,它是一个字母表上的某些有限长字符串的集合,一个形式语言可以包含无限多个字符串。
我们已经知道,纯粹的数学和逻辑语言无法在系统内描述系统本身,同时通过逻辑语言所表示的信息无法完整地表示不同语境下的信息内容。
除了使用不同系统内的逻辑,人们也通过类比、联想等其他方式,快速地理解和认知其他信息。
在这个过程中,处于表层的文字、图像、声音信息,则最直接的获取方式。除此之外,还有嗅觉、触觉等形式的信息,来帮助我们对信息和内容的认知和理解。
技术的发展,使得我们可以将这些处于表层的信息进行通过更加稳定且有效的方式进行传播。从纸张到电报,再到网络屏幕上的文字和图像,我们不断地将真实世界中物体的信息进行数字化处理,从而成为数字化的内容。
与此同时,真实物理世界中的人,他的信息和内容通过数据的方式上传到网络,成为数字化的内容。
由于技术的原因,我们暂时只能将一部分的信息数据化,比如基本信息(姓名、年龄、出生地等)、肖像信息(照片、视频等)、偏好信息(浏览视频的类型、标签等)、行为信息(游戏中的走位)等,从而近似地还原人在虚拟世界中的形象。
3. 信息和数字内容的关系
之前我们提到,内容就是具备了载体的信息。讨巧的地方在于,我们在真实世界中,了解人、物体和事情,也都是通过碎片化的信息进行认知的。
只不过在知识的学习、工作等这种场景下,为了提高信息接受的效率,我们都会将这些碎片化信息进行集成,形成系统化的信息。
网络上的信息都是有载体的信息,所以广义地看,他们都是内容。因此,在网络中,人们和信息以及内容存在的关系,就变成了:
人 — 数字内容 — 数字内容 — 人
这是一个简单的模型,不同的人将真实世界中的内容,转换成了虚拟世界中的内容,这也代表了不同的人在网络上的信息载体,可以是语音,可以是文字,也可以是图片或视频。
同时,由于数字信息可以被多次编辑与修改的特点,人们又会将虚拟世界中的信息进行再次加工,成为新的内容。
当然,不是所有信息都可以被修改,比如一些涉及真实性、保密性和唯一性的信息,就无法被修改,或者说需要权限。
人 — 数字内容 — 数字内容* — 数字内容 — 人
我们将被修改和编辑后的信息,称为“数字内容*”。这些内容是在数字内容 1 或者 2 的基础上进行修改的,人们同样会和这些内容发生交互。这些内容是来源于真实世界的信息,所以归类到数字化的真实世界中。
在真实世界中,当人们想要交流信息时,会有这么几种情况:
一种是大家会聚集在一起,针对某个话题进行讨论、发表见解,并且会记录下来,以便有其他人可以更完整地了解他们讨论的内容;
另一种情况是,其中某个人见解更多,大家都想来听他分享,然后因此聚集起来,同时将其内容以纸的方式进行留存;
还有一种情况是,这个人有一些大家都想要获取的特性,但无法同时让每个人都获得,所以会通过内容的方式,将其传播出去。
内容天生就存在时效性,数字技术仅仅是赋予了时效性的可选择性。人们可以主动地选择将一部分内容设置为长时间存在,或将另一部分内容设置为阅后即焚。这也为内容的传播形式提供了记录的可能。
4. 数字内容的形式
从内容的生产角度来看,真实世界和虚拟世界的信息都可以被人或者机器进行提取和传输。
使用机器提取真实世界的信息,指的是给机器设定规则,在一定场景下,自动地按照规则去记录识别并记录文字、图像、音乐等信息,并以内容的形式在虚拟世界中储存与传播。
而对于人来说,人可以使用终端来将真实世界的信息进行数字化,其实也隐含了一点:以自身的视角来进行这个过程。
这又回到了人身上,人看世界的方式是什么,就可以通过数字化的方式获取什么信息。
根据美国哈佛商学院有关研究人员的分析表明,人的大脑每天通过五种感官接受外部信息,其比例分别为:味觉 1%、触觉 1.5%、嗅觉 3.5%、听觉 11%,以及视觉 83%。
从可行性的角度来说,味觉和嗅觉都需要特殊的分子才能感知,触觉则需要对应工具对应实时控制才能感知到。而视觉和听觉这两种方式对于传播和感知的要求是最低的,仅需要屏幕和发生器即可。
因此,文字输入、拍照图片、视频录制和音频采样成为了数字内容的最主要形式。当然我们也非常希望能在未来看到能够将触觉、嗅觉和味觉进行数字化传播的方式,从而增加内容的形式,让人能够更加沉浸地感知到虚拟世界。
而对于在原生的虚拟世界中产生的内容,它们有着同样的形式,但承载的信息的来源却不同。
5. 数字内容和人的关系
当我们明确了数字内容的形式后,我们可以接着讨论数字内容出现后,人和数字内容的关系,从而理解内容行业的产生与变迁。
最早,由于工具和载体的不先进,以及不同社会发展阶段所对应的组织形式的不同,导致信息的生产最初仅来源于少数的人,然后人们再使用非数字化的载体进行信息的传播,这会花费非常多的时间,信息无法做到快速、及时且稳定的被更多的人接受。
这种用来扩大并延伸信息传送的工具,就是媒介,它是使双方发生关系的各种中介,如文字、声音、图形和图像、动画和视频;在英文语境中,媒介称为medium,指的是用来传播的内容,或者说信息的物质载体。
而媒体则是承载媒介的载体,如报纸、广播、电视、电影、游戏、网站、博客、微博、微信等,其中基于模拟媒质的称为传统媒体,基于数字媒质的称为数字媒体。媒体对应的英文则是 medium 的复数 media, 从词义上理解,media 是所有媒介的集合,而不仅仅是大众媒介的集合。
与此同时,媒质指的就是媒体的材质,如石碑、纸张、磁盘、光盘、磁带、半导体存储器、生物存储器等,其中也可以分为模拟媒质和数字媒质。
事实上,媒体的形式,决定了媒介的传播方式。信息技术出现前,媒体多是以印刷类的实体物体为主;而计算机和互联网的出现,则诞生了电子类媒体。由于技术的发展和普及程度,这种媒体形式一开始是中心化的,具备信息优势的人,会以自己为中心,通过网络进行传播,从而聚集对应的受众和用户。
当技术的突破使得人们能将更多的信息,以更有效的方式转换成内容,再进行数字化处理,网络世界中的信息体量会出现一次次的爆发增长,其增长的节奏则是通过人们对于信息和内容的供需变化来体现的。
最初当网站出现时,人们对于内容的质量要求并不高(或者说,人们对于高质量图像、视频等的实时交互需求尚未出现),所以相比起在个人主页上发布自己对于某一个领域的信息,以中心化的方式进行信息整合与发布,会更有效率,且会有利可图。
随着媒体站点出现了集中式的爆发,内容的供给也相应地大幅增加。为了让人们能够更加快速地找到目标信息,在门户和网页内容的基础上,搜索引擎诞生了,这也极大的提高了人们获取信息的效率。
这段时间也称为内容的 1.0 时代。数字内容和人的关系是由内容的体量来驱动的,因此会受到很多外部因素的干扰,特别是过量的信息也使得内容对于人的持续吸引力不断减弱,从而削弱数字内容和人的关系。
上面我们提到,人本身的信息可以被数字化,随着图文形式的信息变得不断饱和,人们的需求从获取信息变成交流。这和人们在真实世界中发生的过程是一致的:认识了世界后,就希望交流。
因此,在门户网站和搜索引擎出现后,社交网络的出现将人们连接了起来。人们通过网络上各种的账号,将自己的信息变成了数字化的内容。这些内容不仅包含了用户的基本信息,也包含了人们与真实世界所发生的交互内容。
互联网将人与人之间的信息交互变得更加的快速,人们也逐渐把真实世界中的社交关系搬到了数字世界中。
这里需要明确的一点是,我们在真实世界中的社交中,想要获取的是人本身的属性,以及人所产生的信息和内容。
社交网络将一部分人的属性和其内容进行了数字化,让我们可以更快速和高效的方式获取这部分信息,而其他部分的属性则无法被数字化。
同时,社交网络由于其社交的属性,将不同的人们基于他们身边的一层层关系所联系起来,所以社交网络本身对真实世界中的人脉关系具有高度依赖性。
社交网络关注的重点,不在纯粹的内容身上,也不在纯粹的人身上,在依附于人脉关系所产生的内容上。这些内容具备这种特性,使得人们将通过数字化的交互转换为在真实世界中的交互。
与社交网络同时期诞生的还有社交媒体,这两类形式组成了内容 2.0 时代的两条不同发展思路。
相同点在于,人们将关注点从内容本身转移到人身上,具体来说,是和人相关的内容被强调出来。不同点则是,社交网络的路径是“先有人再有内容”,而社交媒体的路径是“先有内容再有人”。
由于数字内容本身就具有媒体的属性,而网络又将人之间的距离变得非常近,所以社交媒体和社交网络之间都具备彼此的一些属性。
同时,社交媒体的重心是在媒体式的中心化内容,而不是建立在人脉关系上的去中心化内容。因此,社交媒体其实是将真实世界中人根据影响力分层,由高到低地建立媒体内容,并持续地通过人进行数字内容的增加。
而社交网络则是以更加平等的方式从每个人身上获取数字内容。在这个过程中,会有人因为自己产出的内容而被更多人关注,从而脱颖而出,并具有了媒体的属性。
在这个过程中,无论是社交媒体、社交网络还是自媒体,一开始都会尽可能地将各种不同领域、不同形式的内容放在同一个体系存在,从而更好地吸引用户。
随着人和内容形成的组织不断扩大,内容的质量就会下降。当用户对坏内容的忍耐程度大于其从内容中获得价值时,他就会离开并寻找其他内容的聚集地。
对于社交媒体来说,应对这种情况的方式其实一种 trade-off 策略。由于它关注的是整个社交媒体的生命力,而不是单纯的内容吸引力,所以它的策略会倾向于头部用户产出的媒体属性内容和尾部用户产出的媒体属性内容,这也是两种比较极端的内容质量。
中间这部分用户则会有一部分向更加垂直的内容聚集地转移,成为社区。
因此,社区和社交媒体的相同点是,都是以内容为核心导向的场所。当然社区也可以由非常多的不同领域内容组成,但社区和社交媒体的区别在于:社区的标志是平等,不会因为用户影响力的大小从而影响到内容的分发。
用户自己对不同主题、不同人的内容进行选择,并在平等的交流关系下,基于内容产生多对多的网状式交互。
不同的地方在于,社交媒体加入了自媒体后,中心化和去中心化的传播会共存。但在发展初期,中心化的传播影响力会占据社交媒体中更主要的位置,而社区的传播则更加扁平。
当越来越多的人有了媒体的属性时,自媒体就从社交网络中诞生了。
事实上,从自媒体的定义来看,它是指大众化的传播者借助网络手段,向不特定的大多数人或者特定的单个人传递信息和内容。因此,只要给用户提供了内容传播的工具,用户就能在任何地方成为自媒体。
所以问题在于,为什么自媒体会优先诞生在社交网络?其实这个问题也非常好回答。在不同的用户和内容之间,平等的关系更利于自媒体的出现。如果事先存在有影响力的权威媒体,个人对于内容的发布会天然受到现有媒体的压制,从而无法快速地形成规模化的传播。
虽然在初期用户会选择使用社交媒体来发布内容,尝试利用已有的用户体量来帮助自己建立一个内心里,但事实证明,总的来说有三种方式能够帮助自媒体进行传播:
在社交媒体中,基于已有的关系链或其他因素,在社交媒体中的自媒体能够接触头部或权威媒体的影响力快速成长。
在社区中,通过对某一个领域或话题的持续贡献,从而成为社区内的自媒体。
在社交网络中,使用更加广泛的方式,持续地将关系链传播和延伸。
从整体来看,任意一种方式都能够给自媒体带来成长。相对来说,社交媒体上的自媒体,更多是依赖于整体的用户体量。而自媒体内容的出现使得用户能够通过自媒体的内容,和自媒体建立一定程度的社交关系,这种关系比基于任意一个用户的内容所建立的关系要强,但又比基于头部媒体或 KOL 的内容所建立的关系要弱。
具有更加平等的内容交互的社区,事实上已经对用户和内容进行了限制,因此自媒体对于社区来说更多的是已有关系的重叠,而不是带来新的交互方式。
同时,社交网络中的关系链,也为自媒体诞生的信息增加了信任度,从而让自媒体内容获得更有效和快速的传播。正因如此,社交网络+自媒体的组合,也带有了社交媒体的一些属性。
随着内容不断的增加,其包含的维度领域越来越多。用户对于某一类内容的需求和对内容获取的时效需求也日益上升,也进一步推动了内容的细分化。
与此同时,原有的用户组织结构也相应的被进一步细分化和碎片化,并诞生了更小形式的圈子和社群。社群往往以人为核心,核心人物如果不再付出,社群的生命力就会日渐消亡。
当内容的密集程度以及和人的交互频次变得更高时(实时或近似于实时),媒体的形式就会发生改变。
人们如果和来源于真实世界中的信息进行深度交互,则会是直播这样的形式,而如果是和来源于虚拟世界中的信息进行深度交互,则会是游戏这种形式。
相比起媒体、社区、社交网络里的内容,游戏的内容会给用户带来更高的信息密度、更深的信息交互、更频繁的交互次数。当然,游戏这种内容也需要更多的投入、花费更长的时间才能生产,这一点和影视、动画会更相似。
这种创意类的内容,不仅需要人们以某种方式将真实世界进行数字化,更需要人们在虚拟世界中创造原生的内容,再将其二者结合形成全新的数字内容。
数字化的内容无论是在信息体量、编辑性等层面,都远超来源于真实世界的内容,它们不仅仅是图文或视频流,而是可以实时地进行动态可交互的内容,这必然会对人们的生产能力提出了更高的要求。
站在内容的角度来说,文字、图片、长短视频等不同媒介的形式,决定了内容的呈现方式,也就在媒体、社区等产品形式中,影响了用户和内容之间的关系和交互方式。
现阶段的各种媒体、社区、社交网络上的内容,每天都产生巨量的内容,以至于基于社交关系链传播的信息也已经无法确保是自己想看的内容,从而人们开始使用机器去分析用户的偏好,并更加高效地让信息去找人。
创意内容和游戏内容都具有结构化的数据,长远来看,这也为人们使用机器来生成内容提供了基础。而在更近的未来,机器将会协同用户产生更加动态和丰富的内容。
二、内容生成的发展逻辑
1. 内容生成的不同阶段
云和 AI 技术的发展,让社交和娱乐方式发生了一个微妙但重要的转变:从以事件为中心而展开的传统互动,转向到以人为中心的自发互动。
随着用户生成内容(UGC)的激增以及 AI 技术逐渐成为创意实现的工具和过程本身,我们在使用新方法创建内容时,也会解锁新型的媒体、社交、社区和游戏等体验。
如果将内容的体量、内容的生产方式和内容的主要表现形式同时考虑,我们能得到这样的一个结构:
事实上,目前我们处于上述第 1 和第 2 阶段。当前娱乐行业中的大部分电视、电影、音乐和游戏,都是由大规模的专业创意团队所创建的。这些产品大多数都是针对单人的体验而开发的,这意味着:当我们在产品中增加同时参与内容交互的用户时,这些体验实际上并没有改变。
正如上文所说,当前市场中大部分的专业新闻媒体、流媒体、非沙盒类游戏等内容都属于第 1 阶段,自媒体、沙盒游戏等内容则属于第 2 阶段,而更广泛意义上的社交媒体、社交网络和社区则会同时横跨 1 和 2 阶段。
当然,ABC 技术(AI, Big Data, Cloud)已经被逐渐地应用到行业中,在一定的规则和约束下,协助人们更有效率地生成数字内容,这也是第 3 阶段所描述的内容生成。
在 AI 、云计算和大数据的支持下,这部分内容将会是天然的动态生成,也因此能够同时适应多人的动态体验。
第 4 部分则是完全由 AI 自动生成大量且丰富的内容,从而支持 Metaverse 中用户的内容消耗需求。
《GTA 5》的开发周期长达 5 年,总共资金投入预计为 2.66 亿美元,有超过 1000 名开发人员参与到制作中。而元宇宙的容量可能会是《GTA 5》的数百万倍以上,并且还是多人实时动态交互的。因此,元宇宙的诞生和持续运行,必须使用 AI 来进行内容的生成。
从真实世界和虚拟世界的发展光谱来看,第 123 阶段都属于数字化的真实世界,而第 4 阶段则完全属于原生的虚拟世界。
2. 与 AI 一起共同创造
我们知道,无论是媒体还是社区,都依赖于用户所产出的数字化内容。
为了将这部分内容更快速且有差异化的方式进行生成,计算机视觉技术使得我们能快速的将真实世界的信息,通过照片和视频的方式传输到数字世界中,并在计算机图像技术的帮助下,我们能在任何一块屏幕上看到这些内容。
在阶段 1 和 2 制作,只有少数的人是内容的生产者(相对来说)。但 AI 能够让内容的生成变得更加的民主化,进一步降低内容创造的门槛,将其变得更加简单。
有了 AI 工具的协助,更多的人会成为创意工作者。我们能以轻量化和模块化的方式,将具体的指令、图像和逻辑处理方式,转换为可投入生产的资产,从而极大地减轻了编码、绘图、动画等工作的负担。
我们知道,逻辑是决策的依据,语言、动作和听力是这种依据的传递对象;而文字、图像和音乐则是媒介,我们可以通过数字化的方式将其呈现在屏幕上。因此,机器能生成的数字内容分为逻辑(RL/SL/USL)、语言(NLG+TTS)、动作(MG+CG)等。
OpenAI 在今年发布的 GPT-3 支持多模态的人机交互,并非常动态地进行学习,能生成远超 GPT-2 表现的文字。而 TTS、NLG、MG 等则是让机器能够生成对应的媒介。
与此同时,AI 能通过理解游戏或电影剧本的信息,快速学习剧本内容,在给定的限制条件下,生成合理的剧情线以及对应 NPC 的对话与翻译。
事实上,与通用人工智能不同的点在于,虽然看起来游戏或电影的内容非常宏大,但事实上剧本可能就几百页,其包含的信息量是可以接受的。
Morpheus Cloud - Storyline/Dialogue Generation
在给定知识框架下的,AI 变得能逐渐地理解创作者的意图,不仅能控制 NPC 对用户交互的不同反应,也能从而与用户一起创造个性化的遭遇和动态的剧情内容。
除此之外,如果把剧情或者叙事看成广义的内容,那么人们可以在 AI 的协助下,可以将现有的图文和视频内容升级成实时交互的内容。无论是物体还是虚拟形象,内容中的一切也将逐渐实现“万物可交互”。
传统的数字化内容的确包含人的数字化,从而我们可以使用数字化的形象,并在虚拟世界进行内容的交互。
当 AI 打造的智能体能主动参与虚拟世界的变化和与真实世界的交互中时,它就成了“虚拟人”。
由于虚拟人本身就是数字内容,所以当具有一定智能的“虚拟人”出现后,由于他们能自主地产生并改变一定程度的数字内容。这时,媒体的生产关系和人们对于内容的供需关系就会发生变化。
在 AI 的协助下,这些由“虚拟人”所产生的内容,能比真人媒体从业者更具时效性和规模性。因此,首先变化的会是社交媒体的形式和内容。其次,社交媒体的内容变化将会带来用户组织结构的变化,从而影响社交关系链的变化。
在这个基础上,当真实世界中的我们建立了社交关系,很可能是因为某个“虚拟人”在和另外一个“虚拟人”互动时,提起真实世界的双方,从而诞生新的社交场景和新的社交网络。
当然,会同步改变的还有社区的形态。AI 学习的数据不仅是结构化的,也是严格平等的。
因此对于“虚拟人”来说,社区的话题、内容和领域是完全可以被他们所掌握和生成的。我们可以大胆设想,当真人在一个由虚拟人组成的社区中,会和虚拟人产生的内容发生怎么样的交互?假如这些内容是来源于游戏,我们是否可以直接进入到游戏中和社区中的虚拟用户进行对战和游玩?这是否带来了新的游戏入口和场景?...
事实上,AI 除了需要在逻辑端进行决策的生成,更需要将这一类更高级的指令传递给图像,让图像根据人的交互运动起来。
深度学习可以在让 AI 控制的角色运动变得更加连贯和顺畅,人们可以在其运动的过程中通过调整各种参数,使其表现出不同的效果。
Morpheus Cloud - walkAI
另外,人们同样在尝试使用 AI 来生成数字化的音乐和艺术。OpenAI 发布的音乐生成系统 Jukebox 是个神经网络系统。通过不同流派、艺术家和歌词作为输入,Jukebox 能够输出从零开始创作的新音乐样本。对于艺术来说,人们通常把使用 GAN 技术生成的艺术统称为 GAN 主义艺术(GANism)。
在 2018 年,Adobe 举办的发布会,真实地展示了如何将 AI 运用在艺术与设计中。无论是 Fast Mask 实现的智能抠图,还是能够将静态图片生成动态视频的 Moving Stills,还是各种艺术字体的自动生成等等,无不让现在的设计师和艺术家们瞠目结舌。
Adobe - Moving Stills
三、消费科技如何改变内容生成?
1. 打造更具交互性的媒体内容
当前媒体几乎已经都有了数字化的产品,传统的纸质媒体也有了电子版,同时它们也开拓了新媒体的传播方式,通过数字化的创作将文字、图片、长短视频等方式融入到了内容中。
对于具有独立站点的媒体来说,选择当下用户聚集的平台几乎是必须的选择。无论是自媒体还是社交媒体,作为媒体的核心命题是:如何用更少的投入和花费,换取大的传播影响力?
而任何一个带有媒体属性的平台都会考虑接下来的一个问题:如何帮助创作者在保持内容差异化的同时,提高内容产出效率?
事实上,在图文时代,平台基本都会提供富文本编辑器;而在(短)视频时代,平台工具属性的强弱决定了用户能使用其产生内容的丰富程度和效率。
而视频的核心就在于视觉效果,因此计算机视觉技术在这个领域能够充分的发挥出潜力,让各式各样的视觉效果以更简单和有效的方式加在录制的视频上或直播中。
工具为平台积累了初期用户,再通过将其内容沉淀下来,通过算法或其他机制进行分发与推送,这样一个同时带有媒体属性的内容产品就出现了。
这样的内容产品,究竟是要走向社交媒体还是社区,得根据内容和交互是偏向用户还是内容本身,才能进行判断。如果是用户,则是社交媒体属性;而如果是内容,就是社区导向。
对于媒介来说,视频之后就是实时互动的沉浸体验,或者内容的交互对象变成了虚拟世界的智能体。由于在数字内容中,游戏的交互性和沉浸性是最强的,因此前者的方式更多可能是实时的游戏社区,或者将游戏化的交互方式带入媒体产品。
而后者则由于虚拟人本身就是数字内容,当具有一定智能的“虚拟人”出现后,由于他们能自主地产生并改变一定程度的数字内容,媒体的生产关系和人们对于内容的供需关系就会发生变化,这也就带来了新的交互关系。
同时,我们也能看到,从传统的电视内容和新闻媒体,到现在的短视频和作为媒体的内容,其创作门槛和传播机制,变得越来越自动化和轻量化。这正是技术的功劳,它让内容生成和分发变得更加智能,从而释放了用户的内容创造力,让每个人都能够以非常便捷且高效的方式创作实时互动的内容。
在交互性上来说,YouTube 的交互更像是把传统电视的遥控器搬到了屏幕中。
虽然 UGC 给 YouTube 带来了非常多的内容体量,但用户和内容的交互还是基于传统的“搜索+推荐”的逻辑。
作为长视频的标杆,YouTube 是一个几乎不用交网费的视频网站,因为其最大优势其实是 Google Peering 为 YouTube 提供的免费带宽。从专业的媒体记者到大街上的任意一个人,只要想通过网络以视频的方式创作并分享内容,无论视频有多长,YouTube 都给你提供高清、高码率、高通达的技术服务。
因此,YouTube 对内容创作者是纯粹的后付费,它也几乎不会出现国内视频网站那样,越过和创作者的分成计划,直接为高价值的内容生产者支付高额签约费。
而在中国是否能用 YouTube 的逻辑去重现呢?答案其实非常明显。在中国,带宽、云计算和其他数据成本无法以最直接的方式被企业所降低,因此要么限制内容的时长,要么需要使用其他方式进行商业化。
我们也能看到很多做视频导向的媒体和社区,一开始都会讲一个烧钱积累用户,然后对用户进行商业化变现的故事。但并不是所有企业都能把这个故事实现,因为这不仅仅和技术相关,更多会和用户和内容本身的交互相关。
对于 TikTok 来说,短视频的确为其在带宽成本上降低了很大一部分,同时也把实时的交互融入了用户的观看体验中,而不是像图文一样,将用户和内容的交互限制在评论中。用户可以随意滚动与浏览视频,并快速且简单地对他们喜欢的视频进行交互。
事实上,TikTok 从根本上改变了我们对内容的思考方式,内容将不再是我们被动接受的东西。简单且沉浸的交互方式配合极强的推荐算法,能够让我们不间断地在不同人创造的内容世界中体验。一旦不喜欢,就可以快速抽离,系统也会重新推荐内容。
如果不把 TikTok 看成一个媒体或者社区,而将其看成一种游戏化的入口,不仅通向各种数字化的真实世界,也通向了原生的虚拟世界。长视频和短视频是不同类别内容的不同互动形式,只不过短视频能够以更快的刷新频次,主动地与用户进行交互。
我们也能看到,当用户在生产这一类的视频内容时,会使用各种图像和视觉技术,快速的实现内容的差异化。这些技术或者说视觉效果,在协助单个内容的生成时,也带有了社交属性,大家都可以使用这样的效果来分享不同的内容。
也就是说,在生成内容时,技术能在内容和用户之间创造更多的交互方式,进一步增加内容的多样性。同时,技术能让用户和内容的交互变得更加的动态,不断地创造玩家喜欢的内容。
讨巧的点在于,无论是长视频还是短视频,用户也许无法在某一个视频内容中体验到动态的内容生成,但可以在同样的主题、音乐和滚动播放中,不断地感受到不同内容的动态出现。
让用户在内容的外部感受到动态交互,其实就是推荐算法等技术所实现的。
如果用户希望在内容的内部进行更深层的动态交互,那么我们需要技术去理解内容的逻辑,而不仅仅是在视觉和图像层面将内容变得不一样。
这就需要更多的 AI 技术来实现:逻辑端的决策生成以及逻辑和图像动作之间的动态交互。
当内容生成的逻辑被实现,我们可以认为,这种逻辑和决策能够支持用户和任何一个视频甚至实时的直播内容进行个性化且动态的交互,通过自动地生成内容、延伸内容的深度,不断地给用户带来更加沉浸的内容体验。
有趣的是,具有高度动态且个性化交互的内容,我们称之为:游戏。
2. 不断游戏化的内容和社交关系
在这个时代里,随着真实世界的不断数字化以及原生虚拟世界的靠近,人们的娱乐方式逐渐从线下转移到线上的泛娱乐产品。作为现代大众最重要的娱乐方式之一,游戏已然成为继文字、图片、视频之后,新的大众传播媒介。
数字技术使得游戏从一种真实世界中的物理媒体,逐渐演变为具有互动性的数字化内容。作为内容的游戏,有着高密度的内容以及自由的交互,让玩家在不同的机制和玩法中,愉快地交出了自己的时间。
作为游戏的内容,或者说“游戏化的内容”,指的是将游戏机制和玩法,运用到其他领域来引导用户和内容进行更加深度的互动。
和其他媒体相比,游戏会使用最先进的技术来吸引观众和玩家,并且给予玩家远超文字、图片、视频的沉浸式交互体验。
事实上,游戏几乎可以包含所有的数字内容交互方式,同时我们可以将视频看成无法交互的游戏片段,把图片看成游戏中静态的某一帧,把文字看成游戏剧本或者某一个描述。虽然这样的描述会带有些许电影的元素,但数字化的游戏和电影在往同样的方向发展。
与电影所展现的导演或编剧的意志不同的是,游戏诞生第一天起,它就所代表了个性化交互与体验。不断突破的技术,在让游戏本身变得越来越沉浸和自由的同时,也将游戏所包含的互动方式和社交潜力,带给了其他行业。
随着 Fortnite,Roblox,王者荣耀等游戏的出现,下一代的游戏,不仅仅是作为内容的游戏,而将更多成为社交关系的新载体。
用户在游戏中能进行个性化的创造,制作自己的剧情、角色等体验并分享给其他人。在虚拟世界中两个完全不相识的人,将在共同体验游戏内容的同时,进行社交与其他行为,这也为下一代的消费提供了源源不断的新场景。
值得我们注意的是,在不断走向完全由 AI 驱动的 Metaverse 的过程中,下一代的游戏和内容将由 AI 和人共同驱动。同时,我们的社交方式会因为 AI 所生成的内容而改变。
在获得更多的内容供给时,我们会转向自己的需求。
如果在真实世界中一样,我们每天的遭遇并不是提前设定好的,都是基于一些独立而随机的事件来驱动我们的探索,在以游戏为代表的虚拟世界中,我们可以与朋友一起自由地探索虚拟的内容。
过去我们在各种社交软件上认识了新朋友后,我们会邀请他们一起玩游戏从而增进关系;但现在,更多的情况是,我们在游戏中直接认识新朋友,并在一起体验的过程中进行社交。
游戏内的社交会发生的非常自然,用户不再需要去强迫自己接受社交。每个人都有属于自己的角色和状态,同时游戏本身也会为用户提供各式各样的场景和话题,这也为用户提供了现成的社交环境。
用户之间为了实现各自的目标,需要与其他玩家和虚拟人物建立联系并互动。
与此同时,AI 除了能协助我们实现场景和剧情的个性化生成,为我们提供社交的必要环境和动力,也能打造数字世界中的虚拟人,为我们带来新的社交关系与对应的场景。
事实上,除了顶级明星外,大部分明星的粉丝数量甚至不如游戏、漫画等虚拟内容中的角色的多。
以强化学习为代表的 AI 技术,在可预见的未来里,能够使用游戏中玩家的行为数据来进行训练和迭代,从而能够在限定的泛娱乐领域中打造真正智能的虚拟角色,带来新的社交体验。
写在最后
正如 a16z 的 Jon Lai 所说:
“关于元宇宙的最令人兴奋的部分,不是我们如何从技术上构建它,而是它具有改变我们彼此社交方式与社会形态的潜力”。
技术将在虚拟世界中为人们带来新的社交关系,也会带来新的生产关系。自动化生成的内容体量正在加速爆发,我们当前所处的 UGC 和 PGC 时代很快将会过去,人类会和 AI 将会共同创造更加动态、丰富且个性化的内容。
今天我们认为的媒体、游戏、社交等概念,将会在不远的未来被新的概念所替代,虚拟世界中的社交互动将具备更类似于现实世界中的随机性和偶然性。
Fortnite - Travis Scott
如果有这样的一个问题:元宇宙最有可能发生在哪一个领域?
从当下的角度来看,也许是游戏领域;在技术的支持下,当游戏化的动态交互内容在各行业涌现时,我们会发现,其实是整个社会在共同向元宇宙发展。
事实上,我们也可以将“社会”看成一个由人和生活组成的内容产品,这也是一个永远会被普遍需要的产品。当技术进步能够满足新的需求时,产品当然也需要迭代和更新。
我们在渴望被连接的同时,也在不断地尝试超越连接本身。
本文来自微信公众号:rct studio