像做 PPT 一样做短视频和直播?
让创意被激发,让创作更简单
(资料图片)
文 | 陈首丞
编 | 石灿
8 月 10 号的快手光合创作者大会上,高管圆桌环节开始前,一笑、于越、Thomas 和笑古分别在视频中做了自我介绍。
只不过,视频中出现的并非真人,而是 " 一笑分笑 "、" 于越分越 "、"Thomas 分托 " 和 " 笑古分古 " ——快手高管们的数字人分身。
这些真假难辨的数字人,来自快手首次公开的 AIGC 数字人解决方案:快手智播,可以低成本创建数字人直播,制作数字人短视频。用户只需 3-5 分钟的少量视频素材,用时 3 天花费千元,就可制成孪生数字人。目前,快手智播可在本地消费、本地生活、电商直播等多种场景落地。正如快手 AI& 用户增长业务负责人王仲远所说:身处这场 AI 技术变革之中,我们坚信 AIGC 将赋予普通用户更多的创作权力和自由,也坚信 AIGC 将成为短视频内容生产的基础设施。
数字人,用在哪?
在直播带货的达播领域,人货场仍然是不可切分的紧密三角,数字人很难取真人而代之。但在非达播的场景,数字人有广阔的应用空间,且能大幅提升从业者的工作效率。
据了解,仅以快手为例,AI 数字人在本地生活、本地消费、24 小时店播和海外商业素材生产等场景有广泛的应用,且曝光转化率等核心指标和大盘相比高达 203%。
以快手的快聘业务为例,快手智播月均生产数字人素材上千条,以中低粉段达人拍摄视频为基准计算,单条短视频创作成本降低到人工成本的 5% 以下。
显然,同样是招聘,在传统的招聘平台上发布文字信息的成本,要远远低于在短视频平台制作视频的成本。在更早的时期,这一问题限制了招聘的短视频化和本地生活化,让有招聘需求的一方望而却步。
但 AI 数字人的诞生和快手智播的存在,让客户可以像做 PPT 一样做视频和直播,仅需输入文案,就可配置视频,再通过快手的算法分发逻辑,将视频推送给广大有潜在需求的人群。这不仅利用了快手的用户量和算法优势,又将招聘方的成本降到了合理的程度。
招聘之外,AI 数字人在一些领域的表现也堪称优秀。比如本地生活,有服务商一次性投入五十个以上的账号进行开播,一个月内有效总直播时长达 11640 小时,带来了 1.1 万个订单和近百万的 GMV,转化率是真人的两倍,且成本还要更低。其中,沪上吃喝玩乐花花系列账号某快餐汉堡套餐单品一个月卖出近 3000 份;某游乐园全日门票单品一个月卖出 30 万元,实际核销率接近 60%,近似真人直播效果。
至于直播带货的店播场景,在更早期的时间里,就有将 24:00-6:00 的时间段交给虚拟主播,用以保持直播间的 24 小时运营和基础商品介绍功能的案例。24 小时的 AI 数字人直播间则是更加激进的尝试,这一方面是因为数字人建模的能力在提升,达到了 " 真假难辨 " 的地步,另一方面也是因为店播本身的特殊属性:" 货 " 比 " 人 " 要更重要。
24 小时店播的效果也不比真人要差,以美妆店铺泉兮旗舰店为例,数字人测试直播半个月期间,人均观看、3s 播放率、转化效率和商品访问下单率均比该直播间真人主播表现更好,每场直播 GMV 贡献近万元。
花西子直播间也同样使用了数字人主播,并对数字人的效果表示:" 很多客户提问交流,有可能我们效果太逼真,用户没看出是数字人,还是会问很多问题,我们也能迅速回复。"
在这种情况下,AI 数字人也就有了大展身手的空间。更低的成本和更好的效果,让 AI 数字人更具竞争力。
3 分钟,3 天,千元成本 AIGC 数字人的三个关键词 数字人并非一个新鲜产物,在生成式 AI 进入该领域之前,就已经有一些数字人 IP 获得了不小的成功。
2021 年开始,与元宇宙概念相关的虚拟偶像率先出圈,如 A-soul、柳夜熙和狐璃璃等,他们往往有大平台扶持的背景,且都吸引了不小的声量,其中,A-soul 主要成员 " 嘉然今天吃什么 " 是 B 站百大 UP 主,柳夜熙在抖音拥有超 800 万粉丝,狐璃璃在快手拥有超 400 万粉丝,均是平台头部创作者。
不过,这批 3D 数字人 IP,在商业化路径上仍然走的是传统流量经济的老路,收入来源以直播打赏或者广告代言为主,这与其制作方成本的投入并不匹配。而且," 中之人 " 的存在,也让这批数字人 IP 面临一定的 " 塌房 " 风险,难以成为真正的 " 数字 " 偶像。行业中也曾有过专为直播带货而生的 IP,如遥望科技旗下的数字偶像 " 孔襄 ",不过该数字人目前已经停更,鲜有新动向。
行业中更加广泛存在的,则是数量庞大的 2D 数字人,在更早的时间段主要服务于政府、金融等行业,C 端用户则无明显感知。2023 年开始,在生成式 AI 技术的加持下,有了爆发性的增长。
一批公司也因此吃到了行业增长的红利,在抖音平台,虚拟人创业公司硅基智能已经服务了上万个客户,主要聚集在本地生活和直播电商领域,也进入了 C 轮融资阶段,是数字人直播领域的头部公司。
此外,行业内还有定位 SaaS 版本视频剪辑工具,专门服务于地方电视台,银行,国家机关和地方政企的腾讯智影,以及主要给政务,金融客户提供定制化解决方案的百度灵犀和给短视频账号公司服务的闪剪等等。
除了定位于营销场景的政企、传媒、金融行业之外,短视频和直播带货的数字人需求往往聚焦于垂类,比如短视频中的口播场景以及直播带货中的标品店播场景,这部分内容对人的表现力需求不强,因此能够由数字人完美取代。
基于此,快手自研的 AIGC 数字人解决方案快手智播有着天然优势,其与快手业务系统的深度打通,能更好的为快手生态服务。比如其完美匹配快手的直播系统和风控系统,还能自动挂车和切换讲解卡,同时回答观众的提问,和观众实时互动,这一过程又进一步节省了人力的使用。
最低只需要 3 分钟的视频和音频素材,用时 3 天,就可以制作相应的数字孪生形象,同时快手还将提供整套的 SaaS 服务工具,不需要用户另外采购任何硬件设备,只需输入短视频文案或者直播稿,就可一键生成视频或开播。这套流程在当前的技术能力下,仅需千元即可完成,而此前传统数字人制作费用一般需 10 万元以上。
据快手技术人员介绍,为了达到目前的拟真度,快手基于自研高精度 3D 面部重建算法进行了 3D 建模,还在数万小时的模特数据上进行了训练,又针对每个具体模特进行了微调。而为了实现实时性,快手还有自研的推理引擎、部署框架、以及在多个业务中得以迭代的流式的数字人生成框架,能够以秒级的低延迟实现数字人直播。
数字人背后,快手布局全模态大模型 AIGC实际上,数字人产品只是快手 AIGC 系列部署中的一环,在光合大会上,王仲远强调了一个概念:全模态、大模型 AIGC。
他表示:创作本身是一件需要创意和专业度的事情,持续创作优质作品会让很多创作者感到压力。以一个美食创作者为例,分享一道或十道拿手菜并不是难事,但长期坚持下去,总会在创意、素材和视频制作等方面遇到难题。
而所谓的全模态、大模型 AIGC 解决方案,就是为了解决创作者在创作过程中的各种痛点而生。据王仲远介绍,这套方案可以帮助创作者更好的激发创意,用户只需一个指令,就可以让大模型帮助自己完成故事撰写、脚本整理,并能够基于场景主题生成对应的图片和配乐。用户不用再绞尽脑汁反复脑暴,可以让大模型提供更多的灵感和创意。在大会上,王仲远还展示了大模型的素材绘制功能,针对周杰伦创作的歌曲《七里香》,大模型自动画出了相关画面,这也就意味着,创作者在使用快手大模型的时候,可以自由地提供场景描述来获得素材,最终简化创作视频的流程。在电商场景上,大模型也可以帮助 B 端创作者将所售商品进行 3D 化展示,进一步提升消费体验。
甚至,传统视频直播中费时费力门槛颇高的剪辑工作,也可以由快手大模型的 AIGC 解决方案取代。创作者只要自行上传相关素材,就可以得到相应的短视频内容。
此前,不少大模型产品都是针对某项具体的场景应用,譬如对话提供相应的文字解决方案或者 AI 智能生成图片。而快手的全模态、大模型 AIGC,不只定位于个别功能,而是聚焦于用户在快手的各种需求,让用户在创作视频和带货的每一步都能得到 AI 的帮助。
而这,显然更符合 AI 诞生的本意,AI 出现,不是为了取代谁的工作,而是帮助人类把工作变得更简单。全模态 AIGC 如此,快手智播这一产品更是如此。在以人为核心,以创作者为核心的基本价值观下,相信每一个快手的创作者,都可以用好 AI,在快手获得更好的创作体验。