(腾讯云小样本数智人)
出品 | 搜狐科技
作者 | 潘琭玙
4月25日,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性,可以轻松实现“自助式”数智人生产制作。据腾讯云智能数智人产品总经理陈磊介绍,小样本数智人12小时就能够出来demo,并且成本已降至千元级别。
陈磊表示,以前做一个数智人是几个月,去年是以几周为单位,“今年我们做一些2D小样本数智人已经达到小时级”。据悉,此前爆火的虚拟人“美妆达人柳夜熙”,3-4分钟的视频制作周期为一个多月,视频制作成本高达几十万。
高成本、长周期以及难以逾越人脑的AI技术也限制了数字人、虚拟人的大规模落地。
目前腾讯小样本数智人的生成需采集3分钟真人口播视频、100句语音素材,之后通过音频、文本多模态数据输入,能够实现实时建模并生成高清人像,制作周期缩短至24小时。
展开全文
陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。与2D真人精品数字人相比,小样本数智人所需素材简单,成本较低,同时可根据文本设计手势,唇动、口型、表情复现真人风格。
成本降至千元,2D视频背后是3D人像做支撑
据腾讯优图实验室研究总监汪铖杰介绍,“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。”
他介绍,腾讯数智人技术包含语音、视觉、自然语言处理等技术,“最近半年我们聚焦在加入人像编辑与3D技术。我们的核心追求,一个是如何做得更高效,另外是把数智人做得更逼真。”
在会后与搜狐科技在内的媒体对话中,汪铖杰也表示,以前行业做的数智人效果未必好,有的一看就知道特别假;现在的数智人看一眼,还要猜测它们到底是真还是假。
数据显示,自2021年7月至今,我国虚拟人、数字人赛道融资总金额已超过8亿人民币,自2021年起,数智人市场因部分技术低门槛已开始陷入同质化竞争。但对此,汪铖杰表示,当下正处于“以一种模式置换另外一种模式的过程”。数智人将带来新生产模式的出现,而在此之后大家会找到自己的定位。
在成本方面,陈磊透露,小样本数智人成本现在主要是千元级别,随着技术发展,成本的门槛会越来越低。但是,3D超写实、高精定制等高技术要求的数智人仍要求高成本,以及具体针对客户需求进行定制。
陈磊也进一步解释,若有低成本或是普惠化的方式,会是腾讯数智人的追求方向。但目前,3D传统的建模,从原画设计、建模、驱动、绑定等,一条链路上有很多传统美术的路径,成本较难迅速降低。
3D 建模数字人精美度高,但因过高的成本和制作周期在商业化应用上存在一定难度,更适用于大企业服务。小样本2D数智人则开拓了市场空间较大的直播带货、短视频制作、偶像娱乐工业、游戏和客服等使用场景,能够很大程度降低时间成本、提升效率并且可控性高。
对于大规模落地的可能性,陈磊指出,时间成本、金钱成本与稳定性是眼前的阻碍,“这三方面如果都解决了,对个人而言做自己的数智分身都是触手可及的。”
在腾讯数智人的构想中,未来将以自助式为主,客户自己开账号,下单,购买,上传素材并自己训练,最终输出效果,未来将是独立式生成的一站式模式。
朝着AIGC生成的框架升级
元宇宙概念退潮后,数字人作为元宇宙的“原住民”并未熄火。速途元宇宙研究院数据显示,2022年虚拟人市场规模同比增长64.5%,增速达到近三年峰值。在AIGC技术的浪潮下,数字人也再次乘上风口。
根据国盛证券报告,在当前以 2D 仿真数字人为主的情况下,AIGC 可以提高皮套生成的效率,并且叠加 NLP 模型后,有望实现 AI 驱动的数字人。
陈磊也透露,腾讯云数智人正朝着AIGC生成的框架去做改动,做一些生成技术的更新。“AIGC在我们数智人的技术中有挺多的,包括口型生成、人脸生成等,在3D数智人也朝生成式的方向去走。”
据悉,在文字生成之外,腾讯数智人也将融合不同的模态。在语音和视觉图像生成建模上,也会基于AIGC技术进行改动升级。另外,陈磊也透露在“卡脖子”的算力方面,数智人产品业务并不会受到影响,“囤货还是蛮多的”。
陈磊直言,在元宇宙过去几年成立了几万家数智人公司,传统美术公司或是科技公司都在干同样的事情,很过热。”但他明确,腾讯将基于服务行业的角度,专注做厚aPaaS数智人平台,以API接口形式向合作伙伴开放“产、销、服”一体化服务。
他表示,腾讯的数智人追求的是两个方向,一个是通过AI技术,能够提升智能性,更智慧。第二个是更懂行,我们进入到各种各样的行业和场景,做深入的场景集成。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权【久伴学 9banxue.com】发表,未经许可,不得转载。