中国移动联合研发 2D 数字人说话驱动系统:可生
IT之家 12 月 9 日新闻,中国挪动 12 月 8 日发布结合南京年夜学团队研发高保真 2D 数字人谈话驱动体系。作为领有天下范围第一用户数的通讯经营商,中国挪动每年的客户效劳经营本钱宏大。现已普遍遍及的智能语音客服虽能实现必定的营业主动应对义务,但仍然不迭人工客服背靠背,一对一的星级效劳休会。针对现实营业存在的痛点,中国挪动九天视觉团队结合南京年夜学邰颖团队,研发高保真 2D 数字人谈话驱动体系,旨在为用户供给心情天然、唇音同步跟头部姿势跟谐的数字人播报对话效劳,可利用于智能客服、教导培训、告白营销等场景。▲ 感情把持的高保真 2D 数字人谈话驱动方式据中国挪动官方先容,2D 数字人谈话驱动体系实现依据给定目的人物的照片或视频跟恣意一段音频,天生与音频同步的目的人物谈话视频流。请求天生视频里的人物真切度高,心情姿势天然,同时须要存在较高的及时性,能做到与言语年夜模子、音频分解才能无机整合,构建起人物数字替人。中国挪动九天视觉团队结合南京年夜学研发的高保真 2D 数字人谈话驱动体系,在以下三方面发展了技巧攻坚跟计划翻新:第一,机能及时:比拟以往数字人方式,在及时播报的口型天生技巧上到达了学术界当先程度,支撑中英文数字生齿型驱动,在坚持后果的情況下到达及时机能 30ms / 帧。第二,后果当先:研发二阶段进修框架,将数字人谈话驱动拆解成:从音频到口型系数跟从口型系数到天生人像两局部,下降进修难度,实现更好的天生后果。第三,情感把持:引入情感领导进修模块,支撑畸形、浅笑、惊奇、恼怒、胆怯、伤心等 7 种主流情感把持天生才能,付与天生的播报大家文感情表白才能。▲ 愉快、伤心情感下的数字人谈话天生后果IT之家从中国挪动官方得悉,数字人天生技巧上实现了端到真个二阶段 30 FPS 及时天生机能,并支撑 512*512 人脸地区天生,同时具有愉快、伤心等 7 种主流情感把持天生才能。在评测集 VoxCeleb 指标方面,该技巧的口型正确性 LMD(LandMark Distance)到达 4.3,天生天然度 FID 到达 11.1。中国挪动官方表现,该研发结果利用远景辽阔,无效下降了创作门槛,晋升了天生人物的视觉品质,已为 5G 新通话、跟留言小秘书品牌营业的拓展赋能进级。告白申明:文内含有的对外跳转链接(包含不限于超链接、二维码、口令等情势),用于通报更多信息,节俭甄选时光,成果仅供参考,IT之家全部文章均包括本申明。
申明:新浪网独家稿件,未经受权制止转载。 -->
上一篇:汽车模拟游戏下载 十大必玩汽车模拟游戏排行
下一篇:没有了
下一篇:没有了