该技术通过输入语音及人脸图像,基于三项自研核心算法实现:语音生成高精度三维表情参数、生成自然稳定头部动作参数、参数驱动人脸生成视频。系统输出嘴型精准同步、头部动作自然且含眨眼细节的说话人脸视频,实现音画高精度同步与拟真运动。
技术提供单位:西安交通大学技术转移中心