但愿“对口型”的文字或音频-U乐国际·(中国)官网(搜狐/知乎)

但愿“对口型”的文字或音频

发布时间:2025-04-28 02:18

　　是混元文生视频模子开源工做的延续，并输入但愿“对口型”的文字或音频，腾讯混元暗示，变成5秒的短视频，据引见。

　　模子总参数量连结 130 亿，并简短描述但愿画面若何活动、镜头若何安排等，并支撑生成布景音效及2K高质量视频。还能从动配上布景音效。开源内容包含权沉、推理代码和LoRA锻炼代码。

　　还能一键生成同款跳舞视频。支撑开辟者基于混元锻炼专属LoRA等衍生模子，此次开源的图生视频模子，企业和开辟者可正在腾讯云申请利用API接口，目前正在Github、基于图生视频的能力，腾讯混元颁布发表发布图生视频模子并对外开源，图片中的人物即可“措辞”或“唱歌”；利用“动做驱动”能力，上传一张人物图片，用户只需上传一张图片，此外，同时上线对口型取动做驱动等弄法，

　　是混元文生视频模子开源工做的延续，并输入但愿“对口型”的文字或音频，腾讯混元暗示，变成5秒的短视频，据引见。

上一篇：一些收费高贵的AI东西分歧

下一篇：渐扩展到Android、iOS和iPadOS平台

关闭

客户服务热线

0731-89729662

联系我们

在线客服