游戏3d好玩的电脑游戏排行2024电脑游戏pc游

发布日期:2025-04-04 07:20:14 作者: AG凯发K8国际


  腾讯混元今日公布图生视频模子并对表开源,同时上线对口型与举措驱动等玩法,并援帮天生后台音效及2K高质料视频。

  基于图生视频的才略,用户只需上传一张图片,并简短描绘盼望画面怎样运动、镜头怎样更改等,混元即可遵循用户央浼让图片动起来,造成5秒的短视频,还能自愿配上合意的后台音效。

  别的,上传一张人物图片,并输入盼望“对口型”的文字或音频,图片中的人物即可“讲话”或“唱歌”;倘若遴选举措模版,还能一键天生同款舞蹈视频。

  此次开源的图生视频模子,是混元文生视频模子开源处事的延续,模子总参数目仍旧 130 亿,合用于多品种型的脚色和场景,囊括写实视频创造、动漫脚色乃至CGI脚色创造的天生。开源实质蕴涵权重、推理代码和LoRA锻炼代码,援帮斥地者基于混元锻炼专属LoRA等衍生模子。

  据混元开源技能讲述披露,混元视频天生模子具备矫捷的扩展性,图生视频和文生视频正在肖似的数据集上发展预锻炼处事。正在仍旧超写实画质、贯通演绎大幅度举措、原生镜头切换等个性的根源上,让模子不妨缉捕到充分的视觉和语义消息,并联合图像、文本、音频和样子等多种输入条款,完成对天生视频的多维度管造。

  混元视频天生模子开源以还,不停仍旧较高的热度,目前Github平台上Star数突出8.9K。多位斥地者自觉创造基于社区Hunyuanvideo的插件与衍生模子,积蓄突出 900 个衍生版本。更早开源的混元DiT文生图模子,正在国表里衍生模子数目多达1600多个。

  目前,混元开源系列模子依然完备掩盖文本、图像、视频和3D天生等多个模态,正在Github累计获取超 2.3 万斥地者眷注和star。

  • 网站TXT地图
  • 网站HTML地图
  • 网站XML地图