• 最新
  • 热门
  • 所有
  • 期货
  • 外汇
  • 股票
通义万相「音频驱动视频生成模型」开源,可生成分钟级视频

通义万相 「音频驱动视频生成模型」 开源,可生成分钟级视频

2025 年 8 月 27 日
Circle能否成为下一个英伟达?巨大潜力还是巨大泡沫

Circle 能否成为下一个英伟达?巨大潜力还是巨大泡沫

2025 年 8 月 27 日
TechWeb微晚报:iPhone 17系列售价曝光,华为再添「绝界」商标

TechWeb 微晚报:iPhone 17 系列售价曝光,华为再添 「绝界」 商标

2025 年 8 月 27 日
双创板块承压,创业板ETF(159915)、科创板50ETF(588080)等产品聚焦科技创新机遇

2025 乙巳年 150 克方形金币价格 (2025 年 08 月 26 日)

2025 年 8 月 27 日
China's Stock Market Looks to Shed Casino Image as Investors Mature

China's Stock Market Looks to Shed Casino Image as Investors Mature

2025 年 8 月 27 日
比亚迪仰望U9工程测试车 打破全球电动汽车极速纪录

比亚迪仰望 U9 工程测试车 打破全球电动汽车极速纪录

2025 年 8 月 27 日
宏观氛围有所缓和 沪锌短期表现较为强劲

安集科技 2025 上半年净利增 60% 部分产品进入放量阶段

2025 年 8 月 27 日
纸黄金震荡下行 提前降息可能性大增

午后,寒武纪股价短暂超越茅台,但沪指差点失守 3800 点!怎么回事?

2025 年 8 月 27 日
债市日报:6月30日

国产芯片替代加速!芯片 ETF 上涨 4.76%,晶晨股份上涨 12.88%

2025 年 8 月 27 日
钌回收价格多少钱一克(2025年06月27日)

2025 年梅花金银蛇纪念币价格 (2025 年 08 月 26 日)

2025 年 8 月 27 日
2025年6月27日ETF黄金最新净持仓量数据

离开王慧文的两年,这位创业者赶上了梁文锋的头班车

2025 年 8 月 27 日
平安银行2025年中报:夯实可持续发展基础,整体经营保持稳健

平安银行 2025 年中报:夯实可持续发展基础,整体经营保持稳健

2025 年 8 月 27 日
消息称传音智能手机上半年在非洲出货超过1800万部 市场份额接近50%

消息称传音智能手机上半年在非洲出货超过 1800 万部 市场份额接近 50%

2025 年 8 月 27 日
2025 年 8 月 27 日 星期三
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票
  • 黄金
  • 期货
  • 外汇
  • 基金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票
  • 黄金
  • 期货
  • 外汇
  • 基金
2025 年 8 月 27 日 星期三
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
广告
首页 黄金

通义万相 「音频驱动视频生成模型」 开源,可生成分钟级视频

来自 禾湖财经
2025 年 8 月 27 日
在 黄金
0
通义万相「音频驱动视频生成模型」开源,可生成分钟级视频
36
SHARES
102
VIEWS

【TechWeb】8 月 27 日消息,通义万相又迎来重磅开源,全新发布的音频驱动的视频模型 Wan2.2-S2V 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

据介绍,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等多种类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

通义团队基于通义万相的通用视频生成能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果。

生成时长上,Wan2.2-S2V 单次生成的视频时长可达分钟级。

Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames(历史参考帧) 的长度从数帧拓展到 73 帧, 从而实现了稳定的长视频生成效果。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,实现镜头运动、角色轨迹和实体间互动,让视频主体的运动和背景的变化更丰富。

同时通过多分辨率训练、支持模型多分辨率的推理,Wan2.2-S2V 可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

目前,用户可在 Github、HuggingFace 和魔搭社区下载模型,通过阿里云百炼调用 API,或在通义万相官网直接体验。

Scan

禾湖财经

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

Circle能否成为下一个英伟达?巨大潜力还是巨大泡沫

Circle 能否成为下一个英伟达?巨大潜力还是巨大泡沫

2025 年 8 月 27 日
TechWeb微晚报:iPhone 17系列售价曝光,华为再添「绝界」商标

TechWeb 微晚报:iPhone 17 系列售价曝光,华为再添 「绝界」 商标

2025 年 8 月 27 日
双创板块承压,创业板ETF(159915)、科创板50ETF(588080)等产品聚焦科技创新机遇

2025 乙巳年 150 克方形金币价格 (2025 年 08 月 26 日)

2025 年 8 月 27 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

OR

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录