• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
文生视频大模型,短视频的过弯点?

文生视频大模型,短视频的过弯点?

2024 年 7 月 30 日
固态电池生产设备企业上半年订单激增

突袭多哈内幕曝光!以色列跨境追杀战术重大升级

2025 年 9 月 10 日
大厂外派员工,在重复中被消耗

大厂外派员工,在重复中被消耗

2025 年 9 月 10 日
OpenAI有意在AI基础设施建设上 扩大与三星电子和SK海力士的合作

OpenAI 有意在 AI 基础设施建设上 扩大与三星电子和 SK 海力士的合作

2025 年 9 月 10 日
老铺黄金,为什么总想跟黄金划清关系?

老铺黄金,为什么总想跟黄金划清关系?

2025 年 9 月 10 日
pt999铂金回收价格今日多少钱一克(2025年09月01日)

9 月 5 日扬州金店黄金 980 元/克 铂金 370 元/克

2025 年 9 月 10 日
游戏ETF(516010)涨超3%,游戏行业景气度与估值空间引关注

宁德时代宜春锂矿复产在即 将尽快召回员工

2025 年 9 月 10 日
TechWeb微晚报:iPhone Air国行仅支持联通eSIM?六部门整治汽车行业乱象

TechWeb 微晚报:iPhone Air 国行仅支持联通 eSIM?六部门整治汽车行业乱象

2025 年 9 月 10 日
算力硬件股探底回升,指数翻红,人工智能ETF(159819)盘中成交额超15亿元

第二批科创债 ETF 获批;中加基金原董事长加盟华宝基金

2025 年 9 月 10 日
化工龙头ETF(516220)连续4日净流入,资金积极布局,机构:看好化工龙头和新材料成长

中金:光伏行业 「反内卷」 进入关键观察节点

2025 年 9 月 10 日
世界黄金协会要搞「新物种」?一图看懂数字黄金是什么|

世界黄金协会要搞 「新物种」?一图看懂数字黄金是什么|

2025 年 9 月 10 日
pt900铂金回收价格今日多少钱一克(2025年09月01日)

欧盟发布 54 亿欧元核聚变投资计划 上游装备、材料等环节有望需求放量

2025 年 9 月 10 日
从市值60亿到不足1亿:车车科技遭遇现实困境与规模增长挑战

大宗进口量价齐跌,新产业图景在向谁招手?

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 10 日 星期三
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 行业新闻

文生视频大模型,短视频的过弯点?

1 年 之前
在 行业新闻
阅读时间: 1 mins read
0 0
A A
文生视频大模型,短视频的过弯点?


随着今年初 Sora 的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。

猜您喜欢

不卖惨只卖书,一家书店闷声活下去

不卖惨只卖书,一家书店闷声活下去

12 月 之前
0
Gemini 2.5弯道超车背后的灵魂人物

Gemini 2.5 弯道超车背后的灵魂人物

3 月 之前
0

6 月初,快手自研的视频生成大模型 「可灵」 正式上线。可灵 AI 采用了与 Sora 相似的技术路线,能够生成具有合理运动和模拟物理世界特性的视频。

截至目前,已有超百万人排队申请内测资格,其中超 30 万人已获得试用资格,累计生成超 700 万条短视频。近日,可灵 AI 终于宣布全面开放内测,同时上线付费会员体系。

其他厂商也在迅速跟进。7 月,智谱 AI 推出 AI 生成视频模型智谱清言,用户可在 30 秒内免费生成 6 秒视频。

目前来看,被称为 「国产版 Sora」 的可灵 AI 不仅热度颇高,用户对其评价也不错,在 Sora 横空出世却迟迟未有完善产品落地的背景下,可灵 AI 甚至被视为 「业内最佳」。

文生视频大模型目前效果如何?为什么厂商们纷纷开始卷文生视频大模型?对于短视频的竞争格局会有哪些影响?

剑走偏锋,「可灵」 大力出奇迹

可灵 AI 上线至今还不够两个月,已经经历了三次迭代更新,从最开始的文生视频,到现在已可支持图生视频、视频续写、多尺寸选择,在生成细节、构图、运镜美观性、光影方面都有很大改善。

据快手视觉生成与互动中心负责人万鹏飞表示, 可灵 AI 生成的视频分辨率高达 1080p,时长最高可达 2 分钟 (帧率 30fps),单次文生视频时长已增至 10 秒,这一指标已超越了目前市场上大多数视频生成工具。

当下,布局文生视频赛道的大厂和创业公司并不少,不过大部分都没有公布文生视频模型的参数量级,快手也表示 「不便透露」。因此,各企业均主要围绕生成视频的时长、视频的分辨率等指标展开比拼。

目前来看,能实现 「分钟级」 内容生产能力的,之前仅有 Sora 一颗独苗,能够生成长达 60 秒的高清视频,现在可灵 AI 则刷新了这一指标,将生成视频时长拉长至 2 分钟。

纵观其它同类竞品,腾讯宣布旗下文生视频模型生成时长达到了 16 秒,预计在三季度达到 20 秒;字节旗 「即梦」 最长支持生成 12 秒视频;美国创企 Runway 支持生成 10 秒左右的视频,最多可延长至 18 秒,但大部分文生视频产品的生成时长都在 10 秒左右。

所以,光看 「时长」 这一点,可灵 AI 确实暂时处于领先状态;而从 「生成内容」 这点来看,大部分用户的评价均是 「远超预期」。

比如跟 Runway 的 Gen-3 相比,其只有文生视频功能,但没有图生视频功能;而可灵 AI 通过迭代新增的运镜控制、首尾帧自定义等功能,也获得了用户的一致好评。

当然,可灵 AI 也还称不上 「完美」,有用户认为其对艺术风格、摄影语言容易把握不准确,但在 「吃东西」 这一领域,可灵 AI 的表现要比其他产品更优秀,这可能也跟快手短视频更擅长真实画风有关。

虽然,目前还不能说可灵 AI 已经能在业内 「一骑绝尘」,但至少已做到了 「一鸣惊人」,这样的成绩背后,则是快手版的 「大力出奇迹」。

程序员出身的快手 CEO 程一笑,早在去年初快手就启动新的 AI 战略,聚焦大语言模型、视觉生成模型、多模态模型等方向。

去年 10 月,快手重启了一个名为 「噗叽」 的项目,是一款将静态图片生成 Gif 表情包的工具软件,这也是可灵 AI 的前身。

真正的变量则是今年初 Sora 的重磅发布,这让万鹏看到了 DiT(新型视频生成架构) 的可行性,快手才开始探索打造 「中国版 Sora」。

据自媒体 「硅星人 Pro」 报道,可灵项目开始后不到一个月,就获得了程一笑的支持,上升为公司战略级项目。可灵团队也很清楚,项目就是要赶在前面,抢先市场,否则就没有意义。

可灵 AI 从 3 月立项到 6 月上线,仅仅花了 3 个月的时间,除了快手内部的资金、资源向其倾斜之外,技术大牛的加入也加速了可灵项目的研发创新,比如曾任腾讯 AI 实验室高级研究员的王鑫涛加入了快手视觉生成与互动中心。

引用知乎用户 「小林不加班」 的回答,可灵 AI 采用了类 Sora 的技术路线,并结合了多项自研创新技术,对视频处理、生成能力以及空间压缩,这三个问题进行优化,使得模型效率和性能提高、能够捕捉到更宽广的特征范围,模型对细节的识别能力也随之增强。

大厂加速,押注下一个爆款

想做 「中国版 Sora」 的可不止快手,据晚点 LatePost 报道,今年一季度,字节 AI 研发团队将视频生成模型的优先级排在了前面;百度在年初推出的视频生成模型 UniVG,也被业内视为与 Runway Gen-2 相当。

另外,文生视频领域开源产品的能力也在提升。今年 3 月,潞晨科技开源了旗下 Open-Sora 1.0 视频生成模型,目前能单次生成大概 20 秒的视频,随着开源平台的普及和能力提升,未来或许还会有更多文生视频应用落地。当然,还有业内公认最强的对手 Sora。

厂商们之所以纷纷下注,一方面是因为行业内确实存在海量的需求。相比于语言,视频和图片更接近文字,国内一些企业包括美图等,早已支持 「一键 AI 美颜」 的功能。

另一方面,随着 「百模大战」 逐渐退烧,当下的大模型企业已经不再盲目追求通用大模型的规模,而是更倾向将大模型集成到产品和服务,解决实际问题并创造真正的商业价值。

而快手之所以能够先拔头筹,首先是因为快手作为头部短视频平台,积累了大量的视频内容,同时还通过智能算法对这些内容进行细致的分类和标注,这些视频数据已经被 「清洗干净」,可以直接供可灵 AI 使用。

而在硬件储备方面,一直以来,快手与英伟达就基于视频处理有着深度合作。早在 2019 年,快手便联手英伟达部署 GPU 计算基础架构,能让业务性能平均增长了 2 倍,成本较之前节省了 30% 以上。快手在算力方面的未雨绸缪,也为可灵项目的快速推进打下了基础。

最后,当然是快手给了可灵项目最大的资源协调,有别于字节、阿里、腾讯等大厂,它们不仅要投入通用大模型的研发,旗下也有不止一个 AIGC 项目,「桃子」 那么多,哪个最先成熟,似乎还得看时机。

不过,即便可灵 AI 已经 「先跑一步」,也并不意味着其就能安枕无忧。一来,目前在文生视频领域并不存在断层式的技术领先。

爱诗科技创始人王长虎表示,Sora 最重要的贡献是验证了视频生成的规模定律。今年以来,文生视频领域之所以能够快速发展,正是因为 Sora 的出现验证出了一条技术可行性的道路。

但既然文生视频在技术上没有秘密,接下来类似产品拼的无非是算力规模、训练数据等。业内人士预计,目前各家大模型厂商都具备了视频生成能力,只是碍于算力成本以及视频效果而未有全面铺开,但这也不过是时间的问题。

二来,若只论算力,快手在国内只算是第二梯队。中信证券曾简单估算,生成一个 60 帧的视频 (约 6 至 8 秒),Sora 要生成至少约 120 万个 token,推理算力需求远大于文生文。

如果可灵 AI 持续迭代,将会对快手提出更高的算力要求,在全面公测以后,快手还能否继续向用户增加生成视频的时间,等待时间会否越来越长,其算力 「天花板」 到底在哪里,恐怕只有快手自己知道了。

事实上,包括快手在内,国内同行在文生视频领域均采取较为现实的推进方式,即保持研发进度,阶段性地产出落地。简单来说,就是先做产品再优化,赶进度先拿下市场。

快手试水商业化,意在生态

Similarweb 数据显示,可灵 AI 在 6 月初开放之后,网站用户流量呈现上升态势,7 月用户峰值接近 10 万 DAU 水平。月狐 iApp 数据显示,接入可灵 AI 的快影 App,7 月后周均 DAU 较 6 月初提升了 100 万左右。

可灵 AI 用户快速增长背后,一方面是因为用户对文生视频的 「好奇」。月狐数据对与可灵 AI 相关的社交媒体用户评论数据进行了分析,用户情绪主要表现为好奇、兴奋、期待和满意。

另一方面也少不了快手的助推。比如在快手平台中,带 #可灵 #相关话题标签的作品会获得更多流量扶持;可灵 AI 也推出了 AI 相关的内容创作活动,包括可灵 AI x 快影视频创作大赛、复活古画定向话题投稿活动。

用户规模是产品商业化的土壤,基于此,外界对于可灵商业化的想象空间也被进一步打开。目前,可灵 AI 已经上线了付费会员体系,分为黄金、铂金、钻石三个级别,月卡价格分别为 66 元、266 元和 666 元,对应生成约 66 个、300 个或 800 个标准视频。

对比 Runway Gen-3 Alpha 最低 12 美元/月;Luma Dream Machine 标准版 29.99 美元/120 次的价格,可灵 AI 的定价并不算高。而且,据接近快手人士透露,可灵 AI 暂无商业化计划。

这就意味着通过会员模式来盈利,还不是可灵的首要目的。万鹏曾公开表示,(可灵出现以后),视频创作的门槛和效果的 ROI 大幅度提升,视频创作者和消费者界限逐渐模糊,越来越多消费者变成创作者,对于视频创作生态的繁荣是非常有价值的。

以最近的 《山海奇镜之劈波斩浪》 和 《三星堆:未来启示录》 为例,前者是抖音和博纳合作的 AI 科幻短剧,后者则是快手原创的 AI 奇幻短剧。毫无疑问,AI 技术可以极大程度的丰富平台内容。

因此,争夺更多内容创作者,繁荣快手平台生态,才是可灵 AI 的当务之急。据快手 2024 年一季度财报显示,快手实际月活人数为 6.97 亿,较上一季度环比下降 0.4%,呈现流失趋势。

通过引入可灵 AI,不仅能帮助创作者降低创作门槛,提升短视频制作质量和效率,也能为快手的内容生态注入新鲜能量。比如在 B 站等内容平台中,用 AI 二创视频就成为了热门话题,在快手平台也有不少关于影视的梗图创作。

但在帮助内容创作者变现的同时,快手也打好了 「提前量」。今年 6 月,快手电商发布了使用 AIGC 能力直播的倡议公告,鼓励商家/达人和老铁们进行良好互动,但对于使用 AIGC 能力辅助创作的内容相较于其他实时直播内容,平台不会给予特殊的流量扶持,避免商家滥用 AIGC 带来大量低质量视频内容。

或许,可灵 AI 不是快手内容生态的 「灵丹妙药」,但有噱头就有热度,目前快手需要的正是这份 「繁荣」。

近年,快手的直播收入出现了下滑的趋势,但今年一季度其广告、电商业务都有双位数的增长,这意味着快手从去年底开始放开泛货架场景流量入口的策略已经起效。但货架电商的核心是搜索,这就驱使快手不得不将内容繁荣放在第一位,只有更多的人气,才会有更多的搜索。

接下来,探索新的内容形态将会是 AIGC 时代下的短视频发展的必经之路,而快手的 「一小步」,将是整个短视频行业的 「起步」。

虽然快手似乎无意加速商业化,但可灵 AI 却一定需要商业化,毕竟烧钱以亿级起算的大模型是个无底洞的吞金猛兽,快手也不能无限地提供子弹。

将目光从 C 端转移到 B 端或更有可能,据内部人士透露,可灵 AI 将部分内测名额给了电商合作比较频繁的 MCN 机构如遥望科技和大品牌,或许也有测试电商行业素材的考虑。

有业内人士表示,拍摄一条高质量 3D 动画视频,成本要按秒来计算,几十万成本也下不来,而可灵、Sora 的出现可以起到增强作用,比如视频某个镜头不行就用 AI 视频来填充。

当然,要实现这样的效果,整个视频生产大模型行业还需要持续进化,但对于 「可灵们」 来说,这样的路径才更为现实,不仅能够改变短视频生态,还可以赋能产业端,比如通过学习爆款视频的文本结构,一键生成与商家产品素材匹配的视频。

目前,各大厂都在卷大模型,但诚如百度李彦宏所言,应用才是大模型落地的根本。「可灵们」 的第一步是繁荣内容生态,但更关键的却是第二步,如何让大模型赋能生态,为平台带来增量效益,才是 「可灵们」 要思考的问题。(楷楷)



相关 文章

固态电池生产设备企业上半年订单激增
禾湖观察

突袭多哈内幕曝光!以色列跨境追杀战术重大升级

5 分 之前

【文章来源:金十数据】AI 播客:换个方式听新闻 下载 mp3 音频由扣子空间生成 据 《华尔街日报》 报道,长期藏身中东多个国家的哈马斯高级领导人于上周末飞抵该组织...

大厂外派员工,在重复中被消耗
行业新闻

大厂外派员工,在重复中被消耗

18 分 之前

馍馍在杭州一家头部游戏大厂从事美术原画外派员工已经 2 年。这两年里,他准点下班的次数不超过 3 次。他每天几乎都要加班。平时一般到晚上 11 点,遇上项目赶进度,加班到凌...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

固态电池生产设备企业上半年订单激增

突袭多哈内幕曝光!以色列跨境追杀战术重大升级

2025 年 9 月 10 日
大厂外派员工,在重复中被消耗

大厂外派员工,在重复中被消耗

2025 年 9 月 10 日
OpenAI有意在AI基础设施建设上 扩大与三星电子和SK海力士的合作

OpenAI 有意在 AI 基础设施建设上 扩大与三星电子和 SK 海力士的合作

2025 年 9 月 10 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录