(9秒快速体验)喷水视频网站电脑版v292.44.92.93.920.08.26-2265安卓网_新万博体育
喷水视频网站 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件中印如何达成边境问题解决方案? → 喷水视频网站 v1.53.6729.783676 安卓版

喷水视频网站

喷水视频网站

  • 电脑版下载
猜你喜欢
标签: 喷水视频网站 小南娘大雷擦狙狙出自哪部动漫
详情
介绍
猜你喜欢
相关版本

内容详情

喷水视频网站

金磊 发自 凹非寺量子位 | 公众号 QbitAI

啪!~~~

一篇入围顶会NeurIPS’25 Oral的论文,狠狠反击了一把DiT(Diffusion Transformer)。

毕竟自打DiT问世以来,视频生成这块,算是被它给稳稳拿捏住了。

但站稳了脚跟,并不意味着没有问题,因为它的计算复杂度高,在资源消耗和速度上有着诸多挑战。

而这篇来自字节跳动商业化技术团队的论文,则是提出了一个名叫InfinityStar的方法,一举兼得了视频生成的质量和效率,为视频生成方法探索新万博体育:可能的路径。

像下面这些有趣的动画片片段,便是由InfinityStar亲手打造:

视频地址:https://mp.weixin.qq.com/s/IZb4h4JeVDsRTwautceYrQ

整体来看InfinityStar的亮点,我们可以总结为如下三点:

首个在VBench上超越扩散模型的离散自回归视频生成器;视频生成不用再“慢慢熬”:从百步去噪到自回归,告别延迟任务通吃:文生图、文生视频、图生视频、交互式长视频生成等。

值得一提的是,InfinityStar目前的论文、代码、体验地址均已经发布(链接见文末),接下来我们就进一步实测一波~

实测给DiT上了一课的AI视频生成

首先我们来简单了解一下InfinityStar的体验方法。

它的入口就在Discord社区里面,大家登录账号之后,点击下面这个链接即可跳转。http://opensource.bytedance.com/discord/invite

在左侧导航栏的下方面,便有InfinityStar文生视频、图生视频等各种功能的选项。像刚才展示的视频,便是在“i2v-generate-horizontal-1”中实现:

接下来,我们来一个InfinityStar的文生图和图生视频的联动玩法

首先来到“infinity-8b-generate”,输入下图中的提示词来生成几张图片:

A hyper-detailed, ultra-realistic, cinematic portrait of a fluffy white Ragdoll cat with striking sapphire-blue eyes and long black eyelashes. The cat’s expression is calm, poised, and intensely self-assured — its gaze direct, steady, and dignified, conveying quiet confidence and elegant composure……

挑选一张比较满意的图像之后,我们再把图片“喂”到“i2v-generate-horizontal-1”中,配上下面的提示词来生成一段视频:

The cat opened its mouth and made a sound, then licked its nose with its tongue.

视频地址:https://mp.weixin.qq.com/s/IZb4h4JeVDsRTwautceYrQ

通过类似的方法,你也可以快速生成各种风格、影视级的镜头:

视频地址:https://mp.weixin.qq.com/s/IZb4h4JeVDsRTwautceYrQ

包括各种运动场景中,人物的复杂动作也是能hold住:

视频地址:https://mp.weixin.qq.com/s/IZb4h4JeVDsRTwautceYrQ

另外,正如我们刚才提到的,作为原生自回归模型,InfinityStar还支持交互式长视频生成

视频地址:https://mp.weixin.qq.com/s/IZb4h4JeVDsRTwautceYrQ

我们只需要先给一段5s的视频,然后InfinityStar能够接受新的提示词,根据参考视频和新的提示词继续往下生成:

为什么能比DiT快这么多?

InfinityStar的核心架构,是一个名叫时空金字塔建模的方法,这正是它能把图像、视频任务统一起来,并且比主流扩散模型快一个数量级的关键所在。

整体来看,InfinityStar借鉴了其前作(如VAR和Infinity)在空间维度上的下一尺度预测思想,并将其巧妙地扩展到时空维度;如此一来便弥补了传统方法往往难以在单一模型中同时处理静态图像和动态视频的问题。

其核心设计是将一个视频分解为两个部分。

1、首帧(外观信息):

视频的第一帧被视为一个独立的图像,采用与Infinity模型一致的图像金字塔进行由粗到精的建模。这一步专门负责捕捉视频的静态外观信息,如场景、物体和风格。

2、后续片段(动态信息):

首帧之后的视频内容被切分为若干个连续的视频片段(Clips)。这些片段金字塔在空间维度之外,额外引入了时间维度,专门负责捕捉视频的动态变化,如运动轨迹和镜头变换。

通过这种“首帧 + 视频片段”的分解策略,InfinityStar成功地将静态外观和动态信息解耦。所有这些金字塔内部(尺度之间)和金字塔之间(片段之间)的依赖关系,都由一个强大的时空自回归Transformer进行建模。

最终,无论是生成图像、生成视频还是图生视频,所有任务都被统一为“预测下一个尺度/下一个片段”的自回归问题,实现了架构的高度统一。

除了整体框架之外,InfinityStar还有两个关键技术。

首先是高效的视觉分词器

为了让Transformer能够处理视觉信息,首先需要将图像和视频翻译成离散的Token。InfinityStar为此训练了一个基于多尺度残差量化的视觉分词器,并提出了两项关键技术来克服训练难题:

知识继承 (Knowledge Inheritance)

训练一个离散的视觉分词器(Tokenizer)通常非常耗时。研究人员发现,相比于从零开始训练,继承一个已预训练的连续视觉分词器(如Video VAE)的结构和权重,能显著加快离散分词器的收敛速度,使其更快达到高保真度的重建水平。

2. 随机量化器深度 (Stochastic Quantizer Depth)

在视频金字塔中,信息分布存在严重的“不均衡”问题:大部分细节信息集中在最后几个精细尺度上,导致token数量相差几十甚至上百倍。这会妨碍Transformer的学习,使其过度依赖后续尺度,而忽略了决定全局语义的早期尺度。

为此,InfinityStar引入了一种名为随机量化器深度的正则化技术。在训练时,随机丢弃(Discard)后面精细尺度的Token,迫使模型在仅有前面粗糙尺度Token的情况下也能重建出有意义的信息。这使得信息在不同尺度上分布更均衡,显著提升了模型的学习效率和最终的生成质量。

其次是优化的时空自回归Transformer

为了应对视频生成带来的新挑战(如长上下文、时空依赖),InfinityStar对自回归Transformer本身也进行了三项关键改进:

语义尺度重复 (Semantic Scale Repetition)研究人员观察到,金字塔中靠前的几个尺度(语义尺度)控制着视频的全局信息,如整体布局和运动趋势。为了强化这一点,InfinityStar在预测时将这些语义尺度重复预测N次,允许模型对视频的全局语义信息进行“反复修正”。这一简单而有效的技巧,极大地增强了生成视频在结构上的一致性和运动的流畅性。时空稀疏注意力 (Spacetime Sparse Attention)视频生成,特别是长视频,意味着极长的Token序列,这对注意力机制的计算和显存是巨大的考验。InfinityStar设计了一种高效的时空稀疏注意力,它只关注必要的上下文信息(如前一片段的最后一个尺度),从而在保持时间一致性的同时,大大降低了注意力的计算复杂度,使得高质量、长上下文的视频生成成为可能。时空RoPE位置编码 (Spacetime RoPE)为了让模型精确感知Token在复杂时空金字塔中的位置,InfinityStar引入了增强版的RoPE位置编码,它同时编码尺度、时间、高度和宽度信息,为Transformer提供了精确的时空坐标感。

总结来看,InfinityStar之所以能做到比DiT快上一个数量级,关键在于DiT需要20–100步去噪迭代,而InfinityStar是纯自回归“一条过”生成;并且离散token+粗到精预测机制,大幅减少inference step数。

在如此方法之下,实验结果显示,在文生图(T2I)任务上,InfinityStar在GenEval和DPG两项基准上取得了优异的表现,尤其在位置、物体关系上展现出了明显的优势。

在文生视频(T2V)任务上,InfinityStar在VBench基准上表现优秀,不仅显著超越了先前所有的自回归模型,甚至取得了比CogVideoX、HunyuanVideo等基于DiT的方法更好的成绩。

在和HunyuanVideo的人类偏好评估中,InfinityStar-8B也取得了比HunyuanVideo-13B更好的效果,尤其是在指令遵循方面展现出了显著的优势。

在视频生成的效率方面,InfinityStar的生成速度比同尺寸的基于DiT的方法(如HunyuanVideo、Wan-Video)快一个数量级,在单张GPU上生成一个5s 720p的视频仅需不到1分钟

总而言之,字节的这篇论文证明了离散自回归模型不仅能快,还能做到好,更是打破了只有扩散才能高清的迷思。

论文链接:https://arxiv.org/pdf/2511.04675

代码链接:https://github.com/FoundationVision/InfinityStar

申请体验:http://opensource.bytedance.com/discord/invite

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    嫩模被强到高潮呻吟不断 亚欧美在线视频 一级毛片A片孕妇婬片免费看 日本性爱片一区二区 国产精品初高中精品久久 同性Gay 片 日本欧美黑人一区二区三区 人人操,人人干,人人爽 永久在线精品免费观看 windows18每HD每HD30 国产一级黄色强奸片 水手机抱着大腿草 色欲色综合视频在线观看 想看一级片在哪里看 欧美中文字幕一区二区三区 自拍偷拍 色图 美女黄色爆操视频黄色爆操视频 18禁 女奥特曼被捏胸 亚洲日韩欧美精品高清在线一区 光溜溜女孩视频大全2025年8月 日韩一级全裸免费黄污视频 大胸美女 动漫视频 东北老头和老太还操逼 韩国一级a爱做片观看免费 扒开秘书胸罩狂揉嫩白奶头白虎穴 操操我 成年人肉丝袜黄色网站 亚洲性爱视频在线 一级黄片中文字模 亚洲一区二区三区观看 在线看黄网站 欧美激性一区二区三区 九九在线精品视频专区 99r在线 韩国做爰无遮A片床戏 浮力国产第三页草草影院 推油少年32集免费播放 g鈥唃047.鈥唗o鈥唒 在线高清AV网站 毛片最新的网站 特级一级毛片兔为费播放 亚洲无码在线黄色电影图片 无码人妻丰满熟妇bbbb 波多野结衣操逼视频 国产婷婷五月综合亚洲 91人妻起碰免费公开视频 阴户视频 在线观看免费a片网站 一欧美熟妇性交动态操逼 欧洲性交网 极品粉红色翻盖大阴茎靠小嫩逼 2021国产精品自拍 变态摸🍑揉搓直播 性爱一级 黄 秘 18禁网站动作馒 三级黄片三级黄片三级黄片三级 欧美506070老妇乱子伦 久久久久久精品免费av igao永久网址入口 一,一级黄色网站在线 精品视频九九精品视频 国产黄片免费在线播放 外国老头舔老女人阴部视频一级黄色视频频一级黄色视频片 就要操就要日 国产免费A片视频 欧美性爱皮皮操 黄片东京热 7月电子厂公厕侧拍图片 日本美女操逼黄色视频 动漫魅魔裸体㊙️无遮挡 黄色网站免费链接在线, 国产一级高潮A级片 谁有黄色网站地址 免费观看 润滑油 亚欧性爱春色 狠狠艹夜夜爱 一级特黄a视频 欧美一级特黄C片久久 人人裸人人操 久久成本大片免费播放野外 2019年黄色视频最新网站 大学生人人看摸人人视频 巨屌插逼视频 亚洲欧美在线黄片 日本黄a级网站 人人色在线视频 一区精品自拍偷拍 亚洲一级无码在线免费 人人艹免费在线视频 日本成人xx视频在线观看 成品网站灬1688 天天碰精品 成人app 色99久在线 久久爱精品 网址暂时无法打开黑人大爽淫水 软萌兔兔酱纳西妲cos 男同网站nantong最新版本更新内容 91网站免费观看nba国产 美女 免费网站 www.欧洲黄色 国产黄色录像一级 影音先锋色色色色 畸形精子症有哪些症状? 亚洲精品无码 国产91在线播放喷水 仙踪林锦集视频在线HD 疯狂❌自慰爽www看片免费动漫 自拍偷拍 色综合 亚洲a级黄片免费观看 九色 蝌蚪 熟女偷拍 男女交性永久免费视频播放 欧美一卡二卡三卡四卡无卡在 美国一级a 好疼好大出水了视频 ⅩO99、me 麻豆国产αv在线观看 一级AAAAAAAABBB片 火影忍者鸣人操纲手 大雄和静香同人漫画免费阅读
    热门网络工具