国产福利在线观看播放,以简单为核心,却拥有强大的功能与丰富的内容_新万博体育

新万博体育

图片
搜索
猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

抖音SAIL团队联合港中文MMLab推出SAIL-Embedding

2025-10-31 11:16:50
来源:

猫眼电影

作者:

芮成钢

手机查看

  猫眼电影记者 符腾堡 报道Q8X2R7L1T4J5M9B6W3

在短视频推荐、跨模态搜索等工业场景中,传统多模态模型常受限于模态支持单一、训练不稳定、领域适配性差等问题。

近日,字节跳动抖音 SAIL 团队联合香港中文大学 MMLab 提出 SAIL-Embedding——一款专为大规模推荐场景设计的全模态嵌入基础模型,不仅实现了视觉、文本、音频的统一表征,更在抖音真实业务场景中带来显著效果提升,相关技术报告已正式公开。

论文标题:SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model技术报告:https://arxiv.org/pdf/2510.12709HuggingFace:https://huggingface.co/BytedanceDouyinContent/collections

SAIL-Embedding 能力概览

突破传统局限:

全模态 + 工业级优化双管齐下

现有多模态嵌入模型主要分为两类:以 CLIP 为代表的双塔架构,虽高效但模态融合浅;以 MLLM 为基础的融合架构,虽语义能力强却多局限于图文模态。SAIL-Embedding 则从根源上解决这些痛点:

全模态输入:覆盖短视频核心信息维度

不同于仅支持图文的传统模型,SAIL-Embedding 可处理任意模态组合——包括视觉模态侧的视频关键帧/封面、文本模态侧的标题/标签/OCR/ASR 文本、以及音频模态侧的背景音乐/语音,以适配抖音等短视频平台的信息结构。例如,在视频检索任务中,模型能同时利用画面内容、字幕文本与背景音效,避免单一模态信息缺失导致的语义偏差。

SAIL-Embedding 架构图

训练稳定性升级:动态难负样本 + 自适应数据平衡

为解决大规模训练中的噪声干扰与数据分布不均问题,团队提出引入两种策略:

动态难负样本挖掘:通过 F1 分数自适应确定相似度阈值,筛选「难区分」的负样本(如主题相似但内容不同的视频),让模型更聚焦细粒度语义差异,避免简单负样本导致的训练低效。

自适应多源数据平衡:基于 Sinkhorn 算法计算训练集与验证集的分布相似度,自动分配各数据源权重,减少人工调参依赖,同时兼顾数据质量与多样性,缓解工业数据与开源数据的领域鸿沟。

创新训练体系:

从内容理解到推荐适配的全链路优化

SAIL-Embedding 的训练并非单一阶段,而是一套覆盖「基础能力-任务适配-推荐增强」的多阶段体系,确保模型既能理解内容语义,又能贴合真实推荐场景需求:

内容感知渐进式训练:从通用到领域的精准过渡

训练分三阶段逐步深入:

第一阶段:用超 10B 样本的大规模多模态数据(含图文音)预训练,奠定基础语义理解能力;第二阶段:聚焦与下游任务(如视频检索、标签分类)对齐的高质量数据,优化任务适配性;第三阶段:引入难负样本微调,强化模型对相似内容的判别能力。

内容感知的渐进式训练

推荐感知的增强训练:融入用户行为信号

针对推荐场景,团队将多模态表征向用户历史序列表征和线上 ID 表征两个维度进行知识蒸馏以融于用户协同行为信息:

序列到物品蒸馏:通过多维度的用户历史兴趣序列筛选机制,利用用户具有正向交互行为的历史观看序列(如最近 10 个观看视频)与目标视频的关联,让模型学习用户兴趣的时序延续性;

ID 到物品蒸馏:对齐推荐系统中的多元化 ID 表征嵌入,将用户偏好信号(如点击、关注等)融入多模态表征,使嵌入结果更贴合推荐侧应用需求。

协同感知的两阶段推荐增强训练

实测性能:

刷新多任务 SOTA,抖音业务指标显著提升

无论是标准数据集的基准测试,还是抖音真实场景的在线实验,SAIL-Embedding 均展现出卓越性能:

离线任务性能:多场景检索与分类任务综合领先

(1) Item-to-Item Retrieval (物品到物品检索)

在 21 个涵盖内容理解、搜索,以及协同感知的多任务场景下,SAIL-Embedding 显著优于 CLIP-based 模型与 VLM-based 的模型:

(2) Query-to-Item Retrieval (查询到物品检索)

在 9 个涵盖检索为导向和分类为导向的多任务场景下,模型的 AUC 与 Recall 指标均取得领先:

在线落地效果:抖音多场景推荐指标显著提升

在抖音 Feed 流、冷启动、抖音精选、消息推送等核心场景中,SAIL-Embedding 通过潜入向量与嵌入离散化的语义 ID 两种形式赋能推荐全链路,带来了一致的 LT 和 AUC 增益,体现了其显著的业务应用潜力。

SAIL-Embedding 的核心价值在于,它不仅是一款性能领先的全模态嵌入模型,更构建了一套从学术研究到工业落地的完整解决方案:通过全模态架构突破输入局限,用动态数据策略解决训练稳定性问题,以推荐增强训练填补产业鸿沟,最终在抖音真实场景中验证了技术价值,在短视频、直播等富模态推荐场景中,具备极强的推广价值。

抖音 SAIL 团队在未来将进一步探索 VLMs 与推荐系统的深度融合,例如通过生成式任务注入推荐知识,让模型不仅能「理解」内容,更能「预测」用户偏好。

??时事1:国产A∨黄A片

??10月31日,形成新质生产力 激发湾区新动能,

  我们轻纺城东京门市,在开春以来在x经理与x店长的带领下,他们以身作责,整个团队非常有战斗力,士气高胀,非常凝聚和睳,做事相互给力,工作非常敬业专注,行动雷历风行,发现公司的产品缺位,马上出差补救,行动力超強,而且个个家人非常在乎自己的业绩目标,在榜样的影响下,团队中个个充满激情,充满活力。做得最好的是紧跟订单力度加强了,串单跑单的客户逐渐减少,当然,还有两位厂家专员巫兵,小王对我们工作上很大的支持与帮助,同时有不可磨灭的功劳,华兵店长的上任后不断完善自己的能力,带领大家冲锋陷阵,相信他的激情一定能带给了大家另外一种能量,而今天的业绩就像乘风破浪,芝麻开花节节高,这次是对领导能力最好的体现,领导的状态就是我们团队的状态,领导的焦点在业绩上,我们的结果一定也在业绩上,所以今天我们所取的一切收获,都是平时大家点滴努力敬业的结果。

,大肉楱征服黄蓉续集。

??10月31日,山东产业结构“追新逐绿” 擦亮经济发展“底色”,

  要知道,这里金属矿稀少,很难开采到,能有一件趁手的兵器很不容易,需要长时间的铸炼与打磨。

,93视频精品免费,www.yw***网站,欧美最婬乱婬爆婬牲视频。

??时事2:久久夜福利亚洲一区二区三区

??10月31日,《好东西》的轻盈感来自哪里 ,

  8、严禁上网吧、游戏厅等一些不利于青少年健康成长的场所,要预防意外事故发生。在家上网时,也要注意网络安全,在网上,不要轻易给出能确定身份的信息,如:家庭地址、学校名称、家庭电话号码、密码、父母身份、家庭经济状况等信息。

,一级婬片A片多人尿,18馃埐/馃崙馃崙,欧美在线xxm。

??10月31日,尊宪崇法|弘扬宪法精神,谱写新时代中国宪法实践新篇章,

  “杀了……那头祭灵?!”

,欧美性爱视频手机在线播放,美女视频黄频大全免费的a,www.高潮。

??时事3:男人天堂网在线

??10月31日,杨凌农高会见闻:科技为农业装上“智慧大脑”,

信用卡逾期了怎么跟银行协商解决分期,分期还款手续费多少钱
,偷拍农村AV,人人操人人人,免费的黄色视频黄色视频。

??10月31日,四川出台17项有力举措 推动资本市场高质量发展,

  “老十一,不要冲动!”一个青年男子开口,阻在前方。

,国产最新网站,精彩视频无码专区在线播放,IGAO视频网为爱寻找点刺激。

??时事4:亚洲色欲综合av

??10月31日,吉林长春:二月二萌娃“剃龙头”,

  它顿时惨叫了起来,在小不点的肩头上翻滚,最后伸出小爪子,用力比划与摇动,那意思是,以后这种事别找我,打死也不干了。

,狼色精品人妻在线视频下载,色多多 美女,青草影院在线。

??10月31日,第二届海峡两岸暨港澳地区舞龙舞狮大赛在福建漳平举行,

  “小不点不要哭,还有我们呢,我们是一起长大的好兄弟,将来有什么一起扛!”一群孩子也叫道。

,玖玖爱免费视频在线观看,久久99久久久免费私密视频,印度美女特黄A级毛片。

责编:贺文萍

审核:钟梦然

责编:宛亚平

相关推荐 换一换