智东西作者|江宇编辑|漠影
智东西12月8日报道,今日,美团正式发布并开源图像生成模型LongCat-Image,这是一款在图像编辑能力上达到开源SOTA水准的6B参数模型,重点瞄准文生图与单图编辑两大核心场景。
▲图源:Hugging Face
从官方披露的基准测试结果来看,LongCat-Image主要对标了Seedream4.0、Qwen-Image、HunyuanImage-3.0、Nano Banana以及FLUX.1-dev等主流开源与闭源生图模型,其核心优化集中在“编辑可控性”和“中文文字渲染”两项能力上。
而在实际体验中,它在连续改图、风格变化和材质细节上表现较好,但在复杂排版场景下,中文文字渲染仍存在不稳定的情况。在涉及复杂UI设计、游戏界面生成等任务时,模型的审美也暴露出一定短板,这或许与其不具备联网搜索能力有关。
在体验入口方面,美团也同步提供了多种使用方式。在移动端,LongCat APP已支持文生图与图生图能力;在网页端,用户也可通过 https://longcat.ai/ 进入图片生成入口进行体验。
对于开发者而言,LongCat-Image的模型权重与代码也已同步开源:
Hugging Face:https://huggingface.co/meituan-longcat/LongCat-ImageGitHub:https://github.com/meituan-longcat/LongCat-Image
下面我们就来看看LongCat-Image的模型结构、评测成绩和具体的实测表现。
一、从模型结构到评测成绩,LongCat-Image把“编辑可控性”和“中文渲染”作为主攻方向
从模型设计上看,LongCat-Image采用了文生图与图像编辑同源的统一架构,并通过渐进式学习策略,在仅6B参数规模下兼顾了指令遵循精准度、生图质量与文字渲染三项能力的协同提升。
▲模型架构
这套训练路线并非从零开始堆参数,而是基于文生图中期训练模型进行初始化,并在后续阶段采用文生图与指令编辑的多任务联合学习机制,来避免编辑能力在后训练阶段被压缩的问题。
在图像编辑能力上,LongCat-Image在GEdit-Bench、ImgEdit-Bench等多个编辑类基准中取得了开源SOTA成绩。
▲客观基准测试性能对比
LongCat-Image通过多源数据预训练、指令改写策略与人工精标SFT数据的引入,使模型在面对复杂编辑要求时更不容易出现风格漂移和结构失真。
针对中文文字渲染这一长期痛点,LongCat-Image采用了覆盖8105个规范汉字的合成字形数据进行预训练,并在SFT阶段引入真实世界文本图片强化排版与字体泛化能力,在RL阶段还引入OCR与美学双奖励模型共同约束,最终在ChineseWord评测中取得90.7分的成绩,领先于现有开源模型。
在真实感方面,LongCat-Image通过对抗训练和严格的数据筛选机制,刻意绕开AIGC“塑料感”的纹理陷阱,并在RL阶段引入AIGC检测器作为奖励信号,反向引导模型学习真实世界的物理纹理与光影变化。
综合评测结果显示,在人类主观评分(MOS)维度上,LongCat-Image在文本对齐、视觉真实度与美学质量等多个子项中的表现已接近Seedream4.0等商业模型水平。
▲人类主观评分(MOS)对比
▲并列对比评估胜率(SBS)
在图像编辑任务的并列对比评估(SBS)中,LongCat-Image-Edit在综合质量与一致性两项关键指标上,对NanoBanana和Qwen-Image-Edit等模型均取得较高胜率。
整体来看,LongCat-Image在图像编辑任务上已逼近部分闭源模型水平,在文生图基础能力上也保持在开源头部阵营。
二、从漫画重绘到玩偶产品渲染,连续编辑稳定,但中文渲染仍是短板
从实际体验过程来看,LongCat-Image在“连续指令可编辑性”上的表现是较为稳定的,我们直接拿近期大火的《疯狂动物城2》相关图片进行测试,在同一角色基础上连续进行多轮修改。
▲参考图
指令:修改为像素风格作品。
指令:重绘为彩色,保留像素质感。
指令:图片角色重绘为模仿乐高积木主题的动物。
在漫画图像测试中,通过像素风、彩色像素重绘以及模仿乐高积木动物主题的连续重绘指令,模型可以保持角色结构稳定,同时完成风格与材质的多轮迁移。多次修改过程中,人物轮廓和构图基本未出现明显错误。
在此基础上,我们也进一步尝试了电影海报的制作场景,用同一角色图进行主视觉海报生成与多语言标题渲染测试。
指令:电影《疯狂动物城2》的宣传海报,海报的主画面是电影主角的精彩场面,主标题用艺术手写字体“疯狂动物城2”,下面附上英文名“Zootopia”,另外附上电影海报需要的其他小字,文字清晰可辨认。
在电影海报场景中,模型对参考图的继承能力较为稳定,无论是角色形象还是动态姿势,都能与原始图片保持较高一致度,中英文标题的主标题表现也较为清晰。不过在“小字”区域,一系列细节文字仍然存在乱码与英文混杂的问题,说明中文文字渲染在复杂排版场景下依然存在不稳定性。
进一步测试人物档案式中文海报时,模型可以正确渲染部分核心字段信息,但仍不可避免地出现中英文错位与局部乱码。
指令:生成动画电影角色的人物档案式宣传海报,用文字体现以下信息: 尼克?王尔德(Nick Wilde),是一只在迪士尼动画电影《疯狂动物城》中出场的狐狸。 中文名:尼克狐尼克。 外文名:Nick Wilde。 原型:赤狐。 职业:从骗子到警察。 搭档:兔子警官朱迪。 经典台词:“伤了你的小心脏?”
在产品级渲染测试中,朱迪警官玩偶在影棚光、台灯暖光、自然光客厅与床品光照等多个现实场景下的质感表现相对稳定。短绒毛的细节、眼睛的高光反射、沙发布料与玩偶绒毛之间的材质对比都能够被较为准确地表现出来,整体更接近商业产品渲染效果。
相比之下,在主流模型较为擅长的游戏界面生成场景中,LongCat-Image的短板更为明显。无论是卡牌游戏、射击游戏,还是MOBA类第一视角界面,整体风格都偏向十多年前的UI设计审美,与当下主流游戏产品存在明显代差。
指令:生成一个卡牌游戏界面。
指令:生成一个射击游戏界面。
指令:生成一个英雄联盟的游戏界面。
指令:生成一个王者荣耀第一视角的游戏界面。
从本次测试结果来看,LongCat-Image在改图与产品渲染类任务中的可用性更高,而在游戏界面与复杂排版场景中的表现相对一般。
结语:开源图像模型进入“可控编辑”竞赛,AI生图战况升级
从LongCat-Image的整体定位来看,美团并没有试图用更大的参数规模去正面冲击旗舰级生图模型,而是明确选择在可控性、连续编辑和中文渲染这几个方向上深挖。
图像模型的竞争焦点,正在快速向“能否真正进入设计、产品、品牌等具体生产流程”的实用能力集中。
《中文字幕人妻斩无码毛片》,《Q8X2R7L1T4J5M9B6W3》中国少妇乱子hdsex粗
“综合色天天鬼久久鬼色”
av资源站
……
12月05日
“视频黄在线观看91”地狱公使 第二季
↓↓↓
12月05日,贵州金沙:高粱红 秋收忙,操人视频无码亚洲,黄色视频丝袜,进去里 片欧美,AAAAAA黄色视频
12月05日,新疆且末群众在塔克拉玛干沙漠边缘植树造林,国产精品正在线播放,毛多水多WWW偷窥小便,性生活一级免费不卡,ⅰgao22
12月05日,从“网红”变“长红”小帐篷撑起身边的“诗与远方”,大咪咪女同,91精品91久久久久1000部,欧美老妇的日逼视频,特级视频
12月05日|南水北调工程超额完成2022—2023年度调水任务|久久精品色网视频|秋霞.com|黄色视频欧美人人网|欧美第一精品
12月05日|马来西亚外长穆罕默德将访华|美女被操黄视频|日韩一级一级欧美6080|黄色视频线上看品亲网|超碰三级黄色网站
12月05日|珠江流域北江将发生特大洪水 水利部将洪水防御应急响应提升至Ⅲ级|主人~别揉了~奶头~啊~嗯…视频|动漫无码18禁魅魔链接|孕妇裸体生产秘 免费网站|免费的婬男婬女视频中文字幕……
12月05日,香港一私家车逃避截查撞伤警察 司机涉嫌袭警、贩毒等被捕,精品人妻一区二区三区日产乱码,性爱视频网站免费高清无码,嫖妓在线精品视频凹凸,国产精品久久久久精品日日三级
12月05日,6100元的“量子面霜”,“黑科技”还是“讲故事”?,武姬和星见翔太,久久综合官网,影音先锋av资源男人站,黄色网站入口免费版
12月05日|云南独龙江公路全线进行临时性全封闭交通管制|欢乐谷m3u8永久保存教程|国产成人精品AA毛片|激情网址你懂的|国产羞羞视频一区
12月05日,俄乌再度交换被俘人员 各向对方移交115人,理论电影网址,美日韩在线一区,18+涩漫,天堂黄色网站观看
12月05日,中国医学发展大会上,专家建议建立多学科融通式医学教育体系,国产嫖妓免费视频在线,鸭灭蝶av在线,黄色C大片,乳をしぼる挤奶.乳がよく出
12月05日,美方就黎以局势表态:停火协议没有破裂,久久无码人妻88专区,AV中文天堂网,在线视频欧美精品,一级生活片免费的视频观看
12月05日|东西问丨张梦新:金庸诞辰百年,我们该如何纪念?|小🐣🐣插入🍑|91n免费处女在线破视频+进https://www.ofvoydi.com:6699/35.html|女同学裸睡我把她奶头摸硬了|中日美韩欧大乳人妻在线
12月05日|加沙援助状况出现恶化迹象|日韩欧美插屄视频|欧美喷射91|超碰在线一|xxxxx视频
12月05日|播下热爱劳动的种子(教育时评)|十大黄台 止app下载|美国人又粗又长又大配种视频|美女脱光衣服网站|老师浴室喂我奶乳脱她胸罩视频
女寝举报送水大爷导致无人送水,《龙腾世纪4》首个评分出炉|中国首个全场景氢能港口建设在山东青岛启动|国内pegging网站|国内A级毛片日日躁夜夜爽|欧美一级片在线免费观看|综合精品喷潮高潮一区
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺