米兰官方版网站登录入口

设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

商汤开源 SenseNova U1 图文交错生成增强版模型:支持多页连续创作,角色风格不“跑偏”

2026/6/12 16:56:37 来源:IT之家 作者:沁沧(实习) 责编:沁沧

IT之家 6 月 12 日消息,商汤科技今日宣布开源商汤日日新 SenseNova U1 系列新成员 —— U1-8B-MoT-Interleaved 图文交错增强版模型。

官方表示,该模型面向图文交错创作与生成(Interleaved Generation)场景进行了专项强化,更好地支持绘本、故事书、多页 PPT、图文教程等连续内容创作,解决传统多模态模型“多轮生成后角色形象飘移、画风断裂、图文脱节”等痛点。

据介绍,该模型核心升级主要体现在四个方面:

  • 叙事一致性与角色连贯性大幅提升:模型显著提升了长周期创作中的叙事连贯性、角色一致性与画风统一性。故事线在整个生成过程中被严格遵循,人物形象从第一页到最后一页均保持高度一致;

  • 图文对应关系增强,告别“图文脱节”:经过专项训练,模型大幅改善了图像内容与文字描述之间的语义对齐能力。生成的画面能更准确地呈现文本所描述的复杂场景、动态动作与物体间的空间关系;

  • 视觉质量与 Artifact 明显改善:针对人物结构、文字渲染、页面排版等高频高难区域进行了定向优化,显著降低了生成物中的视觉瑕疵(Artifact);

  • 全新能力:多页 PPT 自动生成:新版本首次支持了多页 PPT 自动生成能力。模型能够智能从输入内容中提取要点,自行完成排版设计与文字渲染。

IT之家附开源链接如下:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

米兰官方版网站登录入口相关的文章

关键词:商汤开源模型SenseNova U1

软媒旗下网站: IT之家 最会买 - 返利返现优惠券 Win7之家 Win10之家

软媒旗下软件: 软媒米兰官方版网站登录入口-米兰(中国)APP应用 魔方