豆包 Seedream 4.5 图像多模态模型发布
豆包 Seedream 4.5 是豆包最新推出的图像多模态模型,集文生图、图生图、组图输出于一体,融合常识理解与推理能力。相较9月发布的前代 Seedream 4.0,新版本在生成质量上实现显著提升,有效解决了“小人脸崩坏、文字模糊、一致性不足、多图混淆”等核心问题。
模型亮点
原图保持能力
最大程度保留输入图像的人脸特征、光影色调与细节质感,具备接近专业修图软件的真实表现力。



海报与Logo设计排版能力
具备专业级构图与文字排版能力,小字号文字清晰可辨,适用于品牌宣传、电商促销等多种设计场景。
多图组合能力
可在多张输入图像中精准识别并锁定关键元素,实现可控的一致性生成,满足复杂视觉创作需求。


分场景关键任务表现
图生图关键任务
平面设计
任务说明:基于主题文案与素材,对图文元素进行整体编排,生成风格统一的海报、封面或宣传图,如活动主视觉、电商促销图等。
模型表现:得益于构图与文字渲染能力的增强,Seedream 4.5 在多文案、多模块的复杂海报设计中表现优于前代,适配小红书封面、电商KV、直播间贴片等多种应用场景。
| prompt | 原图 | Seedream 4.5 |
【小红书封面】 以“双十一开箱”为主题,生成拼贴风格海报,包含人物四组不同穿搭姿势组合,构图灵动,色彩活泼,文字排版不规则。 |
|
|
【胶囊banner】 生成咖啡品牌新品促销图,椭圆形布局,暖色渐变背景,左侧为卡通咖啡豆形象,突出“新品拿铁来啦”,整体风格温暖可爱。 |
|
|
【商品海报】 参考风格图,生成美食产品宣传海报,突出产品质感与食欲感。 |
|
|
【直播间封面】 生成美妆类直播贴片,暖黄渐变背景,突出“双11宠粉狂欢”“限时秒杀”等信息,营造温馨治愈氛围。 |
|
|
【电商详情页】 生成极简科技风耳机详情页,深空灰与赛博蓝为主色调,融入光轨、几何体等未来元素,文字清晰突出核心卖点。 |
|
|
局部编辑
任务说明:仅修改图像局部内容,其余区域保持不变,如替换文字、调整元素属性等。
模型表现:语义理解与画面保持能力提升,支持基础图片编辑操作,响应更精准。
| prompt | 原图 | Seedream 4.5 |
【图片编辑】 将英文翻译为中文手写体,其他内容不变。 |
|
|
【海报编辑】 基于原布局,替换主体食物,保持整体风格与排版协调。 |
|
|
将红色标记单词改为蓝色斜体文字。 |
|
|
人像/图像编辑
任务说明:对人物或动物外貌进行优化,提升精致度,保持主体特征一致。
模型表现:人像美化效果更自然,一致性显著改善,拉伸变形问题大幅减少。
人像编辑
| prompt | 原图 | Seedream 4.5 |
【创意写真】 生成四宫格人像拼图,每幅图展现不同场景与手绘元素,风格梦幻可爱。 |
|
|
【证件照】 生成猫咪正面证件照,去除头套,蓝色背景,光线充足,超写实风格。 |
|
|
人像美化
人像妆容更自然
| 人像原图 | 效果 | 效果 | 效果 | 效果 |
|
|
|
|
|
多轮对话P图效果展示
通过多轮指令交互,人物特征保持稳定,执行连贯性更强。
| 轮次 | prompt | 输入图 | 输出图 |
| 第一轮 | 进行自然美颜:匀净肤色、柔化眼周、润唇、优化发丝光泽。 |
|
|
| 第二轮 | 将女生自然融入餐吧场景与男生合影,保持穿搭一致,光线融合自然。 |
|
|
| 第三轮 | 调整为社交媒体封面:增强暖调氛围,添加手写体文案“和crush的周末bruch”,点缀装饰元素。 |
|
|
多图组合与复杂任务处理
| prompt | 输入图 | Seedream 4.5 |
| 将多个角色置于街景中生成集体合照。 |
|
|
| 生成童话绘本封面:小女孩与小狐狸站在发光森林屋前,月亮梦幻,星尘飘浮,整体风格温柔魔法。 |
|
|
文生图关键场景
营销配图
- 场景特点:强调内容准确传达、画面真实感,适用于媒体、电商等行业。
- 模型表现:在质感、光影、生动性方面有所提升。



商业设计
- 场景特点:注重排版控制、行业规范理解、文字可读性与视觉效果。
- 模型表现:排版响应更精准,美观度提升,崩坏问题减少。
公众号素材
| 使用场景 | prompt | 素材示例 |
| 公众号首图 | 设计潮流醒目风格图,黄橙放射背景,突出“本周大事件”,搭配青绿横幅“MAJOR EVENTS”。 |
|
| 二维码素材 | 设计儿童风格扫码图,蓝黄撞色边框,中央“扫码关注”,右侧二维码,周围点缀卡通元素。 |
|
| 公众号作者名片 | 生成粉色渐变背景名片,左侧显示“张小豆”中英文名,右侧为潮流达人形象,附联系方式与二维码。 |
|
电商素材
| 使用场景 | prompt | 素材示例 |
| 商品详情页 | 生成科技风耳机海报,深空灰与赛博蓝为主色调,突出“安静一瞬,细节全开”及核心参数。 |
|
| 倒计时弹窗 | 设计3D风格电商弹窗,橙金粉红渐变,玻璃质感日历显示“倒计时3天”,底部按钮“立即参与”。 |
|
| 胶囊banner | 生成闲鱼春日促销图,蓝绿渐变背景,黄色小怪兽持喇叭,标语“春日开挂指南来咯”。 |
|
小红书/抖音素材
| 使用场景 | prompt | 素材示例 |
| 小红书文字封面 | 设计中间带白色波浪框的文字封面,标题为“家里的猫不爱吃我做的猫饭怎么办”。 |
|
| 视频封面 | 生成穿搭分享封面,女主穿连帽卫衣坐地板,背景居家温馨,搭配“一周5个万能叠穿公式”文字。 |
|
| 直播预告 | 设计高级感直播海报,米白信封背景,“直播预告”复古红棕标题,标注时间与“新品首发”亮点。 |
|
Logo 设计
| 使用场景 | prompt | 素材示例 |
| 整体图标 | 生成国风logo,汉服少女抚梅花鹿,英文“Pine & Deer Collection”,配色青碧+米白+朱红。 |
|
| Icon | 设计足球队标志,Nonket United,绿色粉红大树,黑色背景,树上有小鸡图案。 |
|
物料设计
| 使用场景 | prompt | 素材示例 |
| 电子手账 | 设计熊猫主题手账页,淡绿主色调,含抱竹熊猫、竹制托盘、雨滴云朵等萌系元素。 |
|
| 名片 | 设计简约商务名片,浅灰纹理背景,左上角闪电LOGO,信息清晰,风格专业。 |
|
| 门票 | 设计复古圣诞音乐会票,米色乐谱纹理背景,胡桃夹子插画,金色雪花装饰,信息层级清晰。 |
|
学习办公
- 场景特点:面向PPT制作、信息图表、科普插画等需求,强调规范性、知识准确性与内容组织能力。
- 模型表现:知识准确度与内容组织能力优于前代。
| 使用场景 | prompt | 素材示例 |
| PPT | 生成有机蔬果营销PPT,右下角购物袋装满食材,突出“有机水果蔬菜”红色标题。 |
主副标题结构明确 |
| 科普插画 | 绘制太阳系示意图,按距离排列八大行星,并标注名称。 |
星球分布合理 |
影视游戏
- 场景特点:辅助影视与游戏制作,需准确呈现情节,具备故事感与氛围感。
- 模型表现:叙事准确性与氛围营造能力有所提升。
| 使用场景 | prompt | 素材示例 |
| 影视画面 | 古装剧镜头:少侠撑伞,少女立于樱花树下回眸,唯美浪漫。 |
氛围感佳 |
| 漫画 | 绘制两格漫画:父亲消息“没空过生日”,女孩落泪,黑猫担忧注视。 |
情节准确,气泡框位置正确 |
艺术创作
- 场景特点:追求美学表达,强调视觉冲击力、创意与笔触质感。
- 模型表现:整体美感提升,艺术感强,笔触自然。





美学/风格词
热门风格





美学






摄影




潮流






艺术





材质






文生图提示词建议
- 使用连贯自然语言描述画面内容(主体+行为+环境),用短词语描述美学特征(风格、色彩、光影等)。
- 专业术语建议使用原始语言,提升生成准确性。
- 明确图像用途(如“用于PPT封面背景”),可提高场景适配度。
- 将需生成的文字放入“引号”内,提升文字识别准确率。

















