PosterCopilot – 南大联合LibLib.ai等推出的海报设计模型
PosterCopilot是什么
PosterCopilot 是南京大学联合 LibLib.ai 和中科院自动化所共同推出的专业级海报设计大模型。模型通过独特的三阶段训练策略,赋予模型强大的布局推理和精准编辑能力,能实现从素材规划到最终成稿的全链路设计。模型支持全素材生成、缺素材补全、多轮精细化编辑等功能,同时配备高质量分层海报数据集,解决现有设计模型的几何、视觉和编辑痛点,为 AI 辅助创意设计提供新的范式。

PosterCopilot的主要功能
- 全素材海报生成:用户提供完整素材时,模型能精准排列多模态元素,生成符合美学规律的专业海报,同时保证素材零失真。
- 缺素材智能补全:在素材缺失时,自动合成风格统一的背景或前景装饰层,实现从抽象想法到完整海报的无缝落地。
-
多轮精细化编辑:
- 精准单层编辑:仅修改特定图层(如更换模特发色、改变物体材质),其他区域保持不变。
- 全局主题迁移:一键切换海报主题,自动替换主体并调整相关元素,保留原有排版。
- 智能尺寸重构:根据画布尺寸参数重新推理布局,适配不同媒体版面。
- 创意转化:支持从抽象设计构思到具体素材的无缝转化,生成高质量的工程级提示词,驱动生成契合风格的素材。
PosterCopilot的技术原理
-
渐进式三阶段训练策略:
-
阶段一:扰动监督微调(PSFT):引入高斯噪声扰动,使模型学习坐标分布而非离散点,修复几何空间的扭曲,提升布局的几何合理性。
-
阶段二:视觉 – 现实对齐强化学习(RL-VRA):引入基于 DIoU 和元素保真的奖励信号,修正重叠和比例失调问题,确保布局的视觉真实性。
-
阶段三:美学反馈强化学习(RLAF):用美学奖励模型,鼓励模型生成更具视觉冲击力和多样性的布局,超越单一真值。
-
-
生成式智能体(Generative Agent):结合接待模型(Reception Model)和 T2I 模型,实现从抽象灵感到具体素材的无缝转化。接待模型将用户意图拆解为详细规划,生成工程级提示词,驱动 T2I 模型生成高质量素材。
-
高质量分层海报数据集:构建包含 16 万张专业海报、总计 260 万个图层的数据集,通过 OCR 辅助的细粒度图层融合技术,解决传统数据集中图层过度碎片化的问题,为模型训练提供丰富且高质量的数据支持。
PosterCopilot的项目地址
- 项目官网:https://postercopilot.github.io/
- GitHub仓库:https://github.com/JiazheWei/PosterCopilot
- arXiv技术论文:https://arxiv.org/pdf/2512.04082
PosterCopilot的应用场景
-
广告与营销:快速生成符合品牌和营销主题的海报,适配多平台尺寸,支持多轮修改,满足广告宣传需求。
-
创意设计工作室:作为设计师辅助工具,快速生成初步方案,支持素材补全与优化,提升设计效率和创意激发。
-
企业内部设计团队:标准化设计流程,快速响应市场变化,支持多部门协作,提升团队整体效率。
-
教育与培训:作为教学工具,帮助学生理解设计原则,激发创意,适配设计教学和创意启发场景。
-
文化艺术机构:为展览和文化活动设计艺术感海报,支持生成与文化氛围一致的设计方案。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。
粤公网安备 123456789号