PosterCopilot – 南大联合LibLib.ai等推出的海报设计模型

AI框架 2025-12-11

PosterCopilot是什么

PosterCopilot 是南京大学联合 LibLib.ai 和中科院自动化所共同推出的专业级海报设计大模型。模型通过独特的三阶段训练策略,赋予模型强大的布局推理和精准编辑能力,能实现从素材规划到最终成稿的全链路设计。模型支持全素材生成、缺素材补全、多轮精细化编辑等功能,同时配备高质量分层海报数据集,解决现有设计模型的几何、视觉和编辑痛点,为 AI 辅助创意设计提供新的范式。

PosterCopilot

PosterCopilot的主要功能

  • 全素材海报生成:用户提供完整素材时,模型能精准排列多模态元素,生成符合美学规律的专业海报,同时保证素材零失真。
  • 缺素材智能补全:在素材缺失时,自动合成风格统一的背景或前景装饰层,实现从抽象想法到完整海报的无缝落地。
  • 多轮精细化编辑
    • 精准单层编辑:仅修改特定图层(如更换模特发色、改变物体材质),其他区域保持不变。
    • 全局主题迁移:一键切换海报主题,自动替换主体并调整相关元素,保留原有排版。
    • 智能尺寸重构:根据画布尺寸参数重新推理布局,适配不同媒体版面。
  • 创意转化:支持从抽象设计构思到具体素材的无缝转化,生成高质量的工程级提示词,驱动生成契合风格的素材。

PosterCopilot的技术原理

  • 渐进式三阶段训练策略
    • 阶段一:扰动监督微调(PSFT):引入高斯噪声扰动,使模型学习坐标分布而非离散点,修复几何空间的扭曲,提升布局的几何合理性。
    • 阶段二:视觉 – 现实对齐强化学习(RL-VRA):引入基于 DIoU 和元素保真的奖励信号,修正重叠和比例失调问题,确保布局的视觉真实性。
    • 阶段三:美学反馈强化学习(RLAF):用美学奖励模型,鼓励模型生成更具视觉冲击力和多样性的布局,超越单一真值。
  • 生成式智能体(Generative Agent)结合接待模型(Reception Model)和 T2I 模型,实现从抽象灵感到具体素材的无缝转化。接待模型将用户意图拆解为详细规划,生成工程级提示词,驱动 T2I 模型生成高质量素材。
  • 高质量分层海报数据集构建包含 16 万张专业海报、总计 260 万个图层的数据集,通过 OCR 辅助的细粒度图层融合技术,解决传统数据集中图层过度碎片化的问题,为模型训练提供丰富且高质量的数据支持。

PosterCopilot的项目地址

  • 项目官网:https://postercopilot.github.io/
  • GitHub仓库:https://github.com/JiazheWei/PosterCopilot
  • arXiv技术论文:https://arxiv.org/pdf/2512.04082

PosterCopilot的应用场景

  • 广告与营销:快速生成符合品牌和营销主题的海报,适配多平台尺寸,支持多轮修改,满足广告宣传需求。
  • 创意设计工作室:作为设计师辅助工具,快速生成初步方案,支持素材补全与优化,提升设计效率和创意激发。
  • 企业内部设计团队:标准化设计流程,快速响应市场变化,支持多部门协作,提升团队整体效率。
  • 教育与培训:作为教学工具,帮助学生理解设计原则,激发创意,适配设计教学和创意启发场景。
  • 文化艺术机构:为展览和文化活动设计艺术感海报,支持生成与文化氛围一致的设计方案。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章