JIUTIAN Research | AAAI 2026（二）：懂需求、能落地！九天最新研究让大模型精准满足多样写作要求



JIUTIAN Research | AAAI 2026（二）：懂需求、能落地！九天最新研究让大模型精准满足多样写作要求

九天人工智能

2025-12-08

您有没有过这种经历？想让大模型写一篇“专业且幽默、带喜悦感，还紧扣勇气主题”的冲突性故事，结果生成的内容要么太严肃、没笑点，要么只顾幽默感、丢了专业感，甚至情感和主题也完全跑偏。这正是当前大模型可控文本生成的痛点：用户想要的多维属性控制，现有大模型生成的文本不是“顾此失彼”，就是“控制太粗”，遇到“恐惧 + 喜悦”这类冲突属性更是直接“卡壳”。中国移动九天研究院与东南大学联合提出的C³TG（Conflict-aware, Composite, and Collaborative Controlled Text Generation）框架，终于打破了这个僵局，让大模型既能精准满足多维属性要求，又能保证文本的流畅度和安全性。

核心痛点：

现有大模型生成文本的三大“致命伤”

随着大语言模型的发展，文本生成的流畅度早已不是问题，但“可控性”成为关键问题。用户需要的不仅是“生成文本”，而是“按要求生成文本”：情感、风格、语气、主题、安全性都要精准匹配。

但现有大模型生成文本始终绕不开三个难题：

冲突难处理：模型可能无法同时满足“浪漫 + 专业”“恐惧 + 喜悦”这类冲突要求，导致输出的文本内容跑偏；
质量难平衡：强化文本属性控制时，生成的内容变得生硬晦涩，失去自然流畅度和语言多样性；
缺乏闭环：大多数文本是“一次性生成”，没有后续的反馈修正，生成效果全靠初始设置。

图1. C³TG提供了广泛的属性控制能力，并能有效解决冲突

无论是直接干预解码的PPLM、COLD等方法，还是靠提示词、微调的间接控制策略，都难以解决这些问题。但C³TG的出现，正好有针对性地补上了这些短板。

两阶段架构：

像人类写作一样“先写再改”，精准把控所有要求

C³TG 的核心思路很简单：模仿人类“初稿创作 + 多轮修改”的写作流程，设计了“生成阶段+优化阶段”的两阶段协同架构，既保证了模型的生成效率，又实现了精细化控制。

图2. C³TG框架整体流程图，包括生成阶段和优化阶段，最终生成满足用户要求的文本

1. 生成阶段：多模型“投票”，给文本定好基调

C³TG 以Llama2为基础模型，分为5大类、17个细粒度属性，包括愤怒、恐惧、喜悦等6种情感，礼貌、浪漫、幽默等5种风格，专业、休闲2种语气，知识、正义、人性、勇气4种主题，有毒、无毒2种毒性，训练了轻量级专属模型。

生成每个token时，基础模型和各属性模型都会给出自己的“候选答案”，用户设置的属性权重就是“话语权”，权重越高，对应模型的意见越受重视。C³TG通过加权几何平均融合所有模型的意见，相当于让所有模型一起“投票”，最终生成的初稿就初步具备了多属性一致性。

这种设计的优势很明显：不用改动基座模型结构，仅通过LoRA微调就能实现，额外参数量仅占基座模型的0.3%，兼顾了灵活性和轻量化。

2. 优化阶段：Feedback Agent当“金牌编辑”，多轮修正不跑偏

图3.两阶段蒸馏策略示意图

这个阶段才是C³TG的灵魂，大模型自己当“专业编辑校对”，C³TG通过能量函数和Feedback Agent，实现多轮反馈修正，解决属性偏差和冲突问题。

先打分：用专门训练的分类器，给初稿的每个属性打分，比如“勇气0.5（目标0.9）、喜悦 0.6（目标 0.9）”，算出偏差；
定规则：构建能量函数，既惩罚属性偏差（比如“勇气”数据没达标），又约束非目标属性的波动（比如改写“勇气”时，别把专业感弄丢），还会根据属性相关性自动调整惩罚力度，避免“牵一发而动全身”；
逐轮改：由Llama2-7B驱动的Feedback Agent出手，分三步重写：

- 先补短板：聚焦偏差最大的属性（比如“勇气”数值差 0.4），针对性修改；

- 再做平衡：调整其他属性，比如提升喜悦感，同时保持专业度，化解属性冲突；

- 最后微调：保证整体流畅，不破坏内容结构。

更贴心的是，C³TG默认给“无毒”属性设高权重，每轮修改都自动削弱有害内容，越改越安全，再也不怕 AI 写出不当言论。

实验结果：

多属性准确率90%+，冲突场景稳得住

为了验证C³TG的实力，研究团队在ROCStories（短文本）和WritingPrompts（长文本）两个数据集上进行大规模实验，对比了COLD、PPLM、LLM-based Prompt 等10余种主流方法，各项核心指标均达到领先级别。

属性准确率：ROCStories上达90.39%，WritingPrompts上达85.56%，远超所有对比方法；
流畅度：两个数据集上的困惑度（PPL）均为最低，说明多轮优化没有牺牲自然性，反而提升了文本质量；
多样性：Distinct-1/2/3指标领先，强约束下仍能保持丰富表达；
安全性：毒性概率大幅降低，平均毒性评分显著低于同类方法。

人工评审也给出了高分，在属性契合度、流畅度、多样性三个维度，C³TG均获得较高评分，实际阅读体验拉满。针对“恐惧0.7 + 喜悦1.0”这种冲突场景，以及“浪漫0.7 + 爱0.7”这种重叠场景，C³TG的优势更明显：属性偏差更小，非目标维度漂移更低，不会出现“为了满足一个属性而破坏其他”的情况，比如同时要求“幽默”和“专业”，C³TG能精准把握尺度，既不显得轻浮，又不会过于刻板。

消融实验也证明了各模块的必要性：去掉优化阶段，多属性对齐和毒性控制明显退化；去掉重叠惩罚项，非目标属性波动大幅增加。

未来可期：

从文本控制到多场景适配

C³TG的潜力可不止于写文案、编故事。未来，它有望在多个领域进行赋能：

内容生产：批量生成符合品牌语调、行业规范的推文、报告，还能切换不同风格；
智能客服：根据用户需求，精准控制回复的语气（专业/亲切）、情感（耐心/安抚），同时保证合规无毒；
教育场景：生成符合教学大纲、适配学生年龄的趣味教案，兼顾知识性和趣味性。

而且C³TG不依赖白盒模型，哪怕是调用ChatGPT、文心一言这类黑盒API，只要外接属性分类器和Feedback Agent，就能实现精准控制。未来还能扩展到品牌语调、价值观约束等更高层属性，甚至和多Agent系统结合，让大模型生文同时兼顾安全、逻辑及事实性。

从“能生成”到“按要求精准生成”，C³TG重新定义了可控文本生成的范式。它用“生成 + 优化”的闭环思路，解决了多属性冲突、质量失衡等问题，让大模型真正成为“懂需求、能落地”的内容生产工具。

论文题目：

C³TG: Conflict-aware, Composite, and Collaborative Controlled Text Generation

论文地址：

https://arxiv.org/pdf/2511.09292

作者：

Yu Li, Zhe Yang, Yi Huang*, Xin Liu, Guilin Qi

发表团队及会议：

中国移动九天研究院, 东南大学，发表于AAAI 2026

供稿：九天基础研究中心

编辑：秦睿含、张致宁

复审：潘璐、袁博

【声明】内容源于网络

九天人工智能

中国移动研究院九天人工智能官方公众账号。汇聚九天人工智能最新研发成果和创新产品发布，助力行业发展，引领技术潮流。

内容 410

粉丝 0

九天人工智能中国移动研究院九天人工智能官方公众账号。汇聚九天人工智能最新研发成果和创新产品发布，助力行业发展，引领技术潮流。

总阅读44

粉丝0

内容410

JIUTIAN Research | AAAI 2026（二）：懂需求、能落地！ 九天最新研究让大模型精准满足多样写作要求

JIUTIAN Research | AAAI 2026（二）：懂需求、能落地！九天最新研究让大模型精准满足多样写作要求