人们如何使用ChatGPT
Aaron Chatterji¹,² Christopher Ong¹,³ Tom Cunningham¹ Carl Shan¹ David Deming³ Zoë Hitzig¹,³ Kevin Wadman¹
¹OpenAI ²杜克大学(Duke University) ³哈佛大学(Harvard University)
2025年9月15日
摘要
大型语言模型(LLM)聊天机器人迅速普及,但其实际使用方式尚不清晰。本研究追踪ChatGPT自2022年11月推出至2025年7月的发展,覆盖全球约10%的成年人口。早期用户以男性为主,性别差距已显著缩小,中低收入国家增长更快。
通过隐私保护的自动化流程对代表性对话样本进行分类分析发现:非工作相关消息占比从53%上升至70%以上,增速超过工作场景。高学历及高薪职业人群更倾向用于工作。
主要使用场景为“实用指导”“信息查询”和“写作辅助”,合计占所有对话近80%。其中,“写作辅助”在工作场景中占主导地位,凸显其在生成数字内容方面的优势。编程与情感陪伴类使用占比较低。
总体表明,ChatGPT通过提供决策支持创造经济价值,尤其在知识密集型工作中作用突出。
1 引言
ChatGPT于2022年11月上线,截至2025年7月,周活跃用户达7亿,相当于全球10%的成年人口,是史上最快实现广泛普及的技术之一。
作为首个面向大众市场的大型语言模型产品,ChatGPT代表了人工智能能力的重大突破。尽管其技术影响受到广泛关注,但关于具体使用行为的数据仍有限。现有调查多依赖自我报告,存在偏差且无法反映真实对话内容。
本文基于更大规模、更具代表性的数据集,结合自动化分类方法,系统分析ChatGPT的使用模式:
- 用户基数远超同类平台,更具普遍性;
- 采用新分类体系与自动化分类器分析消息类型;
- 追踪不同人群中的普及趋势;
- 在保障隐私前提下,关联用户教育与职业背景,分析使用差异。
研究数据来自2024年5月至2025年6月期间,ChatGPT消费级套餐用户的随机消息样本。通过安全数据洁净室协议,将分类结果与用户汇总级就业和教育信息匹配,确保隐私合规。
表1:ChatGPT日均消息量(百万条):工作相关与非工作相关拆分
| 月份 | 非工作相关(百万条) | 占比 | 工作相关(百万条) | 占比 | 总消息量(百万条) |
| 2024年6月 | 238 | 53% | 213 | 47% | 451 |
| 2025年6月 | 1,911 | 73% | 716 | 27% | 2,627 |
注:总消息量为精确统计值;工作/非工作分类基于抽样估算,排除未登录、未成年、拒绝训练及封禁账号。数值为7天平均值。
数据显示,两类消息均快速增长,但非工作场景增速更快。这一趋势说明,人工智能对日常生活的影响已不亚于其对有偿工作的促进作用。
非工作使用占比上升,主要源于既有用户行为变化,而非新用户结构改变。该发现与Collis和Brynjolfsson(2025)的研究一致——仅2024年,美国用户从生成式AI获得的消费者剩余就超970亿美元。
研究发现,近80%的使用可归为三大类别:
- 实用指导:包括教学辅导、操作建议、创意构思等;
- 信息查询:涵盖人物、时事、产品、食谱等,功能接近搜索引擎;
- 写作辅助:如撰写邮件、文档、文本编辑、翻译、摘要生成。
在工作场景中,“写作辅助”占40%,其中约三分之二为修改已有文本,而非从零创作。同时,约10%的消息涉及教学或学习,显示教育应用广泛。
两项发现与现有研究不同:
- 编程相关消息仅占4.2%,远低于其他平台报告的33%;
- 情感陪伴类话题极少,仅1.9%涉及人际关系反思,0.4%为角色扮演。
人口统计特征显示:
- 性别差距缩小:初期80%活跃用户使用典型男性名字,2025年6月降至48%;
- 年龄分布:近半数消息来自26岁以下用户,但各年龄段差距正在收窄;
- 地区增长:过去一年,中低收入国家使用增长率更高;
- 教育与职业差异:高学历、高薪专业职业者更常用于工作。
引入新的意图分类体系:“咨询型”“任务型”“表达型”:
- 咨询型:寻求信息或建议以辅助决策(如“如何制定预算?”);
- 任务型:请求生成输出或完成任务(如“重写邮件”);
- 表达型:仅表达观点或情绪。
整体分布为:49%咨询型、40%任务型、11%表达型。但在工作场景中,任务型占比达56%,其中近四分之三属于“写作辅助”。
“写作辅助”的高频使用与其核心价值相关:写作是多数白领工作的关键技能,而生成式AI在长文本生成方面具有独特优势。
结合O*NET职业数据库分析发现,工作相关消息中58%集中于两类活动:
- 获取、记录和解读信息;
- 制定决策、解决问题与创造性思考。
这些活动在管理、STEM、行政、销售等各类职业中均居前列,说明ChatGPT的应用具有高度普适性。
总体来看,信息查询与决策支持是核心应用场景。“咨询型”消息增长快于“任务型”,且满意度评分更高。这表明用户更重视其作为“智能顾问”的角色,而非单纯的任务执行工具。
ChatGPT通过提升决策质量创造经济价值,尤其在知识密集型工作中效果显著。这也解释了为何高学历、高薪职业用户更偏好“咨询型”功能,符合“AI副驾驶”模型理论。
2 什么是ChatGPT?
本节简述大型语言模型(LLM)与聊天机器人的基本原理(详见OpenAI系列技术报告)。
聊天机器人是一种统计模型,根据输入文本生成响应,目标是最大化回复质量。用户提交提示词(prompt),模型返回响应(response)。尽管已集成搜索、图像生成等功能,文本交互仍是主流形式。
ChatGPT自推出以来,陆续采用GPT-3.5、GPT-4、GPT-4o、o1、o3及GPT-5等多种底层模型,并持续更新权重与系统提示词。
2.1 大型语言模型的核心原理
大型语言模型本质上是一个函数,将输入文本转换为词汇的概率分布(以“词元”为单位)。该函数由深度神经网络(通常为Transformer架构)实现,包含数十亿参数。虽然部分模型可处理图像、音频等多模态输入,但仍统称为“语言模型”。
2.2 模型训练的两阶段流程
- 预训练阶段:模型在海量文本上学习“预测下一个词”,掌握语言规律与世界知识,形成潜在语义表征;
- 后训练阶段:通过微调、强化学习等方式优化回复质量,并加入安全约束防止有害内容生成。
预训练使模型理解语言结构,后训练则将其转化为实用工具。这一过程实现了从“知识存储”到“功能服务”的转化。
2.3 聊天机器人的评估方法
- 基准测试:使用标准化问题集(如MMLU)衡量模型能力;
- 人类偏好比较:通过人工对比判断回复质量优劣(如Chatbot Arena)。
3 数据与隐私保护
所有分析均遵循OpenAI隐私政策,研究团队未查看任何原始用户消息。
3.1 数据集概述
1. 增长数据集
- 内容:2022年11月至2025年9月间,消费级用户的每日消息总量及注册国家、年龄区间等基本信息;
- 用途:用于用户增长分析;
- 排除范围:企业版、教育版等非消费级用户。
2. 分类消息数据集
通过自动化分类器处理,无人接触原始内容:
- 所有用户抽样:2024年5月15日至2025年6月26日,约110万条匿名消息,用于使用行为分析;
- 部分用户抽样:同期约13万用户的消息,用于用户画像研究。
3. 就业数据集
- 内容:约13万用户公开信息整理的行业、职业、学历等汇总类别;
- 获取方式:通过安全数据洁净室(DCR)汇总,仅允许预设聚合查询,研究后即删除;
- 用途:用于第6章分析,排除未授权共享及未成年用户。
3.2 隐私保护核心措施
1. 自动化分类与PII清洗
- 消息经“隐私过滤器”清除姓名、邮箱等个人身份信息(PII)后,由GPT-5-mini或GPT-5分类;
- 分类时参考前10条消息上下文,每条截断至5000字符以防偏差;
- 技术限制确保研究人员无法查看原始文本。
2. 数据洁净室机制
- 所有就业数据分析在洁净室内完成,研究团队无权访问个体数据;
- 仅返回用户数≥100的聚合结果(如小众职业合并为大类);
- 查询需经6人委员会与合作方双重审批。
3. 分类器验证
使用公开数据集WildChat验证分类准确性,结果显示模型与人工标注一致性高于人类间一致性(如工作相关分类Cohen’s κ=0.83 vs 人类0.66)。
4 ChatGPT的发展历程
4.1 用户增长:从“研究预览”到全球10%成年人口
ChatGPT于2022年11月30日发布,5天内注册用户破百万。截至2025年7月,周活跃用户达7亿,约占全球成年群体的10%。
4.2 消息量增长:总量与用户群体贡献
- 总体增长:2024年7月至2025年7月,日均消息量增长超5倍;
- 用户贡献:早期用户使用量回升至历史高位,新用户群也快速增长,表明用户基数与使用频率同步提升。
4.3 关键趋势:用户使用深度提升
各注册群体的“日均消息量/周活用户”比值持续上升,表明:
- 模型能力升级(如GPT-4o、GPT-5)推动高频使用;
- 用户不断探索新用途,应用场景日益丰富。
5 ChatGPT的使用方式
5.1 工作 vs 非工作使用:非工作场景增长更快
2024年6月至2025年6月,非工作相关消息占比从53%升至73%,且在所有用户群体中均呈上升趋势,说明用户不仅增加使用频次,也在拓展生活化应用场景。
5.2 对话主题:三大核心场景占比近80%
消息被分为七大主题(见下表):
表3:核心对话主题及底层分类器类别
| 主题 | 包含的对话类别 |
| 写作辅助(Writing) | 编辑/点评用户文本、个人写作/沟通、翻译、论点/摘要生成、创意写作 |
| 实用指导(Practical Guidance) | 操作建议、辅导/教学、创意构思、健康/健身/美容/自我护理 |
| 技术帮助(Technical Help) | 数学计算/数据分析、计算机编程 |
| 多媒体(Multimedia) | 生成图像、生成/获取其他媒体(如音频、PPT) |
| 信息查询(Seeking Information) | 特定信息查询(人物、时事等)、烹饪/食谱 |
| 自我表达(Self-Expression) | 问候/闲聊、游戏/角色扮演、人际关系/个人反思 |
| 其他/未知(Other/Unknown) | 询问模型功能、意图不明 |
- 三大主题合计占77%:
- 实用指导:稳定在29%左右,最常见;
- 信息查询:从14%升至24%,成为第二大类;
- 写作辅助:从36%降至24%,但在工作中仍为核心。
- 其他趋势:
- 技术帮助:从12%降至5%,可能因编程转向API工具;
- 多媒体:从2%升至7%,图像生成功能上线后显著增长;
- 自我表达:仅5.3%,其中人际关系类1.9%,角色扮演0.4%。
工作场景的主题特点
在工作相关消息中,“写作辅助”占40%(2025年7月),其次为“实用指导”(24%)和“技术帮助”(10%)。
写作辅助的细节:以“修改文本”为主
“编辑/点评用户文本”“翻译”“论点/摘要生成”三项合计占“写作辅助”类别的三分之二,表明用户更倾向于优化已有内容,而非全新创作。
5.3 用户意图:咨询型增长快于任务型
按意图分类(定义见下表):
表4:用户意图分类及示例
| 意图类型 | 定义与示例 |
| 咨询型(Asking) | 寻求信息/建议以辅助决策(如“去年通胀率是多少?”) |
| 任务型(Doing) | 请求生成输出或完成任务(如“重写邮件使其更正式”) |
| 表达型(Expressing) | 仅表达观点/感受,无信息或任务需求 |
- 总体分布:49%咨询型、40%任务型、11%表达型;
- 时间趋势:2024年7月至2025年7月,咨询型从42%升至51.6%,任务型从50%降至34.6%;
- 工作场景:任务型占56%(其中35%为写作辅助),咨询型占35%。
5.4 与O*NET工作活动的关联:聚焦信息与决策
- 所有消息:45.2%集中于三大通用工作活动(GWA):获取信息(19.3%)、解读信息(13.1%)、记录信息(12.8%);
- 工作相关消息:核心GWA为记录信息(13.2%)、制定决策与解决问题(10.6%)、创造性思考(9.3%);
- 跨职业一致性:无论职业类别,“制定决策与解决问题”“记录信息”“创造性思考”均位列前五,体现ChatGPT在信息处理与决策支持上的普适价值。
5.5 交互质量:“良好”评价增长快于“不佳”
- 2025年7月,“良好”交互数量是“不佳”的4倍以上(2024年末为3倍);
- 主题差异:“自我表达”满意度最高(7:1),“多媒体”最低(1.7:1);
- 意图差异:咨询型消息满意度显著高于任务型或表达型。
6 谁在使用ChatGPT?
6.1 性别差异:差距从显著到近乎消失
- 用户规模:初期80%活跃用户使用典型男性名字,2025年6月女性略占优;
- 使用偏好:女性更关注“写作辅助”“实用指导”;男性偏爱“技术帮助”“信息查询”“多媒体”。
6.2 年龄差异:年轻用户占比高,工作使用随年龄上升
- 消息量分布:18–25岁用户贡献46%的成年用户消息;
- 工作相关比例:26岁以下为22.5%,56–65岁升至27.1%,66岁以上回落至16.1%。
6.3 地区差异:中低收入国家增长更快
2024年5月至2025年5月,人均GDP在1万–4万美元的中低收入国家,用户占互联网人口比例的增长显著高于高收入国家,显示技术扩散加速。
6.4 教育差异:高学历用户更倾向工作使用
- 工作相关比例:本科以下37%,本科46%,研究生48%(调整后差异缩小但仍显著);
- 意图与主题:研究生学历用户更倾向“咨询型”消息(高出2个百分点),“写作辅助”使用率随学历上升。
6.5 职业差异:高薪专业职业更注重工作使用
职业分为五类:非专业、计算机相关、工程/科学、管理/商业、其他专业。
- 工作相关比例:计算机相关职业最高(57%),非专业最低(40%);
- 意图差异:高薪专业职业“咨询型”工作消息占比更高(计算机相关47% vs 非专业32%);
- 主题匹配:管理/商业职业“写作辅助”占52%,计算机相关“技术帮助”占37%,契合岗位需求;
- 跨职业一致性:所有职业的核心GWA均包括“制定决策与解决问题”“记录信息”“创造性思考”,体现价值普适性。
7 结论
- 普及速度空前:截至2025年7月,周活跃用户达7亿,日均消息超25亿条,首项覆盖全球10%成年人口的新技术;
- 非工作使用占主导:70%消息与工作无关且增长更快,显示其对日常生活的深远影响;
- 核心使用场景明确:“实用指导”“信息查询”“写作辅助”合计近80%,编程与陪伴类使用较少;
- 决策支持价值突出:“咨询型”消息增长快、满意度高,体现用户对其“智能顾问”角色的认可;
- 用户群体趋于多元:性别差距基本消除,中低收入国家增长快,年轻用户活跃,但高学历、高薪职业者更用于工作;
- 经济价值显著:提升知识密集型工作效率,非工作场景亦产生巨大消费者剩余(如美国年超970亿美元)。
未来研究可深入探讨其对各行业生产力的具体影响,并推动技术普惠,缩小数字鸿沟。

