

《人们如何使用ChatGPT》中文精校版

小象AI

2025-09-17

人们如何使用ChatGPT

Aaron Chatterji¹,² Christopher Ong¹,³ Tom Cunningham¹ Carl Shan¹ David Deming³ Zoë Hitzig¹,³ Kevin Wadman¹
¹OpenAI ²杜克大学（Duke University） ³哈佛大学（Harvard University）

2025年9月15日

摘要

大型语言模型（LLM）聊天机器人迅速普及，但其实际使用方式尚不清晰。本研究追踪ChatGPT自2022年11月推出至2025年7月的发展，覆盖全球约10%的成年人口。早期用户以男性为主，性别差距已显著缩小，中低收入国家增长更快。

通过隐私保护的自动化流程对代表性对话样本进行分类分析发现：非工作相关消息占比从53%上升至70%以上，增速超过工作场景。高学历及高薪职业人群更倾向用于工作。

主要使用场景为“实用指导”“信息查询”和“写作辅助”，合计占所有对话近80%。其中，“写作辅助”在工作场景中占主导地位，凸显其在生成数字内容方面的优势。编程与情感陪伴类使用占比较低。

总体表明，ChatGPT通过提供决策支持创造经济价值，尤其在知识密集型工作中作用突出。

1 引言

ChatGPT于2022年11月上线，截至2025年7月，周活跃用户达7亿，相当于全球10%的成年人口，是史上最快实现广泛普及的技术之一。

作为首个面向大众市场的大型语言模型产品，ChatGPT代表了人工智能能力的重大突破。尽管其技术影响受到广泛关注，但关于具体使用行为的数据仍有限。现有调查多依赖自我报告，存在偏差且无法反映真实对话内容。

本文基于更大规模、更具代表性的数据集，结合自动化分类方法，系统分析ChatGPT的使用模式：

用户基数远超同类平台，更具普遍性；
采用新分类体系与自动化分类器分析消息类型；
追踪不同人群中的普及趋势；
在保障隐私前提下，关联用户教育与职业背景，分析使用差异。

研究数据来自2024年5月至2025年6月期间，ChatGPT消费级套餐用户的随机消息样本。通过安全数据洁净室协议，将分类结果与用户汇总级就业和教育信息匹配，确保隐私合规。

表1：ChatGPT日均消息量（百万条）：工作相关与非工作相关拆分

月份	非工作相关（百万条）	占比	工作相关（百万条）	占比	总消息量（百万条）
2024年6月	238	53%	213	47%	451
2025年6月	1,911	73%	716	27%	2,627

注：总消息量为精确统计值；工作/非工作分类基于抽样估算，排除未登录、未成年、拒绝训练及封禁账号。数值为7天平均值。

数据显示，两类消息均快速增长，但非工作场景增速更快。这一趋势说明，人工智能对日常生活的影响已不亚于其对有偿工作的促进作用。

非工作使用占比上升，主要源于既有用户行为变化，而非新用户结构改变。该发现与Collis和Brynjolfsson（2025）的研究一致——仅2024年，美国用户从生成式AI获得的消费者剩余就超970亿美元。

研究发现，近80%的使用可归为三大类别：

实用指导：包括教学辅导、操作建议、创意构思等；
信息查询：涵盖人物、时事、产品、食谱等，功能接近搜索引擎；
写作辅助：如撰写邮件、文档、文本编辑、翻译、摘要生成。

在工作场景中，“写作辅助”占40%，其中约三分之二为修改已有文本，而非从零创作。同时，约10%的消息涉及教学或学习，显示教育应用广泛。

两项发现与现有研究不同：

编程相关消息仅占4.2%，远低于其他平台报告的33%；
情感陪伴类话题极少，仅1.9%涉及人际关系反思，0.4%为角色扮演。

人口统计特征显示：

性别差距缩小：初期80%活跃用户使用典型男性名字，2025年6月降至48%；
年龄分布：近半数消息来自26岁以下用户，但各年龄段差距正在收窄；
地区增长：过去一年，中低收入国家使用增长率更高；
教育与职业差异：高学历、高薪专业职业者更常用于工作。

引入新的意图分类体系：“咨询型”“任务型”“表达型”：

咨询型：寻求信息或建议以辅助决策（如“如何制定预算？”）；
任务型：请求生成输出或完成任务（如“重写邮件”）；
表达型：仅表达观点或情绪。

整体分布为：49%咨询型、40%任务型、11%表达型。但在工作场景中，任务型占比达56%，其中近四分之三属于“写作辅助”。

“写作辅助”的高频使用与其核心价值相关：写作是多数白领工作的关键技能，而生成式AI在长文本生成方面具有独特优势。

结合O*NET职业数据库分析发现，工作相关消息中58%集中于两类活动：

获取、记录和解读信息；
制定决策、解决问题与创造性思考。

这些活动在管理、STEM、行政、销售等各类职业中均居前列，说明ChatGPT的应用具有高度普适性。

总体来看，信息查询与决策支持是核心应用场景。“咨询型”消息增长快于“任务型”，且满意度评分更高。这表明用户更重视其作为“智能顾问”的角色，而非单纯的任务执行工具。

ChatGPT通过提升决策质量创造经济价值，尤其在知识密集型工作中效果显著。这也解释了为何高学历、高薪职业用户更偏好“咨询型”功能，符合“AI副驾驶”模型理论。

2 什么是ChatGPT？

本节简述大型语言模型（LLM）与聊天机器人的基本原理（详见OpenAI系列技术报告）。

聊天机器人是一种统计模型，根据输入文本生成响应，目标是最大化回复质量。用户提交提示词（prompt），模型返回响应（response）。尽管已集成搜索、图像生成等功能，文本交互仍是主流形式。

ChatGPT自推出以来，陆续采用GPT-3.5、GPT-4、GPT-4o、o1、o3及GPT-5等多种底层模型，并持续更新权重与系统提示词。

2.1 大型语言模型的核心原理

大型语言模型本质上是一个函数，将输入文本转换为词汇的概率分布（以“词元”为单位）。该函数由深度神经网络（通常为Transformer架构）实现，包含数十亿参数。虽然部分模型可处理图像、音频等多模态输入，但仍统称为“语言模型”。

2.2 模型训练的两阶段流程

预训练阶段：模型在海量文本上学习“预测下一个词”，掌握语言规律与世界知识，形成潜在语义表征；
后训练阶段：通过微调、强化学习等方式优化回复质量，并加入安全约束防止有害内容生成。

预训练使模型理解语言结构，后训练则将其转化为实用工具。这一过程实现了从“知识存储”到“功能服务”的转化。

2.3 聊天机器人的评估方法

基准测试：使用标准化问题集（如MMLU）衡量模型能力；
人类偏好比较：通过人工对比判断回复质量优劣（如Chatbot Arena）。

3 数据与隐私保护

所有分析均遵循OpenAI隐私政策，研究团队未查看任何原始用户消息。

3.1 数据集概述

1. 增长数据集

内容：2022年11月至2025年9月间，消费级用户的每日消息总量及注册国家、年龄区间等基本信息；
用途：用于用户增长分析；
排除范围：企业版、教育版等非消费级用户。

2. 分类消息数据集

通过自动化分类器处理，无人接触原始内容：

所有用户抽样：2024年5月15日至2025年6月26日，约110万条匿名消息，用于使用行为分析；
部分用户抽样：同期约13万用户的消息，用于用户画像研究。

3. 就业数据集

内容：约13万用户公开信息整理的行业、职业、学历等汇总类别；
获取方式：通过安全数据洁净室（DCR）汇总，仅允许预设聚合查询，研究后即删除；
用途：用于第6章分析，排除未授权共享及未成年用户。

3.2 隐私保护核心措施

1. 自动化分类与PII清洗

消息经“隐私过滤器”清除姓名、邮箱等个人身份信息（PII）后，由GPT-5-mini或GPT-5分类；
分类时参考前10条消息上下文，每条截断至5000字符以防偏差；
技术限制确保研究人员无法查看原始文本。

2. 数据洁净室机制

所有就业数据分析在洁净室内完成，研究团队无权访问个体数据；
仅返回用户数≥100的聚合结果（如小众职业合并为大类）；
查询需经6人委员会与合作方双重审批。

3. 分类器验证

使用公开数据集WildChat验证分类准确性，结果显示模型与人工标注一致性高于人类间一致性（如工作相关分类Cohen’s κ=0.83 vs 人类0.66）。

4 ChatGPT的发展历程

4.1 用户增长：从“研究预览”到全球10%成年人口

ChatGPT于2022年11月30日发布，5天内注册用户破百万。截至2025年7月，周活跃用户达7亿，约占全球成年群体的10%。

4.2 消息量增长：总量与用户群体贡献

总体增长：2024年7月至2025年7月，日均消息量增长超5倍；
用户贡献：早期用户使用量回升至历史高位，新用户群也快速增长，表明用户基数与使用频率同步提升。

4.3 关键趋势：用户使用深度提升

各注册群体的“日均消息量/周活用户”比值持续上升，表明：

模型能力升级（如GPT-4o、GPT-5）推动高频使用；
用户不断探索新用途，应用场景日益丰富。

5 ChatGPT的使用方式

5.1 工作 vs 非工作使用：非工作场景增长更快

2024年6月至2025年6月，非工作相关消息占比从53%升至73%，且在所有用户群体中均呈上升趋势，说明用户不仅增加使用频次，也在拓展生活化应用场景。

5.2 对话主题：三大核心场景占比近80%

消息被分为七大主题（见下表）：

表3：核心对话主题及底层分类器类别

主题	包含的对话类别
写作辅助（Writing）	编辑/点评用户文本、个人写作/沟通、翻译、论点/摘要生成、创意写作
实用指导（Practical Guidance）	操作建议、辅导/教学、创意构思、健康/健身/美容/自我护理
技术帮助（Technical Help）	数学计算/数据分析、计算机编程
多媒体（Multimedia）	生成图像、生成/获取其他媒体（如音频、PPT）
信息查询（Seeking Information）	特定信息查询（人物、时事等）、烹饪/食谱
自我表达（Self-Expression）	问候/闲聊、游戏/角色扮演、人际关系/个人反思
其他/未知（Other/Unknown）	询问模型功能、意图不明

三大主题合计占77%：
- 实用指导：稳定在29%左右，最常见；
- 信息查询：从14%升至24%，成为第二大类；
- 写作辅助：从36%降至24%，但在工作中仍为核心。
其他趋势：
- 技术帮助：从12%降至5%，可能因编程转向API工具；
- 多媒体：从2%升至7%，图像生成功能上线后显著增长；
- 自我表达：仅5.3%，其中人际关系类1.9%，角色扮演0.4%。

工作场景的主题特点

在工作相关消息中，“写作辅助”占40%（2025年7月），其次为“实用指导”（24%）和“技术帮助”（10%）。

写作辅助的细节：以“修改文本”为主

“编辑/点评用户文本”“翻译”“论点/摘要生成”三项合计占“写作辅助”类别的三分之二，表明用户更倾向于优化已有内容，而非全新创作。

5.3 用户意图：咨询型增长快于任务型

按意图分类（定义见下表）：

表4：用户意图分类及示例

意图类型	定义与示例
咨询型（Asking）	寻求信息/建议以辅助决策（如“去年通胀率是多少？”）
任务型（Doing）	请求生成输出或完成任务（如“重写邮件使其更正式”）
表达型（Expressing）	仅表达观点/感受，无信息或任务需求