大数跨境
0
0

《人们如何使用ChatGPT》中文精校版

《人们如何使用ChatGPT》中文精校版 小象AI
2025-09-17
92

人们如何使用ChatGPT

Aaron Chatterji¹,² Christopher Ong¹,³ Tom Cunningham¹ Carl Shan¹ David Deming³ Zoë Hitzig¹,³ Kevin Wadman¹
¹OpenAI ²杜克大学(Duke University) ³哈佛大学(Harvard University)

2025年9月15日

摘要

大型语言模型(LLM)聊天机器人迅速普及,但其实际使用方式尚不清晰。本研究追踪ChatGPT自2022年11月推出至2025年7月的发展,覆盖全球约10%的成年人口。早期用户以男性为主,性别差距已显著缩小,中低收入国家增长更快。

通过隐私保护的自动化流程对代表性对话样本进行分类分析发现:非工作相关消息占比从53%上升至70%以上,增速超过工作场景。高学历及高薪职业人群更倾向用于工作。

主要使用场景为“实用指导”“信息查询”和“写作辅助”,合计占所有对话近80%。其中,“写作辅助”在工作场景中占主导地位,凸显其在生成数字内容方面的优势。编程与情感陪伴类使用占比较低。

总体表明,ChatGPT通过提供决策支持创造经济价值,尤其在知识密集型工作中作用突出。

1 引言

ChatGPT于2022年11月上线,截至2025年7月,周活跃用户达7亿,相当于全球10%的成年人口,是史上最快实现广泛普及的技术之一。

作为首个面向大众市场的大型语言模型产品,ChatGPT代表了人工智能能力的重大突破。尽管其技术影响受到广泛关注,但关于具体使用行为的数据仍有限。现有调查多依赖自我报告,存在偏差且无法反映真实对话内容。

本文基于更大规模、更具代表性的数据集,结合自动化分类方法,系统分析ChatGPT的使用模式:

  1. 用户基数远超同类平台,更具普遍性;
  2. 采用新分类体系与自动化分类器分析消息类型;
  3. 追踪不同人群中的普及趋势;
  4. 在保障隐私前提下,关联用户教育与职业背景,分析使用差异。

研究数据来自2024年5月至2025年6月期间,ChatGPT消费级套餐用户的随机消息样本。通过安全数据洁净室协议,将分类结果与用户汇总级就业和教育信息匹配,确保隐私合规。

表1:ChatGPT日均消息量(百万条):工作相关与非工作相关拆分

月份 非工作相关(百万条) 占比 工作相关(百万条) 占比 总消息量(百万条)
2024年6月 238 53% 213 47% 451
2025年6月 1,911 73% 716 27% 2,627

注:总消息量为精确统计值;工作/非工作分类基于抽样估算,排除未登录、未成年、拒绝训练及封禁账号。数值为7天平均值。

数据显示,两类消息均快速增长,但非工作场景增速更快。这一趋势说明,人工智能对日常生活的影响已不亚于其对有偿工作的促进作用。

非工作使用占比上升,主要源于既有用户行为变化,而非新用户结构改变。该发现与Collis和Brynjolfsson(2025)的研究一致——仅2024年,美国用户从生成式AI获得的消费者剩余就超970亿美元。

研究发现,近80%的使用可归为三大类别:

  • 实用指导:包括教学辅导、操作建议、创意构思等;
  • 信息查询:涵盖人物、时事、产品、食谱等,功能接近搜索引擎;
  • 写作辅助:如撰写邮件、文档、文本编辑、翻译、摘要生成。

在工作场景中,“写作辅助”占40%,其中约三分之二为修改已有文本,而非从零创作。同时,约10%的消息涉及教学或学习,显示教育应用广泛。

两项发现与现有研究不同:

  1. 编程相关消息仅占4.2%,远低于其他平台报告的33%;
  2. 情感陪伴类话题极少,仅1.9%涉及人际关系反思,0.4%为角色扮演。

人口统计特征显示:

  1. 性别差距缩小:初期80%活跃用户使用典型男性名字,2025年6月降至48%;
  2. 年龄分布:近半数消息来自26岁以下用户,但各年龄段差距正在收窄;
  3. 地区增长:过去一年,中低收入国家使用增长率更高;
  4. 教育与职业差异:高学历、高薪专业职业者更常用于工作。

引入新的意图分类体系:“咨询型”“任务型”“表达型”:

  • 咨询型:寻求信息或建议以辅助决策(如“如何制定预算?”);
  • 任务型:请求生成输出或完成任务(如“重写邮件”);
  • 表达型:仅表达观点或情绪。

整体分布为:49%咨询型、40%任务型、11%表达型。但在工作场景中,任务型占比达56%,其中近四分之三属于“写作辅助”。

“写作辅助”的高频使用与其核心价值相关:写作是多数白领工作的关键技能,而生成式AI在长文本生成方面具有独特优势。

结合O*NET职业数据库分析发现,工作相关消息中58%集中于两类活动:

  1. 获取、记录和解读信息;
  2. 制定决策、解决问题与创造性思考。

这些活动在管理、STEM、行政、销售等各类职业中均居前列,说明ChatGPT的应用具有高度普适性。

总体来看,信息查询与决策支持是核心应用场景。“咨询型”消息增长快于“任务型”,且满意度评分更高。这表明用户更重视其作为“智能顾问”的角色,而非单纯的任务执行工具。

ChatGPT通过提升决策质量创造经济价值,尤其在知识密集型工作中效果显著。这也解释了为何高学历、高薪职业用户更偏好“咨询型”功能,符合“AI副驾驶”模型理论。

2 什么是ChatGPT?

本节简述大型语言模型(LLM)与聊天机器人的基本原理(详见OpenAI系列技术报告)。

聊天机器人是一种统计模型,根据输入文本生成响应,目标是最大化回复质量。用户提交提示词(prompt),模型返回响应(response)。尽管已集成搜索、图像生成等功能,文本交互仍是主流形式。

ChatGPT自推出以来,陆续采用GPT-3.5、GPT-4、GPT-4o、o1、o3及GPT-5等多种底层模型,并持续更新权重与系统提示词。

2.1 大型语言模型的核心原理

大型语言模型本质上是一个函数,将输入文本转换为词汇的概率分布(以“词元”为单位)。该函数由深度神经网络(通常为Transformer架构)实现,包含数十亿参数。虽然部分模型可处理图像、音频等多模态输入,但仍统称为“语言模型”。

2.2 模型训练的两阶段流程

  1. 预训练阶段:模型在海量文本上学习“预测下一个词”,掌握语言规律与世界知识,形成潜在语义表征;
  2. 后训练阶段:通过微调、强化学习等方式优化回复质量,并加入安全约束防止有害内容生成。

预训练使模型理解语言结构,后训练则将其转化为实用工具。这一过程实现了从“知识存储”到“功能服务”的转化。

2.3 聊天机器人的评估方法

  • 基准测试:使用标准化问题集(如MMLU)衡量模型能力;
  • 人类偏好比较:通过人工对比判断回复质量优劣(如Chatbot Arena)。

3 数据与隐私保护

所有分析均遵循OpenAI隐私政策,研究团队未查看任何原始用户消息。

3.1 数据集概述

1. 增长数据集

  • 内容:2022年11月至2025年9月间,消费级用户的每日消息总量及注册国家、年龄区间等基本信息;
  • 用途:用于用户增长分析;
  • 排除范围:企业版、教育版等非消费级用户。

2. 分类消息数据集

通过自动化分类器处理,无人接触原始内容:

  • 所有用户抽样:2024年5月15日至2025年6月26日,约110万条匿名消息,用于使用行为分析;
  • 部分用户抽样:同期约13万用户的消息,用于用户画像研究。

3. 就业数据集

  • 内容:约13万用户公开信息整理的行业、职业、学历等汇总类别;
  • 获取方式:通过安全数据洁净室(DCR)汇总,仅允许预设聚合查询,研究后即删除;
  • 用途:用于第6章分析,排除未授权共享及未成年用户。

3.2 隐私保护核心措施

1. 自动化分类与PII清洗

  • 消息经“隐私过滤器”清除姓名、邮箱等个人身份信息(PII)后,由GPT-5-mini或GPT-5分类;
  • 分类时参考前10条消息上下文,每条截断至5000字符以防偏差;
  • 技术限制确保研究人员无法查看原始文本。

2. 数据洁净室机制

  • 所有就业数据分析在洁净室内完成,研究团队无权访问个体数据;
  • 仅返回用户数≥100的聚合结果(如小众职业合并为大类);
  • 查询需经6人委员会与合作方双重审批。

3. 分类器验证

使用公开数据集WildChat验证分类准确性,结果显示模型与人工标注一致性高于人类间一致性(如工作相关分类Cohen’s κ=0.83 vs 人类0.66)。

4 ChatGPT的发展历程

4.1 用户增长:从“研究预览”到全球10%成年人口

ChatGPT于2022年11月30日发布,5天内注册用户破百万。截至2025年7月,周活跃用户达7亿,约占全球成年群体的10%。

4.2 消息量增长:总量与用户群体贡献

  • 总体增长:2024年7月至2025年7月,日均消息量增长超5倍;
  • 用户贡献:早期用户使用量回升至历史高位,新用户群也快速增长,表明用户基数与使用频率同步提升。

4.3 关键趋势:用户使用深度提升

各注册群体的“日均消息量/周活用户”比值持续上升,表明:

  1. 模型能力升级(如GPT-4o、GPT-5)推动高频使用;
  2. 用户不断探索新用途,应用场景日益丰富。

5 ChatGPT的使用方式

5.1 工作 vs 非工作使用:非工作场景增长更快

2024年6月至2025年6月,非工作相关消息占比从53%升至73%,且在所有用户群体中均呈上升趋势,说明用户不仅增加使用频次,也在拓展生活化应用场景。

5.2 对话主题:三大核心场景占比近80%

消息被分为七大主题(见下表):

表3:核心对话主题及底层分类器类别

主题 包含的对话类别
写作辅助(Writing) 编辑/点评用户文本、个人写作/沟通、翻译、论点/摘要生成、创意写作
实用指导(Practical Guidance) 操作建议、辅导/教学、创意构思、健康/健身/美容/自我护理
技术帮助(Technical Help) 数学计算/数据分析、计算机编程
多媒体(Multimedia) 生成图像、生成/获取其他媒体(如音频、PPT)
信息查询(Seeking Information) 特定信息查询(人物、时事等)、烹饪/食谱
自我表达(Self-Expression) 问候/闲聊、游戏/角色扮演、人际关系/个人反思
其他/未知(Other/Unknown) 询问模型功能、意图不明
  • 三大主题合计占77%
    • 实用指导:稳定在29%左右,最常见;
    • 信息查询:从14%升至24%,成为第二大类;
    • 写作辅助:从36%降至24%,但在工作中仍为核心。
  • 其他趋势
    • 技术帮助:从12%降至5%,可能因编程转向API工具;
    • 多媒体:从2%升至7%,图像生成功能上线后显著增长;
    • 自我表达:仅5.3%,其中人际关系类1.9%,角色扮演0.4%。

工作场景的主题特点

在工作相关消息中,“写作辅助”占40%(2025年7月),其次为“实用指导”(24%)和“技术帮助”(10%)。

写作辅助的细节:以“修改文本”为主

“编辑/点评用户文本”“翻译”“论点/摘要生成”三项合计占“写作辅助”类别的三分之二,表明用户更倾向于优化已有内容,而非全新创作。

5.3 用户意图:咨询型增长快于任务型

按意图分类(定义见下表):

表4:用户意图分类及示例

意图类型 定义与示例
咨询型(Asking) 寻求信息/建议以辅助决策(如“去年通胀率是多少?”)
任务型(Doing) 请求生成输出或完成任务(如“重写邮件使其更正式”)
表达型(Expressing) 仅表达观点/感受,无信息或任务需求
  • 总体分布:49%咨询型、40%任务型、11%表达型;
  • 时间趋势:2024年7月至2025年7月,咨询型从42%升至51.6%,任务型从50%降至34.6%;
  • 工作场景:任务型占56%(其中35%为写作辅助),咨询型占35%。

5.4 与O*NET工作活动的关联:聚焦信息与决策

  • 所有消息:45.2%集中于三大通用工作活动(GWA):获取信息(19.3%)、解读信息(13.1%)、记录信息(12.8%);
  • 工作相关消息:核心GWA为记录信息(13.2%)、制定决策与解决问题(10.6%)、创造性思考(9.3%);
  • 跨职业一致性:无论职业类别,“制定决策与解决问题”“记录信息”“创造性思考”均位列前五,体现ChatGPT在信息处理与决策支持上的普适价值。

5.5 交互质量:“良好”评价增长快于“不佳”

  • 2025年7月,“良好”交互数量是“不佳”的4倍以上(2024年末为3倍);
  • 主题差异:“自我表达”满意度最高(7:1),“多媒体”最低(1.7:1);
  • 意图差异:咨询型消息满意度显著高于任务型或表达型。

6 谁在使用ChatGPT?

6.1 性别差异:差距从显著到近乎消失

  • 用户规模:初期80%活跃用户使用典型男性名字,2025年6月女性略占优;
  • 使用偏好:女性更关注“写作辅助”“实用指导”;男性偏爱“技术帮助”“信息查询”“多媒体”。

6.2 年龄差异:年轻用户占比高,工作使用随年龄上升

  • 消息量分布:18–25岁用户贡献46%的成年用户消息;
  • 工作相关比例:26岁以下为22.5%,56–65岁升至27.1%,66岁以上回落至16.1%。

6.3 地区差异:中低收入国家增长更快

2024年5月至2025年5月,人均GDP在1万–4万美元的中低收入国家,用户占互联网人口比例的增长显著高于高收入国家,显示技术扩散加速。

6.4 教育差异:高学历用户更倾向工作使用

  • 工作相关比例:本科以下37%,本科46%,研究生48%(调整后差异缩小但仍显著);
  • 意图与主题:研究生学历用户更倾向“咨询型”消息(高出2个百分点),“写作辅助”使用率随学历上升。

6.5 职业差异:高薪专业职业更注重工作使用

职业分为五类:非专业、计算机相关、工程/科学、管理/商业、其他专业。

  • 工作相关比例:计算机相关职业最高(57%),非专业最低(40%);
  • 意图差异:高薪专业职业“咨询型”工作消息占比更高(计算机相关47% vs 非专业32%);
  • 主题匹配:管理/商业职业“写作辅助”占52%,计算机相关“技术帮助”占37%,契合岗位需求;
  • 跨职业一致性:所有职业的核心GWA均包括“制定决策与解决问题”“记录信息”“创造性思考”,体现价值普适性。

7 结论

  1. 普及速度空前:截至2025年7月,周活跃用户达7亿,日均消息超25亿条,首项覆盖全球10%成年人口的新技术;
  2. 非工作使用占主导:70%消息与工作无关且增长更快,显示其对日常生活的深远影响;
  3. 核心使用场景明确:“实用指导”“信息查询”“写作辅助”合计近80%,编程与陪伴类使用较少;
  4. 决策支持价值突出:“咨询型”消息增长快、满意度高,体现用户对其“智能顾问”角色的认可;
  5. 用户群体趋于多元:性别差距基本消除,中低收入国家增长快,年轻用户活跃,但高学历、高薪职业者更用于工作;
  6. 经济价值显著:提升知识密集型工作效率,非工作场景亦产生巨大消费者剩余(如美国年超970亿美元)。

未来研究可深入探讨其对各行业生产力的具体影响,并推动技术普惠,缩小数字鸿沟。

【声明】内容源于网络
0
0
小象AI
1234
内容 61
粉丝 0
小象AI 1234
总阅读1.4k
粉丝0
内容61