大数跨境
0
0

海外 blog 翻译 3:How People Use ChatGPT

海外 blog 翻译 3:How People Use ChatGPT 程序猿读历史
2025-09-28
5
导读:ChatGPT 于 2022 年 11 月 30 日发布,到 2025 年 7 月底,ChatGPT 的周活跃用户总数超过 7 亿,全球 7 亿用户每周发送的信息数量高达 180 亿条,几乎占全球成年

海外 blog 翻译1:DBA的角色演变

海外 blog 翻译2:量子数据库


‍‍‍
9月15日,OpenAI 联合杜克大学、哈佛大学发布了一份关于ChatGPT 研究报告,标题为《How People Use ChatGPT》。尽管该报告仅基于 ChatGPT 的数据,但鉴于 OpenAI 在AI 领域的影响力,以及其每周活跃用户超 7 亿,从这些数据中挖掘出的洞察,大概率能代表大部分 AI 产品的发展趋势。

ChatGPT 发展历程

ChatGPT 于 2022 年 11 月 30 日以 “研究预览版” 的形式向公众发布,到 12 月 5 日,注册用户已超过 100 万。一年后,登录周活跃用户超过 1 亿;两年后,这一数字接近 3.5 亿。图3显示,截至 2025 年 7 月底,ChatGPT 的周活跃用户总数超过 7 亿,全球 7 亿用户每周发送的信息数量高达 180 亿条,几乎占全球成年人口的 10%⁠。

除了用户,报告还提到了用户发送信息的规模。图 4 展示了用户发送信息总量随时间的增长情况。实线显示,2024 年 7 月至 2025 年 7 月期间,信息发送量增长了 5 倍多。

黄线代表 ChatGPT 的首批用户群体。2023 年,这部分用户的使用率略有下降,但在 2024 年底再次开始增长,目前使用率已达到历史最高水平。粉线代表 2023 年第三季度及之前注册用户发送的信息,因此黄线和粉线之间的差值代表 2023 年第二季度和第三季度注册用户发送的信息。无论是新注册用户群体,还是现有用户群体内部使用率的增长,都推动了信息总量的显著增长。

ChatGPT 使用方式

接下来,我们将通过多种不同的分类体系,对 ChatGPT 对话内容进行分析。对于每种分类体系,我们都会先描述一个定义了若干类别的 “提示词”,然后运用大型语言模型将每条信息归入相应类别。我们的分类往往关注用户的意图,而非对话文本本身,因此无法直接观察到分类的真实情况。尽管如此,分类器的结果仍可被解读为人类基于相同提示词可能做出的最佳推测:大型语言模型的推测与人类基于相同提示词做出的推测高度相关,而且当提示词中包含 “不确定” 这一第三类别时,我们仍能得到类似的定性结果。

与工作相关

2024 年 6 月,非工作相关信息占比为 53%,工作相关信息占比为 47%;而到 2025 年 6 月,非工作相关信息占比大幅提升至 73%,工作相关信息占比则下降至 27%,非工作用途的增速达到工作用途的 1.5 倍。见表1。

表1:工作 vs 非工作 使用占比

这一变化的主要驱动因素并非用户结构的改变,而是现有用户使用习惯的调整,越来越多用户将 ChatGPT 应用于工作之外的场景。从用户群体特征来看,工作用途的信息更多集中在研究生及以上学历人群和高收入职业群体中,这类群体对 ChatGPT 在工作场景中的依赖度更高。

可见,ChatGPT 的使用主要由个人非工作需求驱动,且这一趋势正在加速。这说明用户更多地将其用于日常生活和个人兴趣,而非仅限于工作场景。因此,ChatGPT 也可以说是一款消费者级的互联网应用。

在与工作相关的使用中,“写作”占比高达40%,远超其他主题。这凸显了 ChatGPT 在职场中作为生产力工具的核心价值,主要用于处理邮件、报告、文案等。“技术帮助”占比逐步减少,从约18%降至10%,原因可能是像Copilot 等专业编程工具分流了这部分需求。

对话主题

报告显示,用户使用 chatGPT 最常见的三大对话主题是 实用指导、信息查询和写作,这三类主题合计约占 ChatGPT 所有对话的 77%。

实用指导的占比一直保持稳定,约占总使用率的 29%。写作 的占比从 2024 年 7 月的 36% 下降到一年后的 24%。同期,信息查询”的占比从 14% 上升到 24%。技术帮助的占比从 2024 年 7 月的 12% 下降到一年后的约 5%。这可能是因为其他大型语言模型编程的迅速普及,比如Claude。

报告进一步分析了7个主要主题,图9汇总了一年内各类别信息的发送量。写作主题下的 5 个子类分别是:编辑或点评用户提供的文本、个人写作或沟通内容、翻译、论点或摘要生成、小说创作。其中编辑或点评用户提供的文本、翻译、论点或摘要生成 占所有写作对话的三分之二。这表明用户与 ChatGPT 的大多数写作都是请求修改用户输入的内容,而非创建新内容。

教育是 ChatGPT 的一个主要应用场景。所有用户信息中 10.2%,以及 “实用指导” 信息中 36% 的内容是请求辅导或教学。此外,“实用指导” 中还有很大一部分(30%)是关于各类主题的通用操作建议,占所有信息的 8.5%。

意料之外的是,程序猿使用chatGPT的并不多。技术帮助 包括计算机编程占4.2%、数学计算 3% 和数据分析0.4%。

用户意图

报告还分析了用户意图。根据用户意图按照 “询问 Asking、执行 Doing、表达Expressing” 这一简单标准进行归类。Doing” 类对话生成的输出可以直接用于生产流程,而 “Asking” 类对话为决策提供支持,但不直接生成输出,“Expressing” 类对话则几乎不包含经济相关内容。

图 10 展示了样本中各类意图信息的占比。49% 的用户信息属于 “询问” 类,40% 属于 “执行” 类,11% 属于 “表达” 类。

图 13 展示了工作相关与非工作相关信息中 “询问 / 执行 / 表达” 的占比分布。“执行” 类信息约占所有信息的 40%,其中工作相关和非工作相关的占比基本持平。

交互质量

报告还对用户对聊天机器人回复的满意度进行了研究。 “交互质量” 分类器会查看用户在同一次对话中后续发送的信息,以判断用户是否表达了满意或不满意的情绪,并将结果分为 “Good”、“Bad” 和 “Unknown” 三类⁠。

图 16 展示了这三类信息的总体增长情况。2024 年底,“Good” 交互的数量约为 “Bad” 交互的 3 倍,但在接下来的 9 个月里,“Good” 交互的增长速度要快得多,到 2025 年 7 月,“Good” 交互的数量已超过 “Bad” 交互的 4 倍。

图 17 展示了按对话主题和交互类型划分的 “Good” 与 “Bad” 信息比例。面板 A 显示,“自我表达” 是评分最高的主题,其 “Good” 与 “Bad” 的比例超过 7,这与该类别的增长情况相符。“多媒体” 和 “技术帮助” 的 “Good” 与 “Bad” 比例最低,分别为 1.7 和 2.7。面板 B 显示,“询问” 类信息获得 “Good” 评价的概率远高于 “执行” 类或 “表达” 类信息。

ChatGPT 谁在使用

本节将介绍 ChatGPT 消费级用户的基本描述性特征。现有研究已经分析了美国代表性样本(Bick et al., 2024;Hartley et al., 2025)以及丹麦部分职业(Humlum & Vestergaard, 2025a)中生成式人工智能使用的人口统计学差异。这些研究均发现,男性、年轻人以及拥有高等教育学历和 / 或研究生学历的人群使用生成式人工智能的频率更高。

与以往文献相比,我们做出了三方面贡献。首先,我们在全球样本(而非单一国家样本)中验证了这些广泛存在的人口统计学模式。其次,我们针对特定人口统计学特征(如年龄、性别和原籍国)提供了更详细的信息,并研究了各特征的差距随时间的变化情况。第三,我们借助安全的数据洁净室,分析了 ChatGPT 使用情况在不同教育程度和职业群体中的差异。

性别差异

为了研究性别差异,我们利用公开的姓名 - 性别关联汇总数据集,对全球范围内随机抽取的 110 多万名 ChatGPT 用户的名字进行了分类。

在 ChatGPT 推出后的最初几个月里,周活跃用户中男性占比约 80%。然而,在 2025 年上半年,女性和男性的活跃用户逐渐接近持平。到 2025 年 6 月,女性比例更高。这表明 ChatGPT 使用中的性别差距已随着时间的推移大幅缩小。


报告还研究了不同性别用户在使用主题上的差异。女性用户相对更倾向于发送与 “写作” 和 “实用指导” 相关的信息。在 “写作” 主题上的消息占比,女性比男性高 7.6%;在 “实用指导” 主题上,占比高 1.1%。。相比之下,男性用户更倾向于将 ChatGPT 用于 “技术帮助”、“信息查询” 和 “多媒体”

年龄差异

部分用户在注册 OpenAI 账户时会自我报告年龄。在这些自我报告年龄的用户中,我们数据集中约 46% 的信息来自 18-25 岁的用户。

图20展示了不同年龄组工作相关信息占比的变化趋势。随着时间的推移,所有年龄段用户的 ChatGPT 使用中,工作相关用途的占比都在下降。

年龄较大的用户发送的工作相关信息占比更高,26 岁以下用户的工作相关信息约占总信息的 23%,且该比例随年龄增长而上升,仅 66 岁及以上用户例外,其工作相关信息仅占分类信息的 16%。

看来职场牛马主要集中在70、80、90后三个年龄段。好消息是,随着时间的推移,所有年龄段用户的 ChatGPT 使用中,工作相关用途的占比都在下降。

国家差异

通过计算 ChatGPT 周活跃消费级用户占各国互联网用户的比例,来研究不同国家使用 ChatGPT 的情况。

图21显示2024年5月和2025年5月,按人均GDP十分位数划分的 ChatGPT 周活跃用户占各国互联网人口比例情况。横轴是各国按人均 GDP 排名并分为十个十分位数,纵轴为每个十分位数的人均GDP中位数(单位:千美元)。实线代表各十分位数内的中位数占比,阴影区域为该十分位数内各国数值的四分位距。

2024 年 5 月至 2025 年 5 月,GDP 人均 1 万 - 4 万美元的国家,ChatGPT 用户占互联网人口比例的增长幅度,显著高于高收入国家,反映生成式 AI 在全球知识获取平等化中的潜力。

教育差异

图 22 展示了 ChatGPT 使用情况在不同教育程度用户之间的差异。受教育程度较高的用户更有可能将 ChatGPT 用于工作相关用途。教育程度低于本科用户中,37% 的信息与工作相关;拥有本科的用户中,这一比例为 46%;而研究生用户中,这一比例为 48%。

面板 B 探究了不同教育程度用户在信息意图上的差异。教育程度低于学士学位的用户中,“询问” 类信息约占 49%,而教育程度更高的用户在这一比例上几乎没有差异。

职业差异

从事高薪专业和技术职业的用户更有可能将 ChatGPT 用于工作相关用途⁠。面板 A 显示,工作相关信息占比数据如下:计算机相关职业为 57%;管理与商业职业为 50%;工程与科学职业为 48%;其他专业职业为 44%;所有非专业职业仅为 40%。

结论

本文记录了关于 ChatGPT 的八个重要事实。

第一,截至 2025 年 7 月,约 70% 的 ChatGPT 查询与工作无关;尽管工作相关和非工作相关查询的数量都在增加,但非工作相关查询的增长速度更快。

第二,ChatGPT 最常见的三大对话主题是 “实用指导”、“写作” 和 “信息查询”,这三类主题合计占所有信息的近 78%。“计算机编程” 和 “人际关系与个人反思” 的占比分别仅为 4.2% 和 1.9%。

第三,“写作” 是目前最主要的工作用途,占所有工作相关信息的 42%,在管理与商业职业用户的信息中占比超过一半。约三分之二的 “写作” 类信息是请求修改用户文本,而非从零开始生成新文本。

第四,我们根据用户寻求的输出类型,采用 “询问、执行、表达” 这一标准对信息进行分类。结果显示,约 49% 的信息是用户向 ChatGPT 寻求指导、建议或信息(“询问”),40% 是请求完成可用于特定流程的任务(“执行”),11% 是意图不明确的信息(“表达”)。

第五,ChatGPT 使用中的性别差距可能已随着时间的推移大幅缩小。截至 2025 年 7 月,周活跃用户中名字通常为女性名字的用户占比已超过一半。

第六,成年人发送的信息中,近一半来自 26 岁以下的用户。但与工作相关的信息占比,随着年龄的增长而上升,除了66岁及以上的用户以外。

第七,过去一年中,中低收入国家的 ChatGPT 使用率增长尤为迅速。

第八,受教育程度较高且从事专业职业的用户更倾向于将 ChatGPT 用于工作相关信息,并且在工作场景中更倾向于使用 “询问” 而非 “执行” 类功能。

总体而言,我们的研究结果表明,ChatGPT 对全球经济具有广泛的影响。非工作用途增长更快这一事实表明,生成式人工智能的使用可能会带来巨大的福利增益。

原文链接

https://www.nber.org/system/files/working_papers/w34255/w34255.pdf

图片

译者介绍

司马辽太杰,10余年数据库架构和运维管理经验,擅长常见关系型、NoSQL、MPP 等类型数据库。业余热爱历史、足球,读点闲书。欢迎关注个人公众号“程序猿读历史”。需联系,可从关注公众号,在公众号对话窗口中扫码添加好友。感谢您的支持!

【声明】内容源于网络
0
0
程序猿读历史
这是一位数据库从业者以及历史爱好者的个人公众号。
内容 87
粉丝 0
程序猿读历史 这是一位数据库从业者以及历史爱好者的个人公众号。
总阅读121
粉丝0
内容87