
2025 年 3 月 14 日,OpenAI 为 ChatGPT 带来了一次具有里程碑意义的更新 —— 基于 Python 的数据分析功能正式向 o1 和 o3-mini 模型开放。这一升级不仅意味着用户可以通过自然语言指令完成复杂的数据处理任务,更标志着 AI 助手正从简单问答向专业级工具跨越。量子位团队通过多维度实测发现,o1 在调用 Python 后展现出惊人的数据分析能力,而竞品 Claude 与 4o 的表现则各有千秋。

在核心数据分析测试中,团队提供了某航班近一年的 400 余条飞行记录,包含四大核心问题:航线统计、高频航班识别、起飞时段分析(UTC 转北京时间)以及延误统计。o1 的表现堪称惊艳:通过 Python 脚本,它不仅准确完成了航线频次统计,还在高频航班分析中实现了数据分组与二次计算。针对起飞时段问题,o1 自动提取 UTC 时间并转换为北京时间,最终锁定上午 10 点至下午 2 点为高峰时段。最复杂的延误计算中,模型成功解析混杂文本中的时间数据,得出延误 32 次、平均延误 45 分钟、最长延误 2 小时的结论。相比之下,4o 虽然答对问题,但输出格式较为粗糙;Claude 则因文件名含中文一度 “罢工”,重试后竟编造数据,直到文件名调整后才恢复正常,暴露了其在非结构化数据处理中的脆弱性。

可视化测试环节,团队提供了某航班 1700 个时间点的飞行数据,要求绘制高度(英尺→米)、速度(节→公里 / 小时)随时间(UTC→北京时间)变化的折线图。o1 与 4o 均调用 Python 完成任务:4o 的图表标记清晰,数据趋势一目了然;o1 则采用混色绘制,虽线图形状与原始数据一致,但颜色区分度不足。Claude 的表现最为 “惊艳”—— 它生成了交互式网页,支持鼠标悬停查看原始数据,但致命失误在于时区转换错误,且未按要求用虚线连接间隔较长的数据点。

除模型升级外,OpenAI 同步宣布 Mac 客户端专属的Work with Apps 功能向所有用户开放。该功能允许直接从文本编辑器、IDE 等工具读取代码及数据,避免了繁琐的复制粘贴流程,尤其适合编程与数据分析场景。这一举措进一步强化了 ChatGPT 作为 “AI 开发助手” 的定位。

o1 与 o3-mini 对 Python 的支持,不仅是技术迭代,更是 AI 与专业工具融合的里程碑。从单纯的 “问答助理” 到数据分析 Copilot,ChatGPT 正逐步渗透到科研、金融、交通等领域的核心环节。尽管可视化细节与跨平台兼容性仍有提升空间,但此次更新无疑为 AI 辅助决策打开了新的想象空间。未来,随着模型推理能力与工具生态的持续完善,AI 或将成为人类处理复杂数据的 “第二大脑”。

END





