大数跨境
0
0

GPT-4o增强的数据分析能力体验——使用ChatGPT进行数据查询和分析支持

GPT-4o增强的数据分析能力体验——使用ChatGPT进行数据查询和分析支持 AI产品经理研习与实践
2024-06-18
1
导读:用ChatGPT来做数据查询、数据分析,靠谱吗?
欢迎来到AI产品经理从0到1研习之旅。
大约在1个月前,OpenAI表示ChatGPT中的数据分析(早期的code interpreter)得到了改进:
惭愧,官方发布都1个月了,而我总是跟不上“热点”,不能在第一时间更新、分享。。。
如果关注我的时长足够的话,应该知道我对于AI+数据分析这个方向是特别感兴趣的,参见历史文章:
对于这样的功能更新,我当然是非常喜欢的。但因近期本职工作比较忙,即便是下班后也鲜有足够的时间像之前那样比较深入、长时间地进行AI技术和产品的研习。
碰巧昨天有同道中人问我:

这里就简单给大家同步下功能特性,并分享当时结合实际问题进行探索尝试的流水账~

01
更新要点
OpenAI在ChatGPT的该版本改进中引入了一系列数据分析功能增强,这些改进旨在简化数据操作,提升分析能力。从官方介绍、实际体验来看,目前除了不能直接连接数据库,其余的功能从表现形态上而言,和我所关注的chatBI产品是有一定的重叠的。

让我们对这些功能稍作展开>>>

 支持直接从云存储导入文件

在直接上传文件的基础上,用户也可以直接从Google Drive和Microsoft OneDrive导入最新的文件版本,无需先下载到本地。这意味着ChatGPT可以更快地访问和理解Google Sheets、Docs、Slides以及Microsoft Excel、Word、PowerPoint文件。

 支持与数据开展多轮“对话”式的交互

在与数据表互动时,ChatGPT现在能够创建可扩展的交互式视图。用户可以点击特定区域提出后续问题,或者选择系统建议的提示来深入分析。

 支持动态分析和更新数据

ChatGPT能够通过自然语言来运行Python代码,从而完成诸如合并和清洗大型数据集、创建图表以及挖掘洞见等任务。这使得即便是数据分析的新手也能进行深入的分析,同时专家也能节省在日常数据处理上的时间。

 支持自定义修改图表样式

图表也变得更加互动,用户可以定制颜色、样式,并将图表下载用于演示或文档中。

另外,OpenAI承诺:确保不使用ChatGPT Team和Enterprise客户的数据进行模型训练,ChatGPT Plus用户也可以通过数据控制选项选择退出数据训练(我选择了退出)。这让用户在敏感数据处理方面更加安心,有助于加速应用的推广。

02
流水账记录partA
在体验上面提到的功能特性之前,我需要先有可以用来分析的数据。
为此,我得首先让ChatGPT干第一个活:
我给它提供相关数据库表的说明,以及我的期望,让它按需提供目标查询SQL。
这不是我第一次让GPT干这种活了。就这方面而言,它比我强多了!毕竟作为一名产品经理,我只懂得非常简单的sql语法。
接下来我会通过不完整的截图来展示“流水账”:

 提供数据表信息

在一开始,我提供了错误的表信息:
然后我又继续提供了新的、正确的表信息:
理解这些数据表和相互之间的关联,对它而言毫无难度:

 开始提出我的目标查询期望

这个查询本身还是有点复杂的,所以我尝试进行相对“充分”的描述:
然后让GPT开始它的表演:
在尝试运行查询之前,我看了下GPT输出的代码,发现有些小问题,于是让它进行调整:

 再次调整我的目标查询期望以澄清需求

我重新澄清了需求:

它也开始了新的表演:
可是我尝试执行该语句,将近6000秒过去了,还没有查询出结果——这次尝试宣告失败!
调整思路:
目测有点难办。这时候只能靠自己了,真人工 · 智能,给它新的思路:
再让它第3次表演:
这次看着有点靠谱了~继续
这个查询会创建一个名为 monthly_payment_summary 的表,直接汇总了按领域、门店和年月的收款数据统计,包括以下字段:
年份(year) 月份(month) 领域ID(field_id) 门店名称(shop_name) 总收款人数(total_receiver_count) 总收款人次(total_receiver_times) 总收款总金额(total_receiver_amount) 会员收款人数(member_receiver_count) 会员收款人次(member_receiver_times) 会员收款总金额(member_receiver_amount) 非会员收款人数(non_member_receiver_count) 非会员收款人次(non_member_receiver_times) 非会员收款总金额(non_member_receiver_amount)
通过这个汇总表,可以减少数据量,便于后续的查询和导出。
后续我又继续提供了更多的表说明和查询需求,沿着这个思路继续推进,就不继续罗列了。
到这里的时候,查询已经是OK的经过这一系列的折腾,我所需要获取的数据已经能够查询到了。

03
流水账记录partB

接下来进行具体的交互式数据分析对话,直接把查询结果导出生成的Excel稍作整理,上传给它。

 让AI自助探索

看起来像模像样的,而且很有“数据分析师”的套路!
不过接下来可视化图表呈现就有点问题了,例如下图:
(1)坐标轴标题彼时还不支持中文字符
(2)订单的年度分布比例数值明显不对,因为加起来不到100%
对应的解读也明显跟图表对不上号:
难不成是我的原始数据太复杂了?没道理呀
当然,它还在继续分析:
下图这样明显也是不对的了,毕竟
(1)总金额的分布,怎么会在柱状图中用%来表达呢
(2)再看左边的坐标轴这数值,我都不用核对数据也知道不正确
不过它还在继续“努力”进行数据的探索、分析:

到这里开始“幻觉”非常明显了,门店D、门店C、门店B……在数据里没有这样的门店名称!!!

AI·自助探索尝试,宣告失败

 人工引导+智能分析

那就还是让我来吧!
一些图表对话、交互、自定义样式的功能,还是能够成功体验到的。对应的图或视频我就不放了,跟官方视频演示的效果是一致的(再来一遍):
接下来……它就不能继续满足我的需求了:
ChatGPT,你闹呢?!
至此,人工引导的分析也算是失败了。
后来我还是自己在Excel中进行加工和分析了……

04
小结

仅从我个人体验而言,彼时的GPT-4o数据分析能力虽然得到了增强,但是可能还是更适合用于辅助编写数据查询SQL,而不是类似于我心目中chatBI那样的数据分析

但是即便如此,我也不会丧失信心,否定AI大模型在数据分析/商业智能方面的未来应用前景。

如果OpenAI轻而易举地地就取得了理想效果,那么市面上的BI厂商岂不绞杀了。我今年陆续了解了一些BI/数据厂商的最新产品演示效果而言还是相当不错的,比上面PartB的体验要好得多。比如>>>

如果是相对简单的数据分析、并且表头标题行用英文命名,直接使用GPT来做交互式、可视化分析应该也能取得助益。这就有待我/诸位继续验证了。

我依然满怀期待有更多、更好的AI大模型+数据分析产品出现,让从产品经理到高级决策者,每一个使用者都能够从中受益,享受到更高效、更智能的数据处理体验。

这一篇就先到这儿吧,我要看书还“书债”去了~



以上,就是关于用ChatGPT进行数据查询、数据分析的应用研习分享。
本期到此结束。
再见


PS:忘了说,我是基于自定义的GPTs进行的体验

如果你觉得我的分享还不错或者对你有帮助,不妨来个一键N连:点赞+在看+分享+关注。
也欢迎你在留言区与我互动。

参考资料:
  • https://openai.com/index/improvements-to-data-analysis-in-chatgpt/

【声明】内容源于网络
0
0
AI产品经理研习与实践
现软件产品经理、前管理咨询顾问。坚信人工智能(AI)将会深刻影响我们未来的工作、学习、生活,因此我正在积极拥抱变化、研究和学习人工智能产品经理相关的知识和技能。
内容 53
粉丝 0
AI产品经理研习与实践 现软件产品经理、前管理咨询顾问。坚信人工智能(AI)将会深刻影响我们未来的工作、学习、生活,因此我正在积极拥抱变化、研究和学习人工智能产品经理相关的知识和技能。
总阅读9
粉丝0
内容53