作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
面对海量数据,传统数据分析方法往往陷入“高成本、低效率、难解释”的困境。而大模型的出现,如同一场“智能革命”,正在重塑数据分析的边界——从简单的统计描述,到复杂的因果推理;从被动响应需求,到主动预测趋势。
沙丘智库长期跟踪调研大模型技术的发展,旨在帮助企业快速了解大模型最新、最全面的落地情况。随着大语言模型与数据分析场景的深度融合创新,当前,沙丘智库观察到两个值得关注的趋势:
第一,对话式数据查询是实现智能数据分析的必经之路。
通过自然语言获取数据洞察的能力不是大模型带来的,早在10年前就已经开始有国外的BI平台引入自然语言查询、自动洞察生成、自然语言生成等功能,ThoughtSpot是这一领域的明星产品。但由于技术的不成熟,相关产品和功能一直未得以普及。
大模型的自然语言理解和代码生成能力使得自然语言取数的可实现性大大提高。
当前,业界探索对话式数据查询的主流技术路线可分为三种:
第一种是NL2SQL,利用大模型将自然语言问题转换为数据库可读的SQL,但完全依赖大模型的能力难以对齐业务语义和数据语义,导致准确率、性能、成本等多方面的技术挑战;
第二种是NL2DSL2SQL,通常是利用已有BI平台中的数据集和报表,大模型先生成BI查询DSL,再转换成SQL查询;
第三种是NL2Semantic Layer(本质也是NL2DSL的一种),利用优秀的语义层将语义对齐的复杂度从大模型中释放出来,提高数据查询的准确率和时效性。
第二,数据分析Agent是实现从数据到洞察的高级形态。
通过将AI Agent应用于数据分析过程中,可以进一步提升数据分析的自动化和智能化水平。
在《2025年AI Agent应用最佳实践报告》中,沙丘智库认为:
数据分析Agent是将AI Agent应用于从数据到洞察的工作流程中,半自主或自主地编排任务,帮助用户更有效地从数据中提取有价值的信息和见解。在数据分析过程中引入AI Agent,对多步骤任务进行精细化控制,可以缩小数据与洞察之间的差距,也是 “大模型+数据分析”实现深度价值的基础。
在数据分析Agent中,用户输入与需要执行的任务、目标或问题有关,辅助基于洞察力的决策制定。AI Agent可以执行数据准备、分析、可视化、解释和函数调用等任务,并接收来自用户和其他Agent的进一步输入和反馈。
大模型与数据分析的融合,正在打开一扇通向“认知智能”的大门。这场变革不仅是技术的跃迁,更是人类理解世界方式的进化。面对这一快速变化的新兴市场,无论是企业决策者、投资者还是行业从业者,都迫切需要通过系统性的技术研究更好地理解技术发展趋势、市场竞争格局、把握发展机遇。
在此背景下,沙丘智库启动“大模型+数据分析”研究系列报告:
· 《“大模型+数据分析”系列研究:语义层建设指南》:语义层可以大幅提升自然语言问数的准确率,是企业实现智能数据分析的基础。本报告将深入研究语义层的技术实现路径,为企业级语义层建设提供参考指南。
· 《2025年“大模型+数据分析”最佳实践报告》:本报告将深入研究大模型在数据分析领域的技术应用情况,帮助企业了解这一新兴市场;同时,提供“大模型+数据分析”在企业内部的实践案例,为企业“大模型+数据分析”应用提供参考。
· 《2025年中国“大模型+数据分析”主流厂商市场指南》:本报告将发布“大模型+数据分析”主流厂商全景图,分析细分市场定义及市场发展趋势等。
如需了解更多详情,可添加客服微信:zimu738
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738

