
近日,由亚马逊云科技联合耀途资本共同举办的【生成式 AI 与基础设施】讨论会在北京举办。现场,来自 AI Infra 和生成式 AI 领域的 20 余位资深从业者与现场观众一起深入探讨了分布式数据处理、分布式训练和推理、Agent、Text to SQL 和向量数据库等多个硬核话题。数巅科技首席数据科学家张国贤博士也到场参会,并与同场嘉宾和现场观众分享了Text to SQL 当下面临的应用难点及解决思路。

图1:【生成式 AI 与基础设施】讨论会活动现场
张国贤说到:“Text to SQL 在当下的应用依然面临着许多挑战,我们可能常常听到别人说,查询出来的数据用不了,这说明 Text to SQL 在当下实际业务环境中,无论从准确度还是易用性上,依然存在许多应用难点。”

首先,Text to SQL 存在着准确度不够的问题。比如大模型在对应自然语言的时间区间、指标定义等任务指令时存在较大误差,这大大增加了用户使用数据的难度。
其次,Text to SQL 还存在着时效性问题。许多用户当下就有数据使用需求,但要走完一个完整的数据调取流程可能需要 3 天甚至 1 周的时间,时效性差的问题严重降低了数据的使用价值。
最后是洞察力问题。许多用户拿到调取出的数据后,需要靠人力对这些数据加以再分析,以寻求能在这些数据上找到真正可用的业务洞察,这意味着原始调取的数据能给到用户的帮助和启迪还是非常浅显和表面的。
随着数据智能时代的开启、AI 产业的迅速发展,行业必然要正视和解决现有的应用问题。关于 Text to SQL 当下的应用难点,张国贤也分享了自己的解决思路:“我们应该统一企业复杂的异构数据源,形成全局血缘的数据资产,从而提升数据查询效率和准确性,主动为用户提供更多的数据洞察。我们希望能让更多有业务需求的非技术人员通过直接使用大模型的能力来完成数据分析,让业务人员可以更全面地查询数据、更直接地使用数据,从而做出更高效更精准的决策和战略。”
在现场交流中,张国贤也提到数巅的数据智能分析应用 AskBI 可以通过需求交流、数据生成和指标平台连接等方式,将业务与大模型技术有机结合,实现更高效、精确和快速的数据分析和洞察。这种技术能力的应用,不仅可以解放数据分析师和数据工程师的工作负担,还可以极大地提升企业业务能力和竞争力。
AI Infra 的发展,将带来越来越高效的大模型底层技术能力,数巅的增强大模型通过问题拆解的方式来解决数据分析中准确度低的难题,将复杂的端到端问题拆解为多个子问题分段处理,以实现更高效精确的数据分析。作为 AI Infra 领域的技术公司之一,数巅会持续探索大模型技术与数据智能的应用创新,实现企业内部数据的协同和充分利用。

点击蓝字 关注我们

