大模型正在重塑大数据分析的方式:一方面,它让业务用户能够通过“对话式分析”快速获取洞察,降低使用门槛;另一方面,也帮助分析师节省时间,让结果更“说人话”;同时还能辅助开发,减少低质量查询带来的成本浪费。
2025 年开源之夏,StarRocks 社区带来了一个聚焦 “LLM + SQL” 场景的实战项目:你将有机会亲手为 StarRocks 构建内置函数支持,让用户通过简单的 SQL 语句,即可与主流 LLM 服务进行对话,解锁情感分析、文本摘要、数据分类等丰富能力。
项目详情
项目名称:为 StarRocks 添加 llm() 用户自定义函数以实现 LLM 交互
项目简述:
本项目旨在为 StarRocks 数据仓库系统新增一个内置用户自定义函数(UDF)llm(),使用户能够直接在 SQL 查询中调用大型语言模型(LLM),执行情感分析、文本摘要、数据分类、实体抽取等任务,从而显著简化 AI 驱动的数据处理流程。
该函数支持通过 SQL 与 OpenAI、Azure OpenAI 以及 Ollama 等兼容服务进行交互,并通过灵活的配置参数允许用户自定义 LLM 交互的各个方面。函数签名为:llm(prompt: string, config: json_string) -> string,其中 prompt 可为静态字符串或基于表列动态生成,config 用于定义调用细节,返回值为 LLM 的响应内容。
这一功能将显著降低数据出库和二次处理的复杂度,让用户能够在数据存储位置直接利用大模型能力,提升整体数据处理效率和智能化水平。
未来,项目还计划扩展对嵌入式推理引擎(如 llama.cpp)以及文本嵌入生成等能力的支持,进一步拓展 StarRocks 在 AI 场景下的应用边界。
项目产出要求:
功能完整的 LLM UDF 实现与测试
使用文档 + 示例教程 + 故障排查
符合 StarRocks 质量标准的开源贡献
项目技术要求:
熟悉 C++ 和数据库开发
理解 RESTful API、JSON、HTTP 通信
熟悉 LLM API(如 OpenAI API)的基本概念
能够编写清晰、可维护的代码和全面的测试
良好的问题解决能力和调试技能
项目难度:基础
项目奖金:税前 8000 RMB
导师:常冰琳
如何报名?
报名时间:05/09 - 06/09
报名方式:点击官网右上角【学生登录】按钮,注册并提交个人资料,资料通过组委会审核后可进行项目申请。
StarRocks 项目申请入口:https://summer-ospp.ac.cn/org/orgdetail/fbddcc44-29d8-407b-abc4-13dcaf02d662?lang=zh
提交材料:包含技术方案、开发计划及个人简历(需注明技术栈与项目经验)。
如你对 StarRocks 的开源之夏项目感兴趣,或在报名、申请书撰写过程中有任何疑问,欢迎通过邮件联系项目导师(changbinglin@starrocks.com),或添加小助手微信与我们沟通,我们将第一时间为你提供帮助。
行业优秀实践案例
泛金融:中国民生银行|平安银行|中信银行|四川银行|南京银行|宁波银行|中原银行|中信建投|苏商银行|微众银行|杭银消费金融|马上消费金融|中信建投|申万宏源|西南证券|中泰证券|国泰君安证券|广发证券|国投证券|中欧财富|创金合信基金|泰康资产|人保财险
互联网:微信|小红书|滴滴|B站|携程|同程旅行|芒果TV|得物|贝壳|汽车之家|腾讯大数据|腾讯音乐|饿了么|七猫|金山办公|Pinterest|欢聚集团|美团餐饮|58同城|网易邮箱|360|腾讯游戏|波克城市|37手游|游族网络|喜马拉雅|Shopee|Demandbase|爱奇艺|阿里集团|Naver|首汽约车
新经济:蔚来汽车|理想汽车|吉利汽车|顺丰|京东物流|跨越速运|沃尔玛|屈臣氏|麦当劳|大润发|华润集团|TCL |万物新生|百草味|多点 DMALL|酷开科技|vivo|聚水潭|泸州老窖|中免集团|蓝月亮|立白|美的|伊利|公牛|碧桂园

