大数跨境
0
0

StarRocks 开源之夏项目亮相:打造内置 LLM 函数 llm()

StarRocks 开源之夏项目亮相:打造内置 LLM 函数 llm() StarRocks
2025-05-27
2

关于开源之夏

开源之夏是由中科院软件所“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。

关于 StarRocks 

StarRocks 是隶属于 Linux Foundation 的开源 Lakehouse 引擎 ,采用 Apache License v2.0 许可证。StarRocks 全球社区蓬勃发展,聚集数万活跃用户,GitHub 星标数已突破 10000,贡献者超过 450 人,并吸引数十家行业领先企业共建开源生态。

StarRocks 已被全球超过 500 家市值 70 亿元人民币以上的顶尖企业选择,包括中国民生银行、沃尔玛、携程、腾讯、美的、理想汽车、Pinterest、Shopee 等,覆盖金融、零售、在线旅游、游戏、制造等领域。

中文社区:https://www.mirrorship.cn/zh-CN/community

GitHub:https://github.com/StarRocks/starrocks


大模型正在重塑大数据分析的方式:一方面,它让业务用户能够通过“对话式分析”快速获取洞察,降低使用门槛;另一方面,也帮助分析师节省时间,让结果更“说人话”;同时还能辅助开发,减少低质量查询带来的成本浪费。


2025 年开源之夏,StarRocks 社区带来了一个聚焦 “LLM + SQL” 场景的实战项目:你将有机会亲手为 StarRocks 构建内置函数支持,让用户通过简单的 SQL 语句,即可与主流 LLM 服务进行对话,解锁情感分析、文本摘要、数据分类等丰富能力。

项目详情

项目名称:为 StarRocks 添加 llm() 用户自定义函数以实现 LLM 交互

项目简述:

本项目旨在为 StarRocks 数据仓库系统新增一个内置用户自定义函数(UDF)llm(),使用户能够直接在 SQL 查询中调用大型语言模型(LLM),执行情感分析、文本摘要、数据分类、实体抽取等任务,从而显著简化 AI 驱动的数据处理流程。

该函数支持通过 SQL 与 OpenAI、Azure OpenAI 以及 Ollama 等兼容服务进行交互,并通过灵活的配置参数允许用户自定义 LLM 交互的各个方面。函数签名为:llm(prompt: string, config: json_string) -> string,其中 prompt 可为静态字符串或基于表列动态生成,config 用于定义调用细节,返回值为 LLM 的响应内容。

这一功能将显著降低数据出库和二次处理的复杂度,让用户能够在数据存储位置直接利用大模型能力,提升整体数据处理效率和智能化水平。

未来,项目还计划扩展对嵌入式推理引擎(如 llama.cpp)以及文本嵌入生成等能力的支持,进一步拓展 StarRocks 在 AI 场景下的应用边界。

项目产出要求:

  • 功能完整的 LLM UDF 实现与测试

  • 使用文档 + 示例教程 + 故障排查

  • 符合 StarRocks 质量标准的开源贡献

项目技术要求:

  • 熟悉 C++ 和数据库开发

  • 理解 RESTful API、JSON、HTTP 通信

  • 熟悉 LLM API(如 OpenAI API)的基本概念

  • 能够编写清晰、可维护的代码和全面的测试

  • 良好的问题解决能力和调试技能

项目难度:基础

项目奖金:税前 8000 RMB

导师:常冰琳

如何报名?

报名时间:05/09 - 06/09

报名方式:点击官网右上角【学生登录】按钮,注册并提交个人资料,资料通过组委会审核后可进行项目申请。

StarRocks 项目申请入口:https://summer-ospp.ac.cn/org/orgdetail/fbddcc44-29d8-407b-abc4-13dcaf02d662?lang=zh

提交材料:包含技术方案、开发计划及个人简历(需注明技术栈与项目经验)。

如你对 StarRocks 的开源之夏项目感兴趣,或在报名、申请书撰写过程中有任何疑问,欢迎通过邮件联系项目导师(changbinglin@starrocks.com),或添加小助手微信与我们沟通,我们将第一时间为你提供帮助。

行业优秀实践案例



泛金融:中国民生银行平安银行中信银行四川银行南京银行宁波银行中原银行中信建投|苏商银行微众银行杭银消费金融马上消费金融中信建投申万宏源西南证券中泰证券国泰君安证券广发证券国投证券中欧财富创金合信基金泰康资产人保财险



互联网:微信|小红书|滴滴B站携程同程旅行芒果TV得物贝壳汽车之家腾讯大数据腾讯音乐饿了么七猫金山办公Pinterest欢聚集团美团餐饮58同城网易邮箱360腾讯游戏波克城市37手游游族网络|喜马拉雅|ShopeeDemandbase爱奇艺阿里集团Naver首汽约车



新经济:蔚来汽车|理想汽车|吉利汽车顺丰|京东物流|跨越速运沃尔玛屈臣氏麦当劳大润发|华润集团|TCL |万物新生百草味多点 DMALL酷开科技|vivo聚水潭泸州老窖中免集团蓝月亮立白美的伊利公牛碧桂园

【声明】内容源于网络
0
0
StarRocks
StarRocks 是 Linux 基金会旗下的开源项目,专注于打造高性能、可扩展的分析型数据库,助力企业构建高效统一的湖仓新范式。目前,StarRocks 已在全球多个行业广泛应用,帮助众多企业提升数据分析能力。
内容 91
粉丝 0
StarRocks StarRocks 是 Linux 基金会旗下的开源项目,专注于打造高性能、可扩展的分析型数据库,助力企业构建高效统一的湖仓新范式。目前,StarRocks 已在全球多个行业广泛应用,帮助众多企业提升数据分析能力。
总阅读13
粉丝0
内容91