大数跨境
分享
深度求索发布新数据采集专利,提升大语言模型训练效率
2025-04-02 11:04 星期三
杭州深度求索人工智能基础技术研究有限公司的一项名为“一种广度数据采集的方法及其系统”的专利已在4月1日由国家知识产权局正式公布。该技术专注于优化网页数据采集流程,通过智能化筛选和内容分析减少无效下载,提升数据质量和节约网络资源。专利提到其系统设计可保证稳定性和避免对目标网站的影响。由于高质量数据对于大语言模型训练至关重要,这一技术可能为AI领域带来更高效的解决方案。
新闻推荐 查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群