大数跨境

从“大海捞针”到“一语中的”,TeleSearch视频检索“秒级”定位

从“大海捞针”到“一语中的”,TeleSearch视频检索“秒级”定位 中国电信天翼AI
2026-05-26
0

星辰通用人工智能实验室




星辰通用人工智能实验室(Xingchen AGI Lab)是中国电信星辰基础大模型的研发单位,将“基于国产芯片训练国际一流模型”作为自己的使命目标,开展战略性、引领性、系统性的通用人工智能全栈技术研发,推动国产生态成为通用人工智能原始创新和规模应用的重要力量。实验室于2026年3月在北京成立,历经前身近五年建设,团队成员超230人,平均年龄31岁,技术方向牵头人及骨干均毕业于清华、中科院、斯坦福、哥伦比亚等国内外知名高校,核心基模研发团队90%来自阿里、腾讯、百度等互联网大厂。当前,实验室基于中国电信国产万卡集群,已完成视觉、语音、语义和多模态四大方向布局,模型参数覆盖十亿/百亿/千亿/万亿,在GitHub、huggingface等主流开源社区下载次数突破60万,入选2025年“央企十大国之重器”。














Science Technology


随着各行业视频数据量激增,从海量视频中筛查有效线索犹如大海捞针,传统人工研判模式长期存在效率偏低、精准度不足、场景适配性弱等痛点。


星辰通用人工智能实验室自主研发的TeleSearch,依托多模态检索技术,可根据自然语言精准检索图片或视频,实现跨模态复杂语义理解、亿级视频秒级精准检索,已落地应用城市治理、公共安全治理、应急安全预警等场景,相关技术先后斩获CVPR、ICCV、IJCAI等国际顶会竞赛冠军十余项,并已发表在AAAI、SIGIR等国际顶会。





“能匹配”到“匹配准”

全链路技术体系支




针对行业共性痛点,团队构建了以跨模态融合为基础、以细粒度精准识别为核心、以跨域兼容与时序定位为保障的全链路技术体系,能力深度协同、贴合实战需求。


依托以上的技术架构,TeleSearch实现了从基础匹配向精准匹配的升级,具备广覆盖、高精准、秒响应、易操作四大实用优势。依托开放式语义检索,可检索人员、车辆、物品、异常行为等各类目标;凭借图文特征深度对齐,精准辨识细节信息,从容应对复杂文字检索需求;通过高效运算调度实现检索结果秒级检索;搭配多元检索模式,操作简单易懂,切实降低一线使用门槛。


核心能力依托三大底层技术支撑:


去偏证据时序检索,全面提升检索效率


针对海量视频排查慢、关键画面难找、事件过程碎片化的问题,构建去偏时序证据链检索引擎。该引擎通过几何正则化修正传统模型的不确定性偏差,精准评估每帧画面与文本描述的匹配质量,过滤掉模糊、抖动、标注错误的无效信息,避免模型被干扰带偏;同时结合反射翻转融合模块解决模态失衡问题,再通过时序一致性校验严格按照时间顺序串联所有相关片段,构建完整的事件证据链。结合高效的参数优化技术,可在亿级视频库中实现秒级检索。


细粒度对齐与多粒度鲁棒,

强化精准识别能力


面向长文本描述准确率低、多人同框易混淆身份属性等痛点,采用全局+区域协同的识别框架:针对性解决短文本语义稀疏与长文本上下文建模的固有矛盾,同时优化不同长度描述的跨模态对齐效果,让模型既能准确理解简短关键词,也能读懂包含衣着、动作、携带物品的复杂长描述;再通过区域级特征提取技术,把文字里的每个细节和画面里的对应位置绑定。同时兼顾整体身份特征和局部细节特征的关联,在多人重叠、视角多变、部分遮挡的复杂场景下,清晰区分不同个体的细微差异,避免身份混淆。


分层注意力融合与内容风格双解耦,

增强跨域适配能力


针对复杂环境效果不稳、跨摄像头画面差异大、模型适配性不足等问题,通过分层注意力机制,平衡文字和画面的信息权重,大幅提升复杂场景下的识别稳定性;同时把画面里的“实际内容”和“拍摄效果”分开处理,再通过特征分布对齐技术,适配不同分辨率、不同场景条件下的视频数据。无需针对每个新场景重新大量训练,可在各类实际环境中稳定运行。






深耕场景,赋能百业:

让多模态检索成为行业智能化新引擎




在数据标注领域,传统人工模式长期面临“标注周期长、人力成本高、海量视图资产难以快速变现”的痛点。中国电信以TeleSearch多模态检索能力为基座,打造杭州萧山视谷数据自动标注一站式平台,通过CV预标注与大模型深度融合,构建了从视图接入、智能预标到自动质检的全流程自动化流水线。该平台将单批次标注任务由传统的“天级”压缩至“小时级”,人工复核量大幅降低,标注综合效率实现数倍跃升。目前,平台已汇聚城市视图超26万路,深度赋能工业制造、医疗健康、智慧交通等领域,并成功打造全国首个“前店后厂”视觉数据服务模式,核心成果入选国家数据局《数据标注优秀案例集》,成为AI数据要素高质量供给的行业示范。


针对视频监控业务中“定位难”的普遍痛点,一线人员往往需要耗费数小时逐帧回看录像才能找到关键画面。天翼智看深度集成TeleSearch细粒度智能检索能力,直击传统手动排查效率低下的难题。用户仅需一句自然语言描述,即可在回看视频中秒级精准锁定目标,将平均线索查找耗时从数小时锐减至数分钟,检索效率实现数十倍的提升。该应用已累计服务百万级用户,让海量监控数据从“沉默的存储成本”转为实时可用的业务资源,真正实现了“一语看视频、一语搜视频”的便捷体验。


截至目前,中国电信已完成2200万路视频点位的有效接入,日均调用量突破42亿次依托这一庞大的视联网资源底座,TeleSearch检索能力已在天翼智看、萧山视谷数据标注平台、东莞标注基地、扬州公安天元大模型、湖南应急等多个标杆项目中实现规模化落地,正以全栈自研的硬核AI能力,为千行百业的数字化、智能化升级注入强劲动能。








主要作者介绍








星辰通用人工智能实验室





    星辰大模型全尺寸开源地址:













星辰语义基础大模型TeleChat已开源1B、3B、7B、12B、35B、36B、39B(MoE)、52B、105B(MoE)、115B的不同参数模型的训练和推理代码,链接如下:
https://github.com/Tele-AI
https://huggingface.co/Tele-AI
https://modelscope.cn/organization/TeleAI
https://modelers.cn/user/TeleAI


推荐阅读

【声明】内容源于网络
0
0
中国电信天翼AI
中电信人工智能科技(北京)有限公司是中国电信旗下致力于打造开展人工智能业务的科技型、能力型、平台型专业公司,以成为领先的通用人工智能服务提供商为愿景,以发挥央企在AI领域的主力军作用,成为国家战略科技力量为使命,承担央企责任,强化科技攻关。
内容 131
粉丝 0
中国电信天翼AI 中电信人工智能科技(北京)有限公司是中国电信旗下致力于打造开展人工智能业务的科技型、能力型、平台型专业公司,以成为领先的通用人工智能服务提供商为愿景,以发挥央企在AI领域的主力军作用,成为国家战略科技力量为使命,承担央企责任,强化科技攻关。
总阅读392
粉丝0
内容131