作为行业领先的人工智能企业,捷通华声凭借多年在人工智能领域的深厚积累,全新升级灵云智声一体机,为用户带来更加卓越的智能办公体验。
此次升级,聚焦用户体验与功能深化,通过新增独立展板端功能、强化转写控制与精度、优化字幕显示并部署前沿大模型技术,为政府、企业及个人用户带来更加智能、高效、安全的会议与办公解决方案。
功能升级亮点
更智能、更灵活、更可控
本次升级,灵云智声在原有强大功能矩阵(会议速记、录音转写、会议分析、实时字幕、文本翻译、学习训练、记录管理等)基础上,实现创新升级:
独立展板端功能:专为大屏展示场景设计,实现字幕与投屏的灵活控制与管理。在会议过程中,展板端设备屏幕上可叠加展示字幕条或全屏字幕,并能根据实际需求随时调整字幕的位置,满足大型会议、发布会、演讲场景等远距离观看需求,确保会议展示更专业、更聚焦。同时,展板端支持设置会议服务器地址和保留账号,有效保障了会议内容的安全性和保密性。
区间内容精准转写:可自由选择转写录音的开始时间和结束时间,并只对该区间的音频进行转写识别。这一功能在处理较长的会议录音或访谈录音时非常实用,用户无需再花费时间处理整段录音,能够快速获取自己需要的内容,大幅提升了工作效率。
字幕随心定制:会议过程中,用户可以对转写和翻译结果的字体、字号、中间结果颜色、最终结果颜色、背景色、透明度、字幕位置等信息进行选择设置,呈现最佳视觉效果,满足不同场景的个性化需求。
展板设备智能管理:支持查看在线展板设备列表,并可一键开启或关闭指定设备上的字幕或投屏显示,操作简单直观,实现对会议展示效果的精准控制。
大模型深度赋能:深度集成会议分析大语言模型(支持灵活对接智谱、千问、DeepSeek等主流大模型),实现更精准的议题切割、章节概览、观点提取、议题摘要、待办任务、PPT内容提取等智能分析。
核心能力深化
性能领航、安全筑基、多端协同
01
性能指标行业领先
高效语音转写:支持实时会议速记与离线音视频转写,安静环境下普通话识别准确率高于98%,离线转写实时率小于0.1;
智能声纹识别:基于声纹识别技术,实现双角色分离、多角色自动区分(8人以内角色分离准确率大于80%,3秒内辨认出发言人身份);
精准机器翻译:提供实时双语字幕及文本翻译功能,对于通用领域的语言场景,机器翻译BLEU均值不低于32,助力跨语言交流;
大模型效能优化:基于单块4090显卡部署千问32B模型,1小时会议全分析仅需3分钟,会议分析效果满意度指标MOS值不低于4。
02
全链路数据安全
安全可靠:采用本地化计算模式,无需联网即可使用,搭配加密算法保存数据,信息更安全。同时支持音频水印技术,能有效防止信息泄露,可满足政府、金融等高敏感场景的需求;
隐私可控:配备专用物理按键,可实现一键关闭字幕、切换语种等操作,确保用户隐私得到有效控制;
技术自主:基于信创环境开发,拥有自主知识产权核心技术,支持软硬件全国产化环境,符合国家信息安全战略要求,为用户提供更加稳定、可靠的产品。
03
多模块协同
灵云秘书 (Windows/Linux 桌面端):提供会议管理、转写展示、分析结果、文件编辑等丰富交互;
语音笔记 (Word插件):办公助手,提供便捷的语音输入、双角色问答记录、音字对照编辑等;
展板端 (新增):专注展示,提供字幕叠加展示与全屏投屏功能;
灵云Web会议 (B/S架构):提供网页端实时会议、录音转写、声纹分角色、会议分析等功能。
多元场景覆盖
赋能千行百业高效办公
灵云智声一体机应用场景广泛,适用于多种会议及办公场景,无论是个人办公、单人演讲、审讯询问还是多人讨论会议,都能轻松应对。
课程培训:实时字幕叠加PPT/视频,丰富展示形式,提升培训效果。
直播/发布会:提供实时字幕及双语字幕,促进国际交流与品牌传播。
多人会议(政府/企业):分钟级搭建高效会议环境,声纹分角色记录,并基于大模型进行会议分析,形成结构清晰的会议纪要,自动识别会议主题、重点内容、待办事项等,智能抽取PPT,让会议更高效。
个人办公:音视频快速转文字,声纹分角色转写,录音整理效率倍增。
审讯/询问:精准记录,音字对照回听,确保笔录精准可溯。支持问答模式双角色记录,帮助办案人员快速生成笔录,提高办案效率。
移动办公/无网环境/安全场景:单机离线运行,支持语音输入、声纹分角色、录音转写、文本翻译、实时投屏等核心功能,本地加密存储保障数据安全。

