大数跨境
分享
Meta发布支持1600种语言的开源语音识别系统
2025-11-12 09:34 星期三
Meta的AI研究团队推出了一款新的语音识别系统,能将1600多种语言的语音转换为文字,其中500种语言是首次被AI支持。测试表明,该系统在78%的语言中表现良好,字符错误率低于10%;对于训练数据超过10小时的语言,准确率可达95%。新系统具备“快速学习新语言”的能力,用户只需提供少量语音和文本样本,就能添加新语言,最多可扩展至5400种语言。团队还发布了一个涵盖350种语言的转录数据集,并开源了多个不同规模的模型,方便开发者构建定制化的语音识别工具。这一突破有望显著提升多语言沟通效率,推动语音技术在全球范围的应用。
新闻推荐 查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群