据第三方平台Similarweb分析显示,在领先的GenAI工具中,Meta AI的月环比增长率遥遥领先。
同样在今天,Meta还推出全语言自动语音识别(ASR),这是一套开源模型和数据集,可为超过1600种语言提供ASR功能,其中包括500种此前任何ASR系统都未曾服务的低覆盖率语言。
Alexandr Wang称,这是迈向真正通用人工智能的一大步。
此前,他还带领团队推出Vibes——Meta AI应用中新增的AI视频推送功能,Vibes旨在让用户更轻松地寻找创意灵感,并体验Meta AI的流媒体工具,构成Meta AI应用的核心。
使用Vibes,用户可以从零开始创作,也可以使用现有内容或者重新混音视频,打造属于自己的作品,并与朋友和粉丝及时分享,数据显示,得益于Vibes的推出,Meta AI下载量在2025年10月显著增长,日下载量达到30万次,与去年同期相比增长了约75倍。
Meta最新推出的全语言自动语音识别工具名为Omnilingual ASR,官方称以空前的规模实现了最先进的质量。
自动语音识别(ASR)系统旨在通过将语音转录成可搜索、分析和共享的文本,使口语能够被普遍获取。
目前,大多数自动语音识别系统专注于少数几种在互联网上广泛存在的高资源语言,通常依赖大量的标注数据和人工生成的元数据才能达到良好的性能,这意味着,对于使用较少见或资源匮乏语言的用户而言,高质量的转录文本往往难以获取,从而加剧了数字鸿沟。
Omnilingual ASR可为超过1600种语言提供自动语音识别,其中包括500种此前从未被AI转录过的低资源语言,有趣的是,这项新成果由Meta的基础人工智能研究(FAIR)团队基于之前的多年成果构建。
此外,该团队还开源了Omnilingual wav2vec 2.0,这是一个全新的自监督式大规模多语言语音表示模型,参数量高达70亿,可用于其他下游语音相关任务。同时还发布了Omnilingual ASR语料库,这是一个独特的语音转录数据集,包含350种服务不足语言的转录语音,由Meta与全球合作伙伴共同整理而成。
这个7B-LLM-ASR系统在1600多种语言中均达到了最先进的性能,其中78%的语言字符错误率(CER)低于10%。
作为FAIR团队十多年的AI技术理论领袖,Yann LeCun的社交账号尚未官宣回应要离职的消息。
不过有不少网友为他不平:“作为一个世界级的顶尖AI科学家最终不得不向一个比他年轻得多的孩子汇报工作——他的自尊心怎么可能不受伤呢?如果我是他,我也会离开Meta。”
也有人吐槽扎克伯格的做法太不厚道,为了逼走Yann LeCun用上了职场惯用伎俩:把他安排到一个他根本看不上甚至憎恨的人手下。
Meta最近宣称要在2028年前投入6000亿美元的计算资源开发AI,但不少分析认为该公司经过这么一轮人才流失,积累多年的AI研发实力已经不复存在。
很多网友不认为一个靠廉价数据、标签大军和炒作建立起商业帝国的人(暗指Alexandr Wang)能像Yann LeCun那样有所作为,如果Meta不能将基础研究的严谨性、远大的愿景和强大的工程实力结合起来,最终只会剑走偏锋白白浪费计算资源。
-END-
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信。
【AI超级增长启航营】入群好礼:了解更多启航营资讯,交流最新科技动态和产业趋势,定期互动讨论和知识分享,与启航营导师互动交流,领取100份AI科技商业研报合集,加群共同探讨与成长,开启AI领域的超级增长之旅!

