开发者朋友们大家好:
1、OpenAI 再发 Sora 新短片,传 Sora 两周内推出

近日,伦敦艺术家 Jon Uriarte 与 OpenAI 联合创作了一支短片。Jon Uriarte 表示,Sora 的最强之处在于,能够找到「精确视觉」与意外惊喜之间的平衡。
2、CogSound:为无声视频增加动人音效
CogSound 是智谱最新推出一款基于人工智能技术的音效生成模型,能够根据视频内容自动生成与画面匹配的音效,为无声视频添加逼真的音频体验。
CogSound 的生成能力涵盖了多种复杂音效,例如爆炸声、水流声以及交通工具的声音等,并通过先进的技术确保音视频的高度同步。
之所以能达到这种效果,是因为 CogSound 采用了一种叫做「分块时序对齐交叉注意力」的技术,简单来说就是把视频和音频分成一小块一小块,然后让它们互相「认识」一下,确保每个音效都能找到对应的画面,每个画面也都能找到对应的音效。这样一来,视频看起来就更加自然流畅,就像原声配音一样。
它还采用了「基于 Unet 的潜空间扩散」和「旋转位置编码」等技术,这些技术名字听起来很复杂,但其实原理很简单,就是为了让 CogSound 生成的声音更加逼真、更加连贯,避免出现「断断续续」或者「错位」的情况。
CogSound 将与智谱新推出的视频生成模型 CogVideoX v1.5 一起,成为 「新清影」,提供更多特色的视频生成服务。(@AIbase 基地)
3、OpenAI 安全系统团队负责人宣布离职

近期,OpenAI 安全系统团队负责人翁荔 (Lilian Weng) 在 X 平台宣布,她将于 11 月 15 日离职,结束在 OpenAI 长达七年的职业生涯。
4、古尔曼:Vision Pro 的第一个杀手级应用程序已经到来
5、空间智能版 ImageNet 来了!李飞飞吴佳俊团队出品
6、媒体爆料:发现新一代大模型「没有那么大飞跃」,OpenAI 已经改变策略
1、英伟达 CEO 黄仁勋:AI 员工即将成为职场新常态
写在最后:

