开发者朋友们大家好:
1、端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB
Zyphra 于 8 月 27 日发布博文,宣布推出 Zamba2-mini 1.2B 模型,共有 12 亿参数,声称是端侧 SOTA 小语言模型。该模型在 4bit 量化下内存占用低于 700MB,性能与谷歌 Gemma-2B、Huggingface 的 SmolLM-1.7B、苹果的 OpenELM-1.1B 和微软的 Phi-1.5 等更大模型相媲美。
2、智谱清言 App 国内率先面向 C 端开放视频通话服务
在 KDD 国际数据挖掘与知识发现大会上,智谱正式发布了新一代基座大模型 GLM-4-Plus。与 GLM-4-Plus 同步上线的,还有国内首个面向 C 端开放的「视频通话」功能,这是国内首个面向 C 端用户开放的视频通话服务。
3、谷歌最新 GameNGen:扩散模型做游戏引擎,单 TPU 20 FPS 模拟毁灭战士
4、贾佳亚团队新图像视频生成控制 ControlNeXt
贾佳亚团队开发了一款名为 ControlNeXt 的图像和视频生成控制工具,该工具在生成速度、精准控制和用户友好性上有显著提升。ControlNeXt 兼容多款 Stable Diffusion 图像和视频生成模型,如 SD1.5、SDXL、SD3 和 SVD,实现了即插即用,且 GitHub 上已获得 1.1k 星标。ControlNeXt 支持多种条件控制,包括 Canny 边缘、掩模、景深、姿势等,能够生成高质量的图像和视频,且支持超分辨率和人体姿势动作的精准控制。
5、阿里通义千问推出 Qwen2-VL:开源 2B / 7B 模型,处理任意分辨率图像无需分割成块
通义千问团队于今日对 Qwen-VL(视觉语言、Vision Language)模型进行更新,推出 Qwen2-VL。
6、HuggingFace 开源低成本 AI 机器人解决方案 LeRobot
1、a16z:下一代皮克斯,AI 将如何融合电影和游戏?
未来世纪的皮克斯不会通过传统的电影或动画产生,而是通过交互视频。这种新的叙事形式将模糊电子游戏和电视 / 电影之间的界限,将深刻的叙事与观众的参与性和 「玩」 性结合起来,开辟出一个庞大的新市场。随着消费者对互动媒体的偏好增加,以生成式 AI 的发展,游戏已经成为现代叙事的前沿。
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

