
-
北大团队提出 BoT:让 Llama3-8B 超越 Llama3-70B -
Mamba-2:速度提高 2-8 倍,与 Transformers 媲美 -
苹果团队推出文生图新方法 Kaleido Diffusion -
Audio Mamba:用于音频表征学习的双向状态空间模型 -
Block transformer:通过全局到局部语言建模,实现快速推理 -
谷歌团队推出项目语言模型 ILM,用于对话式推荐 -
Cohere 提出自改进鲁棒偏好优化 SRPO -
斯坦福团队提出 DITTO:将语言模型与演示反馈对齐 -
MMLU-Pro:更鲁棒、更具挑战性的多任务语言理解基准测试 -
复旦团队推出 AgentGym:让智能体在多样化环境中进化
想要第一时间获取每日最新大模型热门论文? 扫描下方二维码,加入「大模型技术分享群」。 或点击“阅读原文”,获取「2024 必读大模型论文」合集(包括日报、周报、月报,持续更新中~)。

