分享
月之暗面:一年前已验证长思维链,因成本问题先开展长文本处理
2025-02-17 11:53 星期一
月之暗面研究员Flood Sung近日分享了k1.5模型背后的完整思考过程,并透露2024年9月12日OpenAI o1发布带来的震撼效果让他反思Long-CoT的有效性。早在一年多前,月之暗面Kimi联合创始人Tim周昕宇就验证过使用小模型进行细粒度运算并合成成长CoT数据进行SFT可以获得很好的效果。Flood Sung表示,公司意识到了长上下文的重要性,但并未充分重视Long-CoT,主要原因还是成本问题。(新浪科技)
新闻推荐
查看更多
大数新闻社群
7x24h跨境新闻推送
加入卖家交流群


