
新闻快讯
2024年12月31日
星期二
背景
background
01
近日,国产大模型DeepSeek在全球范围内引起了广泛关注,并带火了一位95后的AI“天才少女”——罗福莉。据多家媒体报道,小米创始人雷军亲自出手,以千万元级别的年薪成功招募了这位DeepSeek开源大模型DeepSeek-V2的关键开发者之一,让她领导小米的AI大模型团队。
时事新闻
News
罗福莉的辉煌履历
罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。早在2019年,还在北大攻读硕士学位的她就在人工智能领域顶级国际会议ACL上发表了8篇论文(其中2篇为第一作者),迅速在学术界崭露头角。面对突如其来的关注,她在知乎上回应称这些成果是她近一年的努力所得,当然其中也不乏运气成分。
硕士毕业后,罗福莉的职业生涯同样耀眼。她先是在阿里达摩院从事人工智能研究,主导开发了多语言预训练模型VECO。之后,她转战幻方量化,从事深度学习相关策略建模和算法研究。再后来,她加入了DeepSeek,担任深度学习研究员,参与了MoE大模型DeepSeek-V2的研发工作。今年5月,在DeepSeek-V2发布以后,罗福莉在知乎撰文表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,并强调其性价比之王的地位。
小米全面发力AI大模型
罗福莉的加入,是小米全面发力AI大模型战略的一个重要举措。2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,与合作伙伴开拓更多机会。今年11月,小米成立了专门的AI平台部,由小米元老级技术大牛张铎负责,他曾被雷军公开称赞是“小米的大神”。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达到240亿元,2025年更是将攀升至300亿元。自2022年至2026年的五年内,小米的研发投入将超过1000亿元,主要聚焦于AI、操作系统、芯片三大底层技术的研发。
近期,小米正在搭建GPU万卡集群,规模远超其大模型团队成立时的约6500张GPU。这一计划由雷军亲自领导,并已实施数月。二级市场上,加码AI算力是小米近期上涨的主要驱动因素之一。小米汽车也宣布全年交付量已超过13万辆,提前完成全年目标。2024年12月27日,小米股价创下2022年以来新高,盘中触及34.95港元/股。
反思:启示
对于小米而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而罗福莉的加入,或许正是小米在AI领域迈出的重要一步。未来,随着小米在AI领域的持续投入和技术突破,我们有理由期待更多令人振奋的消息。
往期回顾
Journalist's Day
1.高端定制 | 探索未来:2024年日本国际精密仪器机械人展考察行程

