罗福莉硕士毕业后先进入阿里达摩院做AI研究,从事预训练语言模型相关工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

小米招聘官方页面搜索发现,仅北京地区大模型相关职位就多达59个。除招聘人才外,小米近期也正在搭建图形处理单元(GPU)万卡集群,规模较其大模型团队成立时的约6500张GPU大幅增加。这一计划已施行数月,由集团董事长雷军亲自领导。

综合证券时报和21世纪经济报道,雷军以千万年薪招揽中国初创企业DeepSeek核心研究员罗福莉,期待由她领导小米AI大模型团队。

中国智能手机和其他消费电子产品制造商小米集团创始人雷军,重金聘用95后人工智能(AI)天才女子罗福莉领导小米AI大模型团队。

总部位于杭州的DeepSeek12月26日在微信公众号称,DeepSeek-V3在多项评测成绩中超越了Meta开发的Llama-3.1,并在性能上与OpenAI开发的闭源模型GPT-4o不分伯仲。有报道指,DeepSeek-V3的训练成本仅558万美元(757万新元),训练时长仅两个月,远低于GPT-4o逾1亿美元的成本及约三个月的训练时长。

今年11月,小米成立了AI平台部,由北京清华大学计算机系毕业的集团元老级技术专才张铎担任负责人。

小米去年4月小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,以开放的态度与合作伙伴开拓更多机会。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,罗福莉还在北大读硕士时,在AI领域顶级国际会议上发表八篇论文,其中两篇是第一作者,登上了知乎热搜。

延伸阅读