職位描述
該職位已進行加V認證,請放心投遞
負責nlp大模型生成內容的可控可信方向的研發(fā)和落地。
工作內容包括大模型基座的訓練,對比,基于公開數據集/業(yè)務數據集的微調, 生成知識的可控性,準確性方案研發(fā),以及大模型小型化相關技術來保證模型的落地應用。
職位要求
1. 計算機相關專業(yè)獲得碩士學位, 博士優(yōu)先, 發(fā)表過大模型相關研究ai頂會論文優(yōu)先;
2. 對nlp主流大模型如gpt3/chatgpt/t5/palm/llama/glm等的原理和差異有深入的理解;
3. 熟練掌握主流深度學習框架pytorch/tensorflow,大模型訓練框架megatron-lm/deepspeed等多機多卡方案,有百億/千億nlp大模型訓練調優(yōu)經驗優(yōu)先;
4. 熟悉常見的模型小型化技術,如量化/剪枝/蒸餾等,熟悉onnx/tensorrt;
5. 有良好的代碼開發(fā)能力,有開源項目開發(fā)經驗優(yōu)先。
工作地點
地址:北京朝陽區(qū)北京-朝陽區(qū)環(huán)球金融中心
??
點擊查看地圖
詳細位置,可以參考上方地址信息
以擔保或任何理由索取財物,扣押證照,均涉嫌違法,請?zhí)岣呔?
職位發(fā)布者
人力資源..HR
螞蟻科技集團股份有限公司



-
銀行
-
1000人以上
-
中外合資(合資·合作)
-
浙江省杭州市西湖區(qū)西溪新座5幢802室
應屆畢業(yè)生
碩士
2025-12-25 04:58:32
人關注
下載APP
關注今日招聘微信服務號