हम आपके अनुभव को बेहतर बनाने, साइट उपयोग का विश्लेषण करने और हमारे मार्केटिंग प्रयासों में सहायता के लिए कुकीज़ और समान तकनीकों का उपयोग करते हैं। गोपनीयता नीति
बजट: CNY 30,000-50,000
पोस्ट का समय:
金蝶国际AI产品团队诚聘大模型评测工程师:负责前沿大语言模型(LLM)的系统性、多维度评估。需构建覆盖基础能力(推理/数学/代码/多语言)、安全合规(价值观对齐、有害内容拒答)、垂直领域适配(金融/医疗/法律)及用户体验的全栈评测框架;设计自动化流水线,集成并扩展HELM、BIG-Bench等基准;执行版本回归评测与归因分析;协同算法与产品团队推动模型优化。要求:硕士+,2年+ LLM/NLP评测经验,精通Python与PyTorch,熟悉主流评测指标与数据集,具备实验设计与可视化分析能力。工作地点:深圳。