हम आपके अनुभव को बेहतर बनाने, साइट उपयोग का विश्लेषण करने और हमारे मार्केटिंग प्रयासों में सहायता के लिए कुकीज़ और समान तकनीकों का उपयोग करते हैं। गोपनीयता नीति
बजट: CNY 80,000-150,000
पोस्ट का समय:
诚聘资深AI研发架构师,聚焦大模型系统设计、推理优化与工程化落地。要求深入理解Transformer架构、MoE机制、KV Cache管理及分布式训练/推理框架(如DeepSpeed、vLLM、Triton)。需具备从0到1构建高并发AI服务的经验,包括模型量化(AWQ/GGUF)、动态批处理、PagedAttention实现、CUDA内核调优等底层能力。熟悉主流开源模型(Llama 3、Qwen、Phi-4)的微调策略与评估体系(MT-Bench、AlpacaEval),能主导RAG系统中检索器与重排序模块的技术选型与性能压测。必须熟练使用Python、C++、PyTorch,并具备Linux系统级调试、GPU内存分析(Nsight Systems/Compute)及Prometheus+Grafana可观测性建设经验。非管理岗,纯技术决策角色,需直接参与代码评审与核心模块开发。不接受仅懂API调用或低代码平台使用者。