We use cookies and similar technologies to improve your experience, analyze site usage, and assist in our marketing efforts. Privacy Policy
Budget: CNY 30,000-60,000
Post time:
亿达科创诚聘AI全栈工程师,专注RAG(检索增强生成)架构的大模型应用研发与工程落地。核心职责:1)设计并实现高可用RAG系统,包括多源异构知识库(PDF/HTML/数据库)的清洗、分块、嵌入(Embedding)与向量化存储(Pinecone/Weaviate);2)深度优化检索策略(HyDE、Rerank、Query Expansion)与LLM响应质量(Prompt Engineering、CoT、Self-Consistency);3)完成主流大模型API集成(OpenAI GPT-4o/Qwen-72B/GLM-4)及私有化部署适配(vLLM/Ollama);4)构建低延迟后端服务(FastAPI/Flask),支持异步流式响应、缓存与监控;5)开发轻量级React前端界面,实现知识检索、对话历史、结果可视化与反馈闭环。必备技能:Python(asyncio、Pydantic)、LangChain/LlamaIndex框架原理与定制开发、RAG Pipeline全链路调优经验、Pinecone向量数据库运维、FastAPI高并发实践;加分项:熟悉Llama.cpp、Docker/K8s容器化部署、金融/汽车/医药领域知识图谱构建经验。本岗位拒绝纯理论或研究型角色,要求候选人具备从POC到生产环境交付的完整工程能力。