AI全栈工程师（RAG大模型应用开发） at 周.

Budget: CNY 30,000-60,000

Post time: 2026-07-01

Python
LangChain
LlamaIndex
RAG
Pinecone
FastAPI

亿达科创诚聘AI全栈工程师，专注RAG（检索增强生成）架构的大模型应用研发与工程落地。核心职责：1）设计并实现高可用RAG系统，包括多源异构知识库（PDF/HTML/数据库）的清洗、分块、嵌入（Embedding）与向量化存储（Pinecone/Weaviate）；2）深度优化检索策略（HyDE、Rerank、Query Expansion）与LLM响应质量（Prompt Engineering、CoT、Self-Consistency）；3）完成主流大模型API集成（OpenAI GPT-4o/Qwen-72B/GLM-4）及私有化部署适配（vLLM/Ollama）；4）构建低延迟后端服务（FastAPI/Flask），支持异步流式响应、缓存与监控；5）开发轻量级React前端界面，实现知识检索、对话历史、结果可视化与反馈闭环。必备技能：Python（asyncio、Pydantic）、LangChain/LlamaIndex框架原理与定制开发、RAG Pipeline全链路调优经验、Pinecone向量数据库运维、FastAPI高并发实践；加分项：熟悉Llama.cpp、Docker/K8s容器化部署、金融/汽车/医药领域知识图谱构建经验。本岗位拒绝纯理论或研究型角色，要求候选人具备从POC到生产环境交付的完整工程能力。

Job details