Tổng quan công việc

Thiết kế và xây dựng các AI Agent chạy trong môi trường Production dựa trên các mô hình nền tảng như Claude, GPT, Gemini và các LLM mã nguồn mở; sử dụng Tool Calling, lập kế hoạch nhiều bước (Multi-step Planning) và điều phối bằng LangChain, LlamaIndex hoặc LangGraph.

Xây dựng hệ thống bộ nhớ cho AI Agent, bao gồm quản lý Context Window, bộ nhớ dài hạn dựa trên Vector, lưu trạng thái phiên làm việc và các chiến lược truy xuất dữ liệu.

Thiết kế và tối ưu hệ thống RAG (Retrieval-Augmented Generation) , bao gồm tạo Embedding, tích hợp Vector Database (Pinecone, Qdrant, Weaviate, FAISS), Ranking và Re-ranking.

Ứng dụng Graph Representation Learning (GNN, Node Embedding, Link Prediction) để thực hiện suy luận trên dữ liệu dạng đồ thị và truy xuất thông tin.

Xây dựng cơ chế tính điểm xác suất và ngưỡng tin cậy nhằm kiểm soát và xác thực đầu ra của LLM khi suy luận.

Tích hợp Tool Calling và kết nối các hệ thống bên ngoài vào quy trình hoạt động của AI Agent.

Chịu trách nhiệm triển khai toàn bộ hệ thống AI từ đầu đến cuối, bao gồm Retrieval → Reasoning → Action, phối hợp chặt chẽ với đội ngũ Engineering.

Đánh giá, benchmark hiệu năng của AI Agent và LLM một cách có hệ thống, đồng thời liên tục cải thiện thông qua quá trình lặp.

Luôn cập nhật các tiến bộ mới về LLM Agent, kiến trúc Memory và hệ thống Reasoning, đồng thời chủ động đề xuất ý tưởng mới cho nhóm.

Kỹ năng chính

Pythondata sciencenodejsmachine learningai

Yêu cầu

Có từ 3 năm kinh nghiệm trở lên trong Machine Learning ứng dụng, Data Science hoặc AI Engineering ở môi trường Production.

Có kinh nghiệm thực tế phát triển ứng dụng sử dụng LLM, bao gồm AI Agent, Tool Calling, Orchestration và Multi-step Reasoning (Claude, GPT, Gemini).

Thành thạo RAG: Embedding, Semantic Search, Vector Database và Re-ranking.

Có kinh nghiệm thiết kế kiến trúc Memory lâu dài cho AI Agent có trạng thái (Stateful Agent).

Hiểu về suy luận xác suất (Probabilistic Reasoning), Confidence Score, Output Filtering và Threshold Validation.

Có kinh nghiệm về Graph Machine Learning: GNN, Node Embedding hoặc Link Prediction trên dữ liệu thực tế.

Thành thạo Python và các thư viện hiện đại phục vụ Data Science/Machine Learning.

Có khả năng thiết kế và chịu trách nhiệm toàn bộ hệ thống AI từ Retrieval → Reasoning → Action.

Điểm cộng (Nice to Have): Kiến thức về bảo mật LLM, Guardrails và phòng chống Prompt Injection.

Kinh nghiệm với các framework đánh giá LLM và đo lường chất lượng đầu ra.

Kinh nghiệm xây dựng hệ thống gợi ý (Recommendation System) dựa trên Graph.

Đã từng sử dụng LangChain, LlamaIndex, LangGraph hoặc các framework Orchestration tự xây dựng.

Công ty đặc biệt đánh giá cao: Khả năng giải quyết vấn đề xuất sắc: Có thể phân tích các bài toán mơ hồ, chưa có lời giải rõ ràng và tự đưa ra các giải pháp mới, hợp lý.

Đã chứng minh được năng lực xây dựng sản phẩm: Không chỉ áp dụng các mô hình có sẵn mà còn sáng tạo ra giải pháp mới khi cần.

Tinh thần trách nhiệm và chính trực cao: Chủ động chịu trách nhiệm với công việc, luôn hoàn thành cam kết và hợp tác chuyên nghiệp với đồng đội.

Quyền lợi

Làm việc remote, giờ Việt Nam nhưng có thể tới văn phòng ở quận 2 nếu muốn - không bắt buộc. Lương Gross $2500 - $3000 Sẽ trao đổi thêm trong lúc phỏng vấn

Thông tin bổ sung

Học vấn/chứng chỉ

Cambridge Certificate

Ngôn ngữ

Tieng Thai