Kỹ sư kiến trúc dữ liệu

Ngày hết hạn: 31/03/2026
Hà Nội
Toàn thời gian

Đóng vai trò là chuyên gia kỹ thuật trong lĩnh vực hạ tầng dữ liệu cho AI, chịu trách nhiệm thiết kế, xây dựng và tối ưu kiến trúc dữ liệu phục vụ cho các hệ thống AI như Chatbot, Callbot, AutoCall, NLP pipeline và các hệ thống Machine Learning.

Vị trí này đảm bảo toàn bộ vòng đời dữ liệu (data lifecycle) được quản lý hiệu quả, có khả năng mở rộng, tái sử dụng và hỗ trợ tốt cho việc huấn luyện, đánh giá và triển khai mô hình AI trong môi trường sản phẩm thực tế.

 

Mô tả công việc

Với vai trò Senior Data Architecture, bạn sẽ làm việc chặt chẽ với AI Engineer, AI Researcher và Software Engineer để xây dựng nền tảng dữ liệu vững chắc cho các hệ thống AI. Các trách nhiệm chính bao gồm:

1. Thiết kế & xây dựng hạ tầng dữ liệu cho AI

  • Thiết kế kiến trúc dữ liệu phục vụ NLP/LLM, Callbot, Chatbot.

  • Xây dựng pipeline xử lý dữ liệu: ingestion → cleaning → transformation → storage.

  • Tổ chức và quản lý data lake / object storage.

  • Thiết kế schema dữ liệu phục vụ training, evaluation và inference.

2. Xây dựng pipeline cho hệ thống AI

  • Thiết kế và tối ưu pipeline embedding, indexing (vector database).

  • Quản lý version dữ liệu và embedding.

  • Xây dựng cơ chế tái tạo (reproducible dataset) cho training và fine-tuning.

  • Tối ưu hiệu suất truy xuất dữ liệu phục vụ real-time inference.

3. Hỗ trợ hệ thống RAG / LLM

  • Thiết kế cấu trúc lưu trữ cho hệ thống Retrieval-Augmented Generation.

  • Quản lý chiến lược chunking, indexing và re-indexing.

  • Theo dõi và tối ưu hiệu suất truy hồi (retrieval performance).

4. Logging, Monitoring & Data Governance

  • Thiết kế hệ thống lưu trữ log phục vụ phân tích và cải tiến mô hình.

  • Đảm bảo data lineage, tracking và quản lý metadata.

  • Phối hợp với AI Engineer để xây dựng pipeline phục vụ MLOps.

  • Đảm bảo tính bảo mật và toàn vẹn dữ liệu.

5. Cố vấn & xây dựng chuẩn dữ liệu

  • Định nghĩa chuẩn dữ liệu cho team AI.

  • Review pipeline và hỗ trợ tối ưu hoá hệ thống dữ liệu.

  • Tham gia xây dựng best practices cho phát triển AI product

 

Yêu cầu

  • Tốt nghiệp Đại học trở lên chuyên ngành Khoa học Máy tính, Hệ thống thông tin, Khoa học Dữ liệu hoặc tương đương.

  • Có ít nhất 3 năm kinh nghiệm trong lĩnh vực Data Engineering.

  • Thành thạo Python và SQL.

  • Có kinh nghiệm xây dựng ETL/ELT pipeline.

  • Hiểu biết về kiến trúc dữ liệu: Data lake, Data warehouse.

  • Có kinh nghiệm làm việc với hệ thống lưu trữ như minIO, GCS hoặc tương đương.

  • Có kinh nghiệm làm việc với cơ sở dữ liệu: PostgreSQL, MariaDB, NoSQL.

  • Có hiểu biết về hệ thống phân tán và tối ưu hiệu suất dữ liệu.

  • Có khả năng làm việc chặt chẽ với AI/ML team.

  • Tư duy hệ thống tốt, chủ động và có trách nhiệm cao.

Tiếng Anh: TOEIC ≥ 550 hoặc tương đương.

 

ƯU TIÊN

  • Có kinh nghiệm với Vector Database (Milvus, Pinecone, Weaviate, pgvector…).

  • Có kinh nghiệm xây dựng pipeline cho NLP/LLM hoặc hệ thống AI.

  • Có kinh nghiệm với workflow orchestration (Airflow, Prefect…).

  • Có kinh nghiệm với containerization (Docker, Kubernetes).

  • Hiểu biết về MLOps: MLflow, experiment tracking, dataset versioning.

  • Đã từng tham gia xây dựng hệ thống AI sản phẩm thực tế.

Chia sẻ: