[SGEN] AI Data Engineer

Lương: Thương lượng

Địa điểm: Hà Nội

Phòng ban: CNTT

Hạn nộp hồ sơ: 01/04 — 31/05/2026

Mô tả công việc

VỀ SUN GROUP & VỊ TRÍ NÀY

Sun Group là tập đoàn kinh tế tư nhân hàng đầu Việt Nam với danh mục đầu tư trải dài từ bất động sản nghỉ dưỡng, khách sạn 5 sao, công viên chủ đề, đến hàng không và đô thị. Trung tâm CNTT Sun Group đang triển khai mô hình AI First — đặt trí tuệ nhân tạo làm trung tâm của mọi quy trình công nghệ thông tin.

AI Data Engineer là vị trí cốt lõi trong hành trình này. Bạn sẽ không đơn thuần viết pipeline — bạn sẽ thiết kế, huấn luyện và cộng tác cùng các AI agent để tự động hóa toàn bộ vòng đời dữ liệu trên nền tảng Azure hiện đại nhất. Đây là cơ hội để bạn trở thành một trong những AI Data Engineer đầu tiên tại Việt Nam làm việc với kiến trúc agentic thực chiến.

TRÁCH NHIỆM CÔNG VIỆC

Xây dựng & vận hành data platform (50% thời gian)

  • Thiết kế, phát triển và tối ưu hóa các data pipeline trên Azure Data Factory, Azure Databricks và Microsoft Fabric
  • Xây dựng và duy trì Data Lakehouse theo kiến trúc Delta Lake / Medallion (Bronze → Silver → Gold)
  • Tích hợp dữ liệu từ các hệ thống nghiệp vụ nội bộ: PMS khách sạn, CRM, ERP, ticketing công viên chủ đề, và các API bên ngoài
  • Đảm bảo hiệu năng, độ tin cậy và khả năng mở rộng của toàn bộ data platform

Làm việc cùng AI agents (40% thời gian)

  • Thiết kế system prompt và workflow cho Pipeline Builder Agent — agent tự động sinh code ETL từ yêu cầu nghiệp vụ
  • Review, test và validate code do AI sinh ra trước khi deploy lên production
  • Xây dựng feedback loop để các AI agent học từ lỗi và tự cải thiện theo thời gian
  • Đánh giá và tích hợp các công cụ AI mới (Claude API, GitHub Copilot, Azure AI Foundry) vào quy trình engineering

Chất lượng & governance (10% thời gian)

  • Thiết lập và duy trì data catalog (Microsoft Purview), metadata management và data lineage
  • Phối hợp với Data Quality Agent để thiết lập ngưỡng cảnh báo và quy trình xử lý sự cố dữ liệu
  • Viết tài liệu kỹ thuật và hướng dẫn sử dụng cho các pipeline và dataset quan trọng

YÊU CẦU

Kiến thức & kỹ năng nền tảng (bắt buộc)

  • Ứng viên tốt nghiệp đại học loại Giỏi/ Xuất sắc
  • Tối thiểu 2 năm kinh nghiệm với data engineering: ETL/ELT, data warehousing, SQL 
  • Thành thạo Python (pandas, PySpark, dbt) và SQL hiệu năng cao — có thể tự review và optimize code của người khác
  • Nắm vững các mô hình data modeling phức tạp: Data Vault 2.0, Kimball dimensional modeling, Data Mesh
  • Kinh nghiệm thực chiến với cloud data platform ở quy mô lớn (Azure ưu tiên, AWS/GCP chấp nhận)
  • Trình độ ngoại ngữ tối thiểu 5.5 IELTS (hoặc tương đương), giao tiếp thành thạo 

Hiểu biết domain data đặc thù (lợi thế quan trọng)

  • Kinh nghiệm làm việc với dữ liệu đặc thù từ một hoặc nhiều ngành: khách sạn & hospitality, công viên giải trí, hàng không & sân bay, bệnh viện & y tế, tài chính kế toán
  • Hiểu đặc thù dữ liệu ngành hàng không/sân bay: passenger movement, slot management, OTP, flight data (IATA/ACI standards)
  • Hiểu dữ liệu y tế: EMR/HIS integration, HL7/FHIR, patient data privacy, clinical data warehousing
  • Hiểu dữ liệu tài chính kế toán: GL, AP/AR, consolidation, multi-entity reporting, chuẩn mực IFRS/VAS
  • Có kinh nghiệm hoặc hiểu biết về prompt engineering và làm việc với LLM API
  • Khả năng đánh giá và kiểm thử output của AI agent (hallucination detection, accuracy testing)
  • Tư duy "AI as a teammate" — biết phân biệt task nào giao cho AI, task nào cần human judgment

Tố chất & văn hóa

  • Chủ động tìm hiểu và áp dụng công nghệ mới — không ngại thử nghiệm
  • Tư duy phân tích và giải quyết vấn đề có hệ thống
  • Giao tiếp rõ ràng, có khả năng giải thích vấn đề kỹ thuật cho stakeholder phi kỹ thuật
  • Tiếng Anh đủ dùng để đọc tài liệu kỹ thuật và tham gia training

Nộp đơn ứng tuyển công việc này

Họ & tên bạn *
Địa chỉ email *
Số điện thoại *
CV của bạn *
Click để chọn & tải lên CV của bạn
Mã bảo mật *

Nộp đơn ứng tuyển