Trở lại trang chủ

Văn bản kĩ thuật

Viettel AI Race - Vòng thi online - Giai đoạn 1 - Public Leaderboard

Bài

# Bài Điểm
1 Văn bản kĩ thuật - GĐ1 - Public LB 100

Thông báo

Thời gian Tiêu đề Mô tả
Tháng 10 10, 2025, 10:04 Vòng private 24h: 12h thứ 7 ngày 11/10 đến 12h Chủ nhật ngày 12/10

Các bạn lưu ý:

  • Vòng Private 24h cuối bắt đầu vào 12h thứ 7 ngày 11/10 đến 12h Chủ nhật ngày 12/10
  • Kết quả vòng Private là kết quả cho giai đoạn 1
  • Ngay sau khi kết thúc GĐ1, yêu cầu mỗi đội cung cấp đường dẫn (link) chứa toàn bộ mã nguồn, tệp requirement, checkpoint và hướng dẫn huấn luyện để tiến hành hậu kiểm và đánh giá mô hình. Thí sinh cần nộp đường dẫn GitHub (ở chế độ chỉ chia sẻ cho BTC theo tài khoản vaip.ict4p@gmail.com). Hệ thống nộp phải là một pipeline thống nhất:

    • Khi chạy tệp run_extract.sh, hệ thống phải tự động chuyển đổi dữ liệu đầu vào dạng PDF thành tập dữ liệu Markdown giống với kết quả nộp. Dữ liệu cần được xử lý và lập chỉ mục (index) hoàn toàn trên môi trường cục bộ (RAM hoặc file local), không được sử dụng cơ sở dữ liệu bên ngoài.
    • Khi chạy tệp run_choose_answer.sh, hệ thống phải tự động duyệt qua các câu hỏi do BTC cung cấp và xuất ra tệp kết quả tương tự kết quả nộp.
Tháng 10 9, 2025, 21:40 update bộ training và test data

Chào các bạn,

Bộ training và test data mới cập nhật, các bạn hãy vào download các bộ data mới.

Tháng 10 8, 2025, 19:14 Rejudge

Chào các bạn,

BGK vừa mới rejudge lại các bài nộp theo trình chấm điểm mới cập nhật. Các bạn vui lòng xem lại điểm số của mình.

Thân mến,

HƯỚNG DẪN CHUNG VÒNG THI ONLINE

1. Tổng quan

  • Thời gian thi: 30/9/2025-11/11/2025.
  • Hình thức thi: trực tuyến. Thi theo đội, mỗi đội 3 thành viên. Mỗi đội thi được cấp một tài khoản nộp bài trên Platform. Các đội thi tự lo nền tảng cloud huấn luyện và máy tính lập trình.
  • Đề thi bao gồm 3 tác vụ. Quá trình thi chia làm 4 giai đoạn với độ khó bộ data tăng dần:
    • Giai đoạn 1: 30/9/2025 – 12/10/2025. Đối với mỗi tác vụ, các đội được cung cấp một bộ dữ liệu tập huấn luyện training_set và tập kiểm tra công khai public_test được trích ra từ tập huấn luyện. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test trong 24h cuối.
    • Giai đoạn 2: 13/10/2025 – 19/10/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 1, và tập dữ liệu này trở thành tập kiểm tra công khai public_test của giai đoạn 2. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối.
    • Giai đoạn 3: 20/10/2025 – 28/10/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 2, và tập dữ liệu này trở thành {tập kiểm tra công khai public_test của giai đoạn 3. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối.
    • Giai đoạn 4: 29/10/2025 – 11/11/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 3, và tập dữ liệu này trở thành {tập kiểm tra công khai public_test của giai đoạn 4. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối. Kết quả giai đoạn 4 là kết quả chung cuộc.

2. Nộp bài và đánh giá kết quả}

Quy trình thi mỗi giai đoạn:
  • Trong toàn bộ thời gian từng giai đoạn: Các đội sử dụng tập dữ liệu training_set được cung cấp để làm bài, có thể nộp bài trên bảng rank Public để chấm điểm trên tập dữ liệu public_test.
  • 24 giờ cuối: Các đội nộp bài trên bảng rank Private để chấm điểm trên tập cho tập dữ liệu private_test.
Cách nộp bài:
  • Với mỗi lần nộp, chỉ nộp một file kết quả duy nhất qua địa chỉ được BTC công bố cho mỗi tác vụ.
  • Mỗi tác vụ, các đội cần nộp file kết quả là một file nén chấm zip với cấu trúc bên trong được quy định chi tiết trong từng bài.
  • Mỗi tác vụ thí sinh có tối đa 200 lần nộp đối với tập public_test và tối đa 20 lần nộp trong 24 giờ cuối đối với tập private_test.
  • Chỉ được phép nộp bài trong thời gian quy định mỗi giai đoạn.
  • Sau mỗi giai đoạn, với mỗi tác vụ, yêu cầu mỗi đội cung cấp đường dẫn (link) chứa toàn bộ mã nguồn, dữ liệu huấn luyện (bao gồm cả dữ liệu đã tăng cường - augmented data), tệp requirement, checkpoint, mô hình huấn luyện cho kết quả trùng khớp với kết quả tốt nhất của đội đã nộp trên hệ thống chấm điểm Private test và hướng dẫn huấn luyện để tiến hành hậu kiểm và đánh giá mô hình. Thí sinh cần nộp đường dẫn GitHub (đặt chế độ chỉ chia sẻ cho BTC theo tài khoản vaip.ict4p@gmail.com).
Đánh giá:
  • Kết quả chung cuộc sẽ được dựa trên kết quả của vòng kiểm tra bí mật trên tập private_test và quá trình hậu kiểm. Nếu kết quả chạy hệ thống khác với kết quả đã nộp (do có sự can thiệp thủ công hoặc chỉnh sửa hashcode), bài thi của thí sinh sẽ bị loại.
  • Các đội phạm quy sẽ không được chấm điểm và bị loại khỏi việc xét kết quả.