Trở lại trang chủ

Văn bản kĩ thuật

Viettel AI Race - Vòng thi online - Giai đoạn 2 - Public Leaderboard

Bài

# Bài Điểm
1 Văn bản kĩ thuật - GĐ2 - Public LB 100

Thông báo

Thời gian Tiêu đề Mô tả
Tháng 10 18, 2025, 8:06 Sửa lại đáp án QA trong tập training data giai đoạn 2

Chào các bạn,

Ban tổ chức đã rà soát và sửa lại một số câu đáp án chưa đúng trong tập private_test giai đoạn 1 (sẽ update lại điểm) và data của giai đoạn sau. Các nhóm có thể lấy lại training data của giai đoạn 2 để training lại. Dữ liệu đang được labeller gán nhãn nên sẽ có một số sai sót và ban tổ chức tiếp tục rà soát. Liên quan đến dữ liệu có sai sót, ban tổ chức muốn đưa ra một thông báo chung:

  • Training data: Có thể có vài dữ liệu sai, nhiễu. Điều đó là bình thường, các model thực tế phải làm việc tốt với cả nhiễu.
  • Testing data: Ban giám khảo sẽ liên tục rà soát để không có lỗi nhiễu, cập nhật lại kết quả đánh giá khi lỗi nhiễu xảy ra sau rà soát.

Nếu còn vấn đề về dữ liệu lỗi nhiễu trong tập testing data, các bạn vui lòng phản hồi cho ban tổ chức.

Tháng 10 13, 2025, 22:34 Điều chỉnh yêu cầu nộp bài

Chào các bạn

Do lượng dữ liệu cung cấp ngày càng nhiều, BGK đã sửa lại yêu cầu nộp bài trong đề bài:

Nộp bài: Thí sinh nộp file 'submission.zip' chứa 2 tệp: Tệp answer.md và tệp main.py. Trong đó, tệp main.py chứa tất cả source code trong project của thí sinh. Chú ý: Tệp main.py này không yêu cầu phải chạy được, mà giúp ban giám khảo kiểm tra trước tính trung thực của nhóm.

Ngoài tệp answer.md và tệp main.py, thí sinh cần chuẩn bị các thư mục con trích xuất từ các PDF (có cấu trúc như tệp trainingoutput.zip) đặt trong cùng file nén publictestoutput.zip và privatetest_output.zip. Thí sinh sẽ được yêu cầu nộp các file này trong bước hậu kiểm cuối mỗi giai đoạn.

HƯỚNG DẪN CHUNG VÒNG THI ONLINE

1. Tổng quan

  • Thời gian thi: 30/9/2025-11/11/2025.
  • Hình thức thi: trực tuyến. Thi theo đội, mỗi đội 3 thành viên. Mỗi đội thi được cấp một tài khoản nộp bài trên Platform. Các đội thi tự lo nền tảng cloud huấn luyện và máy tính lập trình.
  • Đề thi bao gồm 3 tác vụ. Quá trình thi chia làm 4 giai đoạn với độ khó bộ data tăng dần:
    • Giai đoạn 1: 30/9/2025 – 12/10/2025. Đối với mỗi tác vụ, các đội được cung cấp một bộ dữ liệu tập huấn luyện training_set và tập kiểm tra công khai public_test được trích ra từ tập huấn luyện. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test trong 24h cuối.
    • Giai đoạn 2: 13/10/2025 – 19/10/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 1, và tập dữ liệu này trở thành tập kiểm tra công khai public_test của giai đoạn 2. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối.
    • Giai đoạn 3: 20/10/2025 – 28/10/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 2, và tập dữ liệu này trở thành {tập kiểm tra công khai public_test của giai đoạn 3. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối.
    • Giai đoạn 4: 29/10/2025 – 11/11/2025. Các đội được cung cấp bộ dữ liệu tập huấn luyện training_set mới, đồng thời được cung cấp tập dữ liệu kiểm tra riêng private_test của giai đoạn 3, và tập dữ liệu này trở thành {tập kiểm tra công khai public_test của giai đoạn 4. Các đội được đánh giá kết quả trên tập dữ liệu kiểm tra riêng private_test mới trong 24h cuối. Kết quả giai đoạn 4 là kết quả chung cuộc.

2. Nộp bài và đánh giá kết quả}

Quy trình thi mỗi giai đoạn:
  • Trong toàn bộ thời gian từng giai đoạn: Các đội sử dụng tập dữ liệu training_set được cung cấp để làm bài, có thể nộp bài trên bảng rank Public để chấm điểm trên tập dữ liệu public_test.
  • 24 giờ cuối: Các đội nộp bài trên bảng rank Private để chấm điểm trên tập cho tập dữ liệu private_test.
Cách nộp bài:
  • Với mỗi lần nộp, chỉ nộp một file kết quả duy nhất qua địa chỉ được BTC công bố cho mỗi tác vụ.
  • Mỗi tác vụ, các đội cần nộp file kết quả là một file nén chấm zip với cấu trúc bên trong được quy định chi tiết trong từng bài.
  • Mỗi tác vụ thí sinh có tối đa 200 lần nộp đối với tập public_test và tối đa 20 lần nộp trong 24 giờ cuối đối với tập private_test.
  • Chỉ được phép nộp bài trong thời gian quy định mỗi giai đoạn.
  • Sau mỗi giai đoạn, với mỗi tác vụ, yêu cầu mỗi đội cung cấp đường dẫn (link) chứa toàn bộ mã nguồn, dữ liệu huấn luyện (bao gồm cả dữ liệu đã tăng cường - augmented data), tệp requirement, checkpoint, mô hình huấn luyện cho kết quả trùng khớp với kết quả tốt nhất của đội đã nộp trên hệ thống chấm điểm Private test và hướng dẫn huấn luyện để tiến hành hậu kiểm và đánh giá mô hình. Thí sinh cần nộp đường dẫn GitHub (đặt chế độ chỉ chia sẻ cho BTC theo tài khoản vaip.ict4p@gmail.com).
Đánh giá:
  • Kết quả chung cuộc sẽ được dựa trên kết quả của vòng kiểm tra bí mật trên tập private_test và quá trình hậu kiểm. Nếu kết quả chạy hệ thống khác với kết quả đã nộp (do có sự can thiệp thủ công hoặc chỉnh sửa hashcode), bài thi của thí sinh sẽ bị loại.
  • Các đội phạm quy sẽ không được chấm điểm và bị loại khỏi việc xét kết quả.